245 65 7MB
German Pages 354 Year 2017
Jan Michalsky Frageintonation im Deutschen
Linguistische Arbeiten
Herausgegeben von Klaus von Heusinger, Gereon Müller, Ingo Plag, Beatrice Primus, Elisabeth Stark und Richard Wiese
Band 566
Jan Michalsky
Frageintonation im Deutschen Zur intonatorischen Markierung von Interrogativität und Fragehaltigkeit
Zugl. Diss. Carl von Ossietzky Universität Oldenburg
ISBN 978-3-11-053634-8 e-ISBN (PDF) 978-3-11-053856-4 e-ISBN (EPUB) 978-3-11-053685-0 ISSN 0344-6727 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2017 Walter de Gruyter GmbH, Berlin/Boston Druck und Bindung: CPI books GmbH, Leck ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com
| Für meine Frau Jana.
Vorwort Die vorliegende Arbeit wäre in dieser Form und der gegebenen Zeit ohne die vielfältige Unterstützung zahlreicher Freunde und Kollegen kaum möglich gewesen. Obwohl aus rein praktischen Gründen nicht all jene genannt werden können, die direkt oder indirekt Anteil an der Entstehung dieses Werkes hatten, und die folgenden Worte ihrem Beitrag zudem kaum gerecht werden können, möchte ich diese Seiten nutzen, um ein paar Personen besonders hervorzuheben. An erster Stelle danke ich meiner Frau Jana, die mich in jeder erdenklichen Form ununterbrochen unterstützt hat. Vom Beginn meines Studiums, über die Bestärkung in der Entscheidung, eine wissenschaftliche Karriere einzuschlagen, bis weit über die Promotion hinaus; von den euphorischen Momenten unerwarteter Geistesblitze oder signifikanter Prüfstatistiken, über die Talfahrten falsch sortierter Tabellen, verlorener Aufnahmen oder familiärer Schicksalsschläge, bis zum Spaziergang am Rande des Wahnsinn mit spontanen Operneinlagen um 4 Uhr nachts in der Badewanne, wurde jeder Schritt, jede Idee und jede Leistung von ihrem emotionalen Beistand, ihrem offenen Ohr, sowohl für Schwierigkeiten und Sorgen, als auch für Ideen und Konzepte, ihrem wertvollen Rat und nicht zuletzt ihrer konsequenten Bereitstellung von Energie- und Motivationsquellen in Form von Brownies bis Stollenkonfekt getragen. San athchomari yeraan, shekh ma shieraki anni! Mein nächster Dank gilt meinem Betreuer und Mentor Jörg Peters, der nicht nur durch eine intensive Betreuung der Arbeit selbst zu deren Entstehung beigetragen hat, sondern dem ich darüber hinaus den Großteil meiner Identität als Wissenschaftler zu verdanken habe. Von der Hinführung an die Phonetik, Phonologie und Intonationsforschung bis zur Ausbildung der kritischen Geisteshaltung wissenschaftlichen Arbeitens haben seine Ideen und Ideale meine Entwicklung maßgeblich geprägt und werden unentwegt einen zentralen Teil meiner akademischen Persönlichkeit einnehmen. Ich danke weiterhin Heike „Hiki“ Schoormann, die nicht nur über die gesamte Dauer der Promotion die denkbar beste Bürokollegin war, sondern sich zu einer unverzichtbaren wissenschaftlichen Beraterin und guten Freundin entwickelt hat. Ihr außerordentlicher Einsatz und ihre bereitwillige Funktion als zweite Meinung zu jeder Idee, jeder Frage und buchstäblich jedem geschriebenen Satz hat diese Arbeit maßgeblich beeinflusst und zahlreiche zentrale Ideen wären ohne die Verfertigung der Gedanken im lebhaften Dialog mit ihr nicht entstanden. Nicht zuletzt hat ihr Beitrag zu einem ausgefeilten Sicherheitskon-
VIII | Vorwort
zept das Büro zu einem sicheren Zufluchtsort für die wissenschaftliche Entfaltung im Falle einer Zombieapokalypse gemacht. Des Weiteren danke ich Daniela Wochner, die durch ihre eigene wissenschaftliche Beschäftigung mit dem Themenbereich der Frageintonation eine wichtige Austauschpartnerin und zugleich hoch motivierte fachliche und moralische Unterstützung dargestellt hat. Speziell ihre tatkräftige Unterstützung bei der Fertigstellung des Manuskripts hat sich als unverzichtbar herausgestellt und in einem Ausmaß zur Verbesserung der vorliegenden Fassung beigetragen, dass dies hier nicht unerwähnt bleiben kann. Zuletzt danke ich in diesem Zuge meinem besten Freund, Sparringspartner, Konzertcompanion und spirituellen Gefährten Malte Heckelen, der mit einer stoischen Gelassenheit überschüssige Energie abgefangen und in die richtigen Bahnen geleitet hat und mir seit vielen Jahren durch sämtliche Lebensbereiche ein treuer Begleiter war und beständig bleibt. Darüber hinaus geht mein besonderer Dank an Nanna Fuhrhop, die bei mir als erste die Leidenschaft für die Linguistik entfacht und über die wichtigsten Jahre meiner frühen wissenschaftlichen Entwicklung geschürt hat. Ihrer hilfsbereiten, kompetenten und vor allem emphatischen Betreuung habe ich maßgeblich meine Entscheidung für eine wissenschaftliche Karriere zu verdanken und während im Laufe der Jahre viele Wissenschaftler einen prägenden Einfluss auf meine wissenschaftliche Entwicklung hatten, hat ihre inspirierende Anleitung diese überhaupt erst initiiert. In diesem Zuge danke ich auch den damaligen Mitgliedern des graphematischen Kolloquiums, in welchem ich das erste Mal Zugang zu einem fachwissenschaftlichen Diskurs erhalten habe und hierunter besonders Kristian Berg, Franziska Buchmann, Bettina Morcinek, Niklas Schreiber und Karsten Schmidt. Ebenfalls großer Dank geht an die übrigen Mitglieder meiner Prüfungskommission, meinen Zweitprüfer Ronald Geluykens, dessen Arbeiten eine große Inspiration für mein Thema waren und dessen kritische Kommentare einen fruchtbaren Einfluss auf die Arbeit hatten, meinem externen Gutachter und DIMA-Kollegen Oliver Niebuhr, der nicht nur durch sein Feedback und seine Anmerkungen, sondern zusätzlich durch seine engagierte, enthusiastische und optimistische Natur meine wissenschaftliche Perspektive beeinflusst hat, und nicht zuletzt Esther Ruigendijk, die es immer wieder geschafft hat auf motivierende Art und Weise völlig neue Blickwinkel zu eröffnen und mich häufig zum Überdenken geklärt geglaubter Fragestellungen inspiriert hat. Ein wichtiger Dank geht an Bettina Braun und darüber hinaus alle Kolleginnen und Kollegen der Universität Konstanz. Ihre Betrachtung der Intonation
Vorwort | IX
von Fragen, die Einbindung meiner Person in den nationalen Austausch im Rahmen der P&P 2014 als auch der Jahrestagung der DGfS 2015 und die daraus folgenden angeregten Diskussionen stellten eine wichtige Quelle der Inspiration und Motivation für meine eigene Arbeit dar. In diesem Sinne geht auch besonderer Dank an Yi Xu für die Möglichkeit der Präsentation und Diskussion nicht nur meines Themas, sondern grundsätzlicher Fragen zu Kategorialität und ihrer Modellierung im Rahmen der Special Discussant Session zu Tone and Intonation im Rahmen der ICPhS 2015. Für weitere Hinweise, kritische Anmerkungen, Ideen und Inspirationen auf Konferenzen, in Kolloquien oder aus der persönlichen Kommunikation aus dem Kreise des wissenschaftlichen Kollegiums danke ich unter anderem Stefan Baumann, Rebecca Carrol, Aoju Chen, Frank Kügler, Bob Ladd, Jana Neitsch, Antje Schweitzer, Katrin Schweitzer, Fabian Tomaschek, Jürgen Trouvain und Petra Wagner. Aus dem Kreis meiner Freunde danke ich ganz besonders Hendrik Grotheer und Julian Wellbrock; Melanie und Theodor Hillebrand; sowie Marie Ann Kristin Montano Lopez und Mareike Daeglau, die es mir erlaubt haben, immer wieder zu einem Punkt der Beständigkeit zurückzukehren, wenn sich die Dinge etwas zu schnell verändert haben. Ich danke außerdem meiner Familie und hierunter besonders meiner Schwiegermutter Petra, meiner „Schwiegeroma“ Hilda und „Onkel“ Horst, die mich mit ihrem außerordentlichen moralischen und kulinarischen Einsatz unterstützt haben, meiner Oma Elke, für die sonntägliche Auszeitstunde, meinen Brüdern, Arne, der in einem Drahtseilakt aus empathischer Aufmunterung und zynischer Stichelei häufig die richtige Motivationsstrategie finden konnte, und Lars, sowie meinen Eltern, die mir diesen Lebensweg möglich gemacht haben. Ich bedanke mich außerdem bei den zahlreichen Probandinnen und Probanden meiner Experimentreihen, besonders den freiwilligen Teilnehmerinnen und Teilnehmern der drei Perzeptionsexperimente. Neben der akademischen und emotionalen Unterstützung möchte ich zuletzt Personen aus zwei Bereichen danken, die fundamental für mein persönliches Befinden in den schwierigeren Zeiten der Promotionsphase waren. Zum einen danke ich meinen Mentoren, Vorbildern und Trainingspartnern im Bereich der Kampfkünste, speziell des Jiu Jitsu. Ich danke Sensei Andreas Fiegert (5. Dan Jiu Jitsu), unter dem ich in den vergangenen Jahren trainieren durfte und der mit außerordentlichem Engagement dafür gesorgt hat, dass das körperliche und spirituelle Training neben dem intellektuellen Training der Promotion nicht zu kurz kam, und mit ihm den Schülern des Zanshin Dojo Del-
X | Vorwort
menhorst. Ich danke außerdem Sensei Heiko Friebel (5. Dan Jiu Jitsu), der mich von den ersten Schritten bis zum Erwerb des 1. Dans begleitet, meinen Stil maßgeblich geprägt hat und dessen unzähmbare Leidenschaft einen prägenden Einfluss auf meine Persönlichkeit als Kampfkünstler und darüber hinaus hatte, und mit ihm den Schülern der Jiu Jitsu Sparte des TV Hambergen. Zuletzt danke ich Hanshi Alain Sailly (8. Dan Goshindo), dessen technische und geistige Meisterschaft mich immer wieder in Demut auf den niemals endenden Pfad der Perfektion aufmerksam machen, was ebenfalls nicht nur auf die Kampfkünste beschränkt ist. Neben meinen Lehrmeistern danke ich darüber hinaus meinen Trainingspartnern und unter diesen speziell dreien, die sich im Laufe der Jahre als besonders motivierend und voranbringend herausgestellt haben: Malte Heckelen, Eduard Krieger und Duncan Famulla. Zuletzt geht ein ganz besonderer Dank an eine Vielzahl von Künstlern, deren musikalisches Schaffen die Entstehung dieser Arbeit in jeder Sekunde begleitet hat. Besonders danke ich dem Devin Townsend Project für Harmonie, Ruhe und Durchhaltevermögen, Gloryhammer für Enthusiasmus und Euphorie und Primordial für Trotz, Ehrgeiz und aggressive Unnachgiebigkeit.
Inhalt 1
Einleitung | 1
2 2.1 2.1.1 2.1.2 2.1.3 2.1.4 2.2 2.2.1 2.2.2
Forschungsstand | 7 Tonale Struktur von Fragen | 15 Konturwahl und Satzmodus | 20 Intonation und Bedeutung | 33 Lokale Bedeutungen von Intonation in Fragen | 42 Globale Bedeutungen von Intonation in Fragen | 50 Phonetische Merkmale von Fragen | 67 Universalien und der frequency code | 68 Phonetische Merkmale von Fragen im typologischen Überblick | 73 Phonetische Merkmale von Fragen im Deutschen | 88 Kategoriale und kontinuierliche Markierung von Interrogativität und Fragehaltigkeit | 110
2.2.3 2.2.4
3
Forschungsfragen | 115
4 4.1 4.2 4.2.1 4.2.2 4.2.3 4.2.4 4.2.5 4.3 4.3.1 4.3.2 4.3.3 4.3.4 4.3.5 4.4
Experiment 1 – Produktion: Leseaussprache | 121 Einleitung | 121 Methode | 124 Material | 124 Durchführung | 137 Sprecher/innen | 138 Akustische Analyse | 139 Statistische Analyse | 146 Ergebnisse | 147 Verteilung des Materials | 148 Phonetische Effekte der Skalierung | 150 Phonetische Effekte der Alignierung | 161 Phonetische Effekte des shapings | 163 Zusammenfassung | 165 Diskussion | 171
XII | Inhalt
5.3.4 5.3.5 5.4
Experiment 2 – Produktion: Spontansprache | 187 Einleitung | 187 Methode | 191 Material | 191 Durchführung | 196 Sprecher/innen | 200 Akustische Analyse | 201 Statistische Analyse | 203 Ergebnisse | 204 Verteilung des Materials | 204 Phonetische Effekte des Sprechstils | 206 Phonetische Effekte der Anwesenheit eines pränuklearen Akzents | 211 Phonetische Effekte der Sprechergruppe | 214 Zusammenfassung | 215 Diskussion | 218
6 6.1 6.2 6.2.1 6.2.2 6.2.3 6.3 6.4
Experiment 3 – Perzeption: Identifikation und Diskrimination | 223 Einleitung | 223 Methode | 228 Stimuli | 228 Durchführung | 234 Proband/innen | 236 Ergebnisse | 236 Diskussion | 245
7 7.1 7.2 7.2.1 7.2.2 7.2.3 7.2.4 7.2.5 7.3 7.4
Experiment 4 – Perzeption und Produktion: Imitation | 249 Einleitung | 249 Methode | 251 Stimuli | 251 Durchführung | 252 Proband/innen | 253 Akustische Analyse | 253 Statistische Analyse | 254 Ergebnisse | 255 Diskussion | 261
5 5.1 5.2 5.2.1 5.2.2 5.2.3 5.2.4 5.2.5 5.3 5.3.1 5.3.2 5.3.3
Inhalt | XIII
8 8.1 8.2 8.2.1 8.2.2 8.2.3 8.2.4 8.3 8.3.1 8.3.2 8.3.3 8.3.4 8.3.5 8.3.6 8.3.7 8.4
Experiment 5 – Perzeption: Semantische Evaluation | 265 Einleitung | 265 Methode | 267 Stimuli | 267 Durchführung | 270 Proband/innen | 270 Statistische Analyse | 271 Ergebnisse | 272 Übersicht | 272 Fragehaltigkeit | 272 Überraschung | 276 Unsicherheit | 280 Fragehaltigkeit und Überraschung | 284 Fragehaltigkeit und Unsicherheit | 285 Überraschung und Unsicherheit | 286 Diskussion | 288
9 9.1 9.2 9.3 9.4 9.5
Zusammenfassung und Diskussion | 295 Ergebnisse der Literaturrecherche | 295 Ergebnisse der empirischen Untersuchung | 299 Beantwortung der Forschungsfragen | 304 Diskussion der Ergebnisse | 306 Ausblick und offene Forschungsfragen | 316
Literaturverzeichnis | 323 Index | 337
1 Einleitung Das Stellen von Fragen konstituiert den unmittelbaren sprachlichen Weg, um ein Bedürfnis nach Informationen gegenüber einem/r Rezipienten/in zum Ausdruck zu bringen. Bereits im frühen Kindesalter bildet das Einfordern von Informationen mittels sprachlicher Akte einen Kernaspekt der kognitiven Entwicklung und einen primären Zugang zur Erschließung der Lebenswelt (Chouinard 2007: 1). Durch die Rezipientenorientierung leisten Fragen zudem einen wesentlichen Beitrag zur Interaktivität von Kommunikation. Der Bedeutsamkeit für die sprachliche Interaktion entsprechend finden sich Formmerkmale zur Markierung von Fragen auf nahezu allen sprachlichen Beschreibungsebenen. Dies macht sie nicht nur zum Untersuchungsgegenstand diverser linguistischer Teildisziplinen, sondern auch zu einem Vorzeigefall von Markierungsredundanz in der gesprochenen Sprache. Am Beispiel des Deutschen stellt die Intonation nur eine mögliche Markierungsstrategie neben der Morphologie (z. B. über W-Wörter), der Syntax (z. B. Subjekt-Verb-Inversion) und der Pragmatik (z. B. über Präsequenzen oder Indirektheit) dar. Die unterschiedlichen Formmerkmale können dabei zwar exklusiv auftreten, nicht selten ist jedoch eine redundante Markierung des Fragecharakters zu beobachten. Dabei nimmt die Intonation im sprachlichen System eine Sonderrolle ein, da ihr bereits primitive illokutionäre Funktionen wie Bitten und Forderungen zugeschrieben werden, bevor im Laufe des Spracherwerbs das lexikalische Material hinzutritt (Dore 1975: 31). In der vorliegenden Arbeit werden Äußerungen als Fragen im kommunikativ-pragmatischen Sinne über den illokutionären Akt definiert. Dieser stellt die pragmatische Funktion einer Äußerung dar, die Intention auszudrücken, eine Information von einem/r Adressaten/in zu elizitieren. Dabei werden zwei Bedeutungsaspekte von Fragen unterschieden: Zum einen der kategoriale illokutionäre Akt selbst, nach dem eine Äußerung entweder dazu intendiert ist, Informationen zu elizitieren oder nicht. Zum anderen soll angenommen werden, dass Fragen neben der rein kommunikativen Funktion Ausdrucks- und Appellfunktionen übernehmen, die unterschiedliche Grade von Sprechereinstellungen transportieren, welche unter dem Terminus der Fragehaltigkeit zusammengefasst werden sollen. Da der Begriff der Frage häufig synonym für verschiedene Phänomene steht, wird im Folgenden die illokutionäre Funktion analog zu
DOI 10.1515/9783110538564-001
2 | Einleitung
Chisholm et al. (1968) als Interrogativität1, das Bedeutungskontinuum der Sprechereinstellung in Anlehnung an Batliner (1989b) als Fragehaltigkeit, der syntaktische oder satzsemantische Strukturtyp als Fragesatz und die entsprechende Äußerung als Ganzes weiterhin als Frage bezeichnet (s. Kapitel 2.1). Bei der Untersuchung von Frageintonation im Deutschen verfolgt diese Arbeit zwei Ziele. Der erste Hauptteil (Kapitel 2) gibt einen Überblick über bisherige Untersuchungen zu intonatorischen Formmerkmalen von Fragen im Deutschen. Dabei dient dieser Teil nicht nur dem vorbereitenden Literaturüberblick für den empirischen Teil der Arbeit, sondern liefert einen eigenen Interpretationsansatz der tonalen Struktur von Fragen im Deutschen und der möglichen Bedeutung ihrer charakteristischen phonologischen Elemente. Gleichzeitig soll gezeigt werden, dass auf dem momentanen Stand der Forschung keine Evidenz für Frageintonation im Sinne intonatorischer Formmerkmale, die sich als unmittelbare intonatorische Markierung von Fragen identifizieren lassen, vorliegt. Der zweite Hauptteil der Arbeit (Kapitel 3-9) stellt eine Reihe von Experimenten zur Identifikation eben jener intonatorischen Formmerkmale dar. Dass das Deutsche intonatorische Formmerkmale besitzt, die mehr oder weniger eindeutig mit Fragen assoziiert werden können, gilt seit frühesten Beschreibungen der Intonation des Deutschen weitestgehend als Konsens (von Essen 1964: 44, Bierwisch 1966: 166, Pheby 1975: 146f, Oppenrieder 1988, Féry 1993, Grice & Baumann 2002). In der älteren Intonationsforschung finden sich häufig Bestrebungen, ein Kernsystem grammatischer Funktionen in Form von unmittelbaren Assoziationen zwischen Satzmodi und Intonationskonturen zu finden (ebd.). Hieraus resultiert die heute vor allem noch im Fremdsprachenunterricht etablierte Verbindung von Fragen mit einem häufig nicht näher definierten finalen Anstieg der Sprechmelodie (vgl. Hendriks 1999: 54f, Griesbach 2002: 231). Dabei wird der finale Anstieg als charakteristisches Merkmal jedoch einerseits auf Entscheidungs- und Deklarativfragen begrenzt (von Essen 1964: 49, Brinkmann 1962: 502, Isačenko & Schädlich 1966: 44, 59, Siebs 1969: 139, Pheby 1975: 146, Féry 1993: 85) und andererseits mit unvollständigen Aussagen assoziiert (von Essen 1964: 37, Bierwisch 1066: 123, Pheby 1975: 166, Féry 1993: 9). Jüngere Forschung, sowohl experimenteller als auch korpusorientierter Natur, konnte des Weiteren zeigen, dass selbst die Markierung von Entscheidungsund Deklarativfragen über einen finalen Anstieg allenfalls einen intonatorischen Prototypen kennzeichnet (Kügler 2003, Kohler 2004, Selting 1995: 232f, Peters 2006: 102f). Die Assoziation von tonaler Struktur und Satzmodus scheint || 1 Folglich ist der im Rahmen dieser Arbeit pragmatisch definierte Begriff der Interrogativität von Lohnsteins (2013) satzsemantischer Verwendung als Satzmodus zu unterscheiden.
Einleitung | 3
derart frei zu sein, dass je nach pragmatischem Kontext jede Kontur des Inventars des Deutschen mit jedem Satzmodus auftreten kann und exklusiv interrogative Konturen nicht existieren (Kohler 1977: 205, Selting 1995: 232f, CouperKuhlen & Selting 1996, Peters 2006: 102f). Aus der Dissoziation von finalen Anstiegen und Interrogativität ergeben sich zwei Fragen, die dem literaturbasierten ersten Hauptteil der Arbeit als Leitfragen dienen und die Untersuchung erneut in zwei Teile untergliedern: 1. Welche Bedeutungsmerkmale lassen sich der tonalen Struktur, spezifischer einem finalen Anstieg in Abgrenzung zu einem finalen Fall, allgemein und innerhalb von Fragen zuordnen? Dabei stehen jene Bedeutungsaspekte im Vordergrund, die erklären können, warum ein finaler Anstieg präferiert oder zumindest häufig bei Fragen auftritt. Innerhalb der Untersuchungen zur Bedeutung von Intonation kann zwischen zwei Arten von Ansätzen unterschieden werden: Ansätze der lokalen Bedeutung von Intonation erfassen intonatorische Bedeutung in unmittelbarer Abhängigkeit von sprachlichen und außersprachlichen Kontexten (Selting 1995, Kügler 2003, Kohler 2004), während solche zur globalen Bedeutung davon ausgehen, dass sich die Bedeutung von Intonation zwar lokal unterschiedlich ausprägen kann, jedoch einen konsistenten Bedeutungskern besitzt (Truckenbrodt 2013, Peters 2014). Im ersten Teil des ersten Hauptteils (Kapitel 2.1) werden Konzepte und Ansätze zur lokalen und globalen Bedeutung der tonalen Struktur mit Bezug auf Fragen skizziert. Dabei sollen auch gängige Ansätze zum Englischen (u. a. Cruttenden 1981, Gussenhoven 1984, Pierrehumbert & Hirschberg 1990, Gunlogson 2008, Steedman 2014) in die Argumentation einbezogen werden, da die Bedeutung von Intonation in Fragen international, speziell im Schnittstellenbereich zur Semantik und Pragmatik, intensive Betrachtung erfahren hat. Abschließend wird gezeigt, dass sich über das globale Merkmal der Unvollständigkeit möglicherweise eine gemeinsame Eigenschaft aller Ansätze zur Bedeutung final steigender Konturen für das Deutsche erfassen lässt. 2. Weist die intonatorische Ebene abseits der Konturwahl Formmerkmale zur Markierung von Fragen auf und wenn ja, welche? Wenn ein finaler Anstieg kein reliables Kriterium zur Markierung von Interrogativität oder Fragehaltigkeit darstellt, lässt sich fragen, ob diese Funktion von anderen Elementen der intonatorischen Ebene übernommen werden kann. Nach der Betrachtung der tonalen Struktur bildet die Untersuchung der phonetischen Realisierung sowohl den Fokus des zweiten literaturbasierten Teils als auch den Gegenstand der anschließenden empirischen Analyse. In der zweiten
4 | Einleitung
Hälfte des Literaturteils (Kapitel 2.2) wird dafür argumentiert, dass eine intonatorische Markierung von Fragen nicht in einer Markierung von Interrogativität als sprachlicher Kategorie zu finden ist, sondern vielmehr in einer phonetischkontinuierlichen Markierung eines Einstellungsmerkmals wie der erwähnten Fragehaltigkeit. Hierzu werden die physiologische Motivierung phonetischer Effekte von Fragehaltigkeit auf Basis der sogenannten biological codes (Ohala 1983, 1984, Gussenhoven 2002, 2004: 71ff) sowie Evidenz aus vergleichbaren Intonationssprachen und nicht zuletzt aus Untersuchungen des Deutschen dargestellt. Im zweiten Hauptteil der Arbeit (Kapitel 3-9) werden die Befunde zur phonetischen Realisierung von Fragen im Deutschen durch die Ergebnisse eigener empirischer Untersuchungen komplementiert. Hierzu wurde eine Reihe von insgesamt fünf Experimenten, zwei Produktions- und drei Perzeptionsexperimente, durchgeführt. Die vorliegende Arbeit basiert auf der Analyse von Sprecher/innen des nördlichen Standarddeutsch im nordwestlichen Niedersachsen, sodass eine mögliche Generalisierung der Ergebnisse vorerst auf diese Varietät beschränkt bleibt, auch wenn im Folgenden vereinfachend von der Intonation im Deutschen die Rede ist. Bei dem ersten Produktionsexperiment (Kapitel 4) handelt es sich um eine Lesestudie, in der anhand intonatorischer Minimalpaare die Ebene der phonetischen Realisierung von allen anderen sprachlichen Markierungsebenen, inklusive der tonalen Struktur, isoliert wird, um die phonetische Variation ausschließlich in Abhängigkeit von der pragmatischen Funktion der Interrogativität zu erfassen. Das erste Experiment stellt das Schlüsselexperiment der Arbeit dar, da in diesem ersten Schritt die unmittelbar in Abhängigkeit von der pragmatischen Funktion variierenden phonetischen Parameter aus dem Gesamtspektrum möglicher phonetischer Variation und damit die abhängigen Variablen aller folgenden Experimente identifiziert werden sollen. Dabei sind sowohl die Existenz phonetischer Effekte als auch deren konkrete Form Gegenstand der Untersuchung. Es wird gezeigt, dass Interrogativität phonetische Effekte in Form der Erhöhung von finalen Anstiegen aufweist. Gleichzeitig kann festgestellt werden, dass die unterschiedlichen Satztypen phonetisch nicht zu einer kategorialen Differenzierung von deklarativen und interrogativen Äußerungen führen, sondern zu einem graduellen Übergang, der sich treffender als Repräsentation eines Kontinuums an Fragehaltigkeit erfassen lässt. Zugleich zeigen die Ergebnisse, dass Fragehaltigkeit im Falle von Alternativfragen bereits äußerungsintern und nicht erst turn-final markiert wird.
Einleitung | 5
In einem zweiten Produktionsexperiment (Kapitel 5) wurden die gefundenen phonetischen Effekte der Leseaussprache anhand semi-spontansprachlicher Daten überprüft. Hierzu wurde ein Spielexperiment mit dem Ziel konzipiert, semi-spontansprachliche Fragen und fortgesetzte Aussagen zu elizitieren, die strukturell mit dem ersten Produktionsexperiment vergleichbar sind. Das Experiment wurde zudem durch ein weiteres Leseexperiment ergänzt, um den unmittelbaren Einfluss des Sprechstils auf die Ausprägung der phonetischen Merkmale von Fragen zu untersuchen. Es wird gezeigt, dass sich die in Experiment 1 herausgestellten Skalierungseffekte in gleichem Maße in einem semispontansprachlichen Sprechstil wiederfinden lassen. Die anschließende Reihe von Perzeptionsexperimenten (Kapitel 6-8) untersucht sowohl die perzeptive Relevanz als auch die semantisch/pragmatische Natur der gefundenen Effekte. Experiment 3 (Kapitel 6) hat zwei Ziele: Zum einen dient dieses Experiment der Beantwortung der Frage nach der kategorialen oder kontinuierlichen Natur der gefunden Effekte. Hierzu wird in der Tradition des klassischen categorical perception paradigm (Liberman, Harris, Hoffman, & Griffith 1957) ein Identifikationstest mit einem Diskriminationstest verbunden. Es wird untersucht, ob der Übergang zwischen deklarativer und interrogativer Funktion auf der Ebene der phonetischen Realisierung perzeptiv distinkte Kategorien etabliert oder analog zu den Produktionsdaten ein Kontinuum darstellt. Zum anderen wird die generelle perzeptive Relevanz der phonetischen Effekte überprüft. Der Identifikationstest soll Evidenz dafür liefern, dass die gefundenen phonetischen Merkmale überhaupt zur Unterscheidung von Fragen und Aussagen genutzt werden können. Der Diskriminationstest erfüllt zudem den Zweck, zu prüfen, ob Effekte in der Größenordnung der Produktionsexperimente perzeptiv unterschieden werden können. Experiment 3 zeigt, dass der Übergang von deklarativen in interrogative Äußerungen auf phonetischer Ebene kontinuierlich ist und stützt die These, dass die phonetische Markierung eher die Einstellung der Fragehaltigkeit als die sprachliche Kategorie der Interrogativität markiert. Des Weiteren wird gezeigt, dass die Proband/innen die Funktionen deklarativ und interrogativ an den Polen der phonetischen Skala verorten konnten und Effekte in der Größenordnung der Ergebnisse der Produktionsexperimente von ihnen wahrnehmbar waren. Das vierte Experiment (Kapitel 7) komplementiert das dritte hinsichtlich der Frage nach der kategorialen Natur der Effekte. In einem Imitationsexperiment wird überprüft, ob Probanden/innen ein phonetisches Kontinuum in der finalen Anstiegshöhe als solches reproduzieren können oder aufgrund einer mentalen phonologischen Repräsentation kategorial segmentieren und entsprechend wiedergeben. Gleichzeitig sollen die Frequenzabstände zwischen den Stimuli
6 | Einleitung
Aufschluss darüber geben, bis zu welchem Grad akustische Unterschiede auditiv und in einem weiteren Schritt produktiv differenziert werden können. Die Ergebnisse des vierten Experiments stützen ebenfalls die These, dass die phonetische Realisierung ein unsegmentiertes Kontinuum darstellt und damit besser als eine Markierung von Fragehaltigkeit als von Interrogativität beschreibbar ist. Gleichzeitig kann gezeigt werden, dass die Proband/innen Abstände von mindestens einem Halbton reproduzieren und differenzieren können. Das fünfte Experiment (Kapitel 8) dient der Untersuchung, welche Parameter der in den Produktionsexperimenten herausgestellten Effekte den maßgeblichen Eindruck von Fragehaltigkeit erzeugen. Des Weiteren wird untersucht, ob Fragehaltigkeit in Anbetracht seiner intonatorischen Markierung eine eigene Bedeutung konstituiert oder eine Subkategorie der auf gleicher Ebene markierten Einstellungen der Überraschung oder Unsicherheit darstellt. Dies geschieht mittels semantischer Rating-Skalen. Experiment 5 zeigt, dass der perzeptive Eindruck von Fragehaltigkeit maßgeblich auf die Erhöhung des absoluten Endpunkts der Tonhöhenbewegung zurückzuführen ist. Damit unterscheidet sich Fragehaltigkeit sowohl von Unsicherheit als auch Überraschung in der phonetischen Markierung und ist tendenziell als eigenständige Bedeutung beschreibbar. Kapitel 9 schlussendlich diskutiert die Befunde sowohl der Produktions- als auch der Perzeptionsexperimente und setzt diese vor dem Hintergrund des Literaturteils in ein Gesamtbild. Dabei wird gezeigt, dass sich Frageintonation im Rahmen der Arbeit als eine Kombination von tonal markierter Unvollständigkeit und phonetisch markierter Fragehaltigkeit beschreiben lässt, wobei keine der beiden Ebenen eine obligatorische Markierung von Fragen liefert.
2 Forschungsstand Das Thema der Frageintonation führt schon in den frühen Betrachtungen zur Intonation des Deutschen bereits auf terminologischer Ebene zu Uneinigkeit. Während zum Beispiel von Essen (1964: 44) den Begriff synonym für den finalen Anstieg der Sprechmelodie einführt und damit auf die prototypische Assoziation von finalen Anstiegen mit Entscheidungs- und Deklarativfragen referiert, weist unter anderem bereits Kohler (1977: 199) den Begriff kategorisch zurück. Der Terminus der Frageintonation würde eine nicht vorhandene grammatische Funktion von Intonation postulieren (ebd.). Im Rahmen dieser Arbeit soll Frageintonation als die Menge intonatorischer Formmerkmale definiert werden, die exklusiv2 mit als Frage intendierten Äußerungen auftreten. Diese Definition enthält zwei wesentliche Einschränkungen: Zum einen ist es nicht das Ziel der Arbeit, alle potenziellen intonatorischen Formen darzustellen, die mit Fragen auftreten können, sondern die intonatorischen Parameter zu finden, die ausschließlich mit Fragen auftreten. Zum anderen beschränkt sich der Gegenstand der Arbeit in Anlehnung an Haan (2002: 21) auf die Äußerungen, die von Sprecher/innen als Frage intendiert sind und damit eine explizite Markierung auch auf intonatorischer Ebene erst erwarten lassen. Sowohl der Begriff der Frage als auch der Begriff der Intonation bedürfen für die Operationalisierbarkeit dieser Definition weiterer Erläuterung. Der Begriff der Frage denotiert einen weiten Bereich sprachlicher Phänomene in Abhängigkeit von der jeweiligen linguistischen Disziplin. Bolinger (1957) unterscheidet vier Kriterien, nach denen Äußerungen als Fragen klassifiziert werden können: Erstens lassen sich Fragen als Strukturtyp erfassen. Demnach sind Äußerungen unabhängig von ihrer kommunikativen Funktion bereits aufgrund von syntaktischen Formmerkmalen wie Subjekt-Verb-Inversion oder der Anwesenheit eines W-Wortes strukturell als Fragen klassifizierbar (Bolinger 1957). Zum Deutschen findet sich ein Modell zu Satzmodi als syntaktischen Formtypen unter anderem bei Altmann (1987, 1993). Ebenfalls nach einer struk-
|| 2 Die Bezeichnung als ‚exklusive Markierung‘ muss dabei ein Stück weit relativiert werden. Wenn sich im Vergleich von Fragen und Aussagen die Skalierung des finalen Anstiegs als einziges Merkmal herausstellt, das unabhängig von syntaktischen oder anderen intonatorischen Gegebenheiten variiert, so wird dies hier als exklusive Markierung von Fragen bezeichnet. Dies schließt jedoch nicht aus, dass die Skalierung des finalen Anstiegs in anderen Kontexten auch mit anderen Funktionen wie zum Beispiel der Signalisierung von Sprechereinstellungen wie Wut oder Freude auftritt. Für diesen Kommentar danke ich einem anonymen Gutachter des Journal of Phonetics.
DOI 10.1515/9783110538564-002
8 | Forschungsstand
turellen Klassifikation von Fragen operiert auch der semantische Interrogativitätsbegriff unter anderem nach Lohnstein (2013). Lohnstein (2013) trennt das semantische Merkmal der ‚Interrogativität‘ von der pragmatischen Funktion der ‚Frage‘. Dabei stellt ‚Interrogativität‘ ein Merkmal des Satzmodus als Strukturtyp dar und ergibt sich im satzsemantischen Sinne kompositionell aus der wörtlichen Bedeutung. ‚Interrogativität‘ beschreibt dabei in der Tradition der grundlegenden Arbeit von Karttunen (1977) im Wesentlichen die semantische Eigenschaft, einen Raum an Alternativen zu eröffnen und die Äußerung im Kontrast zu diesen Alternativen zu verorten. Im Falle der Entscheidungsfragen geschieht dies vereinfachend zusammengefasst durch die Gliederung der Menge der Propositionen in wahre und nicht-wahre Alternativen. Ein zweites Kriterium stellt die Annahme einer interrogativen Intonation dar (Bolinger 1957). Ähnlich wie im Falle der Syntax und der Semantik ließe sich die Intonation von der tatsächlichen kommunikativen Funktion losgelöst betrachten und eine Äußerung rein intonatorisch als Frage klassifizieren. Dies findet sich im erwähnten Beispiel bei von Essen (1964: 44f) durch die Bezeichnung von steigender Intonation als interrogativer Intonation. Demnach können auch Aussagen mit einer interrogativen Intonation versehen werden und somit intonatorisch-strukturell Fragen darstellen, ohne als solche zu fungieren, wie im Falle von Warnungen oder Drohungen (ebd.). Auch Bierwisch (1966: 165) betrachtet steigende Intonation als Strukturmerkmal von Fragen. Eine steigende Äußerung muss demzufolge nicht als Frage fungieren, bleibt jedoch strukturell eine, während eine fallende Frage als solche fungieren kann, jedoch auf intonatorischer Ebene strukturell keine Frage ist. Als drittes Kriterium nennt Bolinger (1957) die interrogative Distribution. Diese klassifiziert Fragen durch das Auftreten vor einer Antwortreaktion als solche. Eine derartige Bestimmung über die Rezipientenreaktion findet primär in konversations- oder diskursanalytischen Arbeiten Anwendung. So klassifiziert Selting (1995: 232ff) konversationelle Züge als fragenden Aktivitätstyp, wenn diese von einem entsprechenden Antwortzug des Rezipienten gefolgt werden. Auch Geluykens (1988) setzt dieses Kriterium in seiner Untersuchung zur Frageintonation im Englischen an. Als viertes und letztes Kriterium treten bei Bolinger (1957) Gestik und Mimik hinzu, die allerdings im Folgenden nicht betrachtet werden sollen. Eine ähnliche Trennung findet sich bei Kohler (1977: 199, 1995: 197), der zwischen syntaktischen, intonatorischen und situativen Fragen unterscheidet. Eine Frage kann auf einer oder mehreren Ebenen markiert sein, um als solche zu fungieren, wobei eine einzige Ebene ausreicht und keine der strukturellen Ebenen obligatorisch ist. Dies findet sich explizit im Typ der situativen Fragen.
Tonale Struktur von Fragen | 9
Diese sind sowohl syntaktisch als auch intonatorisch Aussagen3 und evozieren lediglich durch den pragmatischen Kontext eine Interpretation als Frage (ebd.). Zwischen der strukturellen und kontextuell-pragmatischen Ebene lässt sich ein weiteres Merkmal verorten, das Geluykens (1987) als interpretationsbeeinflussend in Bezug auf den Fragecharakter identifiziert. Geluykens (1987) gibt an, dass Äußerungen bereits aufgrund ihrer potenziellen Verwendung tendenziell eher als Frage oder als Aussage verortet werden können. Ein Satz wie „Du bist krank“ besitzt demnach wesentlich mehr Kontexte, in denen dieser als Frage interpretiert werden kann als ein Satz wie „Ich bin krank“, der tendenziell mehr Kontexte besitzt, in denen er als Aussage interpretiert werden kann. Geluykens (1987) bezeichnet ersteren daher als question-prone und letzteren als statementprone. Nach den dargestellten Ansätzen erfolgt die Bestimmung von Fragen entweder über strukturelle oder distributionelle Merkmale. Das dezidierte Ziel der vorliegenden Arbeit ist allerdings, wie zuvor skizziert, intonatorische Formmerkmale zu identifizieren, die exklusiv mit als Frage intendierten Äußerungen assoziiert werden, also eine Intention und Bewusstheit seitens des/der Produzenten/in voraussetzen. Eine Definition von Fragen über strukturelle Aspekte ist daher für die vorliegende Fragestellung nur begrenzt zweckdienlich. Die syntaktische Klassifikation eignet sich für die Bestimmung nicht, da Äußerungen, die syntaktisch Fragen sind, wie erläutert nicht notwendigerweise als Fragen intendiert sind. Äußerungen für die intonatorische Analyse anhand intonatorischer Merkmale als Fragen zu klassifizieren ist zirkulär. Von den zuvor dargestellten Möglichkeiten erscheint die interaktionale Perspektive, also die Klassifikation von Äußerungen als Frage über die kontextuelle Einbettung oder spezifischer die unmittelbare Rezipientenreaktion, am zweckdienlichsten. Allerdings ist auch die interaktionale Perspektive für die Klassifikation von Fragen nicht unproblematisch, da eine gänzlich fehlerfreie Klassifikation eine idealtypische Konversationssituation erfordern würde. Unter realistischen Bedingungen ist zu erwarten, dass es zu Fehlklassifikationen kommen kann, indem Äußerungen, die als Fragen aufgefasst werden, nicht als solche intendiert sind oder Äußerungen, die als Fragen intendiert sind, nicht als solche interpretiert werden, wodurch eine entsprechende Rezipientenreaktion unterbleibt. Entsprechend eignet sich der konversationsanalytische Ansatz am besten für eine Frageklassifikation anhand spontansprachlicher Daten und Korpora, um jedoch Äußerungen zu erfassen, die am wahrscheinlichsten eine intonatorische Markierung aufweisen, die die Funktion besitzt, Fragen als solche zu kennzeichnen, || 3 Unter Voraussetzung einer typischen Syntax und Intonation von Aussagen.
10 | Forschungsstand
ist ein Fragebegriff notwendig, der diese über die Intention des/der Sprechers/in einerseits und ihre kommunikative Funktion andererseits erfasst. Die Erfassung kommunikativer Funktionen im Sinne sprecherseitiger Intention fällt in den Gegenstandsbereich der Sprechakttheorie als Teildisziplin der linguistischen Pragmatik. Gemäß der klassischen Sprechakttheorie (Austin 1962, Searle 1976) lässt sich die kommunikative Funktion einer Äußerung über die sogenannte illokutionäre Kraft oder Funktion (illocutionary force) bestimmen. Dabei werden Fragen den Direktiven zugeordnet (Searle 1976: 11), die eine Klasse von Äußerungen mit der Funktion, den/die Rezipienten/in zu einer Reaktion zu veranlassen, bilden. Diese Klasse muss für den Zweck der Arbeit auf solche Akte eingeschränkt werden, in denen die Reaktion des/der Hörers/in aus einem verbalen Beitrag besteht, der entweder eine Information beitragen oder die erfragte Information bestätigen oder zurückweisen soll. Da die illokutionäre Kraft von Fragen innerhalb der Pragmatik ebenfalls als ‚Frage‘ bezeichnet wird, soll im Rahmen dieser Arbeit einer möglichen terminologischen Verwirrung durch begriffliche Trennung von Fragen als Äußerungen und ihrer pragmatischen Funktion vorgebeugt werden. Der Begriff der Interrogativität wird daher im Folgenden als die pragmatische Funktion definiert, eine Rezipientenreaktion in Form von Informationen, Bestätigung oder Zurückweisung zu elizitieren. Diese kategoriale Definition der Intention hinter dem Akt des Fragens ist allerdings nicht unstrittig und soll speziell im Rahmen dieser Arbeit kritisch hinterfragt und geprüft werden. So ist vorgeschlagen worden, den Übergang von Aussagen zur Fragen alternativ nicht in einer Dichotomie von Äußerungen, die Informationen elizitieren sollen und solchen, die dies nicht tun, zu beschreiben, sondern als pragmatisches Kontinuum zwischen interrogativ und deklarativ als zwei prototypischen Polen (Givóns 1984: 254f). Givón (ebd.) gibt hierzu an, dass Sprecher/innen nicht lediglich Fragen haben, sondern damit verbunden einen Grad an (Un-)Sicherheit, Überzeugung und Bedürfnis nach Vervollständigung oder Bestätigung. Diese Skalierbarkeit zeichnet sich laut Givón (1984: 254f) dabei auch in der sprachlichen Struktur über die Realisierung von indirekten Sprechakten mit einem variierenden Grad an Explizitheit aus. Auch bei Geluykens (1987) findet sich die Idee einer Skalierbarkeit durch die Verwendung einer grundlegenden question- und statement force. Als Oberbegriff für ein solch graduelles Konzept der Intention hinter dem Frageakt soll der Begriff der Fragehaltigkeit verwendet werden. Dieser Terminus wurde bereits im Rahmen von Batliners (1989b) Studie zur Perzeption von Frageintonation eingeführt, allerdings mit der eingeschränkten Bedeutung des Grades einer dem/r Rezipienten/in auferlegten Antwortobligation.
Tonale Struktur von Fragen | 11
Was genau unter dem Konzept der Fragehaltigkeit zu verstehen ist, lässt sich nicht a priori bestimmen und soll im Rahmen dieser Arbeit weiter beleuchtet und in die empirische Untersuchung integriert werden. Ebenso ist dabei unklar, ob mit Fragehaltigkeit tatsächlich ein spezifisches Konzept bezeichnet werden kann oder ein Merkmalsbündel, dessen Spektrum sich aus unterschiedlichen Graden der einzelnen Komponenten zusammensetzen kann. Diese Komponenten scheinen dabei auf mindestens zwei Ebenen angesiedelt zu sein. Auf der einen Seite besitzt der Begriff eine Ausdrucksseite im Bühler’schen (1934) Sinne. So kann Fragehaltigkeit unter anderem als Grad des sprecherseitigen Bedürfnisses bezüglich der erfragten Information betrachtet werden. Eine weitere Funktion dieser Art besteht im sprecherseitigen Ausdruck eines Grades an Unsicherheit oder Unwissenheit bezüglich der erfragten Information oder aus einem Grad an Überzeugung. Auf der anderen Seite besitzt der Begriff eine Appellseite. So kann Fragehaltigkeit als der Grad bezeichnet werden, mit dem eine Reaktion des Adressaten durch den/die Sprecher/in erforderlich gemacht wird, wie es in Batliners (1989) Antwortobligation der Fall ist. Eine Mischung aus Ausdruck und Appell findet sich in einer möglichen Interpretation des commitmentMerkmals wie es unter anderem von Gunlogson (2003, 2008) definiert wurde. Dabei kann der Grad an Fragehaltigkeit als der Grad betrachtet werden, mit dem der/die Sprecher/in die Verantwortung über das Gespräch bei sich hält oder an den/die Rezipient/in abgibt. Eine gezielte Elizitation eines Kontinuums an Fragehaltigkeit gehört zu den wünschenswerten Folgezielen dieser Dissertation, ist jedoch im Rahmen einer ersten Annäherung für die Hauptfrage hinderlich. Aus diesem Grund soll der Fragebegriff dieser Arbeit vorerst über das zuvor erwähnte sprechakttheoretische Konzept bestimmt werden. Fragen sind folglich definiert als Äußerungen, denen die Intention zugrunde liegt, interrogativ zu fungieren und diese Intention gleichzeitig zum Ausdruck zu bringen. Zusammengefasst sind im Rahmen dieser Arbeit Fragen also Äußerungen mit der Intention, eine implizite oder explizite Bitte um Information, Bestätigung oder Zurückweisung durch den Rezipienten zum Ausdruck zu bringen. Diese Definition stellt eine starke Vereinfachung der sprachlichen Realität dar und scheitert wie am Rahmen des Fragehaltigkeitskonzepts erkennbar spätestens an den Randphänomenen der Fragen im Übergangsbereich der indirekten Sprechakte. Da es im Rahmen dieser Arbeit jedoch wie beschrieben nicht die Zielsetzung ist, eine vollständige intonatorische Klassifikation aller Fragetypen vorzunehmen, sondern die phonetischen Effekte der durch diese Definition erfassten Kernfunktion herauszustellen, erscheint eine Beschränkung auf den kanonischen Gegenstandsbereich legitim.
12 | Forschungsstand
Das erste unmittelbar relevante Problem dieser Definition ist theoretischer Natur. Die kognitive Realität von Sprecherintentionen ist ein Bereich, der nur schwer innerhalb einer linguistischen Theorie fassbar ist (Givón 1984: 245f). Das zweite Problem, das sich unmittelbar daraus ergibt, ist hingegen methodischer Natur. Wie erwähnt lassen sich zwar über konversationsanalytische Methoden maximale Annäherungen an die Sprecherintention innerhalb einer gegebenen Konversation bewerkstelligen, eine fehlerfreie Rekonstruktion von Intentionen ist jedoch aus dieser Perspektive aufgrund der Natur der Sache nicht möglich. Dieses Problem soll im Rahmen der vorliegenden Arbeit dadurch umgangen werden, dass die Produktionsreihe in Kapitel 4 und 5 Experimente umfasst, die gezielt konzipiert wurden, die Intention der Äußerungen durch den Experimentaufbau vorzugeben. Die dabei herausgestellten Parameter sollen in den anschließenden Perzeptionsexperimenten mit der expliziten Aufgabenstellung abgefragt werden, die entsprechende Intention zu identifizieren. Die Möglichkeit, Äußerungen zu erhalten, die nicht interrogativ intendiert sind, ist dadurch nicht ausgeschlossen, aber reduziert. Um dieses Problem weiter zu minimieren, sollen im Rahmen dieser Arbeit auch auf struktureller Ebene mögliche Problemund Randbereiche von Fragen ausgeklammert und der Fokus auf die im Folgenden als ‚kanonisch‘ klassifizierten Fragesatztypen gelegt werden. Diese Beschränkung des Gegenstandsbereich restringiert zwar auch die Generalisierbarkeit bezüglich der Frage, ob alle interrogativ intendierten Äußerungen über die herausgestellten intonatorischen Parameter markiert werden, vermeidet jedoch gleichzeitig die Integration nicht interrogativ intendierter Äußerungen und sichert dadurch die Reliabilität in der Beantwortung der eigentlichen Kernfrage der Arbeit. Die strukturellen Satzmodustheorien liefern ein breites Spektrum an Fragetypen von denen sich eine Handvoll, wenn auch terminologisch uneinheitlich, dem Kernbereich der kanonischen Fragetypen des Deutschen zuzuordnen lassen. Hierzu gehören die Entscheidungsfragen, die Deklarativfragen, die WFragen und die Alternativfragen (vgl. u. a. von Essen 1964: 44ff, Bierwisch 1966: 166, Sadock & Zwicky 1985, Altmann 1987). Entscheidungsfragen (Winkler 1959: 601, von Essen 1964: 44, Bierwisch 1966: 166, Oppenrieder 1988) oder Satzfragen (Brinkmann 1962: 502, Siebs 1969: 139) zeichnen sich syntaktisch durch Subjekt-Verb-Inversion aus. Den zweiten Kerntyp bilden die W-Fragen beziehungsweise Wortfragen (Siebs 1969: 139) oder Ergänzungsfragen (Winkler 1959: 601, von Essen 1964, Oppenrieder 1988), die aufgrund des namensgebenden W-Wortes lexikalisch als Fragen markiert sind. W-Fragen besitzen intonatorisch eine Sonderstellung, die sie für die experimentelle Untersuchung im empirischen Teil der Arbeit disqualifiziert, wie in Kapitel 2.1.1 erläutert wird.
Tonale Struktur von Fragen | 13
Aufgrund ihrer Kernstellung sowohl im System des Deutschen als auch typologisch (vgl. Sadock & Zwicky 1985, König & Siemund 2013) sollen diese im Rahmen des Literaturteils dieser Arbeit jedoch ebenfalls integriert werden. Sowohl Entscheidungsfragen als auch W-Fragen gelten typologisch als nahezu universell verbreitet (Ultan 1969, Bolinger 1978, Sadock & Zwicky 1985, König & Siemund 2013). Einen dritten Typ bilden die sogenannten Deklarativfragen (Haan 2002: 16), assertiven Fragen beziehungsweise Assertivfragen (Oppenrieder 1988, Reis 2013) oder Intonationsfragen (Niebuhr, Bergherr, Huth, Lill & Neuschulz 2010; Petrone & Niebuhr 2014). Deklarativfragen sind syntaktisch Aussagesätze und werden häufig als Prototyp für die intonatorische Signalisierung von Interrogativität betrachtet, da die Intonation hier das einzige sprachliche Mittel zur Markierung darstellt (vgl. Niebuhr et al. 2010). Deklarativfragen sind in der typologischen Betrachtung speziell, denn während Entscheidungsfragen und W-Fragen in ihrer Funktion über die Sprachen hinweg relativ konsistent sind, erfüllen Deklarativfragen gemäß Cruttenden (1997: 155) je nach Sprache drei unterschiedliche Funktionen. Sprachen wie das europäische Portugiesisch und das moderne Griechisch besitzen angeblich keine syntaktisch markierten Fragen, wodurch die intonatorisch markierten Deklarativfragen die Funktion der Entscheidungsfragen übernehmen. In Sprachen wie dem Finnischen finden sich Deklarativfragen als strukturelle Varianten funktional gleichwertig neben den Entscheidungsfragen. Zuletzt lassen sich Sprachen benennen, in denen Deklarativfragen nur die eingeschränkte Funktion der Echo-Frage erfüllen können (ebd.). Zu letzterem Typ wird häufig auch das Deutsche gezählt (Brinkmann 1962: 502, Cruttenden 1997: 156, Gibbon 1998: 89, Reis 2013). In vielen Darstellungen werden die Deklarativfragen unter die Entscheidungsfragen subsumiert (vgl. Bolinger 1989: 112). Eine letzte Kernkategorie stellen die Alternativfragen dar. Alternativfragen bilden eine Sonderform, da sie sich als Koordination von zwei Entscheidungsfragen beschreiben lassen und sich, zumindest intonatorisch, häufig auch über zwei Phrasen erstrecken und damit eine interne Phrasengrenze besitzen (vgl. Pheby 1975: 146, Brinkmann 1971: 513, Féry 1993: 89). Es ist diskutierbar, ob Alternativfragen in eine Untersuchung zur Frageintonation aufgenommen werden sollten, da sich diese laut dem Großteil der Beschreibungen zur Intonation des Deutschen identisch mit fortgesetzten Aussagen verhalten (Siebs 1969: 139, Pheby 1975: 146, Féry 1993: 89, Gibbon 1998: 88). Vereinzelte Evidenz lässt jedoch vermuten, dass diese Feststellung auf einen Mangel an empirischen Untersuchungen zurückzuführen ist (von Essen 1964: 51, Brinkmann 1971: 513, Batliner 1989a, b, Michalsky 2014, 2015a, 2015b). Aufgrund dieser besonderen intonatorischen Form und ihrer ebenfalls dominanten Stellung im typologischen Vergleich (Kretschmer 1938,
14 | Forschungsstand
Givón 1984, Sadock & Zwicky 1985, König & Siemund 2013) bilden die Alternativfragen den vierten und damit letzten kanonischen Fragetyp der im Rahmen dieser Arbeit betrachteten Satztypen. Die sogenannten tag questions müssen allein aufgrund des Fokus dieser Arbeit ausgespart werden. Die Selektion der oben genannten Fragetypen ist zu einem gewissen Grad willkürlich, orientiert sich jedoch zum einen wie dargestellt an der weiten typologischen Verteilung und ‚Kanonizität‘ der ausgewählten Fragetypen und zum anderen an der Selektion, wie sie in den vorhandenen Untersuchungen zur Frageintonation bisher vorgenommen wurden (vgl. Oppenrieder 1988, Brinckmann & Benzmüller 1999, Haan 2002). Zur Benennung der Fragetypen im Rahmen der vorliegenden Arbeit ist hinzuzufügen, dass diese keiner inhärenten Systematik folgen, sondern im Sinne einer intuitiven Zugänglichkeit für den Leser über die jeweils gängigsten Bezeichnungen erfolgt. Nach dem Begriff der Frage ist der zweite zu klärende Begriff der der Intonation beziehungsweise der intonatorischen Formmerkmale. Die Größe des Gegenstandsbereichs der Intonation kann je nach Definition des Begriffs variieren und einerseits sowohl Sprechmelodie, Intensität, Dauer und andere Bereiche der Prosodie einschließen, als auch nur die Aspekte der Sprechmelodie umfassen. Im Rahmen dieser Arbeit soll Intonation als die Gesamtheit der Formen und Funktionen der Sprechmelodie definiert werden und die drei Bereiche der Phrasierung (tonicity), der Akzentzuweisung (tonality) und der melodischen Struktur (tone) umfassen (Halliday 1967: 18, Peters 2014: 4). Damit werden Aspekte wie Rhythmus und Betonung ausgeschlossen und der Intonation unter dem Terminus der Prosodie nebengeordnet. Innerhalb dieses Intonationsbegriffs werden sowohl sprachliche als auch parasprachliche Bedeutungen gefasst. Diese sollen jedoch in Anlehnung an Ladd (2008: 34f) getrennt betrachtet und behandelt werden. Demnach kann eine Trennung zwischen parasprachlichen und sprachlichen Elementen von Intonation danach unterteilt werden, wie das Verhältnis von Bedeutung und Melodie strukturiert ist (Ladd 2008: 37). Die Markierung kategorialer sprachlicher Funktionen kommt gemäß dieser Trennung tendenziell eher den kategorialen Elementen der Intonationsphonologie und damit den sogenannten Intonationskonturen zu. Demgegenüber steht die Markierung kontinuierlicher, parasprachlicher Bedeutungen über die phonetische Realisierung (ebd.). Unter die parasprachlichen kontinuierlichen Bedeutungen fallen dabei gemäß Ladd (2008: 34) basale Aspekte der interpersonalen Interaktion wie Zustimmung oder Solidarität, aber auch emotionale Bedeutungen wie Wut oder Freude, die im Rahmen dieser Arbeit als Aspekte der Sprechereinstellung oder attitudinale beziehungsweise emotionale Bedeutungen bezeichnet werden
Tonale Struktur von Fragen | 15
sollen. Beide Begriffe werden dabei bewusst vage verwendet und umfassen nicht nur die Einstellung des/der Sprechers/in bezüglich des propositionalen Gehalts der Äußerung, sondern auch selbstoffenbarende Ausdrucksaspekte des emotionalen Zustands wie Wut oder Unsicherheit sowie interaktive Ausdrucksaspekte über das Verhältnis zwischen Hörer/in und Sprecher/in und Appellaspekte bezüglich einer adressatenbezogenen Erwartungshaltung. Als gemeinsames Merkmal parasprachlicher Bedeutung gilt dabei gemäß Ladd (2008: 34), dass diese nicht den propositionalen Gehalt der Äußerung verändern und tendenziell unabhängig vom sprachlichen Material existieren können. Je nach Modell und damit verbunden zugrundeliegender Theorie ist die Grenze dieser Trennung und vor allem die Erfassung und Beschreibung ihrer Elemente stark variabel. Eine grundsätzliche Trennung von kategorialen und kontinuierlichen Elementen, wenn auch nicht mit Bezug zu einer Trennung der Bedeutungsebene, findet sich jedoch mittlerweile in allen gängigen Intonationsmodellen. Problematisch ist die Differenzierung der beiden Ebenen in Fällen, in denen nicht klar bestimmt werden kann, ob die entsprechende Funktion der sprachlichen oder attitudinalen Ebene zuzuordnen ist. Derartige Fälle werden von Ladd (2008: 40) als ‚parasprachliches Patt‘ bezeichnet (paralinguistic stalemates). Frageintonation stellt möglicherweise, wie im Folgenden noch gezeigt werden soll, einen solchen Fall dar und wird auf der einen Seite als sprachliche Kategorie (von Essen 1964, Brinkmann 1962, Bierwisch 1966, Pheby 1975, Oppenrieder 1988) und auf der anderen Seite als attitudinales Kontinuum (Ohala 1983, Batliner 1989b, Haan 2002: 225, Chen 2005: 41f) betrachtet. Somit kann nicht a priori entschieden werden, ob eine intonatorische Markierung von Interrogativität, sofern diese überhaupt existiert, auf Ebene der phonologischen Struktur oder auf Ebene der phonetischen Realisierung erwartet werden kann. Daher sollen in den folgenden beiden Hauptteilen (Kapitel 2.1 und 2.2) zuerst die tonale phonologische Struktur und ihre Modelle und Bedeutungsaspekte und anschließend die phonetische Realisierung dargestellt werden.
2.1 Tonale Struktur von Fragen Die Trennung der phonologischen Elemente von Intonation von ihren phonetischen Ausprägungen lässt sich analog zur segmentalen Ebene beschreiben. Dabei wird der Vielzahl der individuellen Realisierungen der Sprechmelodie ein überschaubares Inventar an Intonationskonturen zugrunde gelegt, das die phonologisch distinktiven Tonhöhenbewegungen erfasst. Phonologisch distinktiv sind Intonationskonturen dahingehend, dass sie sich als Abstraktionen konkreter Melodieverläufe mit äquivalenter sprachlicher Funktion beschreiben
16 | Forschungsstand
lassen (Peters 2014: 53ff). Das Problem bei der Bestimmung des phonologischen Forminventars einer Sprache besteht dabei darin, dass zur Erfassung äquivalenter sprachlicher Funktionen streng genommen ein umfassendes Modell der möglichen Bedeutungen von Intonation der formalen Erfassung des phonologischen Inventars voranzugehen hätte (vgl. ebd.). Die phonologische Distinktivität von Intonationskonturen drückt sich allerdings nicht wie in der segmentalen Phonologie in lexikalischen und damit semantisch relativ klar fassbaren Unterschieden aus, sondern in abstrakten Merkmalen, die sich in der kommunikativen Funktion widerspiegeln. Aufgrund ihrer Abstraktheit ist ein Modell der semantischen Merkmale von Intonation, wie es unter anderem bei Pierrehumbert und Hirschberg (1990) oder Peters (2014: 53ff) vorgeschlagen wird, entsprechend schwieriger empirisch zu überprüfen. Aus diesem Grund stellen viele der gängigen Modelle zur Beschreibung der Phonologie von Intonation in erster Linie rein formale Beschreibungen des Intonationssystems dar und stützen sich zur Ermittlung der phonologischen Distinktivität nicht auf distinktive Bedeutungen der Konturen. Hiermit ist das scheinbar widersprüchliche Bild erklärbar, welches sich im weiteren Verlauf des Kapitels ergibt, wenn die Bedeutungsunterschiede der tonalen Struktur für formal bereits existierende phonologische Kategorien diskutiert werden. Zur Beschreibung phonologisch distinktiver Konturen lassen sich zwei Hauptströmungen unterscheiden: tune-Ansätze, wie sie unter anderem in der Tradition der Britischen Schule zu finden sind, und tone-Ansätze gemäß der autosegmental-metrischen Theorie. Die Tradition der Britischen Schule geht auf frühe Beschreibungen der Intonation des Englischen unter anderem nach Palmer (1922), Kingdon (1958), Halliday (1967), O’Connor und Arnold (1961, 1973) sowie Crystal (1969) zurück und findet sich in späteren Beschreibungen unter anderem bei Bolinger (1989, 1998) und Cruttenden (1997). In der Tradition der Britischen Schule werden Intonationskonturen als Ganzes erfasst und über Merkmale des Verlaufs der Sprechmelodie wie tief-steigend oder fallend-steigend beschrieben. Dabei wird die Äußerung jedoch bereits in Abschnitte unterteilt, von denen der Nukleus, bestehend aus der letzten akzentuierten Silbe und dem nachfolgenden Abschnitt bis zum Phrasenende, für die Bedeutung der Gesamtäußerung besonders hervorgehoben wird (vgl. Palmer 1922: 8, Halliday 1967: 12ff, O’Connor & Arnold 1961: 11f, 1973: 13f). Das Inventar nuklearer Konturen variiert innerhalb der unterschiedlichen Beschreibungen zwischen drei (Gleason 1961), vier (Palmer 1922), fünf (Kingdon 1958, Halliday 1967) oder sechs distinktiven Konturen (O’Connor & Arnold 1961, 1973). Die meisten traditionellen Untersuchungen zur Intonation des Deutschen lassen sich ebenfalls als tune-Ansätze einordnen, von denen sich einige explizit
Tonale Struktur von Fragen | 17
auf die Britische Schule beziehen. Das Aussprachewörterbuch zur Bühnensprache von Siebs (1898; 1901: 78) enthält bereits eine kurze Beschreibung zum ‚Tonfall‘, in der die drei grundsätzlichen Melodiebewegungen fallend, schwebend und steigend angegeben werden. Als erste systematische und korpusbasierte Untersuchung der Intonation des Deutschen wird in der Regel von Essen (1956, 1964) angeführt. Auch von Essen (1964: 46) unterscheidet drei nukleare Konturen: die terminale (fallende), die progrediente (schwebende oder Plateaumelodie) und die interrogative (steigende) Tonführung. Diese Dreiteilung der Melodieverläufe übernehmen unter anderem Wodarz (1960: 85), Brinkmann (1962: 501) in seiner Grammatik der deutschen Sprache, und auch Bierwischs (1966: 164, 182) generatives Modell der Satzintonation stützt sich auf von Essens (1964) Daten und Analysen. Eine explizite Übertragung des Halliday’schen (1967) Intonationssystems mit seinen fünf distinktiven nuklearen Konturen liefern sowohl Pheby (1975: 53), der diese in einen hierarchischen Entscheidungsbaum zur Tonmusterselektion integriert, als auch Kohler (1977: 196). Auch die Darstellung Fox‘ (1984) ist im Wesentlichen der Tradition der Britischen Schule zuzuordnen. Während der Großteil der modernen Beschreibungen der Intonation des Deutschen – mit zahlreichen Ausnahmen im Bereich der Prosodie-Synthese (z. B. Möbius 1993) – der autosegmental-metrischen Theorie zuzuordnen ist, hat sich die Tradition der Britischen Schule mit wesentlichen Modifikationen im Kieler Intonationsmodell (KIM; Kohler 2006) erhalten. Einen von den bisherigen Untersuchungen abweichenden Ansatz liefern Isačenko und Schädlich (1966: 12), die das gesamte Inventar relevanter Tonmuster auf die zwei Melodiebewegungen steigend und fallend reduzieren und damit auf die Alternanz von Hoch- und Tieftönen. Damit stellt ihr Modell ein Ebenenmodell dar, das sich wesentlich von den konturbasierten Modellen der Britischen Schule unterscheidet und bereits Ähnlichkeiten mit dem autosegmentalmetrischen Beschreibungsmodell aufweist, das im Folgenden dargestellt wird. Im Kontrast zur Britischen Tradition stehen die tone-Ansätze der autosegmental-metrischen Theorie (AM-Theorie). Ursprünglich für die Beschreibung von Tonsprachen und die Assoziation von lexikalischen Tönen mit tontragenden Einheiten (tone bearing units) konzipiert (Leben 1976, Goldsmith 1976), wurde der Ansatz auch auf Intonationssprachen übertragen und weiterentwickelt (vgl. Liberman 1975, Bruce 1977, Pierrehumbert 1980, Gussenhoven 1984, Beckman & Pierrehumbert 1986). Dabei zeigen sich in der AM-Theorie Weiterentwicklungen wesentlicher Konzepte des amerikanischen Strukturalismus wie der vertikalen Intervallskala, die bereits Pike (1945: 25) zur Beschreibung von Intonation einführt. In der AM-Theorie lassen sich distinktive Konturen gemäß eines targets-and-transitions Modells über Tonsequenzen beschreiben, die tona-
18 | Forschungsstand
le Zielpunkte in Form von hohen und tiefen Wendepunkten im Melodieverlauf spezifizieren (Pierrehumbert 1980). Hohe und tiefe Wendepunkte stellen dabei im Sinne der vertikalen Intervallskala lokale Tonstufen und keine absoluten Werte dar. Dabei werden in der Regel nur die tonalen Zielpunkte als phonologisch distinktive Einheiten betrachtet, während die Übergänge in der phonetischen Implementierung im einfachsten Fall als linear interpoliert angenommen werden (ebd.). Die Übergänge können dabei in der phonetischen Realisierung zwar variieren, aber nicht distinktiv im Sinne des phonologischen Systems. Dies macht einen wesentlichen Unterschied zum Kieler Intonationsmodell aus, in dem auch die Transitionen phonologische Bedeutung tragen können (vgl. Dombrowski & Niebuhr 2005, 2010, Kohler 2006). Das klassische Modell zur autosegmental-metrischen Beschreibung von Intonation stellt das für das Englische entwickelte ToBI-Modell (Tone and Break Indices) dar. Dies hat einen wesentlichen Ursprung in der Arbeit von Pierrehumbert (1980), wurde unter anderem von Beckman und Pierrehumbert (1986) weiterentwickelt, findet in seiner heutigen Form (Beckman & Ayers Elam 1997, Beckman, Hirschberg & Shattuck-Hufnagel 2005) weite Verbreitung und ist auf zahlreiche Sprachen übertragen worden. Eine Übertragung des ToBIModells auf das Deutsche stellt unter anderem das bis heute weiterentwickelte GToBI-Modell dar (Grice, Reyelt, Benzmüller, Batliner & Mayer 1996, Reyelt, Grice, Benzmüller, Mayer & Batliner 1996, Grice & Baumann 2002, Grice, Baumann & Benzmüller 2005). Eine alternative Ausprägung des autosegmentalmetrischen Ansatzes besteht im für das Niederländische entwickelten ToDISystem (Transcription of Dutch Intonation; Gussenhoven 2005), das auf die Arbeit von Gussenhoven (1984) zurückgeht. Auch dieses Modell ist auf das Deutsche angewandt worden und findet sich unter anderem in den Arbeiten von Féry (1993) und Grabe (1998) sowie dem im Folgenden näher thematisierten Modell von Peters (2014). Ein wesentlicher Unterschied zum ToBI-System besteht unter anderem im Verzicht auf die Markierung von Prominenzen und Pausen, womit das ToDI-Modell ein reines Intonationsmodell darstellt. Des Weiteren liegt dem ToDI-System die Annahme zugrunde, dass Phrasenakzente keine eigene Stellung im System besitzen und sich als Folgetöne den Tonhöhenakzenten zuordnen lassen, sowie in der Verlagerung von einer on-ramp zu einer offramp Perspektive. On-ramp Ansätze wie im ToBI-Modell betrachten dabei die Tonhöhenbewegung zum Akzentton hin als die primär relevante Tonhöhenbewegung, während off-ramp Ansätze die Beschreibung der Tonhöhenbewegung ab dem Akzentton in den Mittelpunkt stellen (Gussenhoven 2004:127f). Weitere Anwendungen des AM-Modells, die sich nicht klar der ToBI- oder ToDIStrömung zuordnen lassen, bilden die Arbeiten von Wunderlich (1988) und von
Tonale Struktur von Fragen | 19
Uhmann (1991). In jüngster Zeit lässt sich zudem die Bestrebung feststellen, die Vergleichbarkeit der Studien zur Intonation im deutschsprachigen Raum durch die Entwicklung eines Konsens-Models der Intonation zu erhöhen. Das sogenannte DIMA-Modell weist dabei einen höheren Grad an phonetischer Information auf, um von der Integration phonologischer Theorien insoweit abzusehen, dass eine Übersetzung in alle gängigen Intonationsmodelle des Deutschen gewährleistet werden kann. Das DIMA-Modell befindet sich zum Zeitpunkt der Publikation dieser Arbeit in einer weiteren Testphase nachdem vorherige Testläufe ein hohes Maß an interlabeler agreement zeigen konnte (Kügler et al. 2015). Im Rahmen dieser Arbeit soll das Modell nach Peters (2014), welches in Peters (2005) innerhalb der Dudengrammatik erstmals veröffentlicht wurde, in seiner aktuellsten Form (Peters 2016) zur Annotation und Beschreibung der tonalen Struktur verwendet werden. Einer der wesentlichen Gründe für diese Entscheidung liegt im Umgang mit Phrasenakzenten. Die Arbeit folgt dabei der Argumentation, dass Phrasenakzente und damit verbunden Intermediärphrasen als eigenständige intonatorische Domäne unterhalb der Intonationsphrase für die Beschreibung des Deutschen nicht notwendig sind (vgl. Peters, Hanssen & Gussenhoven 2015). Ein zweiter wesentlicher Grund besteht in der Analyse von tonaler Bedeutung, die im Rahmen dieser Arbeit einen essenziellen Teil ausmacht. Während die gängigen Anwendungen des ToBI-Systems zwar vereinzelt Bedeutungsaspekte thematisieren, stellen diese, wie zuvor erwähnt, in erster Linie formale Beschreibungssysteme dar und führen zum Problem der Bestimmung phonologischer Distinktivität. Das Modell nach Peters (2014, 2016) ist die bisher einzige Beschreibung des Intonationssystems des Deutschen, die mit einer umfassenden semantischen Beschreibung der tonalen Bedeutung des Kernsystems verbunden ist. Der Vorteil dieser Intonationssemantik für die vorliegende Arbeit besteht vor allem darin, dass die Konturwahl über semantische Eigenschaften vorhergesagt werden kann. Dies ist für die Erstellung des Testmaterials von besonderer Relevanz, wie in Kapitel 4.2.1 gezeigt wird. Das folgende Kapitel widmet sich der Verbindung von Konturwahl und Satzmodus. Dabei soll herausgestellt werden, inwieweit bestimmte Konturen mit der pragmatischen Funktion der Interrogativität assoziiert werden, welche Bedeutung Intonation im allgemeinen zugeschrieben wird, wie sich diese Bedeutung beschreiben lässt und abschließend, welche Bedeutungsaspekte sich der tonalen Struktur innerhalb von Fragen zuordnen lassen.
20 | Forschungsstand
2.1.1 Konturwahl und Satzmodus Frageintonation stellt eines der meistdiskutierten Phänomene dar, wenn es um typologische Universalien in der Intonation geht (Ladd 1981). Dabei steht vor allem in den traditionellen Untersuchungen häufig die Frage im Mittelpunkt, ob sich bestimmte tonale Strukturen, das heißt Intonationskonturen finden lassen, die häufig mit Fragen assoziiert werden und daher tendenziell als Markierung von Interrogativität betrachtet werden können. Dabei ist zu beachten, dass stets von Tendenzen oder Präferenzen die Rede ist und es zumindest im Rahmen der Forschungsliteratur zum Deutschen kaum Quellen gibt, die einen obligatorischen Zusammenhang von Intonation und bestimmten Satzmodi unterstellen. Frühe Evidenz für eine typologische Universalie der Frageintonation findet sich bei Hermann (1942). In den 175 von ihm untersuchten Sprachen stellt Hermann (1942: 363) fest, dass sich Fragen von Aussagen ausnahmslos durch eine Form von mehr Tonhöhe auszeichnen. Auch Ultan (1969: 47) untersucht 79 nach eigenen Angaben möglichst zufällig ausgewählte Ton- und Intonationssprachen mit besonderer Berücksichtigung geringer Verwandtschaftsbeziehungen. Dabei findet er in den 53 Sprachen, die Informationen zur intonatorischen Realisierung von Entscheidungsfragen liefern, 50, die mit irgendeiner Form von mehr Tonhöhe realisiert werden. Davon weisen 38 mehr Tonhöhe durch eine Form des finalen Anstiegs auf. Bolinger (1978) erweitert Ultans (1969) Untersuchung um 41 Intonationssprachen und findet Informationen zur Intonation von Entscheidungsfragen für 36 Sprachen. Von diesen 36 Sprachen weisen 32 eine Form des finalen Anstiegs in Fragen auf. Zuletzt liefern Hirst und di Cristo (1998) Beschreibungen zu Intonationssystemen aus 20 Sprachen und stellen einen finalen Anstieg als charakteristisches Merkmal von Entscheidungsfragen in 13 dieser Sprachen fest (Hirst & di Cristo 1998: 25f). Im Rahmen des folgenden Kapitels soll das Phänomen eines finalen Anstiegs in Fragen exemplarisch am Englischen und Deutschen skizziert werden. Der Vergleich mit dem Englischen besitzt eine zweifache Motivation. Durch die starken Parallelen nicht nur des Intonationssystems des Deutschen und des Englischen an sich, sondern auch in der gesamten Diskussion zur Frageintonation, ergänzen sich die Argumentationsgänge einerseits und erlauben andererseits eine eingeschränkte Vermutung für die Ausweitung der dargestellten Bedeutungen und Prinzipien auf andere verwandte Sprachen. Des Weiteren ist die Literatur zur Intonation des Deutschen immer noch vergleichsweise rar, so dass die Darstellung von der Hinzuziehung der Beschreibungen des Englischen profitieren kann. Ein finaler Anstieg als Charakteristikum von Fragen findet sich im Großteil der Beschreibungen zur Intonation des Englischen. Bereits Sweet (1890: 32)
Tonale Struktur von Fragen | 21
charakterisiert die steigende Melodie als interrogativ, die fallende als affirmativ. Eine vergleichbare Assoziation von final steigender Melodie und Fragen findet sich bei Palmer (1922: 8) als rising tone, bei Kingdon (1958: 210f) als tune 1, bei O’Connor und Arnold (1961: 57, 1973: 55) als low bounce oder high rise, sowie bei Halliday (1967: 26) und Wells (2006: 45). Für das Deutsche lässt sich eine vergleichbare Tendenz feststellen. So schreibt bereits Siebs (1901: 79), dass der ‚Ton‘ gewöhnlich am Ende eines Aussagesatzes absinkt, während er am Ende eines Fragesatzes ansteigt. In späteren Auflagen der ‚Richtlinien zur Bühnenaussprache‘ findet sich die gleiche Annahme in anderer Terminologie. Demnach werden berichtende Aussagen mit Vollschluss beziehungsweise terminaler Kadenz und damit fallender Intonation, Satzfragen mit Hochschluss beziehungsweise interrogativer Kadenz und damit steigender Intonation realisiert (Siebs 1969: 138). Siebs (1969: 138) hebt hervor, dass die Kadenz, definiert als die Melodie am Aussageende, die Aussageart im Sinne des Satzmodus bestimmen kann und interrogative Kadenz in der Lage ist, syntaktische Aussagesätze in Deklarativfragen zu verwandeln (Siebs 1969: 139). Auch von Essen (1964: 44) beschreibt die steigende Intonation als entscheidendes Merkmal zur Festlegung grammatischer Funktionen und benennt sie folglich als interrogative Tonführung. Des Weiteren heißt es, Entscheidungsfragen „sind an ihrer eigenartigen Sprechmelodie – und nur an ihr – zu erkennen“ (von Essen 1964: 44). Dass zumindest eine Funktion von Intonation die Markierung grammatischer Kategorien darstellt, findet sich des Weiteren bei Winkler (1959: 602), Wodarz (1960: 80), Brinkmann (1962: 501f), Stock (1970) und Stock und Zacharias (1973). In all diesen Fällen wird ein finaler Anstieg als Charakteristikum von Fragen herausgestellt. Wodarz (1960: 80) gibt zudem an, dass die Differenzierung der Satzkategorien neben dem Ausdruck des emotionalen Gehalts eine „wohl bekannte Funktion der Satzmelodie“ sei (ebd.). Isačenko und Schädlich (1966: 19) ordnen die Trennung von syntaktischen und emotionalen Funktionen von Intonation der Trennung von phonologischer und phonetischer Ebene zu. Während phonetische Faktoren wie die Skalierung der Sprechmelodie Funktionen wie den Ausdruck von Emotionen übernehmen könnten, komme der kategorischen Struktur die Markierung von syntaktischen Funktionen zu (ebd.). Dabei unterscheiden Isačenko und Schädlich (1966: 44) lediglich zwei Formen der Intonation: Einen Anstieg zur Signalisierung von Fragen und einen Fall zur Signalisierung von nicht-Fragen. Bierwisch (1966: 165) trennt, wie zuvor erwähnt, die sprachliche Funktion von der Struktur. Demnach muss eine Äußerung mit steigender Intonation nicht zwangsläufig als Frage fungieren, wird aber durch diese intonatorische Form zwangsläufig strukturell zu einer intonatorischen Frage (ebd.). Pheby (1975: 45) gibt an, dass die
22 | Forschungsstand
Intonation eine grammatische Funktion haben kann, die das Kernsystem der Intonation bildet. Demnach sei der Begriff der Frageintonation auf die häufige Realisierung von Fragen mit steigender Intonation zurückzuführen. Die Identifikation intonatorischer Prototypen in Verbindung mit Satzmodi stellt auch einen Kernaspekt des Münchener Forschungsprojekts zur Intonation von Fokus und Modus im Deutschen dar (Altmann 1988, Altmann, Batliner und Oppenrieder 1989). Im Rahmen dieser empirischen Untersuchung kommt auch Oppenrieder (1988) zu dem Ergebnis, dass Entscheidungsfragen zumindest prototypisch mit final steigender Intonation realisiert werden. Zuletzt findet sich auch in weiteren jüngeren Betrachtungen zu den Intonationsmustern des Deutschen der Hinweis, dass steigende nukleare Tonhöhenakzente ein typisches Merkmal von Fragen darstellen (Uhmann 1991: 175f, Féry 1993: 85, Grice & Baumann 2002). Obwohl häufig von einer typologischen Universalität eines finalen Anstiegs in Fragen die Rede ist, muss beachtet werden, dass es sich dabei lediglich um eine Tendenz handelt. In Ultans (1969: 47) Daten ist diese Tendenz vergleichsweise stark. Von den 53 Sprachen mit Angaben zu Entscheidungsfragen weisen nur drei ausschließlich fallende Intonation auf. Von diesen drei Sprachen sind zwei Tonsprachen (Fanti und Grebo) und die letzte, das Chitmacha, weist nur einen relativ kurzen Kommentar zur Intonation auf (ebd.)4. Auch Bolinger (1978) kann feststellen, dass nur vier der von ihm untersuchten Sprachen Entscheidungsfragen ausschließlich über einen finalen Fall realisieren. Hirst und di Cristos (1998: 25) Ergebnisse verlagern diese Tendenz, da acht der 20 untersuchten Sprachen in ‚neutralen‘ Entscheidungsfragen den finalen Anstieg nicht als charakteristisches Merkmal aufweisen. Spezifisch dyspräferieren dabei Finnisch, Dänisch und das marokkanische West-Arabisch einen finalen Anstieg und das brasilianische Portugiesisch, das Rumänische, das Bulgarische, das Russische und das Ungarische weisen diesen nur auf, wenn der finale Fall aus phrasenstrukturellen Gründen trunkiert wird (ebd.). Dabei ist fallende Intonation als reguläres Intonationsmuster von Entscheidungsfragen, zumindest für das Ungarische und das Rumänische, ausführlich beschrieben worden und kann als Konsens betrachtet werden (Gόsy & Terken 1994, Dascǎlu-Jinga 1998, Grice, Ladd & Arvaniti 2000, Ladd 2008: 145). Weitere Evidenz findet sich zudem nach Rialland (2004, zitiert nach Chen 2005: 42) in Betrachtungen afrikanischer Intonations-
|| 4 Ultans (1969) Untersuchung stellt in diesem Sinne keine Interpretation einer eigenen Datenerhebung dar, sondern die Analyse der Kommentare zur Intonation in einzelsprachlichen Grammatiken.
Tonale Struktur von Fragen | 23
systeme. Dabei kann er feststellen, dass unter anderem alle 18 Sprachen der Familie der Gur-Sprachen Fragen durch einen finalen Fall realisieren. Zuletzt lässt sich in seltenen Fällen sogar die Umkehrung der universellen Tendenz feststellen. So wird für das Belfast English (Jarman & Cruttenden 1976) und das Chikasaw (Gordon 1999) angenommen, dass Entscheidungsfragen regulär mit fallender Intonation, neutrale Aussagen hingegen mit steigender Intonation realisiert werden. In den dargestellten Betrachtungen jener Sprachen, die einen Zusammenhang von steigender Intonation und Fragen aufweisen, findet sich eine erste Begrenzung der Universalität bereits durch die Beschränkung auf Entscheidungsfragen. Gerade vor dem Hintergrund einer typologischen Universalie ist hervorzuheben, dass von den zwei häufigsten Fragetypen, W-Fragen und Entscheidungsfragen, nur letztere typischerweise mit steigender Intonation realisiert werden. Für W-Fragen kann Ultan (1969: 47) feststellen, dass von den 16 Sprachen, für die Informationen zur Intonation von W-Fragen vorliegen, nur neun einen finalen Anstieg aufweisen, während diese in sieben charakteristisch mit einem finalen Fall assoziiert werden. In den von Bolinger (1978: 499) untersuchten Sprachen lassen sich sogar nur drei von 17 Sprachen mit einem präferierten finalen Anstieg in W-Fragen feststellen, während die übrigen 14 einen finalen Fall präferieren. Und bei Hirst und di Cristo (1998) findet sich in den 20 untersuchten Sprachen keine, in denen eine neutrale W-Frage charakteristisch mit einem finalen Anstieg beschrieben wird. Dabei bilden W-Fragen als EchoFragen eine Ausnahme, für die ein finaler Anstieg wieder als typisches Merkmal auftritt (Hirst & di Cristo 1998: 26). Für das Englische findet sich die Annahme fallender W-Fragen parallel in nahezu allen Quellen zu steigenden Entscheidungsfragen unter anderem bei Palmer (1922: 72ff), Kingdon (1958: 211f), Gleason (1961: 48f), Halliday (1967: 25) und O’Connor und Arnold (1961: 44ff, 1973: 54ff) sowie Bolinger (1989: 106) und Wells (2006: 42). Dabei ist erneut hervorzuheben, dass die fallende Intonation die typische Intonation sogenannter neutraler W-Fragen darstellt. Im Großteil der Beschreibungen wird wie erwähnt die Möglichkeit eingeräumt, W-Fragen mit steigender Intonation zu realisieren, wenn diese als Echo-Fragen fungieren (wenn der nukleare Akzent auf dem W-Wort liegt; vgl. Bolinger 1989: 196) oder, um den Grad der Freundlichkeit zu erhöhen (bei nuklearem Akzent außerhalb des W-Wortes; vgl. Wells 2006: 42). Diese Diskrepanz in der Verbindung von Fragen und finalem Anstieg lässt sich auch für das Deutsche feststellen. Von Essen (1964: 49) gibt an, dass WFragen, sofern sie nicht als Nachfragen (Echo-Fragen) fungieren, mit fallender Intonation realisiert werden. Vergleichbare Aussagen finden sich bei Brink-
24 | Forschungsstand
mann (1962: 502), Winkler 1959: 601, Bierwisch (1966: 166), der den Fall als typisches Muster neutraler W-Fragen und den Anstieg als Merkmal von Echo-WFragen annimmt, Isačenko und Schädlich (1966: 44, 59), Siebs (1969: 139), der angibt, dass das einleitende Fragewort bereits „die Frageabsicht anzeige“, Pheby (1975: 146), Oppenrieder (1988) Uhmann (1991: 175ff), Féry (1993: 85) und Grice und Baumann (2002). Neben der Feststellung, dass nicht alle interrogativen Äußerungen prototypisch mit einer Form des finalen Anstiegs auftreten, lässt sich zugleich feststellen, dass ein finaler Anstieg nicht ausschließlich mit Fragen auftritt. Den häufigsten Fall bilden dabei die fortgesetzten oder auch unvollständigen, abhängigen oder progredienten Aussagen wie z. B. in Form von Nebensätzen oder koordinierten Erstgliedern. Dabei geben sowohl Bolinger (1978: 502), Ohala (1984), Cruttenden (1997: 94) als auch Hirst und di Cristo (1998: 27) an, dass die Verbindung einer Form des finalen Anstiegs mit fortgesetzten Aussagen typologisch genauso häufig auftritt wie eine Verbindung mit Entscheidungsfragen. Hirst und di Cristo (1998: 27) stellen in ihrer Untersuchung sogar fest, dass der finale Anstieg sogar häufiger mit unvollständigen Aussagen auftritt als mit Fragen. Diese Annahme findet sich in den Daten von Geluykens (1988) bestätigt, der im Rahmen einer Korpusuntersuchung zum Englischen darlegen kann, dass von den produzierten steigenden Konturen nur 50 in Deklarativ- oder Entscheidungsfragen, dagegen 246 in fortgesetzten Teilsätzen und 538 in nicht-turnfinalen Aussagen auftreten. Dies spiegelt sich in einigen Quellen durch die Annahme wieder, dass der finale Anstieg von Fragen Gemeinsamkeiten mit dem sogenannten continuation rise, zum Beispiel durch die gemeinsame Eigenschaft der Unvollständigkeit, aufweist (u. a. Bolinger 1978: 501f, Fox 1984: 59f, Cruttenden 1997: 163f, Peters 2014: 53ff), wie in Kapitel 2.1.4 und 2.2.1 ausführlicher betrachtet werden soll. Zum Englischen findet sich bereits bei Palmer (1922: 78f) ein finaler Anstieg neben Entscheidungsfragen zusätzlich in Aussagen, um unter anderem „die Unvollständigkeit des Gedankens“ auszudrücken, wobei Unvollständigkeit in Aussagen sich über einen low rise und einen high rise markieren lässt, während Entscheidungsfragen nur mit einem high rise auftreten. Kingdon (1958: 213f) stellt ebenfalls einen low rise als typisches Merkmal von fortgesetzten Aussagen im Kontrast zu einem high rise in Entscheidungsfragen fest. Gleason (1961: 49) nimmt zwar ebenfalls eine Form von Fortsetzungsintonation an, charakterisiert diese jedoch eher durch eine Form der gleichbleibenden Plateaukontur als durch einen finalen Anstieg. Vergleichbare Beschreibungen finden sich bei Halliday (1967: 41), Crystal (1969: 272), O’Connor und Arnold (1973: 63), Bolinger (1989: 99ff) sowie Wells (2006:91). Hirst (1998: 63) gibt vergleichbar mit Palmer
Tonale Struktur von Fragen | 25
(1922: 78f) und Kingdon (1958: 213f) an, dass sich im Englischen ein Unterschied im finalen Anstieg zur Markierung von unvollständigen Aussagen durch einen low rise und Entscheidungsfragen durch einen high rise findet. Auch für das Deutsche finden sich in der traditionellen Literatur Angaben zu fortgesetzten Aussagen, die allerdings im Gegensatz zum Englischen häufiger wie bei Gleason (1961: 49) mit einem Plateau als mit einem finalen Anstieg im eigentlichen Sinne assoziiert werden. Fox (1984: 28f) merkt hierzu an, dass Plateaukonturen im Deutschen generell bedeutend häufiger auftreten als im Englischen. Bereits bei von Essen (1964: 37) findet sich der Begriff der progredienten Intonation, um unvollständige Aussagen zu kennzeichnen. Progrediente Intonation ist dabei durch eine ‚Schwebehaltung‘ charakterisiert, bei der die Melodie zwar zum Ende hin leicht ansteigen kann, generell jedoch auf ein Plateau oder einen leichten kontinuierlichen Fall hinausläuft. Siebs (1969: 139) übernimmt diese Beschreibung in den späteren Auflagen und gibt an, dass der „Vordersatz zusammengesetzter Sätze“ weiterweisend intoniert wird, was hier ebenfalls eine Form von Schwebehaltung beschreibt. Pheby (1975: 166) postuliert dagegen, dass Nebensätze und andere fortgesetzte Strukturen, je nach Stärke der Verknüpfung, mit Plateaus, aber auch mit einem finalen Anstieg vergleichbar mit Entscheidungsfragen auftreten können. Kohler (1977: 206) beschreibt wiederum das Plateau als typische Intonation zur Kennzeichnung von ‚Redestücken‘. Féry (1993: 9) führt sowohl den continuation rise vergleichbar mit Entscheidungsfragen für die Signalisierung von etwas Nachfolgendem an, als auch die Wahl einer Plateaukontur. Zuletzt findet sich die Funktion des Weiterweisens für Plateaus auch bei Grice und Baumann (2002). Caspers (1998, 2000) gibt zum Niederländischen an, dass Plateaus generell eine Form von turnkeeping signalisieren und damit eher in fortgesetzten Äußerungen auftreten, während ein finaler Anstieg sowohl mit fortgesetzten Äußerungen zum turnkeeping als auch zur Signalisierung von Fragen auftreten kann. Gemäß Peters (2014: 63f) lässt sich jedoch zumindest für das Deutsche annehmen, dass Plateaukonturen auch mit Fragetypen wie Entscheidungsfragen auftreten können und eine Trennung zwischen Fortsetzungs- und Frageintonation nicht festzustellen ist. Einen Sonderfall, bei dem die weiterweisende und die interrogative Funktion des finalen Anstiegs zusammenfallen, stellen die Alternativfragen dar. Diese werden zwar auf dem ersten Frageabschnitt generell mit steigender Intonation realisiert, jedoch mit fallender Intonation am Äußerungsende. Alternativfragen finden in den typologischen Studien häufig keine gesonderte Betrachtung. Eine Ursache hierfür ist, dass viele Beschreibungen zur Intonation den Fokus gezielt auf einzelne vollständige Sätze legen. Ein weiterer Grund scheint zu sein, dass
26 | Forschungsstand
in vielen Sprachen kein Unterschied zwischen der weiterweisenden Intonation von Alternativfragen und Aussagen angenommen wird. So gibt etwa Kingdon (1958: 213f) an, dass die non-finalen Phrasen von Alternativfragen im Englischen mit der gleichen Form des low rise realisiert werden wie fortgesetzte Aussagen und sich damit anders verhalten als Entscheidungsfragen. Zugleich kann der Anstieg durch eine gleichbleibende Plateaukontur substituiert werden (ebd.). Auch Crystal (1969: 272) beschreibt, dass sich die weiterweisende Funktion des finalen Anstiegs sowohl in Aussagen als auch in Alternativfragen findet und sich in beiden nicht unterscheidet. Dies geben des Weiteren auch Bolinger (1989: 114) und Hirst (1998: 63) an, wobei letzterer die Verwendung des low rise in Alternativfragen gleichermaßen wie in fortgesetzten Aussagen in Abgrenzung zum high rise in Entscheidungsfragen annimmt. Auch im Deutschen dominiert die Annahme, dass Alternativfragen mit einer Form eines finalen Anstiegs oder eines Plateaus realisiert werden, die nicht von der Verwendung in fortgesetzten Aussagen zu unterscheiden ist. Dies findet sich unter anderem bei von Essen (1964: 44), der hervorhebt, dass die progrediente Intonation sowohl in Aussagen als auch Alternativfragen nicht mit der interrogativen Melodieführung identisch ist. Zugleich fügt er jedoch hinzu, dass Alternativfragen in besonderen Fällen auch mit dem interrogativen Anstieg realisiert werden können (von Essen 1964: 51). Auch Bierwisch (1966: 166) gibt für Alternativfragen und fortgesetzte Aussagen das gleiche Muster von steigender und fallender Intonation an. Vergleichbar mit von Essens (1964: 51) Beschreibung verhält es sich bei Brinkmann (1971: 513), der zwar generell die gleiche Intonation bei fortgesetzten Aussagen und Alternativfragen annimmt, aber ebenfalls einräumt, dass der erste Teil von Alternativfragen mit dem finalen Anstieg einer Entscheidungsfrage realisiert werden kann. Eine dritte Möglichkeit tritt bei Pheby (1975: 57) hinzu. Dieser beschreibt, dass Alternativfragen im Regelfall mit einem Plateau gefolgt von einem Fall in der letzten Phrase realisiert werden. Fortgesetzte Aussagen können zwar ebenfalls regulär mit einem Plateau, allerdings auch je nach Grad der Verbindung zur folgenden Phrase wie Entscheidungsfragen mit einem finalen Anstieg auftreten. In den meisten Beschreibungen zur Intonation des Deutschen erfahren Alternativfragen keine getrennte Betrachtung. So gibt auch Gibbon (1998: 88) an, dass sich Alternativfragen und progrediente Aussagen im Deutschen intonatorisch nicht unterscheiden lassen. Zusätzlich muss sowohl im Englischen als auch im Deutschen zwischen Alternativfragen mit einer geschlossenen Menge an Alternativen und solchen mit einer offenen, erweiterbaren Menge unterschieden werden. Erstere werden auf der zweiten Phrase typischerweise fallend realisiert, während letztere ebenfalls
Tonale Struktur von Fragen | 27
steigend enden können (Kingdon 1958: 213, Brinkmann 1971: 513, Bolinger 1989: 114). Dabei lassen sich Alternativfragen mit einem finalen Anstieg auf der letzten Phrase auch als Ganzes als Entscheidungsfragen betrachten (Bolinger 1989: 114, Reis 2013). Es lässt sich festhalten, dass auf Basis des Forschungsstandes nicht bestimmt werden kann, wie sich das finale Intonationsmuster der nonfinalen Phrasen in Alternativfragen verglichen mit Entscheidungsfragen und fortgesetzten Aussagen verhält, da dies weder für das Englische noch das Deutsche bisher experimentell überprüft worden ist. Bisher konnte gezeigt werden, dass sich ein finaler Anstieg erstens nicht in allen Sprachen der Welt zur Markierung von Interrogativität finden lässt, zweitens in Sprachen, die eine solche Verbindung aufweisen, generell auf bestimmte Fragetypen wie Entscheidungs- oder Deklarativfragen beschränkt ist und drittens nicht exklusiv mit Fragen, sondern auch mit unvollständigen Aussagen auftreten kann. Als letzter Punkt soll dargelegt werden, dass selbst die Verbindung von steigender Intonation und Entscheidungsfragen in den entsprechenden Sprachen nur eine Tendenz und keine kategorische grammatische Markierung darstellt. In nahezu allen Betrachtungen zur Intonation des Englischen finden sich neben der Annahme typisch steigender Entscheidungsfragen auch Ausnahmen. Dabei ist die Erwähnung fallender Entscheidungsfragen generell an bestimmte Kontexte oder pragmatische Nuancen gebunden, auf welche in Kapitel 2.1.3 genauer eingegangen wird. So findet sich die Erwähnung fallender Entscheidungsfragen unter anderem bei Palmer (1922: 72f), Kingdon (1958: 216f), Halliday (1967: 26) und O’Connor und Arnold (1961: 32f). In der vergleichsweise jüngeren Forschung schließen auch unter anderem Bolinger (1989: 98, 143, 380) und Wells (2006: 15) zum amerikanischen Englisch und Hirst (1998: 63f) und Cruttenden (1997: 136) zum britischen Englisch darauf, dass Intonation keine eindeutige Verbindung mit Fragen, auch nicht bestimmten Fragetypen, aufweist und generell jeder Satztyp mit jeder intonatorischen Form auftreten kann und umgekehrt. Fries (1964) untersucht die Assoziation von Entscheidungsfragen mit steigender Intonation anhand von Korpusdaten, da nach eigenen Angaben kein quantitativer Beleg für die Annahme eines finalen Anstiegs als ‚normaler Intonation‘ dieses Satztyps existiere. Sein Korpus basiert auf einer Spielshow, in der vier Teilnehmer versuchen über Entscheidungsfragen den Beruf einer fünften Person zu ermitteln. In den 2561 Entscheidungsfragen des Korpus konnte Fries (1964: 248) für 1580 (61,7 %) final fallende Intonation und nur für 981 final steigende Intonation feststellen. Das wesentliche Ergebnis ist dabei laut Fries (1964: 249) nicht nur die Feststellung, dass fallende Entschei-
28 | Forschungsstand
dungsfragen existieren und dabei in bestimmten Situationen sogar häufiger auftreten als steigende Fragen, sondern dass auch fallende Fragen als unmarkierte Fragen fungieren können und damit keinen besonders markierten pragmatischen Spezialfall darstellen, wie die traditionellen Darstellungen zur englischen Intonation vermuten lassen. Auch Geluykens (1987, 1988) argumentiert dafür, dass Intonation keine unmittelbare Verbindung zu grammatischen Funktionen besitzt. In einer Perzeptionsstudie kann Geluykens (1987) feststellen, dass die Interpretation der gleichen Intonationskontur deutlich in Abhängigkeit von kontextuell-pragmatischen Faktoren variieren kann. So können Äußerungen mit fallender Intonation als Fragen interpretiert werden, wenn der Kontext eine entsprechende Interpretation begünstigt, während steigende Äußerungen als Aussagen interpretiert werden können, wenn der Kontext eine Frageinterpretation blockiert. Demnach kann final steigende Intonation zwar einen Hinweis auf Interrogativität liefern, wenn andere Faktoren uneindeutig ausfallen, dies stellt aber nicht die primäre Funktion der Intonation dar. In einer mit Fries (1964) vergleichbaren Korpusanalyse zum Auftreten von Intonationsmustern in Deklarativfragen (queclaratives) und Entscheidungsfragen (inversion questions) kann Geluykens (1988) weiterhin herausstellen, dass von den 119 Entscheidungsfragen 68 mit einer Form des finalen Anstiegs und 51 mit einem finalen Fall realisiert werden. Von den 60 Deklarativfragen finden sich sogar nur 19 mit einem finalen Anstieg und 41 mit einem finalen Fall. Des Weiteren kann Geluykens (1988) aufzeigen, dass im gesamten Korpus nur 5,1 % der finalen Anstiege überhaupt auf Fragen fallen. Da sich in dem von Geluykens (1988) verwendeten Korpus eine größere Vielfalt an sprachlichen Situationen findet als in der sehr beschränkten Spielshow-Situation von Fries (1964), sind seine Daten zudem grundsätzlich besser auf Alltagssprache generalisierbar. Auf der anderen Seite birgt die Wahl eines solchen Korpus eine gewisse Problematik in sich. Wie einleitend zu Kapitel 2 thematisiert, können Fragen als pragmatische Akte anhand von Korpora nicht über Intentionen identifiziert werden. Geluykens (1988) wählt daher den Ansatz, eine Frage distributionell über die Rezipientenreaktion zu klassifizieren. Dies wird von Haan (2002: 42) dahingehend kritisiert, dass bei einem ja als Rezipientenreaktion nicht zweifelsfrei zwischen einer Antwort und einem Hörersignal (backchannel) unterschieden werden kann. Gerade bei Deklarativfragen mit deklarativer Syntax, die zusätzlich eine fallende Intonation aufweisen, kann daher nur schwer mit Sicherheit ermittelt werden, ob der/die Rezipient/in die Äußerung als Frage auffasst und beantwortet oder als Aussage und diese in Form eines backchannels zur Kenntnis nimmt. Dieser Kritikpunkt sollte bei der Interpretation der Daten berücksichtigt werden.
Tonale Struktur von Fragen | 29
Auch für das Deutsche findet sich eine mittlerweile überwiegende Gegenposition zur satzmodusspezifischen Intonation. Bereits bei Siebs (1901: 79) heißt es, dass der Intonation eine feine Differenzierung unterschiedlicher Bedeutungsaspekte zukommt und konkrete Regeln zur Verbindung von Melodieverläufen und Satzmodi nicht formulierbar sind. Von Essen (1964: 44f), der für die final steigende Intonation sogar den Begriff Frageintonation prägt, führt die mögliche Realisierung fallender Fragen als Suggestivfragen an (von Essen 1964: 60) und bemerkt, dass jegliche Form grammatischer Intonation von ‚emotionalen Faktoren‘ überformt werden kann. Der Ansatz der emotionalen Überformung der Intonation grammatischer Funktionen ist ebenfalls Teil der früheren Auflagen der Dudengrammatik. Winkler (1959: 600f) schreibt, dass Intonation in erster Linie die Gefühlslage des/der Sprechers/in und seine/ihre Beziehung zum/zur Hörer/in signalisiert und nur eine lose Verbindung zu grammatischen Formen besitze. Wodarz (1960: 80) gibt an, dass Intonation zwar ein wesentliches Merkmal zur Differenzierung von Satzkategorien darstellt, aber durchaus auch Ausdruck emotionaler Aspekte sei, die die grammatische Intonation überformen können. Bierwisch (1966: 102) gibt an, dass fallende Entscheidungsfragen allein aufgrund ihrer Häufigkeit zum grammatischen Kernsystem gerechnet werden müssen und damit äquivalent neben steigenden Fragen auftauchen und keine attitudinalen Überformungen darstellen. Allerdings schreibt er weiterhin, dass der Unterschied zwischen fallenden und steigenden Fragen zwar grammatisch ist, sich aber nicht grammatisch bedeutsam erklären lässt (Bierwisch 1966: 177). Brinkmann (1971: 510f) vertritt wiederum den Ansatz der Überformung, allerdings nicht bezogen auf den Ausdruck von Emotionen, sondern durch Aspekte der kommunikativen Orientierung. Entscheidungsfragen mit fallender Intonation finden sich ebenfalls regulär in den Darstellungen von Brinkmann (1971: 510) und Stock und Zacharias (1973: 138f). Eine direkte Gegenposition zur Idee der grammatischen Funktion von Intonation bezieht Kohler (1977: 200ff), der, wie beschrieben, direkt den Begriff der Frageintonation beziehungsweise interrogativen Tonführung von Essens (1964: 44) kritisiert, da dies einen nicht existierenden grammatischen Zusammenhang unterstellen würde. Dieser Position lässt sich auch Klein (1982) zuordnen, der in seinem Aufsatz unmittelbar Bezug zum Thema fallender Entscheidungsfragen nimmt. Klein (1982) argumentiert auf Basis der eigenen Aussprache dafür, dass fallende Entscheidungsfragen im Deutschen eine gängige Realisierung darstellen und nicht als Randphänomene zu behandeln sind. Demnach würden im Deutschen keine interrogativen Konturen existieren, sondern allenfalls Interrogativität begünstigende Konturen aufgrund ihrer Funktion zur Markierung des thematischen Standes und abstrakterer Prozesse des gesamten Informationsflusses.
30 | Forschungsstand
Fox (1984: 58) hebt in seiner Betrachtung der Deutschen Intonation explizit hervor, dass die Zuordnung von grammatischen Kategorien zu Intonationskonturen der Intonation zu starke Restriktionen auferlegt und die Bedeutung von Intonation globaler gefasst werden muss. Auch die Arbeiten im Rahmen des Münchener Intonationsprojekts zu Modus und Fokus im Deutschen (Altmann 1988, Altmann, Batliner & Oppenrieder 1989) stellen zwar wie erwähnt die steigende Realisierung als Prototypen von Entscheidungs- und Deklarativfragen heraus, räumen jedoch mit Bezug auf Geluykens (1987) ein, dass Entscheidungsfragen sowohl steigend als auch fallend realisiert werden können (Batliner 1989a). Auch Gibbon (1998) gelangt zu dem Fazit, dass, während die traditionelle Literatur häufig noch einen grammatischen Kern von Intonation annimmt, die Intonationsforschung sich zunehmend der höheren Variation und vielfältigeren Assoziationen zwischen kommunikativen Funktionen und intonatorischen Formen bewusst würde. Vergleichbar mit den Analysen Geluykens‘ (1988) zum Englischen kann unter anderem Selting (1995: 232ff) die Häufigkeit fallender Entscheidungsfragen anhand spontansprachlicher Korpora des Deutschen bestätigen. Selting (1995: 232f) untersucht unter anderem die Intonation von Fragen als kommunikativem Aktivitätstyp und kommt ebenfalls zu dem Ergebnis, dass ein wesentlicher Teil der Entscheidungs- und Deklarativfragen mit fallender Intonation realisiert wird. Demnach ließe sich kein systematischer Zusammenhang von Fragen und bestimmten Intonationsmustern feststellen. Diese Beobachtung zur Verteilung von Intonationskonturen und Satzmodi konnte in der jüngeren Literatur weiter bestätigt werden. Sowohl Kügler (2003), der auf ein spontansprachliches Korpus mit Map Task-Daten (vgl. Anderson et al. 1991) zum Obersächsischen zurückgreift, als auch Kohler (2004), der Daten des Kieler Korpus zu Lese- und Spontansprache analysiert, können das gleiche reguläre Auftreten fallender Entscheidungsfragen feststellen. Zuletzt findet sich diese Verteilung dialektübergreifend in den Untersuchungen regionaler Intonation spontansprachlicher Daten in den ausführlichen Betrachtungen von Gilles (2005: 34, 76 und Peters (2006: 102f, 247f) bestätigt. Im Anbetracht dieser Datenlage gilt es in der jüngeren Literatur weitestgehend als Konsens, dass im Deutschen keine satzmodusspezifische Intonation existiert (vgl. Petrone & Niebuhr 2014, Peters 2014: 52f). Nachdem am Beispiel des Englischen und Deutschen gezeigt werden konnte, dass die traditionelle Position zur Annahme grammatischer Intonationskonturen weitestgehend einer vollständigen Loslösung der intonatorischen Form von der grammatischen Funktion gewichen ist, soll die Frage aufgeworfen werden,
Tonale Struktur von Fragen | 31
wie es zu einer solchen Diskrepanz bei der Betrachtung des gleichen Gegenstands kommen konnte. Crystal (1969: 2) gibt an, dass frühere Betrachtungen der englischen Intonation vor allem unter dem Bedarf nach pädagogischen und damit greifbaren und einfach zu vermittelnden Ansätzen entstanden sind. Diese besonderen Anforderungen machen es nötig, das System in seiner einfachsten Form darzustellen, auch wenn dies häufig zu Übersimplifikationen und Fehlinterpretationen geführt hat (Crystal 1969: 2, 290). Dabei sind gerade die früheren Untersuchungen zur Intonation in ihrer Methodik selten datengeleitet und häufig auf Eigenintuition der Autor/innen basierend, womit sich das Potenzial verstärkt, Prototypen abseits der sprachlichen Realität zu erfassen (Crystal 1969: 2, vgl. auch Ladd 2008: 11f). Die Form der bewussten Vereinfachung stellt dabei jedoch selten eine Nachlässigkeit der Verfasser dar, sondern wird häufig entsprechend problematisiert (vgl. Halliday 1967: 7, O’Connor & Arnold 1961: VII, 1973: VII, Wells 2006: 1) und ist eine Notwendigkeit, da pädagogische Ansätze nicht den Anspruch auf Vollständigkeit besitzen können, wie dies von einer rein sprachwissenschaftlichen Beschreibung erwartet wird. Dies ist vereinbar mit von Essens (1964: 63) Angaben zu seiner Untersuchung des Deutschen, dass sich eine „unüberschaubare Menge intonatorischer Nuancen, die kaum beschrieben und schon gar nicht dem Lerner der deutschen Intonation vermittelt werden könne“, ergebe, und eine Beschränkung der beschriebenen Intonationsmuster auf die „allgemein verbreiteten und oft angewandten Intonationsformen“ unumgänglich für pädagogische Ansätze (ebd.). Dieses Problem der Vereinfachung ist im Englischen dabei deutlich weiter verbreitet als im Deutschen. Auch wenn es sinnvoll sein kann, prototypische intonatorische Realisierungen spezifischer Satzmodi zu erfassen, um die Lernbarkeit für den Sprachunterricht zu erleichtern, birgt die dominante Stellung der These zur Verbindung von finalem Anstieg und bestimmten Fragetypen das Risiko, nicht als Beschreibung von Prototypen erkannt und als obligatorische Regularität des Deutschen interpretiert zu werden. Indizien für das Potenzial einer solchen Fehlinterpretation finden sich in Teilen der Fremdsprachendidaktik (vgl. Hendriks 1999: 54f, Griesbach 2002: 231f), in denen die Verknüpfung von Intonation und Satzmodus als strenger korrelierend beschrieben wird, als dies die sprachliche Realität zulässt. Das bisherige Kapitel hat jedoch gezeigt, dass die prototypische Annahme eines finales Anstiegs sich nicht nur in pädagogischen, sondern auch in rein linguistischen Untersuchungen findet. Eine Ursache kann nach Crystal (1969: 2) und Ladd (2008: 11f) an der intuitionsbasierten Arbeitsweise älterer Ansätze festgemacht werden. Es existieren jedoch auch empirische Untersuchungen, die eine Prototypizität des finalen Anstiegs feststellen können. So stehen zum Bei-
32 | Forschungsstand
spiel von Essen (1964: 44), Oppenrieder (1988) und Féry (1993) datengestützt für den finalen Anstieg als Prototyp in Entscheidungsfragen, während Selting (1995: 232f), Kügler (2003, 2004), Kohler (2004) oder Peters (2006: 102f) empirische Daten gegen diesen unmittelbaren Zusammenhang liefern. Die jüngere Forschung kann zeigen, dass diese Diskrepanz höchstwahrscheinlich in Unterschieden des Sprechstils beziehungsweise der Elizitationsmethode begründet ist. Savino (2012) analysiert in ihrer Betrachtung zur Verwendung von verschiedenen Konturen in Fragen des Italienischen Sprachdaten aus unterschiedlichen Dialektgebieten und stellt dabei fest, dass die Distribution der Konturinventare auf den ersten Blick der angenommenen dialektalen Verteilung im italienischen Sprachraum widerspricht. Bei genauerer Betrachtung des Datenmaterials kann Savino (2012) aufzeigen, dass die Verteilung der Konturen nicht mit der regionalen Verteilung der Erhebungspunkte, sondern mit dem Elizitationsmodus korreliert und zwar dahingehend, dass final fallende Intonation in Entscheidungsfragen nahezu ausschließlich auf spontansprachliches Material beschränkt ist, während final-steigende Intonation in Leseaussprache dominiert. Diese Annahme kann Kügler (2003, 2004) für das Deutsche im direkten Vergleich seiner Ergebnisse aus spontansprachlichen Daten mit den Ergebnissen der lesesprachlichen Daten Férys (1993) bestätigen. Weitet man die Betrachtungen auf die zuvor angeführten widersprechenden Ansätze aus, wird das Bild weiter gefestigt. Von Essens (1964) Daten bestehen mehrheitlich aus gelesenen Rundfunkbeiträgen und das Korpus des Münchener Forschungsprojekts zur Intonation von Modus und Fokus (Altmann 1988, Altmann, Batliner & Oppenrieder 1989) basiert auf einem Leseexperiment. Dagegen stehen Selting (1995), Kohler (2004) und Peters (2006), die ihre Analysen wie erwähnt alle drei auf spontansprachlichen Korpora basieren. Dies erklärt zugleich, warum Altmann, Oppenrieder und Batliner (1988, 1989) in den Perzeptionsexperimenten eine Akzeptanz fallender Fragen finden, jedoch kaum solche Produktionen in den Leseexperimenten. Zusammenfassend konnte bisher gezeigt werden, dass der finale Anstieg im Englischen und Deutschen auch in Entscheidungsfragen höchstwahrscheinlich keine grammatische Funktion erfüllt. Die häufige Annahme eines solchen Zusammenhangs konnte auf erstens die intuitionsbasierte Natur traditioneller Betrachtungen, zweitens die Vereinfachung zugunsten pädagogischer Ansätze, drittens den lesesprachlichen Elizitationsmodus datengeleiteter Untersuchungen und viertens das Postulat der Trennung eines kerngrammatischen Systems von seiner attitudinalen Überformung zurückgeführt werden. Dabei bilden die beiden ausgewählten Sprachen keine Ausnahmen. Bereits Bolinger (1978: 503) bemerkt im Rahmen seiner typologischen Betrachtung zur Frageintonation,
Tonale Struktur von Fragen | 33
dass die reguläre Assoziation von finalem Anstieg und Entscheidungsfragen höchstwahrscheinlich nicht nur für das Englische, sondern für den Großteil, wenn nicht sogar alle von ihm untersuchten Sprachen auf eine Vereinfachung oder Beschreibung von Prototypen zurückzuführen ist. Demnach sollten in allen Sprachen auch Ausnahmen in Form von fallenden Entscheidungsfragen zu finden sein (ebd.). Zu diesem Ergebnis kommt auch Cruttenden (1997: 157), der annimmt, dass alternative Intonationsformen vermutlich in allen Sprachen möglich sind und lediglich nicht immer mitbeschrieben werden. Als erste Antwort auf die Leitfrage der Arbeit kann folglich festgehalten werden, dass eine satzmodusspezifische Konturwahl und damit Frageintonation als intonatorische Markierung von Interrogativität gemäß der Arbeitsdefinition auf tonaler Ebene zumindest für das Deutsche nicht existiert. Die Wahl der Intonationskontur scheint Regularitäten zu folgen, nach denen abhängig vom pragmatischen Kontext und anderen sprachlichen Faktoren jede Kontur des intonatorischen Inventars mit jedem Satztyp auftreten kann (Couper-Kuhlen & Selting 1996, Peters 2006: 102f, 2014: 53f). Dabei ist jedoch anzunehmen, dass in der Bedeutung des finalen Anstiegs Aspekte existieren müssen, die in irgendeiner Form die Verbindung mit Fragen erklären können. Es sollte jedoch deutlich geworden sein, dass, welche Bedeutung auch immer final steigender Intonation zukommt, dies nicht die der Interrogativität sein kann. In den folgenden Kapiteln wird daher betrachtet, welche Ebenen der Bedeutung Intonation ausdrücken kann und welche Bedeutung der Intonation innerhalb von Fragen zugeschrieben wird.
2.1.2 Intonation und Bedeutung Bevor auf die Bedeutung der tonalen Struktur in Fragen eingegangen werden kann, sollen ein paar grundsätzliche Ausgangsbedingungen zur Beschreibung intonatorischer Bedeutung an sich geschaffen werden. Die Erfassung der Bedeutung von Intonation (intonational meaning) stellt, wie in Kapitel 2.1 erwähnt, einen Problembereich dar, der gerade im Vergleich zu Beschreibungen der intonatorischen Form noch als erheblich untererforscht bezeichnet werden kann. Zum Zeitpunkt der vorliegenden Arbeit existiert zu keiner Sprache ein Modell der intonatorischen Bedeutung, dass das gesamte Inventar an Intonationskonturen in allen Aspekten erfasst und zugleich empirisch ausreichend abgesichert ist, um allgemein anerkannten Status zu besitzen. Nichtsdestotrotz hat die entsprechende Literatur eine Vielzahl an möglichen Erklärungsansätzen hervorgebracht. Dabei gehen nicht nur die Auffassungen zur Art der Bedeutung, die
34 | Forschungsstand
Intonation ausdrücken beziehungsweise (bei)tragen kann, stark auseinander, sondern bereits die Meinungen darüber, welche Teile der intonatorischen Form überhaupt Bedeutung tragen können. Im Folgenden soll ein Überblick über die grundsätzlichen Unterschiede in den Auffassungen zur Bedeutung von Intonation, sowie die Dimensionen der bedeutungstragenden Elemente gegeben werden. Eine detailliertere Betrachtung erfolgt in Kapitel 2.1.3 und 2.1.4 am konkreten Beispiel der Intonation von Fragen. Wenn im Folgenden von der pragmatischen Funktion von Intonation die Rede ist, ist damit der Beitrag, den intonatorische Formelemente zur Gesamtbedeutung einer mit ihr assoziierten Äußerung liefern können, gemeint, ganz gleich welcher kommunikativen Bedeutungsebene dieser Beitrag zuzuordnen ist. Die gängigen Beschreibungen zur intonatorischen Bedeutung lassen sich mehr oder weniger zwei Polen zuordnen. Zum einen lassen sich Ansätze benennen, die Intonationskonturen einen mehr oder weniger konkreten konsistenten Bedeutungskern zuweisen, der sich je nachdem mit welchen anderen sprachlichen und kontextuellen Faktoren sie auftreten unterschiedlich ausprägen kann, dessen Essenz jedoch erhalten bleibt. Dagegen stehen Ansätze, die davon ausgehen, dass Intonation seine Bedeutung ausschließlich in Wechselwirkung mit den anderen sprachlichen Ebenen entfaltet und dabei so variabel ist, dass sich kein stabiler Bedeutungskern identifizieren lässt, der einer Intonationskontur in all ihren zahlreichen Ausprägungsformen gemeinsam ist. Cruttenden (1997: 106) unterscheidet gemäß dieser Trennung lokale von globalen Bedeutungen. Globale Bedeutungen stellen die konsistenten Bedeutungsaspekte von Intonationskonturen dar, die in allen möglichen Ausprägungen zugrunde liegen. Lokale Bedeutungen beschreiben die aktuelle Ausprägung der Bedeutung in einer bestimmten Wechselwirkung mit dem Verwendungskontext. Dabei ist es nicht zwangsläufig so, dass Ansätze zur lokalen Bedeutung immer die Möglichkeit einer globalen Bedeutung ausschließen. Ebenfalls auf die Dichotomie dieser beiden intonatorischen Bedeutungsebenen bezogen, findet sich die Trennung von minimum linguistic normalcy und maximum linguistic normalcy nach Gussenhoven (1984). Minimum linguistic normalcy beschreibt, dass die Bedeutung intonatorischer Formmerkmale vollständig in Wechselwirkung mit dem Kontext festgelegt wird. Maximum linguistic normalcy beschreibt im Kontrast dazu die Annahme einer konsistenten, stabilen Eigenbedeutung, die sich je nach Kontext unterschiedlich ausprägen kann, jedoch im Kern erhalten bleibt. Ansätze zu globalen Bedeutungen im Sinne Cruttendens (1997: 106) unterstellen daher prinzipiell eine maximum linguistic normalcy, während Ansätze zur lokalen Bedeutung sowohl der minimum als
Tonale Struktur von Fragen | 35
auch der maximum linguistic normalcy zugeordnet werden können, je nachdem ob diese lokalen Bedeutungen als Ausprägungen eines globalen Merkmals betrachtet werden. Zwischen diesen beiden Polen findet sich eine Reihe von Ansätzen, die von einer stabilen Kernbedeutung von Intonation ausgehen, welche jedoch durch kontextuelle Faktoren überformt werden kann. Obwohl die Beschreibungen der lokalen Bedeutung von Intonation grundsätzlich überwiegen, sind die Ansätze, die sich explizit in der minimum linguistic normalcy verorten, überschaubar und vertreten diese Position unterschiedlich stark. So vertritt Crystal (1969: 285) zwar die Position, dass Intonationskonturen keine Vielzahl an unterschiedlichen Bedeutungen besitzen, sondern diese sich erst durch den Kontext ausprägen, lehnt jedoch die Möglichkeit zugrundeliegender globaler Bedeutungen nicht explizit ab. Allerdings gibt er zu bedenken, dass diese Bedeutungen zu generell und ambig sein müssten, um das gesamte Auftreten zu erfassen und damit kaum für die Intonationsanalyse und noch weniger für den Fremdsprachenunterricht nützlich wären. Cutler (1977) im Kontrast weist konsistente Konturbedeutungen explizit zurück und gibt an, dass intonatorische Bedeutung erst durch Interaktion im Kontext greifbar wird und je nach Kontext vollständig variieren kann, welche lokale Bedeutung zur Ausformung kommt. Auch Kohler (1977: 199, 1995: 196) bezieht zu diesem Punkt Stellung und gibt an, dass sich einzelnen Intonationsmustern „keine konsistente, von allen Äußerungen losgelöste Bedeutung“ zuordnen lässt. Ebenfalls explizit innerhalb der minimum linguistic normalcy verortet sich Selting (1995). Nach Selting (1995: 16f) stellt Intonation ein von Syntax und Semantik unabhängiges Markierungsmittel (signalling device) zur Organisation konversationeller Interaktion dar. Konkret bezeichnet Selting (ebd.) die Funktion von Intonation als Kontextualisierungshinweis, um eine Äußerung in den unterschiedlichen Aktivitätstypen und damit der konversationellen Interaktion zu verorten (Selting 1995: 16f, 232f). Dabei erfüllt die intonatorische Form gänzlich unterschiedliche Funktionen in der Verortung der Aktivitätstypen, je nachdem mit welcher Klasse von Aktivitäten sie auftritt. Couper-Kuhlen und Selting (1996) formulieren als Konsequenz dieser minimalen Bedeutung von Intonation, dass der gleichen Kontur auf anderem Material eine völlig andere Bedeutung zukommen kann. Prinzipiell lassen sich alle Ansätze, die nach einer konsistenten globalen Bedeutung von Intonation suchen, der Strömung der maximum linguistic normalcy zuordnen. In gewisser Weise stellt bereits die Grundidee der autosegmental-metrischen Theorie durch die Beschreibung tonaler Einheiten als bedeutungstragende Elemente der Intonation ein Plädoyer dafür dar, dass die Bedeutungen die diese Einheiten tragen, für diese Einheiten auch konsistent sind. Dies findet sich bei Pierrehumbert (1980) und in der expliziten Anwen-
36 | Forschungsstand
dung bei Pierrehumbert und Hirschberg (1990) wieder. Auch Gussenhoven (1984) von dem die Terminologie stammt, verortet sich innerhalb der maximum linguistic normalcy, wie in Kapitel 2.1.4 näher erläutert wird. In diesem Sinne ist auch Ladds (2008: 41f) Linguist’s Theory of Intonational Meaning zu verstehen, die besagt, dass die Elemente der Intonation eine sehr generelle Bedeutung tragen, die jedoch als Teil eines reichen pragmatisch-interpretativen Systems eine Vielzahl von Ausprägungen hervorbringen können. Féry (1993: 106) beschreibt für ihre Darstellung des Deutschen tonale Einheiten ebenfalls als intonatorische Morpheme mit einer konsistenten Bedeutung. Auch außerhalb der autosegmental-metrischen Theorie finden sich Annahmen einer maximum linguistic normalcy unter anderem bei Brazil (1975) und Fries (1964: 243). Letzterer gibt an, dass Konturen eine starke konsistente Bedeutung besitzen, auch wenn diese schwer zu isolieren und definieren ist. Cruttenden (1997: 7) beschreibt vor dem Hintergrund der Britischen Schule, dass Intonationskonturen eine relativ konsistente Bedeutung in Form von globalen Funktionen besitzen, die ein Netz aus metaphorischen Verbindungen zwischen allen lokalen Ausprägungen spinnen würden (Cruttenden 1997: 163). Ansätze zur lokalen Bedeutung von Intonationskonturen sind so zahlreich wie die Beschreibungen einzelsprachlicher Intonationssysteme an sich. In nahezu jeder Beschreibung des Intonationssystems einer Sprache finden sich Angaben zur Bedeutung der Konturen in bestimmten konkreten Kontexten, wobei diese Angaben selten erschöpfend sind und auch selten diesen Anspruch haben. Im letzten Kapitel konnte gezeigt werden, dass die Ebenen, für die lokale intonatorische Bedeutungen angegeben werden, wesentlich zwischen drei Dimensionen variieren: grammatische, attitudinale beziehungsweise emotionale und Diskursfunktionen. Ansätze, welche die lokale Bedeutung von Intonationskonturen auf der grammatischen Ebene verorten, wurden im letzten Kapitel vorgestellt, wobei gezeigt wurde, dass diese entweder exklusiv, als attitudinal überformbare Kernbedeutungen oder parallel neben attitudinalen Funktionen vorkommen können. Beispielhafte Vertreter sind zum Deutschen unter anderem Isačenko und Schädlich (1966: 19), Bierwisch (1966: 164f), Stock (1970) oder Pheby (1975: 146ff). Demgegenüber stehen Ansätze, die die primäre Funktion von Intonation im Ausdruck von emotionalen, psychischen oder physischen Zuständen, im Rahmen dieser Arbeit wie erwähnt als attitudinale Funktionen bezeichnet, beschreiben. In seinen Betrachtungen zur Intonation des amerikanischen Englisch postuliert Pike (1945: 22f), dass der/die Hörer/in in einer Konversation häufig viel mehr an der Einstellung und der emotionalen Haltung des/der Sprechers/in
Tonale Struktur von Fragen | 37
interessiert sei als am Informationscharakter seiner Botschaft. Dieser Ausdruckscharakter von Sprache findet sich bereits in frühen linguistischen Beschreibungen neben der Informationsvermittlung als Kernelement von Kommunikation (Bühler 1934, Watzlawik, Beavin & Jackson 1969, Schulz von Thun 1981). O’Connor und Arnold (1961: 2) sehen die Funktion von Intonation darin, die Einstellung des/der Sprechers/in in Bezug auf die Situation, in der die damit assoziierte Äußerung getätigt wurde, zu signalisieren. Auch Lieberman und Michaels (1962) bezeichnen Formen der Intonation als emotional modes. Bolinger (1978: 515) sieht Intonation ebenfalls als Ausdrucksmittel von Sprechereinstellungen und gibt an, dass „even when it interacts with such highly conventionalized areas as morphology and syntax, intonation manages to do what it does by continuing to be what it is, primarily a symptom of how we feel about what we say, or how we feel when we say [it]” (Bolinger 1989: 1). Geluykens (1989) zieht als Fazit seiner Untersuchung ebenfalls, dass die Funktion der Intonation wahrscheinlicher auf einer attitudinalen als einer grammatischen Ebene zu verorten ist. Zuletzt schreibt auch Cruttenden (1997: 8) einen wesentlichen Teil der intonatorischen Bedeutung der Markierung von Sprechereinstellungen zu. Die Ausdrucksfunktion wird gerade in der traditionellen Literatur maßgeblich der Intonation zugeschrieben und wird in Kapitel 2.1.3 am Beispiel der Frage näher betrachtet. Dabei ist die formale Trennung der parasprachlichen von der sprachlichen Ebene in der Intonation eine vergleichsweise neuere Entwicklung, sodass sich in der traditionellen Literatur vorwiegend Assoziationen von Sprechereinstellungen mit spezifischen Intonationskonturen finden lassen. Die Mehrheit der Beschreibungen zur Intonation lässt sich jedoch zwischen der rein grammatischen oder emotionalen Markierung verorten. Crystal (1969: 254) gibt an, dass Intonation einige wenige reguläre Verbindungen zur syntaktischen Struktur aufweist, dabei jedoch immer auch attitudinale Aspekte markiert. Zum Deutschen findet sich schon bei von Essen (1964: 60) die Anmerkung, dass die grammatische Funktion zwar einen Kernaspekt darstellt, dieser jedoch wesentlich von emotionalen Faktoren überformt werden kann. In der Dudengrammatik bei Winkler (1959: 600) heißt es „in der lebendigen Rede verbinden sich unauflöslich die Wirkung verschiedener Gestaltungskräfte, die die grammatischen Grundformen immer wieder überspielen“. Es findet sich also die Annahme einer grammatischen Grundform der Intonation, jedoch mit der wesentlichen Einschränkung, dass der Tonfall in erster Linie Ausdrucksfunktion besitzt und die Gefühlslage des/der Sprechers/in kundgibt (Winkler 1959: 639). Wodarz (1960: 80) vereint beide Funktionen in einem gemeinsamen Modell. Demnach wird einer Äußerung zuerst eine grammatische Intonationsform zugewiesen und
38 | Forschungsstand
anschließend innerhalb der grammatischen Kategorie zwischen einer neutralen und einer markierten emotionalen Ausprägung selektiert. Des Weiteren lässt sich, wie zuvor erwähnt, für alle Ansätze mit Fokus auf der grammatischen Funktion von Intonation (u. a. Isačenko & Schädlich 1966: 19, Bierwisch 1966: 164f, Stock 1970, Pheby 1975: 146ff) auch die Möglichkeit der attitudinalen Überformung finden (vgl. Isačenko & Schädlich 1966: 19, Bierwisch 1966: 102, Stock 1970, Pheby 1975: 37). Während sich die Beschreibungen grammatischer Funktionen tendenziell in der traditionellen älteren Literatur finden und sich die Erfassung von Sprechereinstellungen von früheren Beschreibungen bis in aktuelle Betrachtungen fortgesetzt hat, stellt die dritte mögliche Funktion, die Verortung einer Äußerung im laufenden Diskurs, eine vergleichsweise jüngere Entwicklung dar, die gerade in aktuellen Ansätzen dominiert. Dabei lässt sich feststellen, dass die Beschreibung von intonatorischen Bedeutungen auf Diskursebene häufig mit einem höheren Geltungsbereich einhergeht, sodass sich viele Ansätze eher den globalen Bedeutungen und der maximum linguistic normalcy zuordnen lassen. Hierzu zählen Funktionen, die den Status einer Äußerung im laufenden Diskurs in Relation zu anderen Äußerungen oder dem Gesprächskontext signalisieren. Zu den Diskursfunktionen werden im Rahmen dieser Arbeit jedoch auch informationsstrukturelle Aspekte wie die Signalisierung von Fokus gezählt, um den Begriff der grammatischen Funktionen auf die Markierung der Satzmodi zu beschränken. Als Vertreter der globalen Diskursfunktionen lassen sich unter anderem die Ansätze von Brazil (1975: 70), Gussenhoven (1984, 2004) oder Steedman (2000, 2007, 2014) nennen, die neben weiteren Vertretern im Rahmen ihrer Funktion für die Beschreibung von Frageintonation in Kapitel 2.1.4 vorgestellt und genauer betrachtet werden. Als nächstes stellt sich die Frage, welche Elemente des Melodieverlaufs Bedeutung tragen können. Wie bereits gezeigt wurde, wird im Gesamtverlauf der Sprechmelodie dem nuklearen Abschnitt, also dem letzten Tonhöhenakzent und dem darauffolgenden Verlauf bis zum Phrasenende, besondere Relevanz für die Gesamtbedeutung der Äußerung zugesprochen (vgl. Ladd 2008: 133, 257ff, Peters 2014: 68f). In der jüngeren Literatur wird dieses Vorgehen stellenweise kritisiert und dafür plädiert, auch die möglichen Funktionen pränuklearer Elemente verstärkt in den Fokus der Betrachtungen von Phrasenbedeutungen zu rücken (vgl. Baltazani 2006, Dainora 2006, Vion & Colas 2006, Face 2007, Petrone & d’Imperio 2011, Petrone & Niebuhr 2014, Baltazani, Kainada, Lengeris & Nicolaidis 2015). Generell konnte im Rahmen der traditionellen Intonationsanalysen festgestellt werden, dass zwar alle Tonhöhenbewegungen Bedeutung
Tonale Struktur von Fragen | 39
vermitteln können, die phrasenfinale Bewegung der nuklearen Kontur jedoch eine besondere Stellung einnimmt und den entscheidenden Beitrag zur Gesamtbedeutung der Äußerung liefert. Pränukleare Akzente werden hingegen in ihrer pragmatischen Funktion auf die akzentuierte informatorische Einheit beschränkt angenommen (vgl. Pierrehumbert & Hirschberg 1990, Ladd 2008: 133, 257, Peters 2014: 68f). Die Forschungsposition, die auch pränuklearen Akzenten einen Status in der Gesamtbedeutung der Phrase zuordnet, ist noch vergleichsweise jung und liefert bisher ein uneinheitliches Bild aus phonetischen und phonologischen Effekten. Für die Darstellung der Grundlagen intonatorischer Bedeutung soll daher auch an dieser Stelle vorerst der Fokus auf den Beitrag der nuklearen Kontur gelegt werden. Dies ist nicht zuletzt dadurch begründet, dass sich diese grundlegenden Aspekte gegebenenfalls auf die pränukleare Kontur übertragen lassen. Im letzten Teil von Kapitel 2.1.4 und in Kapitel 2.2.2 sowie in der empirischen Untersuchung soll jedoch im Rahmen der Frageintonation auch die Rolle der pränuklearen Region in die Untersuchung einbezogen werden. Zur Frage, welche Elemente oder Bestandteile der nuklearen Intonationskontur Bedeutung tragen können, muss zwischen den zuvor eingeführten tuneund tone-Ansätzen sowie zwischen holistischen und kompositionellen Ansätzen unterschieden werden. Die Erfassung der bedeutungstragenden Elemente korreliert dabei zumindest einseitig mit dem Modell zur Erfassung der phonologischen Form. So ist in älteren Betrachtungen der Britischen Schule, in denen tunes als Formelemente der nuklearen Kontur beschrieben werden, nicht zu erwarten, dass tonale Einheiten als Bedeutungsträger fungieren. Im Gegenzug ist es jedoch nicht ausgeschlossen, dass in Ansätzen der autosegmentalmetrischen Theorie die Bedeutung dennoch der Gesamtkontur zugeschrieben wird. Nach der Tradition von tune-Ansätzen wie denen der Britischen Schule werden Intonationskonturen wie einleitend in Kapitel 2.1 beschrieben über die Gesamtbewegung des nuklearen Tonhöhenverlaufs erfasst (vgl. Palmer 1922, Kingdon 1958, O’Connor und Arnold 1961, 1973, Halliday 1967, Crystal 1969, Cruttenden 1997 und Kapitel 2.1). In diesem Sinne wird auch die Bedeutung von Intonation der gesamten Kontur zugeschrieben. Diese Ansätze lassen sich daher als holistische Ansätze zur intonatorischen Bedeutung bezeichnen (Ladd 2008: 147ff, Peters 2014: 55f). Die Unterschiede in der Inventargröße nuklearer Konturen stehen dabei in direktem Zusammenhang mit der Annahme über die Zahl der generellen Bedeutungsunterschiede, die über die Intonation ausgedrückt werden können. Für das Englische reichen diese im Rahmen der Britischen Schule, wie zuvor erwähnt, von drei (Gleason 1961: 46), über vier (Palmer 1922:
40 | Forschungsstand
12ff), fünf (Kingdon 1958, Halliday 1967: 11) bis sechs distinktiven Konturen (O’Connor und Arnold 1961: 7). In der traditionellen Beschreibung der Intonation des Deutschen nach von Essen (1964: 46), die ebenfalls einen tune-Ansatz darstellt, werden drei tunes und damit die drei Aspekte der grammatischen Bedeutung von Intonation Aussage, Fortsetzung und Frage unterschieden. Diese Dreiteilung hält sich in vielen späteren Beschreibungen der deutschen Intonation (vgl. Winkler 1959, Bierwisch 1966, Siebs 1969, Brinkmann 1962). Die Annahme von nur zwei Stufen nach Isačenko und Schädlich (1966) reduziert damit auch die Zahl der möglichen Bedeutungsaspekte von Intonation auf zwei, wobei sich die Anzahl durch die Kombination mit Aspekten der Alignierung zwischen präiktisch und postiktisch (s. Kapitel 2.2.3 für Details) verdoppelt. Ein reicheres Inventar an grundsätzlichen intonatorischen Differenzierungen liefern die Adaptionen der fünf oder sechs Konturen der Britischen Schule unter anderem bei Pheby (1975: 53) oder Kohler (1977: 196) sowie die vier Kernkonturen mit ihren elf möglichen Varianten nach Fox (1984: 20). Die Bedeutung, die den Konturen als Ganzes zugeordnet werden kann, deckt das gesamte Spektrum der in der ersten Hälfte dieses Kapitels dargestellten Funktionen ab. In der Regel werden die Funktionen dabei den drei bis sechs nuklearen Konturtypen zugeordnet (vgl. u. a. von Essen 1964, Halliday 1969, Brazil 1975, Pheby 1975). Die Beschreibungen der klassischen Britischen Schule stellen folglich holistische tune-Ansätze dar. Im Kontrast dazu stehen die kompositionellen tone-Ansätze. Die im Rahmen der autosegmental-metrischen Theorie angenommene formale Zergliederung von Intonationskonturen in tonale Einheiten (s. Kapitel 2.1) bringt die Möglichkeit mit sich, auch die bedeutungstragenden Elemente auf der tonalen Ebene anzunehmen (s. u. a. Linguist’s Theory of Intonational Meaning; Ladd 2008: 41). Demnach lässt sich die Gesamtbedeutung einer Intonationskontur als eine Komposition aus den abstrakten Teilbedeutungen der beteiligten tonalen Elemente beschreiben (vgl. Pierrehumbert & Hirschberg 1990, Peters 2014: 52ff, Steedman 2014). Ein kompositionell tonaler Ansatz muss daher die wesentliche Grundannahme erfüllen, dass die gleichen Elemente in unterschiedlichen Konturen die gleiche Bedeutung beitragen. So sollte zum Beispiel dem hohen Akzentton in einer final fallenden H*L L% (GToBI: H* L-L%) Kontur der gleiche Bedeutungsaspekt zugeschrieben werden wie in einer fallend-steigenden H*L H% (GToBI: H* L-H%) Kontur und dem hohen finalen Grenzton in letzterer die gleiche Bedeutung wie in einer zweifach-steigenden L*H H% (GToBI: L* H^H%) Kontur. Ein solcher Ansatz findet sich unter anderem bei Pierrehumbert und Hirschberg (1990), die den einzelnen tonalen Elementen abstrakte semantische Merkmale zuweisen, die Informationen über die Verortung von akzentuier-
Tonale Struktur von Fragen | 41
ten Einheiten und Phrasen im geteilten Wissen der Sprecher/innen liefert. Das dieser Arbeit zugrundeliegende autosegmental-metrische Beschreibungsmodell von Peters (2014: 53f) folgt ebenfalls diesem Ansatz und modelliert eine Intonationssemantik der tonalen Einheiten für das Kernsystem des Deutschen. Das Modell wird in Kapitel 4.2.1 im Zuge des experimentellen Designs detaillierter beschrieben. Neben beziehungsweise zwischen holistischen tune-Ansätzen und kompositionellen tone-Ansätzen finden sich sowohl kompositionelle tune-Ansätze als auch holistische tone-Ansätze. Als kompositionelle oder zumindest teilkompositionelle tune-Ansätze lassen sich die Arbeiten von Liberman und Sag (1974), Sag und Liberman (1975) sowie Liberman (1975) und bis zu einem gewissen Grad auch bereits die Arbeit von O’Connor und Arnold (1961, 1973) bezeichnen. In diesen Arbeiten werden sowohl den nuklearen Konturen als auch Aspekten der pränuklearen Kontur (heads und pre-heads) Bedeutungen zugewiesen, die mit den Aspekten der nuklearen Konturen zu neuen Gesamtbedeutungen kombiniert werden. Dies ist bei O’Connor und Arnold (1961, 1973) noch eingeschränkt der Fall, da pränukleare und nukleare Teile zwar zu neuen Bedeutungen kombiniert werden, die konsistenten Bedeutungsaspekte der einzelnen Bestandteile jedoch nicht durchweg klar herausgearbeitet werden. Ein holistischer tone-Ansatz findet sich zum Beispiel bei Ward und Hirschberg (1985, 1988). In diesen Arbeiten erfolgt die formale Beschreibung zwar im Sinne der autosegmental-metrischen Theorie über tonale Einheiten, die Bedeutung wird jedoch für bestimmte Konturen holistisch mit der Kontur als Ganzes assoziiert, wie im Falle der sogenannten Incredulity-Kontur. Ebenfalls zwischen den beiden Ansätzen bewegen sich die Arbeiten von Wunderlich (1988), Uhmann (1991), Féry (1993) und Grabe (1998), in denen vereinzelte abstrakte Bedeutungen, maßgeblich bezüglich der Fokus-Hintergrund-Gliederung, den Tönen zugewiesen werden, die Beschreibung der Bedeutung von Konturen jedoch holistisch angegeben wird. Kapitel 2.1.2 konnte zeigen, welche Bedeutungen von Intonation angenommen werden und welche Elemente der Sprechmelodie diese Bedeutungen tragen können. Dabei zeigte sich, dass sich die Bedeutung von Intonation sowohl mit einem minimalen Bedeutungskern und hoher Kontextabhängigkeit als auch mit einem konsistenten Bedeutungskern und folglich geringerer Kontextabhängigkeit annehmen lässt. Es finden sich Beschreibungen sowohl zu lokalen Funktionen von Intonation in spezifischen Einzeläußerungen als auch zu Abstraktionen von jeglicher konkreten Verwendung. Die drei Ebenen intonatorischer Bedeutung richten sich auf die grammatische Struktur, die Sprechereinstellung
42 | Forschungsstand
und den Stand des Diskurses. Auf Formebene der bedeutungstragenden Einheiten lassen sich tune-Ansätze von tone-Ansätzen und ganzheitliche holistische Ansätze von zusammensetzenden kompositionellen Ansätzen unterscheiden.
2.1.3 Lokale Bedeutungen von Intonation in Fragen Bisher konnte gezeigt werden, dass die Wahl der Intonationskontur weitestgehend unabhängig von syntaktischen Kategorien operiert, wenngleich eine gewisse Regelmäßigkeit in der Verbindung von final steigenden Konturen mit ‚neutralen‘ Entscheidungs- und Deklarativfragen in typologischen wie einzelsprachlichen Beschreibungen gerade in der traditionellen Literatur festzustellen ist. Des Weiteren wurde aufgezeigt, dass der Intonation neben der Markierung grammatischer Funktionen eine Reihe von Signalisierungsfunktionen in Bezug auf Sprechereinstellungen und Diskursfaktoren zugesprochen wird. Im folgenden Kapitel sollen Ansätze zur möglichen lokalen Bedeutung der tonalen Struktur innerhalb von Fragen betrachtet werden. Dabei liegt der Fokus auf der finalen Tonhöhenbewegung und der Untersuchung, welche pragmatischen Funktionen für finale Anstiege in Abgrenzung zum finalen Fall angenommen werden. Vorerst ist jedoch zu klären, was genau unter dem bisher noch nicht kritisch diskutierten Begriff des ‚finalen Anstiegs‘ überhaupt zu verstehen ist. Im Rahmen der bisherigen Darstellung sollte deutlich geworden sein, dass finale Anstiege, die in Kapitel 2.1.1 vorerst ohne weitere Erläuterung als einheitliches Phänomen behandelt wurden, je nach phonologischer Theorie sehr unterschiedlich formal beschrieben werden können. Daraus ergeben sich wiederum Unterschiede im Spektrum möglicher Bedeutungen. Generell lässt sich festhalten, dass ‚final steigend‘ keine konkrete, einzelne Kontur im Deutschen darstellt, sondern eine Gruppe von Konturen, die eine phrasenfinal steigende Tonhöhenbewegung gemeinsam haben. Viele Betrachtungen zur Verbindung von final steigender Intonation und Interrogativität differenzieren jedoch nicht zwischen den Typen des finalen Anstiegs (vgl. typologisch Ultan 1969, Bolinger 1978; zum Englischen: Kingdon 1958; zum Deutschen: Winkler 1959, Brinkmann 1962, von Essen 1964, Bierwisch 1966, Siebs 1969). Dies ist vor allem dann problematisch, wenn angenommen wird, dass unterschiedliche steigende Konturen, wie zum Beispiel die fallend-steigende (ToDI: H*L H%, GToBI: H* L-H%) oder die zweifach-steigende Kontur (ToDI: L*H H%; GToBI: L* H-^H%), als Ganzes sehr unterschiedliche Bedeutungen tragen können (vgl. Féry 1993: 81ff, Grice & Baumann 2002, Peters 2014: 56f). Holistische Ansätze, im Besonderen holisti-
Tonale Struktur von Fragen | 43
sche tune-Ansätze, stehen vor dem Problem erklären zu müssen, warum Konturen, die als Ganze unterschiedliche Bedeutungen ausdrücken, einen Aspekt ihrer Bedeutung und zugleich ein Element ihrer Form gemeinsam haben. Dieses Problem ist in den kompositionellen Modellen und vor allem in den kompositionellen tone-Ansätzen abwesend. Wenn sich die Bedeutung einer Kontur über die Einzelbedeutungen der tonalen Einheiten beschreiben lässt, kann ein gemeinsamer Bedeutungskern aller final steigenden Konturen über die gemeinsame Bedeutung der letzten tonalen Einheit, des finalen Grenztons H%, erfasst werden. Diese mögliche Erklärung wird dadurch gestärkt, dass die unterschiedlichen final steigenden Konturen in den meisten Ansätzen zum Englischen und auch zum Deutschen zwar mit unterschiedlichen Bedeutungen assoziiert werden, in der Regel jedoch alle gleichermaßen in Fragen auftreten können (Kohler 1977: 200ff, Pheby 1975: 57ff). Des Weiteren kann unter anderem Geluykens (1987) experimentell feststellen, dass der finale Grenzton die Wahrnehmung von Interrogativität beeinflussen kann, die Wahl des Tonhöhenakzents jedoch nicht. Zudem liefert die mangelnde Differenzierung der finalen Anstiege in der traditionellen Literatur möglicherweise selbst ein Indiz dafür, dass diese Unterscheidung für die Markierung von Interrogativität nicht bedeutsam ist (Ultan 1969, Bolinger 1978). Zuletzt gibt auch Haan (2002: 224) zum Niederländischen an, dass alle nuklearen Akzenttypen gleichermaßen in Fragen und Aussagen auftreten5. Im Rahmen dieser Arbeit erfolgt die Gegenüberstellung der Bedeutungsaspekte steigender und fallender Intonation im Sinne eines kompositionellen tone-Ansatzes (s. Kapitel 2.1.2). Demnach lässt sich die Ausgangsfrage des vorliegenden Kapitels folgendermaßen umformulieren: Welchen Beitrag leistet der hohe finale Grenzton H% gegenüber L% zur Kontur- beziehungsweise Äußerungsbedeutung generell und in Fragen? Wenn im Folgenden nicht explizit anders ausgewiesen, sind daher unter dem Begriff des finalen Anstiegs vereinfachend alle Konturen zusammengefasst, die auf einen hohen finalen Grenzton H% enden. Im Folgenden werden gemäß der Trennung nach Cruttenden (1997: 106) zuerst verschiedene Ansätze zur lokalen Bedeutung des hohen finalen Grenztons skizziert und im Anschluss (Kapitel 2.1.4) durch globale Ansätze ergänzt. Wie bereits in Kapitel 2.1.1 werden aufgrund der Vergleichbarkeit der Intonationssysteme und der geringen Literaturgrundlage zum Deutschen erneut Betrach-
|| 5 In Kapitel 2.2.2 wird gezeigt, dass sich durchaus auch über die Wahl der nuklearen Akzenttöne Präferenzen bezüglich des Satzmodus ausdrücken lassen. Diese sind jedoch über informationsstrukturelle Aspekte begründet und nicht durch die pragmatische Funktion, sodass eine Fokussierung auf der finalen Tonhöhenbewegung vorerst im Mittelpunkt stehen soll.
44 | Forschungsstand
tungen des Englischen mit einbezogen. Dabei ist zu beachten, dass die Bedeutung von Intonation im Englischen gerade in der Semantik und Pragmatik als Schnittstellenbereiche zur Phonologie immense Betrachtung erfahren hat, was eine Vielfalt an Theorien und Modellen hervorgebracht hat. Bereits eine ansatzweise vollständige Übersicht über die pragmatische Literatur würde den Umfang einer eigenen Literaturanalyse ausschöpfen (vgl. Lai 2012), weshalb die folgende Auswahl nur exemplarisch illustrieren soll, welche alternativen Bedeutungen der Intonation von Fragen zugeschrieben werden, wenn sie nicht die Funktion der Markierung von Interrogativität selbst übernehmen kann. Des Weiteren ist darauf hinzuweisen, dass die lokalen Bedeutungen häufig nur in Form des Etiketts wiedergegeben werden können, die von den entsprechenden Autoren gewählt wurden. Konzepte wie zum Beispiel Höflichkeit als lokale Bedeutung zu definieren, würde nicht nur den Rahmen der Arbeit überschreiten, sondern ist in den meisten Fällen nicht zu leisten, da in den Beschreibungen eine Definition der spezifischen Auslegung des entsprechenden Konzepts fehlt. Weiterhin ist, wie in Kapitel 2.1.2 gezeigt wurde, die Trennung der parasprachlichen von der sprachlichen Ebene von Intonation eine neuere Entwicklung, sodass sich in der traditionellen Literatur vorwiegend Assoziationen von Sprechereinstellungen mit phonologischen Intonationskonturen finden lassen (Ladd 2008: 34f). Zuletzt sei darauf hingewiesen, dass bei der Betrachtung von lokalen Bedeutungen in vielen Untersuchungen nicht nur die Bedeutung bestimmter Intonationskonturen nicht nur auf Fragen allgemein beschränkt, sondern weiter differenziert auf bestimmte Fragetypen. Eine wiederkehrende Bedeutung des finalen Anstiegs innerhalb von Fragen ist die des Interesses oder der Involviertheit. Für Entscheidungsfragen im Englischen findet sich dies unter anderem bei Palmer (1922: 78f), wobei dieser gemäß der Britischen Schule neben der nuklearen Kontur die Ausprägung des vorhergehenden head-Abschnitts mit einbezieht, so dass sich Involviertheit auf final steigende Konturen mit rising head beschränkt. Häufiger findet sich diese Bedeutung jedoch in W-Fragen. So beschreiben O’Connor und Arnold (O’Connor & Arnold 1961: 48f, 1973: 64f) W-Fragen mit hohem finalen Anstieg und stepping head als interessiert. Dies findet sich zum Deutschen unter anderem bei Kohler (1995: 197) und Gibbon (1998: 89). In enger Verbindung mit dem Konzept der Involviertheit stehen die Bedeutungen von Höflichkeit und/oder Freundlichkeit. Für Entscheidungsfragen findet Höflichkeit als eine Bedeutung des finalen Anstiegs bei Cruttenden (1997: 106) zum Englischen und in früheren Beschreibungen Kohlers (1977: 205) zum Deutschen. Vergleichbar mit Interesse/Involviertheit wird diese Bedeutung
Tonale Struktur von Fragen | 45
jedoch ebenfalls häufiger mit steigenden W-Fragen assoziiert, wie zum Englischen bei Gleason (1961: 49) oder Crystal (1969: 3) der Fall und zum Deutschen bei von Essen (1964: 58) unter dem Begriff der Höflichkeitsmelodie, der allerdings das Gegenstück der Unhöflichkeit/Unfreundlichkeit als Bedeutung fallender Intonation auch bei Entscheidungsfragen angibt (ebd.: 60), als eine mögliche Bedeutung bei Brinkmann (1962: 502ff), sowie als lokale Ausprägung ebenfalls als Höflichkeitsmelodie bezeichnet bei Fox (1984: 62f). In neueren Untersuchungen findet sich das Merkmal der Höflichkeit unter anderem bei Kohler (2004). Auf Basis des Kieler Korpus zu Lese- und Spontansprache, dessen spontansprachliche Daten maßgeblich aus Telefongesprächen mit dem Ziel der Terminabsprache bestehen, unternimmt Kohler (2004) eine Untersuchung der pragmatischen Funktion der finalen Anstiegsbewegung im Deutschen. Für Entscheidungsfragen nimmt Kohler (2004) den finalen Anstieg als den unmarkierten neutralen Fragefall an. Fallende Intonation stellt hingegen eine besondere Markierung von Routine oder Erwartbarkeit dar, die den Eindruck von Unhöflichkeit erzeugen kann. Für die W-Fragen dreht sich das Markierungsverhältnis um. Während hier die fallende Intonation den neutralen Fragefall darstellt, signalisiert der finale Anstieg einen höheren Grad an Beteiligung beziehungsweise Involviertheit. Dieser höhere Grad an Involviertheit korreliert dabei laut Kohler (2004) unmittelbar mit einem höheren Grad an Höflichkeit oder Freundlichkeit. Die Umkehrung der Markierungsverhältnisse ergibt sich aus Kohlers (1995: 195f) expliziter Annahme der minimum linguistic normalcy, wodurch die syntaktische Struktur beziehungsweise der kommunikative Akt auch die Interpretation der Intonation bestimmt. Gerade in traditionellen Untersuchungen zur Intonation ist eine häufige Feststellung, dass die Bedeutung des finalen Falls selten eine Umkehrung der Bedeutung des finalen Anstiegs darstellt. Während der finale Fall wie in Kapitel 2.1.1 gezeigt in W-Fragen als neutrale Intonation betrachtet wird, ist ein wiederkehrendes Merkmal fallender Entscheidungsfragen der Ausdruck von Erwartung bezüglich der Antwort. In Ermangelung eines treffenderen Terminus wird im Rahmen dieser Arbeit der entsprechende Begriff des bias übernommen (vgl. u. a. Kügler 2003, 2004). Das Konzept der Erwartungshaltung findet sich zum Beispiel zum Englischen bei Palmer (1922: 78) sowie bei Crystal (1969, 273), der fallende Entscheidungsfragen als Suggestivfragen einstuft. Dieser Terminus findet sich zum Deutschen auch bei von Essen (1964: 60). In jüngeren Untersuchungen findet sich das Merkmal der Erwartung unter anderem in den Arbeiten von Kügler (2003, 2004). Kügler (ebd.) analysiert die Funktion des finalen Anstiegs in spontansprachlichen Fragen anhand eines Map Task-Experiments (Anderson et al. 1991) zum Obersächsischen. Von den 38 untersuchten Ent-
46 | Forschungsstand
scheidungsfragen finden sich bei ihm 28 mit einer steigenden und 10 mit einer fallenden Intonation. Kügler (2003, 2004) kommt anhand einer qualitativen Analyse zu der Interpretation, dass die Bedeutung der finalen Tonhöhenbewegung in Zusammenhang mit der Erwartungshaltung steht, die der/die Sprecher/in gegenüber den möglichen Antworten zum Ausdruck zu bringen sucht. Demzufolge signalisiert die prototypische Entscheidungsfrage mit finalem Anstieg eine generelle Offenheit gegenüber den Antwortmöglichkeiten, während eine fallende Entscheidungsfrage im Kontrast dazu eine Form von Geschlossenheit ausdrückt und die Menge der erwarteten Antwortmöglichkeiten einschränkt. Diese Einschränkung kann dabei je nach Kontext dahingehend gedeutet werden, dass der/die Sprecher/in einen bestimmten Typ von Antwort erwartet, oder dass die Antwort auf bereits in der Konversation gegebene Informationen zurückgreift. Auf der anderen Seite kann die Einschränkung der Erwartungen so weit gedeutet werden, dass die Frage zu einer Bitte um Bestätigung (confirmation question) wird und einen starken yes-bias ausdrückt. Diese Interpretation bildet auch einen Teilaspekt bei Selting (1995: 232f), die eine der umfassendsten Betrachtungen spontansprachlicher Fragen im Deutschen liefert. Anders als in den bisherigen Ansätzen geht Selting (1995: 16f) allerdings nicht von einer attitudinalen Funktion von Intonation aus, sondern betrachtet Intonation als ein Markierungssystem zur Kontextualisierung von Äußerungen in der aktuellen Konversation (s. Kapitel 2.1.2). Intonationskonturen dienen dazu, die assoziierte Äußerung bestimmten Aktivitätstypen zuzuordnen oder diese Aktivitätstypen genauer zu bestimmen. Fragen werden in diesem Sinne nicht über semantische, syntaktische oder pragmatische Eigenschaften erfasst, sondern als Aktivitäten im Diskurs, die einen Sachverhalt als offen markieren und dadurch eine Antwortreaktion des Rezipienten konditionell relevant machen (Schegloff 1968, Selting 1995: 232f, Brinker & Sager 2010: 78). Dabei stellen Fragen nicht einen einzelnen Aktivitätstyp dar, sondern mehrere, die, je nachdem welche strukturellen Eigenschaften der Antwort bereits durch den Fragetyp erwartbar gemacht werden, unterscheidbar sind. Innerhalb dieser Oberkategorie kann Intonation dazu beitragen, die verschiedenen Aktivitätstypen zu differenzieren. Die Übergabe des Gesprächs an den Rezipienten ist dabei allen als Frage klassifizierten Aktivitätstypen, sowohl den fallend als auch den steigend intonierten, gemeinsam, da die Kategorie bereits durch andere kontextuelle Faktoren determiniert ist. Die Fragetypen unterscheiden sich in erster Linie darin, ob von Sprecherseite signalisiert wird, dass die Menge der Antworten unbegrenzt geöffnet oder in irgendeiner Form eingeschränkt ist. Des Weiteren kann differenziert werden, ob ein vorerwähntes Thema aufgegriffen wird oder eine Neufokussierung stattfindet. Selting (1995: 232ff) gibt an, dass
Tonale Struktur von Fragen | 47
steigende Intonation dabei vornehmlich Aktivitätstypen kennzeichnet, die der Antwort weniger Einschränkungen auferlegen und dadurch dem Rezipienten einen größeren Spielraum einräumen. Fallende Fragen dagegen sorgen für eine einschränkende Fokussierung und eine größere Erwartungshaltung bezüglich der Antwort. Diese Interpretation ist mit der Position Küglers (2003, 2004) vereinbar. Zugleich findet sich auch eine Übereinstimmung mit Kohler (2004), da die Markierung von Fragen als offen und uneingeschränkt gemäß Selting (1995: 232ff) zugleich den Effekt von Höflichkeit beziehungsweise Freundlichkeit hervorrufen kann. Den Zusammenhang von Offenheit und Höflichkeit einerseits und Geschlossenheit, Erwartungshaltung und Unhöflichkeit andererseits, beschreiben in ähnlicher Weise auch Niebuhr et al. (2010) sowie Petrone und Niebuhr (2014). Parallel hierzu und teilweise als stärkere Form der Erwartung findet sich das Merkmal des Nachdrucks oder Insistierens. Dies findet sich in Entscheidungsfragen des Englischen unter anderem bei Kingdon (1958: 216) und Wells (2006: 91) und unter dem Begriff der sogenannten demand questions mit einem besonderen Nachdruck oder Verlangen bei Halliday (1967: 60). Zum Deutschen nimmt auch von Essen (1964: 45) den Befehl als eine mögliche Funktion fallender Entscheidungsfragen an. Der Begriff der Befehlsfrage findet sich zum Deutschen auch bei Kohler (1995: 197) und der der demand question bei Fox (1984: 62f). Ein vergleichbarer Begriff findet sich in Form der peremptory question als entschiedene oder endgültige Frage bei Gibbon (1998: 89). Siebs (1969: 139) schreibt die Funktion der höheren Verbindlichkeit der fallenden Intonation zuletzt auch in W-Fragen zu. Dabei lässt sich eine Verbindung zwischen Insistieren und der zuvor beschrieben Bedeutung der Erwartungshaltung ziehen. Während Suggestivfragen die möglichen Antworten auf eine Frage einschränken, schränken Befehlsfragen das mögliche Antwortverhalten der/s Rezipienten/in dahingehend ein, dass sie dieser/m zwar offen lassen, was er/sie antwortet, aber nicht ob. In diesem Sinne stellt auch das Merkmal des Insistierens eine Form von Sprecherwartung dar. Gleichzeitig ist das Einschränken der Sprecherreaktion im Sinne der Höflichkeitstheorie ein gesichtsbedrohender Akt (Brown & Levinson 1987: 70), was die häufige Assoziation von Befehlsfragen mit Grobheit (rudeness) oder schlicht Unfreundlichkeit (Kohler 2004) erklären kann. Ein Bedeutungsaspekt, der in den traditionellen Beschreibungen zum Deutschen und Englischen nicht auftaucht, ist das Merkmal der Unterordnung oder Unterwürfigkeit (submissiveness), das dem finalen Anstieg gemäß Merin und Bartels (1997) zukommt. Diese Bedeutung nimmt einen besonderen Status ein, wie in Kapitel 2.2.1 gezeigt werden soll. Demnach ist die Bedeutung des finalen Anstiegs als unterordnend für die Frageinterpretation in Fragen verantwortlich,
48 | Forschungsstand
maßgeblich ist diese Bedeutung jedoch auf das Auftreten in abgeschlossenen Aussagen gerichtet. Laut Merin und Bartels (1997) schränkt der finale Anstieg den behauptenden Charakter von Aussagen ein und drückt eine Form von Zurückhaltung aus, die mit Unterordnung und Unterwürfigkeit zusammenhängt. Folglich würden dominante Sprecher/innen tendenziell häufiger ihre Äußerungen mit einem Fall beenden, während zurückhaltende Sprecher/innen Äußerungen häufiger mit finalem Anstieg markieren. Dagegen sprechen jedoch die Ergebnisse von McLemore (1991) sowie Cheng und Warren (2005), die feststellen konnten, dass auch dominante Sprecher/innen vermehrt Aussagen mit finalem Anstieg produzierten, wenn die Situation es entsprechend erfordert. Neben diesen wiederkehrenden Bedeutungen finden sich in den unterschiedlichen Beschreibungen weniger häufige und zahlreiche Einzelfälle. Nennenswert sind die Bedeutung der Überraschung, die Kingdon (1958: 216) dem finalen Anstieg in englischen W-Fragen, O’Connor & Arnold (1961: 39f, 1973: 55ff) dem hohen finalen Fall in Entscheidungsfragen zuschreiben, der Zurückhaltung oder Reserviertheit, die O’Connor und Arnold (1961: 33f, 1973: 49f) für den tiefen finalen Fall in sowohl W-Fragen als auch Entscheidungsfragen annehmen, sowie die Bedeutung des Patronisierenden, die Kohler (1977: 205, 1995: 197) in speziellen Fällen sowohl für den finalen Anstieg in Entscheidungsfragen als auch in W-Fragen beschreibt. Wie in Kapitel 2.1.1 beschrieben besteht des Weiteren vergleichsweise starker Konsens darüber, dass der finale Anstieg in W-Fragen die Sonderform der Echo-Frage signalisieren kann, wobei dies in der Regel mit einer Verlagerung der Akzentsilbe auf das W-Wort verbunden ist. In Sätzen mit deklarativer Struktur findet sich für den finalen Anstieg häufig die grammatische Funktion des Signalisierung einer Deklarativfrage (s. Kapitel 2.1.1). Es finden sich jedoch auch Bedeutungen, die der Bedeutung in Fragen sehr nahe kommen. Die häufigste Bedeutung stellt dabei die der Unsicherheit dar, die für final steigende Aussagen, die nicht als Fragen fungieren, unter anderem von Palmer (1922: 78f) und Cruttenden (1997: 106) für das Englische und von Féry (1993: 85) und Gibbon (1998: 89) für das Deutsche beschrieben werden. In jüngeren Untersuchungen wird das Merkmal der Unsicherheit unter anderem in den Arbeiten von Nilsenova (2006) und Reese (2007) wieder aufgegriffen. Unsicherheit meint dabei kognitive Unsicherheit im Sinne des englischen uncertainty und nicht emotionale Unsicherheit im Sinne des englischen insecurity. Über Aussagen hinaus schreiben sie dieses Merkmal jedoch auch Entscheidungsfragen zu, in denen der finale Anstieg die Akzeptanz unsicherer Antworten signalisiere, während der finale Fall durch Reduktion der Unsicherheit eine Art bias-Funktion erfüllt.
Tonale Struktur von Fragen | 49
Neben dem Merkmal der Unsicherheit findet sich für Aussagen weiterhin bei Brinkmann (1962: 502f) die Bedeutung der Überraschung auch für den finalen Anstieg in Aussagen, wodurch Deklarativfragen als Aussagen mit einem hohen Grad an erstauntem Vergewissern beschrieben werden und zuletzt beschreiben O’Connor & Arnold (1961: 39f, 1973: 55f) für das Englische auch in Aussagen das zuvor beschriebene Merkmal der Involviertheit, allerdings für den hohen finalen Fall und nicht den finalen Anstieg. Die bisherige Darstellung konnte zeigen, dass Intonation eine ganze Reihe unterschiedlicher Nuancen von attitudinalen Bedeutungen ausdrücken kann. Eine Begründung, weshalb Angaben über die gleiche Verbindung aus Kontur und Äußerungstyp je nach Betrachtung so stark variieren und teilweise zu widersprüchlichen Ergebnissen führen können, liefert die intuitionsbasierte Natur der traditionellen Betrachtungen (vgl. Crystal, Kapitel 2.1.1). Da eine Äußerung nicht kontextlos existieren kann (vgl. Finkbeiner, Meibauer & Schumacher 2012), wird der lokale Aspekt der Bedeutung nicht nur auf die Assoziation von Intonation und Äußerungstyp beschränkt, sondern auch auf die Verwendungen in bestimmten außersprachlichen Kontexten. Diese Kontexte werden mitunter in den älteren Beschreibungen sogar explizit in die Beschreibung einbezogen. Ob der finale Anstieg zum Beispiel demnach in Aussagen Höflichkeit (vgl. Brinkmann 1962: 502f), Patronisieren (Kohler 1977: 205) oder Drohen (vgl. von Essen 1964: 65) signalisiert, ist folglich nicht über die Bedeutung der Intonation zu erklären (vgl. Fox 1984: 59f). Tabelle 1 fasst die häufigsten lokalen Bedeutungsaspekte der finalen Tonhöhenbewegung zusammen.
50 | Forschungsstand
Tab. 1: Übersicht über die lokalen Bedeutungen der finalen Tonhöhenbewegung in der Literatur und die jeweiligen Vertreter/innen dieser Bedeutungen. * = Nach zuvor dargestellter Interpretation des Autors.
Bedeutungsmerkmal
Englisch
Deutsch
Involviertheit / Interesse
Palmer (1922), O’Connor und Kohler (1977, 2004), GibArnold (1961, 1973), Cruttenden bon (1998) (1997)
Erwartung (u. a. Suggestivfragen, yes-bias)
Palmer (1922), Crystal (1969)
Unsicherheit
Palmer (1922), Cruttenden Féry (1993), Gibbon (1998) (1997), Nilsenova (2006), Reese (2007)
Insistieren (u. a. Befehlsfrage)
Kingdon (1958), Halliday (1967), Wells (2006)
von Essen (1964), Siebs (1969), Kohler (1977), Fox (1984), Gibbon (1998)
Höflichkeit / Freundlichkeit
Kingdon (1958), Gleason (1961), Crystal (1969), Cruttenden (1997)
von Essen (1964), Brinkmann (1962), Kohler (1977, 2004), Fox (1984)
Überraschung
Kingdon (1958), O’Connor und Arnold (1961, 1973)
Brinkmann (1962)
Zurückhaltung
O’Connor und Arnold (1961, 1973)
Unterordnung
Merin und Bartels (1997)
Selting (1995)*, Kügler (2003, 2004), Kohler (2004)
2.1.4 Globale Bedeutungen von Intonation in Fragen In Kapitel 2.1.3 wurde gezeigt, dass Äußerungen mit der gleichen tonalen Struktur in unterschiedlichen Äußerungstypen und sogar innerhalb des gleichen Äußerungstyps sehr unterschiedliche Interpretationen in Bezug auf die zugrundeliegende Sprechereinstellung oder ihre kommunikative Funktion aufweisen. Dabei ist gerade durch die Differenzierung von unterschiedlichen Sprechereinstellungen der gleichen Kontur und des gleichen Äußerungstyps nicht immer klar, welchen Beitrag tatsächlich die intonatorische Form zur Gesamtbedeutung leistet und welche Bedeutungsaspekte durch den Kontext bestimmt werden. Dieser Vermerk findet sich bereits bei Grice und Baumann (2002), die sich bei der beispielhaften Beschreibung der Bedeutung von Intonationskonturen bewusst an deren expliziter kontextueller Verwendung orientieren. Sie geben an, dass auch wenn der Intonation selbst globalere Bedeutungen zugewiesen wer-
Tonale Struktur von Fragen | 51
den können, diese in Wechselwirkung mit dem Kontext sowohl grammatische als auch attitudinale Funktionen entfalten können, wie im vorigen Kapitel gezeigt wurde. Betrachtet man zum Deutschen die zuvor dargestellten Ansätze von Selting (1995), Kügler (2003, 2004) und Kohler (2004), kann festgestellt werden, dass die Unterscheidung von lokalen und globalen Bedeutungen ein Spektrum an Abstufungen ohne klare Grenzen eröffnet. Die Signalisierung der biasDimension nach Kügler (2003, 2004) beschränkt sich auf Entscheidungsfragen und dort möglicherweise nicht auf deren Gesamtheit. Die Signalisierung der Höflichkeits-Dimension nach Kohler (2004) erstreckt sich über Entscheidungsfragen und W-Fragen und unter Hinzuziehung weiterer Beschreibungen wie der von Essens (1964: 58) bis zu einem gewissen Grad auf Aussagen, allerdings auch hier nur bedingt, da keiner dieser Äußerungstypen mit einer final steigenden Intonation Höflichkeit bedeuten muss. Die Signalisierung der OffenheitsDimension nach Selting beschränkt sich auf Fragen, deckt aber hier das gesamte Spektrum dieses Aktivitätstyps ab und leistet sogar, wie zuvor geschildert, die Erklärung sowohl der bias- als auch der Höflichkeitsinterpretation. Es ist also möglich, die Ansätze von Kügler (2003, 2004) und Kohler (2004) als lokaler als den von Selting (1995) zu betrachten beziehungsweise im Gegenzug bei Selting (1995) von einer größeren Konsistenz in der gemeinsamen Bedeutung des Auftretens der finalen Tonhöhenbewegung zu sprechen. Daraus ergibt sich die Frage, ob es möglich ist, noch globalere Bedeutungen anzunehmen, die alle lokalen Aspekte unabhängig von Kontext und syntaktischer Struktur erfassen können. Im Folgenden werden erneut exemplarisch Ansätze vorgestellt, die sich als Beschreibungen globalerer Bedeutungen finaler Intonation charakterisieren lassen, und in Bezug auf die Erklärbarkeit der lokaleren Bedeutungen aus Kapitel 2.1.3 hin betrachtet. Als Konsequenz der bisherigen Darstellung sollte ein globales Merkmal vor allem die beiden folgenden Feststellungen berücksichtigen: 1) Auch wenn es keine obligatorische Assoziation eines hohen finalen Grenztons mit Interrogativität gibt, lässt sich feststellen, dass in einem Großteil der vorherrschenden Beschreibungen angenommen wird, dass Fragen häufig, wenn nicht sogar prototypisch, mit einem finalen Anstieg realisiert werden. Daraus ergibt sich die Frage, ob dem hohen finalen Grenzton ein konsistentes semantisches Merkmal zugewiesen werden kann, das zwar nicht Interrogativität selbst darstellt, aber die häufige Kookkurrenz mit dieser erklären kann. 2) Zugleich stellt sich die Frage, ob es möglich ist, dieses Merkmal derartig zu fassen, dass es zugleich erklären kann, warum sich der finale Anstieg einer-
52 | Forschungsstand
seits auf bestimmte Fragetypen beschränkt und sich andererseits auch in der Assoziation mit unvollständigen Aussagen findet (s. Kapitel 2.1.1), oder ob letzteres Auftreten einem anderen Ursprung des finalen Anstiegs zugeordnet werden muss. Jeder Ansatz zur Bedeutung der tonalen Struktur von Fragen liefert zwangsläufig eine Antwort zu beiden Aspekten. Eine frühe Beschreibung globaler Merkmale von Intonation liefert Brazil (1975: 107ff), der fallenden Konturen das Merkmal behauptend (proclaiming) und steigenden Konturen (fallend-steigend und zweifach-steigend) das Merkmal verweisend (referring) zuweist. Diese Funktionen dienen der Unterscheidung von neuen und gegebenen Informationen mit Bezug auf den Wissensstand der Interaktanten und drücken die Verortung einer Äußerung im Verhältnis zwischen Sprecher/in und Hörer/in im Diskurs aus. Durch Äußerungen, die mit einem finalen Fall und folglich dem Merkmal proclaiming assoziiert werden, versucht der/die Sprecher/in demnach, den Inhalt der Äußerung zum geteilten Wissen der beiden Interaktanten hinzuzufügen. Äußerungen mit fallend-steigender Kontur sollen signalisieren, dass der/die Sprecher/in auf eine Information verweist, die sich bereits im geteilten Wissen der Interaktanten findet. Zweifach-steigende Konturen schließlich stellen Verstärkungen dieses verweisenden Effekts dar (intensified referring; Brazil 1975: 107ff) Gussenhoven (1984: 201ff, 2004: 296ff) bezieht sich direkt auf Brazil (1975), greift dessen semantischen features auf und entwickelt diese weiter. Gussenhovens (1984) System operiert mit drei intonatorischen Morphemen, die drei Klassen von Konturtypen abstrakte semantische Merkmale zuweisen. Dem finalen Fall kommt die Bedeutung der ADDITION zu, der fallend-steigenden Kontur die Bedeutung der SELECTION und den beiden steigenden Konturen L* H H% und H* H% (GToBI: L* H-^H% / (L+)H* H-^H%) die Bedeutung (RELEVANCE-)TESTING. In der konkreten Realisierung drücken diese semantischen Eigenschaften aus, wie der/die Rezipient/in die präsentierte Information verarbeiten soll. Über das Merkmal der ADDITION signalisiert der/die Sprecher/in, parallel zu Brazils (1975) proclaiming, dass der/die Rezipient/in die gegebene Information dem geteilten Hintergrundwissen hinzufügen soll. Das Merkmal SELECTION signalisiert, vergleichbar mit Brazils (1975) referring, dass der/die Rezipient/in eine bereits im geteilten Hintergrundwissen vorhandene Information auswählen beziehungsweise abrufen soll. Für den finalen Anstieg weicht Gussenhoven (1984, 2004: 297f) von Brazils (1975) Modell stärker ab und gibt für das Merkmal des TESTINGS an, dass der/die Sprecher/in es dem/der Rezipienten/in überlässt, die Information zu ratifizieren (Gussenhoven 1984, 2004: 297f).
Tonale Struktur von Fragen | 53
Ein umfassendes Beschreibungsmodell zur Verknüpfung von intonatorischen Formen und der satzsemantischen Eigenschaft der Assertivität im Englischen geht auf Bartels (1999) zurück. Allerdings wird in diesem ursprünglichen Ansatz das Merkmal der Assertivität nicht dem finalen Grenzton, sondern dem Phrasenton zugewiesen. Daraus ergibt sich die Konsequenz, dass zum Beispiel zweifach-steigende Konturen das Merkmal -assertiv besitzen, während fallendsteigende Konturen das Merkmal +assertiv besitzen. Damit lassen sich steigende Konturen nicht mehr zu einer Klasse zusammenfassen, was eine Vergleichbarkeit mit den übrigen dargestellten Ansätzen erschwert. Deshalb wird zur Präsentation eines satzsemantischen Modells der Intonation in diesem Sinne im Folgenden auf Truckenbrodt (2011, 2012) referiert. Truckenbrodt (2011, 2012, 2013) adaptiert sowohl Bartels‘ (1999) Merkmal der Assertivität als auch die im Folgenden noch zu präsentierende Untersuchung von Pierrehumbert und Hirschberg (1990) für seine satzsemantische Beschreibung der Frageintonation des Deutschen. Dabei vereinfacht er für die Betrachtung des Deutschen (Truckenbrodt 2011, 2013) die finale Tonhöhenbewegung über die binäre Unterscheidung von fallend [\] und steigend [/] und weist dem Fall das Merkmal der Assertivität und dem Anstieg das Merkmal des Fragenden zu. Des Weiteren operieren diese Intonationsbedeutungen nach Truckenbrodt (2011, 2012, 2013) auf sogenannten salienten Propositionen, womit, im Gegensatz zu herkömmlichen semantischen Propositionen, solche gemeint sind, die nicht in Form der wörtlichen Bedeutung im Material vorkommen müssen, sondern kontextuell oder strukturell erschließbar sein können wie Präsuppositionen oder Implikaturen. Demnach drückt der/die Sprecher/in über einen Fall aus, dass er/sie zu einer salienten Proposition eine assertive Einstellung hat beziehungsweise diese als wahr darstellen will. Über einen Anstieg wird hingegen ausgedrückt, dass er/sie zu einer salienten Proposition eine fragende Einstellung hat beziehungsweise wissen will, ob diese wahr ist. Demnach steht der finale Anstieg nicht für Fragen an sich, sondern für eine fragende Haltung bezüglich einer salienten Proposition. In neutralen Entscheidungsfragen bedeutet der Anstieg demzufolge, dass der/die Sprecher/in die Proposition der Frage fragend präsentiert. In W-Fragen wie „Wer hat einen Hund?“ drückt der Unterschied zwischen fallender und steigender Intonation aus, ob behauptet wird, „dass jemand einen Hund hat“ oder die saliente Proposition „ob jemand einen Hund hat“ fragend präsentiert wird. Den Problembereich der fallenden Entscheidungsfragen erfasst Truckenbrodt (2011) durch die Annahme eines Unterschieds in der salienten Proposition. Dabei drückt fallende Intonation in Entscheidungsfragen die Behauptung von alternativen salienten Propositionen aus. So bedeutet eine fallende Entscheidungsfrage „Hat Peter einen Hund? [\]“,
54 | Forschungsstand
dass der/die Sprecher/in behauptet, „dass Peter einen Hund hat“ oder „dass Peter keinen Hund hat“. Dies basiert auf der in Kapitel 2 erwähnten semantischen Theorie von Karttunen (1977), dass Fragen dahingehend fungieren, einen Raum alternativer Propositionen zu eröffnen. Fortgesetzte Aussagen werden von Truckenbrodt (2011, 2013) zum Deutschen ausgeklammert. Zum Englischen erwähnt er die Möglichkeit des continuation rise, beschränkt diesen jedoch auf die fallend-steigende Kontur (ToDI: H*L H% / GToBI: H* L-H%) und räumt der regulären tief-steigenden Kontur (ToDI: L*H H% / GToBI: L* H-^H%) diese Funktion nicht ein (Truckenbrodt 2013). Ebenfalls in die Kategorie der globalen Funktionen fällt das Merkmal des commitments nach Gunlogson (2003, 2008), das eine gewisse Ähnlichkeit mit dem Merkmal des appeals nach Fox (1984) aufweist. Dabei beschränkt sich die Darstellung Gunlogsons (2003, 2008) auf Äußerungen mit deklarativer Syntax. Gemäß der Autorin wird über die intonatorische Markierung durch den finalen Grenzton geregelt, welcher der Partizipierenden die Kontrolle beziehungsweise Verantwortung über das laufende Gespräch erhält. Der tiefe finale Grenzton L% signalisiert dabei, dass der/die Sprecher/in für das Gespräch verantwortlich bleibt (speaker commitment), während H% die Kontrolle an den/die Hörer/in abgibt (hearer commitment). Hierbei hebt Gunlogson (2008) hervor, dass der hohe Grenzton nicht kategorisch hearer commitment signalisiert, sondern die Äußerung als contingent auszeichnet. Dieses Merkmal kennzeichnet das Potenzial für hearer commitment und stellt eine notwendige, aber keine hinreichende Bedingung hierfür dar, sodass weitere kontextuelle Faktoren notwendig sind, um in einer mit einem hohen Grenzton markierten Äußerung mit deklarativer Syntax hearer commitment und damit eine Deklarativfrage zu signalisieren. Steedmans (2000, 2007, 2014) Modell zur oberflächenstrukturellen Semantik der Intonation im Englischen folgt einem vergleichbaren Ansatz. Dabei zeigen die früheren Stufen dieses Modells (Steedman 2000, 2007) noch große Parallelen zu Gussenhoven (1984) und Gunlogson (2003, 2008), indem die Funktion der Grenztöne maßgeblich dem commitment von Sprecher/in und Hörer/in bezüglich einer Menge von Propositionen im Diskus zugeordnet wird. Die aktuellste Fassung nach Steedman (2014) operiert jedoch auf einer abstrakteren Ebene. Die Grenztöne tragen in Steedmans (2014) Modell zwar eine eigene abstrakte Bedeutung, entfalten ihre Wirkung allerdings erst in Interaktion mit dem nuklearen Tonhöhenakzent. So kennzeichnet die Wahl des Tonhöhenakzents, ob eine Information dem common ground der Interagierenden hinzugefügt wird, während der Grenzton regelt, welchem/r Interaktanten/in diese Funktion zugeschrieben wird. Diese Bedeutung der Grenztöne benennt Steedman (2014) als Agentivität (agency). Demnach bedeutet die Kombination von H*
Tonale Struktur von Fragen | 55
und LL%6, dass eine Information durch H* dem gemeinsamen Wissen hinzugefügt werden soll und durch LL%, dass dies durch den/die Sprecher/in geschieht. L* LH% hingegen bedeutet, dass eine Information nicht dem gemeinsamen Wissen hinzugefügt werden soll und dies explizit nicht durch den/die Hörer/in geschieht. Hierdurch kommt gemäß Steedman (2014) der Fragecharakter dieser Kontur dadurch zu Stande, dass dem/der Hörer/in durch die Antwortreaktion die Aufgabe zukommt, die Information zu ratifizieren. Im Wesentlichen stellen alle zuvor dargestellten Ansätze Variationen eines gemeinsamen Bedeutungskerns dar. Sowohl bei Brazil (1975), Gussenhoven (1984, 2004), Fox (1984), Steedman (2014), Gunlogson (2003, 2008) als auch bei Truckenbrodt (2011, 2012, 2013) signalisiert der finale Fall, dass der/die Sprecher/in den Inhalt einer bestimmten Äußerung präsentiert, die Verantwortung für den Inhalt übernimmt und intendiert, dass der/die Rezipient/in diesen seinem/ihrem Wissensstand hinzufügt. Dabei scheint es in dieser Abstraktion möglich, das entsprechende Merkmal als behauptend (proclaiming Brazil 1975; asserierend Fox 1984, Truckenbrodt 2011) oder hinzufügend (ADDITION; Gussenhoven 1984; 2004) zu beschreiben und über die Sprecherverantwortung (speaker commitment; Gunlogson 2003, 2008) oder durch die Regelung der Agentivität über die entsprechende Äußerung (Steedman 2014) zu erfassen. Der finale Anstieg hat in allen dargestellten Ansätzen ebenfalls eine gemeinsame Komponente, nämlich, dass der/die Sprecher/in signalisieren möchte, dass er/sie die präsentierte Information in dieser Form nicht beziehungsweise noch nicht dem geteilten Wissen hinzufügen möchte. Für den finalen Anstieg ergeben sich durch die unterschiedlichen Bedeutungsnuancen in den verschiedenen Ansätzen jedoch Probleme. Einen ersten Problembereich stellt dabei der Umgang mit unvollständigen Aussagen dar. In den bisherigen Darstellungen wurden ausnahmslos unabhängige Einzeläußerungen untersucht. Wie im Rahmen der Diskussion in Kapitel 2.1.1 gezeigt wurde, stellen unvollständige, das heißt fortgesetzte Aussagen eine wesentliche Domäne für die Realisierung von finalen Anstiegen dar (vgl. Hirst & di Cristo 1998). Während diese zusätzliche Bedeutung steigender Intonation in den lokalen Ansätzen ihrer Natur nach ignoriert werden kann, muss dieser Aspekt in einem allgemeingültigen globalen Merkmal Berücksichtigung finden. Der Begriff der unvollständigen oder abhängigen Äußerung ist dabei vor allem intonatorisch nicht zwangsläufig selbsterklärend und bedarf der Erläuterung. Im Sin-
|| 6 Steedman (2014) unterscheidet nur zwischen zwei Grenztonkombinationen, wobei LH% einen komplexen Grenzton darstellt und nicht im Sinne des klassischen ToBI (Beckman & Ayers Elam 1997) eine Kombination aus Phrasenakzent und Grenzton.
56 | Forschungsstand
ne der prosodischen Hierarchie sollen im Rahmen dieser Arbeit solche Äußerungen als vollständig gelten, die sowohl eine Intonationsphrase (intonational phrase = IP) als auch eine Äußerungsphrase (utterance phrase = UP) umfassen (Fuhrhop & Peters 2013: 168, Peters 2014: 77f). Unvollständige Äußerungen hingegen sind jene, in denen innerhalb der Äußerungsphrase noch eine oder mehrere weitere Intonationsphrasen folgen. Prinzipiell kann jede syntaktisch vollständige Äußerung von einer weiteren Äußerung gefolgt werden, die aus gesprächsstrukturellen Gründen in die gleiche Äußerungsphrase integriert wird (Geluykens 1988). Aus Gründen der Einfachheit und der Verwendung in der entsprechenden Literatur sind im Folgenden mit unvollständigen oder abhängigen Äußerungen jedoch in erster Linie solche gemeint, die auf syntaktischer Ebene bereits einen zweiten Phrasenteil erwarten lassen. Hierzu gehören die diversen Formen abhängiger Aussagesätze wie koordinierte Erstglieder oder Nebensätze, aber auch Erstbestandteile von Alternativfragen. Truckenbrodt (2013) klammert die Betrachtung unvollständiger Aussagen explizit aus seiner Betrachtung aus. Durch die Verbindung von steigender Intonation mit dem Merkmal des Fragens nach einer salienten Proposition ist dies auch nicht mit der Unvollständigkeitsinterpretation vereinbar. Allerdings ließe sich über die frühere Formulierung dieses Ansatzes (Truckenbrodt 2011) das Merkmal assertiv mit der Idee vereinbaren, dass unvollständige Aussagen noch nicht an der Äußerungsgrenze asseriert werden sollen. Gussenhoven (2004: 299f) gibt an, dass das Merkmal testing neben der Funktion, dem/der Hörer/in die Verantwortung über die Assertion zu übergeben, auch signalisieren kann, dass die Information noch nicht dem gemeinsamen Hintergrundwissen hinzugefügt werden soll. Dies löst das Problem, ist jedoch schwierig mit der eigentlichen Definition des Merkmals vereinbar. Gunlogson (2003, 2008) schreibt dem hohen Grenzton wie erwähnt nicht die kategorische Markierung des hearer commitments zu, so dass fortgesetzte Äußerungen prinzipiell mit diesem Merkmal vereinbar sind, der hohe Grenzton in Aussagen hierdurch aber nur toleriert und nicht erklärt werden kann. Steedman (2000, 2007, 2014) gibt an, dass die Interpretation von Unvollständigkeit oder Vorwärtsweisen eine sekundäre Interpretation der Funktion darstellt, dass dem/der Hörer/in die NichtHinzufügung der Information zugewiesen wird. Dies scheint aus zwei Gründen umständlich: Zum einen signalisiert der finale Anstieg in abhängigen Aussagen genau das Gegenteil von Hörer-Agentivität, sodass die kontextuellen Faktoren der eigentlichen Bedeutung nicht nur etwas hinzufügen, sondern diese ins Gegenteil verkehren müssten. Zum anderen scheint der Anstieg in unvollständigen Äußerungen der häufigere zu sein (Hirst & di Cristo 1998: 25f), sodass eine vollständige Umkehrung der intonatorischen Signalisierung der eigentlichen Funk-
Tonale Struktur von Fragen | 57
tion in der Mehrzahl seiner Verwendungen auftreten müsste, was dem Prinzip sprachlicher Ökonomie stark zu widersprechen scheint. Einen zweiten Problembereich stellen fallende W-Fragen dar. Außer bei Truckenbrodt (2011, 2013) findet sich in den dargestellten Ansätzen zwar die Erwähnung fallender W-Fragen, jedoch nicht die Problematisierung dieses Verwendungsbereichs. Für alle Ansätze lässt sich fragen, warum und was der/die Sprecher/in in W-Fragen im Gegensatz zu Entscheidungsfragen behauptet oder warum die Verantwortung über die Beantwortung der Frage in diesem Fall nicht an den Rezipienten abgegeben wird. Truckenbrodt (2011, 2013) erklärt dies wie zuvor geschildert dadurch, dass fallende W-Fragen ihre Präsupposition asserieren. Zuletzt stehen alle diese Ansätze vor dem Problem, fallende Entscheidungsfragen zu integrieren. Gemäß der vorgestellten globalen Merkmale ergeben sich durch die Assoziation finaler Anstiege mit Entscheidungsfragen behauptende, vollständige Fragen, die die Verantwortung zu antworten nicht an den/die Hörer/in abgeben. Diese Bedeutung lässt sich mit der bias-Interpretation nach Kügler (2003, 2004) oder der wiederkehrenden Bedeutung des Insistierens vereinbaren, wie unter anderem Fox (1984: 59) explizit als Interpretation des assertiv-Merkmals in Entscheidungsfragen angibt. Allerdings besteht mit Blick auf Kapitel 2.1.3 berechtigter Zweifel, ob alle fallenden Entscheidungsfragen diese Bedeutung tragen. Der einzige Erklärungsansatz für dieses Problem findet sich wieder bei Truckenbrodt (2011, 2013). Demnach würden final steigende Entscheidungsfragen signalisieren, dass eine saliente Proposition in Frage gestellt wird, während fallende Entscheidungsfragen den Alternativraum der Antworten asserieren. Dabei nimmt Truckenbrodt (2011, 2013) nur vereinzelt Bezug darauf, welche Auswirkungen die unterschiedlichen semantischen Markierungen auf die kommunikative Orientierung besitzen. Demnach kann dieses Modell zwar bis zu einem gewissen Punkt die Assoziation von Intonationsmustern mit semantischen Strukturen über saliente Propositionen erklären, jedoch im Gegensatz zu den anderen globalen Merkmalen die kommunikative Funktion der Intonation nur bedingt erfassen. Die zuvor dargestellten globalen Merkmale können einen Großteil der Konturverteilung in der kommunikativen Verwendung erklären. Im Folgenden soll jedoch mit dem Merkmal der Unvollständigkeit ein mögliches Extrem der Globalität dargestellt werden, dass auch die bisher nicht erklärbaren Bereiche der Konturverteilung erfassen kann. Das Merkmal der Unvollständigkeit findet sich in verschiedensten Ausprägungen bereits seit den Anfängen der systematischen Beschreibung von intona-
58 | Forschungsstand
torischer Bedeutung. Schon in Kuhlmanns (1931: 61) Untersuchung zur ‚Intonation deutscher Aussagesätze‘ findet sich der Hinweis, dass Fragen und Aussagen mit final-steigender Intonation den Anspruch des Weiterweisens teilen. Fragen benötigen eine Vervollständigung durch den/die Hörer/in, Aussagen eine Vervollständigung durch den/die Sprecher/in, doch beide haben den Aspekt der generellen Unvollständigkeit gemeinsam. Dieser Anspruch der Weiterweisens ist es auch, der die progrediente Intonation nach von Essen (1964: 37) auszeichnet, wobei hier in erster Linie Plateaukonturen gemeint sind, die jedoch auch mit einem flachen Anstieg realisiert werden können. Eine besondere Form der Unvollständigkeit findet sich bei Isačenko und Schädlich (1966: 51). In ihrem Modell, in dem wie zuvor dargestellt nur zwischen den zwei Tonbrüchen steigend und fallend unterschieden wird, steht die steigende Bewegung für die Ankündigung einer fallenden Bewegung. Dies gilt nicht nur für den finalen Anstieg, sondern für jeden Anstieg innerhalb einer Äußerung gleichermaßen. Der Fall hingegen ist unmarkiert und hat keine Ankündigungsfunktion. Eine Anstiegsbewegung muss also bei jedem Auftreten irgendwann von einem Fall gefolgt werden. Steht der Anstieg äußerungsfinal, verlagert sich das weiterweisende Moment auf die nächste Intonationsphrase. Dabei kann sowohl derselbe/dieselbe Sprecher/in als auch der/die Rezipient/in die Realisierung des Falls vornehmen. Ein Dialog, in dem jedoch eine steigende Tonhöhenbewegung auftaucht, die nicht auf die eine oder andere Weise von einem Fall gefolgt wird, gilt laut Isačenko und Schädlich (1966: 59) als Fragment. Ein alternatives Merkmalspaar zu unvollständig versus vollständig findet sich häufig auch in der Terminologie finality versus non-finality. Dieses Paar akzentuiert eine etwas andere Nuance, da es sich nicht auf die Markierung der vorhergehenden Einheit bezieht, sondern auf den Punkt des Auftretens der Grenze. Für Aussagen, die mit einem finalen Anstieg enden, findet sich das Merkmal non-final bereits bei Halliday (1967: 41), der diesen Parameter über den Eindruck beschreibt „that there is a ‚but‘“ (ebd.). Auch Ultan (1969: 45) deutet die Universalität des finalen Anstiegs sowohl in Fragen als auch in abhängigen Aussagen dahingehend, dass der Fall eine Form von Finalität signalisiert, während der Anstieg einen Aspekt der Unvollständigkeit beiträgt. Diese Ansicht vertreten weiterhin Crystal (1969: 272) und Liberman (1975: 92). Vergleichbar mit Ultan (1969: 45) kommt auch Bolinger (1978: 515) zu dem Schluss, dass finaler Fall und Anstieg sich in den Merkmalen final und non-final gegenüberstehen. Nach Bolinger (1978: 515) bedeutet ein Fall generell, dass der/die Sprecher/in fertig ist (being through), der Anstieg das Gegenteil. Davon ausgehend entfalten sich gemäß Bolinger die lokalen Bedeutungen dieser zu-
Tonale Struktur von Fragen | 59
grundeliegenden Unterscheidung. Wie Kuhlmann (1931: 61) gibt auch Bolinger (1978: 498) an, dass Unvollständigkeit sich als allgemeines Merkmal sowohl für Fragen als auch für unvollständige Aussagen eignet, da beiden gemein ist, dass etwas zu folgen hat. In etwas konkreterer Form beschreibt Bolinger (1989: 425) die finale Anstiegsbewegung auch mit Bezug zum Diskurs als Möglichkeit anzuzeigen, ob ein im Gespräch befindliches Thema noch diskussionsbedürftig (unsettled) oder mit der entsprechenden Äußerung als abgeschlossen zu betrachten ist (settled). Ein wesentlicher Beitrag zur Etablierung des Konzepts der Unvollständigkeit geht auf Cruttenden (1981) zurück. Cruttenden (1981) betrachtet eine Vielzahl an Beschreibungen zur Bedeutung fallender und steigender Tonhöhenbewegungen und kommt dabei zu dem zuvor hergeleiteten Ergebnis, dass der finalen Tonhöhenbewegung eine Funktion höherer Generalisierung als die Markierung von grammatischen Funktionen, Sprechereinstellungen oder konkreten Diskursfunktionen zukommen muss. Dabei stellt er fest, dass allen von ihm dargestellten Merkmalen ein Merkmal gemein zu sein scheint, nämlich das der Unabgeschlossenheit/Unvollständigkeit. Cruttenden (1981) definiert dabei die Ebene und die spezifische Funktion der Unabgeschlossenheit allerdings nicht weiter, sondern belässt es bei der abstrakten notion of incompleteness und einer generellen vorwärtsweisenden Abhängigkeit (forward dependency). Eine weitere Alternative für diese Opposition stellt das Begriffspaar open versus closed dar (Cruttenden 1997: 163). Dieses alternative Begriffspaar lässt sich auch bei Selting (1995: 232ff) identifizieren, die wie erwähnt prinzipiell die Gegenposition zu einem konsistenten Bedeutungskern vertritt. Innerhalb von Fragen signalisiert der finale Anstieg laut Selting (1995: 232f) die Offenheit der Antwortmenge, während der finale Fall diese begrenzt. Betrachtet man die Offenheit der Antwortmöglichkeiten als lokale Ausprägung der generellen Offenheit innerhalb von Fragen, ist Seltings (1995) Ansatz zumindest in Bezug auf Fragen unmittelbar mit dem Ansatz Cruttendens (1981) vereinbar. In jüngeren Beschreibungen zur Intonation findet sich die globale Funktion der Unvollständigkeit zum Deutschen außerdem bei Féry (1993: 106), Niebuhr et al. (2010) sowie Petrone & Niebuhr (2014) und zum britischen Englisch bei Hirst (1998: 65). Lai (2012) greift den Ansatz der Unvollständigkeit in ihrer pragmatischen Interpretation des finalen Anstiegs im Englischen wieder auf. Dabei beschreibt sie Unvollständigkeit jedoch anders als Cruttenden (1981) nicht durch eine vorwärtsweisende, sondern durch eine hierarchisch aufwärtsweisende Abhängigkeit. Demnach wird die Unvollständigkeit der assoziierten Äußerung nicht in Bezug auf eine folgende Äußerung oder Phrase markiert, sondern in Bezug auf
60 | Forschungsstand
eine im Diskurs laufende Leitfrage (question under discussion), die sich auf einer metasprachlichen Ebene parallel zum Diskurs und hierarchisch über den Einzeläußerungen befindet (Lai 2012: 8f). Die spezifische Funktion der finalen Melodiebewegung besteht demnach darin, zu signalisieren, ob das Gespräch einen akzeptablen Abschluss bezüglich des zu erledigenden kommunikativen Ziels erreicht hat, was durch den finalen Fall ausgedrückt wird, oder nicht, wie der finale Anstieg anzeigt (Lai 2012: 8f). Dies steht in gewisser Verbindung zu Bolingers (1989: 425) settled vs. unsettled Unterscheidung. Die finale Tonhöhenbewegung offenbart demzufolge die Ansichten des/der Sprechers/in über den Status des Gesprächs (Lai 2012: 8f). Spezifische pragmatische Funktionen und Aspekte der Sprechereinstellung ergeben sich dabei aus konversationellen und kontextuellen Interpretationen der Signalisierung dieses Diskursmerkmals. Dabei beschränkt sich Lais (2012) Untersuchung auf die Intonation bestimmter Partikeln und backchannels, sodass sich die Frage nach der Verortung der fallenden W-Fragen ergibt. Diese würden demzufolge typischerweise nicht auf eine unabgeschlossene Leitfrage verweisen, sondern signalisieren, dass das Gespräch bezüglich der Leitfrage zu einem akzeptablen Schlusspunkt gekommen ist. An Cruttendens (1981) Begriff von Unvollständigkeit und damit der forward dependency orientieren sich das kompositionelle Modell zur tonalen Intonationssemantik zum Englischen von Pierrehumbert und Hirschberg (1990) und das der vorliegenden Arbeit zugrundeliegende Modell für das Deutsche von Peters (2014: 53ff). Wie in Kapitel 2.1.2 dargestellt weist der kompositionelle tonale Ansatz den einzelnen tonalen Einheiten einer Intonationskontur abstrakte semantische Bedeutung zu. Dabei wird in den beiden Systemen von Pierrehumbert und Hirschberg (1990) und Peters (2014: 53ff) der Unterschied in der Bezugsebene von Akzenttönen und Grenztönen, der wie einleitend beschrieben bei allen vorigen Betrachtungen unterstellt wurde, explizit gemacht. Akzenttöne tragen abstrakte semantische Eigenschaften, die den Informationsstatus der akzentuierten Einheit betreffen, wie zum Beispiel informatorische Unabgeschlossenheit oder kommunikative Abhängigkeit. Grenztöne hingegen besitzen Skopus über die gesamte Intonationsphrase und deren interaktive Orientierung. Der hohe finale Grenzton H% signalisiert dabei, dass die assoziierte Intonationsphrase eine Form von Unvollständigkeit aufweist und demnach in irgendeiner Weise vorwärtsweisend mit Bezug auf nachfolgende Intonationsphrasen interpretiert werden muss. Eine Besonderheit der Intonationssemantik nach Peters (2014: 58) stellt dabei die Annahme dar, dass der tiefe finale Grenzton L% nicht explizit die Vollständigkeit einer Intonationsphrase markieren muss, sondern eine potenzielle konversationelle Abgeschlossenheit signalisiert und damit
Tonale Struktur von Fragen | 61
tendenziell den unmarkierten Fall der Abwesenheit einer expliziten Markierung von Unabgeschlossenheit. Dies ist vereinbar mit dem Modell von Isačenko und Schädlich (1966: 51), in dem der finale Fall allerdings gänzlich unmarkiert interpretiert wird und keine besondere Signalisierung hervorruft. Der vorwärtsweisende Charakter des hohen finalen Grenztons gibt dabei nicht an, ob die Intonationsphrase in Bezug auf eine weitere Äußerung des/der gleichen Sprechers/in oder eines/r anderen Sprechers/in interpretiert werden muss. Somit erfasst diese Bedeutung auch hier sowohl die Realisierung von Fragen, die vom Rezipienten vervollständigt werden sollen, als auch von progredienten Aussagen, die von dem/der Sprecher/in selbst vervollständigt werden. H% drückt also eine allgemeine Form der Unvollständigkeit aus. Dass L% nicht die Funktion zukommt, explizit Vollständigkeit zu markieren, stellt einen möglichen Vorteil des Modells nach Peters (2014) dar. Damit schließt L% die Interpretation der Unvollständigkeit nämlich nicht aus, sondern kennzeichnet eine Intonationsphrase lediglich als nicht explizit vorwärtsweisend. Der Vorteil dieser semantischen Beschreibung ergibt sich mit Bezug auf die zu Beginn dieser Arbeit erwähnte Redundanz in der Markierung von Interrogativität in der gesprochenen Sprache. Der Unterschied zwischen W-Fragen einerseits und Entscheidungsfragen und Deklarativfragen andererseits besteht folglich nicht darin, dass erstere prototypisch abgeschlossen und letztere prototypisch unabgeschlossen markiert werden, sondern dass W-Fragen auf intonatorischer Ebene tendenziell häufiger nicht explizit als unabgeschlossen markiert werden. Die Begründung kann darin gesucht werden, dass in diesem Fall diese Markierung bereits ausreichend auf einer anderen sprachlichen Ebene besteht, nämlich der lexikalischen (vgl. Siebs 1969: 133). Dadurch vermeidet dieser Ansatz einen Großteil der am Anfang dieses Kapitels geschilderten Probleme globaler Funktionen und ist vereinbar mit den Darstellungen von unter anderem Kohler (1977, 1995) oder Geluykens (1988), die annehmen, dass eine intonatorische Markierung unter Anwesenheit anderer sprachlicher oder kontextueller Faktoren schlicht unterbleiben oder kontextuell überschrieben werden kann. Als primäres Merkmal von Interrogativität lässt sich die Signalisierung von Unvollständigkeit durch den finalen Anstieg allenfalls dann interpretieren, wenn jegliche andere Markierung fehlt. Dies ist am häufigsten bei Deklarativfragen der Fall, die, wie aus den bisherigen Darstellungen hervorgeht, häufig keine Markierung auf einer anderen Ebene aufweisen. Allerdings ist auch dies nicht zwingend notwendig, da Geluykens (1987) zeigt, dass sich selbst Deklarativfragen mit fallender Intonation realisieren lassen, nämlich genau dann, wenn der interrogative Charakter sich eindeutig aus kontextuellen Faktoren erschlie-
62 | Forschungsstand
ßen lässt. Diese Annahme findet sich auch in Kohlers (1977: 199) situativen Fragen wieder. Bezüglich des Grades an Markierung auf anderen sprachlichen Ebenen lassen sich die Entscheidungsfragen zwischen den W-Fragen und den Deklarativfragen einordnen, das sie zwar syntaktisch durch Inversion als Fragen gekennzeichnet sind, dies jedoch kein exklusives Merkmal von Interrogativität darstellt, da auch bestimmte Imperativsätze, Nebensätze oder elliptische Konstruktionen mit dieser syntaktischen Form auftreten können (vgl. Altmann 1987, Lohnstein 2013, Kapitel 4.2.1). Demnach ist die syntaktische Markierung von Entscheidungsfragen je nach Kontext mehr oder weniger ausreichend, was die Variation zwischen steigender und fallender Intonation erklären könnte. Betrachtet man den finalen Anstieg als optionale Markierung bei unzureichender Markierung auf anderen Ebenen, findet sich möglicherweise eine Erklärung für die Diskrepanz zwischen Lese- und Spontansprache. In Leseexperimenten fehlen häufig zwei wesentliche Aspekte spontansprachlicher Kommunikation, nämlich zusätzlicher sprachlicher Kontext und der außersprachliche Kontext. Im Sinne Kohlers (1977: 199, 1995: 197) und Bolingers (1957) kann der interrogative Charakter einer Äußerung bereits durch vorhergehendes sprachliches Material angekündigt oder auch durch außersprachliche Elemente wie Gestik und Mimik betont werden. Durch ein Fehlen dieser beiden Hinweisquellen, wie in Einzeläußerungen innerhalb von Leseexperimenten häufig der Fall, steigt die Notwendigkeit der Markierung dieser Faktoren über die intonatorische Ebene. Nachdem gezeigt werden sollte, dass mit dem Merkmal der Unvollständigkeit ein globales Merkmal gefunden ist, das prinzipiell mit allen Verbindungen von finalen Tonhöhenbewegungen und Äußerungstypen vereinbar ist, soll der Versuch unternommen werden, auch die anderen globalen Funktionen innerhalb dieses Kapitel mit diesem Parameter der Unvollständigkeit in Einklang zu bringen. Bei Brazil (1975: 107ff) und Gussenhoven (1984: 201ff, 2004: 296f) wird dem finalen Fall die Aufgabe zugewiesen, zu signalisieren, dass der Äußerungsinhalt dem gemeinsamen Wissen hinzugefügt werden soll. Die Markierung potenzieller Abgeschlossenheit in unabhängigen Aussagen kann die Interpretation nahelegen, dass der/die Sprecher/in diese Markierung begründet wählt, da er dem Inhalt nichts weiter hinzuzufügen hat und ihn deswegen behaupten möchte. Über diese Erklärung lässt sich im weitesten Sinne auch das Merkmal assertiv nach Truckenbrodt (2011, 2013) einschließen. Für den finalen Anstieg formuliert Gussenhoven (1984: 201ff, 2004: 296f) das ursprüngliche Konzept Brazils (1975: 107ff) derartig um, dass diesem die Funktion zukommt, zu signalisieren,
Tonale Struktur von Fragen | 63
dass eine Behauptung noch nicht oder durch den/die Hörer/in vorgenommen werden soll. Dies ist eine nachvollziehbare Folge der expliziten Markierung von Unvollständigkeit, die eine Assertion blockieren würde. Auch das commitment-Merkmal von Gunlogson (2003, 2008) und das agency-Merkmal von Steedman (2014) sind mit dieser Interpretation vereinbar. Das speaker commitment fallender Äußerungen in dem Sinne, dass der/die Sprecher/in die Verantwortung über die Assertion übernimmt, lässt sich wie zuvor über die potenzielle Vollständigkeit der Äußerung herleiten. Hearer commitment in dem Sinne, dass dem/der Hörer/in die Übernahme der Gesprächskontrolle zukommt, ergibt sich nicht unmittelbar aus der Markierung von Unvollständigkeit, sondern erst durch die Kombination mit sprachlichen oder kontextuellen Faktoren. Die bisherigen Darstellungen sollten jedoch gezeigt haben, dass eine solche Form der Unterspezifiziertheit notwendig ist, um eine Generalisierbarkeit zu erhalten, der auch Realisierungen wie steigende fortgesetzte Aussagen zulässt, die das commitment-Merkmal nicht ohne Weiteres abdeckt. Die Assoziation von Erwartungshaltung/bias (Kügler 2003, 2004) und Unabgeschlossenheit findet sich wie erwähnt bereits bei Selting (1995: 232f), die die bias-Interpretation aus der Markierung der Einschränkung der Antwortmöglichkeiten ableitet. Wenn der entsprechende konversationelle Kontext dies zulässt, ist es möglich, anzunehmen, dass die Abwesenheit von markierter Unabgeschlossenheit in Entscheidungsfragen den Eindruck einer intentionalen Nicht-Markierung hervorrufen kann, die wiederum die Interpretation hervorrufen kann, dass die Frage eben nicht der Vervollständigung bedarf. Dies kann dann der Fall sein, wenn die Menge der Antwortmöglichkeiten bis hin zu einem yes-bias eingeschränkt werden soll oder wenn der/die Sprecher/in gar keine Antwort erwartet. In W-Fragen kehrt sich dieser Fall um. Während eine explizite Markierung von Unabgeschlossenheit hier generell nicht notwendig ist, kann die redundante explizite Markierung von Unvollständigkeit über die intonatorische Ebene eine besondere Öffnung der Frage hervorrufen und dadurch ein größeres Bedürfnis nach Vervollständigung signalisieren. Bias ist demnach eine mögliche Interpretation des finalen Falls in Fragen, allerdings nicht aufgrund des finalen Falls selbst, sondern aufgrund dessen Interpretation vor dem Hintergrund anderer sprachlicher, parasprachlicher und außersprachlicher Phänomene. Um diese Frage empirisch zu festigen, wäre es notwendig, fallende Fragen mit einem klaren bias und solche, ohne einen klaren bias zu finden, und hinsichtlich anderer Parameter, auch intonatorischer Natur, zu vergleichen. Unmittelbar daran lässt sich die Beschreibung des finalen Anstiegs als Mittel zur Signalisierung von Höflichkeit anschließen. Dabei liefert Kohler (2004)
64 | Forschungsstand
das entsprechende Merkmal bereits selbst, indem er höfliche Fragen als offener charakterisiert. Wie bereits zur bias-Interpretation erläutert, kann der finale Fall in Abhängigkeit vom Kontext als bewusste Markierung von nicht-unvollständig interpretiert werden. Eine Entscheidungsfrage, in der der/die Sprecher/in signalisiert, dass die Antwort für die Äußerung nicht notwendig ist, ohne dabei gleichzeitig Hinweise darauf zu geben, dass der Grund dafür zum Beispiel in einer Antworterwartung liegt, könnte daher die Interpretation hervorrufen, dass der/die Sprecher/in kein Interesse an einer Antwort beziehungsweise an einem Gesprächsbeitrag des/der Hörers/in hat. Der Eindruck von Unhöflichkeit ergibt sich demnach aus der Interaktionsverweigerung. Werden W-Fragen hingegen trotz ihrer bereits lexikalisch markierten Unvollständigkeit zusätzlich intonatorisch als unvollständig markiert, so liegt eine redundante Extra-Markierung als unabgeschlossen mit der Interpretationsmöglichkeit von Offenheit vor. Diese Offenheit kann wiederum je nach pragmatischem Kontext dahingehend interpretiert werden, dass der/die Sprecher/in keine Erwartungshaltung bezüglich der Antwort hat, aber auch dahingehend, dass eine besondere Notwendigkeit der Vervollständigung vorliegt. Diese besondere Notwendigkeit schließt den Beitrag des/der Adressaten/in explizit in die Frageaktivität mit ein und hat daher das pragmatische Potenzial, den Eindruck von Höflichkeit hervorzurufen, wie es auch Selting (1995: 269) angibt. Um diesen Punkt weiter zu stärken, wird darauf hingewiesen, dass es nicht möglich zu sein scheint, eine Alternativfrage mit einem finalen Anstieg zu beenden, um Höflichkeit zu signalisieren. Dies bedeutet nicht, dass nicht auch Alternativfragen mit einem (zweiten) finalen Anstieg enden können. Aufgrund der syntaktischen Struktur wird das Merkmal der Unabgeschlossenheit hier jedoch unmittelbar über seine Primärfunktion gedeutet, sodass eine unvollständige Alternativfrage in erster Linie entweder signalisiert, dass die Anzahl der Elemente, die als Alternativen zur Verfügung stehen, noch keine geschlossene Menge darstellt (z. B. „Möchtest du Kaffee oder Tee(H%)? (oder Saft?)“; vgl. Brinkmann 1971: 513, Truckenbrodt 2013, Peters 2014: 53f) oder als Ganzes als Entscheidungsfrage interpretiert werden muss (z. B. Möchtest du Kaffee oder Tee? (H%) = Möchtest du eins von beiden?; Bolinger 1989: 114, Truckenbrodt 2013, Reis 2013, Peters 2014: 53f). Auch der Eindruck der Unsicherheit (Nilsenova 2006, Reese 2007) lässt sich über eine kontextgebundene Interpretation des Merkmals der Unvollständigkeit erfassen. Die Unsicherheits-Interpretation von Nilsenova (2006) und Reese (2007) bezieht sich hauptsächlich auf das Auftreten final steigender Intonation in vollständigen Aussagen. Hier kommt es zu einer Diskrepanz zwischen syntaktischer Struktur und intonatorischer Markierung, da ein vollständiger Aus-
Tonale Struktur von Fragen | 65
sagesatz als unvollständig markiert wird. Das Öffnen einer abgeschlossenen Aussage als unvollständig könnte dabei zu der Interpretation führen, dass der/die Sprecher/in nicht sicher ist, ob die Aussage in dieser Form als abgeschlossen und damit zum gemeinsamen Wissen hinzufügbar betrachtet werden kann. Die Unvollständigkeit lässt dem/der Rezipienten/in die Option, die Aussage weiter zu ergänzen. Der Parameter, den die Intonation hier beiträgt, ist also in unsicheren abgeschlossenen Aussagen, fortgesetzten Aussagen und Deklarativfragen der gleiche. Die jeweilige Interpretation ist abhängig von lokalen kontextuellen Faktoren. Kapitel 2.1.3 und 2.1.4 haben gezeigt, dass sich die Funktion des finalen Anstiegs in Fragen nicht über lokale semantische Parameter erfassen lässt, ohne dabei einen Teil der weiteren Bedeutungen auszublenden. Gleichzeitig konnte gezeigt werden, dass es nicht notwendig ist, der finalen Tonhöhenbewegung jeglichen Anspruch eines konsistenten Bedeutungskerns abzusprechen. Das Merkmal der Unvollständigkeit besitzt dabei einen so hohen Grad an Globalität, dass sich dem finalen Anstieg zwar gemäß der maximal linguistic normalcy ein stabiler Bedeutungskern zuweisen lässt, dieser jedoch in so hohem Maße unterspezifiziert ist, dass sich die verschiedenen lokalen Bedeutungen erst durch den Kontext ausdifferenzieren lassen. Die spezifische Bedeutung der Intonation entfaltet sich demnach durch die Interpretation eines globalen Kernmerkmals in Verbindung mit anderen sprachlichen und außersprachlichen Merkmalen. Folglich können die in Kapitel 2.1.3 präsentierten lokalen grammatischen, emotionalen und diskurssteuernden Bedeutungen des finalen Anstiegs als kontextuelle Manifestationen des Merkmals der Unvollständigkeit gedeutet werden. Im weiteren Bezug auf Kapitel 2.1.1 lässt sich damit abschließend festhalten, dass der finale Anstieg einen Bedeutungskern besitzt, der prototypische Tendenzen in der Assoziation mit bestimmten Fragetypen erklären kann, dabei jedoch selbst kein unmittelbares Merkmal von Interrogativität darstellt. Ob die Wahrnehmung der Bedeutung von Intonation sich in der Kommunikationssituation tatsächlich aus der kontextuellen Interpretation solcher globalen Merkmale ergibt oder diese ein linguistisches Konstrukt darstellen und, wie Crystal (1969: 285) und Fox (1984: 59) kritisieren, zu generell sind, um praktische Relevanz zu besitzen, ist damit jedoch nicht abschließend beantwortet. Eine Frage, die sich aus dieser Konklusion ergibt, ist, ob sich der Beitrag der intonatorischen Form zur Markierung von Interrogativität damit generell auf diese unterspezifizierte Signalisierung von Unvollständigkeit beschränkt. Demnach könnte Intonation erst in Kombination mit anderen konversationellen Faktoren sprachlicher, parasprachlicher oder außersprachlicher Natur zur Interpretation von Interrogativität beitragen. In anderen Worten soll also gefragt
66 | Forschungsstand
werden, ob die Unterspezifiziertheit des finalen Anstiegs ausschließlich durch nicht-intonatorische Faktoren aufgelöst werden kann oder ob auch auf Ebene der Intonation weitere Parameter existieren, die den finalen Anstieg spezifizieren können. Dabei lassen sich in der phonologischen Struktur neben den Grenztönen noch die nuklearen Akzenttöne sowie die pränuklearen Tonhöhenakzente als bedeutungstragende Elemente identifizieren. Im Rahmen dieser Arbeit wurde bisher bewusst auf die Ausdifferenzierung der Bedeutungen unterschiedlicher steigender Konturtypen verzichtet. Als ein Grund wurde hierzu einleitend in Kapitel 2.1.3 erklärt, dass in den typologischen (vgl. Hermann 1942, Ultan 1969, Bolinger 1978) und älteren Arbeiten zum Deutschen (vgl. von Essen 1964, Bierwisch 1966, Isačenko & Schädlich 1966) häufig keine Angaben zum Akzenttyp gemacht werden. Des Weiteren wurde dargestellt, dass in vielen Ansätzen, die zwischen Konturtypen unterscheiden, diese Unterschiede keinen Einfluss auf die Assoziation mit Interrogativität haben (vgl. zum Englischen: Kingdon 1958, Halliday 1967, O’Connor & Arnold 1961, 1973; zum Deutschen: Pheby 1975, Kohler 1977, 1995). Zudem konnte in diesem Kapitel gezeigt werden, dass in der jüngeren Forschung die Interrogativität stützende Bedeutung, sofern angenommen, ausschließlich dem finalen Grenzton zugewiesen wird (vgl. Brazil 1975, Gussenhoven 1984, 2004, Gunlogson 2003, 2008, Truckenbrodt 2011, 2012, 2013, Lai 2012). Zuletzt wurde bereits die Arbeit von Haan (2002: 224f) genannt, die keinen Einfluss des Tonhöhenakzents feststellen konnte, allerdings am Beispiel des Niederländischen. Dies ist nach der Intonationssemantik von Pierrehumbert und Hirschberg (1990) sowie Peters (2014: 53f) darüber erklärbar, dass die Bedeutung von Tonhöhenakzenten die Interpretation der akzentuierten Einheit und nicht der gesamten Phrase beeinflusst. Da sich die Funktion der Interrogativität auf den Status der gesamten Phrase beziehungsweise Äußerung bezieht, ist diese Funktion auch nicht in der Semantik der Akzenttöne zu erwarten. Die zweite Möglichkeit stellt der Beitrag der pränuklearen Region dar. Der Beitrag der pränuklearen Region zur Gesamtbedeutung der Äußerung wird in der traditionellen Literatur kategorisch vernachlässigt, da der nuklearen Kontur der Skopus über die Gesamtäußerung zugesprochen wird. Einige Aspekte zur Interaktion zwischen nuklearer und pränuklearer Region finden sich wie erwähnt zum Beispiel bei O’Connor und Arnold (1961, 1973) oder Liberman (1975), in deren Modell die vorangehenden heads die Bedeutung der nuklearen Kontur mitbestimmen können. Übersetzt in das AM-Modell handelt es sich allerdings hierbei häufig um phonetische Variationen in f0 vor dem nuklearen Akzentton und nicht um die tonale Struktur der pränuklearen Region. Eine zunehmende Bedeutung wird dem pränuklearen Konturabschnitt in jüngeren Arbeiten zuge-
Phonetische Merkmale von Fragen | 67
schrieben. So können Dainora (2006) und Face (2007) zum Beispiel für das Spanische, Baltazani (2006) und Baltazani et al. (2015) für das moderne Griechisch, Vion und Colas (2006) für das Französische und Petrone und D’Imperio (2011) für das neapolitanische Italienisch feststellen, dass bereits Aspekte der pränuklearen Kontur in Abhängigkeit vom Satzmodus variieren beziehungsweise Hörer/innen bereits vor dem nuklearen Abschnitt in der Lage sind, Fragen von Aussagen zu differenzieren. Evidenz dieser Art zum Deutschen liefern Niebuhr et al. (2010) sowie Petrone und Niebuhr (2014), wie in Kapitel 2.2.2 ausführlicher dargestellt wird. Dabei kann jedoch festgestellt werden, dass sich die Effekte der pränuklearen Region fast ausnahmslos auf die phonetische Realisierung wie die Ausrichtung des pränuklearen Gipfels (Baltazani 2006, Baltazani et al. 2015) beziehen und nicht auf Aspekte der tonalen Struktur. Auch zum Deutschen geben Niebuhr et al. (2010) sowie Petrone und Niebuhr (2014) keine tonalen Mittel zur Markierung von Interrogativität im pränuklearen Abschnitt an. Dies steht erneut im Einklang mit Pierrehumbert und Hirschberg (1990) sowie Peters (2014), die der tonalen Struktur von pränuklearen Akzenten wie bereits im Fall der nuklearen Akzente Bedeutung für die akzentuierten Einheiten zusprechen. Da keine Literatur zum Deutschen oder Englischen vorliegt, die der tonalen Struktur von pränuklearen Akzenten die Markierungsfunktion von Interrogativität zuspricht, soll dies auch im Rahmen dieser Arbeit vorläufig ausgeschlossen werden. Als Fazit des Kapitels lässt sich festhalten, dass Frageintonation auf der phonologischen Ebene der Intonation im Sinne einer eindeutig mit Interrogativität assoziierten tonalen Struktur weder in der Form spezifischer Grenztöne noch spezifischer nuklearer oder pränuklearer Tonhöhenakzente existiert.
2.2 Phonetische Merkmale von Fragen Im Anschluss an Kapitel 2.1 stellt sich die Frage, ob die Bedeutung der Intonation ausschließlich auf einer globaleren Ebene als der Markierung von konkreten grammatischen Strukturen operiert, womit eine Frageintonation im Sinne dieser Arbeit folglich nicht existiert. Eine Alternative besteht darin, zwar anzunehmen, dass sich der Beitrag der tonalen Struktur an dieser Form der Unterspezifiziertheit erschöpft, die phonologische Struktur jedoch nicht die einzige Ebene der Intonation darstellt, die einen Beitrag zur Markierung von Fragen leisten könnte. Das folgende Kapitel widmet sich daher der Betrachtung der phonetischen Realisierung und den Fragen, welchen Bedeutungsbeitrag diese in Abgrenzung zur dargestellten Funktion der tonalen Ebene leisten kann, und ob diese dazu
68 | Forschungsstand
beitragen kann, die generelle Bedeutung der Unvollständigkeit auf intonatorischer Ebene weiter zu spezifizieren. Hierzu soll in Kapitel 2.2.1 zuerst ein typologischer Blick auf Frageintonation geworfen und das Konzept der biological codes als mögliche Universalien parasprachlicher Markierung und Erklärungsmodell für die Phonetik von Frageintonation dargestellt werden. Die daran anschließenden Kapitel dienen der Identifikation der konkreten phonetischen Messvariablen, die aufgrund ihres Vorkommens in den Sprachen der Welt (Kapitel 2.2.2) und nicht speziell im Deutschen (2.2.3) als exklusive Merkmale von Fragen angenommen werden können. Hierdurch wird zugleich die Grundlage für die empirischen Untersuchungen gelegt. In Kapitel 2.2.4 sollen zuletzt mögliche Erklärungsansätze dargestellt werden, um die Frage zu beantworten, wie sich phonetische Parameter, die als Markierung von Interrogativität interpretiert werden können, im Hinblick auf die Trennung von phonetischer und phonologischer Ebene einerseits und der binären Kategorialität von Interrogativität andererseits mit der linguistischen Theorie vereinbaren lassen.
2.2.1 Universalien und der frequency code In Kapitel 2.1.1 wurden sprachtypologische Untersuchungen angeführt, die zeigen konnten, dass die Verbindung von Fragen oder zumindest bestimmten Fragetypen mit einer Form des finalen Anstiegs nicht nur für das Deutsche und verwandte Sprachen, sondern für die Mehrheit der Sprachen der Welt zu finden ist (vgl. Hermann 1942, Ultan 1969, Bolinger 1978, Hirst & di Cristo 1998). Obwohl gezeigt werden konnte, dass diese Verbindung eher eine Tendenz oder Präferenz darstellt, ergibt sich die Frage, wie sich dieses Merkmal in einer solchen Vielzahl von Sprachen ausprägen konnte, wenn weder eine gemeinsame Ursprungssprache noch Sprachkontakt eine ausreichende Erklärung zu bieten scheinen. Zuerst ist dabei festzustellen, dass die sprachliche Universalie nicht immer spezifisch auf den finalen Anstieg bezogen ist, sondern auch generell steigende oder mehr Tonhöhe bedeuten kann. Hermann (1942: 363) gibt hierzu an, dass sich Fragen in den Sprachen der Welt von Aussagen mit mehr Tonhöhe irgendwo innerhalb der Äußerung unterscheiden können, wobei der finale Anstieg eine spezifische Form von mehr Tonhöhe darstellt. Auch Ultan (1969: 45) stellt fest, dass sich higher pitch als Merkmal von Fragen auf verschiedene Arten wie höheres Register, höhere Akzentgipfel oder eben einen finalen Anstieg ausdrücken kann. Bolinger (1978: 513) führt zum Vergleich die Annahme an, dass sich die rhythmische Phrasierung physiologisch auf den Atemzyklus
Phonetische Merkmale von Fragen | 69
zurückführen lässt und räumt für den finalen Anstieg in Fragen auch einen urtümlichen, in Ansätzen sogar angeborenen Status ein. Dieser Gedanke findet sich ausgeführt bei Ohala (1983, 1984). Nach Ohala (1983, 1984) ist der finale Anstieg wie bei Hermann (1942) und Ultan (1969) nicht die typologische Universalie, sondern eine Erscheinungsform der Universalie von mehr Tonhöhe. Weiterhin gibt Ohala (ebd.) an, dass die Funktion von Tonhöhe sich nicht auf Fragen beschränkt, sondern vielmehr eine Vielzahl von unterschiedlichen Einstellungen, emotionalen und attitudinalen Bedeutungen ausdrückt. Dabei stünden tiefe oder fallende Tonhöhe tendenziell für Dominanz, Autorität, Bedrohung oder Selbstsicherheit, während hohe oder steigende Tonhöhe für Subordination, Abhängigkeit, Abwesenheit von Bedrohung oder Unsicherheit stünden. Diese Ausprägungsformen führt Ohala auf zwei wesentliche Grundmerkmale zurück: largeness versus smallness. Als Begründung für diesen Zusammenhang von Tonhöhe und smallness/largeness wurde von Ohala (1983/84) der sogenannte frequency code als Erklärungsmodell geprägt (vgl. auch Gussenhoven 2002, 2004: 71ff). Gemäß dem frequency code geht die Assoziation von Tonhöhe mit smallness/largeness auf eine Umdeutung anatomisch-physiologischer Zusammenhänge zurück. Kleine Lebewesen verfügen demnach mit höherer Wahrscheinlichkeit über einen kleineren Vokaltrakt, wobei ein kleinerer Vokaltrakt in direktem Zusammenhang mit kürzeren Stimmlippen und einem kleineren Resonanzraum steht. Die Stimmlippen kleinerer Lebewesen schwingen dabei aufgrund der geringeren Masse und häufig höheren Spannung mit höherer Geschwindigkeit und erzeugen damit eine höhere Grundfrequenz. Dieses Verhältnis dreht sich mit zunehmender Größe um. Größere Lebewesen besitzen einen größeren Vokaltrakt mit größeren Resonanzräumen und massigeren, längeren Stimmlippen, was zu einer relativen Verringerung der Grundfrequenz führt (Morton 1977, Ohala 1983, 1984, Gussenhoven 2004: 71ff). Tonhöhe steht demnach in einer gewissen7 anatomisch-physiologischen Relation zur Körpergröße und korreliert damit mit den Parametern smallness und largeness nicht im Sinne kommunikativer Konzepte, sondern im Sinne der tatsächlichen Dimensionen des Benutzers. Es kann nun festgestellt werden, dass bestimmte Tierarten diesen anatomischen Zusammenhang für sich nutzbar machen. So lassen sich Fälle feststellen,
|| 7 Hierbei handelt es sich um eine lose Relation, von der sich Ausnahmen finden lassen. Innerhalb der menschlichen Spezies ist die Diskussion bislang offen, inwieweit innerhalb der Geschlechter die Stimmhöhe ein Indikator für Körpergröße sein kann (für einen Zusammenhang vgl. u. a. Pisanski, Fraccaro, Tigue, O’Connor & Feinberg 2014, dagegen vgl. u. a. Feinberg, Jones, Little, Burt & Perrett 2005, Pisanski & Rendall 2011).
70 | Forschungsstand
in denen Tiere der gleichen Spezies das Heben oder Senken der Grundfrequenz bewusst oder unbewusst dazu einsetzen, einen Unterschied in der Körpergröße zu suggerieren beziehungsweise den damit verbundenen Eindruck zu erzeugen. So kann unter anderem bei Wölfen das Produzieren niederfrequenter Laute in Form von zum Beispiel Knurren als Zeichen der Größe und Dominanz, das Produzieren hochfrequenter Laute wie zum Beispiel Heulen oder Jaulen als Zeichen von Kleinheit, Unterwürfigkeit und Abhängigkeit interpretiert werden. Die Benutzung von Tonhöhe steht im Tierreich folglich in Verbindung mit der Regelung von Machtverhältnissen (Ohala 1983, 1984). Vergleicht man die Bedeutungsaspekte, die der tierischen Kommunikation zugeordnet werden, mit Ohalas (1983, 1984) Interpretation der Bedeutungsaspekte von Tonhöhe in der menschlichen Kommunikation, so lässt sich ein hoher Grad an Überlappung feststellen. Der frequency code besagt demzufolge, dass die Assoziation von Tonhöhe und der Signalisierung von Dominanz versus Unterordnung in der menschlichen Sprache phylogenetisch überliefert ist und bereits eine tierische Instrumentalisierung eines ursprünglich anatomisch-physiologischen Zusammenhangs darstellt. Aus dieser Feststellung leitet Ohala (1983, 1984) die Verbindung zur Interrogativität ab. Betrachtet man Fragen wie im Sinne dieser Arbeit pragmatisch als implizite oder explizite Bitten um Informationen oder Bestätigung/Ablehnung so lassen sich als Glückensbedingungen unter anderem formulieren, dass der/die Sprecher/in davon ausgeht, dass der/die Hörer/in potenziell die Antwort weiß und damit der Bitte nachkommen könnte. Als zweite Bedingung lässt sich zumindest im typischen Fall annehmen, dass der/die Sprecher/in die Frage äußert, weil er/sie zum gegebenen Zeitpunkt die Antwort selbst nicht weiß (Searle 1976). Aufgrund dieser beiden Annahmen entsteht ein hierarchisches Gefälle zwischen den beiden Interaktant/innen in Bezug auf den angenommenen Wissensstand. Dieses bewusste Gefälle wird durch das Stellen der Frage erst etabliert. Der/die Sprecher/in übt folglich durch das Äußern der Frage aktiv die Tätigkeit aus, zu signalisieren, dass er/sie über ein gewisses Defizit in seinem Wissensstand verfügt, von dem er/sie ausgeht, dass der/die Hörer/in es nicht besitzt. Zugleich offenbart der/die Sprecher/in dieses Defizit nicht nur, er bittet den/die Hörer/in auch, sein/ihr Wissensdefizit durch das eigene Wissen aufzuheben. Es kommt also auf pragmatischer Ebene sowohl zu einer Unterordnung des/der Sprechers/in als auch zu einer Abhängigkeit vom Wissensstand des/der Hörers/in. Sowohl der Parameter der Unterordnung als auch jener der Abhängigkeit stehen gemäß dieser Interpretation in direktem Bezug zum Parameter der Interrogativität (Ohala 1983, 1984). Demzufolge drückt jede Frage pragmatisch zugleich eine Botschaft aus wie „Ich weiß die
Phonetische Merkmale von Fragen | 71
Antwort nicht. Ich glaube, du weißt die Antwort. Bitte hilf mir.“ Fragen stellen also eine Art pragmatischer Abhängigkeitserklärung dar. Nimmt man die Implikationen des frequency codes an, lässt sich diese sprachliche Universalie so betrachten, dass sich in den Sprachen der Welt eine Verbindung von Tonhöhe und Fragen in der Signalisierung von Dependenz, Subordination, Unsicherheit und/oder Überraschung auf pragmatischer Ebene auszeichnet. Damit ist jedoch zugleich festzustellen, dass der frequency code nicht Interrogativität im Sinne der kategorialen sprachlichen Funktion signalisiert, sondern eine kontinuierliche möglicherweise zugrundeliegende Sprechereinstellung, die damit in Verbindung steht. Gussenhoven (2002, 2004: 71ff) übernimmt das Konzept des frequency codes im Sinne Ohalas (1983) und erweitert dieses zu einem Set von drei biological codes. Weiterhin geht Gussenhoven davon aus, dass die Bedeutung der tonalen Struktur generell sprachspezifisch ist, die Bedeutung der phonetischen Realisierung jedoch über universelle typologische Merkmale verfügen kann. Dies deckt sich im Wesentlichen mit der Trennung von sprachlicher und parasprachlicher Ebene nach Ladd (2008: 34f). Zugleich beschreibt Gussenhoven (2002) die Möglichkeit des Übergangs von Parametern der einen Ebene in die andere. So können Aspekte der phonetischen Realisierung grammatikalisiert werden und sich im Laufe des Sprachwandels in tonalen Kategorien niederschlagen. Finale Anstiege in Fragen in den Sprachen der Welt sind demnach als sprachspezifische tonale Elemente zwar selbst keine sprachliche Universalie, können aber als Grammatikalisierungen eines gemeinsamen phonetischen Parameters betrachtet werden. So ließe sich das nahezu universelle Auftreten finaler Anstiege erklären, ohne die Trennung von phonetischer und phonologischer Ebene im Sinne der vorigen Erläuterungen aufgeben zu müssen (Gussenhoven 2002). Neben dem frequency code, den Gussenhoven (2002 204: 71ff) auch aus den oben skizzierten Gründen als size code bezeichnet, lassen sich noch zwei weitere biological codes als Metaphern intonatorischer Bedeutung herausstellen. Während der frequency code für die Signalisierung von Größe steht, steht der sogenannte effort code für die Signalisierung von energetischem Aufwand. Dieser Code soll unter anderem das Auftreten von mehr Tonhöhe in emphatischen Akzenten durch die ikonische Signalisierung von Nachdruck erklären. Der production code zuletzt erklärt das Heben und Senken der Grundfrequenz an den Äußerungsgrenzen. Die Idee des production codes geht bereits auf Lieberman (1967: 42) zurück, der breath groups im Sinne von sprachlichen Einheiten, die sich in einem Atemzug realisieren lassen, als Referenzgröße für die Sprechatmung postuliert. Hierüber erklärt Lieberman (1967: 42f) in erster Linie die typo-
72 | Forschungsstand
logische Universalie des finalen Falls als allgemeingültiges Signal des Abschlusses, sowie das phonetische Phänomen des final lowerings der Grundfrequenz am Ende einer Äußerung. Demnach geht das Ende einer Atemphase in der Regel mit dem Versiegen des Luftstroms und der Abnahme des subglottalen Drucks einher, was physiologisch zum Absinken der Grundfrequenz am Ende einer Äußerung beziehungsweise zur Erhöhung am Beginn einer neuen Atemphase führt (ebd.). Dieses Phänomen ist laut Bolinger (1978: 512) auch der Grund dafür, dass Kinder zuerst die fallende Intonation erwerben, obwohl seitens des Inputs steigende Intonation häufiger in kindgerichteter Sprache zu finden sei (vgl. auch Delack 1974). Gussenhoven (2002, 2004: 71ff) greift diese Idee auf und beschreibt, dass das bewusste Heben oder Senken der Grundfrequenz an den Äußerungsgrenzen suggerieren kann, dass eine Äußerung am Ende oder am Beginn einer Atemphase steht und dadurch vom/von der Sprecher/in zur thematischen Segmentierung der Gesprächsbeiträge genutzt werden kann. Demnach kann die Abgeschlossenheit eines Themas durch das Senken der Grundfrequenz am Ende der Intonationsphrase signalisiert werden. Im Gegenzug dazu stellt das Heben der Grundfrequenz am Ende einer Äußerung ein Markierungsmittel von Unvollständigkeit dar, da entgegen der Tatsache, dass die Intonationsphrase zu einem Ende gekommen ist, signalisiert wird, dass noch Energie zur Verfügung steht und der Beitrag damit nicht abgeschlossen ist. Ein wichtiger Aspekt der biological codes ist es, dass die auslösenden physiologischen Bedingungen für die Realisierung des Codes nicht gegeben sein müssen. Für den frequency code erscheint dies naheliegend, doch bedeutet es zugleich für den effort code, dass mehr Tonhöhe nicht mit mehr energetischem Aufwand und für den production code, dass das Senken der Grundfrequenz nicht durch Versiegen des subglottalen Drucks begründet sein muss, solange der auditive Effekt der gleiche ist (ebd.). Die Existenz einer Form des finalen Anstiegs, die auf globaler Ebene, wie in Kapitel 2.1.4 gezeigt wurde, zumindest bis zu einem gewissen Grad eine interpretationsbeeinflussende Markierungsfunktion für Interrogativität übernehmen kann, stellt die Wirksamkeit der biological codes vor eine wesentliche Frage. Während der frequency code das Auftreten von mehr Tonhöhe in Fragen erklären soll, soll der production code das Auftreten von phrasenfinaler Tonhöhe in abhängigen beziehungsweise unvollständigen Aussagen erklären, die, wie in Kapitel 2.1.1 gezeigt wurde, ebenfalls typologisch mit finalen Anstiegen assoziiert werden (vgl. Hirst & di Cristo 1998: 24f). Ein finaler Anstieg kann folglich sowohl auf eine Realisierung des production codes zur Signalisierung von Unvollständigkeit als auch auf eine Manifestation des frequency codes zur Signali-
Phonetische Merkmale von Fragen | 73
sierung von Unsicherheit, Abhängigkeit oder sekundär Interrogativität zurückzuführen sein. Auf der einen Seite liefert dies eine Erklärung dafür, warum diese beiden Parameter im Deutschen so schwer auseinanderzuhalten sind, wie Kapitel 2.1 gezeigt hat. Auf der anderen Seite lässt sich jedoch fragen, ob der finale Anstieg überhaupt eine Ausprägung des frequency codes darstellt, da in Kapitel 2.1.4 gezeigt werden konnte, dass auch das Merkmal der Unvollständigkeit eine Erklärung für das Auftreten in Fragen liefern kann. Unabhängig davon, welcher biological code als Ursache für die Grammatikalisierung finaler Anstiege im Deutschen angenommen wird, lässt sich fragen, ob die Tatsache, dass eine solche Grammatikalisierung existiert, das weitere Wirken des gleichen oder der anderen biological codes blockiert. Evidenz zur Beantwortung dieser Fragen soll in den nächsten Kapiteln herausgearbeitet sowie ausführlich vor dem Hintergrund der Ergebnisse des empirischen Teils diskutiert werden. Generell kann jedoch bereits vermutet werden, dass das Merkmalspaar vollständig versus unvollständig des production code aufgrund seiner kategorialen Natur generell besser für die Grammatikalisierung in der tonalen Struktur geeignet ist als das Kontinuum von smallness versus largeness. Wenn der finale Anstieg als tonale Struktur eine Grammatikalisierung des production codes darstellt, schließt dies jedoch nicht die Möglichkeit aus, dass sich der frequency code weiterhin in der Exkursion des finalen Anstiegs oder anderen phonetischen Variationen der Kontur ausprägen und somit den möglichen Beitrag zur Spezifizierung des finalen Anstiegs leisten kann.
2.2.2 Phonetische Merkmale von Fragen im typologischen Überblick In Kapitel 2.2.1 wurde gezeigt, dass Ausprägungen des frequency codes nicht nur in einer Form des finalen Anstiegs, sondern in einer Vielzahl phonetischer Faktoren angenommen werden können. In den folgenden beiden Kapiteln sollen die konkreten phonetischen Parameter herausgearbeitet werden, die in bisherigen Untersuchungen mit Fragen in Verbindung gebracht wurden. Hierdurch sollen unter anderem die für die anschließende empirische Untersuchung zu erwartenden Messvariablen ermittelt werden. Dieses Kapitel gibt einen generellen Überblick über die phonetischen Variationsmöglichkeiten, die für die Sprachen der Welt mit Fragen in Verbindung gebracht werden und sich prinzipiell auf das Deutsche übertragen lassen. Dabei liegt im Anbetracht der Vielfalt an einzelsprachspezifischen Nuancen der phonetischen Realisierung, häufig schon durch Unterschiede im Beschreibungsmodell begründet, der Fokus auf wiederkehrenden Parametern. Zwei Arbeiten sollen des Weiteren besonders hervorge-
74 | Forschungsstand
hoben werden: Zum einen die Untersuchung von Haan (2002) zu phonetischen Aspekten der Frageintonation im Niederländischen, die methodisch maßgeblich der Orientierung für die vorliegende Arbeit dient und deren Ergebnisse eine besondere Relevanz aufgrund der Nähe des niederländischen Intonationssystems zu dem des Deutschen besitzen (Peters, Michalsky & Hanssen 2012). Zum anderen die Untersuchung von Chen (2005) zu typologischen Universalien in der parasprachlichen Intonation, unter anderem zur Wahrnehmung von Interrogativität, die einen wesentlichen Beitrag zum Fragehaltigkeitskonzept liefert, das in Kapitel 2.1 eingeführt wurde und im empirischen Teil weiterentwickelt und gestützt werden soll. Eine wichtige Unterscheidung unter den festgestellten phonetischen Parametern ist, ob diese über Produktions- oder Perzeptionsexperimente erhoben wurden. Während Effekte aus Produktionsexperimenten nur eingeschränkt Aussagen darüber erlauben, inwieweit diese perzeptiv und kommunikativ relevant sind, lassen die Perzeptionsexperimente alleine noch keine Aussage darüber zu, ob die festgestellten Parameter in der entsprechender oder überhaupt einer Sprache Verwendung finden. Da der primäre Fokus dieser Arbeit im experimentellen Teil auf der Produktion liegt, konzentriert sich die folgende Darstellung zuerst auf die Produktionsebene. Die Perzeptionsebene wird im Rahmen der Perzeptionsexperimente in Kapitel 6-8 erläutert und diskutiert. Erhöhung der Grundfrequenz am Äußerungsbeginn Die erste mögliche Position einer intonatorischen Markierung stellt der f0Onset, also der erste Wert der Grundfrequenz am Beginn der Äußerung dar. De Moraes (1998) findet für das brasilianische Portugiesisch Belege dafür, dass Fragen mit einem höheren Anfangswert realisiert werden als vergleichbare Aussagen, auch wenn diese zudem über einen finalen Anstieg unterschieden werden. Für das Finnische hingegen beschreibt Iivonen (1998) den finalen Anstieg als selten und fremdartig, wodurch Fragen und Aussagen generell mit der gleichen fallenden nuklearen Kontur realisiert werden. Dabei weisen die Fragen jedoch ebenfalls einen deutlich höheren initialen f0-Wert auf. Ähnlich werden die Verhältnisse für das marokkanische West-Arabisch beschrieben, in dem Fragen und Aussagen mit dem gleichen steigend-fallenden finalen Akzentmuster realisiert werden, der f0-Anfangswert in Fragen jedoch durchschnittlich 3,5 und mindestens zwei Halbtöne höher liegt als in Aussagen (Benkirane 1998).
Phonetische Merkmale von Fragen | 75
Erhöhung des nuklearen Akzentgipfels In einigen Beschreibungen zur Frageintonation findet sich der Begriff des final rise synonym sowohl für einen Anstieg bis zum Phrasenende als auch für den letzten Anstieg am Ende der Phrase, selbst wenn dieser von einem Fall gefolgt wird (z. B. im Rumänischen; Dascǎlu-Jinga 1998). In Sprachen mit einem tiefen finalen Grenzton ist dieser letzte Anstieg in der Regel der nukleare Akzentgipfel (zum Beispiel im Finnischen (Iivonen 1998) oder marokkanischen WestArabisch (Benkirane 1998)). Ob diese unterschiedlichen Skalierungen der letzten steigenden Tonhöhenbewegung den gleichen Status haben, kann anhand der Datenlage nicht beantwortet werden. Es lässt sich jedoch feststellen, dass die Erhöhung des nuklearen Akzentgipfels bei sonst identischer tonaler Struktur ein häufiges Markierungsmittel von Interrogativität darstellt. Für das Niederländische findet sich die Beschreibung dieses Phänomens bereits in frühen Betrachtungen bei Van Es (1932). Dies konnte sich in neueren Untersuchungen bei Haan (2002: 219), wie später näher erläutert wird, bestätigen. Für das Schwedische wird generell angenommen, dass sich abseits des finalen Anstiegs phonetische Effekte von Interrogativität im Verlauf der Dachlinie zeigen, die eine hypothetische Linie durch die Tonhöhenmaxima über eine Äußerung hinweg beschreibt (Gårding 1998). Eine genauere Betrachtung der von Gårding (1998) präsentierten Daten lässt jedoch vermuten, dass der Dachlinienverlauf eventuell keinen primären Parameter darstellt, sondern sich aus der Variation in der Tonhöhe des nuklearen Gipfels ergibt, wie auch Haan (2002: 218) für das Niederländische anführt. Für das Finnische gibt Iivonen (1998) an, dass Interrogativität sich generell auch als eine Form von Expressivität auffassen lässt. Demnach ist auch ein Indiz von Interrogativität eine höhere Auslenkung der nuklearen Tonbewegung. Und auch für das Russische lassen sich höhere nukleare Gipfel neben einem erhöhten Sprechtempo als Markierungsmittel von Fragen finden (Svetozarova 1998), wobei diese nicht nur als höher, sondern auch als schmaler beschrieben werden. Zuletzt führt die Hebung des gesamten Melodieverlaufs vom Onset bis zum Offset im marokkanischen West-Arabisch auch zu einer wesentlichen Erhöhung der nuklearen Tonhöhenakzente der mit tiefem Grenzton realisierten Konturen von Fragen (Benkirane 1998). Erhöhung des finalen Anstiegs Die Erhöhung des finalen Anstiegs als phonetischer Parameter ist im Deutschen und intonatorisch verwandten Sprachen wie dem Englischen oder Niederländischen nur sehr schwer von der Erhöhung des nuklearen Tonhöhenakzents zu isolieren. Häufig erfährt die phonetische Realisierung dieses tonalen Abschnitts keine gesonderte Betrachtung, da der Anstieg selbst bereits als Frageindikator
76 | Forschungsstand
klassifiziert wird (s. Kapitel 2.1.1). Hinzu tritt die Frage, ob ein höherer finaler Anstieg im Falle einer zweifach-steigenden Kontur (L*H H% / GToBI: L*H-^H%) auf eine Erhöhung des finalen Grenztons, eine Erweiterung des nuklearen Akzents, wie im letzten Kapitel beschrieben, oder auf eine Erweiterung der pitch range im nuklearen Abschnitt zurückzuführen ist. Einige phonetische Anmerkungen zur Skalierung des finalen Anstiegs finden sich schon in früheren Beschreibungen zur Intonation des Englischen. So schreibt bereits Palmer (1922: 78f), dass der finale Anstieg zum Ausdruck der Unvollständigkeit von Aussagen sowohl in Form eines low rise als auch eines high rise auftreten kann, während Entscheidungsfragen nur mit einem high rise realisiert werden können. Kingdon (1958: 213f) gibt ebenfalls den low rise als typisches Merkmal von fortgesetzten Aussagen im Kontrast zum high rise von Entscheidungsfragen an. Bolinger (1978: 513) führt seine Behauptung, dass der finale Anstieg eine sprachliche Universalie sein könnte, maßgeblich auf dessen Parasprachlichkeit zurück, die sich dabei aus der graduellen Skalierbarkeit ergäbe. Und auch Hirst (1998: 63) gibt vergleichbar mit Palmer (1922: 78f) und Kingdon (1958: 213f) an, dass sich im britischen Englisch ein Unterschied im finalen Anstieg zur Markierung von unvollständigen Aussagen durch einen low rise und Entscheidungsfragen durch einen high rise findet. Der Unterschied zwischen einem low rise in Aussagen und einem high rise in Fragen wird auch für das Kiswahili angenommen (Hetland & Molnár 1995:23). Auch zum Französischen lässt sich eine lange Tradition der Erforschung phonetischer Unterschiede unter anderem auch von Fragen und fortgesetzten Aussagen feststellen (zum Überblick vgl. di Cristo 1998: 202). Dabei unterscheidet sich der finale Anstieg in Fragen von dem in fortgesetzten Aussagen durch eine größere Exkursion, einen höheren Zielpunkt und einen steileren Anstieg (ebd.). Ähnlich verhält es sich auch im Russischen (Svetozarova 1998), wo in selteneren Fällen Entscheidungsfragen entgegen der häufigeren fallenden nuklearen Kontur mit einem finalen Anstieg und somit tonal identisch mit bestimmten Typen fortgesetzter Aussagen auftreten können. Auch hier kann Svetozarova (1998) feststellen, dass der finale Anstieg in Fragen sich dabei vom finalen Anstieg in Aussagen durch eine größere Exkursion unterscheidet. Neben dem Vergleich des finalen Anstiegs von vollständigen Entscheidungsfragen und abhängigen Aussagen gibt es eine Handvoll Untersuchungen, die sich mit der Frage befassen, ob sich bereits der Anstieg in Alternativfragen als question rise beschreiben und vom reinen continuation rise unterscheiden lässt. Es wurde im bisherigen Verlauf der Arbeit darauf hingewiesen, dass zumindest für das Englische und Deutsche die Konsensmeinung existiert, dass sich der finale Anstieg der ersten Intonationsphrase von abhängigen Aussagen und Alternativfragen nicht unterscheidet (vgl. Bolinger 1989: 114, Gibbon 1998,
Phonetische Merkmale von Fragen | 77
Hirst 1998, Haan 2002: 20). Als Gegenbelege im Deutschen wurden unter anderem von Essen (1964: 44) und Brinkmann (1971: 513) angeführt. Zusätzliche Gegenbelege liefert unter anderem Fónagy (1998) sowohl für das Französische als auch das Ungarische. Fónagy (1998) gibt an, dass französische Muttersprachler ohne Kenntnis der ungarischen Sprache in der Lage waren, fortgesetzte Aussagen von Alternativfragen zu unterscheiden und umgekehrt. Für das Ungarische ist dies primär darauf zurückzuführen, dass Alternativfragen an der Phrasengrenze mit einem Anstieg realisiert werden können, was für fortgesetzte Aussagen ausgeschlossen ist. Jedoch auch wenn beide Äußerungstypen fallen, kann festgestellt werden, dass der Fall innerhalb von Alternativfragen an einem höheren Zielpunkt endet. Dies ist zwar nicht identisch mit den Unterschieden in der Höhe des finalen Anstiegs, jedoch durch den Bezug auf die Implementierung des finalen Grenztons vergleichbar. Eine solche Erhöhung des tiefen finalen Grenztons beziehungsweise des f0Offsets findet sich unter anderem im brasilianischen Portugiesisch und im marokkanischen West-Arabisch. Benkirane (1998) stellt für das marokkanische West-Arabisch fest, dass das Register und der Tonhöhengipfel in Fragen soweit angehoben werden, dass der finale Fall, obwohl in seiner Exkursion größer als in Aussagen, niemals das gleiche tiefe Endniveau erreicht. Diese Beschreibung findet sich auf einem vergleichbaren final steigend-fallenden Muster auch im Bengali (Hayes & Lahiri 1991:65). Nicht klar zuzuordnen ist wie erwähnt die phonetische Realisierung in Sprachen wie dem Rumänischen oder dem Ungarischen. Die Intonation des Rumänischen oder Ungarischen ist durch eine steigend-fallende Tonhöhenbewegung auf der letzten betonten Silbe gekennzeichnet (Dascǎlu-Jinga 1998; Fónagy 1998). Wenn die letzte betonte Silbe gleichzeitig die letzte Silbe der Phrase ist, kann der Melodieverlauf trunkiert werden und damit formgleich mit einem finalen Anstieg realisiert werden. Folgen weitere Silben, fällt die Melodie zum Ende der Phrase ab. Zugleich muss die letzte betonte Silbe nicht akzentuiert sein, sodass die nukleare Akzentsilbe nicht mit dem finalen Tonhöhengipfel zusammenfällt. Für das Rumänische kann festgestellt werden, dass der letzte Tiefton vor der letzten steigend-fallenden Bewegung in Fragen gesenkt wird. Dies kann möglicherweise als Mittel interpretiert werden, die Auslenkung der finalen Tonhöhenbewegung zu erweitern (Dascǎlu-Jinga 1998). Ob dies mit der Skalierung des ‚echten‘ finalen Anstiegs wie im Englischen oder dem Tonhöhengipfel wie im Finnischen vergleichbar ist, kann hier nicht beantwortet werden.
78 | Forschungsstand
Erweiterung des Tonhöhenumfangs (pitch range) Wie schon im Falle der letzten beiden Parameter lässt sich auch die Erweiterung des Tonhöhenumfangs (pitch range) teilweise nur schwer von der Erhöhung des nuklearen Tonhöhengipfels oder des finalen Anstiegs trennen, da die pitch range als Abstand zwischen dem tiefsten und dem höchsten Punkt des f0Verlaufs beschrieben wird und diese maßgeblich von der nuklearen Region abhängig sind. Der wesentliche Unterschied besteht darin, dass eine Erweiterung der pitch range als Ganzes eine höhere Skalierung aller Tonhöhenbewegungen in der Äußerung beschreibt. In den meisten Betrachtungen wird die Ermittlung der pitch range allerdings nicht gesondert für pränukleare Akzente durchgeführt und damit vom Einfluss der nuklearen Region getrennt. Wenn nicht explizit angegeben, ist es demnach gut möglich, dass einige der hier beschriebenen Feststellungen zur pitch range Erweiterung unter einen der ersten beiden Aspekte fallen und umgekehrt. Ebenfalls problematisch ist, dass pitch range einen funktional stark belasteten parasprachlichen Parameter darstellt. Die Erweiterung der pitch range wird für diverse Emotionen und Sprechereinstellungen wie Wut, Unsicherheit oder Freude als essenzielles Merkmal angesetzt (Scherer, Ladd & Silverman 1984, Ladd, Silverman, Tolkmitt, Bergmann & Scherer 1985), sodass hier gerade in konversationellen Daten ein starker Einfluss externer Variation zu erwarten ist. Eine Erweiterung der pitch range in Fragen gegenüber Aussagen wird unter anderem für das Dänische angegeben, das, neben einer im Folgenden beschriebenen Unterlassung von Deklination, unakzentuierte Hochtöne in Fragen höher skaliert (Grønnum 1992, 1995, 1998b). Auch im Bengali finden sich in lexikalisch und syntaktisch identischen Aussage-Frage-Minimalpaaren mit identischer steigend-fallender Kontur Fragen mit einer relativ größeren pitch range (Hayes & Lahiri 1991:65). Während sich die ersten beiden Parameter vorwiegend in Intonationssprachen finden lassen, da das Konzept der nuklearen Kontur nicht ohne Weiteres auf Tonsprachen übertragbar ist und auch der finale Anstieg sich in Tonsprachen aufgrund der Konkurrenz mit lexikalischen Tönen nicht immer vergleichbar ausgeprägt ist, stellt die Erweiterung der pitch range eine auch in Tonsprachen häufig auftretende Fragemarkierung dar. Untersuchungen unter anderem zum Hausa zeigen, dass Fragen von Aussagen über die Erhöhung des letzten lexikalischen Hochtons unterschieden werden können (Lindsey 1985: 105; Inkelas & Leben 1990: 18). Auch im Chengdu-Chinesischen lassen sich Unterschiede in der Realisierung bestimmter Toneme in Abhängigkeit von der Funktion einer Äußerung als Frage oder Aussage feststellen (Ladd 2008: 158f).
Phonetische Merkmale von Fragen | 79
Registerhöhe Unter Erhöhung des Registers ist zu verstehen, dass die melodische Realisierung einer Äußerung eine andere Position im tonalen Bezugsraum des/der Sprechers/in einnimmt. Folglich werden alle Hoch- und Tiefpunkte höher realisiert, ohne dabei jedoch das stimmliche Register8 zum Beispiel vom Brust- in das Falsettregister zu wechseln. Da die Höhe des Registers neben der Erfassung über Regressionslinien (Haan, van Heuven, Pacilly & van Bezooijen 1997) häufig äquivalent zur Dachlinie über eine Basislinie und damit die Tiefpunkte des Melodieverlaufs ermittelt wird, zeigen sich auch hier Überschneidungspunkte mit den zuvor beschriebenen Parametern. Durch die kontinuierliche Deklination des Melodieverlaufs stellt der tiefe nukleare Akzentton zweifach-steigender Konturen häufig den tiefsten Punkt der Äußerung und damit auch den Referenzpunkt für das tonale Register dar. Eine Senkung des Registers steht daher in solchen Fällen in unmittelbarer Korrelation zu einer Erweiterung der pitch range der nuklearen Region, des finalen Anstiegs oder der Gesamtäußerung. Dies ist in den folgenden Ansätzen zur Registererhöhung zu berücksichtigen, da sich häufig keine Spezifizierung des Registerbegriffs findet. Die Vagheit der Begrifflichkeit findet sich beispielhaft bei de Moraes (1998: 184), der für das brasilianische Portugiesisch „average higher pitch“ angibt oder bei Gårding (1998), die für das Schwedische ein generelles „shifting up“ der Sprechmelodie beschreibt. Spezifischer beschreibt es Benkirane (1998: 354) für das marokkanische West-Arabisch, in dem die Erhöhung des Registers neben der bereits beschriebenen Anhebung des Tonhöhengipfels und der Grenztöne auch durch eine Erhöhung aller Tiefpunkte beschrieben wird. Vergleichbare Befunde finden sich unter anderem erneut für das Finnische (Iivonen 1998: 319), in schwacher Ausprägung nach Geluykens (1988: 477) sowie Hirst (1998) für das britische Englisch, sowie nach Brown, Currie und Kenworthy (1980: 59) für das schottische Englisch Edinburghs. Des Weiteren finden sich Indizien für das Mandarin Chinesische (Shen 1990: 25), das Vietnamesische und das Thailändische (Hirst & di Cristo 1998: 25), das Cherokee (Lindsey 1985: 144), das Hausa (Inkelas & Leben 1990: 18), das Chichewa (Myers 1999), das Chickasaw (Gordon 1999) und das Sango (Ultan 1969: 46).
|| 8 Für detailliertere Informationen zur innerhalb der Arbeit verwendeten Differenzierung der Registerbegriffe vgl. Peters (2014: 38f).
80 | Forschungsstand
Aufgabe von Abwärtstrends Suspension of downtrends beschreibt keinen einheitlichen Parameter, sondern eine Klasse von Merkmalen. Eines dieser Merkmale bezieht sich auf den akzentuellen downstep. In seiner ursprünglichen Form stammt das Konzept des downstep aus der Beschreibung von Tonsprachen und meint das sukzessive und obligatorische Herabstufen von Hochtönen im Verlauf der Äußerung (vgl. Clements 1979, Pierrehumbert 1980). Dabei kann für einige Tonsprachen festgestellt werden, dass dieser Abwärtstrend in Fragen systematisch unterbleibt zum Beispiel im Hausa (Inkelas & Leben 1990), im Zulu (Clements 1990: 69) oder auch im Chichewa (Myers 1999). Für Intonationssprachen wird die Herabstufung von Tonhöhenakzenten nicht (mehr) als obligatorische phonologische Regel, sondern als semantisch bedeutsame Modifikation angenommen (Gussenhoven 2004: 100, Ladd 2008: 147, Peters 2014: 40). Deklination im Sinne eines regulären Abwärtstrends findet sich in Intonationssprachen im graduellen Abfallen der Basislinie im Verlauf der Äußerung (Gussenhoven 2004: 98f, Ladd 2008: 16, Peters 2014: 40). Bruce und Gårding (1978) stellen für das Dänische fest, dass die Deklination in Fragen unterbleiben und bis zu einer ebenen Basislinie führen kann (vgl. auch Thorsen 1980, 1985, Grønnum 1992, 1995, 1998a, b). Dies ist hervorhebenswert, da bis heute noch nicht abschließend geklärt ist, ob Deklination überhaupt unter bewusster Kontrolle des/der Sprechers/in liegt (Gussenhoven 2004: 97ff). Vergleichbare Annahmen finden sich bei Gooskens und van Heuven (1995) auch für das Niederländische (vgl. Cohen, Collier & ‘t Hart 1982; Liberman & Pierrehumbert 1984; Thorsen 1985, 1986; Van Den Berg et al. 1992 und Sluijter & Terken 1993) sowie bei Vaissière (1983: 57) für das Französische und das Russische. Ausrichtung tonaler Zielpunkte (Alignierung) Neben den in Übereinstimmung mit dem frequency code vorgefundenen Skalierungseffekten kann die phonetische Realisierung jedoch nicht nur im Frequenzbereich, sondern auch im Zeitbereich variieren. Auf den ersten Blick liegt die Vermutung nahe, dass Alignierungseffekte zur Signalisierung von Interrogativität, wenn sie sich finden lassen, sprachspezifische Eigenarten darstellen, da eine Anbindung an den frequency code oder eine andere typologische Erklärung nicht unmittelbar naheliegt. Es lässt sich jedoch Evidenz finden, dass hohe Gipfel bei gleichem Anstiegsgrad eine längere Zeit benötigen und daher tendenziell mit späteren Gipfeln korrelieren, weshalb vermutet wurde, das späte Gipfel hohe Gipfel substituieren könnten (vgl. Gussenhoven & Chen 2000, Gussenhoven 2004: 90f, Chen 2005: 60). Hierfür sprechen die Ergebnisse von Peters (2002) zum hamburgischen Dialekt des Deutschen, für welchen spätere Gipfel
Phonetische Merkmale von Fragen | 81
zur Signalisierung des engen FokusFehler! Textmarke nicht definiert. gefunden wurden, der im Deutschen tendenziell durch höhere Gipfel ausgedrückt wird. Dies deckt sich unter anderem mit dem Befund nach Kohler (1987) und Niebuhr und Kohler (2004), die dem späten Gipfel das Bedeutungsmerkmal von überraschter oder unerwarteter Information zuordnen und auch von Petrone und Niebuhr (2014), die einen hohen Effekt von Überraschung bei späten pränuklearen Gipfeln feststellen können, obwohl das Merkmal der Überraschung tendenziell eher ein Skalierungsphänomen darstellt (Gussenhoven & Rietveld 1997). In einem Perzeptionsexperiment kann Makarova (1999) feststellen, dass Muttersprachler/innen des Japanischen und Russischen unter anderem späte Gipfel eher interrogativen Äußerungen zuordnen. Dies kann auch Chen (2005: 60) für Muttersprachler/innen des Ungarischen, Mandarin Chinesischen und Niederländischen feststellen. Braun (2005: 116ff) hingegen liefert experimentelle Belege zum Deutschen, die gegen eine Korrelation zwischen hohen und späten Gipfeln in der Produktion sprechen, sodass späte Gipfel als Fragemarker zumindest für das Deutsche eventuell eher für die Perzeption als für die Produktion relevant sind (vgl. Petrone & Niebuhr 2014). Zur Produktion sprechen Misheva und Nikov (1998) bei der Realisierung von Tonhöhengipfeln im Bulgarischen in interrogativen Äußerungen von einer progressiven Kraft, die systematisch zu einer späteren Realisierung von Gipfeln führt, sofern nachfolgende Silben dies zulassen. Für die südlichen Varietäten des Italienischen konnten Grice (1995), Grice und Savino (1997) sowie d’Imperio (1997) zeigen, dass sich Aussagen und Fragen wesentlich durch die Gipfelalignierung unterscheiden. Gemäß der Autor/innen sind diese Unterschiede so groß und systematisch, dass hierfür zwei unterschiedliche tonale Repräsentationen statt einer Verschiebung der phonetischen Alignierung gewählt wurden. Baltazani (2006) und Baltazani et al. (2015) liefern zudem Evidenz, dass Alignierung im Griechischen einen Beitrag zur Markierung über die späte Ausrichtung pränuklearer Gipfel leisten kann. Form der Transitionen (shaping) Ein weiteres Merkmal, das bisher einen sehr marginalen Status in den gängigen Betrachtungen von Intonation eingenommen hat, ist das der konkreten Form der Transitionen zwischen tonalen Zielpunkten. Während im Rahmen des AMModells vereinfacht von einem linearen Übergang zwischen den tonalen Zielpunkten ausgegangen wird (Peters 2014: 25), konnten unter anderem Dombrowski und Niebuhr (2005, 2010) Evidenz dafür liefern, dass unterschiedliche Transitionsformen zwischen den Zielpunkten wie ein konvexer oder konkaver Verlauf einen Einfluss auf die Diskursinterpretation von Äußerungen
82 | Forschungsstand
ausüben können. Dabei argumentieren die Autoren dafür, dass ein konkaverer Verlauf tendenziell eine Interpretation als interrogativ begünstigen kann, wie in Kapitel 2.2.3 am Beispiel des Deutschen ausführlicher diskutiert wird. Eine Relevanz des shapings für die Markierung von Interrogativität wurde außerhalb des Deutschen bisher nur für das Französische postuliert. So nimmt Delattre (1966a, zitiert nach di Cristo 1998) einen Unterschied zwischen konvexem und konkavem Verlauf im finalen Anstieg zwischen Fragen und fortgesetzten Aussagen an. Laut Roméas (1992, zitiert nach di Cristo 1998) konnte sich dies jedoch nicht bestätigen. Es lassen sich zwar Unterschiede in den Transitionen ermitteln, diese sind im Französischen jedoch nicht für die Markierung sprachlicher Funktionen wie Interrogativität relevant (vgl. di Cristo 1998: 202). Abschließend lässt sich feststellen, dass in einigen der dargestellten Sprachen mehr als nur ein möglicher Parameter zur Markierung von Interrogativität angenommen wird. Gemäß Lindsey (1985: 49) lässt sich annehmen dass gerade intonatorisch reiche Sprachen mehr als nur einen einzigen high-pitched cue verwenden, um Interrogativität zu signalisieren. Folglich ist es nicht nur möglich, sondern eventuell sogar erwartbar, dass eine Sprache mehr als nur eine einzige phonetische Markierungsmöglichkeit nutzt. In ihrer Dissertation untersucht Haan (2002) die Realisierung von Frageintonation im Niederländischen hinsichtlich der Frage, ob Interrogativität systematisch mit intonatorischen Merkmalen korrespondiert und ob diese eher auf phonologischer, phonetischer oder beiden Ebenen zu finden sind. Zugleich untersucht Haan (2002) ob sich unterschiedliche Fragetypen (Entscheidungsfragen vs. W-Fragen vs. Deklarativfragen) je nach Grad der Markierung auf anderen sprachlichen Ebenen intonatorisch differenzieren lassen. Zuletzt schließt sie auch den Einfluss des Sprechergeschlechts in die Betrachtung ein. Haans (2002) Befunde basieren auf einem Leseexperiment zur Elizitation intonatorischer Prototypen. Hierzu wurden die zwei Ausgangssätze, „Peter heeft noch wat vlees over“ (Übersetzung: Peter hat noch etwas Fleisch übrig.) und „Marina will har Mandoline verkopen“ (Übersetzung: Marina will ihre Mandoline verkaufen.), verwendet und neben der gegebenen Struktur als Aussagesatz in die drei Fragetypen W-Fragen, Entscheidungsfragen und Deklarativfragen überführt. Diese wurden mit zwei unterschiedlichen Kontextsätzen gekoppelt, um syntagmatische Effekte in der Abfolge von Intonationsphrasen mitzuuntersuchen. Zehn Proband/innen (fünf Männer und fünf Frauen) erhielten die Anweisung, die Testsätze in einer natürlichen Art und Weise zu lesen. Das Material enthielt keine Filler. Die Sätze wurden in eine randomisierte Reihenfolge ge-
Phonetische Merkmale von Fragen | 83
bracht und zweimal präsentiert. Jeweils einer der zwei Durchläufe pro Proband/in wurde dabei mit umgekehrter Folge präsentiert, um einen Ordnungseffekt auszuschließen. Das Experiment wurde bewusst als Lesestudie konzipiert, um einen hohen Grad an Explizitheit zu gewährleisten und so zu untersuchen, welche intonatorischen Formen prototypisch mit interrogativen Äußerungen des Niederländischen assoziiert werden. Im Sinne des frequency codes besteht Haans (2002) Hypothese darin, dass sich auch im Niederländischen Fragen von Aussagen durch mehr Tonhöhe an einer Stelle der Äußerung auszeichnen. Zur phonologischen Struktur von Fragen kommt Haan (2002: 224) anhand empirischer Befunde zu einem vergleichbaren Ergebnis wie in Kapitel 2.1.1: Weder im nuklearen noch im pränuklearen Bereich lassen sich systematische Unterschiede in der Wahl des Akzenttyps feststellen. Auch im Niederländischen kann, je nach pragmatischem Kontext, eine Frage mit den gleichen tonalen Strukturen ausgedrückt werden wie eine Aussage. Dabei stellt Haan (2002: 160f) allerdings fest, dass tone-linking, also das Tilgen eines tiefen Folgetons zwischen zwei Hochtönen, tendenziell häufiger in Fragen auftritt als in Aussagen und so einen längeren Abschnitt höherer Tonhöhe erzeugt. Des Weiteren findet auch Haan (2002: 112) ein 100%iges Auftreten von hohen finalen Grenztönen in Deklarativfragen und tiefen finalen Grenztönen in Aussagen. Entscheidungsfragen finden sich nur in zwei Ausnahmefällen mit tiefem Grenzton. W-Fragen werden zu 70 % mit einem hohen Grenzton realisiert und bewegen sich somit in einem Zwischenbereich. Der Zusammenhang von Prototypizität und finalem Anstieg, der in Kapitel 2.1.4 für den Sprechstil eines Leseexperiments angenommen wurde, findet sich folglich auch hier bestätigt. In der phonetischen Analyse betrachtet Haan (2002: 42ff) die Gesamtheit möglicher phonetischer Parameter, die in Abhängigkeit von Interrogativität variieren können, wie sie unter anderem im vorhergehenden Kapitel dargestellt wurden. Untersucht werden im speziellen: 1) die Höhe des finalen Anstiegs, 2) die Höhe pränuklearer und nuklearer Akzenttöne, 3) die Höhe der Grundfrequenz am Äußerungsbeginn, 4) die Registerhöhe und 5) der globale Trend. Zur Messung des globalen Trends greift Haan (2002: 65) dabei nicht wie methodisch oft üblich auf visuelle Abstraktion zurück, sondern errechnet drei Regressionslinien. Die erste Regressionslinie erfasst dabei den generellen Verlauf der Äußerung über eine all-points-linear-regression line. Die zweite Linie stellt die Basislinie oder bottomline dar, die aus den Messpunkten unterhalb der mittleren Regressionslinie erstellt wird, die dritte Linie stellt die Dachlinie oder topline dar, die aus den Messpunkten oberhalb der mittleren Regressionslinie errechnet wird. Der Verlauf der oberen und unteren Linie geben dabei zwar nur den Ver-
84 | Forschungsstand
lauf von 50 % der Messpunkte wieder, schließen dabei jedoch zugleich Extremwerte aus. Zur Vergleichbarkeit dieser globalen Trendlinien gibt Haan (2002: 65) die Notwendigkeit der Exklusion des finalen Anstiegs an. Dies ist im Niederländischen möglich, da sowohl die steigenden als auch die fallenden Konturen einen gemeinsamen L-Folgeton vor dem Grenzton besitzen. Für das Deutsche ist dies nicht ohne weiteres möglich, da die typische steigende Kontur deutscher Fragen die zweifach-steigende und nicht fallend-steigende darstellt (vgl. Kapitel 2.1.1). Besonders Hervorzuheben ist an Haans (2002: 54) Arbeit außerdem die Untersuchung möglicher geschlechterspezifischer Unterschiede in der phonetischen Realisierung von Interrogativität. Gemäß van Bezooijen (1995) ist ein Unterschied zwischen Frauen und Männern in der phonetischen Realisierung von Fragen sowohl aus anatomischen als auch aus kulturellen Gründen möglich. Anatomisch verfügen Frauen über kürzere Stimmlippen, sodass das Schwingungsverhalten sich tendenziell unterscheidet. Dies hat möglicherweise einen Einfluss auf Exkursionen der Sprechmelodie, in jedem Fall jedoch auf die generelle Lage des Registers. Aus kultureller Sicht seien Frauen in ihrem kommunikativen Verhalten involvierter und stärker hörerorientiert, sodass sich ein höherer Grad an Expressivität und Variation erwarten ließe. Diese tendenziell größere Bereitschaft zur Kommunikation und Interaktion könnte sich daher in einer stärkeren Markierung von Fragen als prototypisch interaktiver Gesprächshandlung abzeichnen. Auch Gussenhoven (2002) gibt an, dass sich geschlechtsspezifische Unterschiede evolutionär bedingt aufgrund der höheren Notwendigkeit der Signalisierung von Dominanz bei männlichen Individuen ausgeprägt haben. Daher untersucht Haan (2002) geschlechtsspezifische Variation in der phonetischen Realisierung vor allem des Tonhöhenumfangs sowohl global als auch lokal sowie der Registerhöhe. Generell kann Haan (2002: 213ff) feststellen, dass die tonalen Tiefpunkte in allen Fragetypen signifikant über den Realisierungen tonaler Zielpunkte in Aussagen liegen, sodass daraus geschlossen werden kann, dass die Basislinie und damit das Register höher liegt. Als weiterer maßgeblicher Parameter fungiert das sogenannte postnuclear low, also der letzte tiefe Folgeton zwischen dem hohen Akzentton und dem hohen Grenzton. Dieser wird in Fragen bedeutend höher realisiert als in Aussagen. Dies führt Haan (ebd.) allerdings weniger auf ein eigenes phonetisches Kriterium, sondern auf einen Effekt des hohen finalen Grenztons zurück. Demnach sei das Artikulieren eines Anstiegs motorisch generell schwieriger als das Artikulieren eines Falls, weswegen der tiefe Folgeton vor dem Anstieg in Antizipation des folgenden Anstiegs höher realisiert würde. Dies soll an dieser Stelle deshalb besonders hervorgehoben wer-
Phonetische Merkmale von Fragen | 85
den, da dadurch die Möglichkeit eingeräumt wird, dass Variation in der tonalen Struktur einen Einfluss auf die phonetische Realisierung vorhergehender tonaler Zielpunkte haben kann. Weiter ist zu erwähnen, dass der Minimalwert zur Ermittlung der Registerhöhe in den meisten Fällen mit dem postnuclear low zusammenfällt, sodass das gehobene Register ebenfalls auf die Anwesenheit des finalen Anstiegs zurückzuführen sein kann oder andersrum das höhere postnuclear low auf die Hebung des Registers. Innerhalb der Fragetypen kann Haan (2002: 216ff) einen Unterschied zwischen Deklarativfragen und den beiden anderen Fragetypen dahingehend feststellen, dass Deklarativfragen einen höher endenden finalen Anstieg aufweisen. Dies steht im Einklang mit ihrer These, dass die phonetische Markierung zunimmt, wenn Markierungsformen auf den anderen sprachlichen Ebenen ausbleiben (ebd.). Dieses Phänomen kann auch im Dänischen beobachtet werden (Grønnum 1998b), wo die Reduktion des Abwärtstrends nicht binär, sondern graduell variiert. Aussagen weisen die stärkste Deklination auf, darauf folgen fortgesetzte Aussagen, dann syntaktisch markierte Fragen und zuletzt der Typ unmarkierter Fragen. Zudem unterscheidet sich die Exkursion des finalen Anstiegs im Niederländischen als Ganzes nicht innerhalb der beiden anderen Fragetypen (W-Fragen und Entscheidungsfragen), da nicht nur der Endpunkt, sondern auch der Beginn des Anstiegs angehoben wird. Dadurch wird der gesamte Anstieg heraufgestuft, bleibt jedoch in seiner Exkursion unverändert. Eine weitere Klassenbildung findet sich bezüglich des globalen Trends. Während sowohl W-Fragen als auch Aussagen eine deklinierende Dachlinie haben, besitzen Deklarativ- und Entscheidungsfragen eine inklinierende Dachlinie. Haan (2002: 218f) stellt jedoch weiterhin fest, dass der globale Trend höchstwahrscheinlich keinen primären Parameter darstellt. Während der pränukleare Akzent auf dem Subjekt und der nukleare Akzent auf dem Objekt in Aussagen ungefähr gleich hoch steigen (abgesehen von der natürlichen Deklination, der zufolge Hochakzente im Verlauf der Äußerungen zunehmend tiefer realisiert werden (Peters 2014: 40)), lässt sich in Entscheidungs- und Deklarativfragen feststellen, dass der nukleare Akzent im Verhältnis zum pränuklearen Akzent deutlich höher liegt (Haan 2002: 219f). Dies liegt zum einen daran, dass der pränukleare Akzent reduziert wird, aber auch daran, dass der nukleare Akzent teilweise soweit erhöht wird, dass Haan (ebd.) dafür eine mögliche Annotation mit tonalem upstep vorsieht. In W-Fragen liegt in Haans (2002: 219f) Daten der Hauptakzent häufig auf dem initialen W-Wort und hat reduzierte Akzente auf den folgenden Akzenten zur Folge. In diesem Sinne lassen sich die Unterschiede in den globalen Trends als Reflexe des Akzentmusters sowie anderer phonetischer Effekte beschreiben.
86 | Forschungsstand
Aus den konkreten phonetischen Befunden leitet Haan (2002: 221f) zudem ein weiteres Merkmal von Frageintonation ab. Der sogenannte upsweep beschreibt die Tatsache, dass Fragen nicht nur einen finalen Anstieg besitzen, sondern dass dieser deutlich über alle anderen Tonhöhenbewegung der Äußerung, maßgeblich den initialen f0-Wert, hinausgeht und damit den Extremwert der Äußerung auf ein höheres Level festlegt. Daraus ließe sich ableiten, dass als ein Charakteristikum von Fragen im Niederländischen angenommen werden kann, dass der finale Offset den höchsten und vielleicht entscheidenden Punkt der Äußerung bildet. Zu geschlechtsspezifischen Unterschieden ergibt sich in Haans (2002: 216f) Daten ein weniger klares Bild, wobei die pitch range der weiblichen Sprecherinnen tendenziell konform mit der Hypothese im Vergleich mit den männlichen Sprechern größer ausfällt. Des Weiteren kann Haan (ebd.) auf der phonologischen Ebene feststellen, dass weibliche Sprecherinnen häufiger den finalen Anstieg in W-Fragen nutzen, der auch in Leseexperimenten optional zu sein scheint. Die Ergebnisse räumen in jedem Fall die Notwendigkeit ein, geschlechterspezifische Variation bei der Durchführung von Produktionsexperimenten zur phonetischen Realisierung von Fragen zu berücksichtigen. Haans (2002: 213ff) Ergebnisse zeigen also, dass Fragen phonetisch generell höher realisiert werden als Aussagen und die Fragetypen sich untereinander durch den Grad der Ausprägung der phonetischen Parameter sinkend mit zunehmender syntaktischer und lexikalischer Markierung unterscheiden lassen. Betrachtet man sowohl das postnuclear low als auch die Registerhöhe als Reflexe des finalen Anstiegs und den globalen Trend als Reflexe des Akzentmusters, so lässt sich abschließend festhalten, dass das phonetische Kernmerkmal in Haans (2002: 219) Untersuchung die Erhöhung des nuklearen Gipfels sowohl absolut als auch in Relation zu pränuklearen Gipfeln darstellt. Haan (2002: 225) zieht in ihrer Untersuchung das Fazit, dass die Phonetik für die Frageintonation im Niederländischen einen bedeutend größeren Beitrag leistet als die Phonologie. Demnach wird die intonatorische Signalisierung von Fragen nicht primär über kategoriale Mittel geleistet, sondern über die universellen parasprachlichen Mittel entsprechend des frequency codes. Dies zeigt sich unter anderem darin, dass innerhalb interrogativer Satztypen über die phonetische Realisierung graduell weiter unterschieden werden kann. Haan (2002: 225) adressiert das im Rahmen dieser Arbeit dargelegte Problem der linguistischen Theoriebildung und argumentiert dafür, dass die Intonation von Fragen sich eher als Markierung einer Sprechereinstellung statt einer kategorialen pragmatischen Funktion beschreiben lässt.
Phonetische Merkmale von Fragen | 87
Chen (2005) untersucht in ihrer typologischen Betrachtung zu universalen und sprachspezifischen Aspekten der Wahrnehmung von parasprachlicher Intonation unter anderem auch phonetische Aspekte der Intonation, die mit Fragen assoziiert werden können. Diese Untersuchung steht im Zusammenhang mit der Überprüfung der Wirksamkeit des frequency codes als parasprachlicher Universalie (s. Kapitel 2.2.1). Chen (2005) untersucht die Interpretation von phonetischen Aspekten der Intonation im Hinblick auf Fragen mit Proband/innen aus drei unterschiedlichen Muttersprachen: Mandarin Chinesisch, Niederländisch und Ungarisch. Diese unterscheiden sich wesentlich in der intonatorischen Markierung von Fragen. Im Ungarischen werden Fragen prototypisch mit dem gleichen fallenden Grenzton realisiert wie Aussagen, allerdings mit einem höheren und/oder späteren nuklearen Gipfel (Gόsy & Terken 1994, Fónagy 1998). Im Mandarin Chinesisch werden Fragen und Aussagen aufgrund der tonsprachlichen Natur nicht über intonatorische Mittel im eigentlichen Sinne differenziert, es kann jedoch eine Tendenz festgestellt werden, Fragen mit einem höheren Register zu realisieren (Yuan, Shih & Kochanski 2002, Shen 1989). Das Niederländische zeichnet sich, wie zuvor dargestellt, in Fragen unter anderem durch ein höheres Register und einen höheren nuklearen Gipfel aus (Haan 2002: 216ff). In einem Perzeptionsexperiment wurden drei Sprechergruppen aus den drei Muttersprachen synthetisierte Stimuli mit Nonsens-Wörtern nach dem Muster ‚Tatata‘ mit der Behauptung präsentiert, dass es sich um Beispieläußerungen einer wenig erforschten Inselsprache im Südpazifik handelte (Chen 2005: 48f). Dabei wurden jeweils zwei Äußerungen hintereinander präsentiert, von denen per two-alternative-forced-choice eine als Frage identifiziert werden sollte. Manipuliert wurden sowohl die Gipfelhöhe, die Gipfellage, als auch der finale Anstieg einer fallend-steigenden Kontur H*L H% (GToBI: H*L-H%). Als Ergebnis kann Chen (2005: 54f) feststellen, dass alle Sprecher/innen unabhängig von ihrer jeweiligen Muttersprache Äußerungen mit höherem Gipfel, späterem Gipfel und einem höheren finalen Anstieg einheitlich stärker als Frage bewerteten. Dabei erhöhte nicht nur die Anwesenheit, sondern auch die Erhöhung der finalen Anstiegsbewegung die Fragebewertung. Die unterschiedlichen Muttersprachen zeigten dabei maßgeblich einen Einfluss in der Sensitivität gegenüber bestimmten phonetischen Merkmalen (Chen 2005: 60f). So schienen ungarische Muttersprachler beispielsweise sensibler auf Veränderungen der Gipfelhöhe zu reagieren, was naheliegend darin zu begründen sein kann, dass Gipfelhöhe im Ungarischen anders als im Chinesischen und Niederländischen das primäre Markierungsmittel von Fragen darstellt (Chen 2005: 60f).
88 | Forschungsstand
Diese Ergebnisse zeigen, dass trotz unterschiedlicher sprach-spezifischer Strategien auf Ebene der Produktion eine gewisse Universalität in der Wahrnehmung bezüglich der Verbindung von Skalierung und Interrogativität zu bestehen scheint. Eine methodische Konsequenz dieser Ergebnisse ist vor allem, dass sich Parameter der Skalierung oder generell der phonetischen Realisierung in der Wahrnehmung als perzeptiv relevant für Interrogativität herausstellen können, ohne dass diese in der entsprechenden Sprache oder weiter noch überhaupt einer Sprache in dieser konkreten Form Verwendung finden müssen. Zuletzt liefert auch die Studie Chens (2005) Evidenz dafür, Interrogativität im Sinne des Fazits von Haan (2002) mehr als eine skalierbare Sprechereinstellung zu betrachten, da auch Chen (2005) unter anderem zeigen kann, dass die kontinuierliche Erhöhung phonetischer Aspekte wie der Höhe des finalen Anstiegs die Frageklassifikation graduell erhöht. Auch die Tatsache, dass die Bedeutung von Intonation unabhängig vom intentional nicht verständlichen und sogar verstehbaren sprachlichen Material eine konsistente Funktion erfüllt, spricht für eine parasprachliche Bedeutung im Sinne Ladds (2008: 34).
2.2.3 Phonetische Merkmale von Fragen im Deutschen Die Zahl der Arbeiten, die sich explizit mit der phonetischen Realisierung von Fragen im Deutschen befassen ist vergleichsweise überschaubar. Neben den jüngeren speziellen Untersuchungen lässt sich jedoch auch in den traditionellen Arbeiten, in denen eine Trennung von tonaler Struktur und phonetischer Implementierung noch nicht vorliegt, vereinzelt Evidenz für phonetische Variabilität in Abhängigkeit von Fragen finden. Wie an früherer Stelle bereits erwähnt, findet sich bereits in Kuhlmanns (1931: 61) Darstellungen zur Intonation von Aussagesätzen im Deutschen die Annahme, dass innerhalb des Fragesatzes durch das Suchen nach einer Antwort ein stärkeres Streben nach Vervollständigung (Streben des Weiterweisens) vorliegt als in fortgesetzten Aussagesätzen. Kuhlmann (ebd.) gibt an, dass sich dieses stärkere Bedürfnis durch eine größere Exkursion des finalen Anstiegs in Fragen auszeichnet, wie es unter anderem bei Palmer (1922: 78ff) zum Englischen ebenfalls früh in der Unterscheidung von low rise und high rise formuliert wird. Von Essens (1964: 46) Unterscheidung von progredienter und interrogativer Intonation ist, wie gezeigt wurde, in erster Linie ein tonaler Unterschied zwischen einem Plateau (ToDI: L*H 0% / GToBI: L*H-%) und einem zweifachen Anstieg (ToDI. L*H H% / GToBI: L* H-^H%). Betrachtet man von Essens (1964: 37) Ausführungen zur progredienten Intonation jedoch im Detail, so lässt sich
Phonetische Merkmale von Fragen | 89
feststellen, dass dieser Begriff übertragen auf das AM-Modell zwei unterschiedliche Konturtypen umfasst. So schreibt von Essen (ebd.) zwar, dass die Melodie des progredienten Weiterweisens die Form der ‚Schwebehaltung‘ annehmen, jedoch auch durch ein ‚Heraufschleifen‘ am Äußerungsende auslaufen kann. Da hier nicht von einem graduellen Anstieg, sondern von einem finalen Heraufschleifen die Rede ist, kann davon ausgegangen werden, dass von Essen (1964: 37) Konturen mit einem hohen finalen Grenzton einschließt und die progrediente Intonation somit in der tonalen Struktur mit der interrogativen Intonation zusammenfallen kann. Dieses Zusammenfalls scheint sich von Essen (1964: 46) bewusst zu sein, wenn er hinzufügt, dass der interrogative Anstieg eine wesentlich „höhere Melodiebreite“ besitzt als der progrediente Verlauf. Es findet sich also auch bei von Essen (1964) eine Unterscheidung der gleichen Kontur über die phonetische Realisierung des finalen Anstiegs. Pheby (1975: 170) trennt in seinem System zur grammatischen Tonmusterselektion sowohl in fallend-steigenden als auch in ausschließlich steigenden Konturen eine neutrale von einer expressiven Tonhöhenstufe. Die Höhe des finalen Anstiegs kann dabei jedoch in fortgesetzten Aussagen und in Fragen zwei unterschiedliche Funktionen erfüllen. In fortgesetzten Aussagen drückt ein höherer Anstieg eine stärkere Verbindung zwischen den beiden Satzteilen aus. Dies ist direkt vereinbar mit dem in Kapitel 2.2.1 erwähnten production code9, steht jedoch im Kontrast zu den Ausführungen Kuhlmanns (1931) und von Essens (1964). Für Fragen beschreibt Pheby (1975: 170), dass der finale Anstieg den Grad beziehungsweise die Stärke der Fragebewertung signalisieren kann. Obwohl Pheby (1975: 170) hierbei auf einen Grad an Fragebewertung verweist, findet sich in seinem Modell nur die binäre Unterscheidung zwischen einem neutralen und einem expressiven Anstieg und somit eine kategoriale Distinktion. Isačenko und Schädlich (1966) verorten den Unterschied zwischen progredient und interrogativ auf einer anderen phonetischen Ebene. Wie zuvor beschrieben operiert ihr System nur mit den zwei intonatorischen Formmerkmalen fallend und steigend. Diese müssen dabei immer alternieren, sodass auf einen Anstieg kein zweiter Anstieg folgen kann, wodurch ein unmittelbarer Unterschied zwischen Plateaus und zweifach-steigenden Konturen in diesem Modell nicht ausdrückbar ist. Zudem betrachten Isačenko und Schädlich (1966) die
|| 9 Dabei ist darauf hinzuweisen, dass bisher keine empirischen Belege dazu vorliegen, ob der production code außerhalb der Grammatikalisierung als finaler Anstieg eine kontinuierliche Implementierung zeigt. Im Gegenteil wird eher davon ausgegangen, dass der production code sich ausschließlich kategorial manifestiert. Ich danke Aoju Chen für diesen Hinweis.
90 | Forschungsstand
Markierung von sprachlichen Funktionen als Teil der tonalen Struktur und schließen somit Skalierungseffekte von Interrogativität kategorisch aus. Auf der anderen Seite betrachten sie die Alignierung nicht als Teil der phonetischen Realisierung, sondern als Teil der phonologischen Struktur, und nehmen an dass die Unterscheidbarkeit von einem progredienten und einem interrogativen Tonbruch in der Lage des Tonbruchs relativ zum segmentalen Material liegt (ebd.: 51). Hierzu unterscheiden sie in Bezug auf die Iktussilbe, die der nuklearen Silbe in der Terminologie dieser Arbeit entspricht, einen präiktischen Tonbruch, der vor dem Beginn der nuklearen Silbe realisiert wird, von einem postiktischen, der nach dem Beginn und somit entweder in oder nach der nuklearen Silbe realisiert wird. Progredienz wird in diesem Sinne über einen präiktischen Tonbruch ausgedrückt, Interrogativität über einen postiktischen. (s. Abbildung 1)
Abb. 1: Präiktischer und postiktischer Tonbruch gemäß Isačenko und Schädlich (1966: 51).
Übersetzt man diese beiden Typen in die tonale Struktur des AM-Modells, entspricht der Unterschied zwischen präiktisch und postiktisch nicht einem Unterschied in der phonetischen Alignierung der gleichen Kontur, sondern einem tonalen Unterschied zwischen H* H%/0% (GToBI: (L+)H* H-^H% / (L+)H*H-%) für Progredienz und L*H H%/0% (GToBI: L*H-^H% / L*H-%) für Interrogativität. Wie in Kapitel 4.2.1 zur Materialdiskussion des ersten Experiments näher erläutert wird, ist die Zuordnung Isačenko und Schädlichs (1966) gemäß der
Phonetische Merkmale von Fragen | 91
Intonationssemantik nach Peters (2014: 53ff) bis zu einem gewissen Grad tonal erklärbar. Dabei kennzeichnen Tonhöhenakzente mit einem tiefen L* Akzentton die Information als kommunikativ nicht unabhängig relevant, durch Anwesenheit des Folgetons H jedoch zugleich informatorisch abgeschlossen. Dies macht eine Folgeäußerung erwartbar, die auf die akzentuierte Einheit Bezug nimmt, diese jedoch nicht vervollständigen muss. Ein Hochakzent H* hingegen kennzeichnet die akzentuierte Einheit als kommunikativ unabhängig relevant, jedoch durch Fehlen eines Folgetons informatisch als nicht abgeschlossen. Diese Unvollständigkeit der akzentuierten Einheit legt eine Vervollständigung durch den/die gleiche/n Sprecher/in näher als durch den/die Rezipienten/in. Zugleich unterscheidet sich im Modell von Isačenko und Schädlich (1966: 51) je nach folgender Silbenzahl der Grenzton, da sich nach dem postiktischen Tonbruch ein längerer Plateau-Abschnitt erstreckt als nach dem präiktischen Tonbruch. Demnach tritt die postiktische Kontur häufiger mit einem hohen Grenzton H% auf, die präiktische Kontur ohne spezifizierten Grenzton 0%. Gemäß dieser tonalen Unterscheidung ist die Plateaukontur mit informatorisch nicht geschlossener akzentuierter Einheit tendenziell eher mit unvollständigen Aussagen zu erwarten. Die Kontur mit hohem Grenzton und informatorisch geschlossener, kommunikativ nicht unabhängiger akzentuierter Einheit ist wiederum mit beiden gleichermaßen, jedoch typischer mit Fragen zu erwarten. Dies ist allerdings keine Evidenz für eine strikte Trennung von präiktischer Progredienz und postiktischer Interrogativität, wie in den vorigen Kapiteln diskutiert wurde, sondern allenfalls für eine Präferenz in der Konturwahl aufgrund pragmatischer Faktoren. Bierwisch (1966: 130, 142) greift den Gedanken von Isačenko und Schädlich (1966) auf und beschreibt die Differenzierung von progredientem und interrogativem Anstieg ebenfalls über die Alignierung. Eine Untersuchung speziell zum Zusammenhang von Intonation, Satzmodus und Fokus findet sich in den Arbeiten des entsprechenden Forschungsprojekts von Altmann (1988) und Altmann, Batliner und Oppenrieder (1989). Dieses Projekt basiert auf einer Reihe von Produktions- und Perzeptionsexperimenten, wobei im Folgenden nur die wesentlichen Ergebnisse zur Frageintonation berücksichtigt werden sollen. Ziel des Projekts ist es unter anderem, vergleichbar mit Haan (2002), intonatorische Prototypen für die kanonischen Satzmodi des Deutschen, darunter auch verschiedene Fragetypen, zu identifizieren. In diesem Sinne greifen auch Altmann (1988) und Altmann, Batliner und Oppenrieder (1989) auf Leseexperimente zurück. Dabei werden den Proband/innen diverse Satztypen wie auch die für diese Arbeit relevanten W-Fragen, Entscheidungsfragen und Deklarativfragen (hier assertive Fragen) in Verbindung mit Kon-
92 | Forschungsstand
textsätzen zur Elizitation einer prototypischen Realisierung präsentiert. Zu den Ergebnissen der phonologischen Prototypen siehe Kapitel 2.1.1. Als ein konkretes phonetisches Merkmal von Fragen untersucht Oppenrieder (1989) die Deklination und überprüft, ob das Deutsche parallel zu den Ergebnissen von Thorsen (1980, 1985) beziehungsweise Grønnum (1992, 1995, 1998a, b) zum Dänischen und Vaissière (1983) zum Französischen und Russischen (s. Kapitel 2.2.2) über eine Aufhebung des Deklinationstrends in Fragen in Abgrenzung von Aussagen verfügt. Den Deklinationstrend ermittelt Oppenrieder (1989) zum einen über die Maxima und damit die Dachlinie der Äußerungen sowie über die Minima zwischen den Tonhöhengipfeln und damit im Wesentlichen die Basislinie. Beide Linien weisen in Aussagen einen deklinierenden Trend auf. Bei Fragen gestaltet sich das Bild uneindeutig, da diese sowohl mit als auch ohne Deklination realisiert werden können und hohe interindividuelle Variation zeigen. Oppenrieder (1989) schlussfolgert, dass die Aufhebung des Deklinationstrends kein notwendiges Merkmal zur Markierung von Fragen darstellt, aber ein sicheres Indiz sein kann, da sich dieses Phänomen ausschließlich in Fragen finden lässt. Die Erkenntnisse der Produktionsexperimente werden über die damit verbundenen Perzeptionsexperimente weiter ausdifferenziert. Hierzu untersucht Batliner (1989a) unter anderem den Übergang von Aussagen zu Fragen gemäß der intonatorischen Prototypen auf Kategorialität. Dabei werden im Sinne des klassischen categorical perception paradigm (Liberman et al. 1957) ein Identifikationsexperiment und ein Diskriminationsexperiment durchgeführt (s. Kapitel 6). Für beide Experimente wird der Übergang zwischen beiden intonatorischen Prototypen entlang eines 10-stufigen-Kontinuums resynthetisiert. Als Grenzstimuli für Fragen und Aussagen wurden die intonatorischen Prototypen mit H*L L% (GToBI: H* L-L%) für Aussagen und L*H H% (GToBI: L* H-^H%)10 für Fragen verwendet und maschinell synthetisch ineinander überführt. Dabei erfolgte die Interpolation bei Batliner (1989a) linear. Dies ist, wie der Autor selbst anmerkt, nicht unproblematisch, da dies zur Folge hat, dass die Schritte in den höheren Realisierungen des finalen Anstiegs akustisch äquivalent bleiben, was nicht der perzeptiven Realität entspricht (Nolan 2003). Die Stimuli am FrageEnde des Kontinuums weisen daher einen perzeptiv kleineren Abstand auf, was beträchtlichen Einfluss auf die Diskriminationswahrscheinlichkeit haben könnte. Batliner (1989a) kommt zu dem Ergebnis, dass der Übergang von Fragen zu Aussagen aufgrund des Zusammenfalls eines Diskriminationsgipfels mit dem Kategorienübergang des Identifikationsexperiments kategorial ist. Gleichzeitig || 10 Die Annotationen wurden vom Autor auf Basis der stilisierten Konturen der Quelle erstellt.
Phonetische Merkmale von Fragen | 93
lässt sich allerdings ein zusätzlicher Gipfel in der Diskriminationskurve erkennen, nämlich früher im Kontinuum. Dieser fällt augenscheinlich mit einem Übergang von einem flachen Verlauf zu einem leichten Anstieg in den Stimuli zusammen. Batliner (1989a) deutet hieraus die Existenz einer dritten Kategorie, deren Natur allerdings aufgrund der Vorgabe von zwei Kategorien im Identifikationsexperiment nicht genauer bestimmt werden kann. In entsprechenden Nachexperimenten mit mehreren Kategorien kommt Batliner (1989b) zu dem Ergebnis, dass sich der Grad der Fragebewertung bei sinkendem Anstieg verringert und zwischen Aussagen und unterschiedlich starken Fragetypen unterschieden werden muss. Hieraus folgert er, dass nicht die Kontur, sondern der genutzte f0-Raum am Ende der Äußerung für etwas steht, was er provisorisch als Grad an Fragehaltigkeit bezeichnet. Dieses Ergebnis steht im Einklang mit den Beschreibungen von Kuhlmann (1931) und von Essen (1964) sowie mit den zum Englischen und anderen Sprachen wie zuvor dargestellt. Batliner (1989b) äußert zudem die Möglichkeit, dass die Zwischenstufe des flachen finalen Anstiegs eventuell den Unterschied zwischen einem progredienten und einem interrogativen Anstieg markieren könnte, verfolgt diesen Ansatz jedoch nicht weiter, da auch der flache Anstieg der Fragekategorie zugeordnet wird. Es ist jedoch möglich, dass dieses Ergebnis durch die Tatsache beeinflusst wurde, dass die Instruktionen des Experimentaufbaus keine Möglichkeit einräumen, eine Fortsetzung der Äußerung zu erwarten. So kann es sein, dass die Proband/innen nur auf die Frageklassifikation zurückgreifen, weil die Äußerung als abgeschlossen präsentiert wird. In einem zweiten Perzeptionsexperiment untersucht Batliner (1989b) die Interaktion zwischen der intonatorischen Form einerseits und einer durch Kontext erzeugten Hörererwartung andererseits. Der Testsatz wird wie im Experiment zuvor entlang eines Kontinuums in der finalen Anstiegshöhe resynthetisiert und mit einem Kontextsatz präsentiert. Dabei ist der Kontextsatz so konstruiert, dass immer nur ein Satzmodus in der folgenden Äußerung als sinnvoll beabsichtigt ist. Als Ergebnis dieses Experiments kann Batliner (1989b) festhalten, dass die Erwartungshaltung, die der entsprechende Kontextsatz auslöst, so stark ist, dass die Bedeutung der intonatorischen Form in hohem Maße überschrieben werden kann. Die Interpretation der intonatorischen Form ist demnach deutlich von Faktoren wie sprachlichem Kontext und Verbstellung abhängig. Diese Erkenntnis steht in Übereinstimmung mit der Bedeutung der tonalen Struktur, wie sie in Kapitel 2.1 herausgearbeitet wurde, mit Kohlers (1977: 199) Konzept situativer Fragen und Geluykens‘ (1987, 1988) Annahme, dass Intonation allenfalls eine Äußerung als Frage ausweisen kann, wenn der Kontext diese Interpretation zulässt.
94 | Forschungsstand
In einem weiteren Perzeptionsexperiment untersucht Batliner (1989b) den Übergang von Fragen zu sogenannten Exklamativsätzen, da beide abgeschlossen über Verberststellung realisierbar sind (vgl. „Säuft der Leo?“ vs. „Säuft der Leo!“). Exklamativsätze zeichnen sich neben einem Unterschied im finalen Abschnitt nach den Prototypen in Oppenrieder (1988) durch einen äußerungsinitialen Fall aus. In einem weiteren Perzeptionsexperiment nach dem categorical perception paradigm wird ein Kontinuum erzeugt, bei dem sowohl der finale Anstieg als auch der initiale Fall stufenweise variieren. Hierbei kann Batliner (1989b) erneut trotz der binären Vorgabe drei Kategorien identifizieren. Während der initiale Fall nur einen unwesentlichen Beitrag leistet, findet sich eine Unterteilung der Fragebewertung von 0 % bei einem flachen Verlauf, 50 % bei einem Anstieg von drei Halbtönen und mehr als 90 % bei einem Anstieg von sechs und neun Halbtönen. In einem anschließenden Perzeptionsexperiment wurden Proband/innen die gleichen Stimuli präsentiert, allerdings mit der Aufgabe, den Grad an Antwortobligation, also wie weit sie sich genötigt fühlen, auf die entsprechende Äußerung zu antworten, zu bewerten. Dabei kann Batliner (1989b) feststellen, dass sich die Akzeptabilität von Fragen als solche graduell mit der Verringerung des finalen Anstiegs senkt, auch wenn immer noch ein finaler Anstieg vorliegt. Ein maßgebliches Problem des letzten Experiments stellt die Tatsache dar, dass die Manipulation des finalen Anstiegs bis zu einem flachen Verlauf ohne die gleichzeitige Erzeugung eines Hochakzents dazu führt, dass ein Teil der Stimuli die Kontur L* L% (GToBI: L* L-L%) erhält. Diese Kontur ist weder für Fragen, noch für Exklamative, Aussagen oder überhaupt einen Satztyp im Deutschen systematisch beschrieben und eventuell gar nicht natürlich erwartbar11 (Peters 2014: 67). Es ist daher gerade für das Experiment zur kategorischen Wahrnehmung möglich, dass vereinzelt die Alternative zur wählbaren Kategorie ‚Frage‘ nicht die Kategorie ‚Aussage‘, sondern die Kategorie ‚keine mögliche Äußerung des Deutschen‘ die Alternative gewesen wäre, was eine höhere Akzeptabilität einer Äußerung als Frage selbst bei einem flachen Anstieg zur Folge haben kann. Erneut ergibt sich auch wieder das Problem, dass die mögliche Kategorie einer progredienten Aussage weder in den Antwortmöglichkeiten gegeben ist, noch die Präsentation als abgeschlossene Einzeläußerung eine solche Interpretation nahelegt. Die Erfassung der möglichen Funktionen des finalen Anstiegs ist daher durch die experimentelle Auslegung eingeschränkt.
|| 11 Zwar ist eine solche Kontur möglich, allerdings in der Regel zur Kennzeichnung von totalem Downstep nach einem vorhergehenden hohen leading tone und bezeichnet somit nicht die beschriebene Melodie. Die entsprechende Äußerung %L L* L-L% ist sehr fraglich.
Phonetische Merkmale von Fragen | 95
Batliner (1989b) folgert aus der Kombination aller dargestellten Experimente, dass es sowohl kategoriale als auch kontinuierliche Aspekte in der Frageintonation gibt. Dabei sei der Übergang von Fall zu Anstieg kategorisch und markiere den Übergang von Aussage zu Frage, der weitere Anstieg differenziere dann jedoch kontinuierlich den Grad der Fragehaltigkeit. Batliner (1989b) schließt hieraus, dass der finalen Tonhöhenbewegung zwei Funktionen zukommen: In nicht anderweitig markierten Äußerungen steht der finale Anstieg für die pragmatische Funktion der Interrogativität, in bereits ausreichend markierten Äußerungen stellt der finale Anstieg den Grad an Erwartungshaltung oder Fragehaltigkeit dar, wobei ein hoher finaler Anstieg eine uneingeschränkte Frage markiert, ein flacher Anstieg eine Frage mit einer gewissen Erwartungshaltung und der finale Fall die geringste Erwartungshaltung. Das Hauptproblem auf das Batliner (1989a, b) in seiner Interpretation stößt ist die Annahme des Wechsels des finalen Anstiegs von einem kategorialen in einen kontinuierlichen Parameter. Das Modell Altmanns (1988) und Altmann, Batliner und Oppenrieder (1989) weist wie erwähnt keine Trennung von einer phonologischen und einer phonetischen Ebene auf, mit Hilfe derer Batliners (1989a, b) Ergebnisse nicht nur interpretierbar werden, sondern einen wesentlichen Beitrag zur Argumentation der vorliegenden Arbeit liefern. Der Übergang von einer fallenden zu einer steigenden finalen Tonhöhenbewegung stellt den Übergang von einer phonologischen Kategorie in eine andere dar, was in Batliners (1989a, b) Experimenten mit einer perzeptiven Kategoriengrenze zusammenfällt. Die weitere Steigerung des finalen Anstiegs führt zur Erhöhung des Grades an Antwortobligation und damit an Fragehaltigkeit. Dies ist im Sinne dieser Arbeit mit der Annahme vereinbar, dass die tonale Zuweisung eines hohen Grenztons zuerst kategorisch die Unvollständigkeit der Äußerung markiert. Dies führt, da die mögliche Alternative der unvollständigen Aussage in diesen Experimenten nicht erfasst werden kann, in Ermangelung anderer kontextueller oder syntaktischer Indizien zu einer Frageinterpretation. Die phonetische Implementierung in Form der Skalierung des finalen Anstiegs erhöht daraufhin den Grad der Fragehaltigkeit. Dies entspricht den Erwartungen der Ausgangsthese und zugleich den zuvor dargestellten Befunden zur Realisierung des frequency codes. Dabei ist eine Feststellung besonders hervorzuheben: Die graduelle Erhöhung des finalen Anstiegs führt nicht an einem Punkt in der Skalierung zu einem kategorialen Wechsel zur Frageinterpretation, sondern zu einer ebenfalls graduellen Erhöhung der Antwortobligation. Dies lässt darauf schließen, dass die Skalierung des finalen Anstiegs nicht die pragmatische Kategorie der Interrogativität markiert, sondern die von Batliner (1989a, b) postulierte Fragehaltigkeit als kontinuierliches attitudinales Merkmal. Dies spricht wie bereits in Haans (2002) Konklusion und an
96 | Forschungsstand
diversen Stellen der Arbeit erwähnt dafür, die intonatorische Markierung von Fragen auch im Deutschen nicht als Markierung der sprachlichen Funktion von Fragen, sondern der damit verbundenen graduierbaren Sprechereinstellung zu betrachten und deckt sich mit den Ergebnissen des Perzeptionsexperiments von Chen (2005). Dies soll in Kapitel 2.2.4 näher erläutert werden. Erwähnungen zu Skalierungseffekten in der Realisierung des finalen Anstiegs finden sich auch in den Betrachtungen Kohlers (1977, 1995). So gibt Kohler (1995: 196) unter anderem an, dass die interrogative Wirkung eines finalen Anstiegs mit dessen Höhe variieren kann. Demnach drücke ein steiler finaler Anstieg eine Frage aus, während ein flacher Anstieg eher eine „Aufforderung zum Weiterreden“ signalisieren kann. Innerhalb verschiedener Fragetypen nimmt Kohler (1995: 196) zudem an, dass Fragen mit deklarativer Syntax einen höheren Anstieg benötigen, um als Fragen wahrgenommen zu werden, da der finale Anstieg ansonsten nur Zurückhaltung oder Behutsamkeit signalisieren würde. Zuletzt gibt Kohler (1995: 197), wie zuvor in Kapitel 2.1.3 geschildert, an, dass dem finalen Anstieg an sich in W-Fragen die Bedeutung von gesteigertem Interesse und dadurch Höflichkeit zukommt. Dieses signalisierte Interesse sei dabei über die Skalierung des finalen Anstiegs steigerbar. Dabei lassen sich bei Kohler (1977, 1995) jedoch keine konkreten Angaben dazu finden, ob diese Skalierbarkeit ein echtes Kontinuum oder separate kategoriale Stufen darstellt. In Anlehnung an die Haan (2002) zugrundeliegende Untersuchung von Haan, van Heuven, Pacilly und van Bezooijen (1997) untersuchen Brinckmann und Benzmüller (1999) für das Deutsche intonatorische Merkmale von Fragen. Dabei ermitteln sie ebenfalls sowohl die intonatorischen Unterschiede zwischen Aussagen und Fragen im Generellen, sowie zwischen den einzelnen Fragetypen Entscheidungsfragen, Deklarativfragen und W-Fragen. Brinckmann und Benzmüller (1999) setzen in ihrer Untersuchung äquivalent zu Haan, van Heuven, Pacilly und van Bezooijen (1997) als tonale Parameter den finalen Grenzton und die Wahl des Tonhöhenakzents, als phonetische Parameter die Höhe des f0Offsets, des f0-Onsets, die pitch range sowie die Basis- und die Dachlinie an. Das entsprechende Produktionsexperiment besteht aus gescripteten Dialogen, die zwischen den 4 Proband/innen (2 m / 2 w) und einem der Autoren geführt werden. Das Material ist syntaktisch einfach und segmental kontrolliert, jedoch nicht bezüglich der Akzentposition konstant. In die akustische Analyse wurden nur Äußerungen übernommen, die in einer einzelnen Intonationsphrase und ohne kontrastiven Fokus realisiert wurden. Gemessen wurde f0 an allen tonalen Zielpunkten und an den Äußerungsgrenzen sowie am Minimum und am
Phonetische Merkmale von Fragen | 97
Maximum unter Ausschluss der Grenztöne zur Ermittlung der pitch range. Die Deklinationslinien wurden, anders als bei Haan, van Heuven, Pacilly und van Bezooijen (1997), vergleichbar mit Oppenrieder (1989) als Regressionslinien durch die hohen Extrempunkte im Falle der Dachlinie und durch die tiefen Extrempunkte im Falle der Basislinie ermittelt. Als Ergebnis zur tonalen Struktur konnte festgestellt werden, dass alle Aussagen zu 100 % mit einer fallenden, alle Deklarativfragen und nahezu alle Entscheidungsfragen (100 % und 98 %) hingegen mit einer steigenden Kontur realisiert wurden. Abweichend von den Ergebnissen bei Haan (2002) sowie bei Altmann (1988) und Altmann, Batliner und Oppenrieder (1989) zeigten die WFragen jedoch keine Variation in der Konturwahl, sondern wurden zu 100 % fallend realisiert. Die tonale Analyse der Akzentmuster stellte heraus, dass Aussagen mit einem fallenden H*L Akzent, W-Fragen mit einem fallenden H*L oder L+H*L12 Akzent realisiert wurden, wobei letzterer im Sinne dieser Arbeit einem späteren Gipfel entspricht. Die steigende Kontur der Entscheidungs- und Deklarativfragen wurde dagegen, wie unter anderem nach Oppenrieder (1988), Féry (1993) oder Grice und Baumann (2002) erwartet, mit einem tief-steigenden L* H Akzent realisiert. Wie zuvor erwähnt, führen diese Unterschiede in der Konturwahl zu Komplikationen in der phonetischen Analyse. Bereits bei Haan (2002) konnte festgestellt werden, dass die Wahl der tonalen Struktur in Form von Akzentwahl und Antizipation des Grenztons einen wesentlichen Einfluss auf die phonetische Realisierung einzelner Messpunkte und abgeleiteter Parameter wie dem globalen Trend und der pitch range hatte. Im Deutschen ist dieser Einfluss noch gravierender, da sich die gesamte nukleare Tonhöhenbewegung und vor allem der nukleare Akzentton selbst unterscheiden. In Aussagen stellt der hohe nukleare Akzentton H* häufig den hohen Maximalwert dar und gibt somit die Obergrenze der pitch range und den Verlauf der Dachlinie vor. In Entscheidungs- und Deklarativfragen hingegen stellt der tiefe nukleare Akzentton L* häufig den tiefsten Extremwert der Äußerung dar und gibt somit einen Teil der pitch range, den Verlauf der Basislinie und die Höhe des Registers an. Im Folgenden ist also zu beachten, dass die meisten der herausgestellten phonetischen Parameter nicht notwendigerweise primäre phonetische Effekte, sondern Reflexe der tonalen Struktur darstellen können. Konkret stellen Brinckmann und Benzmüller (1999) fest, dass sich alle Fragetypen sowohl in der pitch range, als auch im Verlauf der Dachlinie von Aus|| 12 Die Annotation bezieht sich an dieser Stelle auf die Angaben der Autoren und nicht wie zuvor auf das Modell nach Peters (2014).
98 | Forschungsstand
sagen unterscheiden. Innerhalb der fallenden Äußerungstypen lassen sich WFragen von Aussagen dahingehend unterscheiden, dass der f0-Offset von Aussagen niedriger liegt als der von Fragen, allerdings systematisch nur bei zwei der vier Sprecher/innen. Bezüglich des f0-Onsets sind Deklarativfragen dabei generell am niedrigsten. In der pitch range sind Aussagen und Entscheidungsfragen hingegen am schmalsten und unterscheiden sich von Deklarativ- und WFragen. Bezüglich der Deklination der Basislinie geben die Autoren einen generellen Trend an, Fragen mit einer flacheren Deklination zu realisieren. Für keine Äußerung können die Autoren hingegen eine inklinierende Dachlinie feststellen. Dies scheint nicht weiter verwunderlich, da die inklinierende Dachlinie bei Haan (2002: 218) auf eine Erhöhung des nuklearen Akzentgipfels in Entscheidungs- und Deklarativfragen zurückzuführen ist, die im Deutschen beide nicht mit einem Gipfel realisiert werden. Bei all diesen Effekten stellen Brinckmann und Benzmüller (1999) zudem ein hohes Maß an interindividuellen Unterschieden fest, wie sie auch schon von Oppenrieder (1989) beobachtet wurden. Als Fazit ziehen Brinckmann und Benzmüller (1999), dass auf Ebene der phonetischen Realisierung eine Reihe von Parametern existieren, die zur Markierung von Interrogativität genutzt werden können, diese jedoch in erheblichem Maße von individuellen Sprecherstrategien abhängig sind, sodass der Grad der Markierung bis hin zur völligen Unterlassung von Sprecher/in zu Sprecher/in variieren kann. Als Hauptmerkmal zur Unterscheidung von Entscheidungs- und Deklarativfragen auf der einen Seite und W-Fragen und Aussagen auf der anderen Seite halten die Autoren den finalen hohen Grenzton fest, wie gemäß Kapitel 2.1 in einem Leseexperiment zu erwarten. Als Merkmal zur Unterscheidung der beiden fallenden Äußerungstypen der Aussagen und der WFragen stellen die Autoren die pitch range und den Verlauf der Dachlinie heraus, der sich aus der höheren Skalierung des nuklearen Akzentgipfel H* in WFragen ergibt. Von Bedeutung für die Argumentation dieser Arbeit ist zum einen die Feststellung, dass Sprecher/innen die phonetischen Parameter individuell unterschiedlich verwenden oder sogar auslassen können. Dies steht in unmittelbarem Einklang mit der Hypothese zur Verteilung von steigenden und fallenden Entscheidungsfragen in Kapitel 2.1.4, dass die intonatorische Markierung von Fragen eine potenziell redundante Markierung darstellt und bei ausreichenden kontextuellen Bedingungen ohne Bedeutungsdifferenzierung abwesend sein kann. Des Weiteren kann außerhalb der erwartbaren tonalen Unterschiede festgestellt werden, dass sich konturgleiche Aussagen und W-Fragen durch Unterschiede in der Skalierung des nuklearen Akzentgipfels auszeichnen, was identisch mit Haans (2002: 219) Haupteffekten ist. Wenn sich im Deutschen eine phonetische Markierung von Fragen sowohl in der Skalierung des
Phonetische Merkmale von Fragen | 99
nuklearen Akzents als auch des finalen Anstiegs findet, lässt sich erneut fragen, ob diese zwei unterschiedliche phonetische Effekte der gleichen Bedeutung darstellen, oder ob auch der Effekt in seiner phonetischen Natur der gleiche ist und eine Erhöhung des finalen Anstiegs äquivalent zur Erhöhung des nuklearen Akzents von zweifach-steigenden Konturen steht. Eine weitere Untersuchung zur Phonetik der Intonation von Fragen findet sich in den bereits erwähnten Arbeiten von Dombrowski und Niebuhr (2005, 2010). Der Ansatz von Dombrowski und Niebuhr (2005, 2010) unterscheidet sich von den vorigen Betrachtungen dadurch, dass sie über das Merkmal des shapings einen für das Deutsche vorher nicht untersuchten Parameter postulieren. Shaping beschreibt im Sinne Dombrowski und Niebuhrs (2005, 2010) die konkrete Form des Melodieverlaufs im Sinne einer ganzheitlichen Gestalt. Anders als im AM-Modell werden im Kieler Intonationsmodell (KIM; vgl. Kohler 2006 und Kapitel 2.1) nicht tonale Zielpunkte, sondern Formelemente im Sinne eines tune-Ansatzes als phonologische Einheiten erfasst. Dabei unterscheidet das KIM zwischen Gipfeln und Tälern. Gipfel lassen sich in früh, mittel und spät, Täler in früh und spät einteilen. Demnach gibt es im KIM zwei Formen finaler Anstiege (exklusive fallend-steigender Konturen), nämlich Anstiege mit einem frühen Tal und einem späten Tal. Im Sinne des AM-Modells unterscheiden sich diese durch die Alignierung des L* Akzenttons bei frühen Tälern vor, bei späten Tälern in oder nach der Akzentsilbe. Das shaping differenziert bei Dombrowski und Niebuhr (2005) konkret in erster Linie die frühen Tal-Konturen weiter in die zwei Untertypen mit einem konvexen und einem konkaven Verlauf. Diese Unterscheidung meint, ob der Verlauf der Kontur in Bezug auf einen linearen Übergang zwischen dem Beginn und dem Ende des Anstiegs eher nach unten (konkav) oder nach oben (konvex) gebogen realisiert wird (s. Abbildung 2).
100 | Forschungsstand
Abb. 2: Shaping des finalen Anstiegs gemäß Dombrowski und Niebuhr (2005). 1) Konvex, 2) Linear, 3) Konkav.
Die beiden Formen des shapings ordnen Dombrowski und Niebuhr (2005) zu Beginn der Untersuchung den zwei Diskursfunktionen turn yielding für konkav und turn holding für konvex zu. Erstere sollen signalisieren, dass der/die Sprecher/in den konversationellen Zug an den/die Rezipienten/in abgibt, während zweitere das Gespräch beim/bei der aktuellen Sprecher/in halten sollen. Diese Verteilung untersuchen die Autoren anhand der spontansprachlichen Daten aus dem bereits zu Kohler (2004) erwähnten Kieler Korpus. Dabei stammen die Daten maßgeblich aus Terminfindungsgesprächen. Eine Besonderheit der Experimentsituation stellt die Tatsache dar, dass die beiden beteiligten Proband/innen sich während des Gesprächs nicht sehen konnten und für die Dauer ihres Redeanteils einen Knopf drücken und diesen für die Abgabe des Rederechts loslassen mussten. Anhand dieses Designs lassen sich die produzierten Äußerungen relativ präzise den beiden Typen der konversationellen Züge nach turn yielding und turn holding klassifizieren. Aufgrund der begründeten aber strikten Anforderungen an das Testmaterial basiert die Analyse allerdings nur auf 32 Äußerungen für turn yielding und etwa doppelt so vielen für turn holding. Diese stammen des Weiteren von acht verschiedenen Sprecher/innen. Als phonetischen Messwert beschreiben Dombrowski und Niebuhr (2005) die sogenannte range proportion. Die range proportion erfasst den Anstieg der Kontur bis zum Ende der Akzentsilbe relativ zur Gesamtexkursion des finalen Anstiegs bis zum Phrasenende mit Werten von 0 bis 1. Ein niedriger Wert drückt dabei eine eher konkave Kontur aus, ein hoher Wert einen konvexen Verlauf. Dombrowski und Niebuhr (2005) geben selbst an, dass der Messpunkt am Ende der akzentuierten Silbe einen mehr oder weniger willkürlich gewählten Fixpunkt darstellt, der dazu dient, die Bedingungen konstant zu halten, der jedoch
Phonetische Merkmale von Fragen | 101
Schwierigkeiten mit sich bringt. Range proportion soll den relativen Anstieg an einem sogenannten pivot point beziehungsweise perceptive center of gravity der Kontur zur Bestimmung von konkavem oder konvexem Verlauf erfassen. Dabei verlagert sich dieses center of gravity mit zunehmender Silbenzahl weiter in den hinteren Teil der Äußerung, sodass der feste Messpunkt am Ende der Akzentsilbe mit zunehmender Silbenzahl schlechter zur Bestimmung des shapings geeignet ist. Dies ist vor allem vor dem Hintergrund zu beachten, dass die Silbenzahl durch die spontansprachlichen Daten nicht kontrolliert werden konnte. Da dieser Effekt jedoch in beiden Situationen gleichermaßen nicht kontrolliert ist, minimiert sich der Einfluss, wobei dies bei der geringen Anzahl der Äußerungen durchaus ins Gewicht fallen könnte. Bei der akustischen Analyse stellen Dombrowski und Niebuhr (2005) signifikante Unterschiede in der range proportion für die beiden konversationellen Funktionen turn yielding mit einem Wert von 0,35 und turn holding mit einem Wert von 0,54 fest. Demnach zeigt sich, dass konkave Konturen häufiger in Äußerungen mit der Funktion auftreten, den Gesprächszug an den/die Hörer/in abzugeben. Gleichzeitig konnten Effekte für die Exkursion der finalen Anstiegsbewegung als Ganzes festgestellt werden. Diese liegen mit 0,9 ST größerer Exkursion in der turn yielding Bedingung knapp im Bereich der angenommenen Wahrnehmbarkeit (vgl. u. a. Isačenko & Schädlich 1966: 27). Der Durchschnittswert steigt jedoch durch Ausschluss einzelner Sprecher/innen auf 1,7 ST, was entweder auf einen großen Einfluss individueller Strategien in der Markierung oder aber generell interindividuelle Unterschiede in der Höhe finaler Anstiege unabhängig von der kommunikativen Funktion zurückzuführen sein kann, da die Äußerungen über die zwei Gruppen nicht nach Sprecher/innen getrennt wurden. Wie die Autoren selbst anmerken, ist es möglich, dass der Parameter der totalen Anstiegshöhe nicht ausreichend berücksichtigt wurde und zudem eine gewisse Abhängigkeit des shapings von dieser möglich ist. Als zusätzliches Ergebnis stellen Dombrowski und Niebuhr (2005) fest, dass die Formen des shapings keine distinkten Kategorien, sondern ein Kontinuum konstituieren. Dies kann als mögliches Indiz in Richtung der Skalierbarkeit zwischen turn yielding und turn holding und damit zugunsten des Merkmals der Fragehaltigkeit gedeutet werden. Die Autoren geben jedoch an, dass diese Varianz höchstwahrscheinlich den Unterschieden in der Länge des nuklearen Abschnitts geschuldet ist und sich eigentlich zwei zugrundeliegende Formen feststellen lassen sollten. Als weiteren Grund für die Varianz innerhalb der Gruppen beschreiben Dombrowski und Niebuhr (2005), dass dies auch ein Indiz dafür sein kann, dass die Zuordnung zu den Diskursfunktionen turn yielding und turn
102 | Forschungsstand
holding falsch gewählt ist und schlagen als Alternative activating für konkave und restricting für konvexe Konturen vor. Die Übersetzung des KIM in das AM-Modell gestaltet sich schwierig, da wie gezeigt wurde im KIM nukleare Tal-Konturen ausschließlich über die Alignierung des Tals klassifiziert werden und die unterschiedlichen Folgetöne der AM Konturen sich daraus nicht unmittelbar erschließen lassen. Dombrowski und Niebuhr (2005) kritisieren, dass die Unterscheidung von konvex und konkav eine Differenzierung erlaubt, die im AM-Modell nicht gefasst werden kann. Tatsächlich geben bereits die Autoren selbst an, dass sich der Unterschied im shaping im AM-Modell in einem tonalen Unterschied äußern könnte. Demnach lassen sich konkave Konturen im Modell dieser Arbeit als L*H H% (GToBI: L* H^H%) klassifizieren, konvexe Konturen jedoch als H* H% (GToBI: (L+)H* H-^H%) oder sogar H* 0% (GToBI: (L+)H* H-%). Damit entspricht der Unterschied im shaping genau jenen beiden Konturen, die bereits Isačenko und Schädlich (1966) zur Differenzierung von Fragen und Aussagen annehmen, wie an früherer Stelle in diesem Kapitel ausführlicher gezeigt wurde. Demnach lassen sich die Unterschiede zwischen turn yielding/activating und turn holding/restricting auch über Unterschiede in der tonalen Bedeutung mittels des AM-Modells erfassen. Gleichzeitig wurde jedoch bereits bei Isačenko und Schädlich (1966) angemerkt, dass die Konturen zwar Präferenzen bezüglich dieser Assoziation besitzen, jedoch nicht unmittelbar interrogativ von deklarativ unterscheiden. Dies kann möglicherweise ebenfalls die Variation innerhalb der Gruppen erklären. Die Korrelation von shaping-Unterschieden im KIM und tonalen Unterschieden im AM-Modell zeigen sich noch deutlicher bei Dombrowski und Niebuhr (2010). Im Rahmen eines Perzeptionsexperiments werden zwei Typen von Stimuli mit unterschiedlichen Werten für die range proportion synthetisiert. Dabei werden der Wert für die konkaven Konturen auf 0,2 und der Wert für die konvexen Konturen auf 0,8 festgelegt. Im Gegensatz zu den Mittelwerten der Produktionsdaten von 0,35 zu 0,54 ist dieser Unterschied klar ersichtlich auf einen Unterschied in der tonalen Struktur zurückführbar wie er zuvor beschrieben wurde. Die Feststellung, dass die Kontur mit H* Hochakzent ohne Folgeton und eventuell sogar 0% Grenzton tendenziell restricting ausdrückt und L*H H% tendenziell activating ist im Sinne der gleichen Argumentation wie im Abschnitt zu Isačenko und Schädlich (1966) auch im Rahmen des dieser Arbeit zugrundeliegenden Modells der Intonationssemantik (Peters 2014: 53ff) erklärbar. Der Gegenstandsbereich der Untersuchung von Niebuhr et al. (2010) ist sowohl weiter als auch enger als für die Betrachtung innerhalb dieser Arbeit relevant. Einerseits beschränken sich die Autoren auf die Untersuchung von Dekla-
Phonetische Merkmale von Fragen | 103
rativfragen, die im Rahmen der Arbeit als Intonationsfragen bezeichnet werden, und jenen Fragetyp darstellen, der, wenn überhaupt, auf sprachlicher Ebene nur durch intonatorische Mittel innerhalb der Äußerung als Frage kenntlich gemacht werden kann. Zugleich widmet sich die Arbeit nicht nur der Frageintonation, sondern allgemeiner der Frageprosodie, da auch die Aspekte der Sprechgeschwindigkeit und des Behauchungsgrades berücksichtigt werden. Im Folgenden sollen nur die relevanten intonatorischen Merkmale herausgestellt werden. Mit der bisherigen Argumentation dieser Arbeit vereinbar gehen Niebuhr et al. (2010) von der Annahme aus, dass der finale Anstieg auch für Deklarativfragen keine notwendige Markierung darstellt, was zur Folge hat, dass die sogenannten Intonationsfragen auch auf Ebene der Intonation nicht markiert und somit nur durch den Kontext als Fragen identifizierbar sein können. Hieran anknüpfend stellen die Autoren die Frage, ob sich die intonatorische Realisierung fallender Fragen trotz der identischen Konturwahl von fallenden Aussagen systematisch unterscheidet und damit auf intonatorischer Ebene trotzdem eine Markierung von Interrogativität liefert. Dabei legen die Autoren einen größeren Fokus sowohl auf die häufig vernachlässigte pränukleare Region als auch auf Aspekte des shapings anknüpfend an Dombrowski und Niebuhr (2005). Die Argumentation für eine Markierung im pränuklearen Bereich führen Niebuhr et al. (2010) auf die Asymmetrie interrogativer Markierung zurück, die dadurch zu Stande kommt, dass lexikalische und syntaktische Mittel den Fragecharakter bereits am Anfang der Äußerung signalisieren, der finale Anstieg jedoch erst am Ende. Zur Ermittlung der phonetischen Parameter wurden zwei Leseexperimente durchgeführt. Das erste besteht aus isolierten Einzeläußerungen, das zweite aus gescripteten Dialogen. Entgegen der eingangs formulierten Annahmen entscheiden sich Niebuhr et al. (2010) gegen den Vergleich fallender Aussagen und Fragen, sondern greifen auf die typischeren Realisierungen fallender Aussagen und steigender Fragen zurück. Als Begründung geben die Autoren an, dass Kontextmaterial, das zur Elizitation einer fallenden Frage dienen könnte, einen unvorhersehbaren Einfluss auf die sonstige pragmatische Interpretation und damit phonetische Realisierung haben kann, wie im Hinblick auf Kapitel 2.1.2 nachvollziehbar. Damit nehmen die Autoren allerdings die bereits erwähnten Konsequenzen des Einflusses der Konturwahl auf die phonetische Realisierung in Kauf. Dies ist im Rahmen dieser Untersuchung jedoch weniger beeinträchtigend, da die Autoren sich nicht globalen oder nuklearen Parametern, sondern in erster Linie der pränuklearen Region widmen. Ob die Antizipation eines finalen Anstiegs gegenüber einem finalen Fall auch einen Einfluss auf die phonetische Realisierung der pränuklearen Region hat, kann hierbei nicht ausgeschlos-
104 | Forschungsstand
sen werden. Für das erste Leseexperiment wurden vier Zielsätze mit deklarativer Syntax konzipiert. Alle Sätze bestehen aus den drei Konstituenten Personalpronomen, Vollverb und Präpositionalobjekt mit finalem Substantiv. Zusätzlich sollen die Testsätze in zwei Bedingungen mit und ohne Emphase produziert werden, wozu diese so konstruiert und markiert wurden, dass die Fragen mit „ungläubigem Erstaunen“, die Aussagen mit „vehementer Zurückweisung“ realisiert werden sollten. Wie Niebuhr et al. (2010) selbst anmerken, ist dies methodisch problematisch, da ungläubiges Erstaunen und vehementes Zurückweisen nicht zwangsläufig auf dem gleichen Konzept von Emphase basieren. Für das zweite Experiment wurden die Testsätze in Dialoge eingebettet, wobei das Wortmaterial variierte, um die Erkennung zu vermeiden. Erneut wurden die Testsätze in vier Bedingungen, zwei Satzmodi und zwei Emphasetypen, angeboten. Dabei ist nicht genauer angegeben, in welchen unterschiedlichen Kontexten die Testsätze auftreten, woraus sich potenziell kontextuelle Einflüsse auf die phonetische Realisierung ergeben könnten. Des Weiteren wurden die Proband/innen vorab zur Sicherung der Spontansprachlichkeit angewiesen, die Dialoge an den eigenen Sprachgebrauch anzupassen, wodurch der Grad an Spontansprachlichkeit möglicherweise negativ mit dem Grad an Kontrollierbarkeit korreliert. Als Proband/innen wurden acht Muttersprachler/innen des Deutschen in vier Paaren gewählt, die „durch langjährige Freundschaft miteinander verbunden waren“ und zugleich in einem „Vertrautheitsverhältnis zu den Versuchsleitern“ standen. Hierdurch besteht einerseits, wie die Autoren selbst angeben, der Vorteil, unvorhersehbare Einflüsse von Fremdheit auszuschließen und gleichzeitig durch die Vertrautheit einen einfacheren Zugang zur Spontansprachlichkeit zu erhalten. Andererseits birgt diese Herangehensweise die Gefahr zahlreicher Einflussfaktoren gerade auf parasprachlicher phonetischer Ebene in sich, da langjährige Freundschaft ebenfalls keinen objektiv fassbaren Parameter darstellt. Gleichermaßen verhält es sich jedoch mit den Einflussfaktoren von Fremdheit. Weiterhin mussten zwei Sprecher/innen aufgrund „zu expressiver oder gestörter Aussprache“ ausgeschlossen werden. Zur akustischen Messung wurden zwischen Satzanfang und dem ersten Akzent das generelle f0-Niveau, die Standardabweichung der Messwerte sowie das Gefälle in Halbtönen pro Sekunde ermittelt. Zusätzlich wurde über die gesamte Äußerung hinweg die Dichte pränuklearer Akzente erhoben. Als Ergebnis können Niebuhr et al. (2010) festhalten, dass Fragen sich systematisch von Aussagen durch weniger pränukleare Akzente unterscheiden. Des Weiteren sinken Fragen im f0-Niveau entgegen der Erwartung der Autoren tiefer als Aussagen und besitzen damit eine höhere Deklination. Dabei muss allerdings erneut darauf verwiesen werden, dass die Fragen mit einem L*H
Phonetische Merkmale von Fragen | 105
Akzent und die Aussagen mit einem H*L Akzentton realisiert wurden, was sich in der phonetischen Realisierung widerspiegeln kann. Für alle anderen untersuchten phonetischen Parameter kann keine systematische Abhängigkeit von der pragmatischen Funktion festgestellt werden. Petrone und Niebuhr (2014) untersuchen ebenfalls den Beitrag intonatorischer Aspekte zur Markierung von Fragen abseits vom finalen Anstieg. In zwei Perzeptionsexperimenten überprüfen die Autoren, ob Unterschiede in der phonetischen Realisierung der pränuklearen Region von Deklarativfragen einen Einfluss auf die Wahrnehmung von Interrogativität ausüben können. Für die Stimuli des ersten Perzeptionsexperiments wurde der Satz „Katharina sucht eine Wohnung“ vom zweiten Autor selbst sowohl als fallende Aussage als auch als fallende Frage eingesprochen. Beide Äußerungen werden mit einem fallenden pränuklearen und einem fallenden nuklearen Gipfel realisiert. Dabei unterscheiden sich die fallenden Fragen von den entsprechenden Aussagen phonetisch durch einen steileren Anstieg zum pränuklearen Gipfel, eine spätere Alignierung der Gipfelposition und einem konkaveren Übergang im Anstieg und Abfall des pränuklearen Gipfels. Die nukleare Region, die für das Experiment möglichst konstant sein sollte, weicht allerdings ebenfalls dahingehend ab, dass der nukleare Gipfel in den fallenden Fragen den der Aussagen um 71 Hz übersteigt. Dies ist dahingehend relevant, dass bisher gezeigt werden konnte, dass die Skalierung des nuklearen Gipfels in einigen Sprachen und nach Brinckmann und Benzmüller (1999) auch im Deutschen ein primäres Merkmal von Interrogativität darstellt. Die Stimuli werden in drei Kategorien entweder direkt nach dem Wort „Katharina“ (short) oder nach „Katharina sucht“ (medium) geschnitten oder als Ganzes (long) angeboten. Hervorzuheben ist im Besonderen, dass die Autoren die Stimuli explizit nach segmentalen und nicht nach intonatorischen Kriterien schneiden. Demzufolge ist der pränukleare Akzent der Fragestimuli aufgrund des späten Gipfels in den short-Stimuli nicht vollständig realisiert, sondern bereits am Beginn des Abfalls auf hohem Niveau abgeschnitten. Das erste Experiment wird als gating-Experiment durchgeführt. Hierzu werden die drei unterschiedlichen Stimuluslängen den Proband/innen mit der Anweisung präsentiert, sich vorzustellen, einen Raum zu betreten und einen ersten unvollständigen Fetzen des Gesprächs mitzubekommen. Anhand der unvollständigen Gesprächsteile sollen die Proband/innen anschließend per two-alternative-forced-choice entscheiden, ob die Äußerung eine Frage oder eine Aussage darstellen sollte. Als Ergebnis des ersten Experiments stellen die Autoren fest, dass sowohl die short-Stimuli als auch die long-Stimuli eindeutige Werte bei der Zuordnung
106 | Forschungsstand
als Frage oder Aussage erzielen. Lediglich die medium-Stimuli konnten von den Proband/innen nicht klar zugeordnet werden. Die eindeutige Zuordnung der short-Stimuli führt Petrone und Niebuhr (2014) zu der Schlussfolgerung, dass Hörer/innen bereits anhand der pränuklearen Region entscheiden können, ob eine Äußerung eher interrogativ oder deklarativ zu interpretieren ist. Dieser Interpretation steht die Feststellung entgegen, dass der medium-Stimulus als einziger Stimulus, in dem der nukleare Akzent abwesend und zugleich der pränukleare Akzent vollständig realisiert ist, nicht zugeordnet werden kann. Wenn die pränukleare Region einen Beitrag zur Markierung von Interrogativität leisten kann, dann sollte gerade dieser Stimulus eine sichere Klassifikation erlauben. Wenn die pränukleare Region jedoch keinen Beitrag zur Markierung von Interrogativität leistet, stellt sich die Frage, warum die short-Stimuli eine so hohe Erkennungsrate liefern konnten. Eine mögliche Erklärung ist in den Schnittkriterien der Stimuli zu finden. Wie erwähnt endet der short-Stimulus direkt an der Wortgrenze und damit kurz hinter dem Gipfel. Während der Aussagestimulus in dieser Bedingung mit einem vollständig realisierten Fall tief endet, endet der Fragestimulus hoch und damit im f0-Verlauf nahezu identisch mit einer vollständigen final steigenden Kontur. Es scheint nicht ausgeschlossen, dass sich die Proband/innen trotz der Anweisung, dass es sich um eine unvollständige Äußerung handelt, an diesem typisch interrogativen Merkmal orientiert haben könnten. Gleichzeitig unterscheiden sich der medium- und der long-Stimulus durch die Anwesenheit des nuklearen Konturabschnitts, der, wie ebenfalls anfangs dargestellt, in Fragen einen deutlich höheren Gipfel aufweist. Wenn man daher den short-Stimulus wegen der ungünstigen Schnittstelle aus der Argumentation ausklammert, muss der medium-Stimulus als Indikator für den Einfluss der pränuklearen Region in Relation zum long-Stimulus als Indikator für den Einfluss der nuklearen Region bewertet werden. Hierbei lässt sich das Gegenteil der Konklusion der Autoren erschließen, nämlich dass die nukleare Region einen bedeutsamen Einfluss auf die Klassifikation hat, während die pränukleare Region keinen nachweislichen Einfluss liefern konnte. Im zweiten Experiment untersuchen die Autoren den Beitrag der einzelnen Faktoren des pränuklearen Gipfels in Form der zeitlichen Alignierung, der Länge der Fallbewegung und des shapings der Fallbewegung bezüglich ihres Einflusses auf die Bewertung von Interrogativität. Die Stimuli sind erneut vom zweiten Autor eingesprochen, dieses Mal jedoch in Bezug auf f0 resynthetisiert. Dabei wird der nukleare Gipfel zwischen Fragen und Aussagen gemittelt und über alle Manipulationen hinweg konstant gehalten. Für den pränuklearen Gipfel werden drei Parameter variiert. Die Alignierung unterschied sich zwischen medialem Gipfel und spätem Gipfel, wobei die Autoren anmerken, dass
Phonetische Merkmale von Fragen | 107
der Gipfel zur besseren Unterscheidung in einem Maße nach hinten verschoben wurde, in dem es in der Produktion regulär kaum vorkommt. Die Länge der Fallbewegung variierte in vier Schritten mit einem Abstand von 50 ms. Das shaping des Falls unterschied sich zuletzt zwischen einem linearen, einem konvexen und einem konkaven Übergang. In der Durchführung des Experiments wurden die unterschiedlichen Stimuli mit einem von zwei Kontextsätzen präsentiert, die jeweils nur eine Interpretation bezüglich der pragmatischen Funktion zuließen. Die Proband/innen wurden angewiesen zu beurteilen, inwieweit der Testsatz den durch den Kontextsatz erzeugten Erwartungen entspricht. Es wurde kein Filler-Material angeboten. Als Ergebnis stellen die Autoren fest, dass in der späten Gipfelbedingung sowohl die Länge des Falls als auch das shaping keinen Einfluss haben. Bei früheren Gipfeln sei jedoch sowohl die Länge des Falls und bei einem längeren Fall auch das shaping relevant. Ein steiler Fall signalisiere demnach mit großer Übereinstimmung eine Aussage. Ein flacher Fall sei ein Indiz für eine Frage, jedoch nur, wenn dieser mit einem konkaven Übergang einherginge. Generell geben die Autoren an, dass alle Äußerungen stark dazu tendieren, als Aussagen interpretiert zu werden. Dies ist möglicherweise auf die fallende nukleare Kontur mit gemitteltem f0-Verlauf zurückzuführen. Aus den Ergebnissen beider Experimente folgern Petrone und Niebuhr (2014), dass auch phonetische Parameter des pränuklearen Gipfels einen Beitrag zur Wahrnehmung von Interrogativität leisten können und hierbei auch Faktoren wie Alignierung und shaping eine Rolle spielen. Auch wenn gezeigt werden konnte, dass die Ergebnisse des ersten Experiments potenziell eine alternative Interpretation zulassen, kann an dieser Stelle festgehalten werden, dass bei einer Untersuchung phonetischer Effekte von Interrogativität auch die pränukleare Region berücksichtigt werden muss. Zugleich liefert die Untersuchung weitere Evidenz dafür, dass die phonetische Variation über die Dimension der Skalierung hinausgehen kann. Zuletzt untersuchen auch Kaiser und Baumann (2013) phonetische Aspekte von Frageintonation im Deutschen. In Anlehnung an Dombrowski und Niebuhr (2005, 2010) richten die Autoren den Fokus ihrer Untersuchung auf Unterschiede im shaping zwischen konvex und konkav in Verbindung mit Fragen und progredienten Aussagen. Obwohl bei Kaiser und Baumann (2013) die Terminologie Dombrowski und Niebuhrs (2005, 2010) bewusst umgekehrt verwendet wird, sollen die Begriffe der Einfachheit halber hier konstant nach der ursprünglichen Definition weiterverwendet werden. Zur Überprüfung der shapingEffekte verwenden Kaiser und Baumann (2013) ein Perzeptionsexperiment. Die
108 | Forschungsstand
Stimuli werden dabei nicht synthetisiert, sondern natürlich eingesprochen, wobei die Autoren Minimalpaare mit Verberststellung oder Verbzweitstellung verwenden13, die entweder mit einem konkaven oder einem konvexen Verlauf realisiert werden. Dabei ist anzumerken, dass die Autoren trotz der Intention, die shaping-Effekte nach Dombrowski und Niebuhr (2005, 2010) zu replizieren, in ihren Stimuli nicht diese Unterscheidung erzielen. Eine Kernbedingung zur Erfassung der shaping-Unterschiede besteht gemäß Dombrowski und Niebuhr (2005, 2010) darin, die Grundkontur konstant zu halten. Im Sinne des KIM bedeutet dies in beiden Fällen, Konturen mit einem frühen Tal, also einem nuklearen Tiefton L*, der vor dem Beginn der nuklearen Akzentsilbe aligniert ist, zu vergleichen. Zu Dombrowski und Niebuhr (2005) wurde gezeigt, dass der Unterschied im shaping im AM-Modell einem Konturunterschied entspricht, sodass erwartbar auch bei Kaiser und Baumann (2013), die nach dem GToBI Modell arbeiten, ein Konturunterschied auftritt. Jedoch ist es für die Vergleichbarkeit essenziell, dass trotz des Konturunterschieds die wesentlichen phonetischen Parameter des KIM beibehalten werden. Aus den Darstellungen Kaiser und Baumanns (2013) wird deutlich, dass diese zwar den tonalen Unterschied beibehalten haben, das Kriterium der konstanten Alignierung des L* Akzenttons beziehungsweise L leading tones nicht erfüllt ist. Obwohl die Autoren in ihren Beispielen keine Silbifizierung angeben, geht aus den Darstellungen hervor, dass der tiefe nukleare Akzentton L* der konkav intendierten Kontur in den Stimuli bedeutend später in der Akzentsilbe aligniert ist als der L leading tone in den konvexen Stimuli. Dadurch besteht der phonetische Unterschied zwischen den beiden Stimuli-Klassen nicht im shaping, sondern in der Alignierung des Beginns des Anstiegs und folglich in einer Stauchung des finalen Anstiegs und dadurch wiederum einer Erhöhung der Steilheit. Gleichzeitig kontrollieren die Autoren, anders als Dombrowski und Niebuhr (2010), durch die Wahl natürlicher Stimuli nicht die Gesamthöhe des nuklearen Anstiegs, sodass diese in den präsentierten Beispielstimuli des konkaven Stimulus circa 3-4 Halbtöne größer ist als der des konvexen Anstiegs. Dies fällt umso mehr ins Gewicht, da durch die Kompression des finalen Anstiegs in konkaven Konturen aufgrund der späten Alignierung des tiefen Akzenttons zudem die Steilheit erhöht ist. Selbst wenn sich also in den nicht präsentierten übrigen Stimuli ein echter Unterschied im shaping zeigen sollte, ist dieser nicht von den Unterschieden im finalen Anstieg zu isolieren, die sich im Rahmen der bisherigen Darstellungen nicht nur für andere Sprachen der Welt, sondern auch für das Deutsche als einer der || 13 Die Ergebnisse zu W-Fragen werden an dieser Stelle aufgrund der abweichenden tonalen Struktur nicht in die Betrachtung einbezogen.
Phonetische Merkmale von Fragen | 109
primären phonetischen Effekte von Fragen herausgestellt haben. Die Aufgabe der Proband/innen bestand darin, unter den präsentierten Stimuli per twoalternative-forced-choice Entscheidung einen von beiden als „eher fragend“ auszuwählen (Kaiser & Baumann 2013). Dadurch ergibt sich einerseits das Problem, dass die Proband/innen sich für einen Stimulus entscheiden mussten, selbst wenn keiner von beiden zur Realisierung einer Frage geeignet ist. Auf der anderen Seite wird dem Problem der möglichen graduellen Abstufung von Fragehaltigkeit durch die Relativierung als „eher fragend“ begegnet. Eine weitere methodische Schwierigkeit besteht darin, dass den Proband/innen keine mögliche Fortsetzung präsentiert wurde, was die Klassifikation eines Stimulus als progredient erschweren könnte. Kaiser und Baumann (2013) stellen als Ergebnis eine eindeutige Klassifikation von ‚konkaven‘ Konturen als eher fragend und ‚konvexen‘ Konturen als eher weniger fragend fest. Obwohl sich wie erwähnt die einzelnen Effekte, die innerhalb der beiden Stimuli-Klassen variiert wurden, nicht voneinander trennen lassen, kann festgestellt werden, dass steilere und höhere Anstiegsbewegung als Ganzes, deren Anstiegsbeginn später in der nuklearen Silbe erfolgt, eine starke Frageinterpretation nahelegen. Eine Gemeinsamkeit zu den Stimuli Dombrowski und Niebuhrs (2010) besteht dabei darin, dass der Melodieverlauf in der Akzentsilbe länger auf einem tieferen Niveau bleibt, was ebenfalls einen phonetischen Effekt darstellen könnte. Folglich sprechen die Ergebnisse Kaiser und Baumanns (2013) erneut dafür, dass neben Skalierungseffekten möglicherweise auch Alignierungseffekte in der phonetischen Markierung von Fragen erwartbar sind. Die in diesem Kapitel dargestellten Arbeiten zur Frageintonation im Deutschen liefern ein vielseitiges aber auch uneinheitliches Bild über die phonetischen Effekte, die im Rahmen einer empirischen Untersuchung zu erwarten sind. Diese finden sich den Erwartungen entsprechend primär jedoch nicht ausschließlich auf der Ebene der Skalierung im nuklearen Bereich. Zugleich lassen sich vereinzelt Indizien dafür finden, dass die phonetische Markierung von Fragen nicht für eine kategoriale Markierung der pragmatischen Funktion der Interrogativität, sondern nah am frequency code für eine kontinuierliche Markierung einer graduellen attitudinalen Bedeutung wie Fragehaltigkeit steht. Dies kann jedoch im Rahmen der dargestellten Ergebnisse weder eindeutig bestätigt werden, noch lassen sich an dieser Stelle konkretere Aussagen darüber machen, was genau der Begriff der Fragehaltigkeit bezeichnet. Des Weiteren konnte gezeigt werden, dass für das Deutsche bisher keine Produktionsstudien existieren, in denen die phonetische Realisierung von der
110 | Forschungsstand
tonalen Struktur isoliert betrachtet werden kann, da die phonetische Realisierung immer in unterschiedlichen Konturen untersucht wurde. Dadurch ist wie erwähnt nie vollständig auszuschließen, dass diese Effekte bis zu einem gewissen Grad Reflexe der tonalen Struktur darstellen. Darüber hinaus stehen spezifische Untersuchungen aus, die Aussagen darüber erlauben, wie sich die phonetische Realisierung unter Einfluss spontansprachlichen Kontextes verändert. Zuletzt ergibt sich mit spezieller Referenz auf Batliner (1989b) eine offene Fragestellung bezüglich der Perzeption des finalen Anstiegs. Die entsprechenden Ergebnisse konnten zeigen, dass der Grad der Fragehaltigkeit mit sinkendem finalen Anstieg abnimmt, das experimentelle Design konnte jedoch nicht zeigen, ob dieser unmittelbar einen Beitrag zur Differenzierung von Progredienz und Interrogativität leisten kann. Diese Ergebnisse und offenen Fragen erlauben zum einen klare Fragestellungen und Zielsetzungen für eine folgende empirische Untersuchung und zeigen zugleich, dass Aspekte der phonetischen Realisierung auch im Deutschen prinzipiell eine Rolle in der intonatorischen Markierung von Fragen spielen.
2.2.4 Kategoriale und kontinuierliche Markierung von Interrogativität und Fragehaltigkeit Im Literaturteil dieser Arbeit wurde postuliert, dass die tonale Struktur über das unterspezifizierte Merkmal der Unvollständigkeit indirekt einen Teilbeitrag zur Markierung von Interrogativität leisten kann, dieser jedoch weder obligatorisch noch unmittelbar auf Fragen beschränkt ist. Weiterhin konnte für zahlreiche Sprachen und nicht zuletzt für das Niederländische und das Deutsche gezeigt werden, dass die phonetische Realisierung Formmerkmale besitzt, die mit der pragmatischen Funktion der Interrogativität auftreten. Diese phonetischen Formmerkmale finden sich primär in der Dimension der Skalierung tonaler Zielpunkte im Frequenzbereich. Eine mögliche Begründung dieses Zusammenhangs von mehr Tonhöhe und Interrogativität konnte dabei im Erklärungsmodell des frequency codes gefunden werden. Damit kann die Frage, ob Aspekte der phonetischen Realisierung prinzipiell in Abhängigkeit von der sprachlichen Funktionen der Interrogativität variieren können, mit ja beantwortet werden. Offen bleibt an dieser Stelle die Frage, wie der Zusammenhang zwischen der kategorialen sprachlichen Funktion der Interrogativität und der kontinuierlichen Form der Skalierung mit der linguistischen Theorie vereinbar ist. Im Folgenden werden drei mögliche Interpretationsansätze zur theoretischen Modellierung der Markierung von Interrogativität und Fragehaltigkeit vorgeschlagen.
Phonetische Merkmale von Fragen | 111
1)
Die erste Möglichkeit besteht darin, dass es sich auf Ebene der phonetischen Realisierung nicht um ein phonetisches Kontinuum handelt, sondern um einen bisher nicht in der phonologischen Struktur berücksichtigten kategorialen Unterschied. Selbst wenn sich die Markierung jedoch als kontinuierlich herausstellen sollte, kann Gussenhoven (2002, 2004) folgend angenommen werden, dass die Trennung in der Markierung von sprachlicher und attitudinaler Ebene innerhalb der Intonation nicht so strikt ist wie auf anderen sprachlichen Ebenen. Demnach setzte die Markierung sprachlicher Kategorien nicht notwendigerweise eine strikte Kategorialität in der intonatorischen Form voraus. In diesem Sinne ist es vorstellbar, dass auch die Markierung von sprachlichen Kategorien wie Fragen versus Aussagen über kontinuierliche Parameter der phonetischen Realisierung möglich ist. Ein unmittelbares Beispiel für die Markierung sprachlicher Funktionen über kontinuierliche Parameter findet sich in der Markierung des engen beziehungsweise emphatischen Fokus. Die kategoriale Markierung durch einen akzentuellen Hochton zeichnet hierbei die Einheit je nach phonologischer Theorie als informatorisch neu, nicht aktiviert oder schlicht prominent aus. Die Realisierung der engen Fokussierung beziehungsweise der Emphase erfolgt durch die Erhöhung des Tonhöhengipfels der entsprechenden akzentuierten Einheit (vgl. Bolinger 1978: 475, Féry 1993: 155, Peters 2014: 54). Dabei zeigen Ladd und Morton (1997), dass die Markierung von Emphase trotz der kategorialen Interpretation der sprachlichen Bedeutung als emphatisch vs. non-emphatisch keine perzeptiv kategoriale Unterscheidung, sondern Aspekte eines phonetischen Kontinuums zeigt. Dieser Fall ist für die phonologische Theorie deswegen essenziell, da entschieden werden muss, ob die höhere Skalierung in das phonologische Modell integriert werden sollte oder nicht. Folglich stellt sich die Frage, ob die Unterschiede in der sprachlichen Kategorie die Einführung von upstep als phonologischem Merkmal für diesen Fall rechtfertigen oder ob diese aufgrund der perzeptiven Kontinuität weiterhin dem Bereich phonetischer Variation zugeordnet wird. Ein weiteres Beispiel findet sich im Phänomen des downstep, dessen Bedeutung auf sprachlicher Ebene in der Markierung der akzentuierten Einheit bezüglich dessen Status als Anknüpfungspunkt für den weiteren Verlauf der Unterhaltung betrachtet werden kann (vgl. Peters 2014: 64). Auch hier ist es die Ebene der phonetischen Skalierung, die einen kategorialen Unterschied in einer sprachlichen Funktion markiert. Dabei ist Downstep als Phänomen in der phonologischen Theorie deswegen besonders, da dieser Unterschied in der Skalierung bereits in das phonologische Modell integriert wurde (Beckman, Hirschberg & Shattuck-Hufnagel 2005,
112 | Forschungsstand
2)
Grice, Baumann & Benzmüller 2005, Gussenhoven 2005, Peters 2014). Ob es sich hierbei um einen kategorialen Wechsel auch in der Perzeption handelt oder um ein phonetisches Kontinuum wie im Falle der Emphase, ist noch nicht gänzlich geklärt. Zuletzt findet sich diese Parallelität in der Trichotomie zwischen early peak, medial peak und late peak (Kohler 1987, 1996:198). Dabei werden drei sprachliche Bedeutungen der akzentuierten Einheit, nämlich gegeben, neu und unerwartet, über das Kontinuum der phonetischen Alignierung markiert. Hervorzuheben sind dabei die Ergebnisse Kohlers (ebd.), der darlegt, dass zwar drei Bedeutungskategorien vorliegen, jedoch perzeptiv nur der Übergang zwischen early peak und medial peak kategorial ist, während der Übergang von medial peak zu late peak ein perzeptives Kontinuum konstituiert. All diesen Phänomen ist gemeinsam, dass auf Bedeutungsebene (vermutlich) distinktive sprachliche Kategorien vorliegen, die trotz einer potenziell kontinuierlichen phonetischen Markierung weiterhin sprachliche Kategorien konstituieren. Gemäß diesem Interpretationsansatz könnte die intonatorische Ebene in Form der phonetischen Realisierung einen Beitrag zur Markierung von Interrogativität als sprachlicher Kategorie leisten, wobei die Skalierung zwar graduell variieren kann, allerdings zwischen zwei nicht scharf abgetrennten aber konzeptuell trennbaren Kategorien. Die Konsequenz, die wie im Falle von emphatischem Upstep, Downstep oder Alignierung diskutiert werden muss, ist im Falle dieses Interpretationsansatzes, ob phonetische Unterschiede, die eine linguistisch so essenzielle sprachliche Unterscheidung wie zwischen Frage und Aussage leisten können, trotz ihrer phonetischen Natur in das phonologische Modell übernommen werden müssen. Eine zweite Möglichkeit besteht darin, dass die Unterschiede in der phonetischen Realisierung nicht unmittelbar mit dem kategorialen Merkmal der Interrogativität assoziiert sind, sondern mit einem nicht-kategorialen, attitudinalen Merkmal, das tendenziell, aber nicht notwendigerweise obligatorisch mit dieser pragmatischen Funktion einhergeht. Ein solches attitudinales Merkmal, das in Kapitel 2.1 eingeführt und im Rahmen dieser Arbeit immer wieder aufgegriffen wurde, wäre das der Fragehaltigkeit. Entsprechend sind Fragen orientiert an Givón (1984: 254f) neben der reinen Funktion, eine Antwortreaktion des/r Rezipienten/in zu elizitieren, mit verschiedenen Graden einer Vielzahl möglicher Sprechereinstellungen verbunden. Darunter wurden bisher unter anderem Unsicherheit, Überzeugung, ein Bedürfnis nach Vervollständigung, ein Grad an Abhängigkeit bzw. Subordination und eine generelle Hörerorientierung gefasst. Eine Alternative zur Einführung eines neuen Konzepts der Fragehaltigkeit wäre es gewesen, dass
Phonetische Merkmale von Fragen | 113
Konzept der Interrogativität generell als Kontinuum zu betrachten. Von dieser Möglichkeit soll hier aus zwei Gründen abgesehen werden. Der erste Grund ist schlicht terminologischer Natur. Interrogativität ist speziell im Rahmen der Syntax und der Semantik als Konzept für eine klar abgrenzbare Kategorie eingeführt worden und eine Neudefinition dieses etablierten Konzepts wäre problematisch. Zum anderen würde dies bedeuten, dass das kategoriale Konzept der Interrogativität nicht weiterhin neben dem attitudinalen Kontinuum bestehen bleibt, sondern zugunsten dieses Kontinuums aufgegeben wird. Diese Position soll im Rahmen dieser Arbeit explizit nicht vertreten werden, da wir davon ausgehen wollen, dass eine kategoriale Unterscheidung zwischen Äußerungen, die im Rahmen der Fragedefinition eine Antwortreaktion elizitieren sollen und solchen, die dies nicht tun, existiert und kognitive Realität besitzt. Der zweite Interpretationsansatz geht allerdings davon aus, dass Äußerungen, die die Funktion der Frage erfüllen, gleichzeitig von den zuvor definierten Sprechereinstellungen begleitet werden können. Dabei können diese innerhalb der gleichen Kategorie in einem unterschiedlichen Grad realisiert werde, so dass eine Äußerung mehr oder weniger stark die Unsicherheit des/der Sprechers/in zum Ausdruck bringen kann, ohne dabei den kategorialen Status als Frage einzubüßen. Weiterhin stellt sich dann die Frage, ob Fragehaltigkeit eine notwendige Komponente von Fragen ist oder ob Fragen als solche fungieren können, ohne eine der genannten Sprechereinstellungen aufzuweisen oder zumindest explizit über die intonatorische Struktur zu transportieren. Umgekehrt ist es ebenfalls denkbar, dass Komponenten von Fragehaltigkeit mit Aussagen auftreten, ohne dass diese den Status einer Frage erhalten. Gemäß diesem Interpretationsansatz leistet die phonetische Realisierung keinen Beitrag zur Markierung von Interrogativität als sprachlicher Kategorie, sondern zur Markierung der Sprechereinstellung der Fragehaltigkeit, wobei diese mit interrogativ fungierenden Äußerungen erwartbar ist. 3) Der dritte Interpretationsansatz ergibt sich aus der Weiterführung der Frage, welche Bedeutungen genau unter dem Konzept der Fragehaltigkeit zusammengefasst werden. Der zweite Ansatz geht von der Notwendigkeit eines Fragehaltigkeitskonzepts aus, das verschiedene attitudinale Aspekte von Fragen in sich zu einem neuen Konzept vereint, das als Ganzes in der phonetischen Realisierung markiert wird. Alternativ ließe sich davon ausgehen, dass die phonetische Realisierung von Fragen kein fragespezifisch Bedeutungskonzept transportiert, sondern an der Basis des frequency code operierend eine basalere Bedeutung kennzeichnet, die zudem nicht exklusiv mit Fragen auftritt und nur durch die Verbindung mit Äußerungen, die
114 | Forschungsstand
bereits durch andere strukturelle und kontextuelle Faktoren eine Frageinterpretation nahelegen, den Eindruck von Fragehaltigkeit erzeugt. Während unter den von Givón (1984) angeführten graduierbaren Merkmalen einige, wie das Bedürfnis nach Informationen, unmittelbar mit Fragen in Verbindung stehen, stellen andere, wie Unsicherheit oder Überzeugung, Bedeutungen dar, die auch außerhalb von Fragen auftreten können. Folglich ließe sich annehmen, dass die Skalierung nicht Fragehaltigkeit markiert, sondern so etwas, wie Unsicherheit. Die Assoziation von Unsicherheit mit Äußerungen, die sich als Fragen klassifizieren lassen, führt daraufhin dazu, den Grad an Unsicherheit als Grad an Fragehaltigkeit zu interpretieren. Weiter lässt sich fragen, ob die Vielfalt an phonetischen Effekten, wie sie auch für das Deutsche gefunden wurden, vielfältige Ausprägungen eines komplexen Merkmals der Fragehaltigkeit darstellen oder jeder für sich ein eigenes Merkmal markieren, das zum Eindruck von Fragehaltigkeit kompositionell beiträgt. Es stellt sich also die Frage danach, inwieweit sich die Implementierung des frequency codes auf die Bedürfnisse menschlicher Kommunikation hin entwickelt hat, oder noch die gleichen urtümlichen Bedeutungen signalisiert, die diesem phylogenetisch zugeordnet werden. Im Sinne der dritten Interpretation kann die intonatorische Ebene folglich weder einen unmittelbaren Beitrag zur Markierung von Interrogativität als sprachlicher Kategorie noch zur Markierung von Fragehaltigkeit als Sprechereinstellung leisten. Stattdessen markieren sowohl die tonale als auch die phonetische Ebene eigene Bedeutungsaspekte. So kommt beispielsweise der tonalen Ebene die Funktion zu, zu signalisieren, dass eine Äußerung der Vervollständigung bedarf. Zugleich markiert die phonetische Implementierung diese Äußerung hinsichtlich einer attitudinalen Bedeutung wie Unsicherheit, Überraschung oder Abhängigkeit. Die Kombination beider Bedeutungen, also die Markierung einer Äußerung als sowohl unvollständig als auch unsicher, abhängig oder überrascht kann nun einen Eindruck von Interrogativität beziehungsweise die Interpretation einer Äußerung als Frage begünstigen.
3 Forschungsfragen Die Darstellung des Forschungsstandes zur Frageintonation im Deutschen hat eine wesentliche Leitfrage der folgenden empirischen Analyse herausgestellt: Besitzt das Deutsche in der phonetischen Realisierung von Intonation Formmerkmale, die signifikant in Abhängigkeit von der pragmatischen Funktion der Interrogativität variieren? Hervorzuheben ist dabei, dass diese phonetischen Effekte gemäß der Darstellung in Kapitel 2.2.4 sowohl unmittelbar mit der pragmatischen Funktion als auch mit dem damit einhergehenden Grad an Fragehaltigkeit als Sprechereinstellung in Verbindung stehen können. Dabei untergliedert sich die Leitfrage dieser Arbeit in vier Teilaspekte mit den dazugehörigen Forschungsfragen. Um eine erste Annäherung an die phonetische Realisierung von Fragen zu leisten, sollen diese in einer möglichst kontrollierten Umgebung und daher zuerst in einem Leseexperiment betrachtet werden. Nachdem in Kapitel 2.2 gezeigt werden konnte, dass in den Sprachen der Welt, darunter auch im Englischen und Deutschen, eine Vielzahl phonetischer Parameter zur Differenzierung von Fragen und Aussagen beitragen können, soll dabei nicht nur herausgestellt werden, ob die phonetische Realisierung signifikant variieren kann, sondern auch, welche intonatorischen Formmerkmale sich ausschließlich dem Einfluss der Interrogativität zuordnen lassen. Experiment 1 stellt somit das Schlüsselexperiment dar, insofern die in den Folgeexperimenten zu überprüfenden Parameter identifiziert werden. Dabei wird zwischen zwei Aspekten phonetischer Formmerkmale unterschieden: der Dimension und der Domäne. Die Frage nach der Dimension bezieht sich darauf, ob die phonetischen Effekte von Fragen in 1) der Skalierung im Frequenzbereich, wie der frequency code und der Großteil der dargestellten Studien vermuten lassen 2) der zeitlichen Alignierung 3) dem shaping des Übergangs zwischen den tonalen Zielpunkten oder in einer der möglichen Kombinationen dieser drei Faktoren zu finden sind, wie in Kapitel 2.2.2 und 2.2.3 erläutert. Die Frage nach der Domäne richtet sich darauf, ob die phonetische Markierung von Fragen globale Parameter der Äußerung betrifft, oder ob sich die Effekte lokal auf entweder die nukleare oder die pränukleare Region beschränken.
DOI 10.1515/9783110538564-003
116 | Forschungsfragen
Forschungsfrage 1 Kann die phonetische Realisierung von Intonationskonturen bei identischer grammatischer/lexikalischer Struktur in Abhängigkeit von der pragmatischen Funktion der Interrogativität in Leseaussprache variieren? (Experiment 1) Forschungsfrage 2 Welche Formmerkmale der phonetischen Realisierung von Intonationskonturen variieren in Leseaussprache in Abhängigkeit von der pragmatischen Funktion der Interrogativität? (Experiment 1) In Kapitel 2.1 konnte gezeigt werden, dass die Konturwahl in Fragen wesentlichen Einflüssen des Sprechstils zu unterliegen scheint. Obwohl der Einfluss des Sprechstils auf die phonetische Variation zwischen Fragen und Aussagen bisher nicht explizit untersucht wurde, ist vor diesem Hintergrund nicht ausgeschlossen, dass auch der Grad der phonetischen Effekte speziell aufgrund ihrer kontinuierlichen Natur variiert. Daher sollen im Rahmen dieser Arbeit die phonetischen Effekte von Interrogativität sowohl in Spontan- als auch in Leseaussprache untersucht werden. Sollte sich feststellen lassen, dass auch in spontansprachlichen Realisierungen phonetische Effekte in Abhängigkeit von der pragmatischen Funktion der Interrogativität auftreten, lässt sich fragen, ob Art (Dimension und Domäne) und Grad dieser Effekte aufgrund des Elizitationsmodus variieren. Forschungsfrage 3 Kann die phonetische Realisierung von Intonationskonturen in Abhängigkeit von der pragmatischen Funktion der Interrogativität in Spontansprache variieren? (Experiment 2) Forschungsfrage 4 Unterscheiden sich die phonetischen Effekte von Interrogativität in Spontansprache und Leseaussprache in Dimension und/oder Domäne einerseits und/oder dem Grad der Ausprägung andererseits? (Experiment 1 und 2) In Kapitel 2.2.2 wurde darauf hingewiesen, dass die Ermittlung phonetischer Effekte in entweder Produktions- oder Perzeptionsexperimenten jeweils nur eine eingeschränkte Erklärungskraft besitzt. Produktionseffekte erlauben noch keine unmittelbare Aussage darüber, ob und wie diese von den Partizipant/innen tatsächlich wahrgenommen und kommunikativ genutzt werden
Forschungsfragen | 117
können. Perzeptionsexperimente hingegen erlauben keine unmittelbare Aussage darüber, ob die untersuchten Parameter tatsächlich in natürlicher Sprache vorkommen. Um die Nachteile der beiden Methoden auszugleichen, werden die phonetischen Effekte im Rahmen der vorliegenden Arbeit zuerst in Produktionsexperimenten erhoben und anschließend in einer Reihe von Perzeptionsexperimenten auf ihre perzeptive und damit potenziell kommunikative Relevanz überprüft werden. Forschungsfrage 5 Sind die phonetischen Effekte von Interrogativität wahrnehmbar? (Experiment 3, 4 und 5) Forschungsfrage 6 Lassen sich die phonetischen Effekte der Produktionsexperimente der pragmatischen Funktion der Interrogativität in der Wahrnehmung zuordnen? (Experiment 3 und 5) Um einen Beitrag zu der in Kapitel 2.2.4 gestellten Frage nach der Einbettung phonetischer Effekte in die linguistische Theorie zu leisten, wird in Anlehnung an Batliner (1989a, b) weiter überprüft, ob der Übergang in der phonetischen Realisierung von Fragen und Aussagen ein Kontinuum bildet oder eine Kategoriengrenze aufweist. Die Überprüfung dieses Unterschieds kann Evidenz dafür liefern, ob die phonetische Markierung eher der pragmatischen Funktion der Interrogativität oder der attitudinalen Bedeutung der Fragehaltigkeit zuzuordnen ist. Anders als im Falle Batliners (1989a, b) soll dabei jedoch nicht die Kategoriengrenze von einer fallenden Aussage zu einer steigenden Frage oder von einer flach-steigenden Frage zu einer steil-steigenden Frage untersucht werden, sondern der Übergang von einer steigenden Aussage zu einer steigenden Frage. Hierzu sollen sowohl zwei Wahrnehmungstests im Sinne des klassischen categorical perception paradigm (Liberman et al. 1957) durchgeführt werden als auch ein Imitationsexperiment nach dem Vorbild von Pierrehumbert und Steele (1989). Forschungsfrage 7 Ist der Übergang in der phonetischen Realisierung von interrogativen und deklarativen Äußerungen kategorial oder kontinuierlich? (Experiment 3, 4 und 5)
118 | Forschungsfragen
Gemäß der Feststellung Lindseys (1985: 49), dass reiche Intonationssprachen mehr als nur einen phonetischen Parameter zur Markierung von Interrogativität aufweisen können, wie auch Kapitel 2.2 zeigt, besteht auch für das Deutsche die Möglichkeit, dass mehrere phonetische Parameter signifikant in Abhängigkeit von Interrogativität variieren. In den Produktionsexperimenten (Kapitel 4 und 5) wird gezeigt, dass sich auch hier unterschiedliche phonetische Parameter als Markierung von Fragen herausstellen lassen. Es wird daher im dritten Perzeptionsexperiment (Kapitel 8) überprüft, welcher dieser Parameter in welchem Maße zum Eindruck von Interrogativität beitragen kann. Forschungsfrage 8 Welche Aspekte der phonetischen Realisierung leisten den maßgeblichen Beitrag zur Markierung von Interrogativität/Fragehaltigkeit? (Experiment 5) Sollte sich die phonetische Realisierung von Fragen als Markierung einer kontinuierlichen Bedeutung herausstellen, kann in Anlehnung an die Erklärungsmodelle aus Kapitel 2.2.4 weiter gefragt werden, ob diese Bedeutungsdimension unmittelbar Fragehaltigkeit darstellt oder sekundär aus anderen Bedeutungen abgeleitet wird. Hierzu soll im dritten und letzten Perzeptionsexperiment der Beitrag der unterschiedlichen phonetischen Parameter nicht nur direkt zum Eindruck der Fragehaltigkeit, sondern auch zum Eindruck von Unsicherheit und Überraschung durchgeführt werden. Dabei wird überprüft, ob die Markierung dieser Bedeutungen nach dem gleichen phonetischen Muster wie im Falle der Fragehaltigkeit geschieht und eine Trennung der Bedeutungen folglich nicht möglich ist, oder ob Fragehaltigkeit ein eigenes phonetisches Muster aufweist, was tendenziell für eine eigene Bedeutung spricht. Forschungsfrage 9 Markiert die phonetische Realisierung die Bedeutung der Fragehaltigkeit primär oder sekundär über eine basalere Bedeutung wie Unsicherheit oder Überraschung? (Experiment 5) Zuletzt wurde in Kapitel 2.2.2 herausgestellt, dass das Sprechergeschlecht gerade im Bereich der Interrogativität aus physiologischen und soziokulturellen Gründen einen Einfluss auf die phonetische Realisierung haben kann, die bei Haan (2002: 216f) zur Frageintonation im Niederländischen in begrenztem Maße nachgewiesen werden konnten. Zugleich wurde an diversen Stellen auf hohe interindividuelle Variation und idiosynkratische Strategien in der phonetischen
Forschungsfragen | 119
Realisierung von Interrogativität hingewiesen (vgl. Oppenrieder 1989, Brinckmann & Benzmüller 1999, Dombrowski & Niebuhr 2005). Aus diesem Grund werden im Rahmen dieser Arbeit die beiden Geschlechter innerhalb der Proband/innengruppen ausgeglichen und getrennt analysiert. Zugleich wird die Anzahl der Proband/innen ausreichend groß gehalten, um die interindividuelle Variation zu berücksichtigen. Hierdurch kann überprüft werden, ob geschlechtsspezifische Unterschiede in früheren Untersuchungen auf idiosynkratische Unterschiede aufgrund zu kleiner Sprecherzahlen zurückzuführen sind oder geschlechtsspezifische Unterschiede in der phonetischen Realisierung von Fragen existieren. Forschungsfrage 10 Variieren die phonetischen Effekte von Interrogativität/Fragehaltigkeit in Leseund/oder Spontansprache in Abhängigkeit vom Sprechergeschlecht? (Experiment 1 und 2)
4 Experiment 1 – Produktion: Leseaussprache 4.1 Einleitung Im Fokus des ersten Experiments steht die Beantwortung der ersten beiden Forschungsfragen und damit die Ermittlung des Einflusses von Interrogativität auf die phonetische Realisierung von Intonationskonturen. Im Verlauf von Kapitel 2.2 wurde die Notwendigkeit aufgezeigt, die phonetische Realisierung isoliert von Einflüssen der tonalen Struktur zu betrachten. Um sich diesem Ziel systematisch und schrittweise anzunähern, erfolgt die erste Überprüfung der Leitfrage analog zu Haan (2002) mittels eines kontrollierten Leseexperiments. Die Wahl eines Leseexperiments als Elizitationsmodus hat den Vorteil, dass die grammatische Form, die segmentale Struktur und, was im Rahmen dieser Arbeit von besonderer Relevanz ist, die erwartete Konturwahl kontrolliert werden kann. Als Nachteil von Leseexperimenten lässt sich anführen, dass von den festgestellten Befunden nicht ohne weiteres auf Spontansprache generalisiert werden kann. Dies stimmt mit den Befunden aus Kapitel 2.1 zum Einfluss des Sprechstils auf die Konturwahl überein (vgl. u. a. Kügler 2003, 2004, Savino 2012). Dabei ist Leseaussprache jedoch nicht generell als eine unnatürliche Form von gesprochener Sprache zu bezeichnen, sondern stellt eine besondere Kommunikationsform im gesamten Spektrum nutzbarer Sprache dar (Wagener 1986). Dies ist nicht zuletzt darauf zurückzuführen, dass die Kommunikation in syntaktisch vollständigen Sätzen, wie sie regulär in Leseexperimenten vorkommen, eher die Ausnahme in spontansprachlicher Kommunikation darstellt (Swerts & Collier 1992, Schwittala 2010: 84ff). Gibbon (1998: 88) gibt zu bedenken, dass gerade die interaktive Orientierung von Interrogativität zu erheblichen Unterschieden in der Verbindung von Satzmodi und Konturwahl in Abhängigkeit vom Sprechstil führen könnte. Der Problematik des Sprechstils wird im Rahmen dieser Studie auf zwei Arten begegnet. Zum einen ist die Elizitation von kontrollierten Realisierungen im ersten Experiment beabsichtigt, da nicht untersucht werden soll, welche Parameter in welchem Maße in der natürlichen Kommunikation variieren, sondern welche phonetischen Parameter überhaupt in Abhängigkeit von Interrogativität variieren können. Sollten sich in der expliziten Leseaussprache keine phonetischen Effekte von Interrogativität finden lassen, ist die Wahrscheinlichkeit zumindest geringer, dass diese in Spontansprache auftreten. Im Gegenzug wurde in Kapitel 2.2 darauf hingewiesen, dass die phonetische Realisierung sensibel auf Sprechereinstellungen reagieren und diese reflektieren kann. Folglich kann in einem spontansprachlichen Experiment oder einer Untersuchung spontan-
DOI 10.1515/9783110538564-004
122 | Experiment 1 – Produktion: Leseaussprache
sprachlicher Korpora sowohl die Anwesenheit als auch die Abwesenheit phonetischer Effekte von Interrogativität nicht kontrollierbaren kontextuellen Einflüssen unterliegen. Die Entscheidung für isolierte Testsätze in Leseaussprache unter Ausschluss kontextueller Faktoren und Sprechereinstellungen (so weit möglich) ist folglich eine bewusste Entscheidung und stellt nach dieser Argumentation den besten Ausgangspunkt für eine erste Untersuchung der Phonetik von Frageintonation dar. Dabei ist hervorzuheben, dass auch kontextfreie Leseaussprache ein Konstrukt darstellt und so etwas wie eine kontextfreie Interpretation nicht existieren kann (Finkbeiner et al. 2012). Diese interindividuellen Variationsmöglichkeiten werden in Kauf genommen, sodass die Testsätze dieses Experiments als Annäherung an eine kontextfreie Interpretation zu verstehen sind. Des Weiteren stellt die Erfassung der phonetischen Parameter in Leseaussprache nur den ersten Schritt der Gesamterfassung in dieser empirischen Untersuchung dar. Nachdem die Parameter ermittelt wurden, die prinzipiell in Abhängigkeit von Interrogativität variieren können, soll im Anschlussexperiment in Kapitel 5 deren Auftreten in weniger kontrollierter, spontansprachlicher Sprache gegengeprüft werden. Experiment 1 soll neben der Existenz phonetischer Effekte zudem der zweiten Forschungsfrage entsprechend erfassen, in welcher Form die phonetische Realisierung variiert und in welchem Bereich der Äußerung. Die erste Frage richtet sich dabei auf die verschiedenen Dimensionen, in denen phonetische Variation stattfinden kann. Wie in Kapitel 2.2.2 und 2.2.3 bereits eingeführt, soll im Rahmen dieser Arbeit zwischen drei prinzipiellen Dimensionen unterschieden werden: der Skalierung im Frequenzbereich, der Alignierung im Zeitbereich und dem shaping als Kombination beider Dimensionen. Die Skalierung umfasst Variationen in der Tonhöhe tonaler Zielpunkte (Peters 2014: 38) und stellt damit den Parameter dar, der gemäß des frequency codes die erwartbarste Dimension der Markierung von Interrogativität darstellt (Ohala 1983, 1984, Gussenhoven 2002, 2004: 71ff). In den Bereich der Skalierung fallen dabei sowohl die lokalen Parameter, wie die Realisierung von Akzenttönen und Grenztönen, als auch globale Parameter, wie der Tonhöhenumfang und die Lage der Äußerung im Stimmumfang des Sprechers. Die Alignierung beschreibt die zeitliche Ausrichtung tonaler Zielpunkte relativ zur segmentalen Struktur (Peters 2014: 41). Wie in Kapitel 2.2.2 und 2.2.3 gezeigt, wird in einigen Untersuchungen zur Frageintonation angenommen, dass späte Gipfel möglicherweise mit Interrogativität assoziiert werden können (vgl. Bierwisch 1966: 130, 142, Niebuhr et al. 2010, Petrone & Niebuhr 2014). Dies konnte gemäß Gussenhoven (2004: 90f) und Chen (2005: 60f) dadurch erklärt werden, dass eine Korrelation von Tonhöhe
Einleitung | 123
und später Alignierung besteht, die sich nach Kohler und Niebuhr (2004) auch in gemeinsamen Bedeutungsmerkmalen widerspiegelt. Zugleich zeigen Kaiser und Baumann (2013), dass die Ausrichtung des Beginns zweifach-steigender Konturen die Wahrnehmung von Interrogativität beeinflusst (vgl. auch Isačenko & Schädlich 1966: 51). Es lassen sich folglich Indizien dafür finden, dass sich phonetische Effekte von Interrogativität auch in der Alignierung ausprägen können. Die letzte Dimension der Form beziehungsweise des shapings beschreibt die konkrete Ausgestaltung der Übergänge zwischen tonalen Zielpunkten. Gemäß Dombrowski und Niebuhr (2005, 2010) kann angenommen werden, dass neben dem Wechsel fallender und steigender Tonhöhenbewegungen, deren Skalierung und Alignierung auch die spezifische Form der Bewegung zwischen Wendepunkten Bedeutung tragen kann. Dombrowski und Niebuhr (2005, 2010) unterscheiden in diesem Sinne zwischen einem linearen, einem konkaven und einem konvexen Verlauf. Für einige Vorkommen, in denen der Unterschied zwischen konkaven und konvexen Übergängen einen Bedeutungsunterschied kennzeichnet, konnte gezeigt werden, dass sich eine direkte Übersetzung in die autosegmental-metrische Repräsentation über einen tonalen Unterschied ausdrücken lässt (s. Kapitel 2.2.3). Petrone und Niebuhr (2014) finden jedoch Belege, dass auch das shaping zwischen tonalen Zielpunkten die Wahrnehmung von Interrogativität beeinflussen kann. Daher soll auch dieser Parameter in der akustischen Messung mitberücksichtigt werden. Die zweite Frage bezieht sich auf die Domäne, also den Bereich der Intonationsphrase, in der die phonetischen Variationen der verschiedenen Dimensionen auftreten können. Im Rahmen dieser Arbeit soll zwischen drei Wirkungsbereichen innerhalb der Intonationsphrase unterschieden werden: dem nuklearen Bereich, der den letzten Tonhöhenakzent der Intonationsphrase und den nachfolgenden Grenzton enthält, dem pränuklearen, der alle Tonhöhenbewegungen vom Beginn der Äußerung bis zum Beginn der nuklearen Kontur umfasst und zuletzt die Intonationsphrase als Ganzes. Haans (2002) Untersuchung zum Niederländischen konnte zeigen, dass die phonetischen Effekte von Interrogativität hauptsächlich im nuklearen Bereich der Äußerung auftreten. Dies lässt sich auch für das Deutsche nach Brinckmann und Benzmüller (1999) und Batliner (1989a, b) sowie für die Mehrheit der in Kapitel 2.2.2 dargestellten Sprachen bestätigen. Variation im pränuklearen Bereich wie die Reduktion des pränuklearen Gipfels erfüllt demnach primär die Funktion, die phonetischen Effekte des nuklearen Bereichs prominenter zu machen. Niebuhr et al. (2010) sowie Petrone und Niebuhr (2014) vertreten dagegen die Auffassung, dass Effekte in der pränuklearen Region im Deutschen die Asymmetrie zur syntaktischen Markierung ausgleichen. Ähnliche Beschreibungen finden sich auch zum Spanischen
124 | Experiment 1 – Produktion: Leseaussprache
(Dainora 2006, Face 2007), Italienischen (Petrone & D’Imperio 2008, 2009, 2011) oder Griechischen (Baltazani 2006, Baltazani et al. 2015). Zuletzt lässt sich für viele Sprachen feststellen, dass Interrogativität sich in globalen Aspekten wie der Erweiterung des Tonhöhenumfangs oder der Anhebung des Registers finden lassen, die über die gesamte Intonationsphrase realisiert werden (z. B. im Dänischen: Grønnum 1998b; im marokkanischen West-Arabisch: Benkirane 1998; oder im Schwedischen: Gårding 1998). Im Rahmen des ersten Experiments sollen die drei Dimensionen Skalierung, Alignierung und shaping in allen drei Domänen pränuklear, nuklear und über die gesamte Intonationsphrase ermittelt werden. Neben der Beantwortung der ersten beiden Forschungsfragen stellt auch die Beantwortung von Forschungsfrage 10 zur Rolle des Sprechergeschlechts ein Teilziel des ersten Experiments dar. Da wie zuvor beschrieben die Möglichkeit besteht, dass weibliche Sprecherinnen Interrogativität expressiver markieren als männliche Sprecher (Haan 2002: 216f), soll auch im Rahmen des Leseexperiments der Frage nachgegangen werden, ob sich in den festgestellten phonetischen Effekten von Interrogativität signifikante Abweichungen sowohl im Grad der jeweiligen Parameter als auch in der Art der Parameter in Abhängigkeit vom Sprechergeschlecht ergeben. Dabei liegt ein Augenmerk darauf, die geschlechtsbedingten Effekte von möglicher idosynkratischer Variation zu trennen.
4.2 Methode 4.2.1 Material Durch die Zielsetzung der isolierten Betrachtung der phonetischen Effekte von Interrogativität ergeben sich starke Restriktionen bezüglich des Materials. Um zu gewährleisten, dass die phonetische Realisierung keine Reflexe anderer sprachlicher Ebenen darstellt, werden alle anderen Formmerkmale konstant gehalten. Dies bedeutet, dass die Testsätze so konzipiert werden müssen, dass sie in ihrer lexikalischen und segmentalen Struktur, also der Wahl des Wortmaterials, der syntaktischen Struktur und vor allem in der zu erwartenden Intonationskontur in allen Domänen identisch und gleichzeitig in dieser Form sowohl interrogativ als auch deklarativ verwendbar sind. Beginnend mit dem Kriterium der Konturwahl lässt sich für das Deutsche gemäß dem dieser Arbeit zugrundeliegenden autosegmental-metrischen Ansatz nach Peters (2014: 47) ein Inventar von acht nuklearen Konturen annehmen, die aus Tabelle 2 hervorgehen. Transkriptionen gemäß dem deutschen GToBIModell (Grice & Baumann 2002) werden an dieser Stelle zur Vergleichbarkeit
Methode | 125
angegeben, während im weiteren Verlauf aus ökonomischen Gründen alle Transkriptionen gemäß Peters (2014) wiedergegeben werden. Tab. 2: Inventar nuklearer Konturen des (nördlichen Standard)Deutschen nach Peters (2014: 47) mit Übersetzungen für GToBI (Grice & Baumann 2002).
Bezeichnung
ToDI / Peters (2014)
GToBI
Fallend
H*L L%
H* L-L%
Fallend-steigend
H*L H%
H* L-H%
Fallend-gleichbleibend
H*L 0%
H+L H-%
Hoch-steigend
H* H%
H* H-^H%
Hoch-gleichbleibend
H* 0%
H* H-%
Zweifach-steigend
L*H H%
L* H-^H%
Steigend-gleichbleibend14
L*H 0%
L* H-%
Tief-steigend
L* H%
L* L-H%
Die klassische Unterscheidung von steigender und fallender Intonation lässt sich wie in Kapitel 2.1 beschrieben in die Terminologie der autosegmentalmetrischen Beschreibung über den finalen Grenzton übersetzen. Demnach kann die fallende Kontur H*L L% der fallenden Intonation zugeordnet werden. Im weitesten Sinne fällt auch der unvollständige Fall H*L 0% in diese Kategorie, soll aber im Rahmen dieser Arbeit nicht weiterverfolgt werden, da zu Distribution und Bedeutung dieser Kontur bisher zu wenig bekannt ist. Der steigenden Intonation lassen sich demnach die fallend-steigende Kontur H*L H%, die tiefsteigende Kontur L* H%, die hoch-steigende Kontur H* H% und die zweifachsteigende Kontur L*H H% zuordnen. Des Weiteren werden im Rahmen dieser Arbeit sowohl die steigend-gleichbleibende Plateaukontur L*H 0% als auch die hoch-gleichbleibende Plateaukontur H* 0% mit zu den steigenden Konturen gezählt, obwohl diese technisch gesehen keinen hohen Grenzton aufweisen. Allerdings sind beide Konturen durch eine steigende Bewegung im nuklearen Bereich ausgezeichnet, die nicht von einem Fall gefolgt wird. Zudem lässt sich feststellen, dass an vielen Stellen der Übergang zwischen Plateaukonturen und echt-steigenden Konturen fließend ist, beide häufig austauschbar nebeneinan-
|| 14 Diese Kontur wird im weiteren Verlauf der Arbeit aus ökonomischen Gründen simplifizierend als Plateaukontur bezeichnet und ist nicht mit der hoch-gleichbleibenden Kontur zu verwechseln, die im Falle ihres Auftretens als Hochplateau abgegrenzt wird.
126 | Experiment 1 – Produktion: Leseaussprache
der stehen und ihre Bedeutungen starke Überschneidungen aufweisen, wie in Kapitel 2.1 gezeigt wurde. Trotz dieser Ähnlichkeiten und der Zuordnung zur Klasse der steigenden Konturen werden die beiden Konturpaare L*H H%/0% und H* H%/0% dennoch weiterhin als vier unterschiedliche Konturen betrachtet und entsprechend analysiert. Bisher konnte gezeigt werden, dass innerhalb von Leseaussprache abgeschlossene Aussagen ohne besondere kontextuelle Einbettung im Deutschen präferiert mit fallenden Konturen realisiert werden, während sich die Kernfragetypen der Entscheidungs- und Deklarativfragen typischerweise mit final steigenden Konturen finden (vgl. u. a. von Essen 1964, Bierwisch 1966, Pheby 1975, Oppenrieder 1988, Féry 1993, Grice & Baumann 2002 und Kapitel 2.1). Um die Konturwahl in beiden Funktionen konstant zu halten, ist es folglich notwendig, eine der beiden Funktionen mit einer weniger typischen Konturwahl zu elizitieren. Es müssen daher syntaktische Satztypen gefunden werden, die entweder Fragen mit einer fallenden oder Aussagen mit einer steigenden Kontur vergleichsweise sicher elizitieren können. Satztypen Aus den Darstellungen in Kapitel 2.1.1 geht hervor, dass selbst in Entscheidungs- und Deklarativfragen eine fallende Intonation möglich ist. Gleichzeitig konnte jedoch gezeigt werden, dass diese Realisierung primär in Spontansprache auftritt und die konkrete Funktion fallender Intonation im Deutschen allenfalls eingrenzbar, jedoch nicht präzise bestimmbar ist. Daher lässt sich nur schwer eine Elizitationsmethode ableiten, die zu einer sicheren Produktion fallender Entscheidungs- und Deklarativfragen in Leseexperimenten führen würde. Dieses methodische Problem thematisieren auch Niebuhr et al. (2010) mit dem Zusatz, dass alle Kontexte, die zu einer fallenden Intonation führen, weitere nicht kontrollierbare Einflussfaktoren mitbringen würden. Ebenfalls aus der bisherigen Darstellung ist zu entnehmen, dass die W-Fragen einen Fragetyp des Deutschen darstellen, der typischerweise mit fallender Intonation realisiert wird. Dies ist jedoch in Leseaussprache in geringerem Maße der Fall, so zum Beispiel bei Brinckmann und Benzmüller (1999), die W-Fragen in 70 % der Fälle mit steigender Intonation vorfinden. Aufgrund der spezifischen lexikalischen Markierung von W-Fragen durch das namensgebende W-Wort ist es zudem unmöglich, hierzu ein lexikalisch und syntaktisch vollkommen identisches deklaratives Gegenstück zu konstruieren, ohne erneut auf spezielle kontextuelle Einbettung zurückzugreifen (z. B. W-Exklamative; Altmann 1987, Lohnstein 2013).
Methode | 127
Die Alternative stellt die Elizitation steigender Aussagen dar. Die Realisierung unvollständiger Aussagen mit steigender Intonation konnte in Kapitel 2.1 typologisch als ebenso regelmäßiges Phänomen wie der Prototyp steigender Fragen herausgestellt werden (vgl. Hirst & die Cristo 1998: 26) und ist zudem auch im Deutschen traditionell als regulär beschrieben worden (vgl. von Essen 1964: 37f, Féry 1993: 85f, Grice & Baumann 2002, Peters 2014: 57f). Im Sinne der tonalen Bedeutung, wie sie in Kapitel 2.1.4 herausgearbeitet wurde, ist steigende Intonation bei allen Aussagen zu erwarten, die in irgendeiner Weise als unabgeschlossen oder vorwärtsweisend interpretiert werden. Fortgesetzte Aussagen sind weiterhin im Rahmen dieser Arbeit eingeschränkt als solche Aussagen definiert, die in mehr als einer Intonationsphrase realisiert werden und deren erste Intonationsphrase deshalb erwartbar mit steigender Intonation auftritt. Fortgesetzte Aussagen lassen sich sowohl mit Verberststellung zum Beispiel in konditionalen Nebensätzen (z. B. Will Mone zu Arne gehen, kann sie nicht bei Suse bleiben.) als auch mit Verbzweitstellung zum Beispiel in koordinierten Hauptsätzen (z. B. Simone will zu Arne gehen oder bei Suse bleiben.) finden. Dadurch lassen sich fortgesetzte Aussagen je nach Verbstellung sowohl mit Entscheidungsfragen (z. B. Will Mone zu Arne gehen?) als auch mit Deklarativfragen (z. B. Simone will zu Arne gehen?) vergleichen. In Kapitel 2.2.2 wurde gezeigt, dass einige Untersuchungen existieren, die die phonetische Realisierung von Fragetypen wie Deklarativ- und Entscheidungsfragen mit der Realisierung fortgesetzter Aussagen vergleichen, um den Einfluss der Interrogativität zu ermitteln (vgl. Rossi 1981, di Cristo 1998, Hirst 1998). Ein Problem, das sich jedoch bei diesem Vergleich ergibt, ist, dass sich fortgesetzte Aussagen und Entscheidungs- bzw. Deklarativfragen in einem wesentlichen Punkt der Phrasenstruktur unterscheiden. Wie zuvor diskutiert wurde, lässt sich in der prosodischen Hierarchie oberhalb der Intonationsphrase die Äußerungsphrase (utterance phrase = UP) als ein weiterer Phrasentyp höherer Ordnung annehmen (Fuhrhop & Peters 2013: 168f, Peters 2014: 77f). In Deklarativ- und Entscheidungsphrasen endet die Äußerung mit der Intonationsphrase, sodass die rechte Intonationsphrasengrenze mit einer Äußerungsphrasengrenze zusammenfällt (s. Beispiel 1). (1)
((Simone will zu Arne gehen?)IP)UP).
128 | Experiment 1 – Produktion: Leseaussprache
In fortgesetzten Aussagen wird die erste Intonationsphrase innerhalb der Äußerungsphrase jedoch häufig von einer zweiten Intonationsphrase gefolgt, sodass deren rechte Phrasengrenze nur eine Intonationsphrasengrenze darstellt (s. Beispiel 2). (2)
((Simone will zu Arne gehen)IP (oder bei Suse bleiben)IP)UP).
Die Äußerungsphrase stellt in der prosodischen Hierarchie eine Konstituente dar, deren Eigenschaften bisher noch wenig erforscht sind (Fuhrhop & Peters 2013: 168f, Peters 2014: 77). Daher gibt es bisher noch keine empirisch gesicherten Erkenntnisse zu phonetischen Effekten der Phrasengrenzstärke auf die phonetische Realisierung von nuklearen Konturen oder Grenztönen. Gemäß Gussenhovens (2004: 71ff) production code ist es jedoch möglich, dass sich der Unterschied in der Grenzstärke, im weiteren Verlauf für die leichtere Assoziation mit den entsprechenden Satztypen als Grad an Finalität bezeichnet, auch in der phonetischen Implementierung ausprägen könnte. In Phebys (1975: 170f) Beschreibung zur Intonation wird die Möglichkeit der Erhöhung des finalen Anstiegs in fortgesetzten Aussagen explizit ausgewiesen, um die Zusammengehörigkeit der beiden Intonationsphrasen zu verstärken. Es ist daher zu vermeiden, zwei Strukturen mit unterschiedlicher Finalität zu vergleichen, wenn der Effekt der Funktion isoliert werden soll. Um den Einfluss der Finalität auszuschließen, bieten sich zumindest in der Theorie die beiden Möglichkeiten an, steigende Aussagen mit einer rechten Äußerungsphrasengrenze oder steigende Fragen mit nur einer rechten Intonationsphrasengrenze zu elizitieren. Ersteres gestaltet sich schon aufgrund der in Kapitel 2.1.4 angenommenen tonalen Bedeutung steigender Intonation als schwierig. In diesem Fall wäre es notwendig, eine Unvollständigkeit signalisierende Aussage in einer abgeschlossenen Äußerung zu elizitieren. Einige der dargestellten Ansätze wie Nilsenova (2006) und Reese (2007) zeigen zwar, dass sich diese möglicherweise systematisch über den Parameter der Unsicherheit erfassen lassen, eine entsprechende Elizitation jedoch auf die gleichen unerwünschten Einflussfaktoren wie im Fall fallender Entscheidungsfragen stößt. Die Alternative besteht zuletzt darin, fortgesetzte Aussagen mit fortgesetzten Fragen zu vergleichen, deren erste Intonationsphrase ebenfalls nicht mit einer Äußerungsphrasengrenze zusammenfällt. Dies findet sich regulär in Alternativfragen. Die Wahl von Alternativfragen als interrogativem Vergleichstyp schränkt allerdings die Menge der fortgesetzten Aussagen auf solche mit Verberststellung ein. Ein im Rahmen dieser Arbeit durchgeführter Vortest zum Erproben verschiedener Satztypen und lexikalischer Kombinationen mit einer Gruppe von zwei männlichen und zwei weibli-
Methode | 129
chen Sprecher/innen konnte zeigen, dass Alternativfragen mit Verbzweitstellung (z. B. Simone will nachher zu Arne gehen oder bei Suse bleiben?) systematisch als offene Listen oder Entscheidungsfragen interpretiert wurden (vgl. Kingdon 1958: 212f, Crystal 1969: 273, Brinkmann 1971: 513, Pheby 1975: 57, 146, Bolinger 1989: 114). Dies äußert sich in der Konturwahl durch einen weiteren finalen Anstieg in der zweiten Intonationsphrase. Prinzipiell ist dies unproblematisch, da nur die erste Intonationsphrase der akustischen Analyse unterzogen werden soll. Es ist jedoch nicht auszuschließen, dass die Konturwahl der zweiten Intonationsphrase einen Effekt auf die phonetische Realisierung der ersten hat, was sich auch in zuvor erwähntem Vortest bestätigen konnte. Ein solcher Einfluss auf die phonetische Realisierung sollte für das Hauptexperiment ausgeschlossen werden. Aus diesem Grund wird ausschließlich auf Alternativfragen mit Verberststellung zurückgegriffen, die geschlossen interpretiert werden können und daher vergleichbar mit den fortgesetzten Aussagen mit einem Fall in der zweiten Intonationsphrase realisiert werden. Nukleare Zielkontur Nach der Festlegung des syntaktischen Strukturtyps stellt sich die Frage, welche der möglichen steigenden Konturtypen hierdurch reliabel elizitiert werden können. Zur Vorhersage der tonalen Struktur soll im Folgenden wie bisher auf das intonationssemantische Modell nach Peters (2014: 53ff) zurückgegriffen werden, da dies die bisher einzige vollständige Beschreibung des tonalen Kerninventars des Deutschen anhand semantischer Merkmale liefert. Es soll vorab hervorgehoben werden, dass die dargestellten semantischen Merkmale der tonalen Elemente keine obligatorischen Verbindungen zwischen tonaler Struktur und Satzsemantik postulieren, sondern Erwartungen an die Wahrscheinlichkeit der Auftretens bestimmter Konturen mit bestimmten semantischen Strukturen. Untersuchungen zur Frageintonation im Deutschen konnten wie gezeigt feststellen, dass Entscheidungs- und Deklarativfragen in Leseaussprache typischerweise mit einer zweifach-steigenden L*H H% Kontur realisiert werden. Dieser Konturtyp findet sich ebenfalls häufig in Verbindung mit fortgesetzten Aussagen (s. Kapitel 2.1.1). Gemäß Peters (2014: 53ff) signalisiert diese Kontur über den hohen finalen Grenzton die Unvollständigkeit der Intonationsphrase, über den Tonhöhenakzent L*H, dass die akzentuierte Einheit aufgrund der Anwesenheit eines Folgetons informatorisch abgeschlossen ist, und durch die Wahl eines tiefes Akzenttons, dass sie nicht kommunikativ unabhängig interpretiert werden kann. Diese Bedeutung lässt sich sowohl mit fortgesetzten Aussagen, als auch mit Deklarativ-, Entscheidungs- und Alternativfragen vereinbaren.
130 | Experiment 1 – Produktion: Leseaussprache
Ebenfalls mit fortgesetzten Äußerungen und Fragen findet sich die fallendsteigende Kontur H*L H% (vgl. Féry 1993, Grice & Baumann 2002, Peters 2014: 57). Der Unterschied zwischen H*L und L*H besteht primär darin, dass die akzentuierte Information mit hohem Akzentton kommunikativ unabhängig relevant ist, während ein tiefer Akzentton kommunikative Abhängigkeit signalisiert (Peters 2014: 57). Demzufolge ist H*L bei fortgesetzten Aussagen neben L*H je nach Art der Fortsetzung gleichermaßen möglich, bei Alternativfragen jedoch unwahrscheinlicher, da es in der Natur der Alternativfrage liegt, zwei akzentuierte Einheiten als Alternativen auszuzeichnen, wodurch diese als einzelne nicht kommunikativ unabhängig relevant sind. Um sicherzustellen, dass der Tonhöhenakzent in beiden Satztypen identisch ist, sollte der zweite Satzteil in den fortgesetzten Aussagen so konstruiert werden, dass dieser eine Information liefert, von der die akzentuierte Information der ersten Intonationsphrase kommunikativ abhängig ist. Der Unterschied zwischen der zweifach-steigenden Kontur L*H H% und steigend-gleichbleibenden Plateaukontur L*H 0% ist schwer zu fassen. Sowohl der hohe Grenzton als auch die Abwesenheit des Grenztons stellen eine Form von vorwärtsweisender Verknüpfung dar, wobei 0% die entsprechende Intonationsphrase tendenziell eher als Teil eines mehrgliedrigen Ganzen signalisiert (Peters 2014: 63). Daher tritt 0% präferierter (jedoch nicht ausschließlich) an äußerungsinternen Intonationsphrasengrenzen und H% häufiger an Äußerungsphrasengrenzen auf. Diese Verteilung wird von Caspers (1998) auch für das Niederländische beschrieben. In Alternativfragen und fortgesetzten Aussagen ist daher tendenziell die Plateaukontur zu erwarten. Da in jedem Fall jedoch kein semantischer Unterschied vorliegt, der eine Alternanz der beiden Konturen in Abhängigkeit von der pragmatischen Funktion erwarten lässt, werden eventuelle Idiosynkrasien in der Wahl dieser beiden Konturen für beide Funktionen in Kauf genommen. Die hoch-steigende Kontur H* H% beziehungsweise die hochgleichbleibende Plateaukontur H* 0% sind in Abgrenzung zu den L*H-Konturen dann erwartbar, wenn die Interpretation naheliegt, dass die akzentuierte Einheit informatorisch unabgeschlossen ist und ein Element der zweiten Intonationsphrase in die akzentuierte Einheit integriert werden soll. Diese Funktion lässt sich dem hohen Akzentton H* unter Abwesenheit eines Folgetons zuordnen (Peters 2014: 58). Bei Alternativfragen sind beide Akzentuierungen denkbar. Beispielsweise wäre in einem Satz wie „Möchtest du ein Brot mit Wurst oder lieber eine Banane?“ in zwei Intonationsphrasen eher ein L*H Akzent auf „Wurst“ zu erwarten, da die Elemente „Brot mit Wurst“ und „Banane“ informatisch abgeschlossen sind. In einem Satz wie „Möchtest du dein Brot lieber mit
Methode | 131
weichem oder lieber mit hartem Käse?“ ist eher mit einem H* Akzent zu rechnen, da „weichem“ ohne „Käse“ nicht informatisch geschlossen ist (vorausgesetzt die Phrase wird in zwei Intonationsphrasen zergliedert). In fortgesetzten Aussagen mit einem konditionalen Nebensatz ist die informatorische Geschlossenheit der akzentuierten Einheit in der ersten Intonationsphrase einfacher zu konstruieren, weshalb auch in den Alternativfragen darauf geachtet wird, die akzentuierbaren Einheiten informatorisch geschlossen zu konzipieren. Die tief-steigende Kontur L* H% zuletzt stellt den seltensten Konturtyp des Deutschen dar (Peters 2014: 62). Gemäß dem intonationssemantischen Modell signalisiert diese Kontur die Unvollständigkeit einer Intonationsphrase, die informatorische Unabgeschlossenheit der akzentuierten Einheit und die kommunikative Abhängigkeit von einer weiteren akzentuierten Einheit. Damit ist diese Kontur in ihrer Verwendung in Alternativfragen und fortgesetzten Aussagen stark restringiert. Aus der Darstellung geht hervor, dass zur möglichst isolierten Untersuchung der phonetischen Effekte von Interrogativität fortgesetzte Aussagen und Alternativfragen mit Verberststellung zu konstruieren sind, deren akzentuierten Einheiten informatorisch abgeschlossene Elemente darstellen, die in kommunikativer Abhängigkeit zu einem weiteren Element der Äußerung stehen. Um die letzte Bedingung zu erfüllen wird im vorliegenden Experiment für die akzentuierten Positionen mit Eigennamen gearbeitet. Durch die Kontrastierung von Individuen kann mit hoher Wahrscheinlichkeit sichergestellt werden, dass eine Verbindung zwischen den beiden Personen und damit kommunikative Abhängigkeit besteht. Gleichzeitig stellen Eigennamen ein sicheres Mittel dar, um informatorische Geschlossenheit zu erzeugen, wenn diese nicht unmittelbar von weiteren Eigennamen gefolgt werden und damit die Interpretation einer Gruppenzusammengehörigkeit erzeugen. Pränukleare Kontur Da auch der pränukleare Konturabschnitt untersucht werden soll, ist es notwendig, die Testsätze um pränuklear akzentuierbares Material zu erweitern. Hierzu wird erneut ein Eigenname gewählt, um auch die pränukleare Einheit als informatorisch abgeschlossen interpretierbar zu machen. Zugleich soll durch Variation der Eigennamen und Hinzufügen von Filler-Sätzen sichergestellt werden, dass die Eigennamen bei jedem Auftreten nicht kommunikativ verfügbar sind (vgl. Musan 2002) und daher als neue Informationen interpretiert werden. Gemäß der Intonationssemantik nach Peters (2014: 68) werden pränuklear akzentuierte Einheiten mit nicht unmittelbar verfügbaren Referenten präferiert mit
132 | Experiment 1 – Produktion: Leseaussprache
einem Hochakzent realisiert. Dies lässt daher sowohl die Zuweisung von einem Tonhöhenakzent als auch die Wahl des fallenden H*L Akzents erwarten. Verbpaar Aus dem zuvor dargestellten Vortest geht hervor, dass die Wahl der Alternativfragen eine zusätzliche Problematik mit sich bringt: Durch die bewusste Entscheidung für eine kontextlose Präsentation der Testsätze ist es notwendig, die Interpretation der Alternativfragen als geschlossen durch die Struktur des Satzes vorzugeben. Dabei hat sich gezeigt, dass wenige Verbpaare diese Interpretationsanweisung unmittelbar nahelegen und dabei zugleich die im Folgenden angeführten segmentalen Restriktionen erfüllen. Aus diesem Grund wurde für das vorliegende Experiment die Entscheidung für das Paar „Bei X bleiben – Zu Y gehen“ getroffen, da dies aus semantischen Gründen eine geschlossene Menge nahelegt, wie sich im Vortest bestätigen konnte. Postnuklearer Abschnitt Um eine möglichst ausgeprägte Realisierung der Intonationskontur zu erlauben, sollten auf die nukleare Akzentsilbe so viele unakzentuierte Silben wie möglich folgen. Das Nachfeld durch präpositionale Attribute zu erweitern birgt dabei die Gefahr, dem Material weitere akzentuierbare Positionen hinzuzufügen und dadurch die informationsstrukturelle Organisation und folglich die Konturwahl zu stören. Ein praktikables Mittel ist es daher, das Vollverb in satzfinale Stellung zu bringen. Hierzu eignen sich Konstruktionen mit Hilfsverb (z. B. Passiv, Perfekt oder Futur) sowie die Verwendung von Modalverben. In Kombination mit dem zuvor festgelegten Verbpaar „gehen – bleiben“ hat sich dabei die Verwendung mit Modalverb im Vortest als reliabelste Lösung herausgestellt, da Perfekt und Passiv durch die Verwendung des Partizip II des Vollverbs zu einem zusätzlichen unerwünschten Plosiv im finalen Anstieg führen („Ist X zu Mone gegangen?“) und das Futur häufig zu Testsätzen führt, die in natürlicher gesprochener Sprache nur bedingt akzeptabel sind („X wird nachher zu Y gehen?“). Aus den vorigen Überlegungen ergeben sich die in Beispiel 3 angeführten Rohstrukturtypen. (3)
Alternativfragen: Will X nachher zu Y gehen oder bei Z bleiben? Fortgesetzte Aussagen: Will X nachher zu Y gehen, kann sie nicht bei Z bleiben.
Methode | 133
Die Einheiten Y und Z sind durch ihren Status als Eigennamen informatorisch geschlossen und kontrastieren sowohl in Alternativfragen als auch in fortgesetzten Aussagen über das Verbpaar „gehen – bleiben“ direkt miteinander, um kommunikative Abhängigkeit zu erzeugen. Auf diese Weise soll eine Realisierung mit einem nuklearen L*H Akzent elizitiert werden. In beiden Strukturtypen ist die erste Intonationsphrase unvollständig und nicht ohne die zweite Intonationsphrase interpretierbar. Hierdurch soll eine Realisierung mit einem hohen finalen Grenzton H% oder einem Plateau 0% elizitiert werden. Die Einheit X ist durch die Assoziation mit einem Eigennamen ebenfalls informatorisch geschlossen, durch die Variation in den Eigennamen ist der Referent jedoch nicht unmittelbar verfügbar, sodass eine Realisierung mit pränuklearem H*L Akzent zu erwarten ist. Des Weiteren enthalten in beiden Äußerungstypen beide Intonationsphrasen ein Objekt und eine Verbform, um die Realisierung in zwei Intonationsphrasen wahrscheinlicher zu machen als die Realisierung in einer einzelnen Intonationsphrase was ebenfalls auf praktische Erfahrung aus dem Vortest zurückgeht. Folglich ist für die oben skizzierten Strukturen die in Beispiel 4 dargestellte intonatorische Realisierung der ersten Intonationsphrase zu erwarten. (4)
Alternativfrage ((Will X nachher zu Y gehen)IP, (oder bei Z bleiben?)IP)UP H*L L*H H%|0% Fortgesetzte Aussage ((Will X nachher zu Y gehen)IP, (kann sie nicht bei Z bleiben.)IP)UP H*L L*H H%|0%
Erweiterung des Materials Um so viele Einflussfaktoren wie möglich auszuschließen, wurde das bisherige Testmaterial mit sehr starken Restriktionen belegt. Dabei ist es möglich, dass einige der berücksichtigten Faktoren wie Finalität oder Verbstellung keinen Einfluss auf die phonetische Realisierung von Interrogativität ausüben. Um die Einschränkungen für mögliche Folgeexperimente potenziell zu reduzieren, wurde das Material um Strukturtypen erweitert, in denen die einzelnen Einflussfaktoren schrittweise hinzugenommen wurden. Alle weiteren Strukturtypen wurden dabei mit Ausnahme der bewusst variierten Faktoren identisch zu den beiden zuvor dargestellten Testsätzen konstruiert. Neben den fortgesetzten Aussagen mit Verberststellung wurden des Weiteren fortgesetzte Aussagen mit Verbzweitstellung („X will zu Y gehen oder bei Z
134 | Experiment 1 – Produktion: Leseaussprache
bleiben.“) aufgenommen. Diese dienten zum einen dazu, die Notwendigkeit der Konstanthaltung der Verbstellung zu untersuchen. Des Weiteren kann die Hinzunahme dieses Testsatzes ein Problem im primären Minimalpaar dieses Experiments auflösen: In Alternativfragen und fortgesetzten Aussagen mit Verberststellung sind die ersten Intonationsphrasen der beiden Strukturen nicht exakt gleichwertig, da es sich in den Alternativfragen um einen prinzipiell vollständigen Hauptsatz handelt („Will Mone zu Arne gehen?“), während in der fortgesetzten Aussage ein Nebensatz vorliegt („Will Mone zu Arne gehen...“). Zugleich ergibt sich ein pragmatischer Unterschied, da die erste Intonationsphrase der Alternativfragen bereits für sich genommen die pragmatische Funktion der Frage erfüllen kann, der ersten Intonationsphrase der fortgesetzten Aussage jedoch noch nicht die pragmatische Funktion der Aussage zukommt15. Ein Einfluss dieser beiden Faktoren ist nicht zu erwarten, jedoch lässt sich beides über das Hinzunehmen von fortgesetzten Aussagen mit Verbzweitstellung ausschließen. Des Weiteren wurden sowohl Entscheidungsfragen („Will X nachher zu Y gehen?“) als auch Deklarativfragen („X will nachher zu Y gehen?“) hinzugenommen. Erstere lassen sich mit Alternativfragen zur Untersuchung des unmittelbaren Einflusses von Finalität innerhalb interrogativer Äußerungen mit gleicher Verbstellung vergleichen. Über den Vergleich von Entscheidungsfragen und fortgesetzten Verberstaussagen sowie Deklarativfragen und fortgesetzten Verbzweitaussagen kann des Weiteren der kombinierte Einfluss von pragmatischer Funktion und Finalität ermittelt werden. Zudem erlaubt die Hinzunahme dieser beiden Satztypen in Anlehnung an Haan (2002) die Untersuchung, ob unterschiedliche Fragetypen unterschiedlich starke Markierungen von Interrogativität zeigen. Aus dieser Materialerweiterung ergeben sich die in Tabelle 3 dargestellten sieben Strukturtypen.
|| 15 Für diesen Hinweis danke ich Bettina Braun.
Methode | 135
Tab. 3: Die fünf Satztypen des ersten Produktionsexperiments unter Angabe von pragmatischer Funktion, Wortstellung und Finalität.
Testsatz
Pragmatische Funktion
Wortstellung
Finalität
X will nachher zu Y gehen?
Interrogativ
V2
Final
X will nachher zu Y gehen, oder bei Z bleiben.
Deklarativ
V2
Non-final
Will X nachher zu Y gehen?
Interrogativ
V1
Final
Will X nachher zu Y gehen, oder bei Z bleiben?
Interrogativ
V1
Non-final
Will X nachher zu Y gehen, kann sie nicht bei Z bleiben.
Deklarativ
V1
Non-final
Segmentale Struktur Um trotz der strikten Vorgaben bezüglich der syntaktischen Struktur der Testsätze Variation zu erzeugen, wurden verschiedene lexikalische Einheiten für die Positionen X, Y und Z erstellt. Dabei unterliegt das Wortmaterial ebenfalls Beschränkungen, da alle drei Einheiten in Akzentpositionen stehen und damit erwartbar die wesentlichen Messpunkte für den Grundfrequenzverlauf enthalten. Das Wortmaterial sollte daher so konzipiert sein, dass so wenige Störungen im f0-Verlauf wie möglich bereits durch das segmentale Material verursacht werden. Die Wahl von Eigennamen hat neben den erwähnten informationsstrukturellen Aspekten die Vorteile, dass sie große Freiheit im segmentalen Aufbau zulassen und alle in gleichem Maße mit demselben Verb kombinierbar sind. Um diese Wahl vollständig nach Sonoritätskriterien durchführen zu können, wurden für die Eigennamen auch Kunstnamen zugelassen. Alle Eigennamen wurden ausschließlich aus Vokalen und sonoren Konsonanten konstruiert. Dabei wurde aus Gründen der Segmentierbarkeit sowohl auf den alveolaren Lateral als auch den palatalen Approximanten verzichtet (Turk, Nakai & Sugahara 2006). Um zusätzlich Mikropertubationen zu vermeiden, wurden keine Plosive einschließlich dem glottalen Verschluss zugelassen (ebd.). Rhythmisch besitzen alle Eigennamen trochäische Füße als präferiertem Fußtyp des Deutschen (Nübling, Dammel, Duke & Szczepaniak 2008: 33). Um im Sinne der optimalen Ausformung der Zielkontur die Anzahl der Silben zwischen der nuklearen Akzentsilbe und dem Ende der Intonationsphrase zu maximieren, endeten alle Eigennamen auf Schwa, da so Synkopen vermieden werden. Das Wortmaterial für die Y und Z Position bestand gemäß der dargestellten Kriterien aus den folgenden vier Eigennamen in schriftlicher Form und der entsprechenden pho-
136 | Experiment 1 – Produktion: Leseaussprache
netischen Zielrealisation: [ˈzuː.zə], [ˈzøː.ʁə], [ˈnaː.nə], [ˈneː.və]. Von diesen Namen stellt der erste einen echten Eigennamen des Deutschen dar, während die anderen drei an existierende Eigennamen angelehnt sind, jedoch bezüglich der Kriterien des Experiments angepasst wurden. Für den Eigennamen in X-Position ergibt sich eine zusätzliche Anforderung. Durch den Wechsel der Verbstellung steht dieser Eigenname sowohl an erster als auch an zweiter Position in der Äußerung. Demnach ändert sich der Abstand der pränuklearen Akzentposition von der initialen Phrasengrenze. Um diesen Einfluss zu reduzieren wurden hier Eigennamen gewählt, die an zweiter Stelle zweisilbig trochäisch und an erster Stelle dreisilbig trochäisch mit Auftakt (vgl. Fuhrhop & Peters 2013: 107) realisierbar sind. Hierdurch ist die akzentuierte Silbe immer die zweite Silbe in der Äußerung. Die entsprechenden Eigennamen sind [hɛɐ̯ .ˈmiː.nə] mit der Kurzform [ˈmiː.nə] und [zi.ˈmoː.nə] mit der Kurzform [ˈmoː.nə]. In beiden Fällen ist die Struktur der Akzentsilbe und der folgenden Silbe in Kurz- und Langform identisch. Gesamtmaterial der Testsätze und Filler Die fünf unterschiedlichen Satztypen wurden sowohl mit den zwei Eigennamen in pränuklearer X Position und den vier Eigennamen in nuklearer Y und Z Position zu einer Gesamtzahl der Testsätze von 80 kombiniert. Dabei wurde nicht jede Kombination von pränuklearen und nuklearen Eigennamen gewählt, um die Gesamtmenge des Materials unterhalb einer aus Erfahrungswerten festgelegten Zumutbarkeitsgrenze zu halten. Die 80 Testsätze wurden um 144 FillerSätzen erweitert. Als Filler wurden den fünf Testsätzen sowohl abgeschlossene Deklarativsätze mit Verbzweitstellung („X will nachher zu Y gehen.“) als auch eine Variante des fortgesetzten Aussagesatzes mit Verberststellung mit umgekehrter Satzfolge („Kann Z nachher zu Y gehen, will sie nicht bei X bleiben.“) hinzugefügt, die nach denselben Kriterien wie die übrigen Testsätze konzipiert waren. Diese wurden dem Material ursprünglich zur Überprüfung zusätzlicher Forschungsfragen hinzugefügt und nach Streichung der entsprechenden Forschungsfragen zur Fokussierung des ersten Experiments als Filler im Material belassen. Die gleichen sieben syntaktischen Typen wurden für 112 zusätzliche Filler verwendet, allerdings in variierender Länge unter Hinzufügung von Adverbialen und Attributen sowie mit wechselnden Verbpaaren. Dabei wurde explizit gegen die segmentalen Restriktionen des Wortmaterials aus den Testsätzen verstoßen, um auch auf segmentaler Ebene die Variation zu erhöhen. (vgl. Anhang zur vollständigen Materialliste).
Methode | 137
Anordnung des Materials Testsätze und Filler wurden mit einer Gesamtzahl von 224 Stimuli in eine pseudo-randomisierte Reihenfolge gebracht. Dabei wurde kontrolliert, dass sowohl Filler und Testsätze als auch die pragmatischen Funktionen deklarativ und interrogativ immer im Wechsel folgten. Die Reihenfolge der konkreten Satztypen war zufällig und unterlag keinen weiteren Restriktionen. Da die Elizitation einer Intonationsphrasengrenze für die vorliegende Untersuchung von besonderer Relevanz war, wurde in der schriftlichen Präsentation zusätzlich an der zu elizitierenden Phrasengrenze ein Komma eingefügt. Dabei ist hervorzuheben, dass das Komma in den fortgesetzten Verberstaussagen mit untergeordnetem Konditionalsatz regelhaft ist, in den fortgesetzten Aussagen mit Verbzweitstellung und den Alternativfragen jedoch orthographisch ungrammatisch. Um neben der phonologischen Phrasengrenze einen Einfluss des orthographischen Verstoßes auf die phonetische Realisierung auszuschließen, kann der Unterschied zwischen V1-Aussagen mit regelhaftem Komma und V2-Aussagen mit ungrammatischem Komma im Ergebnisteil anhand möglicher Interaktionseffekte zwischen Wortstellung und Finalität überprüft werden, da ein möglicher Wortstellungeffekt entsprechend auf die nonfinalen Aussagen beschränkt wäre. Um zusätzliche Sicherheit zu erhalten, wurden die gleichen Testsätze ohne Kommafehler innerhalb des zweiten Experiments erneut einer zweiten, gleichgroßen Gruppe von Proband/innen präsentiert und bezüglich Sprechergruppe auf Effekte verglichen. Die Ergebnisse finden sich in Kapitel 5.3.4.
4.2.2 Durchführung Die randomisierte Liste aus Testsätzen und Fillern wurde den Proband/innen visuell in einer PowerPoint-Präsentation angeboten. Jede Folie enthielt dabei einen einzelnen Stimulus. Stimuli, mit einer intendierten Realisierung in zwei Intonationsphrasen, wurden zusätzlich an der intendierten Phrasengrenze per Zeilenumbruch getrennt. Um einen Störeffekt durch die Unbekanntheit der künstlichen Eigennamen zu vermeiden, wurden diese zusammen mit den realen Eigennamen der Filler-Sätze vor Beginn des Experiments in einer ebenfalls per PowerPoint angebotenen Wortliste präsentiert. Die Kunstnamen wurden den Proband/innen dabei als seltene oder exotische Eigennamen vorgestellt. Die Teilnehmer/innen wurden instruiert, die Namen laut vorzulesen, um sich mit der Leseaussprache der Namen vertraut zu machen.
138 | Experiment 1 – Produktion: Leseaussprache
Des Weiteren wurde mit allen Teilnehmer/innen vor Beginn des Experiments ein Testdurchlauf mit 28 Stimuli aus der Mitte der Liste durchgeführt. Dieser Test diente zum einen als Aufwärmphase vor Beginn der Aufnahmen und zum anderen als Screening, da einige Proband/innen systematisch von den Zielrealisierungen in Bezug auf die Konturwahl abwichen. Eine Gruppe bestand aus Proband/innen, die die Alternativfragen durchweg mit offener Interpretation und damit einem finalen Anstieg auf der zweiten Intonationsphrase realisierten. Eine weitere Gruppe bestand aus Sprecher/innen, die die fortgesetzten Verberstaussagen konstant mit fallend-steigender nuklearer Kontur H*L H% realisierten. Dabei konnte anhand von vorab ausgefüllten Fragebögen zur Erfassung möglicher Einflussfaktoren festgestellt werden, dass diese Gruppe eine Gemeinsamkeit dahingehend aufwies, dass alle Sprecher/innen gebürtig dem ostfriesischen Raum zuzuordnen waren. Ein Einfluss des ostfriesischen Intonationssystems ist möglich, bisher aber nicht systematisch untersucht und soll an dieser Stelle nicht weiter verfolgt werden. Für den Hauptteil des Experiments wurden die Proband/innen darauf hingewiesen, dass immer nur ein Testsatz pro Folie präsentiert wird und instruiert, diesen erst im Stillen zu lesen, um den gesamten Satz überblicken zu können, und ihn anschließend laut vorzulesen. Der Folienwechsel wurde vom Experimentleiter durchgeführt, um den Proband/innen zum einen die volle Konzentration auf die eigentliche Aufgabe zu lassen und gleichzeitig wenn nötig einen regulierenden Einfluss auf die Sprechgeschwindigkeit ausüben zu können. Die Aufnahmen wurden im Sprachlabor der Universität Oldenburg in einer schalldicht-isolierten Kabine durchgeführt. Als Aufnahme-Equipment wurde ein tragbarer Digital-Recorder (Tascam HD P2) mit einem Kopfbügelmikrofon (DPA 4065 FR) verwendet. Die Aufnahmen wurden mit einer Abtastrate von 48 kHz und einer Auflösung von 24 bit durchgeführt.
4.2.3 Sprecher/innen In Anlehnung an Haan (2002) wurde für das Experiment eine größere Sprecherzahl gewählt, um dem möglichen Einfluss idiosynkratischer Variation vorzubeugen, wie ihn unter anderem Oppenrieder (1989) und Brinckmann und Benzmüller (1999) für das Deutsche beobachten konnten. Des Weiteren besteht die Möglichkeit, dass das Sprechergeschlecht einen relevanten Einfluss auf die phonetische Realisierung von Intonation in interrogativen Äußerungen haben kann (vgl. Kapitel 2.2.2). Daher wurde das erste Experiment mit 21 Sprecher/innen durchgeführt, elf weiblichen und zehn männlichen. Die Gruppe der
Methode | 139
Proband/innen wurde so homogen wie möglich gehalten. Alle 21 Sprecher/innen waren zum Zeitpunkt der Aufnahmen zwischen 18 und 25 Jahre alt, sind im nordwestlichen Teil Niedersachsens geboren und aufgewachsen, Muttersprachler/innen des Deutschen und zum Zeitpunkt der Aufnahme Studierende der Universität Oldenburg. Die Teilnahme wurde vergütet.
4.2.4 Akustische Analyse Tonale Analyse Für die tonale und die phonetische Analyse wurde das Praat Softwarepaket zur Audioanalyse verwendet (Boersma & Weenink 2013). Vor der akustischphonetischen Analyse wurde das Material tonal annotiert, um eine Selektion der Äußerungen mit korrekt realisierter Zielkontur vorzunehmen. Auch wenn für die akustische Analyse nur die erste Intonationsphrase von Relevanz war, wurde zudem die tonale Struktur der zweiten Intonationsphrase analysiert, um einen möglichen Einfluss auszuschließen. Die tonale Annotation erfolgte konsistent zu den vorherigen Darstellungen der Arbeit gemäß der Adaption des niederländischen ToDI-Systems (Gussenhoven 2005) für das Deutsche nach Peters (2014). Für die weitere akustische Analyse wurden ausschließlich Äußerungen ausgewählt, die in Übereinstimmung mit Kapitel 4.2.1 mit der zweifachsteigenden Kontur L*H H% oder dem tief-steigenden Plateau L*H 0% realisiert wurden. Innerhalb der selektierten Äußerungen wurden sowohl Äußerungen mit einem pränuklear fallenden Akzent H*L in der X-Position als auch ohne pränukleare Akzente aufgenommen. Des Weiteren wurden nur Äußerungen analysiert, deren zweite Intonationsphrase mit einem hohen initialen Grenzton %H und einem fallenden Akzent H*L oder herabgestuft fallenden Akzent !H*L sowie einem tiefen finalen Grenzton L% realisiert wurden. Problematisch für die Annotation stellten sich maßgeblich zwei Unterscheidungen heraus. Zum einen die Differenzierung von H% und 0%, wenn die Kontur vom hohen nuklearen Folgeton einen graduellen Anstieg zum Ende der Intonationsphrase zeigte. Hierzu wurden Äußerungen mit mehr als zwei Halbtönen Abstand zwischen Hochton und Grenzton als H%, alle darunterliegenden als 0% klassifiziert, wobei die Anzahl dieser Zweifelsfälle unter 5% lag. Zum anderen musste ein reliables Kriterium zur Unterscheidung von L*H und H* festgelegt werden. Als H* wurden Konturen klassifiziert, in denen der f0-Verlauf den hohen Knick noch innerhalb der Akzentsilbe erreichte. Dabei konnte festgestellt werden, dass gemäß den Erwartungen der Konstruktion des Testmaterials nahezu keine Realisierungen von H* H% oder H* 0% im Material auftraten.
140 | Experiment 1 – Produktion: Leseaussprache
Phonetische Analyse Für die drei unterschiedlichen phonetischen Dimensionen Skalierung, Alignierung und Shaping wurden für die akustische Analyse drei unterschiedliche Sets an Messpunkten bestimmt. Skalierung: Im Bereich der Skalierung im Frequenzbereich werden die Variationen in der Realisierung der Tonhöhenakzente und Grenztöne und daraus abgeleitete globale Parameter wie Tonhöhenumfang, Registerhöhe und Deklinationstrend ermittelt. Um nicht nur die Exkursionen selbst, sondern auch die Verschiebung von Anstiegsbewegungen zum einen im Register und zum anderen relativ zueinander erfassen zu können, wurden sowohl relationale als auch absolute Parameter erhoben. Wie in Kapitel 4.3 gezeigt wird, kann eine Erhöhung des finalen Anstiegs beispielsweise durch Senkung des Beginns und durch die Hebung des Endes realisiert werden. Die Hinzunahme absoluter Parameter kann erschließen lassen, welche Strategie hierzu gewählt wird. Bei der Verwendung absoluter Parameter ist zu beachten, dass nur deren Verhältnis zueinander in Abhängigkeit vom Satztyp bedeutsam interpretiert werden kann und nicht die Lage der absoluten Parameter selbst, da diese sowohl durch die interindividuellen als auch die geschlechtsspezifischen Unterschiede in der Stimmlage starken Schwankungen unterliegen. Für die Ermittlung der phonetischen Effekte in der Skalierung wurden die in Abbildung 3 illustrierten Messpunkte und deren f0-Werte in Hertz ermittelt (s. Tabelle 4 und 5). Zur Vergleichbarkeit der beiden Geschlechter sowie der Relativierung interindividueller Variationen in der Stimmlage wurden die entsprechenden Hertzwerte logarithmisch in eine Halbtonskala transformiert. Im Rahmen dieser Arbeit wurde die Halbtonskala anderen Skalen wie der ERB oder der Bark-Skala vorgezogen, da sich die Halbtonskala speziell für die Erfassung geschlechtsspezifischer Unterschiede am praktikabelsten herausgestellt hat (vgl. Nolan 2003).
Methode | 141
Abb. 3: Phonetische Messpunkte zur Bestimmung der Skalierung. Oben: Plateaukontur. Unten: Zweifach-steigende Kontur.
Tab. 4: Absolute phonetische Variablen für die Skalierungsdimension und ihre Berechnung.
Variable
Messung
Beschreibung
f0-Onset
p-on
Der erste messbare Grundfrequenzwert am Beginn der Äußerung.
Pränuklearer Gipfel
p-p
Das f0-Maximum des pränuklearen H*L Akzents.
Register
r-on
Beginn der nuklearen Anstiegsbewegung. Dieser Punkt entspricht dem nuklearen Tiefton L*.
Finaler Offset
r-off
Der letzte messbare Grundfrequenzwert am Äußerungsende.
142 | Experiment 1 – Produktion: Leseaussprache
Tab. 5: Relative phonetische Variablen für die Skalierungsdimension und ihre Berechnung.
Variable
Messung
Beschreibung
Pränuklearer Anstieg
p-p - p-on
Die Tonhöhenbewegung vom Beginn der Äußerung zum pränuklearen Gipfel. Entspricht der Differenz zwischen p-p und p-on.
Finaler Anstieg
r-off - r-on
Die Tonhöhenbewegung vom Beginn des finalen Anstiegs bis zum Ende der Intonationsphrase. Entspricht der Differenz zwischen r-on und r-off.
Differenz der Anstiege (r-off - r-on) - (p-p p-on)
Das Verhältnis zwischen der nuklearen und der pränuklearen Anstiegsbewegung. Entspricht der Differenz zwischen dem finalen Anstieg und dem pränuklearen Anstieg.
Differenz der Gipfel
r-off – p-p
Der Unterschied in der Tonhöhe zwischen dem Extrempunkt des finalen Anstiegs und dem pränuklearen Gipfel. Entspricht der Differenz zwischen r-off und p-p.
Deklination
(p-on – r-on) / Zeit zwischen den Messpunkten
Abfall der Tonhöhe vom tiefen initialen Grenzton bis zum letzten tiefen Zielpunkt am Beginn des finalen Anstiegs. Entspricht der Differenz zwischen p-on und r-on.
In Anlehnung an Haan (2002) wird im Rahmen dieser Arbeit die Registerhöhe zur Verortung der Lage der Äußerung im Stimmumfang des/der Sprechers/in über den minimalen Extremwert der Äußerung ermittelt. Dieser Wert entspricht im vorliegenden Experiment immer r-on. Durch die Beschränkung auf einen pränuklearen Akzent und eine finale steigende nukleare Kontur kann im Rahmen des Experiments pitch range nicht als eigenständiger Parameter losgelöst von den lokalen Bewegungen erfasst werden. Stattdessen ergeben sich Variationen in der pitch range implizit, wenn im Rahmen der Auswertung festgestellt werden kann, dass sowohl der pränukleare als auch der nukleare Akzent in Abhängigkeit von der pragmatischen Funktion in die gleiche Richtung skaliert werden. Alignierung: Auf Ebene der Alignierung soll untersucht werden, ob die pragmatische Funktion der Interrogativität einen Einfluss auf die Ausrichtung der tonalen Zielpunkte relativ zum segmentalen Material besitzt. Hierzu wurden die Zeitwerte der in Abbildung 4 und Tabelle 6 angegebenen Messpunkte bestimmt und die relative Alignierung in Millisekunden (ms) ermittelt.
Methode | 143
Abb. 4: Phonetische Messpunkte zur Bestimmung der Alignierung. Oben: Plateaukontur. Unten: Zweifach-steigende Kontur.
Tab. 6: Phonetische Variablen für die Alignierungsdimension und ihre Berechnung.
Variable
Messung
Beschreibung
Alignierung pränuklearer Gipfel
O1 - p-p
Lage des pränuklearen Gipfels (p-p) in Form des f0Maximums des pränuklearen H*L Akzents in Relation zum Beginn des Vokals der akzenttragenden Silbe des pränuklearen Akzents (O1).
Alignierung nukle- O2 - r-on arer Akzentton
Lage des nuklearen Akzenttons L* (r-on) in Form des Anstiegsbeginns der nuklearen f0-Bewegung in Relation zum Beginn des Vokals der akzenttragen Silbe des nuklearen Akzents (O2).
Alignierung nukle- O2 - r-el arer Folgeton
Lade des hohen Folgetons H (r-el) in Form des ersten Knicks nach dem nuklearen Anstieg in einen flacheren Anstieg oder ein Plateau in Relation zum Beginn des Vokals der akzenttragen Silbe des nuklearen Akzents (O2).
Shaping: Anhand des shapings soll untersucht werden, ob der Übergang zwischen tonalen Zielpunkten einen linearen, einen konvexen oder einen konkaven Tonhöhenverlauf aufweist. Dabei muss für den pränuklearen Fall zuerst
144 | Experiment 1 – Produktion: Leseaussprache
zwischen zwei möglichen tonalen Realisierungen unterschieden werden, die sich aufgrund des Phänomens des tone-linkings ergeben. Tone-linking beschreibt nach Gussenhoven (1991) für die vorliegenden Konturen, dass der Übergang des fallenden pränuklearen Akzents in den direkt nachfolgenden Akzent auf zwei Arten realisiert werden kann, wie in Abbildung 5 illustriert. Ohne tone-linking bestimmt der fallende pränukleare Akzent einen eigenen tiefen Zielpunkt für den Fall, sodass sich zwischen dem Ende des pränuklearen Falls und dem nachfolgenden nuklearen Akzent durch Tonausbreitung des tiefen Folgetons ein tiefes Plateau ergibt. Total linking16 beschreibt die Tilgung des tiefen Folgetons des pränuklearen Akzents. Demnach fällt der Melodieverlauf graduell vom hohen pränuklearen Akzent zum tiefen nuklearen Akzent ab.
Abb. 5: Zwei Fälle des tone-linkings am Beispiel der H*L L*H H% Sequenz.
Da die Realisierung eines tiefen Zielpunktes zwischen pränuklearem Gipfel und nuklearem Anstieg einen erheblichen Einfluss auf das shaping des Übergangs hat, werden die Produktionen im Folgenden als linking für einen gemeinsamen Zielpunkt und kein linking für zwei separate Zielpunkte bezeichnet und getrennt analysiert. Der ursprüngliche Messpunkt zur Erfassung des shapings, wie ihn Dombrowski und Niebuhr (2005) verwenden, eignet sich für die vorliegende Untersuchung nur bedingt. In Kapitel 2.2.2 wurde gezeigt, dass Dombrowski und Niebuhr (2005) die range proportion als Verhältnis des finalen Anstiegs bis zum Ende der Akzentsilbe relativ zur Gesamthöhe des finalen Anstiegs als Maß für das shaping festlegen. Dabei wurde dargelegt, dass dieser Messwert dazu
|| 16 Der Fall des partial linkings wird ausgespart, da dieser keine Relevanz für die Konturwahl des vorliegenden Experiments hat.
Methode | 145
tendiert, tonale Unterschiede zwischen H* und L*H statt phonetischer Unterschiede zu erfassen. Diese werden im Rahmen der vorliegenden Arbeit bereits über die tonale Analyse erfasst. Um auch das shaping-Merkmal von Kaiser und Baumann (2013) zu berücksichtigen, wird wie in Kapitel 2.2.2 auch die Alignierung des L* Akzenttons auf Effekte getestet. Gleichzeitig soll neben dem shaping in Form der Ausrichtung und Skalierung tonaler Zielpunkte das shaping wie bei Petrone und Niebuhr (2014) in Form des Übergangs zwischen tonalen Zielpunkten bestimmt werden. Hierzu wird sowohl das shaping des pränuklearen Anstiegs, des pränuklearen Falls als auch des nuklearen Anstiegs vom tiefen Akzentton bis zum hohen Folgeton und als Ganzes untersucht. Um einen Einfluss der variierenden zeitlichen Ausrichtung der tonalen Zielpunkte auf das shaping auszuschließen, werden diese wie im letzten Kapitel beschrieben zusätzlich auf Alignierung getestet. Der Reliabilität halber wird der zeitliche Mittelpunkt zwischen tonalen Zielpunkten als center of gravity für die Ermittlung der range proportion festgelegt (s. Kapitel 2.2.3). Hieraus ergeben sich die in Abbildung 6 und Tabelle 7 dargestellten Messpunkte.
Abb. 6: Phonetische Messpunkte zur Bestimmung des shapings. Oben: Plateaukontur. Unten: Zweifach-steigende Kontur.
146 | Experiment 1 – Produktion: Leseaussprache
Tab. 7: Phonetische Variablen für die shaping-Dimension und ihre Berechnung.
Variable
Messung
Beschreibung
range proportion pränuklearer Anstieg
(p-m - p-on) / (p-p p-on)
Entspricht dem Verhältnis zwischen dem Anstieg vom pränuklearen Onset (p-on) zum zeitlichen Mittelpunkt des pränuklearen Anstiegs (p-m) relativ zum gesamten pränuklearen Anstieg vom pränuklearen Onset (p-on) zum pränuklearen Gipfel (p-p).
range proportion pränuklearer Fall
Mit tone-linking: (r-on - pf-m) / (r-on - p-p) Ohne tone-linking: (p-off - pf-m) / (p-off - p-p)
Entspricht dem Verhältnis zwischen dem Fall vom zeitlichen Mittelpunkt des pränuklearen Falls (pfm) zum, mit tone-linking, Beginn des nuklearen Anstiegs (r-on) oder ohne tone-linking zum Ende des pränuklearen Falls (p-off) relativ zur gesamten Fallbewegung vom pränuklearen Gipfel (p-p) zum Ende des Falls (Linking: r-on, Kein Linking: p-off).
range proportion finaler Anstieg bis Ellenbogen
(r-m - r-on) / (r-el - r-on)
Entspricht dem Verhältnis zwischen dem Anstieg vom nuklearen Onset (r-on) zum zeitlichen Mittelpunkt des nuklearen Anstiegs (r-m) relativ zum gesamten nuklearen Anstiegs vom nuklearen Onset (r-on) zum nuklearen Ellenbogen (r-el) als ersten deutlichen Knick im finalen Anstieg in einen flacheren Anstieg oder in ein Plateau.
range proportion (r-el - r-on) / finaler Anstieg gesamt (r-off - r-on)
Entspricht dem Verhältnis zwischen dem nuklearen Anstieg vom nuklearen Onset (r-on) zum nuklearen Ellenbogen (r-el) relativ zum gesamten finalen Anstieg vom nuklearen Onset (r-on) bis zum letzten messbaren f0-Wert der Äußerung (roff). Entspricht dem range proportion Parameter nach Dombrowski und Niebuhr (2005, 2010).
4.2.5 Statistische Analyse Für die statistische Analyse wurden lineare gemischte Modelle mittels R (R Core Team 2015) verwendet. Als feste Effekte wurden PRAGMATISCHE FUNKTION (FUN) mit den Ausprägungen Aussage und Frage, WORTSTELLUNG (WOR) mit den Ausprägungen V1 und V2, FINALITÄT (FIN) mit den Ausprägungen Final und Nonfinal und GESCHLECHT mit den Ausprägungen Weiblich und Männlich sowie alle möglichen Zwei-Wege-Interaktionen bestimmt. Die zufälligen Effekte beinhalteten sowohl die random intercepts für SUBJECT und ITEM als auch die random slo-
Ergebnisse | 147
pes für Subject und Item in Abhängigkeit von PRAGMATISCHER FUNKTION, WORTSTELLUNG und FINALITÄT. Die abhängigen Variablen wurden nach den drei phonetischen Dimensionen unterteilt. Für die Skalierung wurden die abhängigen Variablen f0-Onset, pränuklearer Gipfel, finaler Offset, Register, pränuklearer Anstieg, finaler Anstieg, Differenz der Anstiege, Differenz der Gipfel und Deklination festgelegt. Für die Alignierung wurden die abhängigen Variablen Alignierung pränuklearer Gipfel, Alignierung nuklearer Akzentton und Alignierung nuklearer Folgeton festgelegt. Für das Shaping wurden die abhängigen Variablen range proportion pränuklearer Anstieg, range proportion pränuklearer Fall (mit und ohne tone-linking), range proportion finaler Anstieg bis Ellenbogen sowie range proportion finaler Anstieg gesamt bestimmt. Die linearen gemischten Modelle wurden unter Verwendung der lmerFunktion des lme4-Pakets (Bates, Macheler, Bolker & Walker 2015) erstellt. Für jede abhängige Variable wurde zuvor das jeweils am besten angepasste Modell mittels der step-Funktion des lmerTest-Pakets (Kuznetsova, Brockhoff & Christensen 2016) ermittelt. In Modellen, die nicht konvergierten, wurden die random slopes der ITEMS eliminiert. Die p-Werte wurden unter Verwendung der Satterthwaite-Approximation des lmerTest-Pakets (ebd.) kalkuliert. Da sich für jedes Modell unterschiedliche Kombinationen aus random intercepts und random slopes ergeben, werden diese zusammen mit den statistischen Kennwerten berichtet. Aus ökonomischen Gründen wird hierfür eine Kurznotation wie in Beispiel 5 verwendet. Die Notation in Beispiel 5 entspricht signifikanter Variation der random intercepts für Subject und Item, repräsentiert durch 1, und random slopes by-Subject für PRAGMATISCHE FUNKTION (FUN), WORTSTELLUNG (WOR) und FINALITÄT (FIN), jedoch ohne random slopes für ITEM. (5)
Subject(1+FUN+WOR+FIN). Item(1)
4.3 Ergebnisse Zu Beginn des Kapitels soll die Verteilung der produzierten Äußerungen bezüglich der tonalen Struktur dargestellt werden. Im Anschluss werden die Ergebnisse der untersuchten phonetischen Variablen getrennt nach den drei separaten Dimensionen der Skalierung (Kapitel 4.3.2), der Alignierung (Kapitel 4.3.3) und des shapings (Kapitel 4.3.4) dargestellt. In Kapitel 4.3.5 werden die Hauptergebnisse der Arbeit noch einmal zusammenfassend präsentiert.
148 | Experiment 1 – Produktion: Leseaussprache
4.3.1 Verteilung des Materials Tabelle 8 gibt einen Überblick über alle Äußerungen des Produktionsexperiments, die bei der akustischen Analyse berücksichtigt wurden. Tab. 8: Verteilung der Produktionen von Experiment 1 getrennt nach Kontur und Satztyp mit Angaben zu Äußerungs- und Sprecherzahl. Linke Zahl: weiblichen Sprecherinnen. Rechte Zahl: männliche Sprecher.
L*H H%
L*H 0%
Äußerungen
Sprecher
Äußerungen
Sprecher
Deklarativfragen
234 / 196
11 / 10
-
-
V2 Aussagen
68 / 61
6/4
114 / 112
9/6
Entscheidungsfragen
256 / 185
11 / 10
-
-
Alternativfragen
68 / 82
6/4
118 / 131
9/6
V1 Aussagen
77 / 63
6/4
94 / 149
9/6
Die Verteilung der nuklearen Konturen gemäß Tabelle 8 zeigt, dass eine Alternanz der Konturen nur in den fortgesetzten Äußerungstypen auftritt und sowohl Deklarativ- als auch Entscheidungsfragen ausnahmslos mit einer zweifach-steigenden Kontur (L*H H%) realisiert wurden. Dies ist für die folgende Darstellung der Ergebnisse essenziell, da somit innerhalb der Plateaukonturen keine Effekte für den festen Faktor FINALITÄT ermittelt werden können. Die fortgesetzten Äußerungstypen weisen gemäß den Erwartungen aus Kapitel 4.2.1 eine Präferenz für Plateaukonturen auf. Die Verteilung nach Satztypen zeigt, dass sich keine Korrelation zwischen PRAGMATISCHER FUNKTION und Konturwahl feststellen lässt. Es lässt sich interindividuelle Variation in der Präferenz der beiden Konturtypen zwischen den Sprecher/innen beobachten. Des Weiteren zeigen einzelne Sprecher/innen ausgewogene Alternanz zwischen beiden Konturtypen. In keinem Fall jedoch finden sich Sprecher/innen, die die Konturen funktional Fragen und Aussagen zuordnen. Eine Besonderheit in der Verteilung besteht in Abhängigkeit vom GESCHLECHT. Während die männlichen Sprecher jeweils nur einen Konturtyp wählen und in ihrer Konturwahl konsequent bleiben, alternieren nur die weiblichen Sprecher/innen in der Konturwahl, ohne dabei jedoch ein Muster in Abhängigkeit von der PRAGMATISCHEN FUNKTION erkennen zu lassen.
Ergebnisse | 149
Wie in Kapitel 4.2.4 beschrieben, zeigt sich Variation in der tonalen Struktur zudem im sogenannten tone-linking des pränuklearen Akzents. Tabelle 9 präsentiert die Verteilung der beiden Typen von tone-linking aufgeteilt nach Kontur und Satztyp. Aufgrund von Störungen im Grundfrequenzverlauf konnte das tone-linking nicht für alle Realisierungen ermittelt werden, weshalb die Summe der linking und kein linking Fälle nicht immer mit der Gesamtzahl der Äußerungen übereinstimmt. Tab. 9: Verteilung des tone-linkings getrennt nach Kontur und Satztyp. Linke Zahl: weiblichen Sprecherinnen. Rechte Zahl: männliche Sprecher.
Kontur
H%
0%
Anzahl
Kein Linking
Linking
Kein Linking
Linking
Deklarativfragen
234 / 196
206 (88 %) / 123 (63 %)
23 (10 %) / - / 65 (33 %) -
Anzahl
-/ -
-/ -
V2-Aussagen
68 / 61
54 (79 %) / 45 (74 %)
9 (13 %) / 7 (12 %)
101 (89 %) / 51 (46 %)
13 (11 %) / 54 (48 %)
Entscheidungs- 256 / fragen 185
166 (65 %) / 103 (56 %)
84 (33 %) / - / 74 (40 %) -
-/ -
-/ -
Alternativfragen
68 / 82
36 (53 %) / 49 (60 %)
27 (40 %) / 118 / 29 (35 %) 131
70 (59 %) / 18 (14 %)
45 (38 %) / 110 (84 %)
V1-Aussagen
77 / 63
52 (68 %) / 35 (56 %)
21 (27 %) / 94 / 26 (41 %) 149
68 (72 %) / 23 (15 %)
21 (22 %) / 120 (81 %)
114 / 112
In Tabelle 9 lässt sich ablesen, dass die Anzahl der Äußerungen ohne tonelinking generell überwiegt. Eine Auffälligkeit besteht darin, dass sich das Verhältnis von linking zu kein linking in den mit Plateaukontur realisierten Produktionen der männlichen Sprecher umkehrt. Diese Verteilung findet sich weder bei den weiblichen Sprecherinnen, noch bei den zweifach-steigenden Realisierungen der männlichen Sprecher. Eine Erklärung kann hierfür nicht gegeben werden. Generell lässt sich jedoch feststellen, dass sich in Tabelle 9 keine systematische Abweichung im tone-linking in Abhängigkeit vom Satztyp beziehungsweise vom Satzmodus ergibt und tone-linking folglich für die Markierung von Interrogativität keine erkennbare Rolle spielt.
150 | Experiment 1 – Produktion: Leseaussprache
4.3.2 Phonetische Effekte der Skalierung Tabelle 10 gibt einen Überblick über die statistischen Signifikanzen der vier Hauptfaktoren und Tabelle 11 über alle signifikanten Zwei-Wege-Interaktionen beschränkt auf die zweifach-steigenden Konturen, da keine Interaktionen in Plateaukonturen gefunden wurden.17 Tabelle 12 berichtet die statistischen Signifikanzen der PRAGMATISCHEN FUNKTION getrennt nach GESCHLECHT für die Faktoren finaler Offset, finaler Anstieg, Differenz der Anstiege und Differenz der Gipfel in zweifach-steigenden Konturen, die eine signifikante Interaktion für PRAGMATISCHE FUNKTION und GESCHLECHT im Gesamtmodell zeigen. Tab. 10: Statistische Signifikanzen der festen Faktoren für die phonetische Skalierung getrennt nach Kontur. Linke Spalte: L*H 0%. Rechte Spalte: L*H H%.
GESCHLECHT
PRAG. FUNKTION
WORTSTELLUNG
FINALITÄT
F0-Onset