283 19 12MB
German Pages 213 [216] Year 2006
BEIHEFTE ZUR ZEITSCHRIFT FÜR ROMANISCHE P H I L O L O G I E B E G R Ü N D E T V O N GUSTAV G R Ö B E R H E R A U S G E G E B E N VON G Ü N T E R HOLTUS
Band 338
RICHARD WALTEREIT
Abtönung Zur Pragmatik und historischen Semantik von Modalpartikeln und ihren funktionalen Äquivalenten in romanischen Sprachen
MAX N I E M E Y E R VERLAG T Ü B I N G E N 2006
Gedruckt mit Unterstützung der Newcastle University
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. ISBN 13: 9783-484-52338-8 ISBN 10: 3-484-52338-7
ISSN 0084-5396
© Max Niemeyer Verlag, Tübingen 2006 Ein Unternehmen der Walter de Gruyter G m b H & Co. KG http://www.niemeyer.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbeständigem Papier. Druck: AZ Druck und Datentechnik G m b H . Kempten Einband: Norbert Klotz, Jettingen-Scheppach
Inhaltsverzeichnis
Vorwort
IX
1. Einleitung: Modalpartikeln, Abtönungspartikeln, Abtönung 1 1.1. Die Modal- oder Abtönungspartikeln 1 1.2. Modalpartikeln, Diskurspartikeln, Diskursmarker 3 1.3. Zur Bedeutung von Partikeln: Minimalismus, Maximalismus, Polysemie.... 8 1.3.1. Haben Partikeln eine Bedeutung? 8 1.3.2. Minimalismus, Maximalismus, Polysemie 9 1.4. Abtönung ohne Partikeln 12 1.4.1. Abtönungspartikeln und Abtönungsformen 12 1.4.2. Übersetzungsvergleiche als Heuristik fur Abtönungsformen 14 1.4.3. Der «Reichtum» des Deutschen an Modalpartikeln: eine optische Täuschung? 16 1.4.3.1. Probleme der Übersetzbarkeit 16 1.4.3.2. Grammatikographische Illusionen 17 1.4.3.3. Modalpartikeln und Abtönungspartikeln 18 1.4.4. Funktional-pragmatische Legitimation von Abtönung als übereinzelsprachlicher Größe 18 1.4.5. Universale Funktionen der Sprache und die Wortarten 22 1.5. Abtönung: Prozedurale Instruktionen oder illokutionäre Modifikation? 22 1.6. Illokution, Aktivitätstypen und Diskurstraditionen 25 1.7. Sätze, Sprechakte und generalisierte konversationeile Implikaturen (GCIs) 29 1.7.1. Generalisierte und partikularisierte konversationeile Implikaturen 29 1.7.2. Konversationsimplikaturen und Aktivitätstypen 31 1.7.3. Konversationsimplikaturen und Sprechakte 32 1.7.4. GCI-Theorie und Theorie des Satzmodus 34 1.8. Zusammenfassung 37 2. Was ist Abtönung? Zur dt. Partikel ja 2.1. Verwendungen der Partikel ja 2.2. Die Modalpartikel ja 2.2.1. Drei Varianten der Modalpartikel ja 2.2.2. Minimalistische Analysen der Modalpartikel ja 2.3. Hypothese 1: Abtönung als Antizipation der Hörerreaktion 2.3.1. Die kommunikative Redefinition der Modalität bei Givon (1995) 2.3.2. Antizipation der Hörerreaktion in Assertionen: die Modalpartikel ja
39 39 42 42 43 46 46 48
V
2.3.3. «Schwere» und «leichte» Formen der Rechtfertigung 50 2.4. Modalpartikel und Antwortpartikel 52 2.4.1. Hypothese 2: Die Abtönungsform evoziert einen typischen Gebrauchskontext ihres nicht-modalen Gegenstücks 52 2.4.2. Der diachrone Weg von Antwort- zu Modalpartikel 54 2.5. Antwortpartikel und Diskurspartikel 56 2.5.1. Syntaktische Position von Modalpartikel und Diskurspartikel 56 2.5.2. Ja als Modalpartikel vs. Diskurspartikel: Bezug auf die illokutiven vs. diskurssyntaktischen Merkmale der Antwortpartikel 60 2.6. Ist «Abtönung» eine einheitliche Kategorie? 61 2.7. Polyphonie 62 2.7.1. Was ist Polyphonie? 63 2.7.2. Polyphonie und «Footing» 66 2.7.3. Bedeutungswandel als Übergang von principal zu enonciateur 68 2.7.4. Polyphonie bei der Modalpartikel ja 69 2.8. Delokutivität 70 2.8.1. Delokutiver Bezug auf den Kontext 70 2.8.2. Das Verhältnis zwischen Abtönungsform und ihrem gleichlautenden Gegenstück: Eine Relation nicht zwischen zwei Wörtern, sondern zwischen zwei Sätzen 72 2.9. Zusammenfassung 73 3. Die französische Partikel quand meme 75 3.1. Quand meme: Adverb und Partikel 75 3.2. Der semantisch-pragmatische Effekt von quand meme 78 3.2.1. Hat quand meme mehrere Bedeutungen? 78 3.2.2. Der Abtönungseffekt von quand meme 80 3.2.3. Die Partikel quand meme in verschiedenen Sprechakten 83 3.3. Zur Geschichte von quand meme 85 3.4. Zum Verhältnis der Varianten von quand meme 90 3.4.1. Modaler Kontrast 91 3.4.2. Heterosemie 92 3.4.3. Delokutivität 93 3.5. Noch einmal zur Theorie: Ein Szenario zur Entstehung von Abtönungsformen 95 3.5.1. Erster Schritt: Abusiver Gebrauch einer Form durch Sprecher 95 3.5.2. Zweiter Schritt: Reanalyse der missbräuchlich verwendeten Form als Abtönungsform durch die Hörer 97 3.5.3. Frequenzsteigerung und Wirkungsverlust 99 3.5.4. Zur Abgrenzung der Genese von Abtönungsformen, der Genese von Diskurspartikeln und von Grammatikalisierung 101 3.6. Andere Abtönungspartikeln in romanischen Sprachen 105 3.6.1. Abtönender Gebrauch deiktischer Lokaladverbien: Französisch lä und brasilianisch-portugiesisch ai und Ιά 105 3.6.2. Italienisch pure 107
VI
4. Diminutive im Portugiesischen 109 4.1. Verkleinerung und positive affektive Einstellung 109 4.2. Der Verweis auf nicht-ernste Sprechsituationen 112 4.2.1. Kinder-zentrierte Sprechsituationen 112 4.2.2. Die Übertragung auf haustier- und geliebtenzentrierte Situationen ..115 4.2.3. [Nicht-ernst] als Form der Abtönung 117 4.3. Zum Verhältnis der Funktionen des Diminutivs 118 4.3.1. Drei Funktionen 118 4.3.2. Ist die Beziehung zwischen den Funktionen metaphorisch? 120 4.3.3. Welche Funktion ist zuerst da: 'klein' oder [nicht-ernst]? 121 4.3.4. Der Funktionswandel zu [nicht-ernst] als Entstehung eines Abtönungsphänomens 122 4.3.5. Neue Wortbildungsbasen für die abtönende Funktion 126 4.4. Ausblick: Augmentative 127 5. Prosodische Abtönung 5.1. Intonation als Abtönungsverfahren: Vorüberlegungen 5.1.1. Die Pilotstudie von Schubiger (1972) 5.1.2. Ausgangsintuition und erste Beispiele 5.2. Intonationskonturen als einzelsprachliche Ausdrucksmittel 5.2.1. Zur Erforschung der Intonation der romanischen Sprachen 5.2.2. Das Beschreibungssystem von Janet Β. Pierrehumbert 5.3.1-Topikalisierung und Fall-Rise Kontur 5.3.1. Die I-Topikalisierung 5.3.2. Die Fall-Rise-Kontur 5.3.3. Zur inhaltlichen Analyse der L*+H Kontur: Eine Interaktion von Intonation und Informationsstruktur 5.3.4. L*+H als Abtönung: Pragmatische Überlegung 5.3.5. L*+H als diachrones Zitat der elliptischen Frage: Semantische Überlegung 5.3.6. L*+H als Abtönung: Phonologische Überlegung
129 129 129 131 132 132 135 136 137 139
6. Rechtsversetzung im Italienischen 6.1. Der abtönende Effekt der Rechtsversetzung: Erste Annäherung 6.2. Rechtsversetzung vs. Linksversetzung 6.3. Der Abtönungseffekt der Rechtsversetzung 6.4. Kataphorische Manipulation der Diskurswelt 6.5. Unmittelbar vorerwähnte Diskursreferenten 6.6. Zur Diachronie der Rechtsversetzung im Italienischen 6.7. Konventionalisierungsphänomene der italienischen Rechtsversetzung 6.7.1. Intonation: eine unitä tonale oder zwei? 6.7.2. Weitergehende Konventionalisierungseffekte: Segmentierung indefiniter Nominalphrasen und Kongruenzverlust. 6.8. Fragen und Negationen 6.9. Andere syntaktische Abtönungsverfahren: Französisch t 'as qu'ä
151 152 153 157 158 163 164 168 168
VII
140 142 143 146
170 172 174
7. Abtönung in Abgrenzung zu anderen pragmatischen Kategorien 7.1. Abtönung vs. Höflichkeit 7.1.1. Die Theorie der Höflichkeit bei Brown/Levinson 7.1.2. Vielfalt der Höflichkeitseffekte 7.1.3. Höfliche Abtönungsverfahren 7.1.4. Ist Abtönung nur eine Form von Höflichkeit? 7.2. Abtönung vs. Abschwächung 7.2.1. Abschwächung als pragmatische Kategorie bei Briz (1995) 7.2.2. Ist Abtönung auch Abschwächung (oder umgekehrt)?
177 177 178 182 182 184 186 186 188
8. Rückblick
191
9. Literaturverzeichnis 9.1. Corpora, Quellen und Lexika 9.2. Wissenschaftliche Literatur
195 195 195
VIII
Vorwort
Modalpartikeln wie ja, doch, eigentlich, halt usw. gelten seit langem als ein Spezifikum des Deutschen bzw. der festlandgermanischen Sprachen. Romanische Sprachen haben solche Modalpartikeln nicht. In der Forschung ist aber immer davon ausgegangen worden, dass der semantische und pragmatische Effekt der deutschen Partikeln - Abtönung - in den romanischen (und anderen) Sprachen durch andere Formtypen verschiedenster Art erreicht wird: pragmatische Verwendungen der Diminutive (Johnen 1995), Intonation (Schubiger 1965), Rechtsdislokation (Ulrich 1985) u.v.a.m. Um dies zu belegen und um überhaupt diese Mittel herauszufinden, sind oft literarische deutsche Werke mit ihren romanischen Übersetzungen verglichen worden. Mit diesem Verfahren kann aber immer nur die Intuition und das Wissen des Übersetzers rekonstruiert werden. Einen Schritt weiter scheint die Frage zu gehen, warum die vom Übersetzer gewählten Formen in den romanischen Sprachen den gleichen Effekt hervorbringen können wie die deutschen Partikeln. Hierfür ist zunächst ein theoretisch-pragmatisches (vom Ausdruck unabhängiges) Kriterium dafür nötig, was Abtönung ist. Dies zu erarbeiten wird in dieser Arbeit unternommen (Hypothese 1, Kap. 2.3.). Gleichzeitig wird gezeigt, dass die deutschen Modalpartikeln mit ihren Äquivalenten anderer Sprachen nicht nur funktional, sondern auch formal etwas gemeinsam haben: sie entstehen diachron durch einen sehr spezifischen Sprachwandelkanal (Hypothese 2, Kap. 2.4.). Die gewählte Perspektive bedingt also, dass auf Übersetzungsvergleiche verzichtet wird. Natürlich kann hier nicht beansprucht werden, exhaustiv die Abtönungsmöglichkeiten der romanischen Sprachen wiederzugeben. Vielmehr soll an einigen Fällen exemplarisch gezeigt werden, wie mithilfe verschiedenster sprachlicher Mittel abgetönt werden kann. 1 Mit der Wahl verschiedener Verfahren aus verschiedenen romanischen Sprachen soll ein Eindruck von der Vielfalt der Abtönungsmöglichkeiten in dieser Sprachfamilie vermittelt werden. - Es ist dies keine rein theoretische Arbeit; ich stützte mich bei meinen eigenen Analysen stets auf veröffentlichte Corpora authentischer gesprochener Sprache. Die verwendeten Corpora sind im Literaturverzeichnis erwähnt. Ich habe dabei die jeweiligen Transkriptionskriterien in meinen Zitaten stark vereinfacht, um ein einheitliches Format zu erreichen. In Kapitel 1 werden die theoretisch-pragmatischen Grundlagen erörtert, an denen ich mich in dieser Arbeit orientieren werde. In Kapitel 2 wird anhand der deutschen
Eine Anwendung des hier zugrunde gelegten, in einer ersten Form schon in Waltereit (2001) vorgestellten Modells auf die doppelte Negation des brasilianischen Portugiesisch bietet Schwenter (2005).
IX
Partikel ja ein Modell für Abtönung entwickelt. In Kapitel 3 exemplifiziere ich dieses Modell für die französische Partikel quand meme\ dabei wird speziell in Kap. 3.5. das historisch-semantische Modell für Abtönung auch verfeinert werden. In den folgenden Kapiteln wird gezeigt, dass das Modell auch nicht-partikelförmige Abtönungsverfahren zu beschreiben vermag. Hierfür werden in Kapitel 4 bestimmte Verwendungen portugiesischer Diminutive erörtert. In Kapitel 5 werden suprasegmental-phonologische Abtönungsverfahren diskutiert. In Kapitel 6 wird eine syntaktische Konstruktion des Italienischen, die Rechtsversetzung, auf ihre abtönende Funktion hin überprüft. Alle diese Verfahren sind in der Literatur schon einmal in Zusammenhang mit Abtönung gebracht worden, aber es ist nie erklärt worden, wie dieser abtönende Effekt zustande kommt und was diese Verfahren mit den deutschen Modalpartikeln gemeinsam haben. Neben diesen eingehender studierten Fällen wird jeweils auch für weitere Phänomene angedeutet, wie die sich so ergebende Liste erweitert werden kann. In Kapitel 7 werde ich Abtönung noch einmal gesamthaft in den Blick nehmen und sie insbesondere von anderen pragmatischen Kategorien abgrenzen, mit denen sie leicht in Verbindung gebracht werden kann, nämlich «Höflichkeit» und «Abschwächung». Das vorliegende Buch ist die überarbeitete Fassung meiner Tübinger Habilitationsschrift. Sie wurde begutachtet von Maj-Britt Mosegaard Hansen (Kopenhagen), Peter Koch und Marga Reis (Tübingen) und Harald Weydt (Frankfurt/Oder). Ich möchte allen danken, die zum Zustandekommen dieser Arbeit beigetragen haben. An erster Stelle Peter Koch, auf den die Anregung zum Thema zurückgeht, mit dem ich viel darüber diskutieren konnte, der frühere Fassungen der Arbeit kommentiert hat und der mich seit mehr als zehn Jahren immer gefördert und angespornt hat. Ich habe bei ihm weit mehr gelernt, als aus den Literaturverweisen hervorgeht. Mein ganz besonderer Dank geht an Ulrich Detges für seinen ununterbrochenen fachlichen Rat und seine ebenfalls ununterbrochen arbeitstägliche Unterstützung, Bestärkung und freundschaftliche Begleitung in den gemeinsamen Tübinger Jahren und darüber hinaus. Den Gutachtern möchte ich für ihre wertvollen Hinweise und Kritikpunkte meinen Dank aussprechen. Ich danke allen aus der Tübinger Sprachwissenschaft, die die Entstehung der Arbeit begleitet und mir mit Anregungen, Kritik und Hinweisen geholfen haben, namentlich Tanja Autenrieth, Klaus Böckle, Sarah Dessi Schmid, Angela Dorn, Jean-Pierre Durafour, Paul Gevaudan, Hanneke van Hoof, Johannes Kabatek, Reinhard Meisterfeld, Wiltrud Mihatsch, Antonia Neu und Brigitte Schlieben-Lange. Für viele Hinweise, Gespräche und Kommentare danke ich Andreas Blank, Colette Cortes, Hang Ferrer Mora, Maj-Britt Mosegaard Hansen, Daniel Jacob, Daniel Oskui, Salvador Pons Borderia, Martin Riegel, Marina Sbisä und Scott Schwenter. Günter Holtus danke ich für die Aufnahme der Schrift in die Beihefte zur Zeitschrift für romanische Philologie. Dem Max Niemeyer Verlag, insbesondere Ulrike Dedner und Norbert Alvermann, danke ich für die freundliche verlegerische Betreuung. Für die Hilfe bei der Herstellung der Druckvorlage danke ich Nathalie Gerber und Melanie Hege. Ganz besonders danke ich Nicoletta. Newcastle-upon-Tyne, Januar 2006
X
Richard
Waltereit
1. Einleitung: Modalpartikeln, Abtönungspartikeln, Abtönung
1.1. D i e M o d a l - o d e r A b t ö n u n g s p a r t i k e l n Im Deutschen gibt es eine Klasse v o n Partikeln, die die Forschung seit der grundlegenden Arbeit v o n W e y d t ( 1 9 6 9 ) viel beschäftigt, die s o genannten Modal- oder A b tönungspartikeln. 1 Einige Beispiele dafür sind die hervorgehobenen Ausdrücke in den folgenden Sätzen: (1) (2) (3) (4) (5) (6) (7) (8) (9)
Du weißt ja, dass mir ein solches Verhalten überhaupt nicht gefallt. Hier ist ja noch ein alter Hundertmarkschein. Du wirst das schon schaffen. Er hat von diesem Thema eigentlich gar keine Ahnung. Du spinnst wohl\ Wir können da halt nichts mehr dran ändern. Man sollte sich eben informieren, bevor man so etwas macht. Was ist denn das Problem? Lass da bloß die Finger von!
D i e s e Partikeln haben eine Reihe v o n formalen Eigenschaften, die in der germanistischen Forschung dazu geführt haben, sie als eine e i g e n e Wortart zu betrachten (cf. Heibig 1988, Thurmair 1989, 39, Meibauer 1994, 3 0 - 3 2 , Autenrieth 2 0 0 2 ) : (10a) Sie erscheinen in einer bestimmten syntaktischen Position, nämlich im Mittelfeld des deutschen Satzes, d.h. zwischen finitem und nicht-finitem Teil des Verbs, und dort meist vor dem Rhema; (10b) sie sind nicht flektierbar; (10c) sie sind meist unbetont (betont werden können jedoch ja und bloß) (lOd) sie sind fakultativ; (lOe) sie haben Skopus über den ganzen Satz; (lOf) sie sind nicht koordinierbar; (10g) sie sind nicht modifizier- oder erweiterbar; (10h) sie sind nicht erfragbar; (lOi) sie können nicht negiert werden; (lOj) ihr Auftreten ist vom jeweiligen Satztyp abhängig; (10k) sie sind miteinander kombinierbar.
1
Der Begriff «Abtönungspartikel» wurde von Weydt (1969) in Umlauf gebracht. Weydt weist allerdings selbst darauf hin, dass das Wort «Abtönung», «abtönen» mit ähnlicher Bedeutung auch schon in Schulgrammatiken der 1950er Jahre verwendet wurde. Ich verwende, im Einklang mit der Forschungsliteratur, die Termini Modalpartikel und Abtönungspartikel zunächst synonym und werde sie erst in 1.4.3.3. terminologisch differenzieren.
1
Autenrieth (2002,34) weist darauf hin, dass das Kriterium (10a) das einzige ist, welches die Modalpartikeln nicht mit anderen Wortarten teilen. Da dieses Kriterium spezifisch auf die Topologie des deutschen Satzes abhebt, müssen somit Modalpartikeln im Sinne der Liste (10) auf das Deutsche bzw. Sprachen, die in dieser Hinsicht wie das Deutsche sind, beschränkt sein (cf. Abraham 1988). Zu diesen Sprachen mit Modalpartikeln gehören die anderen festlandgermanischen Sprachen, z.B. Niederländisch und Dänisch (Davidsen-Nielsen 1996, Hansen 1998,41), nicht jedoch Englisch. Überhaupt spricht man von Modalpartikeln praktisch nur bei den germanischen Sprachen.2 In den romanischen Sprachen gibt es anscheinend keine Modalpartikeln, wenn auch manchmal manche Wörter dieser Sprachen in die Nähe von Modalpartikeln gerückt werden (cf. z.B. Masi 1996, 229-260, Hansen 1998, 41s.). Während die formale Identifikation der Modalpartikeln aufgrund der Liste (10) keine größeren Schwierigkeiten bereitet (zumindest wohl keine größeren als bei anderen Wortarten auch), ist die semantische Funktion dieser Partikeln wesentlich weniger klar. Intuitiv betrachtet, scheinen sie jedoch eine untereinander ähnliche semantische Funktion zu haben. Diese Intuition ist schon im Terminus Abtönungspartikeln reflektiert. Der Begriff Abtönung ist mit Vorstellungen wie «Abschwächung», «Freundlichkeit» u.ä. assoziiert, ohne dass sich hieraus eine genauere semantische Beschreibung der Wortart ableiten ließe. Was die semantisch-pragmatische Charakterisierung von Modalpartikeln als Wortart betrifft, so werden oft die folgenden (je nach theoretischer Orientierung einander ausschließenden oder einander ergänzenden) Kriterien genannt: ( I I a ) Modalpartikeln beziehen sich auf das Verhältnis der Äußerung zum situativen Kontext (Franck 1980, Coseriu 1988, Koch/Oesterreicher 1990, König/Requardt 1991, Fischer 2000) (1 lb) Modalpartikeln modifizieren den Sprechakt (Koch/Oesterreicher 1990, Jacobs 1991, Lindner 1991) (11c) Modaipartikeln beziehen sich auf die Einstellung des Sprechers zum Gesagten (Weydt 1969, Meibauer 1994, Autenrieth 2002)
Auf die Bedeutung der Modaipartikeln werde ich genauer in 1.3. und in 2. zurückkommen. Ich möchte hier nur vorausschicken, dass keines dieser Kriterien (so sie denn zutreffend, und vor allem hinreichend eng formuliert sind) für Modalpartikeln spezifisch ist. So kann man auch von Satzadverbien wie hoffentlich, zum Glück, leider usw. sagen, dass sie sich auf das Verhältnis der Äußerung zum situativen Kontext beziehen, dass sie den Sprechakt modifizieren und dass sie sich auf die Einstellung des Sprechers zum Gesagten beziehen. Solche Satzadverbien gibt es nicht nur in den festlandgermanischen Sprachen, sondern auch in den romanischen und vielen anderen Sprachen und Sprachfamilien. Zwischen Form und Bedeutung der Modalpartikeln besteht somit eine auffallige Asymmetrie in Bezug auf die Distribution in den Sprachen der Welt: Modalpartikeln
Cf. jedoch die Angaben zu Modalpartikeln in ganz anderen Sprachfamilien bei Weydt (2001,789).
2
haben formale Eigenschaften, die für bestimmte Sprachen spezifisch sind, und somit sind diese Partikeln auch besonders typisch für diese Sprachen (cf. Coseriu 1988). Die Bedeutungsseite hingegen ist nicht fur bestimmte Sprachen und noch nicht einmal für die Wortart spezifisch. 3 So wurde in der Partikelforschung schon früh davon ausgegangen, dass die Funktion von Modalpartikeln in anderen Sprachen mit anderen Mitteln als den Partikeln selbst ausgedrückt wird. Dies wurde, wie im Vorwort erwähnt, hauptsächlich anhand von Übersetzungsvergleichen untersucht. Hier wurde geprüft, mit welchen Mitteln in Übersetzungen von (meist deutschen) Originaltexten eine Modalpartikel wiedergegeben wurde (cf. hier 1.4.2.). Diese Übersetzungsvergleiche haben wertvolle Informationen zutage gefordert und unser Wissen über Partikeln bereichert, sie können aber nicht das Hauptproblem lösen: Was sind die semantischen Eigenschaften der Übersetzungsäquivalente, die sie den Modalpartikeln ähnlich wirken lassen (und die den Übersetzer diese Form und keine andere haben wählen lassen)? Dies ist der Ausgangspunkt meiner Untersuchung. Ich will versuchen, ein ausdrucksunabhängiges und hinreichend spezifisches Kriterium dafür zu erarbeiten, was die Funktion von Modal- bzw. Abtönungspartikeln ist. Auf der Grundlage dieses Kriteriums für Abtönung können dann ohne Rückgriff auf Übersetzungsvergleiche abtönende Ausdrücke identifiziert werden, die nicht die Form von Modalpartikeln haben.
1.2. Modalpartikeln, Diskurspartikeln, Diskursmarker Für einige Autoren sind Modalpartikeln Teil einer umfassenderen Wortklasse, der Diskurspartikeln (Davidsen-Nielsen 1996), für andere Autoren jedoch gehören die Modalpartikeln nicht zu den Diskurspartikeln (Hansen 1998, Fräser 1999). Während Modalpartikeln offenbar auf bestimmte Sprachen beschränkt sind, scheinen Diskurspartikeln eine übereinzelsprachlich weit, wenn nicht sogar universal, verbreitete Wortart zu sein. Diskurspartikeln oder Diskursmarker (diese beiden Termini werden in dieser Arbeit synonym verwendet) sind Ausdrücke wie die in den folgenden Äußerungen kursiv markierten: (12)
it. £>e(LIP) «A: si si va be quello non non non guasta B: non guasta perö lo rende piuttosto ρίΰ pesante A: un ρό piü complicata B: si A: ahah be per forza mh va bene»
(13) it. poi (LIP) «Α: ecco ma eh lei faccia una letterina alia al servizio della direzione e voi dite signori la situazione dei nostri veicoli turistici e questa va bene? ο se no via mi faccia un promemoria a me B: mh si A: poi ci penso io via perche bisogna presentarla questa situazione»
3
Dies wurde auch schon von Lieb (1977) klar formuliert.
3
(14) ft. ben (ELICOP) «Α: mm mm et il vous arrive d'avoir des clientes enfin qui sont d' un bord un peu moins eleve que des gens modestes euh B: ah oui ah oui oh ben lä vous s vous savez il y a toujours moyen de s'arranger d'abord moi je vous dirais que euh je me suis toujours arrangee pour reprendre le minimum de tissu ä ma diente» (15)
fr. enfin (ELICOP) «A:et puis eux ils vont venir ils vont venir ici B: mais enfin pour Γ instant vous songez pas ä 9a vous songez au bapteme»
D a es sich bei den Diskurspartikeln, im Gegensatz zu den deutschen Modalpartikeln, nicht u m eine auf eine Einzelsprache beschränkte Wortart handelt, ist ihre Definition nicht so einfach, und die Zugehörigkeit bestimmter Elemente zu dieser Klasse kann kontrovers sein. B e i den in der Literatur gebotenen Definitionen v o n Diskurspartikeln kann man o f t eine charakteristische M i s c h u n g v o n ausdrucksseitigen und funktionalen Bestimmungselementen beobachten: (16)
«Los son unidades lingüisticas invariables, no ejercen una funcion sintäctica en el marco de la predication oracional - son, pues, elementos marginales - y poseen un cometido coincidente en el discurso: el de guiar, de acuerdo con sus distintas propiedades morfosintäcticas, semanticas y pragmäticas, las inferencias que se realizan en la comunicaciön» (Martin Zorraquino/Portoles 1999, 4057).
(17)
«Discourse markers [...] impose a relationship between some aspect of the discourse segment they are a part of, call it S2, and some aspect of a prior discourse segment, call it SI. In other words, they function like a two-place relation, one argument lying in the segment they introduce, the other lying in the prior discourse. I represent the canonical form as » (Fraser 1999, 938).
(18)
«[Discourse particles can be considered as those items which do not enter grammatical relationships with other elements of sentences; which usually occur outside sentence boundaries and constitute entire utterances themselves; which fulfil structuring, meta-languaging, turn-exchange, interpersonal and speech management functions and whose meanings contain pointers to the speaker and to other aspects of the utterance situation» (Fischer 2000, 26).
Hier werden ausdrucksseitige (Invariabilität, A b w e s e n h e i t syntaktischer Funktion, periphere Position im Satz) und inhaltliche (Steuerung diskursbezogener Inferenzen und Relationen z w i s c h e n Diskursabschnitten) B e s t i m m u n g e n verbunden. Eine solche Verbindung ist bei der Definition v o n Wortarten traditionell durchaus üblich und entspricht auch der Intuition, die in d e m hybriden Terminus
Diskurspartikel
schon angelegt ist. Schon dieser Terminus hat ja einen ausdrucksseitigen ( P a r t i k e l ) und einen inhaltlichen B e z u g (Diskurs).
Andere Autoren b e m ü h e n sich, eine aus-
drucksunabhängige, ausschließlich funktionale Charakterisierung z u geben: (19)
4
«I propose to define discourse markers as non-propositional linguistic items whose primary function is connective, and whose scope is variable. [...] It is moreover part of the definition of discourse markers that they do not contribute to the propositional content of their host units [...], and that they function as instructions from the speaker to the hearer on how to integrate the host unit into a coherent mental representation of the discourse» (Hansen 1998, 73-75).
(20)
«[Diejenigen] sprachlichen Elemente, die ausschließlich auf Instanzen und Faktoren der Kommunikation verweisen (Kontakt zwischen Produzent und Rezipient, ihre Gesprächsrollen, Diskurs/Text, (Formulierung), deiktische Konstellationen, Kontexte und Emotionen)» (Koch/Oesterreicher 1990, 51).
Eine ebenfalls funktionale Charakterisierung lässt sich Brinton (1996, 36-40) entnehmen. Brinton listet Funktionen von Diskurspartikeln auf und unterteilt diese in zwei große Gruppen: textbezogene und interpersonale Funktionen. Textbezogene Funktionen bei Diskurspartikeln sind Gliederung, Turn-taking, Verzögerungs- und Korrekturmarkierung. Interpersonale Funktionen bei Diskurspartikeln sind z.B. Ausdruck von Emotionen sowie Kontaktsignale. Die Kategorisierung als «textbezogen» bzw. «interpersonal» bei Brinton ist inspiriert von den drei Sprachfunktionen Michael Hallidays. Halliday (1970) unterscheidet die darstellungsbezogene, textbezogene und interpersonale Sprachfunktion. Brintons Zuweisung der Diskurspartikeln zu den beiden Gruppen textbezogen und interpersonal reflektiert somit auch die (wohl unkontroverse) Annahme, dass Diskurspartikeln keine darstellende Funktion haben, dass sie also keinen Beitrag zum propositionalen Gehalt ihrer Trägeräußerung leisten (Brinton 1996, 38). Vergleicht man nun Diskurspartikeln mit den Eigenschaften von Modalpartikeln, wie sie in den Listen (10) und (11) beschrieben sind, so zeigt sich, dass Diskurspartikeln im allgemeinen Sinne eine große Zahl der Eigenschaften von Modalpartikeln teilen. Zunächst zu den inhaltlichen Merkmalen der Modalpartikeln und zu deren Beziehung zu den inhaltlichen Merkmalen von Diskurspartikeln im Allgemeinen. Einerseits kann man die inhaltlichen Merkmale von Modalpartikeln relativ leicht negativ bestimmen insofern, als Modalpartikeln sicher keinen Beitrag zum propositionalen Gehalt der Trägeräußerung leisten. Dies gilt für alle der in (11) genannten inhaltlichen Merkmale der Modalpartikeln. Insofern passen ihre inhaltlichen Charakteristika zu denjenigen der Diskurspartikeln im Allgemeinen, wie sie von Brinton (1996, 3 2 ^ 0 ) beschrieben wurden: Akzeptiert man Brintons Anwendung von Hallidays drei Sprachfunktionen, so müssen Modalpartikeln, wenn sie keine darstellende Funktion haben, also eine textuelle oder eine interpersonale Funktion haben. Andererseits ist es nicht ganz einfach zu entscheiden, ob die Funktionen der Modalpartikeln, wie in (11) von anderen Autoren benannt, global als « textuell» oder als « interpersonal» klassifiziert werden können. Die Position (IIa), nach der Modalpartikeln sich auf den situativen Kontext beziehen, würde man vielleicht einer Klassifkation als in einem erweiterten Sinne textuellen Funktion zurechnen. Dies suggeriert insbesondere der von Diewald (1997; 1999) und Fischer (2000) verwendete Begriff «pragmatischer Prätext». Hiermit sind die Situationselemente gemeint, die für Sprecher und Hörer salient sind und auf die sich die Modalpartikel bezieht. Die Position (IIb), nach der Modalpartikeln den Sprechakt modifizieren, scheint eher mit einer Klassifikation als «interpersonal» identifizierbar zu sein. Denn die Konstitutionsbedingungen von Sprechakten z.B. bei Austin oder bei Searle nehmen Bezug auf das Verhältnis zwischen Sprecher und Hörer, haben also per se eine interpersonale Komponente. Sie haben jedoch keine unmittelbar textuelle Komponente, denn in der klassischen Sprechakttheorie wurden Sprechakte immer als Einzeläußerungen gesehen (cf. Kap. 1.6.). Die Position (11c) schließlich, nach der
5
Modalpartikeln sich auf die Einstellung des Sprechers z u m Gesagten beziehen, scheint recht einfach (weil sie schon begrifflich auf eine Person, nämlich den Sprecher, B e z u g nimmt) mit der Klassifikation der Modalpartikeln als interpersonal identifizierbar zu sein. Insgesamt scheint die «interpersonale» Funktion am leichtesten auf Modalpartikeln zu «passen». D e n n auch die Position ( I I a ) , die als einzige möglicherweise die Funktion v o n Modalpartikeln mit einer textuellen Funktion identifizieren würde, ist mit der Kategorisierung als «interpersonal» verträglich. Schließlich gehören auch Sprecher und Hörer als die den Diskurs konstituierenden Personen z u m «situativen Kontext»! Modalpartikeln haben aber sicherlich auch eine textgliedernde Funktion. S i e « n e h m e n [ . . . ] eine Einordnung der j e w e i l i g e n Äußerung in einen Interaktionszus a m m e n h a n g vor, dadurch, daß sie eine Äußerung mit vorausgehenden Handlungen b z w . Zuständen verknüpfen und auf Erklärungen b z w . weitere Information abzielen [ . . . ] . Modalpartikeln strukturieren damit auch ein Gespräch» ( K ö n i g 1977, 129). K o m m e n wir nun zu den formalen
Übereinstimmungen v o n Modalpartikeln mit
Diskurspartikeln im A l l g e m e i n e n (jeweils entsprechend der Liste [10]): (21a)
Diskurspartikeln erscheinen typischerweise am Anfang oder Ende einer Diskurseinheit unterschiedlicher Größe. Dies gilt für die Beispiele in (10). Die periphere Position wird durch die damit verbundene Gliederungsfunktion zum Definitionskriterium schlechthin erhoben bei Schiffrin (1987, 31), die Diskursmarker definiert als « sequentially dependent elements which bracket units of talk». Hansen (1998,66-7) und Martin Zorraquino/Portoles (1999,4063) weisen jedoch darauf hin, dass Diskursmarker manchmal auch innerhalb eines Satzes stehen können. Würden Diskursmarker ausschließlich am Rand einer Diskurseinheit erscheinen, dürften Modalpartikeln, die ja im Mittelfeld und damit inmitten eines Satzes stehen, nicht zu Diskurspartikeln gezählt werden.
(21b)
Diskurspartikeln sind nicht flektierbar. Diese für Partikeln überhaupt konstitutive Eigenschaft dürfte wohl im geringsten Maße Anlass zu Kontroversen geben.
(21c)
Im Gegensatz zu Modalpartikeln, die typischerweise unbetont sind, sind Diskurspartikeln typischerweise (aber nicht zwingend) betont bzw. bilden eigene Intonationseinheiten (Martin Zorraquino/Portoles 1999, 4064-5). Dies gilt auch fur alle Beispiele in (12)—(15).
(21d)
Nicht nur Modalpartikeln, sondern auch Diskurspartikeln im Allgemeinen sind fakultativ, d.h. die Äußerung wird nicht grammatisch unakzeptabel, wenn Diskurspartikeln fehlen.
(2 le)
Modalpartikeln haben Skopus über den ganzen Satz. Diskurspartikeln haben Skopus über Einheiten unterschiedlicher Größe (Hansen 1998, 73—4). Insofern scheinen in dieser Hinsicht Modalpartikeln zunächst ein Spezialfall von Diskurspartikeln zu sein.
(21 f-i) Wie die Modalpartikeln haben auch Diskurspartikeln im Allgemeinen die syntaktischen Eigenschaften, nicht koordinierbar, nicht modifizier- oder erweiterbar, nicht erfragbar und nicht negierbar zu sein (Martin Zorraquino/Portoles 1999,4065-9). Jedoch können manche Diskurspartikeln (im Gegensatz zu den Modalpartikeln) eine eigene Äußerung konstituieren (Martin Zorraquino/Portoles 1999,4068-9). (21j)
6
Modalpartikeln unterliegen grammatischen Beschränkungen in Bezug auf den Satztyp, in dem sie vorkommen können (Autenrieth 2002), und nicht nur pragmati-
sehen Präferenzen in Bezug auf den Sprechakt. Aus der Literatur jedoch geht nicht hervor, dass dies auch für Diskurspartikeln allgemein gilt. (21k)
Wie die Modalpartikeln sind Diskurspartikeln prinzipiell kombinierbar, wie man schon im Beispiel (15) (mais enfin) sehen kann.
Diese Durchsicht zeigt, dass Modalpartikeln auch in formaler Hinsicht weitreichende Affinitäten mit den Diskurspartikeln haben können. Viele der Speziflka der Modalpartikeln gelten auch für Diskurspartikeln allgemein, und keines dieser Spezifika der Modalpartikeln wird von den Merkmalen der Diskurspartikeln ausgeschlossen. Es gibt jedoch ein formales Merkmal, das es verbietet, Modalpartikeln uneingeschränkt als Teilmenge der Diskurspartikeln zu betrachten. Modalpartikeln haben darin ist sich die germanistische Forschung wohl einig - Skopus über den ganzen Satz, cf. (lOe), (21e). Insofern ist ihr Skopus grammatisch bestimmbar. Diskurspartikeln hingegen haben Skopus über syntagmatische Einheiten variabler Größe (Hansen 1998, 73-74, Waltereit 2005). Mit « variabler Größe» ist nicht nur gemeint, dass die einzelnen Diskurspartikeln als lexikalische Einheiten sich in ihrem Skopus unterscheiden. Bei diesem Verständnis von «Skopusvariabilität» könnten nämlich Modalpartikeln noch als Spezialfall von Diskurspartikeln gewertet werden. Es muss aber vielmehr bei jedem einzelnen Token einer Diskurspartikel nach diskursstrukturellen, nicht syntaktischen, Kriterien bestimmt werden, welches ihr Bezugsbereich ist. In den Beispielen (12)—(15) lässt sich nur nach textuellen, nicht nach konstituentiellen, Merkmalen beschreiben, worauf sich die Diskurspartikel bezieht. Ihr Bezugsbereich kann ein Satz sein, er kann aber auch ein ganzer Redezug oder auch eine kleinere syntagmatische Einheit sein. Das ist ein wichtiger Unterschied zu Modalpartikeln, deren Skopus ja jeweils der ganze Satz und damit eine syntaktisch bestimmbare Größe ist. Auf diesen Unterschied werde ich in Kap. 2.5.1. bei der Besprechung von ja genauer zurückkommen. Modalpartikeln haben somit sowohl inhaltlich als auch formal eine große Affinität zu Diskurspartikeln. Modalpartikeln können aber nicht uneingeschränkt als Unterklasse der Diskurspartikeln zählen, denn ihre Skopuseigenschaften sind zu unterschiedlich. Mit dem Terminus Modalpartikel verbindet sich natürlicherweise der Anspruch, dass diese Partikeln zu Ausdrucksmitteln sprachlicher Modalität zählen. Mir erscheint es plausibel, Modalpartikeln als Ausdrucksformen der Modalität anzunehmen. Dies wird in Kap. 2.3. unter Rückgriff auf Givons kommunikative Redefinition genauer ausgeführt werden. Allerdings werden aus dem hier Erörterten keine Folgerangen für andere Formen sprachlicher Modalität wie verbale Modi, modale Adverbien oder Modalverben beansprucht.
7
1.3. Zur Bedeutung von Partikeln: Minimalismus, Maximalismus, Polysemie Die genaue semantische Beschreibung von Modal- und anderen Diskurspartikeln ist in der Forschung ein notorisches und auch als solches reflektiertes Problem. Der Grund hierfür ist, dass die Bedeutung von Modalpartikeln in sehr hohem Maße kontextabhängig zu sein scheint (cf. König/Requardt 1991, 64).
1.3.1. Haben Partikeln eine Bedeutung? Das Phänomen der hochgradigen Kontextabhängigkeit hat dazu geführt in Frage zu stellen, ob Partikeln überhaupt Bedeutung im Sinne einer eigenen konventionalisierten semantischen Repräsentation, also im gleichen Sinne wie andere Wörter auch, haben. So bestreiten Krivonosov (1963) und Schiffrin (1987,319) explizit, dass die Partikeln eine eigene Bedeutung haben. Damit wird nicht behauptet, dass Partikeln etwa funktionslos seien. Es wird aber gesagt, dass ihre Funktion eine völlig andere ist als die anderer Wörter. Im Wesentlichen werden dabei zwei Argumente angeführt: (22a) Die Funktion von Partikeln ist nicht an der Partikel als einzelner Form, sondern nur im Satzzusammenhang erkennbar, und deswegen haben diese einzelnen Formen keine Bedeutung (Krivonosov). (22b) Die Funktion von Partikeln liegt im pragmatischen Bereich, und deswegen haben sie keine Bedeutung im Sinne der Semantik (Schiffrin).
Man könnte als der Position (22b) affin vielleicht auch noch König/Requardt 1991, Martin Zorraquino/Portoles 1999 und Fräser 1999 anführen, die der Auffassung sind, dass Partikeln prozedurale Bedeutung haben, und damit eine völlig andere Art von Bedeutung als andere Wörter. Mir scheint, dass die Frage, ob Partikeln überhaupt Bedeutung haben, in gewisser Hinsicht nur ein terminologisches Problem darstellt. Es dürfte heute wohl unkontrovers sein, dass Partikeln nicht leere, funktionslose Gebilde («Füllsel, Flickwörter») sind. Die spektakulär wirkende Ansicht, dass Partikeln keine Bedeutung haben, rührt aus der theoretischen Festlegung, dass die spezifische Funktion von Partikeln nicht als «Bedeutung» im herkömmlichen Sinn gesehen wird. Selbst wenn man diese Festlegung teilt, sind Partikeln trotzdem sprachliche Zeichen, und als solche haben sie eine Inhaltsseite. Insofern können sie nicht «bedeutungslos» sein. Auch die (an sich treffende) Einsicht Krivonosovs, dass die Funktion von Partikeln nur im Satzzusammenhang erkennbar ist, ändert nichts daran. Die Funktion vieler sprachlicher Zeichen, z.B. der verbalen Flexionsmorpheme, ist nur im Satzzusammenhang erkennbar. Trotzdem erschiene es sehr unplausibel zu behaupten, dass z.B. Flexionselemente wie die Tempusmorpheme keine Bedeutung hätten. Ein nicht nur terminologisches Problem ist allerdings die Frage, welcher Art die Bedeutung der Partikeln ist. Man kann auch hier zwei in der Forschung vertretene Positionen unterscheiden:
8
(23a) Die Funktion von Partikeln setzt direkt in der Pragmatik an. Partikeln haben keinen konzeptuellen Gehalt und auch keine grammatische Bedeutung für den Satz, sondern sie sind Instruktionen an den Hörer, wie er die Äußerung im Kontext zu verorten hat (z.B. König/Requardt 1991, Hansen 1998). (23b) Die Funktion von Partikeln setzt nicht direkt in der Pragmatik an, sondern Partikeln haben einen konzeptuellen Gehalt. Die pragmatische Wirkung der Partikeln sind Inferenzen, die der Hörer aus diesem konzeptuell-semantischen Gehalt zieht (z.B. Abraham 1991, Autenrieth 2002).
Mir erscheint die in (23a/b) formulierte Alternative nicht als eine Frage, die empirisch entschieden werden kann, sondern als eine theoretische Vorentscheidung. Empirische Evidenz kann es nur indirekt geben, insofern nämlich, als Analysen, die auf der einen oder der anderen Vorentscheidung aufbauen, sich als mehr oder weniger plausibel erweisen. Die Position (23a) impliziert in gewisser Weise eine Abkehr von der herkömmlichen Sicht des Verhältnisses zwischen Semantik und Pragmatik (als dem Unterschied zwischen Bedeutung und Gebrauch sprachlicher Zeichen), weil als Funktion eines Zeichens eine unmittelbar auf seinen Gebrauch zielende Beschreibung gegeben wird. Hingegen ist die Position (23b) konform mit dieser herkömmlichen Sicht, weil die Bedeutung als prinzipiell unabhängig vom Gebrauch angegeben wird. Ich werde mich in dieser Arbeit an die Position (23a) halten. Obwohl sie zunächst theoretisch weniger sparsam zu sein scheint als die alternative Position, möchte ich sie dennoch vorziehen. Kodierte sprachliche Bedeutung muss nicht konzeptuell, sondern kann auch prozedural sein. Schon die Bedeutung grammatischer Einheiten wie Präpositionen kann nur als prozedural beschrieben werden, insofern Präpositionen nämlich Anweisungen geben, wie andere Formen im Satz aufeinander zu beziehen sind. Ähnliches gilt für andere «unverdächtige» Formen wie Tempusoder auch Kasusmorpheme. Die Prozeduralität der Funktion von Partikeln ist also noch kein Argument, sie en bloc der Pragmatik im Sinne von «nicht-kodiert» zuzuweisen.
1.3.2. Minimalismus, Maximalismus, Polysemie Der Eindruck, dass die Funktion von Partikeln in hohem Maße variabel ist, fuhrt natürlicherweise zu der Frage, welche Anteile der Funktion einer Partikel in einer konkreten Verwendung auf den Kontext zurückzuführen sind und welche Anteile der zugrunde liegenden sprachlichen Bedeutung zuzuschreiben sind. Jede Entscheidung dieses Problems ist wiederum eng mit einer Stellungnahme zur Frage nach der Anzahl der zugrunde liegenden Bedeutungseinheiten einer Partikel verknüpft. Hat man zwei Verwendungsvarianten von Partikeln in unterschiedlichen Kontexten, stellt sich also stets folgende Alternative: (24)
Kann man den Unterschied in der Verwendung der beiden Varianten bei gleicher Bedeutung der Partikel auf den je unterschiedlichen Beitrag des Kontexts zurückführen? Oder: Entspricht der Unterschied in der Verwendung zwei verschiedenen Bedeutungen der Partikel?
9
Im Prinzip besteht diese Alternative natürlich nicht nur bei Partikeln, sondern bei jedem Wort. Bei Partikeln stellt sich das Problem aber in gewisser Weise verschärfter Form, weil die Bedeutung von Partikeln überhaupt nur im Kontext fassbar erscheint (cf. schon die Beobachtung Krivonosovs 1963). Mit der Formulierung der Alternative (24) wird auf die beiden Positionen des Bedeutungsminimalismus bzw. Bedeutungsmaximalismus Bezug genommen (cf. Posner 1979). Bedeutungsminimalistisch ist eine Position, die versucht, möglichst alle Verwendungen einer Partikel als Instanziierungen weniger, idealerweise einer einzigen, Sprachbedeutungen, der Grund- oder Gesamtbedeutung, auszuweisen. Diese Position muss dann die Funktionsvariabilität von Partikeln wechselnden Kontextgegebenheiten zuschreiben. Bedeutungsmaximalistisch ist demgegenüber eine Position, die eine große Zahl von Sprachbedeutungen zulässt und jede Verwendungsvariante mit einer eigenen Bedeutung identifiziert. In dieser Sichtweise ist der Anteil des Kontextes entsprechend minimal. Diese Positionen existieren natürlich nicht nur in Bezug auf Modalpartikeln, sondern es geht hier um eine theoretische Problematik, die sich für die ganze lexikalische Semantik stellt. Tendenziell bedeutungsminimalistisch sind dabei «monosemistische» Zugänge, während «polysemistische» zunächst eher dem Bedeutungsmaximalismus näher zu stehen scheinen. In den 1990er Jahren haben bedeutungminimalistische bzw. sich vom Maximalismus abgrenzende Analysen immer mehr an Einfluss gewonnen (Hentschel/Weydt 2003, Abraham 1991, Meibauer 1994, Autenrieth 2002, Fischer 2000 und andere). Ein nicht unwesentlicher Teil der germanistischen Modalpartikelforschung hat es sich zum Anliegen gemacht, die einzelnen Partikelvarianten von einer einzigen Partikelbedeutung abzuleiten oder auch die Modalpartikelverwendungen von der Bedeutung der nicht-modalen Gegenstücke herzuleiten. Der Bedeutungsminimalismus fuhrt dabei das methodologische Argument ins Treffen, dass eine kleine Zahl von Bedeutungen bei gleicher Erklärungsmächtigkeit der tatsächlichen Vorkommen aus Gründen der theoretischen Sparsamkeit, Redundanzvermeidung und Eleganz vorzuziehen sei (Occam's razor). Dieses wissenschaftliche Grundprinzip wird in sich auf den Bedeutungsminimalismus berufenden Analysen oft so zugespitzt, dass nur eine einzige Bedeutung zugelassen wird. Zum einen ist dieses Vorgehen jedoch dem alle monosemistische Analysen treffenden Einwand ausgesetzt, dass die herausdestillierte Grundbedeutung als kleinster gemeinsamer Nenner oft so abstrakt ist, dass sie praktisch nichtssagend werden kann (cf. kritisch König 1991, 175, Hansen 1998, 85-90). Zum anderen ist eine strikt monosemistische Analyse schon deswegen problematisch, weil sie diachron nur schwer anschlussfahig ist. Wie in verschiedenen Arbeiten zur historischen Semantik gezeigt wurde, ist Bedeutungs- und Funktionswandel nur unter Rückgriff auf Polysemie plausibel erklärbar. Denn Bedeutungen «wandeln» sich nicht im Sinne einer «Transsubstantiation», wie dies der Terminus suggeriert, sondern eine neue Bedeutung eines Ausdrucks wird einer bereits vorhandenen hinzugefugt (Blank 1997, 103-130). Zumindest in dieser «Übergangsphase» muss der Ausdruck also zwei Bedeutungen haben. Diese Argumente schließen einen strikten Monosemismus aus. Natürlich wird auch ein «aufgeklärter» Polysemist eine maximalistische Sichtweise im Sinne einer
10
Proliferation von Bedeutungen vermeiden, ganz im Einklang mit Occam 's razor. Er wird jedoch grundsätzlich mehrere Bedeutungen zulassen: «Analysts who take this stance [i.e. den polysemistischen Standpunkt] assume that particles may indeed have different senses which are not merely a matter of pragmatics, but that rather than being homonymous and discrete, these various senses are related [...]. This obviates the minimalist need to find a single basic meaning which is common to all possible uses of a particle, but at the same time allows for a certain indeterminacy of meaning which is not possible on a maximalist account, insofar as the senses instantiated in particular contexts may overlap» (Hansen 1998: 87).
Ich möchte mich hier dem Polysemiebegriff Blanks (1997) anschließen. Blank sagt zunächst, ähnlich wie Hansen: «Polysemie liegt vor, wenn mit einer Lautkette mehrere Bedeutungen verbunden sind und diese Bedeutungen in einer semantischen Relation zueinander stehen» (1997, 103). Er differenziert dann, aufbauend auf Deane (1988), Polysemie und Kontextvarianz. Der Unterschied wird klar, wenn man, mit Blank, die Beispielgruppen (25) und (26) vergleicht: (25a) (25b) (25c) (25d)
My arm can't reach the ceiling of this room. the arm of a coat the arm of a record player an arm of the sea
(26a) My arm hurts. (26b) Look at the arm of the statue. (26c) A robotic arm reached out and grabbed me.
In (25) wird das Wort arm in vier verschiedenen Bedeutungen aus vier verschiedenen Domänen verwendet: Körperteil, Teil eines Kleidungsstücks, technisches Gerät, topographischer Begriff. Zwischen diesen Bedeuungen bestehen klar wahrnehmbare Beziehungen der Ähnlichkeit. Insofern ist das englische Wort arm (mindestens) vierfach polysem. Auch die Verwendungen in (26) werden als unterschiedliche Verwendungskontexte empfunden. In (26b/c) hat man es jedoch nach Blank mit Kontextvarianten der Bedeutung 'Arm als Körperteil' zu tun, weil sie als Vertreter derselben Kategorie empfunden werden: Diese Arme teilen mit dem 'Arm als Körperteil' die «Positionierung im oberen Bereich eines menschlichen oder nach dem Vorbild des Menschen gefertigten Körper[s]» (Blank 1997, 415) und sie haben die entsprechenden formalen und funktionalen Merkmale des menschlichen Arms. Mit dieser Differenzierung zwischen Bedeutungen und Kontextvarianten wird der Intuition Rechnung getragen, dass bestimmte Verwendungsvarianten als enger zusammengehörig als andere empfunden werden und dass der Unterschied zwischen den einzelnen Kontextvarianten als durch den Kontext, nicht durch die konventionelle Bedeutung determiniert beschrieben werden kann. Nicht jede Verwendungsvariante wird also - bedeutungsmaximalistisch - mit einer eigenen Bedeutung identifiziert, vielmehr werden kontextgesteuerte pragmatische Prinzipien zugelassen, die unterschiedliche Interpretationen einer Bedeutung (Kontextvarianten) produzieren können. Posner (1979), der als erster im Zusammenhang mit Partikeln die Alternative zwischen einem polysemistischen und einer monosemistischen Zugang auf den
11
Punkt brachte, argumentierte zwar gegen den von ihm Bedeutungsmaximalismus genannten Standpunkt. Er ist aber selbst nicht Minimalist in dem Sinne, dass er Partikeln unbedingt nur eine einzige Bedeutung zuweisen wollte. Vielmehr spricht er ausdrücklich davon, dass Wörter durchaus mehrere Bedeutungen haben können: «Dreideutige Wörter sind nichts Ungewöhnliches» (Posner 1979, 386). Insofern kann man nicht davon ausgehen, dass strikt monosemistische Analysen sich zu Recht auf die von Posner formulierte Position des Bedeutungsminimalismus berufen können.4 Vielmehr scheint die von Hansen (1998) und auch in dieser Arbeit vertretene Position dem Posnerschen Verständnis von Bedeutungsminimalismus viel näher zu stehen als dies z.B. die streng monosemistische Arbeit von Abraham (1991) tut. Insofern ist die hier vertretene Position die eines gemäßigten Minimalismus.
1.4. Abtönung ohne Partikeln 1.4.1. Abtönungspartikeln und Abtönungsformen In der Forschung ist schon früh davon ausgegangen worden, dass ähnliche Effekte, wie sie die deutschen Modalpartikeln bewirken, auch durch andere sprachliche Elemente erzielt werden können. Besonders interessant ist dies natürlich in Sprachen, in denen es keine Modalpartikeln gibt. Ich gebe zunächst einige in der Literatur erwähnte Beispiele für Abtönung ohne Partikeln. Dies natürlich ohne jeden Anspruch auf Vollständigkeit; es ist mir hier lediglich daran gelegen, einen Eindruck von der Vielfalt der Formen zu geben, die in den Sprachen der Welt zur Abtönung verwendet werden können. Jacobs (1991) nennt den ethischen Dativ des Deutschen im Zusammenhang mit der Bedeutung von Modalpartikeln: (27)
«Du ziehst mir nicht wieder die roten Strümpfe an!» (Jacobs 1991, 148)
Der Gegensatz zwischen «Minimalismus» und «Maximalismus» erscheint mir daher auch insofern etwas überspreizt dargestellt, als es speziell in Bezug auf Partikeln eigentlich kaum Analysen gibt, die wirklich «maximalistisch» sind. Bei genauerem Hinsehen verdienen Arbeiten, die als maximalistisch bezeichnet werden, dieses Prädikat meistens nicht, schon gar nicht im Sinne einer expliziten theoretisch-semantischen Stellungnahme. Als «maximalistisch» werden z.B. Franck (1980) genannt (von Abraham 1986, 29) oder Heibig (1988) (bei Meibauer 1994,4 und Autenrieth 2002). Zwar diskutiert Franck (1980) jeweils eine Reihe von Verwendungsvarianten von Modalpartikeln, sie versucht aber, möglichst viele davon einer Grundbedeutung zuzuweisen: Sie plädiert ausdrücklich, unter Bezug auf Occam's razor, dafür, sprachliche Bedeutung und kontextuelle Faktoren zu trennen (1980: 128-140). Wo dies nicht geht, nimmt sie Homonyme an - eine eigentlich typisch monosemistische Strategie. Auch Heibig (1988) kann kaum als maximalistisch bezeichnet werden. Heibig (1988) ist ein Partikelwörterbuch, in dem sich der Autor bemüht, möglichst viele Verwendungsvarianten von Modalpartikeln zu erfassen. Diese Sorgfalt kann ihm nicht als theoretisch-semantische Stellungnahme für den Bedeutungsmaximalismus ausgelegt werden, zumal er im theoretischen Einleitungskapitel (1988, 67-71) ausdrücklich für die Suche nach einer «Gesamtbedeutung» plädiert!
12
Die syntaktische Rechtsversetzung (pronominale Vorwegnahme eines Satzgliedes) in verschiedenen romanischen Sprachen ist von einigen Autoren (Ulrich 1985, Koch/Oesterreicher 1990) als Abtönungsphänomen bezeichnet worden: (28) (29)
«spengilo i'registratore vai 5 » (Koch/Oesterreicher 1990, 71) Rumänisch: Bate el Ivan in poartä 'Nun klopft er, Ivan, ans Tor' (Ulrich 1985, 272, ihre Übersetzung)
Hentschel (1991) weist daraufhin, dass perfektiver Aspekt in serbo-kroati sehen direktiven Sprechakten eine ähnlich abtönende Wirkung haben kann wie die deutsche Partikel mal (wenn man die Äußerung mit ihrem jeweiligen Pendant mit imperfektivem Aspekt bzw. ohne mal vergleicht): (30a) «Gib mir mal das Brot!» (30b) «Gib mir das Brot!» (31a) Serbo-Kroatisch: «dodji ovamo! kommen-IMPERATIV-PERFEKTIV her! ' k o m m mal her!'» (31b) «dolazi ovamo! kommen-IMPERATIV-lMPERFEKTIVher! 'kommher!'» (alle Beispiele Hentschel 1991, 140-142)
Schubiger (1965/1972) zeigt, dass bestimmte Intonationskurven im Englischen eine ähnliche pragmatische Wirkung erzielen können wie deutsche Modalpartikeln. Auf dieses Phänomen gehe ich in Kap. 5. detailliert ein, hier nur ein erster Eindruck: (32)
«A: I'm sorry about the mess. Β: VYou couldn't help it. B': Du kannst doch nichts dafür» (Schubiger 1972, 184).
Die fallend-steigender Kontur nuanciert laut Schubiger die Entgegnung you couldn 't help it in ähnlicher Weise wie dies im entsprechenden deutschen Satz die Modalpartikel doch tut. Die englischen tag-questions können eine modalisierende Wirkung ähnlicher Art wie die deutschen Modalpartikeln haben (cf. ausfuhrlich Bublitz 1978). Im folgenden Beispiel wird der Nachsatz right «in ähnlicher Funktion wie die MPn ja und doch verwendet» (Bublitz 1978, 164): (33)
«The Pope's a catholic, right? So why should he be celebrating Passover?» (Bublitz 1978, 164)
Auch das französische periphrastische Futur ist als abtönend bezeichnet worden: (34)
«Voulez-vous que je vous dise franchement mon opinion? ... Eh bien! faute d'ecouter quelques conseils de gens que vous prenez pour des ennemis, vous allez vous brüler les a i l e s . . . » (Toussaint, zitiert bei Schrott 1997, 292)
Die Form spengilo ist eine dialektale Variante von
spegnilo.
13
Der Teilsatz vous allez vous brüler les ailes in (34) müsste nach Schrott (1997, 292) mit Sie werden sich noch die Finger verbrennen übersetzt werden, also mit der (hier wohl abtönend wirkenden) Partikel noch. Schon diese kleine Liste legt nahe, dass Abtönung außer durch Partikeln mit einem breiten Spektrum sprachlicher Formen ausgedrückt werden kann: Personalpronomina (Dativus ethicus), Segmentierungskonstruktionen (Rechtsversetzung), Aspektmorpheme (perfektiver Aspekt im Serbokroatischen), Intonationskonturen, Tempusmorpheme (periphrastisches Futur). In dieser Arbeit werden einige von diesen und noch andere, hier noch nicht erwähnte, einer genaueren Betrachtung unterzogen werden. Diese Formen sind materiell keine Modalpartikeln, scheinen aber eine ähnliche Funktion wie diese auszuüben. Abtönung kann also nicht nur durch Partikeln ausgedrückt werden. Im Folgenden will ich daher von Abtönungsformen sprechen. Abtönungsformen sind alle sprachlichen Formen, die regelmäßig eine abtönende Wirkung haben können. Es ist hierfür nicht entscheidend, dass eine solche Abtönungsform das genaue Übersetzungsäquivalent für eine bestimmte deutsche Modalpartikel ist. Entscheidend ist vielmehr, dass die Abtönungsform einen semantisch-pragmatischen Effekt hat, der funktional demjenigen der Modalpartikeln zuzurechnen ist. Zu den Abtönungsformen gehören also die Modalpartikeln, aber auch andere sprachliche Formen.
1.4.2. Übersetzungsvergleiche als Heuristik für Abtönungsformen Die in 1.4.1. aufgelisteten Abtönungsformen sind sehr unterschiedlicher Natur. Sie bilden kein formales Paradigma und scheinen wenig miteinander zu tun zu haben. Es stellt sich daher die Frage, wie man nicht-partikelartige Abtönungsformen überhaupt herausfinden kann. Die Forschung hat sich hierbei im Allgemeinen auf Übersetzungsvergleiche gestützt. In Übersetzungen deutscher (speziell epischer) Texte in andere Sprachen ohne Modalpartikeln wurde geprüft, wie der Übersetzer das Problem gelöst hat, den durch die deutsche Modalpartikel produzierten Effekt in der Zielsprache wiederzugeben. Linguistische Arbeiten in dieser Tradition sind z.B. für das Sprachenpaar Deutsch-Französisch Feyrer 1998, für Deutsch-Italienisch Helling 1983 und Masi 1996, für Deutsch-Spanisch Beerbom 1992, Prüfer 1995, Cardenes Melian 1998 und Ferrer Mora 1999. Für die drei genanten Sprachenpaare gebe ich nun je ein Beispiel für einen Übersetzungsvergleich mit der Modalpartikel doch. Feyrer (1998, 190) vergleicht doch und ihre Entsprechung in der französischen Übersetzung eines Stücks von Ödön von Horvath: (35)
14
«[die Gnädige Frau will pünktlich ihre Zinnsoldaten geliefert bekommen] [...] DIE GNÄDIGE FRAU: Also ich kann mich auf Sie verlassen? MARIANNE: Ganz und gar, gnädige Frau! Wir haben doch hier das erste und älteste Spezialgeschäft im ganzen Bezirk - gnädige Frau bekommen die gewünschten Zinnsoldaten, garantiert und pünktlich. [...]
LA DAME: Je peux compter sur vous, n'est-ce pas? MARIANNE: Absolument, madame! Vous etes chez le meilleur et le plus ancien fournisseur de tout rarrondissement ... Vous aurez vos soldats de plomb, madame, sans faute et ä l'heure! ( Ö H \ 19)»
Feyrer (1998, 190) zeichnet nach, wie der «intensive Verweis auf allgemein bekanntes Wissen» durch doch im Französischen «durch einen stilistischen Wechsel zur direkten Anrede an die Zielperson» wiedergegeben wird. Im folgenden Übersetzungsbeispiel, untersucht von Masi (1996,93), wird ein doch im Italienischen als Futur wiedergegeben: (36)
«Du kannst doch von mir nicht verlangen, dass ich ausmisten gehe! 'Non vorrai pretendere anche tu che vada a spalar letame!'»
Nach Masi (1996, 93) «[suggeriert] das futuro di probability mit der Negation eine negative Antwort - das, was in der Absicht des Sprechers liegt». Cardenes Melian (1998, 122s.) zeigt auf, dass in spanischen Übersetzungen die Modalpartikel doch manchmal mit betontem pues übersetzt wird: (37)
«Sag doch, worin verberge ich dir etwas? '^En que te oculto yo algo? Dimelo,
Durch Vergleich einer großen Zahl von Beispielen bei gleichzeitiger Differenzierung der Modalpartikelverwendungen nach Sprechakttypen (doch in Aufforderungen, suggestive Verwendungen von doch usw.) ist inzwischen eine recht feinrastrige Erfassung von funktionalen Äquivalenten der Modalpartikeln möglich und zum Teil auch schon erreicht. Auch in dieser Arbeit werde ich mich gelegentlich auf die Ergebnisse der Übersetzungsvergleiche stützen und mich von ihnen anregen lassen. Der Vergleich von Übersetzungen ist jedoch mit dem grundsätzlichen Mangel behaftet, dass es den Übersetzern auf die Wiedergabe von Texten ankommt, nicht von einzelnen Formen (Weydt 2003b). Übersetzer übersetzen nicht Bedeutungen, sondern Bezeichnungen bzw. einen kommunikativen Sinn. Aufgrund der hohen Kontextabhängigkeit kann bei Partikeln die Diskrepanz zwischen Bedeutung und Bezeichnung besonders groß sein. Übersetzungsvergleiche können daher nur sehr bedingt Auskunft über die Semantik der Partikeln geben (cf. Berkenbusch 2001). Daher können Übersetzungsvergleiche niemals das Hauptproblem der vergleichenden Abtönungsforschung lösen: was sind die Bedeutungsmerkmale der zielsprachlichen Abtönungsformen, die sie in ihren jeweiligen Verwendungen den deutschen Modalpartikeln äquivalent wirken lassen? Um diese Fragen zu beantworten, führt kein Weg herum um eine pragmatische Definition dessen, was Abtönung eigentlich ist: Was ist das tertium comparationis des Sprachvergleichs, das im jeweiligen Textzusammenhang Futur, imperfektiven Aspekt, Intonation usw. als den Modalpartikeln pragmatisch ähnlich scheinen lässt und das die Übersetzungsäquivalente erst möglich macht? Ein solches Kriterium wird hier zu erarbeiten unternommen.
15
1.4.3. Der «Reichtum» des Deutschen an Modalpartikeln: eine optische Täuschung? Wie erwähnt, wird in der Forschung seit Jahrzehnten als selbstverständlich angenommen, dass Modalpartikeln eine Spezialität der festlandgermanischen Sprachen, insbesondere des Deutschen, seien und dass z.B. in den romanischen Sprachen keine oder fast keine Modalpartikeln anzutreffen seien. In einigen neueren Arbeiten wurde jedoch behauptet, dass diese Vorstellung möglicherweise etwas relativiert werden müsse. 1.4.3.1. Probleme der Übersetzbarkeit Die Auffassung, dass Modalpartikeln ausschließlich oder überwiegend im Deutschen anzutreffen seien, speist sich in hohem Maße aus Übersetzungsvergleichen. Vergleicht man deutsche Texte und deren Übersetzungen z.B. ins Französische, so stellt man fest, dass sich für eine deutsche Modalpartikel häufig entweder gar kein Äquivalent findet oder eine nicht-modalpartikelförmige Wiedergabe. Hieraus entsteht der Eindruck, dass Modalpartikeln nur im Deutschen existieren. Diesen Befund machte schon Weydt (1969) anhand eines Vergleichs der Erzählung Der Bau von Franz Kafka mit deren französischer Übersetzung. Ein Vergleich von Übersetzungen in umgekehrter Richtung, also z.B. vom Französischen ins Deutsche, zeigt aber, dass auch bei solchen Übersetzungen viele Partikeln «verloren gehen». Metrich (2002) vergleicht Comics aus der Serie Les Frustres von Ciaire Bretecher und deren deutsche Version. In folgenden von Metrich angeführten Beispielen wurden in der deutschen Fassung französische Partikeln (oder diesen zumindest ähnlich scheinende Ausdrücke) nicht übersetzt: (38a) «Tu sais, j ' a i fermement decide de faire du sport cette annee. (38b) 'Ich bin fest entschlossen, dieses Jahr mehr Sport zu machen'». (39a) «7M VOIS, en lui parlant j'ai ressenti profondement que les barrieres de classe sont en train de disparaitre. (39b) 'Dabei ist mir echt bewusst geworden, dass sich die Klassenunterschiede langsam verwischen'». (40a) «Je regrette de ne pas avoir de magnetophone sous la main Hens'. (40b) 'Schade, dass ich kein Tonbandgerät hab!'» (41a) «Mais qu'est-ce qu'ils ont tous? Faut etre maso... - Ben et toi? (41b) 'Was haben die bloß alle? ... da muss man doch maso sein! - Und du?'»
Metrich kommt in seinem Vergleich zum Ergebnis, dass eine ganze Reihe der von ihm so genannten «kommunikativen Funktionswörter», z.B. ςα, kein, je te jure, tu sais, tu vois, ben, typischerweise nicht oder nur selten übersetzt werden. Die Gegenprobe aus der Übersetzung Französisch-Deutsch macht also deutlich, dass die NichtÜbersetzung deutscher Modalpartikeln in andere Sprachen noch nicht ein entsprechendes lexikalisches Defizit in den Zielsprachen beweist. Vielmehr ist es durchaus möglich, dass die Abwesenheit von Modalpartikeln in den Übersetzungen etwas mit der Übersetzungssituation als solcher zu tun hat. Es scheint so zu sein, dass Diskurspartikeln im Allgemeinen (also nicht nur Modalpartikeln) bei Übersetzungen oft weggelassen werden.
16
1.4.3.2. Grammatikographische Illusionen Neben dem methodischen Argument, das auf die Übersetzungssituation Bezug nimmt, sind von verschiedener Seite in letzter Zeit andere Einwände gegen die angebliche Partikelarmut der romanischen Sprachen erhoben worden. Speziell in Bezug auf das Spanische legen Pons Borderia (1998a), Ferrer Mora (1999) und Kaiser (2002) nahe, dass der Eindruck der Modalpartikelarmut einfach damit zu tun haben könnte, dass in der traditionellen spanischen Grammatikographie diese Kategorie nicht vorgesehen ist, obwohl eine Reihe spanischer Formen durchaus eine den deutschen Modalpartikeln pragmatisch ähnliche Funktion einnimmt. So untersucht Pons Borderia (1998a) spanische Konnektoren wie claro, que, entonces, mira. Er kommt unter explizitem Bezug auf die deutsche Modalpartikelforschung zu dem Ergebnis, dass zumindest in einigen Verwendungen die spanischen Konnektoren eine Funktion haben, die genau derjenigen der deutschen Modalpartikeln entspricht. Dies gelte z.B. für claro: «En espanol no existe una clase de particulas modales que se pueda delimitar con criterios morfosintäcticos ο distribucionales, aunque si algunas expresiones cuya fünciön principal consiste en la expresiön de la modalidad. A nuestro juicio, claro es una de estas particulas [...]» (Pons Borderia 1998a, 176).
Für claro zeige dies z.B. folgender Beleg (Pons Borderia 1998, 172): (42)
P:«entonces cuando C: ves P: saliö el cirujano dice todo ha salido estupendo Mari Angeles que ha hecho llorando y chillando claro dice y de momento porque como estä con l'anestesia C: no non gilan bien ο sea no Ρ: y eso asi que cuando salia chillando y llorando buäa y venga y claro se acerco Mari Angeles y carino y carino y el se abrazo la cara asi asi no la desapegö»
pero va a salir igual no te va a conocer
llorar unas lägrimas a su madre acerco a
In dem im Original kursiv gedruckten Redebeitrag von Ρ gibt der Sprecher mit claro einen (zustimmenden) Kommentar zu dem, was er selbst gerade berichtet hat. Dies ist nach Pons eine modale Funktion. Pons vertritt die Auffassung, dass die Elemente der Wortart Konnektor in jeweils unterschiedlichem Maße drei verschiedene pragmatische Funktionen erfüllen, und zwar Konnexion (Satzverknüpfung), Formulierung und Modalität. Aufgrund von statistischer Auswertung umfangreicher Korpora kommt er zu der Ansicht, dass besonders die Konnektoren claro und bueno eine modale Funktion haben. Auf die Verbindung zwischen Modalität und Satzverknüpfung weist auch Hansen (1998, 42) hin. Auch Kaiser (2002) stellt in einem Vergleich deutscher und venezolanischer studentischer Seminar- und anderer Qualifikationsarbeiten fest, dass die Frequenz der Partikeln, zu denen sie auch Modalpartikeln zählt, viel weniger mit der Einzelsprache (Deutsch / Spanisch) als mit der Textsorte zu tun hat. Die von ihr untersuchten literaturwissenschaftlichen Arbeiten weisen viel mehr Partikeln auf als die sprachwissenschaftlichen. Kaiser nennt auch Kombinationen spanischer Partikeln wie ya
17
un poco oder incluso ya ni (Partikelkombinationen gelten sonst als typisch für die deutschen Modalpartikeln, cf. Thurmair 1989). 1.4.3.3. Modalpartikeln und Abtönungspartikeln Mir scheint, dass für die Bewertung dieser Aussagen genau gesagt werden muss, was man unter Modalpartikeln zu verstehen geneigt ist. Hält man sich streng an die hier zugrunde gelegte Definition von Modalpartikeln (10), so muss man sagen, dass empirische Forschungen darüber, ob es in romanischen Sprachen vielleicht doch Modalpartikeln gibt, unnötig sind. Es kann sie aus systematischen Gründen gar nicht geben. Denn zur Definition von Modalpartikeln gehört ein strukturelles Element der deutschen Syntax, das Mittelfeld. Weil es dieses strukturelle Element in den romanischen Sprachen nicht gibt, kann es in diesen Sprachen also auch keine Modalpartikeln geben. Mit dieser Klarstellung wird jedoch nicht ausgeschlossen, dass es in den romanischen Sprachen Abtönungsformen geben kann, die zwar keine Modalpartikeln im strengen Sinne der Definition (10) sind, die aber trotzdem im weiteren Sinne (cf. Kapitel 1.2.) Partikeln sind! Insofern scheinen die Beobachtungen von Pons Borderia, Ferrer Mora und Kaiser vollkommen berechtigt. Es kann in den romanischen Sprachen Partikeln geben (und es gibt sie wirklich), die abtönende Funktion ausüben. Diese sind jedoch keine Modalpartikeln im Sinne der an der Germanistik orientierten Definition (10). Um größere Klarheit anzustreben, werde ich daher im Folgenden terminologisch auseinander halten: Abtönungsform\ sprachliches Elemente beliebiger Form und Wortart, das abtönende Funktion ausübt. Abtönungspartikel: Abtönungsform, die der Wortart Diskurspartikel angehört. Modalpartikel. Abtönungspartikel, die den Kriterien der Definition (10) genügt.
Die drei Begriffe inkludieren sich: Modalpartikeln sind eine Teilmenge der Abtönungspartikeln, und Abtönungspartikeln sind eine Teilmenge der Abtönungsformen. Modalpartikeln und Abtönungspartikeln gehören funktional zur Menge der Abtönungsformen, und formal (mit Einschränkungen) zur Menge der Diskurspartikeln.
1.4.4. Funktional-pragmatische Legitimation von Abtönung als übereinzelsprachlicher Größe Neben der Suche nach Übersetzungsäquivalenten für einzelne deutsche Modalpartikeln ist auch versucht worden, Abtönung als pragmatische Größe sprachtheoretisch zu legitimieren (bes. Koch/Oesterreicher 1990, 67-71). Bei der Suche nach Übersetzungsäquivalenten wird von den deutschen Formen ausgegangen und für diese Entsprechungen gesucht; es handelt sich also um ein semasiologisches Vorgehen (von der Form zur Funktion). In der anderen Forschungsrichtung wird universalistisch-sprachtheoretisch hergeleitet, dass es in den Einzelsprachen einen Ausdrucksbedarf für Abtönung geben muss. Dieser Ausdrucksbedarf könne sich in Form von Partikeln, aber auch in anderer Weise materialisieren. Dies ist ein onomasiologisches Vorgehen (von der Funktion zur Form).
18
Koch/Oesterreicher leiten einen Ausdrucksbedarf für Abtönung aus universal begründbaren Merkmalen gesprochener Sprache ab. In gesprochener Sprache werden, im Gegensatz zu geschriebener Sprache, viele Aspekte der Kommunikation nicht sprachlich explizit gemacht, sondern ergeben sich aus dem Kontext. Dies gilt auch für Aspekte der in den Diskursen bzw. Texten realisierten Sprechakte. In gesprochener Sprache werden oft bestimmte Aspekte der Sprechakte sprachlich nur sparsam angedeutet. Dieses Andeuten von illokutionären Aspekten ist für die Autoren die pragmatische Essenz von Abtönung: «Ein besonders interessantes, im weiteren Sinne dialogisches Verfahren nähesprachlicher Kommunikation besteht nun darin, bestimmte interaktioneil relevante Kontextbedingungen illokutionärer Akte lediglich durch äußerst sparsame sprachliche Elemente anzudeuten» (Koch/Oesterreicher 1990, 67s.).6 Im Deutschen geschehe dies überwiegend in Form von Partikeln, zum Teil auch im Französischen: (43)
A: «ija se voit pas tellement hein? Β : 9a se voit pas monsieur [...] A : 9a choque peut-etre un peu si j ' e n faisais un peu sur les un peu au partout autour comme 9a hein ? Β : faut quand meme pas exagerer Monsieur !» (Koch/Oesterreicher 1990, 68)
In der Situation hat Α Β auf ihr Kleid einen hässlichen Fleck gemacht. Hier wird mit quand meme «eindeutig, aber äußerst sparsam, auf die situativen und interaktionalen Gegebenheiten [...] Bezug genommen. Dadurch wird der Vorwurf gerechtfertigt und zugleich mit einer abtönenden Nuance versehen» (Koch/Oesterreicher 1990, 68). Auf quand meme komme ich ausführlich in Kap. 3 zurück. Einen funktional ähnlichen Verweis auf situative und interaktionale Gegebenheiten könne z.B. die schon erwähnte italienische Rechtsversetzung erbringen: (28)
«spengilo i'registratore vai» (Koch/Oesterreicher 1990, 71)
Hier gibt es aber keine Partikel. Man hätte es also mit Abtönung ohne Partikeln zu tun. Mit der sprechakttheoretischen bzw. allgemein-sprachtheoretischen Legitimation von Abtönung skizzieren Koch/Oesterreicher ein Programm, welches in dieser Arbeit aufgegriffen werden soll. Eine ebenfalls universalistisch begründete Theorie der Abtönung lässt sich König/Requardt 19917 entnehmen. Nach diesem Ansatz fungieren die deutschen Modalpartikeln als «metapragmatische Instruktionen». Sie helfen dem Hörer, für die Proposition, auf die sie sich beziehen, einen geeigneten Verarbeitungskontext zu suchen, in dem «sie die meisten kontextuellen Effekte hat und somit maximal relevant ist» (König 1997,71). Diese These ist im Zusammenhang mit der von Sperber/Wilson (1986) begründeten Relevanztheorie zu sehen. Nach dieser Theorie ver-
6
7
Mit der Bestimmung «durch äußerst sparsame sprachliche Elemente» hat diese onomasiologische Definition aber auch einen semasiologischen Anteil. In geringfügig überarbeiteter Form hat König diesen gemeinsamen Aufsatz in deutscher Sprache als König 1997 veröffentlicht.
19
suchen Kommunikationsteilnehmer, Äußerungen stets so zu verarbeiten, dass die auf ihnen basierenden Inferenz- (Schluss-)prozesse sich in möglichst ergiebiger Weise in die bestehenen Annahmen über die Welt eingliedern. Zu diesem Zweck können neue Äußerungen auf prinzipiell drei verschiedene Weisen verarbeitet werden: i. ii. iii.
Sie können Widersprüche zwischen bestehenden Annahmen identifizieren; sie können bestimmte bestehende Annahmen verstärken oder schwächen; sie können zusammen mit bereits bestehender Information neue Annahmen erzeugen.
Dies sind die Aufgaben eines Inferenzsystems. Königs und Requardts These ist, dass Modalpartikeln ihre jeweiligen Propositionen einer dieser drei Verarbeitungsweisen zuordnen. Insofern seien sie argumentativen Konnektoren wie aber, sogar, übrigens usw. und deren Pendants in anderen Sprachen vergleichbar (Ducrot 1983; Blakemore 1987). Ich möchte nun an einigen Beispielen aus König (1997, 67-71) veranschaulichen, wie Modalpartikeln, analog zu argumentativen Konnektoren, auf Inkonsistenzen hinweisen, eine bestehende Annahme stärken oder eine neue Annahme suggerieren können: (44)
«Cette voiture est bon marche, tu devrais done l'acheter» (Ducrot 1983, 13).
Im Beispiel (44) leitet der argumentative Konnektor done 'also' eine Kaufempfehlung als Schlussfolgerung aus einem bestimmten Befund (dass ein Wagen billig ist) und einer unterstellten Norm (dass billige Gegenstände kaufenswert sind) ab. Der Konnektor done identifiziert die Proposition tu devrais l'acheter als Schlussfolgerung aus der voraufgehenden Proposition bzw. identifiziert die voraufgehende Proposition als Evidenz für die folgende Aufforderung. Dies ist eine Standardverwendung eines argumentativen Konnektors. Insofern kann man Konnektoren als «metapragmatische Instruktionen» bezeichnen, die dem Hörer Hinweise darauf geben, in welchem pragmatischen Kontext er eine Proposition zu situieren hat. In ähnlicher Weise kann, nach König, die Modalpartikel schon ihre Proposition als Schlussfolgerung aus dem vorher Gesagten und Bekannten kennzeichnen: (45)
«Das schaffen wir schon. (Wir haben das bisher noch immer geschafft.)» (König 1997, 66)
Indem die Partikel ihre Proposition als Schlussfolgerung kennzeichnet, wählt sie den relevanten Interpretationskontext für sie aus. Man hat es hier also mit der dritten der erwähnten Aufgaben eines Inferenzssystems zu tun, nämlich der Ableitung von neuen konversationeilen Schlüssen. Nur noch einige Beispiele zu den anderen Aufgaben des Inferenzsystems: Die Partikel doch kann Widersprüche zwischen vorgängigen Informationen identifizieren. Mit dem Beispiel (46) (König 1997, 67s.) könnte der Sprecher auf einen Widerspruch aufmerksam machen zwischen einer Verpflichtung oder dem Wunsch des Hörers, etwas Bestimmtes zu tun und dem Umstand, dass der Hörer dies unterlassen hat:
20
(46)
«Ruf ihn doch an.»
Im nächsten Beispiel signalisiert die Partikel ja, dass fur den Inhalt der Proposition nach Auffassung des Sprechers starke Evidenz vorhanden ist und verstärkt damit die in ihr ausgedrückte Annahme: (47)
«Dein Mantel ist ja ganz schmutzig.»
Ausgehend von diesen Beispielen klassifiziert König die deutschen Modalpartikeln danach, welche der Aufgaben des Inferenzsystems sie übernehmen: (48)
Klassifikation der deutschen Modalpartikeln nach König (1997, 65)
Identifikation von Widersprüchen
Indikatoren starker Evidenz
Auswahl eines Kontexts (Ableitung neuer konversationeller Schlüsse)
doch, etwa
aber, vielleicht, erst, schon, ja, wohl, eben, nun mal, halt
auch, eben, nun mal, halt, schon, denn, eigentlich, einfach, nur, bloß, wohl
Prinzipiell ist dieser Ansatz ein guter Kandidat für eine pragmatische Charakterisierung von Abtönung, weil er keinerlei Bezug auf die Form der Partikeln nimmt. Die Funktionen von Partikeln, so wie sie König und Requardt skizzieren, könnten auch von anderen Wortarten oder Formtypen eingenommen werden. Es wird eine onomasiologische Theorie der Abtönung geboten. Wenn also der Ansatz von König und Requardt richtig ist, bräuchte man in anderen Sprachen als dem Deutschen nur Formen zu suchen, die in gleicher Weise wie die deutschen Modalpartikeln «metapragmatische Institutionen» sind, und man hätte das Inventar von Abtönungsverfahren in der jeweiligen Sprache. 8 Problematisch scheint mir allerdings, dass nur drei Typen von Inferenzsystem-Operationen vorgesehen sind, es also nur drei Klassen von Modalpartikeln geben kann, siehe (48). Jedoch scheint es offentsichtlich, dass es z.B. zwischen doch und etwa oder zwischen auch und eigentlich wichtige Unterschiede gibt, die intuitiv recht deutlich sind, aber linguistisch schwer zu beschreiben sind. Solche Unterschiede haben die Modalpartikelforschung von Beginn an beschäftigt. Im Ansatz von König und Requardt können sie nicht von der Theorie selbst erklärt werden. In ihrem gegenwärtigen Stadium ist diese Theorie also noch recht grobkörnig. Weiterhin bleibt unklar, was denn das Besondere an Modalpartikeln gegenüber argumentativen Konnektoren ist. Man hat intuitiv den starken Eindruck, dass M o dalpartikeln eine andere Funktion als argumentative Konnektoren haben, wenn sie ihnen auch nicht unähnlich sind. Welcher Art dieser Unterschied ist, wird von König und Requardt jedoch nicht erklärt. 9
8
9
In Waltereit (1999a) wird dies fur das Französische und Italienische ansatzweise unternommen. In Waltereit (1999a) wird folgende Hypothese zu diesem Unterschied gemacht: Argumentative Konnektoren beziehen den Satz, in dem sie stehen, argumentativ auf den vorhergehenden Satz. Modalpartikeln hingegen beziehen den Satz, in dem sie stehen, argumentativ nicht auf den vorhergehenden Satz, sondern auf eine im Kontext verfugbare Annahme.
21
1.4.5. Universale Funktionen der Sprache und die Wortarten Der Ausgangspunkt dieser Arbeit ist, dass Modalpartikeln eine universale pragmatische Funktion ausüben, und dass daher Sprachen ohne Modalpartikeln andere Ausdrucksmittel für diese pragmatische Funktion haben müssen. Dieser Gedanke ist für andere Wortarten schon erprobt worden: Croft (2000) argumentiert gegen die weit verbreitete Sicht, dass die drei Hauptwortarten Substantiv, Verb und Adjektiv etwas Einzelsprachspezifisches seien und dass es «exotische» Sprachen z.B. ohne die Substantiv/Verb-Unterscheidung gebe. Er geht vielmehr davon aus, dass es die Sprachfunktionen Referenz, Prädikation und Modifikation gibt. Diese Funktionen sind nicht spezifisch für einzelne Sprachen, sondern sie werden sprachtheoretisch als universale Funktionen der Sprache postuliert. Die Wortarten Substantiv, Verb und Adjektiv sind jeweils die unmarkierten Repräsentanten der Funktionen Referenz, Prädikation und Modifikation. Weil diese Funktionen universal sind, muss es entsprechend Substantive, Verben und Adjektive auch in allen Sprachen geben. Croft belegt, dass auch in Sprachen, in denen es früheren Analysen zufolge diese Wortarten angeblich nicht gibt, sich auf überzeugende Weise die Existenz der Hauptwortarten nachweisen lässt. Somit ist das Anliegen dieser Arbeit in gewisser Weise die Übertragung und Ausweitung dieses Ansatzes auf eine «kleine» Wortart: Abtönung wird als universale Sprachfunktion postuliert, die, eben weil sie universal ist, in allen Sprachen auf die eine oder andere Weise materiell ausgedrückt werden muss.
1.5. Abtönung: Prozedurale Instruktionen oder illokutionäre Modifikation? Die beiden in 1.4. skizzierten Ansätze von König/Requardt einerseits und Koch/Oesterreicher andererseits stehen in gewisser Weise stellvertretend für zwei in der Forschung diskutierte Strategien, die kommunikative Funktion sprachlicher Ausdrücke zu beschreiben. In einer Richtung (vertreten von König/Requardt) werden abtönende Formen als «prozedurale Instruktionen» gesehen, mit deren Hilfe der Sprecher den Hörer anweist in Bezug darauf, wie die Äußerung im Kontext zu situieren ist. In der anderen Richtung (vertreten von Koch/Oesterreicher) wird Abtönung als Modifikation der illokutionären Charakteristik der Äußerung angesehen. Beide Richtungen gehen je auf ihre Weise auf den starken Kontextbezug ein, der für Abtönung charakteristisch zu sein scheint. Die erste Richtung ist mit der von Sperber/Wilson (1986) initiierten Relevanztheorie assoziiert, die zweite natürlich mit der Sprechakttheorie. Die Relevanztheorie greift die Grice'schen Konversationsmaximen auf und will sie auf eine einzige reduzieren, nämlich das «Prinzip der Relevanz». 10 Dieses Prinzip besagt, dass Äußerungen vom Hörer stets in der Weise verarbeitet werden, dass das Verhältnis von Aufwand zu Ertrag optimal ist, genauer gesagt: dass bei geringst
10
Das Hauptwerk der Relevanztheorie ist natürlich Sperber/Wilson (1986), überarbeitet als Sperber/Wilson (1995). Eine lehrbuchartige Einführung gibt Blakemore (1992), eine treffende Kurzdarstellung und -einschätzung bietet Hansen (1998, 26-34).
22
möglichem Verarbeitungsaufwand (geringe Zahl an Inferenzen) die meisten «kontextuellen Effekte» erzielt werden. «Kontextuelle Effekte» bestehen darin, die Äußerung sinnvoll in Bezug auf Annahmen zu situieren, die der Hörer bereits hat oder macht, also z.B., wie oben in (48) angedeutet, indem sie eine bereits vorhandene Annahme stärken oder in Verbindung mit bereits vorhandenen Annahmen eine neue erzeugen. Interessant ist hierbei die theoretische Annahme, dass der Verarbeitungskontext nicht eine vorgegebene Größe ist, sondern ausgewählt wird (Sperber/Wilson 1986, 132-142). Das Prinzip der Relevanz ist im Gegensatz zu den Grice'schen Konversationsmaximen keine Maxime; es ist also keine Norm, der man folgen kann oder auch nicht, sondern den Autoren zufolge ein Prinzip der Sprachverarbeitung, das zur routinemäßigen kognitiven Tätigkeit des Sprachverstehens gehört und daher automatisch angewandt wird. Man entscheidet sich nicht, beim Sprachverstehen dem Relevanzprinzip zu folgen; das Relevanzprinzip gehört konstitutiv zum Verstehen dazu. Als Argument fur diese Position wird beispielsweise die Beobachtung angeführt, dass Individuen sich nicht entscheiden können, sprachliche Äußerungen in einer ihnen vertrauten Sprache, die sie hören, nicht verstehen zu wollen. Blakemore (1987) untersucht in diesem theoretischen Rahmen Konnektoren. Konnektoren sind Wörter wie englisch hence, therefore oder frz. done. Sie geben die Art und Weise vor, in der die Äußerung, die ihnen folgt, auf die vorhergehende zu beziehen ist. So muss eine mit done eingeleitete Äußerung als Schlussfolgerung aus der vorhergehenden Äußerung interpretiert werden. Insofern helfen Konnektoren dem Hörer, die von ihnen eingeleitete Äußerung in geeigneter Weise mit kontextuellen Effekten zu versehen. Anders ausgedrückt (die Automatizität des Relevanzprinzips beachtend): Konnektoren restringieren die Auswahl möglicher Kontexte (und damit auch möglicher kontextueller Effekte) für die Äußerung, die sie einleiten, oder: Konnektoren verringern den Inferenzaufwand bei der Suche möglicher Kontexte. Diese Sichtweise läuft darauf hinaus, dass es eine Reihe von sprachlichen Ausdrücken gibt, die eine prozedurale Funktion haben, d.h. dass sie dem Hörer Instruktionen in Bezug darauf geben, wie die Äußerung im Kontext zu situieren ist. Zu diesen zählen König/Requardt (1991) auch die Modalpartikeln. Sie behandeln sie analog zu den Konnektoren. Auch Fräser (1999) diskutiert Ausdrücke mit prozeduraler Funktion. Er setzt definitorisch, dass Ausdrücke, die eine Äußerung einleiten und die Funktion haben, diese in je spezifischer Weise auf die unmittelbar voraufgehende Äußerung zu beziehen, Diskursmarker sind. 11 Dabei schließt Fräser übrigens die deutschen Modalpartikeln ausdrücklich aus der Klasse der Diskursmarker aus (1999, 942), da diese nicht ihre Trägeräußerung einleiten und sie sich nicht immer auf die unmittelbar voraufgehende Äußerung beziehen. Selbst wenn man Fräser in dieser Hinsicht nicht folgt, gibt es eine ganze Reihe von sprachlichen Ausdrücken, die eine prozedurale Funktion zu haben scheinen. Es stellt sich nun das Problem zu bestimmen, was unter den Ausdrücken mit prozedura-
11
Nach dieser Definition sind Diskursmarker kein spezielles Merkmal der gesprochenen Sprache! So diskutiert Fräser auch eher typisch schriftsprachliche Formen wie moreover, similarly, in spite of that als Diskursmarker.
23
ler Funktion das Spezifische der Abtönung ist. Analysen, die Modalpartikeln oder andere Abtönungsformen als prozedurale Instruktionen auffassen, müssen ihre Spezifizität in der Domäne suchen, in Bezug auf die die Trägeräußerung situiert wird. Nur so können Abtönungsformen angemessen von anderen prozeduralen Instruktionen abgegrenzt werden. Als diese Domäne wird bei vielen Wissenschaftlern der situative Kontext gewählt. Während Konnektoren wie done etc. die Trägeräußerung in Beziehung zur unmittelbar voraufgehenden Äußerung (und damit zum sprachlichen Ko-Text) setzen, wird das Spezifikum der Abtönung typischerweise darin gesehen, dass eine Äußerung einen indirekten Bezug auf den Situationskontext macht. Neuere Analysen verschiedener Art gehen in diese Richtung (cf. Waltereit 1999a, Fischer 2000, 268s., Diewald 1997, 77, 1999, 85). Diewald (1997, 1999) und Fischer (2000) sprechen vom «pragmatischen Prätext» und meinen damit «a proposition which is not explicitly mentioned but which is Anna hat genau drei Kinder.
(54)
Der Satz Einige Gäste sind schon gegangen implikatiert, dass nicht alle Gäste schon gegangen sind (er wäre auch wahr, wenn schon alle Gäste gegangen wären): Einge Gäste sind schon gegangen +> Nicht alle Gäste sind schon gegangen.
Zur Verdeutlichung des Konzepts der GCI nennt Levinson aber auch folgende Beispiele: «Why is it that I can introduce myself with My name is Steve, but not I was given the name Steve; that I can express sympathy with you with I am sorry but not conventionally with That saddens me; that I express outrage with Really! but not with In truth!·, that I can say I am delighted to meet you but not idiomatically I am gratified to meet you; that I can choose a pastry by saying I'd like that one but not I'd admire that one, and so on» (Levinson 2000, 23).
Partikularisierte konversationeile Implikaturen (PCIs) sind demgegenüber situationsabhängig und nicht konventionalisiert. Levinson (2000) entwickelt eine umfassende Theorie der GCI und ihrer Funktion für die Sprache. Insbesondere nimmt er drei Schichten von Äußerungsbedeutung an: - die Satzbedeutung (sentence meaning); - die Äußerungstypbedeutung (utterance-type-meaning); - die situationsspezifische Bedeutung (speaker-meaning).
Die Satzbedeutung ist die wörtliche, nicht löschbare Bedeutung des Satzes, wie sie sich kompositional aus der Bedeutung der beteiligten Wörter und der Syntax ihrer Zusammenstellung ergibt. Die Äußerungstypbedeutung ist die Satzbedeutung zusammen mit den mit ihr verbundenen (gegebenenfalls löschbaren) GCIs. Der enjeu von Levinsons Theorie, das was sie von anderen Zugängen zum Verhältnis von Semantik und Pragmatik abhebt, ist natürlich diese mittlere Ebene, die der Äußerungstypbedeutung. Satzbedeutung und Äußerungstypbedeutung sind Typen. Die situationsspezifische Bedeutung dagegen ist an ein Token gebunden. Sie ist das, was ein Sprecher in einer bestimmten Situation mit seiner Äußerung mitteilen wollte (Levinson 2000, 25). Hier sind also zusätzlich zur Satz- und zur Äußerungstypbedeutung die PCIs anzusiedeln, des Weiteren die fallweise gelöschten GCIs. Während also zu bestimmten Satzbedeutungen typischerweise bestimmte GCIs gehören, ist das Verhältnis von Satzbedeutungen zu PCIs nicht durch den Typ der Satzbedeutung selbst beschränkt. Der Sprecher kann im Prinzip beliebige PCIs mit einer Satzbedeutung verbinden, solange die Verknüpfung durch andere Kontextelemente gewährleistet ist. 1.7.2. Konversationsimplikaturen und Aktivitätstypen In seiner Studie über GCIs macht Levinson (2000) keine Aussagen über das Verhältnis von Konversationsimplikaturen zu dem immerhin auch von ihm selbst entwickelten Konzept der Aktivitätstypen, und sein Aufsatz von 1979 wird in der Bibliographie nicht genannt. Die Frage nach dem Verhältnis dieser beiden Theorien ist aber naheliegend, denn beide Modelle machen Aussagen zum Verhältnis von Semantik und Pragmatik. Folgende Charakterisierung suggeriert, dass GCIs diskurstypunabhängig sind und nur die Einzelsprache betreffen:
31
«Utterance-type meanings are matters of preferred interpretations [...] which are carried by the structure of the utterances, given the structure of the language, and not by virtue of the particular contexts of utterance» (Levinson 2000, 3, Hervorhebung von mir, RW).
Diese Einzelsprachbezogenheit überzeugt sofort, wenn man die Beispiele (53) oder (54) betrachtet. Dass man die Äußerung Anna hat drei Kinder versteht als Anna hat genau drei Kinder, scheint in der Tat nicht von dem jeweiligen Äußerungskontext abzuhängen. Das soeben genannte Zitat scheint jedoch nicht ganz zu der Beispielliste des Zitats im vorangegangenen Abschnitt zu passen. Denn die Beobachtung, dass jemand mit dem Namen Steve sich üblicherweise vorstellt mit My name is Steve und nicht mit / was given the name Steve sagt weniger etwas darüber, wie Äußerungen einer Sprache typischerweise verstanden werden als vielmehr darüber, wie ein bestimmter Zug in einem Aktivitätstyp typischerweise versprachlicht wird. Levinson selbst nennt ja in seiner Liste p. 31 die jeweilige Aktivität und damit auch den jeweiligen Äußerungskontext: Sich-Vorstellen, Mitleidsbekundung, Wutausbruch etc.! Insofern ist das Konzept der GCI möglicherweise auch onomasiologisch zu verstehen. 15 Also: die Äußerungstypebene beschreibt möglicherweise nicht nur, wie Sätze typischerweise verstanden werden, sondern auch, wie Sprechakte ausgedrückt werden. Schließlich nimmt schon der Begriff der Konversationsimplikatur selbst die Perspektive des Sprechers (desjenigen, der eine Mitteilungsabsicht hat, der etwas versprachlichen will) ein. In den Beispielen aus dem letzten Abschnitt macht sich Levinson klar eine onomasiologische Sichtweise zu Eigen: Äußerungstypen werden auf ihre Eignung hin verglichen, einen bestimmten Sprechakt (wie Sich-Vorstellen, Mitleidsbekundung etc.) effektiv auszudrücken. 16 Man könnte die in (53) oder (54) erwähnten Standardimplikaturen onomasiologisch umformulieren, etwa in der folgenden Art: (53') Um zu sagen, dass Anna genau drei Kinder hat, genügt es zu sagen: Anna hat drei Kinder. (54') Um zu sagen, dass mehr als einer der Gäste (aber nicht alle) gegangen sind, genügt es zu sagen Einige Gäste sind gegangen.
1.7.3. Konversationsimplikaturen und Sprechakte Der Begriff der GCI scheint es nun zu ermöglichen, die Affinitäten zwischen Sprechakten und Satztypen zumindest teilweise zu erfassen. Die drei Ebenen der Bedeutung bei Levinson (Satzbedeutung, Äußerungstypbedeutung, situationsspezifische Bedeutung) beschreiben verschiedene Typen bzw. Grade von Konventionalität eines Mitteilungsinhalts; sie sagen noch nicht über die Lokalisierung bestimmter Formate von Inhalten (Proposition, Illokution) aus. Der Sprechakttyp kann also auf allen dieser drei Ebenen angesiedelt sein. Es scheint, dass der Sprechakttyp von al15 16
Diesen Standpunkt vertritt auch Schwenter (1999, 26). I was given the name Steve ist als bloßer Außerungstyp genauso zulässig wie My name is Steve. In einer Autobiographie z.B. schiene mir I was given the name Steve eine durchaus angemessene Einführung des eigenen Namens zu sein. Lediglich wenn man den Sprechakt (mündliche) Selbstvorstellung vorgibt, ist dies die weniger geeignete Ausdrucksform für ihn.
32
len drei Ebenen, der Satzbedeutung, der Äußerungstypbedeutung und der situationsspezifischen Bedeutung zugewiesen werden kann. Es ist also zu unterscheiden: i.
Der Sprechakt gibt die Satzbedeutung wieder («direkter» Sprechakt): Zwei mal zwei sind vier als Assertion der Proposition, dass zwei mal zwei vier ist.
ii.
Der Sprechakt entspricht nicht der Satzbedeutung; man hat es mit einem indirekten Sprechakt zu tun, dessen illokutionäre Funktion aber konventionalisiert ist; Könnten Sie das Fenster öffnen? als Bitte, das Fenster zu öffnen.
iii.
Der Sprechakt entspricht nicht der Satzbedeutung; die illokutionäre Funktion des indirekten Sprechaktes ist nicht konventionalisiert: Der da ist schön als Absichtserklärung, den gezeigten Salat zu kaufen (cf. Beispiel aus Kap. 1.6.).
Im ersten Fall greift überhaupt keine Implikatur, die kodierte illokutionäre Bedeutung wird vom Sprecher aktualisiert und vom Hörer als solche verstanden. Im zweiten Fall (konventionalisierte Indirektheit) spezifiziert eine GCI, dass die Äußerung entsprechend einer konventionalisierten, aber indirekten, Beziehung zwischen Gesagtem und Gemeintem zu interpretieren ist.17 Im dritten Fall muss der Hörer situationsspezifische Gegebenheiten einbeziehen, zum Beispiel den jeweiligen Aktivitätstyp, um die Mitteilungsabsicht des Sprechers korrekt zu interpretieren. Der Übergang zwischen PCI und GCI ist möglicherweise fließend, auf jeden Fall können aber PCIs in verschiedenem Grad «partikularisiert» sein.18 Die konversationeile Implikatur eines mit einem Satztyp verbundenen bestimmten Sprechaktes kann routinemäßig mit einem bestimmten Zug des Aktivitätstyp verbunden sein (dann ist sie nicht der Einzelsprache, sondern einem Aktivitätstyp bzw. einer Diskurstradition zugehörig), und sie kann vollkommen individuell sein (dann ist sie einem Aktivitätstyp nur insofern zugehörig, als dieser dem Hörer den nötigen Interpretationsrahmen liefert, wie bei dem Salatbeispiel [49]). Die Auffassung, den Sprechakttyp einer der drei Levinson'schen Bedeutungsebenen zuzuweisen, bietet mindestens folgende Vorteile: a) Man trägt der Einsicht Rechnung, dass das Verhältnis von Sprechakt zu sprachlichem Ausdruck sehr vermittelt sein kann. PCIs können in den jeweiligen Aktivitätstypen den interpretativen Rahmen liefern, der Sprechakte mit einer sprachlichen Form verbindet. Andererseits bleibt die Intuition berücksichtigt, dass es so etwas wie eine unmarkierte illokutive Funktion gibt, die eine mit einer sprachlichen Form verbundene GCI ist. b) Man erhält eine einfache Lösung des Problems der indirekten Sprechakte (cf. p. 26). Searle (1979, 42s.) weist daraufhin, dass mit sog. indirekten Sprechakten wie ich muss für die Prüfung lernen (gemeint als Ablehnung des Vorschlags, ins Kino zu gehen) zwei Sprechakte vollzogen werden: eine Aussage und eine Absage (also ein
17
18
Zum Verhältnis von Sprechakten und seiner GCI-Theorie sagt Levinson nur an einer Stelle: «[I]t is at this level [i.e. von utterance-types] [...] that we can sensibly talk about speech acts, presuppositions, conventional implicatures, felicity conditions [...]» (Levinson 2000, 22s.). Traugott (1999b) und Traugott/Dasher (2002) konstruieren einen diachronen Ubergang der Art PCI > GCI > konventionelle Bedeutung. Eine ausführliche Kritik an diesem Modell semantischen Wandels liefern Hansen/Waltereit (im Druck).
33
Kommissiv). Der Eindruck von «zwei Sprechakten» kommt dadurch zustande, dass solche Sätze systematisch zwei Interpretationen zulassen, je nachdem, ob eine bestimmte Implikatur gelöscht wird oder nicht. 19 Der indirekt vollzogene Sprechakt der Ablehnung ist eine PCI, die (erster Sprechakt) angelegt werden kann oder (zweiter Sprechakt) gelöscht werden kann. Wird die PCI der Ablehnung gelöscht, muss der Satz als einfacher Aussagesatz interpretiert werden. Natürlich kann der indirekt vollzogene Sprechakt auch eine GCI sein. Das entspricht konventionalisierter Indirektheit.
1.7.4. GCI-Theorie und Theorie des Satzmodus In der Germanistik wird die Diskussion über das Verhältnis zwischen der syntaktischen Form eines Satzes und der durch ihn vollzogenen Illokution seit etwa Mitte der 1980er Jahre unter dem Stichwort Satzmodus geführt (cf. z.B. Meibauer 1987, Brandt et al. 1992, Lohnstein 2000). Vergleicht man z.B. folgende Sätze: (55a) «Jochen klaut Zigarren. (55b) Klaut Jochen Zigarren (55c) Jochen, klau Zigarren!» (cf. Lohnstein 2000, 1)
so wird in allen drei Varianten die gleiche Proposition ausgedrückt (nämlich dass Jochen Zigarren klaut). Der inhaltliche Unterschied zwischen Deklarativsatz, Fragesatz und Exklamativsatz korreliert mit Unterschieden in der Wortstellung und Verbmodus (Indikativ vs. Imperativ). Während die formalen, konstruktionellen Unterschiede mit dem Begriff des Satztyps erfasst werden, gehören die inhaltlichen Größen zum Satzmodus. Satzmodus ist dabei als eine semantische, nicht pragmatische Einheit zu verstehen. Erst der Illokutionstyp ist eine pragmatische Größe. Wie Brandt et al. (1992, 4—6)20 zeigen, ist schon die formale Identifikation der Satztypen nicht unproblematisch. Brandt et al. (1992) kommen zu sieben Satztypen, die sich aus einer Kreuzklassifikation der drei Verbstellungstypen des Deutschen (Verberst, Verbzweit, Verbletzt) und der Unterscheidung Deklarativ/Entscheidungsinterrogativ/w-Interrogativ (die hier als syntaktische Merkmale zu verstehen sind) ergeben. Dabei wird die Unterscheidung nicht direkt an Oberflächenmerkmalen abgelesen, sondern wird erst aus einer strukturellen Repräsentation des Satzes gewonnen. Lohnstein (2000) nimmt die verbalen Modi als Formmerkmale der Satztypen hinzu bzw. lässt sie in die strukturelle Repräsentation als Modusphrase eingehen. Brandt et al. (1992) gehen von drei Satzmodi aus: Deklarativsatz, Entscheidungsinterrogativ und w-Interrogativ. Der Deklarativsatz stiftet einen Referenzbezug zu einem Sachverhalt in dem Sinne, dass er eine «wahrheitswertfahige Einheit» ist, die «auf mögliche Welten beziehbar» ist (Brandt et al. 1992, 36). Entscheidungsinterrogativ und w-
19
20
Es werden also gar nicht wirklich zwei Sprechakte (gleichzeitig) vollzogen. Vielmehr sind solche Äußerungen ambig in dem Sinne, dass sie entweder als der eine oder der andere Sprechakt verstanden werden können. Dieser berühmte Aufsatz wird auch manchmal nach den Anfangsbuchstaben seiner Autorinnen «BRRZ» genannt.
34
Interrogativ werden aus dem Defaulttyp Deklarativsatz mit Hilfe eines die Fragesemantik kennzeichnenden Operators OFFEN gewonnen. Lohnstein (2000, 28) kritisiert neben hieran unter anderem, dass «die Klassifikation der Satzmodi bereits in den zugrunde liegenden syntaktischen Strukturen vorentschieden ist» und schlägt ein anderes Konzept für die Semantik von Fragen her, das er Partitionierung nennt. Deklarativsätze sind im unmarkierten Fall mit dem Illokutionstyp Assertion verbunden, sie eignen sich aber «darüber hinaus [...] im Prinzip für die direkte Realisierung von Illokutionen eines jeden Typs» (Brandt et al. 1992, 60). Auch der Interrogativsatz «hat einen Defaultbezug zur Frage, kommt aber [...] auch als Realisator bestimmter Regulierungshandlungen [Direktive und Kommissive, RW] vor» (Brandt et al. 1992, 60s.). Der unmarkierte Bezug des Deklarativsatzes zur Assertion begründen Brandt et al. (1992, 61) mit dem in seinem Satzmodus angelegten Sachverhaltsbezug: «Falls der Sprecher sich auf dieses Fakt [d.h. den Sachverhalt] als illokutionsunabhängig gegeben bezieht [...], liegt automatisch eine wahrheitswertfahige Äußerung vor, also eine Assertion. In der Regel gilt dabei gleichzeitig, dass der Sprecher auch an die Existenz des Sachverhalts glaubt».
Die Flexibilität des Deklarativsatzes in Bezug auf die mit ihm vollzogene Illokution wird folgendermaßen begründet: «Da der Sprecher [...] mit dem Deklarativsatz auf die gleichzeitig vollzogene Illokution referieren kann, versteht es sich von selbst, dass der Deklarativsatz geeignet ist, im Zusammenwirken mit der jeweiligen performativen Konstruktion die unterschiedlichsten Illokutionen zu realisieren» (Brandt et al. 1992, 62).
Wenn das, worauf der Deklarativsatz referiert, also kein Sachverhalt der realen Welt ist, sondern eine (als Sachverhalt formulierte) Illokution, so kann diese einfach durch Formulierung dieses Deklarativsatzes realisiert werden. Auch die Interrogativmodi haben nach Brandt et al. (1992) Merkmale (insbesondere den Operator OFFEN), die diese für Frageillokutionen besonders geeignet machen: «[B]eim w-IS [w-Interrogativsatz, RW] geht es um eine Referenz auf noch nicht identifizierte aber identifizierbare Objekte etc., bzw. beim Ε-IS [Entscheidungs-Interrogativsatz, RW] um eine Referenz auf einen Sachverhalt, dessen Existenz noch nicht entschieden ist. Dieser besondere Typ von Referenz ist die Brücke, die im Defaultfall vom Satzmodus mit seinem Offenoperator zu dem konstitutiven Merkmal der Frageillokution, der Spezifizierungsbedürftigkeit, fuhrt» (Brandt et al. 1992, 64).
Die Autorinnen wollen mit dieser Konstruktion begründen, dass die Satzmodi spezifische Eigenschaften haben, die diese für bestimmte Illokutionen prädestinieren, und wollen so zirkuläre Zuordnungen von Satztypen und Sprechakten vermeiden. Die Theorie der Satzmodi und ihres Verhältnis zu den Illokutionen ist prinzipiell nicht unverträglich mit der in Abschnitt 1.7.3. dargelegten Auffassung des Verhältnisses von Konversationsimplikaturen zu Sprechakten. Die grundsätzliche Trennung von Satzmodus und Illokution macht deutlich, dass Sätze noch nicht unmittelbar bestimmte Illokutionen «bedeuten», sondern nur einen semantischen Beitrag dazu liefern. Um einen Sprechakt zu realisieren, müssen - auch im einfachsten Fall - prag-
35
matische Variablen hinzukommen, die als Konversationsimplikaturen gedeutet werden können. So scheint der für Deklarativsätze geltende Umstand, «dass der Sprecher auch an die Existenz des Sachverhalts glaubt» (Brandt et al. 1992, 61), problemlos als Qualitätsimplikatur aufgefasst werden zu können. Des weiteren gibt es eine unmarkierte Beziehung zwischen der Bedeutung von Sätzen und Illokutionen, die auch in den zitierten Ausführungen von Brandt et al. (1992) klar zum Ausdruck kommt. Die markierten Zuordnungen von Satzmodi und Sprechakten können als partikularisierte Konversationsimplikaturen ausgedeutet werden. Ein Nachteil der Theorie der Satzmodustheorie von Brandt et al. (1992) scheint mir zu sein, dass sie indirekte Sprechakte nur unbefriedigend zu repräsentieren vermag. Zwar leiten die Autorinnen her, dass der Deklarativsatz neben der Assertion auch eine Reihe anderer Illokutionstypen realisieren kann und bringen deren illokutionäre Charakteristik mit dem semantischen Beitrag des Deklarativsatzmodus in Verbindung. Nicht befriedigend wiedergegeben werden kann aber die spezifische Doppelbedeutung (und Mehrdeutigkeit, cf. Anm. 19) der indirekten Sprechakte. Es scheint mir, dass die Diskussionen um die sprachliche Repräsentation von illokutionären Inhalten um zwei begriffliche Gegensätze kreisen (und sie manchmal nicht auseinanderhalten): -
den Gegensatz von propositionaler und nichtpropositionaler/illokutionärer Bedeutung einerseits; den Gegensatz von konventionalisierter (kodierter) und nichtkonventionalisierter (nichtkodierter, situationsabhängiger) Bedeutung andererseits.
Alle vier Kombinationen, die sich aus diesen beiden Gegensätzen ergeben, sind möglich und auch vorhanden. Propositionale konventionalisierte Bedeutung ist z.B. die gewöhnliche lexikalische Bedeutung lexikalischer Einheiten. Nichtkonventionelle propositionale Bedeutung ist beispielsweise die übertragene Verwendung lexikalischer Einheiten. Zu nichtpropositionaler konventioneller Bedeutung gehört die Verwendung eines Aussagesatzes als Aussage-Sprechakt, nichtpropositionale nichtkonventionelle Bedeutung kann die Verwendung des gleichen Aussagesatzes als Aufforderungs-Sprechakt sein. Verkompliziert wird das Verhältnis von konventioneller und nichtkonventioneller Bedeutung dadurch, dass es zwei Arten von Konventionen im Sprachlichen zu geben scheint (Morgan 1978): einzelsprachliche Konventionen und Konventionen des Sprachgebrauchs (man könnte auch sagen: diskurstraditionelle Konventionen). Zu den Konventionen des Sprachgebrauchs zählt Morgan die konventionalisierten indirekten Sprechakte wie «können Sie mal das Fenster schließen», die zwar einzelsprachlich Fragen sind, aber im Sprachgebrauch konventionell als Aufforderungen gebraucht und verstanden werden. Die klassische Sprechakttheorie versucht, propositionale und nichtpropositionale Bedeutung radikal zu trennen; den Unterschied zwischen konventionalisierten und nichtkonventionalisierten Sprechakten erfasst sie mit der Unterscheidung von direkten und indirekten Sprechakten. Die Satzmodustheorie scheint den Satzmodus der konventionalisierten und die Illokution der nichtkonventionalisierten Inhaltsebene zuzuweisen, suggeriert damit aber, dass es sich um kategorial verschiedene Inhaltstypen handle. Eine Lösung im Rahmen von Levinsons Theorie ermöglicht es, die
36
unterschiedlichen nichtpropositionalen Inhalte im Hinblick auf einzelsprachlichkonventionellen Gebrauch (Satzbedeutung), nicht einzelsprachlich-konventionellen, aber diskurstraditionellen Gebrauch (Äußerungstypbedeutung) und sprecherspezifischem, nichtkonventionellen Gebrauch (Außerungsbedeutung) zu trennen.
1.8. Zusammenfassung Diese Arbeit geht aus von der Beobachtung, dass der semantisch-pragmatische Effekt der deutschen Modalpartikeln auch durch andere Verfahren bewirkt werden kann. Hieraus leitet sich die methodische Forderung ab, die formale und die inhaltliche Seite der Abtönung auseinander zu halten. Alle Formen (gleich ob Partikel oder nicht), die abtönen, sollen Abtönungsformen heißen. Hat eine Abtönungsform die formalen Eigenschaften einer Partikel, so sprechen wir von Abtönungspartikeln. Abtönungspartikeln sind eine Teilmenge der Abtönungsformen. Die deutschen Modalpartikeln sind wiederum eine Teilmenge der Abtönungspartikeln (und damit auch eine Teilmenge der Abtönungsformen), die sich über die formalen Merkmale der Partikel hinaus noch durch für die germanischen Sprachen spezifische Eigenschaften auszeichnen, so dadurch, dass sie an das Mittelfeld des Satzes gebunden sind. Abtönung wird in meinem Ansatz als illokutionäre Operation gesehen. Sie modifiziert den Sprechakt. Der Sprechakt ist dabei nicht unmittelbar mit der Semantik eines Satzes gekoppelt, sondern er ist zunächst ein sprachlich vollzogener Handlungszug in einem Aktivitätstyp bzw. einer Diskurstradition. Die Verbindung zwischen sprachlichen Formen (Sätzen) und Sprechakten wird aber über konversationeile Implikaturen hergestellt. Im folgenden Kapitel 2 wird für die deutsche Modalpartikel ja ein Modell für Abtönung entwickelt, das dann in den weiteren Kapiteln der Arbeit für Abtönungsformen in romanischen Sprachen erprobt wird.
37
2. Was ist Abtönung? Zur dt. Partikel ja
Am Beispiel der deutschen Partikel ja möchte ich in diesem Kapitel ein pragmatisch fundiertes, das heißt von der Wortartzugehörigkeit dieses Elementes unabhängiges, Modell der Abtönung vorstellen. Dieses Modell wird in den weiteren Kapiteln auf Abtönungsphänomene in den romanischen Sprachen, seien sie partikelförmig oder nicht, angewendet werden. Ich beginne mit einer Charakterisierung des Funktionsspektrums von ja.
2.1. Verwendungen der Partikel ja Fischer (2000) nennt folgende Verwendungstypen der Partikel ja (Beispiele und Elemente der Liste sind Fischer entnommen, die Etikettierung der Verwendungstypen ist jedoch meine): 1. Antwortpartikel (1)
A: sollte ich den mit fünf nehmen? B: ja, einen mit fiinf und einen mit dreien. (Fischer 2000, 68)
Β gibt hier mit ja eine positive Antwort auf eine Entscheidungsfrage in A's voraufgehendem Turn. 2. Bestätigungspartikel (2)
A: du brauchst äh eine runde orange Schraube mit Kerbe B: ja (Fischer 2000,71)
Β bestätigt die von Α im voraufgehenden Turn gemachte Aussage. 3. Annahme eines direktiven Sprechaktes (3)
A: und damit das festbleibt, drehst du da so einen diesen grünen Klotz rein oder ist egal, welche Farbe. B: mhm ja.
39
A: so und jetzt noch hinter den Propeller äh hinter die Flügel. (Fischer 2000, 74) Α fordert Β zu einer bestimmten Handlung auf, Β nimmt mit ja an und führt die Handlung unmittelbar aus.
4. Bestätigungs-einholendes ja (4)
A: da komme ich zu Ihnen, ja! B: ja, das wäre schön. (Fischer 2000, 92)
Mit dem turn-finalen, mit steigender Intonation versehenen ja holt Α eine Zustimmung zu seinem Vorschlag ein.
5. Hörerkontaktsignal (5)
A: wir könn' das ja erstmal vorläufig festhalten und B: ja A: wenn wir dann genau wissen, uns genau im klaren darüber sind und genauer beurteilen können, wieviel Zeit wir dann noch brauchen, könn' wir ja vielleicht nochmal eh zur Not noch anders umlegen, umstellen. (Fischer 2000, 73s.)
Β gibt hier lediglich zu erkennen, dass er zuhört. Er bestätigt A's Äußerung nicht inhaltlich und zieht auch nicht das Rederecht an sich. Β's Einwurf kommt nicht an einem transition relevance place vor, und Α setzt seinen unterbrochenen Turn ohne syntaktischen Bruch fort.
6. Sprecherkontaktsignal (6)
A: ja, hallo, hier ist Ina Weißpflug, ich wollte fragen, wann Sie vielleicht Zeit hätten, die beiden zweitägigen Treffen zu machen. B: ja, Tag, Frau Weißpflug (Fischer 2000, 79)
Mit Sprecher Β's ja scheint hier signalisiert zu werden, dass «the speakers refer to the same topic that is brought up by their communication partners» (Fischer 2000, 79).
7. «Framer» (7) = (6) A: ja, hallo, hier ist Ina Weißpflug, ich wollte fragen, wann Sie vielleicht Zeit hätten, die beiden zweitägigen Treffen zu machen. B: ja, Tag, Frau Weißpflug (Fischer 2000, 79)
40
Ja scheint hier Sprecher Α dazu z u dienen, ein neues Diskursthema oder ein g a n z e s Gespräch einzuleiten.
8. Hesitation (8)
phenomenon
Α: nimmst du ahm ja den ja nimmst du die gelbe Schraube mit der Kerbe. (Fischer 2000, 88)
Ja fungiert als Überbrückungsphänomen innerhalb e i n e s Turns.
9. Reparaturmarker (9)
A: nun ist das Problem, ja, unsere Chefs wollen natürlich auch einen Bericht über diese tolle Reise haben. A: es wird um einen länger, genau, ja damit es um einen länger wird. (Fischer 2000, 89s.)
(10)
Ja kann auch, w i e hier in (9), zur Einleitung syntaktischer Neustarts, oder w i e in (10), zur Einleitung einer inhaltlichen Neuformulierung ohne syntaktischen Bruch verwendet werden.
10. Modalpartikel (11)
ja, wir machen ja noch eins, noch ein Treffen, dann reicht das ja. (Fischer 2000, 95)
A l s Funktion der Modalpartikel ja wird im A l l g e m e i n e n die Markierung der U n kontroversheit des Sachverhaltes angenommen. Hierauf k o m m e ich in 2.2.2. genauer zurück. Lässt man zunächst die Modalpartikeln außer Betracht, s o lassen sich die Funktionen v o n ja in z w e i große Gruppen gliedern: 1. In der Funktion als Antwortpartikel, als Bestätigungspartikel, als Annahme eines direktiven Sprechaktes und als bestätigungseinholende Partikel bezieht sich ja auf Redeinhalte: Bejahung einer Frage, Annahme eines Direktivs, Zustimmung zu einer Aussage. Mit ja wird ein illokutionärer Akt vollzogen, der, wie alle illokutionären Akte, fur den Sprecher bestimmte soziale Festlegungen zur Folge hat: Er ist darauf festgelegt, die Frage bejaht zu haben, der Bitte nachzukommen bereit zu sein, der Aussage des anderen zugestimmt zu haben. Diese sozialen Festlegungen können für den Sprecher Konsequenzen haben, die weit über die Situation des Gespräches selbst hinausgehen. 2. In der Funktion als Kontaktsignal, als Framer, hesitation phenomenon und als Reparaturmarker bezieht sich ja auf die Struktur des Diskurses: Sprecher markieren Themenwechsel, Neuformulierungen, Redeverzögerungen und schließlich, dass sie dem anderen überhaupt zuhören. Die Funktion von ja ist hier also nicht, soziale Festlegungen mittels Sprache zu erreichen, sondern ist auf das Sprechen selbst gerichtet und damit auch in ihren absehbaren Konsequenzen typischerweise auf den Diskurs selbst begrenzt. Dies sind die typischen Funktionen eines Diskursmarkers. D i e fundamentale Unterscheidung, die der A b g r e n z u n g z w i s c h e n diesen b e i d e n Funktionstypen entspricht, entnehme ich der Sprechaktsystematik v o n K o c h ( 1 9 8 7 ) .
41
Koch unterscheidet Sprechakte der inneren Organisation des Sprechens, die den illokutionären Akten im traditionellen Sinn der Sprechakttheorie entsprechen, und Sprechakte der äußeren Organisation des Sprechens, deren «Finalität [...] innerhalb der Sprechtätigkeit auf das Sprechen selbst gerichtet» ist und die damit «die Herstellung sozialer Sachverhalte, wie sie durch die erste Gruppe von Sprechakten geleistet wird, ihrerseits erst ermöglichen» (Koch 1987, 312). Hierzu gehören z.B. Das-WortErgreifen, Unterbrechen, Rückmeldung, Kontaktsicherung usw., also Funktionen der Art, wie sie für ja oben unter 2. erwähnt wurden. Das Besondere dieser Sprechaktsystematik ist also, dass als Sprechakte nicht nur illokutionäre Akte im traditionellen Sinne zählen, sondern auch Handlungen, die sich auf die Sprechtätigkeit selbst beziehen. Hierauf wird in 2.5.2. zurückzukommen sein.
2.2. Die Modalpartikel ja 2.2.1. Drei Varianten der Modalpartikel ja Die Modalpartikel ja kommt im Mittelfeld des deutschen Satzes vor. Es gibt eine unbetonte (und insofern den anderen deutschen Modalpartikeln paradigmatisch sehr ähnliche) Variante: (11)
ja, wir machen ja noch eins, noch ein Treffen, dann reicht das ja. (Fischer 2000, 95)
Des weiteren hat die Modalpartikel ja (und das ist eine Besonderheit unter den deutschen Modalpartikeln) eine betonte Variante: (12)
Komm mir JA nicht wieder mit diesen Geschichten!
Ja kann sicherlich als die am eingehendsten untersuchte und insofern typischste Modalpartikel gelten.1 In Bezug auf die Bedeutung werden für die unbetonte Variante meist ein «Bekanntheits-ja» und ein «Überraschungs-ja» (Brauße 1986, sinngemäß auch Heringer 1988, König/Requardt 1991) unterschieden: (13) (14)
Bekanntheits-ya: Er isst ja am liebsten Erdbeertorte. Überraschungs-ya: Du hast ja ein Loch in Deinem Ärmel!
Mit dem Bekanntheits-ya drückt der Sprecher aus, dass er davon ausgeht, dass der Hörer die mitgeteilte Proposition schon weiß; dies zeigt Satz (13). Mit dem Überraschungs-ya drückt der Sprecher aus, dass er davon ausgeht, dass die Proposition dem Hörer gerade nicht bekannt ist - mit (14) will der Sprecher einen überraschenden, also dem Hörer unbekannten, Sachverhalt mitteilen - aber dass der betreffende
ι
Cf. z.B. Weydt 1969, Franck 1980, Brauße 1986, Hentschel 1986, Heringer 1988, Jacobs 1991, Lindner 1991, Meibauer 1994, Fischer 2000.
42
Sachverhalt evident ist, also nicht bestritten werden kann. In Bezug auf das Wissen, welches der Sprecher beim Hörer voraussetzt, sind beide Verwendungen also völlig entgegengesetzt. Das betonte JA schließlich wird von Thurmair (1989, 109) mit einem Merkmal 'Verstärkung' beschrieben. Es verstärke die illokutionäre Kraft des Satzes, meist einer Aufforderung im Imperativ: (15) (16)
Komm JA nicht zu spät nach Hause! Probier JA nicht diesen Käse!
aber auch eines Aussagesatzes wie (17)
Ich darf JA nicht die Autoschlüssel vergessen. (Thurmair 1989, 109)
Allerdings ist (17) vom Satztyp her zwar ein Aussagesatz, muss aber wohl als ein indirekter Direktiv (wenn auch an den Sprecher selbst gerichtet) verstanden werden. 2.2.2. Minimalistische Analysen der Modalpartikel ja In den meisten neueren Arbeiten zu Modalpartikeln wird versucht, die unterschiedlichen Kontextvarianten einer Partikel von einer einheitlichen Grundbedeutung abzuleiten (Bedeutungsminimalismus). Die Kontextvarianten werden dann aus dieser Grundbedeutung plus deren Spezifizierung in «communicative domains, such as perception, prepositional information or the interpersonal relationship between the speakers» (Fischer 2000, 263) abgeleitet. Im Fall von ja wird meist als Grundbedeutung angenommen, dass ja Einverständnis zwischen Sprecher und Hörer signalisiert (cf. Hentschel 1986, 162-164, Heringer 1988,742). Der Sprechakt gilt als unkontrovers (Hentschel 1986, 163, König/Requardt 1991, 72s„ Jacobs 1991, 145s„ Lindner 1991, 171-174, Meibauer 1994, 140-158, Fischer 2000, 266). Beim Bekanntheits-y'a ist mit der Einigkeit die unterstellte Bekanntheit der Proposition gemeint. Der Sprecher geht davon aus, dass dem Hörer die Proposition bekannt ist und dass insofern beide sich über diese Proposition einig sind. Beim Überraschungs-y'a ist dem Hörer die Proposition gerade nicht bekannt, aber sie wird als (für den Hörer) offensichtlich unterstellt, als unabweisbar. Die Einigkeit ist hier also in Bezug auf die Offensichtlichkeit des Sachverhaltes, den die Proposition beschreibt, zu sehen. Meibauer (1994) unternimmt es, auch das betonte JA wie in (12), (15) oder (16) von einer einheitlichen Grundbedeutung 'Unkontroversheit von p' (p = Proposition) abzuleiten. Die besondere Funktion der 'Verstärkung' wird dabei in direkten Zusammenhang mit der Betonung des Wortes gebracht. Die Betonung von ja wird als Kontrastakzent analysiert. Der Kontrastakzent markiert den Gegensatz zu einer kontextuell relevanten Proposition, z.B. in (15): Adressat wird zu spät nach Hause kommen, oder in (16): Adressat könnte den Käse probieren. Die unterstellte Unkontroversheit bezieht sich nach Meibauer (1994, 142-152) auf den Willen des Sprechers: Der Sprecher will, dass ein bestimmter Sachverhalt eintritt (also dass der Adressat nicht zu spät kommt, oder nicht den Käse isst). Das ist schon in dem Satzmodus des Aufforderungssatzes enthalten. Der Bedeutungsbeitrag von ja beziehe sich nun auf die Einstellung des Sprechers hierzu. Der Sprecher wolle nämlich au-
43
ßerdem, dass sein Wollen unkontrovers ist (also dass der Adressat ihm nicht widerspricht oder seine Aufforderung nicht befolgt). Die Analyse als Kontrastakzent läuft dann allerdings darauf hinaus, dass die Annahme des Sprechaktes doch kontrovers ist, also dass der Adressat z.B. spät nach Hause kommen will. Was in den monosemischen Analysen als «Unkontroversheit» etikettiert wird, sind also bei näherem Hinsehen durchaus unterschiedliche Nuancen: (18) Domäne
Funktion
Bekanntheits-y'a
Deklarativsatz
Sprecher geht davon aus, dass Hörer den Sachverhalt kennt.
Überraschungs-/a
Exklamativsatz
Sprecher geht davon aus, dass der Sachverhalt offensichtlich ist und dass der Hörer ihn nicht bestreiten kann.
Betontes ja
Deklarativsatz, Entscheidungsfrage, Imperativsatz, Nebensatz, 2 jeweils mit Kontrastakzent
Sprecher verleiht nachdrücklich seinem Wunsch nach Annahme des Sprechaktes durch den Hörer Ausdruck
Eine monosemische Analyse verschiedener Verwendungsweisen in verschiedenen Domänen verlangt, dass die semantischen Effekte, die mit den Verwendungsweisen assoziiert sind, sich aus der Grundbedeutung der Partikel und den Funktionen der Domänen kompositional ableiten lassen (so explizit Fischer 2000). Weiterhin verlangt sie, dass die Domänen in gewisser Weise analog sind (sonst sind die Varianten nicht vergleichbar). Für Meibauers Analyse des (unbetonten) Bekanntheits- und des Überraschungs-y'a galt, dass beide Einigkeit in Bezug auf die Bekanntheit bzw. Evidenz der Proposition signalisieren, und zwar eine als tatsächlich unterstellte Einigkeit zwischen Sprecher und Hörer. Darüber hinaus korreliert der Unterschied zwischen Bekanntheits-y'a und Überraschungs-y'ö mit dem Unterschied zwischen dem Deklarativ- und Exklamativsatz. Man kann also sagen, dass der Unterschied zwischen Bekanntheits-y'a und Überraschungs-y'a nicht in der Bedeutung von ja selbst lokalisiert zu werden braucht, sondern sich aus dem satzsemantischen Beitrag des Deklarativ- bzw. Exklamativsatzes herleiten lässt (Meibauer 1994). Das Moment der Überraschung kann dem Exklamativsatz zugeschrieben werden. Insofern ist für Bekanntheits- vs. Überraschungs-ya die Anforderung erfüllt, dass der Unterschied beider Varianten sich auf den Unterschied der Domänen, in denen sie eingesetzt werden, reduzieren lässt. Beim betonten JA hingegen implikatiert das «Wollen der Unkontroversheit», dass der Sprecher die Annahme des Sprechaktes durch den Hörer geradezu als uneinig unterstellt. Die «Unkontroversheit» als Grundbedeutung ist also in völlig verschiedenem Sinne zu verstehen: Beim Bekanntheits-AJberraschungs-ya gibt es sie wirklich bzw. wird sie angenommen, beim betonten JA ist sie nur möglich bzw. sie wird nicht als schon gegeben angenommen. Wäre die Grundbedeutung beim 2
Diese Domänen und Beispiele dafür finden sich bei Meibauer (1994, 133s.).
44
betonten JA die gleiche wie beim unbetonten ja, so müsste das betonte JA Unkontroversheit von Sprecher und Hörer gegen Dritte markieren. Das ist aber nicht der Fall. Dieser Umstand ist für die monosemische Analyse ein Problem, weil sich der Unterschied im semantischen Effekt nicht auf unabhängige Unterschiede zwischen den Domänen reduzieren lässt. Das betonte JA kann in verschiedenen Domänen vorkommen, darunter mit dem Deklarativsatz sogar in derselben wie das Bekanntheits-7'α! Ähnliche Schwierigkeiten ergeben sich bei genauerem Hinsehen in Fischers (2000) monosemischer Analyse der Partikel ja. Für Fischer ist die Grundbedeutung von ja in allen seinen Verwendungen, d.h. nicht nur als Modalpartikel, sondern auch als Diskurspartikel: Ί think that you and I think the same' (2000,266) und damit der «Unkontroversheit» Meibauers sehr ähnlich. Übertragen auf die Verwendung von ja als Annahme eines direktiven Sprechaktes (cf. Nr. 3 in 2.1.) wird diese Grundfunktion bei Fischer folgendermaßen ausformuliert: «For ja as a signal of completed action [...] its invariant meaning concerns the action which is supposed to be carried out. Thus, the agreement relation refers to the execution of an action requested such that there is identity between the action requested and the action performed» (Fischer 2000,267).
Gegen diese Darstellung ist einzuwenden, dass die Annahme eines direktiven Sprechaktes und Erledigung der Handlung, auf die er Bezug nimmt, sicherlich nicht mit «I think that you and I think the same» paraphrasiert werden kann. Es dürfte auch schwerfallen, eine «kommunikative Domäne» zu finden, auf die der Satz «I think that you and I think the same» angewandt eine angemessene Charakterisierung dieser Funktion von ja ergibt. Ich möchte damit nicht bestreiten, dass es eine intuitiv wahrnehmbare (und auch semantisch rekonstruierbare) Verbindung zwischen dieser Funktion von ja und z.B. der Modalpartikel oder auch der Antwortpartikel ja gibt. Es scheint mir jedoch nicht möglich, diese Verbindung durchgängig als Applikation eines invarianten semantischen Grundwerts in verschiedenen kommunikativen Domänen auszubuchstabieren. Vielmehr sind schon die Modal- und Diskurspartikel, und anscheinend auch die verschiedenen Varianten der Modalpartikel, je autonome Bedeutungen, zwischen denen zwar nachvollziehbare Beziehungen bestehen, die aber nicht bloß Applikationen einer einheitlichen Grundbedeutung sind. Aufgabe wird es also sein, diese Beziehungen aufzuzeigen und historische Filiationen zwischen ihnen zu rekonstruieren. Hiermit werde ich mich genauer in Kap. 2.4. befassen. Wir müssen jedoch zunächst das theoretische Fundament legen, welches uns erlaubt, die Natur der Modalpartikel (und anderer Abtönungsformen) besser zu verstehen. Im Anschluss daran kann das Problem der historischen und synchronen Beziehungen zwischen der Modal- und der Diskurspartikel ja angegangen werden.
45
2 . 3 . H y p o t h e s e 1: A b t ö n u n g a l s A n t i z i p a t i o n d e r H ö r e r r e a k t i o n Im folgenden möchte ich nun, aufbauend auf der Modalitätskonzeption
Givöns
( 1 9 9 5 ) , ein v o m Ausdruck unabhängiges Modell vorstellen, mit d e m die Funktion abtönender Ausdrücke beschrieben werden kann.
2.3.1. D i e kommunikative Redefinition der Modalität bei G i v ö n ( 1 9 9 5 ) G i v ö n ( 1 9 9 5 ) schlägt eine Konzeption sprachlicher Modalität vor, in der die traditionellen l o g i s c h e n Kategorien epistemischer Modalität «kommunikativ» redefiniert werden: (19) Givön (1995, 114) Logische Tradition
Kommunikatives
Äquivalent
Notwendig wahr
Präsupposition
Kontingent wahr
Realis-Assertion
Möglicherweise wahr
Irrealis-Assertion
Unwahr
Negierte Assertion
Grundgedanke ist dabei, dass die Modalitäten sich danach unterscheiden lassen, in w e l c h e m M a ß e der Sprecher der Proposition subjektiv Hörerreaktion
er antizipiert.
gewiss
ist und w e l c h e Art von
D i e antizipierten Hörerreaktionen für diese vier Typen
v o n Modalität beschreibt Givön ( 1 9 9 5 , 114) nun folgendermaßen: (20)
«The communicative
re-definition of epistemic
modality
a. Presupposition: The proposition is assumed to be true, either by definition, by prior agreement, by generic culturally-shared convention, by being obvious to all present at the speech situation, or by having been uttered by the speaker and left unchallenged by the hearer. b. Realis assertion: The proposition is strongly asserted to be true; but challenge from the hearer is deemed appropriate, although the speaker has evidence or other grounds to defend their strong belief. c. Irrealis assertion: The proposition is weakly asserted to be either possible, likely or uncertain (epistemic sub-modes), or necessary, desired or undesired (valuative-deontic sub-modes). But the speaker is not ready to back up the assertion with evidence or other strong grounds; and challenge from the hearer is readily entertained, expected or even solicited. d. NEG-assertion: The proposition is strongly asserted to be false, most commonly in contradiction to the hearer's explicit or assumed beliefs; challenge from the hearer is anticipated, and the speaker has evidence or other grounds to back up their strong belief.» Information, die in einer Präsupposition enkodiert ist, wird v o m Sprecher als unkontrovers eingeschätzt. In der Äußerung
46
(21)
Ich möchte mit dem Geschäftsführer sprechen
erwartet der Sprecher vielleicht Widerstand gegen den Wunsch, mit dem Geschäftsführer sprechen zu können, nicht jedoch gegen die präsupponierte Proposition, dass es einen Geschäftsführer gibt. Die Reaktion «Es gibt hier keinen Geschäftsführer» würde als unerwartete Fortsetzung des Diskurses angesehen werden. 3 Für die Assertion (22)
Es gibt hier einen Geschäftsführer
die die gleiche Proposition nicht präsupponiert, sondern assertiert, ist der Sprecher hingegen auf mehr Widerstand gefasst. Er hält es fur möglich, dass die Geltung der Proposition, dass es einen Geschäftsführer gibt, unmittelbar im Anschluss an seinen Redebeitrag thematisiert wird, und dass er also Evidenz oder andere Gründe für seine Assertion aufbringen muss. Noch stärker ist dies der Fall bei Negationen wie (23)
Es gibt hier keinen Geschäftsführer
die die gleiche Proposition negiert, im Allgemeinen gegen tatsächliche oder unterstellte Überzeugungen des Hörers. Negationen haben spezifische Bedingungen, um pragmatisch akzeptabel zu sein (Givon 1978). Damit die Äußerung (23) glückt, muss im Diskurskontext die Frage der Existenz eines Geschäftsführers schon thematisiert oder anderweitig evoziert sein. Hier werden Einwände sogar erwartet (cf. Givon 1979, 107). Welchen Beitrag kann dieser Rahmen nun für die Beschreibung abtönender Ausdrücke leisten? Hansen (1998b) regt an, Givons Modalitätskonzeption auch für die Untersuchung pragmatischer Partikeln fruchtbar zu machen. Modalität wird so «kommunikativ» insofern, als sie zur «negociation perpetuelle des faits et des perspectives qui est une caracteristique sans doute definitoire du dialogue» (Hansen 1998b, 134) gehört. Ich möchte für folgende Anschlussmöglichkeit der Abtönungsformen an Givons Konzeption plädieren: Modalpartikeln, und Abtönungsformen im Allgemeinen, haben die Funktion, die illokutive Funktion ihrer Trägeräußerung in Bezug auf den jeweiligen Diskurs zu perspektivieren. Sie zeigen an, in welchem Maße der Sprecher Zustimmung, Widerstand oder andere Reaktionen erwartet und wie er diese Reaktion in Bezug auf den bis dahin erreichen Stand des Diskurses rechtfertigt, z.B. indem er auf frühere Äußerungen Bezug nimmt. Sie sind daher insbesondere geeignet, die mit Givons vier Typen kommunikativer Modalität in (20) verbundenen Erwartungen an Hörerreaktionen zu modifizieren bzw. zu verfeinern. Dadurch ermöglichen sie dem Sprecher auch, Äußerungen zu vollziehen, die vordergründig nicht in 3
Diese Eigenschaft kann allerdings auch manipulativ dafür ausgenutzt werden, Propositionen in den common ground zu «schmuggeln», d.h. ihre nachfolgende Thematisierung zu verhindern, die von ihrem Informationsgehalt her einer Enkodierung als Assertion durchaus würdig wären: «[...] consider the daughter who tells her father selbstverständlich +> Zustimmung
campidoglio 'Kapital'
campidoglio 'Ölfeld'
capitolio 'Kapital'
Auf dem Kapitolhügel standen Ölbäume.
2.5. Antwortpartikel und Diskurspartikel 2.5.1. Syntaktische Position von Modalpartikel und Diskurspartikel Zwischen den Verwendungen von ja als Modalpartikel und denjenigen als Diskurspartikel gibt es einen auffalligen syntaktischen Unterschied: Nur die Position der Modalpartikel ja kann nach satzgrammatischen Kriterien bestimmt werden (sie steht typischerweise satzintern im Mittelfeld, nach dem finiten Verb). Die Position der Diskurspartikeln und auch die der Antwortpartikel kann nicht syntaktisch, sondern nur nach Kriterien der Diskursstruktur bestimmt werden (Hansen 1998, 129-169). Die Modalpartikel ist immer weit in einen Satz integriert, die Diskurspartikel ist immer eine syntaktisch periphere Konstituente. Die Syntax der einzelnen Verwendungen von ja (cf. 2.1.) wird in der Tabelle (45) zusammengefasst. Abgesehen von der Modalpartikel und der Antwort- und Bestätigungspartikel sind die Funktionen von ja also Varianten von Diskurspartikeln.
56
(45)
Syntax der Varianten von dt. ja
Variante
Positionelle
Antwortpartikel
Satzwertig
Merkmale
Beispiel A: sollte ich den mit fünf nehmen? B: ja
Bestätigungspartikel
Satzwertig
A: du brauchst äh eine runde orange Schraube mit Kerbe B: ja
Annahme eines direktiven Sprechaktes
Satzwertig
und damit das festbleibt, drehst du da so einen diesen grünen Klotz rein oder ist egal, welche Farbe. B: mhmja.
Bestätigungs-einholend
Satzwertig oder am rechten Satzrand, am Ende eines Turns
A: da komme ich zu Ihnen, ja?
Hörerkontaktsignal
Satzwertig
A: wir könn' das ja erstmal vorläufig festhalten und B: ja A: wenn wir dann genau wissen, uns genau im klaren darüber sind und genauer beurteilen können
Sprecherkontakt-signal
Am linken Satzrand, am Anfang eines Turns
B: ja, Tag, Frau Weißpflug
«Framer»
Am linken Satzrand
A: ja, hallo, hier ist Ina Weißpflug. ich wollte fragen, wann Sie vielleicht Zeit hätten, die beiden zweitägigen Treffen zu machen.
Hesitation phenomenon
Mitten im Satz, aber in einer Formulierungspause
nimmst du ähm ja den ja nimmst du die gelbe Schraube mit der Kerbe.
Reparaturmarker
Mitten im Satz, aber in einer Formulierungspause
es wird um einen länger, genau, ja damit es um einen länger wird.
Modalpartikel
Am Anfang des Mittelfeldes
wir machen ja noch eins
Die Position aller Varianten außer der Modalpartikel wird nach Prinzipien der D i s kursstruktur bestimmt, nicht nach satzgrammatischen Prinzipien: Die Antwortpartikel steht unmittelbar nach einer Frage, die Bestätigungspartikel unmittelbar nach der Äußerung, die sie bestätigt, die Annahmepartikel unmittelbar nach d e m direktiven Sprechakt, auf den sie reagiert. D i e auf den Diskurs selbst bezogenen Varianten stehen, je nachdem ob sie voraus- oder rückwirkend sind, an der jeweiligen Grenze des
57
Diskursabschnittes, der durch ihren funktionalen Skopus bestimmt wird: Das Hörerkontaktsignal bestätigt rückwirkend das Zuhören, das Sprecherkontaktsignal hat eine vorauswirkende phatische Funktion, der «Framer» leitet vorauswirkend einen neuen thematischen Abschnitt ein, hesitation phenomenon und Reparaturmarker befinden sich an derjenigen Stelle im Diskurs, deren Formulierung sie vorausbzw. rückwirkend markieren. Im Gegensatz zu all diesen Diskurspartikelverwendungen ist der Skopus der Modalpartikel grammatisch bestimmbar. Er entspricht dem Satz, der der Träger dieser Partikel ist. Für diesen Unterschied im syntaktischen Verhalten der Partikelvarianten gibt es einen historischen Grund. Diskurspartikeln enstehen historisch aus Entitäten, die noch keine Diskurspartikeln sind. Z.B. ist die italienische Partikel guarda aus dem Imperativ guarda! 'guck [mal]!' entstanden (ähnlich die entsprechenden Partikeln frz. regarde, sp. mir a (cf. Pons Borderia 1998b), pt. olha, engl. look). Der Imperativ guarda! und seine Pendants in anderen Sprachen werden von Sprechern dazu verwendet, die Aufmerksamkeit der Gesprächspartner auf in der Situation sichtbare Dinge zu lenken (Pons Borderia 1998b). Mit diesem Imperativ implikatiert der Sprecher, dass ihm etwas Wichtiges, Interessantes bekannt ist, was die unmittelbare und sofortige Aufmerksamkeit der anderen Gesprächspartner verdient (Waltereit 2002). Wenn der Sprecher nach einem solchen Imperativ sofort weiterspricht, wird dadurch sein Gesprächsbeitrag auch als besonders wichtig und relevant gekennzeichnet (denn es wird darin etwas gesagt, was die sofortige und unmittelbare Aufmerksamkeit der anderen verdient): (46)
Verkaufsgespräch in einem Bekleidungsgeschäft (LIP RE1) A: questa e bella guarda pure questa quant'e questa erasata fuori e flanellata dentro
Ein Redebeitrag, der in solcher Weise wichtig und beachtenswert ist, kann auch eine Unterbrechung eines anderen Gesprächspartners rechtfertigen (Waltereit 2002). Da die Redeübernahme ein in spontaner Konversation hochgradig häufiges Problem ist, das nach schnellen und effektiven Routinen verlangt, werden Sprecher dazu neigen, selbstselegierte Redeübernahmen mit Formeln einzuleiten, die die Relevanz ihres Beitrags herausstellen (Detges 2001, 330-336). Es ist daher plausibel anzunehmen, dass Sprecher irgendwann entdecken, dass man Unterbrechungen gewissermaßen straflos mit guarda! einleiten kann. Sprecher werden daher anfangen, unterbrechende Redebeiträge mit guarda! einzuleiten, auch wenn sie gar nichts zum Hingucken haben. Sie sagen einfach guarda!, um die hohe Relevanz dessen, was sie sagen, zu unterstreichen bzw. um möglicherweise eine Unterbrechung zu rechtfertigen. Auf diese Weise wandelt die Formel guarda ihre Bedeutung; sie heißt nicht mehr 'guck mal!', sondern 'hör mir zu, ich habe etwas Wichtiges zu sagen': (47)
Telefongespräch (LIP MB9) Β: l'hanno ammazzato era ricchissimo qualcuno l'avrä fatto fuori A: guarda che soffriva di cuore eh?
Α bringt hier einen neuen Gesichtspunkt in die Konversation ein: Α scheint nicht zu glauben, dass die Person, über die sie sprechen, getötet wurde; vielmehr weist Α auf die Herzschwäche dieser Person hin. Hier hat guarda nichts mehr mit «Hingucken» zu tun, sondern es wird nur ein neuer Gesichtspunkt, den man beizusteuern hat, fo-
58
kussiert. Eine konversationeile Implikatur, die mit der Imperativbedeutung verbunden war, wird nun zur konventionellen Bedeutung. Eine solche Bedeutung ist nicht mehr die Bedeutung einer Verbform. Auf diese Weise entsteht der Diskursmarker: 7 Eine Form, die selbst kein Diskursmarker ist, hat einen für die Diskursstruktur wichtigen Nebeneffekt (in diesem Fall die «Erlaubnis» zur Rederechtsübernahme); sie wird in dem Moment ein Diskursmarker, wo Sprecher diesen Nebeneffekt gezielt einsetzen und es ihnen gar nicht mehr um die Imperativbedeutung 'guck mal!' zu tun ist. In der Imperativverwendung war guarda ein kurzer, aber syntaktisch vollständiger Satz. In der Diskurspartikelverwendung ist guarda kein Satz mehr, sondern eine Partikel, die Teil einer anderen (typischerweise auf sie folgenden) Äußerung ist. Die Form guarda hat aber - und das ist hier entscheidend - ihre syntaktische Position nicht geändert; sie steht sowohl in der Imperativ- als auch in der Diskurspartikelverwendung vor dem Satz, auf dessen Wichtigkeit sie hinweist. Wenn man diese Beobachtung verallgemeinert, sieht man den Unterschied zwischen Diskurs- und Modalpartikeln in einem neuen Licht: Diskurspartikeln sind syntaktisch periphere Konstituenten, weil auch ihre Vorgänger schon syntaktisch periphere Konstituenten waren. Modalpartikeln hingegen sind in den Satz integriert; man kann daher ceteris paribus davon ausgehen, dass auch ihre Vorgänger syntaktisch in den Satz integriert waren. Unter dieser Annahme wird die Vermutung Pauls gestützt, dass der Vorgänger der Modalpartikel ja nicht direkt die Antwortpartikel ja war, denn die Antwortpartikel kann natürlich nicht an der selben Stelle im Satz stehen wie die Modalpartikel. Vielmehr ist es wahrscheinlich, dass der Vorgänger der Modalpartikel ein Wort war, das in derselben syntaktischen Position stehen konnte wie jetzt die Modalpartikel, in diesem Fall das Adverb je. Erst durch eine volksetymologische Reinterpretation wurde die Antwortpartikel ja eine «Stiefmutter» der Modalpartikel. Der syntaktische Unterschied zwischen Diskurs- und Modalpartikeln macht so auf einen wichtigen funktionalen Unterschied aufmerksam. Wenn die Vorgänger von Modalpartikeln auch schon in den Satz integriert waren, mussten auch sie schon Skopus über eine satzgrammatisch bestimmbare Einheit, typischerweise den Satz, haben. Die Vorgänger von Diskurspartikeln hingegen bezogen sich auf ein «Textstück», d.h. auf eine syntagmatische Einheit, die nicht nach syntaktischen, sondern nach diskursstrukturellen Kriterien bestimmt werden kann. Sie hatten eine bestimmte Wirkung, die sich Sprecher dann in «missbräuchlicher» Verwendung dieser Formen zunutze gemacht haben, um den Nebeneffekt, der mit ihr verbunden war, gezielt in den Vordergrund zu rücken. Ein Unterschied zwischen den Vorgängern von Modal- und Diskurspartikeln ist also, dass die Vorgänger von Diskurspartikeln sich auf einen Diskursabschnitt variabler Länge beziehen, die Vorgänger von Modalpartikeln hingegen auf einen Satz.
In weiteren diachronen Schritten kann der rhetorische Effekt, der mit einer bestimmten Diskurspartikel verbunden ist, wiederum «missbräuchlich» verwendet werden und so können durch weitere Konventionalisierungen konversationeller Implikaturen neue Diskurspartikelfunktionen entstehen. D.h. der unmittelbare funktionale Vorgänger einer bestimmten Diskurspartikelbedeutung kann auch selbst schon eine Diskurspartikel gewesen sein.
59
In dieser Argumentation wird als eine Regel des Sprachwandels vorausgesetzt, dass sprachliche Einheiten vor und nach funktionalem Wandel die gleiche Position in der chaine parlee haben. Dies ist eine unmittelbare Folge aus der Annahme, dass funktionaler Wandel formalem Wandel vorausgeht (cf. etwa Heine/Claudi/Hünnemeyer 1991, 212s.). Natürlich können, wenn der Funktionswandel erfolgt ist, die Elemente in eine andere syntaktische Position kommen. Für die Modalpartikeln heißt dies, dass nur solche Elemente in die spezifische syntaktische Position der deutschen Modalpartikel einrücken können, die auch in der Vorgängerfunktion dort stehen konnten. Hierzu gehören insbesondere Adverbien und Adverbiale, wie eben je. 2.5.2. Ja als Modalpartikel vs. Diskurspartikel: Bezug auf die illokutiven vs. diskurssyntaktischen Merkmale der Antwortpartikel In der Diachronie von ja als Diskursmarker wird auf die eine oder andere Weise immer der diskursstrukturierende Effekt der Antwortpartikel ja ausgenutzt. Als Antwortpartikel ist ja automatisch das zweite Glied eines adjacency pair (ein second-pair-part, cf. Sacks/Schegloff/Jefferson 1974); es folgt daher immer unmittelbar auf einen Sprecherwechsel. Außerdem ist ja ein Satzwort. Für die Verteilung des Rederechts heißt dies, dass nach ja wiederum ein Sprecherwechsel stattfinden kann. Nach ja entsteht ein neuer transition-relevance-place, d.h. der Antwortende kann das Rederecht nach seiner Antwort wieder abgeben. Je nach Fragesituation kann das Rederecht sogar so verteilt sein, dass der Antwortende mit dem ja das Rederecht sogleich wieder abgeben muss, d.h. dass erwartet wird, dass er keine weiteren Erläuterungen hinzufugt (z.B. beim mündlichen Durchgehen eines Fragebogens oder bei einem Ratespiel). Die Antwortpartikel ja hat somit eine sehr strenge Diskurssyntax. In den Verwendungen als Diskursmarker werden die Effekte dieser Diskurssyntax «ausgebeutet»: Ja als Hörerkontaktsignal (5) hat die gleiche Diskurssyntax wie die Antwortpartikel, ohne dass damit notwendigerweise Einverständnis signalisiert wird. Die Diskurssyntax der Antwortpartikel wird hier also für das in der Kommunikation hochfrequente Problem ausgenutzt, beim Zuhören dem Sprecher kleine phatische Rückmeldungen zu geben, ohne ihm das Rederecht streitig zu machen. Die Verwendungen von ja zum Einholen einer Bestätigung (4), als Sprecherkontaktsignal (6) und als «Framer» (7) übertragen in je spezifischer Weise die Diskurssyntax der Antwort- bzw. Bestätigungspartikel in monologale Kontexte. Beim Einholen der Bestätigung (4) sagt der Sprecher die Antwort gleich mit. Der Sprecher überlässt also nicht dem Hörer nicht die Antwort, sondern nimmt sie vorweg. (Hier kommt allerdings hinzu, dass nicht nur die Diskurssyntax des Wortes ja ausgenutzt wird, sondern auch sein illokutiver Gehalt der Einverständniserklärung.) Ja als gesprächseinleitender «Framer» (7) suggeriert eine Anknüpfung an eine gemeinsame «Diskursvergangenheit». Wenn das Gespräch mit einem second-pair-part eingeleitet wird, wird damit suggeriert, dass es vorher schon ein first-pair-part gegeben hat, so als ob das Gespräch z.B. nur nach einer Pause wiederaufgenommen worden wäre. Damit wird das kommunikative Problem gelöst, beim Gesprächsbeginn einen gemeinsamen Anknüpfungspunkt zu finden. Ja als
60
Sprecherkontaktsignal leitet den Turn ein (6). Damit wird die Eigenschaft der Antwortpartikel ja, unmittelbar nach einem Sprecherwechsel vorzukommen, ausgenutzt, ohne dass dieses Sprecherkontaktsignal den Sprecher darauf festlegt, sein Einverständnis zu irgend etwas erklärt zu haben. In den Funktionen als Verzögerungs- und Reparaturmarker in (8) und (9) erscheint ja innerhalb eines Turns (turn-medial). Selbstverständlich sind Redeverzögerungen und Neuformulierungen häufig vorkommende kommunikative Probleme. Hier wird anscheinend die Eigenschaft der Antwortpartikel ja ausgenutzt, dass ihr immer ein Sprecherwechsel vorausgeht und oft ein Sprecherwechsel folgt. Indem der Sprecher eine Formulierungspause mit diesem Wort füllt, gibt er zu erkennen, dass er sein Rederecht nicht abgeben will. Denn nach dem Wort ja fällt das Rederecht wieder an den, der es vor diesem Wort schon innehatte. Man könnte diesen Effekt auch so beschreiben, dass der Sprecher polyphonisch (cf. 2.6.) ein Hörerkontaktsignal in seine eigene Rede einbaut. Es gibt somit einen wichtigen semantischen Unterschied in der Diachronie von ja als Diskursmarker und von ja als Modalpartikel. Die Modalpartikel nutzt die auf die innere Organisation des Sprechens (im Sinne von Koch 1987, siehe oben 2.1.) bezogenen Eigenschaften der Antwortpartikel aus, nämlich die illokutive Qualität der Einverständniserklärung, nicht jedoch die diskurssyntaktischen Eigenschaften (das second-pair-part). Die verschiedenen Varianten von ja als Diskursmarker hingegen nutzen die auf die äußere Organisation des Sprechens bezogenen Eigenschaften der Antwortpartikel aus, nämlich die diskurssyntaktische Eigenschaft, ein second-pair-part mit anschließendem transition-relevance-place zu sein, nicht jedoch die illokutive Qualität der Einverständniserklärung.
2.6. Ist «Abtönung» eine einheitliche Kategorie? Der hier unternommene Versuch, die Intuition hinter dem traditionellen Begriff «Abtönung» ernst zu nehmen, mag zum Widerspruch reizen. Ist das wirklich eine einheitliche Inhaltskategorie wie beispielsweise Tempus oder Negation? Die Einheitlichkeit von Abtönung kann, wie mir scheint, auf mehreren Ebenen hinterfragt werden: Sind nicht die Effekte der hier Abtönungsformen genannten Elemente in sich so heterogen, dass sie nicht zu einer Inhaltskategorie zusammengefasst werden können? Man könnte vorbringen, dass z.B. der Effekt von bloß in (48)
Geh bloß weg!
und derjenige von schon in (49)
Ich komm schon.
so unterschiedlich sind, dass sie sich nicht sinnvoll zu einer einheitlichen Kategorie fugen. Sicherlich sind die Funktionen der Abtönungsformen unterschiedlich, und die Unterschiede können auch nicht ohne weiteres als Werte eines einzigen Parameters aufgefasst werden in der Art, wie z.B. Tempusformen als Parameterwerte einer Zeit-
61
skala aufgefasst werden können. Jedoch ist Abtönungsformen in der hier vertretenen Rekonstruktion gemein, dass sie die illokutive Funktion einer Äußerung in Bezug auf die zu erwartende Hörerreaktion modifizieren. Dies scheint mir einerseits allgemein genug zu sein, um die durchaus unterschiedlichen Effekte der einzelnen Formen zusammenbringen zu können. Andererseits ist dies spezifisch genug, um Abtönungsformen z.B. von Diskursmarkern und -partikeln absetzen zu können, die keine inhaltliche Situierung einer Äußerung, sondern die Verortung eines Diskursabschnittes in der Gesamtstruktur des Diskurses vornehmen. Zu dieser Abgrenzung komme ich noch genauer in Kap. 3.5.4. Handelt es sich überhaupt um Bedeutungen sprachlicher Zeichen, und nicht vielmehr um kontextuell bedingte Interpretationseffekte, die nicht dem Signifie eines einzelnen Ausdrucks zugeschrieben werden können? Man könnte einwenden, dass z.B. die «Modalpartikelverwendung» von dt. ja kein eigenes sprachliches Zeichen repräsentiert, sondern einen Nebeneffekt anderer Bedeutungen. Das mit diesem Einwand angesprochene Problem ist die Frage nach Mono- oder Polysemie. In einer monosemischen Perspektive, wie sie Fischer (2000) vertritt, ist die Modalpartikelverwendung in der Tat keine eigene Bedeutung, sondern lediglich einer der Effekte, die sich aus der Grundbedeutung des Ausdrucks ergeben. In dieser Arbeit ist aber für eine polysemische Perspektive argumentiert worden (cf. Kap. 1.3.) und entsprechend ist davon auszugehen, dass die Regelmäßigkeit, mit der z.B. die deutschen Modalpartikeln mit dem «abtönenden» Effekt assoziiert werden, auch semantisch repräsentiert sein muss.
2.7. Polyphonie Beschreibt man den Zusammenhang zwischen Modal-, Antwort- und Antwortpartikel so, wie ich es in den Abschnitten 2.4.1. und 2.4.2. vorgeschlagen habe, so setzt man voraus, dass der Sprecher eine Reaktion des Hörers in seine eigene Rede einbaut. Der Sprecher nimmt das bestätigende ja des Hörers in seiner eigenen Äußerung vorweg. Er spricht gewissermaßen mit mehreren «Stimmen», mit seiner eigenen und der des Hörers. Diese Vereinnahmung des Hörers kann eine Form von «positiver Höflichkeit» (Brown/Levinson 1989, 101-103, cf. hier Kap. 7.1.) sein, weil der Sprecher etwas, was für den anderen tatsächlich selbstverständlich ist, auch als selbstverständlich kennzeichnet und so seine Empathie mit dem Gesprächspartner zum Ausdruck bringt. Die Vereinnahmung kann aber auch ausgesprochen unfreundlich sein, wenn nämlich der Sprecher etwas als selbstverständlich ausgibt, von dem er in Wirklichkeit weiß, dass es gar nicht selbstverständlich ist, wenn etwa ein Elternteil dem Kind sagt: Du hast ja schon deine Hausaufgaben gemacht, obwohl die Hausaufgaben womöglich noch unerledigt sind (Reiter 1980 bezeichnet diese Verwendung von ja als «perfide»). Auch das bestätigungseinholende ja (4) ist so eine Form der Vereinnahmung.
62
2.7.1. Was ist Polyphonie? Das Hereinnehmen einer anderen Sprechinstanz in die eigene Rede wird in der Linguistik traditionell als Polyphonie bezeichnet. Der Begriff wurde von Michael Bachtin geprägt. Für Bachtin ist Polyphonie eine Kategorie der Literaturanalyse: «Pour Bakhtine, il y a toute une categorie de textes [...] pour lesquels il faut reconnaitre que plusieurs voix parlent simultanement, sans que l'une d'entre elles soit preponderate et juge les autres: il s'agit de ce qu'il appelle [...] la litterature populaire, ou encore carnevalesque, et qu'il qualifie quelquefois de mascarade, entendant par lä que l'auteur y prend une serie de masques differents» (Ducrot 1984, 171).
Ducrot (1984) hat diesen Ansatz zu einem linguistisch-pragmatischem Konzept weiterentwickelt, mit dessen Hilfe die Intuition rekonstruiert werden kann, dass in einer Äußerung «mehrere Stimmen sprechen». 8 Ducrot tritt mit dem weitgesteckten Ziel an «de contester - et, si possible, de remplacer - [ . . . ] un prealable (generalement implicite) de tout ce qu'on appelle actuellement da linguistique moderne> [...]. Ce prealable, c'est l'unicite du sujet parlant» (Ducrot 1984, 171).
Ducrot unterscheidet hierfür: Sujet parlant = derjenige, der eine Äußerung materiell hervorbringt. Locuteur = derjenige, der für den Inhalt einer Äußerung verantwortlich ist und sich ihn zu Eigen macht. Enonciateur = tatsächliche oder fiktive Instanz, der eine Proposition zugeschrieben wird.
In nicht-polyphonen Äußerungen fallen diese drei Instanzen zusammen. Polyphonie liegt dann vor, wenn eine oder zwei dieser Instanzen nicht übereinstimmen. Einfache Fälle von Polyphonie sind z.B. Zitate. Beim Zitat wiederholt ein Sprecher eine Äußerung eines anderen, für die er natürlich nicht selbst verantwortlich ist. Das ist eine Trennung von sujet parlant einerseits und locuteur/enonciateur andererseits. Besonders interessant scheinen aber Fälle zu sein, wo locuteur und enonciateur auseinanderfallen. Ducrot (1984, 214-224) nennt hier die Negation. Für eine Negation wie Pierre η'est pas gentil nimmt Ducrot zwei enonciateurs an. 9 Dem ersten enonciateur wird die Proposition zugeschrieben Pierre est gentil. Der zweite enonciateur widerspricht dieser Proposition. Der locuteur macht sich die Proposition des zweiten enonciateurs zu Eigen. 10 Mit der Annahme eines zweiten enonciateurs, der das affirmative Pendant zur Negation vertritt, wird der Einsicht Rechnung getragen, dass Negation diskursstrukturell voraussetzt, dass dieses Pendant explizit zurückgewiesen werden soll oder zumindest suggeriert wurde:
8 9
10
Roulet 1996 gibt einen guten Überblick über Bachtins und Ducrots Polyphoniekonzeption. Dies ist ein Beispiel fur den einfachsten und typischsten Fall der Negation, der «negation polemique». Ducrot (1984) diskutiert noch andere Fälle. Diese Analyse stimmt im Kem mit der Charakterisierung der Pragmatik der Negation von Givön(1979, 107) überein: «Negative assertions are used in language in contexts where the corresponding affirmative has been mentioned, deemed likely, or where the speaker assumes that the hearer - erroneously - holds to a belief in the truth of that affirmative».
63
«Negative assertions are used in language in contexts where the corresponding affirmative has been mentioned, deemed likely, or where the speaker assumes that the hearer - erroneously - holds to a belief in the truth of that affirmative» (Givon 1979, 107).
Im Fall der Negation ist Polyphonie systematisch in die Struktur der Sprache eingegangen. Aber «polyphony [...] is often achieved through means that are neither conventionalized nor grammaticalized» (Tabakowska 1991,21). So untersucht Günthner (1999), wie Sprecher sich prosodisch, durch Imitation oder Verfremdung der Stimme, von Worten oder Inhalten ihrer Rede distanzieren können, sie einem anderen enonciateur zuschreiben. Hier hat man es mit Polyphonie im «wörtlichen» Sinne zu tun: Der Sprecher (sujet parlant) inszeniert prosodisch mehrere Stimmen in seiner eigenen Rede. Ducrot(1984, 194) spricht einen anderen interessanten Fall von nicht-systematischer Polyphonie an: das Unterschreiben vorformulierter (und vorgedruckter) Erklärungen, z.B. bei Standardverträgen. Hier fallen locuteur einerseits und sujetparlantlenonciateur andererseits auseinander.11 Der Unterzeichnende, als locuteur, macht sich mit der Unterschrift Inhalte zu Eigen und muss sie verantworten, obwohl er sie weder selbst formuliert noch selbst materiell hervorgebracht hat. Das Formular wurde von einem anderen (enonciateur) entworfen und auch (als sujet parlant) gedruckt oder geschrieben. Aus dem Text «sprechen» somit die Stimmen sowohl desjenigen, der das Formular entworfen und aufgesetzt hat, als auch desjenigen, der es unterschreibt. - Man sieht an dieser kleinen Beispielserie, dass die Instanzen sujet parlant, locuteur und enonciateur anscheinend beliebig kombiniert werden können und dass keine zwei von ihnen mit derselben Person identifiziert werden müssen. Für den speziellen Fall, dass die zweite «Stimme» die des Angesprochenen ist, führen Roulet et al. (31991) den Begriff Diaphonie ein. Damit wird der besonderen, diskurskonstituierenden Rolle der 2. Person (gegenüber den durch die 3. Person vertretenen Diskursreferenten) Rechnung getragen: «Dans une structure polyphonique [...] deux voix se combinent dans la meme intervention, mais la voix de l'autre, qui n'est pas le destinataire de Γ intervention, n'est lä qu'ä titre d'objet de reference, et non pas de pöle d'interaction directe avec le destinataire. Dans une structure diaphonique, Γ enonciateur ne se contente pas de reagir, sans la toucher, ä une parole presente ou de se referer ä des paroles absentes, il commence par reprendre et reinterpreter dans son propre discours la parole du destinataire, pour mieux enchainer sur celleci» (Roulet et al. 1991,71).
Insofern differenziert Roulet den Polyphoniebegriff. In einem (in englischer Sprache geschriebenen) Überblicksartikel beruft sich Roulet (1996) auf Bachtin und Ducrot und benennt weitere Probleme und Facetten der Polyphonie, so die Unterscheidung nach expliziter/impliziter Polyphonie, Formen der Referenz auf die «andere Stimme»; er übernimmt aber nicht Ducrots Trennung zwischen locuteur und enonciateur, sondern fällt in dieser Hinsicht auf den undifferenzierten Begriff «voice» für
11
Die Trennung von locuteur und sujet parlant wird durch die französische Formel lu et approuvi 'gelesen und zugestimmt' explizit gemacht (Hinweis von Wiltrud Mihatsch).
64
alle «Stimmen» zurück. So sind für Roulet (1991, 77) 12 nicht nur direkte und indirekte Rede Polyphonie, sondern auch der anaphorische Bezug auf die Redeinhalte eines anderen: (50)
«je citai des propos dont ma vertu (Choderlos de Laclos, Liaisons dangereuses).
et
mon
amitie
s'alarmaient»
In diesem Beispiel ist der Bezug auf die «Stimme» eines anderen noch vermittelter als bei indirekter Rede. Er wird lediglich durch das Verb s 'alarmer, bezogen auf den Rede-bezeichnende Aktanten propos, erkennbar. Eine andere Form von Diaphonie konstituieren für Roulet Konnektoren, die einen Bezug auf einen Standpunkt des Gesprächspartners beinhalten, so wie pourtant im folgenden Interview aus dem Nouvel Observateur. (51)
«NO: Alors, comment expliquez-vous cette extreme variete face ä la pression selective? JR: Pour le geneticien japonais K.K., la plupart des mutations n'apportent ä l'individu ni defaveur sensible ni avantage particulier. Elles sont neutres. [...] K. n'elimine pas completement la selection, mais lui confere le röle de frein. NO: Dans votre livre, pourtant, vous ne vous ralliez pas entierement ä cette these du neutralisme» (zitiert bei Roulet et al. 1991, 81).
Der Gegensatz, den NO mit pourtant implikatiert, besteht nicht zwischen zwei von ihm selbst geäußerten Propositionen, sondern zwischen der von ihm selbst geäußerten und der des Gesprächspartners JR. N O ' s zweiter Turn ist trotzdem diaphon, weil pourtant auf den soeben geäußerten anderen Argumentationsstandpunkt verweist, von dem sich N O distanziert. Roulet nennt dies implizite Diaphonie. Eine weitere Differenzierung zieht Roulet zwischen «effektiver» und «potenzieller» Diaphonie. In den bisher besprochenen Fällen greift der Sprecher auf eine im Ko-Text wirklich vorhandene Äußerung des Gesprächspartners zurück. Der Rückgriff kann jedoch auch auf eine nur unterstellte, nicht wirklich geäußerte, «Stimme des Anderen» gemacht werden: (52)
«Bon les prix ont augmente hein depuis mais quand meme pas ä ce point-lä» (zitiert bei Roulet et al. 1991, 83).
Mit «bon les prix ont augmente hein» wird ein Standpunkt geäußert, von dem sich der Sprecher sogleich distanziert. Für den polyphonen Effekt ist es aber gar nicht nötig, dass der Gesprächspartner, oder irgend jemand anders, wirklich die Äußerung «les prix ont augmente» vollzogen hat. Insofern kann man von potenzieller Polyoder Diaphonie sprechen. Die bei Roulet (1991) besprochenen Fälle suggerieren also folgende (disjunktive) Kriterien für Polyphonie:
12
Roulet et al. 1991 ist ein Gemeinschaftswerk von Eddy Roulet, Antoine Auchlin, Jacques Moeschier, Christian Rubattel und Marianne Schelling. Das Kapitel über Polyphonie ist jedoch, wie in einer Fußnote p. 9 festgehalten wird, «redige par Eddy Roulet».
65
Direkte oder indirekte Redewiedergabe, auch Reformulierung; Präsenz von Elementen (insbesondere Diskurspartikeln), die eine Distanzierung des Sprechers von einem anderen (tatsächlichen oder unterstellten) Argumentationsstandpunkt implikatieren.
2.7.2. Polyphonie und «Footing» Es wird bei Ducrot nicht ganz klar, was eigentlich über diese Beispiele hinweg die Einheit des Phänomens Polyphonie (Diaphonie) genau definitorisch ausmacht, wie man also die Intuition, dass irgendwie eine weitere «Stimme» in der Rede präsent ist, theoretisch rekonstruieren kann. Vor allem aber wird nicht klar, warum es überhaupt so etwas wie Polyphonie gibt und warum sie in der Sprache eine so große Rolle spielt. Ist jeder Sprecher ein kleiner Theaterregisseur, dem es Vergnügen macht, verschiedene «Stimmen» zu inszenieren, oder kann man das Phänomen der Polyphonie auf grundlegendere pragmatische und interaktionstheoretische Annahmen zurückführen? Das wird bei Ducrot nicht angesprochen. Hier möche ich auf Erving Goffmans (1981) Theorie des Footing zurückgreifen, die in der Pragmatik weniger bekannt als die Polyphoniekonzeption Ducrots zu sein scheint, die aber Differenzierungen von Instanzen des «Sprechers» schon deutlich früher 13 angeboten hat und darüber hinaus den Vorteil hat, diese Differenzierungen in einem umfassenderen Modell sozialer Interaktion zu situieren. Bei Goffman ist die Trennung von Instanzen des Sprechers erst ein zweiter Schritt, aufbauend auf einer Trennung von Instanzen des Hörers. Diese letztere Trennung ist viel leichter nachzuvollziehen, wenn man einmal die von den Standard-Kommunikationsmodellen (Saussure, Bühler, Jakobson) überlieferte Vorstellung aufgibt, dass das Gespräch unter vier Augen die Normalform der Kommunikation sei. In sehr vielen sozialen Situationen, in denen gesprochen wird, ist der «Hörer» nicht immer die gleiche Person. Gesprächsteilnehmer gehen weg, andere kommen hinzu. Auch ist nicht jeder Anwesende ein Hörer. Die Anwesenden beteiligen sich nicht immer in gleichem Maße am Gespräch, «hören weg», klinken sich aus, kommen wieder zurück und «horchen auf». Ein Sprecher richtet sich einmal an alle Anwesenden, einmal nur an einen Teil, einmal ignoriert er bestimmte Anwesende, mal redet er einen Anwesenden unmittelbar an, möchte aber, dass ein anderer sich auch «angesprochen fühlt», auch wenn die Rede nicht direkt an ihn gerichtet wird usw. 14 Weiterhin gibt es auch Mithörer, also in der Situation Anwesende, die legitim mitbekommen können, was gesagt wird, auch wenn es mit ihnen nichts zu tun hat (man denke z.B. an Gespräche in öffentlichen Verkehrsmitteln oder Restaurants), die sogenannten «overhearers», und schließlich «eavesdroppers», die ein Gespräch unerlaubt belauschen. Mit der Wahl des Terminus «Footing» wird anscheinend auf die Veränderung der Körperhaltung angespielt, die mit der Adressaten-Selektion einhergeht. Ist diese Differenzierung des «Hörers» erst einmal gemacht, so wird auch die Differenzierung
13 14
Der hier als Goffman 1981 zitierte Artikel erschien erstmals 1979. Die Adressaten müssen nicht einmal unbedingt Menschen sein, z.B. wenn jemand ein Auto repariert und ein mechanisches Teil beschimpft, weil es nicht so funktioniert, wie der Bastler es will.
66
des «Sprechers» notwendig. Schon der Umstand, dass es die erste Person im Singular und im Plural gibt (bzw. dass ein einzelner «wir» sagen kann), macht es zwingend notwendig zu unterscheiden zwischen dem Sprecher als demjenigen, der die Worte materiell hervorbringt (bei Goffman: animator) und demjenigen bzw. denjenigen, die sie inhaltlich verantworten (principal). Wenn ein Sprecher im Plural spricht, müssen animator und principal auseinanderfallen. Bei wechselnder Zusammensetzung der Personen einer Sprechsituation ergibt sich zudem der Bedarf, dass ein Sprecher einmal nur für sich selbst (animator = principal), einmal (auch) für andere spricht (animator Φ principal). Die Reflexivität der Sprache, der Umstand, dass Sprecher andere oder sich selbst zitieren können, macht es weiterhin nötig, zwischen dem animator und demjenigen, der die Worte erstmals formuliert hat, zu unterscheiden. Diese letztere Instanz nennt Goffman author. Das Zitieren ist wiederum kein artifizieller Gebrauch der Sprache, vielmehr ergibt sich aus dem Umstand, dass die Hörer ständig in ihrer Zusammensetzung wechseln, unmittelbar der Bedarf, frühere Gesprächsteilnehmer oder sich selbst zu zitieren, um die neu hinzugekommenen Hörer auf den neuesten Stand zu bringen. Man könnte es auch noch grundsätzlicher ausdrücken sagen: Der Sprecher spricht im Laufe seines Lebens mit verschiedenen Hörern, und da seine Beziehungen mit diesen Hörern miteinander zusammenhängen, ergibt sich ein unmittelbarer Bedarf für Zitieren. Auch das Zitieren und Erzählen gehören für Goffman zum «Footing», weil in diesen Aktivitäten Sprecher und Hörer in einen anderen Rahmen versetzt werden und sich so die «Ausrichtung» der Kommunikation gegenüber der Ausgangssituation ändert. Versucht man nun, die Modelle Ducrots und Goffmans zu vergleichen, ergibt sich folgendes: Beide trennen den materiellen Produzenten der Rede von anderen Aspekten des Sprechers. Was bei Ducrot sujetparlant ist, ist bei Goffman animator. Hiermit hören aber die unmittelbaren Parallelen auf. Die Trennung zwischen locuteur und enonciateur einerseits und die zwischen author und principal andererseits sind nicht isomorph. Der Unterschied zwischen author und principal bezeichnet die Trennung zwischen inhaltlicher, gewissermaßen rechtlicher, Verantwortlichkeit und dem Formulieren einer Äußerung. Für diesen Unterschied zwischen «Inhalt» und «Verpackung» der Rede gibt es bei Ducrot keine Entsprechung. Der locuteur scheint vielmehr author und principal zusammenzufassen. Jedoch bezeichnet der enonciateur einen anderen Standpunkt als den des jeweiligen locuteur, der aber - zumindest suggeriert dies Ducrots Verwendung des Terminus - durch die Bedeutung eines bestimmten Ausdrucks evoziert wird und insofern an diesen Ausdruck gebunden ist. Während die Trennung zwischen author und principal sich durch die Redekonstellation ergibt bzw. im Belieben des jeweils Sprechenden liegt, ist die Trennung zwischen enonciateur und locuteur in der Bedeutung bestimmter Ausdrücke angelegt und insoweit der Kontrolle der Sprecher entzogen. Der Gebrauch von Ausdrücken wie der Negation oder von Konnektoren wie pourtant oder mais evoziert zwingend einen anderen Standpunkt. Zugespitzt formuliert: Die Ducrotsche Polyphonie ist ein Phänomen, das der Linguist als Eigenschaft einzelsprachlicher Ausdrücke «entdeckt», die Goffmansche Polyphonie hingegen ist, coserianisch gesprochen, ein Universale der Sprechtätigkeit im Allgemeinen. Insofern würde Goffmans Modell den Namen «Polyphonie» eher als Ducrots Modell verdienen, denn Goffman weist darauf hin, dass in der Rede einer
67
Person tatsächlich mehrere «Stimmen» im Sinne von wirklichen, konkret individuierbaren anderen Sprechern oder zumindest anderen sozialen Rollen präsent sind, während für Ducrot diese anderen «Stimmen» lediglich als Eigenschaften der Bedeutung bestimmter Ausdrücke rekonstruierbar sind, die dann nachträglich mit Redebeteiligten identifiziert werden können.
2.7.3. Bedeutungswandel als Übergang von principal zu enonciateur Möglicherweise gibt es aber eine Verbindung zwischen beiden Polyphoniekonzeptionen: die Diachronie. Die einzelsprachlichen enonciateur-Träger sind, zumindest in gewissem Maße, Konventionalisierungen von Zitieren oder Sprechenfür-andere, d.h. von anderen authors oder principals, als Phänomenen der Rede. Ich möchte dies am Beispiel des französischen Adverbs enfin verdeutlichen. In seinem Polyphonieaufsatz argumentiert Ducrot (1984) dafür, dass das Adverb enfin von seiner lexikalischen Bedeutung 'endlich' her einen anderen Standpunkt, einen anderen enonciateur, einführen kann. Er wählt als Beispiel den Beginn der Education sentimentale von Flaubert: (53)
«Le 15 septembre 1840, vers six heures du matin, la Ville-de-Montereau, pres de partir, fumait ä gros tourbillons devant le quai Saint-Bemard. Des gens arrivaient hors d'haleine; des barriques, des cables, des corbeilles de linge genaient la circulation; les matelots ne repondaient ä personne; on se heurtait; les colis montaient entre les deux tambours, et le tapage s'absorbait dans le bruissement de la vapeur, qui, s'echappant par des plaques de töle, enveloppait tout d'une nuee blanchätre, tandis que la cloche, ä l'avant, tintait sans discontinuer. Enfin le navire partit».
In den ersten beiden Absätzen hat der Roman eine rein auktoriale Erzählperspektive. Ein anscheinend unbeteiligter, gewissermaßen ortloser Erzähler beschreibt die Situation auf dem sich zur Abfahrt anschickenden Schiff. Der Ausdruck enfin im dritten Absatz aber führt zusätzlich subtil eine Figurenperspektive ein, zunächst noch ohne die Figur selbst. Denn nur ein am Geschehen Beteiligter kann sinnvollerweise die Abfahrt des Schiffes herbeiwünschen. Dieser Effekt wird durch die lexikalische Bedeutung von enfin hergestellt, die als konventionelle Implikatur das Element der 'ungeduldigen Erwartung' eines Ereignisses hat. Sie bringt den Leser dazu, neben den mit dem Erzähler identifizierten locuteur eine weitere Instanz, einen mit einer zunächst noch nicht eingeführten Figur identifiziertem enonciateur, anzunehmen, denn nicht nur der Sprecher, sondern auch ein anderer kann das bezeichnete Ereignis ungeduldig erwarten: «It is important to note that this can be, but is not necessarily an expectation that the speaker herself holds: it may also be attributed to someone else, including the hearer» (Hansen 2005, 54). Nun hat enfin die phasale Bedeutung 'endlich' in einem diachronen Bedeutungswandelprozess erworben. Hansen (2005) zeigt, dass diese Bedeutung ab dem 17. Jh. im Französischen konventionalisiert ist. Bis dahin konnte enfin lediglich rein temporal im Sinne von 'letztes Ereignis in einer Reihe', ähnlich wie heute finalement, verwendet werden, wo der Effekt 'endlich' keine lexikalische Bedeutung,
68
sondern nur fallweise eine konversationelle Implikatur ist, wie Hansen (2005, 54) an folgendem Beispiel zeigt: (54)
«Quand le beau Narcissus j a lasse de sa chasse, vaincu du chauld, et travaille de courir, cherchoit oü il se peult reposer, et tant chercha il q u ' e n f i n il veit une fontaine en la vallee obscure ...» (Jeanne Flore, Contes amoureux, 1537).
Hier ergibt sich der Bedeutungseffekt der 'ungeduldigen Erwartung' nicht aus der lexikalischen Bedeutung von enfin, sondern als konversationelle Implikatur aus dem im Verb chercher angelegten Telos des 'Findens'. Nun scheint es so zu sein, dass konversationelle Implikaturen, zumindest eine relevante Teilmenge von ihnen, je schon einen weiteren principal konstituieren: Sie sind Propositionen, die der Sprecher nicht ausspricht, die nicht materiell greifbar sind (die also weder animator noch author haben) und für die er nicht verantwortlich gemacht werden kann, die ihm aber zugeschrieben werden. Der Hörer inferiert sie, um die tatsächlich gesprochenen Worte des Sprechers sinnvoll zu verstehen. Die Konventionalisierung der konversationellen Implikatur macht also aus einem weiteren principal, der mit dem Sprecher nicht identifiziert wird, einen mit einer Wortbedeutung verbundenen enonciateur. Mir scheint, dass die Unterscheidung zwischen nichtwörtlicher und wörtlicher Bedeutung, die konversationelle von konventionellen Implikaturen trennt, tatsächlich wichtig ist für die Frage, ob eine Implikatur als weiterer principal zählt oder nicht, denn diese Differenz entscheidet darüber, ob der Sprecher für die implikatierte Proposition verantwortlich ist oder nicht. Die konventionelle Implikatur ist nicht löschbar, der Sprecher ist also für sie verantwortlich. Es hätte keinen Sinn, einen anderen principal als den Sprecher selbst für sie anzunehmen. Die konversationelle Implikatur ist dagegen löschbar. Der Sprecher hat eine Proposition übermittelt, aber ist nicht auf sie festgelegt. Genau das macht Implikaturen so attraktiv: man kann etwas zu verstehen geben, worauf man aber nicht festgelegt werden kann. Die einzelsprachlichen Phänomene wie Negation, bestimmte Partikeln usw., die Ducrot anspricht (und die bei Goffman weitgehend außen vor bleiben), sind diachrone Fixierungen von Zitaten und vom Sprechen-für-andere. Polyphonie selbst ist also keine Kategorie, die als solche schon linguistische Erklärungskraft hat. Einzelsprachliche Phänomene, die synchron als Formen von Polyphonie erscheinen, sind vielmehr als ein Hinweis darauf zu verstehen, dass ihre Diachronie etwas mit der Fixierung von Zitaten oder Sprechen-für-andere zu tun hat. 2.7.4. Polyphonie bei der Modalpartikel ja Übertragen auf die Modalpartikel ja heißt dies, dass man in Äußerungen wie Die Malerei war ja immer sein Hobby eine Polyphoniekonfiguration der folgenden Art rekonstruieren kann: (55)
Polyphone Struktur der Äußerung Die Malerei war ja immer sein Hobby Enonciateur 1: Die Malerei war immer sein Hobby. Enonciateur 2: Ich weiß, dass die Malerei immer sein Hobby war. Locuteur!Author = enonciateur 1. Der Hörer der Äußerung wird mit enonciateur 2 identifiziert.
69
Da der zweite enonciateur der Hörer (der Gesprächspartner) ist, ist die Modalpartikel diaphon. Darüber hinaus ist ja, wie andere Modalpartikeln auch, eine Form der potenziellen Diaphonie, denn der Standpunkt des zweiten enonciateur muss nicht tatsächlich geäußert worden sein, sondern ist typischerweise nur als solcher vom Sprecher unterstellt. Außerdem könnte man die Modalpartikel ja wohl als implizite Diaphonie bezeichnen. Denn der Standpunkt, der dem Gesprächspartner unterstellt wird, wird nicht selbst ganz im Ko-Text gesagt. Es wird im Ko-Text gesagt: Die Malerei war immer sein Hobby, aber nicht: Ich weiß, dass die Malerei immer sein Hobby war. Beim diaphonen Bezug auf den Gesprächspartner handelt es sich also um eine konventionalisierte Implikatur, die mit dem Ausdruck ja verbunden ist. Diachron ist ja (allerdings auf dem Umweg über die Volksetymologie je > ja, cf. 2.4.2.) von einer Dialogizität voraussetzenden Affirmationspartikel zu einem Ausdruck geworden, der konventionell den Bezug auf eine Position des Hörers implikatiert. Die Entstehung der Modalpartikel lässt sich lesen als eine Übertragung dieser Dialogizität in einen monologalen Kontext.
2.8. Delokutivität In Waltereit (2001) wird die Beziehung zwischen Abtönungsform und ihrem gleichlautendem Gegenstück als delokutive Kontiguität analysiert. Diesem Gedanken möchte ich auch hier folgen, jedoch in etwas anderer Akzentuierung.
2.8.1. Delokutiver Bezug auf den Kontext Der Begriff der Delokutivität geht auf Benveniste (1966) zurück; sein wohl bekanntestes Beispiel ist das lat. Verb salutare: (56)
salus 'Heil' > salutare 'grüßen'
Warum bedeutet das von salus 'Heil' abgeleitete Verb nicht, wie man den Wortbildungsregularitäten gemäß erwarten würde, 'heilen', sondern 'grüßen'? Weil es im Lateinischen eine Grußformel «salus!» gab. Die inhaltliche Basis der Derivation ist also nicht der semantische Gehalt des Nomens salus, sondern der illokutive Gehalt der Äußerung «salus!». Eine Illokution wird zu einer Wortbedeutung. Koch (1993a) hat Delokutivität als Interaktion zwischen einem Wortlaut, einem Sprechakt und einem typischen Äußerungskontext analysiert: Wortlaut
70
In einem typischen Äußerungskontext (relevant z.B. für Begrüßung) wurde der Wortlaut salus als Begrüßungssprechakt interpretiert, dies war die Basis für die delokutive Derivation salutare. Man könnte sagen: Der Sprechakt wird mit dem Wortlaut assoziiert. Dies ist ein kontiguitätsbasierter Sprachwandel insofern, als Wortlaut und Sprechakt in einer erfahrungsmäßigen Nähe zueinander stehen. Vergleicht man dies nun mit den Abtönungsformen und ihren Pendants, so könnte man sagen, dass sie Delokutivität sehr nahe stehen insofern, als hier nicht der Sprechakt, sondern der Kontext mit dem Wortlaut assoziiert wird. Für die deutsche Affirmationspartikel ja bedeutet dies: Der Sprechakt ist «positive Antwort», der Kontext ist «Einverständnis mit einer relevanten Äußerung». Zur Bedeutung der Modalpartikel wird dann nicht der Sprechakt selbst, sondern sein typischer Äußerungskontext, nämlich bei ja «Einverständnis mit einer im Kontext verfügbaren Proposition». Verallgemeinert ausgedrückt: Abtönungsformen haben die Funktion, einen Kontext zu evozieren, der für das Sagen ihres nicht-modalen Gegenstücks typisch ist (cf. Hypothese 2 aus Kap. 2.4.2.). Der Unterschied zwischen delokutivem Bedeutungswandel und delokutiver Derivation einerseits und der Genese von Abtönungsformen andererseits ist also folgender: Der im engeren Sinne delokutive Sprachwandel führt, aufgrund hoher Typizität eines Wortlauts für einen Sprechakt in einem bestimmten Kontext, dazu, dass dieser Wortlaut die Illokution bezeichnet, die er früher performativ vollzog. Bei der Genese von Abtönungsformen hingegen evoziert ein Wortlaut den Kontext, der früher typisch für den von ihm vollzogenen Sprechakt war. (58) Wortlaut
Delokutiver Sprachwandel
Wortlaut
Entstehung von Abtönungsformen In gewisser Weise ist somit die Genese von Abtönungsformen eine Art Spiegelbild von delokutivem Bedeutungswandel oder delokutiver Derivation, wie in (58) versinnbildlicht. 71
2.8.2. Das Verhältnis zwischen Abtönungsform und ihrem gleichlautenden Gegenstück: Eine Relation nicht zwischen zwei Wörtern, sondern zwischen zwei Sätzen Es stellt sich jedoch die Frage, welches eigentlich genau der Wortlaut ist, der fur die Entstehung der Abtönungsform relevant ist. In Waltereit (2001) wurde davon ausgegangen, dass dies die Form selbst in holophrastischem Gebrauch ist. Nach dieser Ansicht verweist die Modalpartikel ja auf den Äußerungskontext eines holophrastischen ja, d.h. der Satzwortäußerung Ja!. Das Satzwort Ja! erzeugt einen Äußerungskontext von «Einverständnis der Beteiligten», der im Gebrauch der Modalpartikel vorausgesetzt wird. Es ist in der Tat eine suggestive Vorstellung, dass die holophrastischen (d.h. eine ganze Äußerung konstituierenden) Ausdrücke Ja!, Quand meme! usw. als einzelne ganze Äußerungen mit dem Sprechakt, den sie vollziehen, eine enge assoziative Verbindung eingehen und so die Kontiguität aufbauen, die erforderlich ist, um diesen Wortlaut als Index einer bestimmten Sprechsituation zu identifizieren. Dies ist insbesondere dann naheliegend, wenn diese Wortlaute selbst Satzwörter sind, wie eben ja. Jedoch wird die Uberzeugungskraft dieser Vorstellung etwas durch den Befund geschwächt, dass die Modalpartikel ja wahrscheinlich gar nicht direkt aus dem Satzwort ja entstanden ist, sondern durch eine volksetymologische Reanalyse des Adverbs je, für das man nicht von einem holophrastischen Gebrauch ausgehen kann (cf. Kap. 2.4.2.). Zu diesen empirischen Problemen kommt der theoretische Einwand, dass wir als die Träger der konversationeilen Implikaturen, die die Illokution ausmachen, nicht einzelne Wörter, sondern Satztypen angenommen haben (cf. Kap. 2.3.2.). Es scheint also nicht die einzelne Form ja den für den Sprachwandel entscheidenden Wortlaut auszumachen. Plausibler scheint es mir anzunehmen, dass der für den Sprachwandel entscheidende Wortlaut nicht die (zukünftige) Abtönungsform allein ist, sondern dass dies ein Satz ist, in dem diese Form vorkommt. Man fügt also nicht ein einzelnes Wort ein, um einen Kontext zu evozieren, der mit einem durch dieses einzelne Wort vollzogenen Sprechakt verknüpft ist. Vielmehr wird der Kontext evoziert durch einen Satztyp, mit dem typischerweise der betreffende Sprechakt vollzogen wird und in dem außerdem die Abtönungsform vorkommt. 15 Der für den Sprachwandel relevante Signifikant ist damit genau genommen nicht die (zukünftige) Abtönungsform selbst, sondern die Form ist eine Art Index für den Signifikanten. Der Signifikant ist also nicht als einzelne Form angebbar, weil er kein konkreter Satz ist, sondern ein Satztyp und damit eine bestimmte Konstruktion. Obwohl der «Wortlaut» also keine materiell angebbare Form ist, kann man ihn mit vollem Recht als einzelsprachlichen Signifikanten ansprechen, denn auch Konstruktionen (wie Aktiv-Deklarativsatz, Passivsatz, Fragesatz...) sind konventionalisierte einzelsprachliche Zeichen mit einer Ausdrucks- und einer Inhaltsseite. Konstruktionen sind syntagmatisch komplexe Zeichen, deren Slots mit lexikalischen Einheiten gefüllt werden müssen. Dieser Gedanke ist insbesondere in der Construction Grammar ausgearbeitet worden (cf. bes. Crofit 2001). 15
Diese Überlegung passt auch zum treffenden frühen Befund von Krivonosovs (1963) (cf. Kap. 1.3.1.). Krivonosov stellte fest, dass die Bedeutung von Modalpartikeln nicht an ihrer Form selbst erkennbar ist, sondern dass sie Bedeutungsträger nur im Satzzusammenhang sind.
72
2.9. Zusammenfassung In diesem Kapitel wurde am Beispiel der dt. Modalpartikel ja ein pragmatisches Modell von Abtönung entwickelt. Die zentralen Annahmen dieses Modells sollen nun noch einmal zusammengefasst werden: Es wird angenommen, dass Abtönung eine Form von Modalität ist insofern sie ihre Trägeräußerung in Bezug auf den Diskurs perspektiviert. Im Fall der Modalpartikel ja in einer Assertion wird die normalerweise für Assertionen geltende Bedingung aufgehoben, dass der propositionale Gehalt nicht sowieso schon bekannt ist. Ja hat den Effekt zu signalisieren, dass der Sprecher den propositionalen Gehalt der Behauptung als für den Hörer bekannt annimmt und dass der Sprecher somit Einverständnis zu seiner Assertion voraussetzt. Der Sprecher kann so eine Behauptung machen, für die die normalerweise geltende Bedingung, dass ihr propositionaler Gehalt unbekannt oder nicht selbstverständlich ist, nicht gilt. So ermöglicht die Modalpartikel dem Sprecher eine sehr «leichte», mit geringen sprachlichen Mitteln auskommende, Rechtfertigung des Sprechaktes. Der synchrone Zusammenhang der Modalpartikel ja mit der Antwortpartikel ja kann dabei folgendermaßen beschrieben werden: Die Modalpartikel evoziert die typische Situation des Sagens der Antwortpartikel ja durch den Gesprächspartner. Wer mit ja auf eine Frage antwortet, stellt performativ Einverständnis zwischen Sprecher und Hörer über die Proposition der Frage her. Eine Assertion mit der Modalpartikel ja zu versehen evoziert somit den Effekt, den die Antwortpartikel ja performativ herstellt. Abtönung ist damit auch eine Form der Polyphonie bzw. lässt sich als diachrone Fixierung von Polyphonie rekonstruieren: Die «Stimme» des Gesprächspartners wird in die Rede des Sprechers hereingenommen bzw. fiktiv zitiert. Auch diachron gibt es einen Zusammenhang zwischen den beiden Varianten von ja, der aber wohl untypisch für Modalpartikeln ist. Wahrscheinlich ist die Modalpartikel ja eine volksetymologische Reinterpretation einer Modalpartikel je (hervorgegangen aus dem Adverb je 'immer'). Hierfür sind einerseits die lautliche Ähnlichkeit von ja und je und andererseits der inhaltliche Zusammenhang ihrer Funktionen verantwortlich: Was «immer» schon war, ist auch «selbstverständlich» so; und wenn etwas «selbstverständlich» ist, so kann dazu Zustimmung vorausgesetzt werden.
73
3. Die französische Partikel
quand
meme
In diesem und den weiteren Kapiteln dieser Arbeit möchte ich das nun erarbeitete Instrumentarium auf Abtönungsformen in den romanischen Sprachen anwenden. Zu diesen Abtönungsformen zählen Partikeln (die aber keine Modalpartikeln sein können, da die romanischen Sprachen kein Mittelfeld haben) und Formen ganz anderen Typs. In diesem Kapitel möchte ich mich detailliert einer französischen Abtönungspartikel zuwenden, dem Wort quand meme. In 3.5. werde ich, auf der Folie der in diesem Kapitel gebotenen historischen Daten, noch einmal auf das im letzten Kapitel im Zusammenhang mit Hypothese 2 eingeführte Modell der Entstehung von Abtönungsformen zurückkommen, es präzisieren und insbesondere von den vieldiskutierten diachronen Prozessen der Grammatikalisierung und der Entstehung von Diskursmarkern abgrenzen. In 3.6. wird für einige andere Partikeln in romanischen Sprachen eine Interpretation als Abtönungsphänomen umrissen. In den folgenden Kapiteln der Arbeit werden dann nicht-partikelförmige Abtönungsverfahren untersucht.
3.1. Quand meme: Adverb und Partikel1 Im heutigen Französisch hat die Sequenz quand meme verschiedene Verwendungsweisen, von denen einige sich in die Nähe von Abtönung bringen lassen. Zum einen gibt es quand meme als konzessives Adverb: (1)
R750/BLIER.B / LES VALSEUSES / 1972 (Frantext) «Elle avait des larmes dans les yeux et bien du mal ä les dissimuler. Elle avait beau tourner la tete de tous les cötes, utiliser le maximum de cheveux pour se planquer, 9a se voyait quand meme. Pleurer pour un chemisier: merde alors!...»
Hier wird eine Proposition p, die das konzessive Adverb quand meme enthält, ςα [eile avait des larmes dans les yeux] se voyait quand meme, als «gegensätzlich» oder «unerwartet» in Bezug auf eine andere, in unmittelbarer Nähe stehende Proposition q eile avait beau tourner la tete de tous les cötes, utiliser le maximum de cheveux pour se planquer gekennzeichnet. Wer den Kopf wegdreht und die eigenen Haare ins Gesicht zieht, kann normalerweise das Weinen verbergen. Trotz des Versuchs, es zu verbergen, ist es hier aber zu sehen, ρ und q treffen gleichzeitig zu, ob-
Die hier gegebene synchrone und diachrone Analyse von quand meme wurde bereits teilweise in Waltereit (2004) veröffentlicht.
75
wohl «normalerweise» das Zutreffen von ρ durch das gleichzeitige Zutreffen von q ausgeschlossen wird. Dies wird oft als das Wesen von Konzessivität gesehen (König 1988). Dufter (2003) reinterpretiert Königs «Normalitätstheorie», d.h. die Vorstellung, dass Konzessivität eine «normalerweise» unerwartbare Kookkurrenz von Sachverhalten repräsentiere, unter Bezug auf jeweils zu unterstellende Annahmen der Sprecher als markierte Kookkurrenz zweier Sachverhalte. Zum anderen gibt es quand meme in einer weiteren Verwendung: (2)
BENOZIGLIO Jean-Luc / CABINET PORTRAIT / 1980 (FRANTEXT) «Armoire fait exactement la meme chose. Et je receptionne une bouteille plus qu'aux trois quarts pleine. Suspense. Armoire me fixe, sourcils fronces. J'aurais quand meme reussi ä lui faire un peu peur».
Man kann hier nicht sagen, dass die Proposition j 'aurais reussi ä lui faire un peu peur in einer «markierten Kookkurrenz» zur Proposition Armoire me fixe, sourcils fronces stehe. Die beiden mit diesen Propositionen bezeichneten Sachverhalte widersprechen sich nicht. Vielmehr scheint umgekehrt der Ausdruck quand meme die Proposition j 'aurais reussi ä lui faire un peu peur als eine Art Begründung für das in der vorausgehenden Proposition beschriebenen Verhalten Armoires zu kennzeichnen. Quand meme kann hier also kein konzessives Adverb sein. Der Ausdruck scheint in noch näher zu spezifizierender Weise die Assertion j'aurais reussi ä lui faire un peu peur in ihren Kontext einzugliedern. Er erweckt somit den Eindruck einer Abtönungsform. Auch in folgendem Beispiel ist quand meme keine konzessive Konjunktion: (3)
R750/ BLIER Bertrand/Les Valseuses/1972 (FRANTEXT) «Trois minutes, il m'a fallu, pas une de plus. II etait salement impressionne, Pierrot, devant le voyant rouge du contact allume. Y a pas ä dire, 9a sert quand meme d'avoir bosse dans un garage, ne serait-ce que quinze jours».
Vergleicht man die nacheinander berichteten Sachverhalte, so sieht man, dass sie sich keineswegs normalerweise ausschließen: (3')
Y a pas a dire Ρ
ragazzino (lb) casa > casetta (1 c) pastore > pastorello (Beispiele aus Schwarze 1995, 511-516) (ld) scatola > scatoletta Portugiesisch (2a) dia > diazito (2b) dia > diazinho (2c) adeus > adeusinho (2d) chä > chazinho (2e) cuidado > cuidadinho (Beispiele aus Hundertmark-Santos Martins 1982, 61) Spanisch (3a) cerveza > cervecita (3b) burro > borrico (3c) aldea > aldehueta (3d) chico > chiquillo (Beispiele aus Reumuth/Winkelmann 2001)
Jedes dieser Beispieltupel zeigt verschiedene Typen von Diminutiven in den jeweiligen Sprachen. In allen drei Sprachen gibt es jedoch ein jeweils prototypisches Diminutivsuffix, das am häufigsten und am produktivsten ist: im Spanischen -ito, im
109
Italienischen -ino und im Portugiesischen —inho. 1 Im Folgenden konzentriere ich mich besonders auf das Portugiesische. 2 Diminutive haben zunächst die Funktion der Verkleinerung, d.h. sie drücken aus, dass der Referent des Nomens bzw. des Adjektivs kleiner als üblich ist: (4)CRPC «X: andavamos ο dia todo. quando ο tempo estava assim menos mal andävamos ο dia todo; quando comefava a puxar mais inverno, ο navio chamava para bordo. A: ah, sim? B: mas e quantos e que iam em cada barco (...)? X: iamos so um em cada botezinho, minha senhora...» (5)CRPC «A: e. quer dizer, a rapariga tem uma es(...), tem um; mas näo; esse saquinho, ο saquinho vem dentro do vestido da rapariga. X: pois, pois».
In (4) wird durch den Kontext klar, dass der Sprecher, ein Fischer, von kleinen Booten spricht, denn die Boote sind so klein, dass sie nur eine einzige Person aufnehmen können. In(5) handelt es um einen kleinen Beutel - der so klein ist, dass er unter das Kleid passt (es geht hier um Requisiten für eine Theateraufführung). Der intensionale Gehalt des Gattungsnomens bote bzw. saco wird jeweils um das Merkmal klein angereichert. So wird der Referenzbereich des jeweiligen Nomens eingegrenzt. Klein ist natürlich relativ zu verstehen, also klein in Bezug auf Boote, auf Beutel usw. Neben dieser auf die Intension abhebenden (minorativen) hat der Diminutiv auch eine andere Funktion. Allein der Umstand, dass er auch Ausdrücke wie adeus! modifizieren kann, die keine Substantive sind und daher auch nicht referenzfähig sind, deutet darauf hin, dass seine Funktion sich nicht in der intensionalen Spezifikation erschöpfen kann. Vielmehr wird in der umfangreichen Forschung zu Diminutiven allgemein davon ausgegangen, dass sie auch eine «affektive» Funktion haben. Sie haben etwas mit einer in noch näher zu spezifizierenden Weise positiven affektiven Einstellung des Sprechers zu tun. Bei dieser affektiven Markierung sind zwei Typen zu unterscheiden. Zum einen kann der Diminutiv den Referenten neben der denotativen Einschränkung auf 'klein', zusätzlich noch sekundär als angenehm, nett, lieb, süß kennzeichnen. Schwarze (1995, 511) geht für das Italienische -ino sogar davon aus, dass diese beiden Funktionen nicht zu trennen sind, dass sie immer kookkurrieren. Selbst wenn man dieser Annahme nicht in ihrer Absolutheit folgt, könnte man analog für das Portugiesische sagen, dass der Sprecher in (4) nicht nur ausdrückt, dass die Boote klein sind, sondern auch, dass er eine positive affektive Einstellung zu ihnen hat. Zum anderen kann der Diminutiv aber auch von der referierenden bzw. attribuierenden Funktion ganz abgelöst sein und ausschließlich Im heutigen Französisch ist die Diminutivbildung nicht produktiv und es gibt nur eine relativ kleine Zahl von lexikalisierten Diminutiv-Derivationen: maisonette, fillette ... Cf. Hasselrot (1957, 169-212) und Hasselrot 1972. In der älteren Forschung wurde manchmal die Auffassung vertreten, dass das Portugiesische diejenige romanische Sprache sei, die am stärksten von Diminutiven Gebrauch macht (M. L. Wagner 1952, 464).
110
dazu dienen, eine affektive Einstellung zu markieren. In dieser Funktion kann er insbesondere Wortbildungsbasen modifizieren, die mit einer Einschränkung auf «kleine» Referenten gar nicht verträglich sind. Damit wird klar, dass er dann nichts mehr mit der Bedeutung 'klein' zu tun hat. Sehr deutlich ist dies im Beispiel (6) zu sehen: (6)CRPC «X: pois näo e verdade podiam agradar a elas mesmas gostarem de se ver ao espelho mesmo assim ja velhinhas nös aqui nas cidades apreciamos uma coisa: qualquer... por exemplo tä aqui uma senhora dum capitäo viüva dum capitäo ο senhor j a faleceu que e, que e ja uma senhora de oitenta e tal anos e e uma coisa digna de louvor quer dizer ela tem um brio tem um brio! olhe parece uma uma jovem! ela toda, uma maquilhagem täo bem feita! ela so apenas os cabelinhos todos brancos mas däo person..., personalidade, aquele cabelinho muito branquinho, aquela perna muito bem feita, gorda e... desenxovalhada, a velha! eu äs vezes di.. e verdade!»
Die Sprecherin äußert hier ihre Sympathie für eine betagte Dame aus ihrer Nachbarschaft und beschreibt bewundernd, was für eine elegante und ausdrucksvolle Erscheinung diese Frau noch in ihrem hohen Alter ist. In ihrem Redezug kommen vier Diminutive vor, von denen keiner als «minorativ» gelten kann. Velhinha 'alt' + DIM ist begrifflich nicht als Minoration verstehbar. Das Gleiche gilt für branquinho 'weiß' + DIM. Cabelinho 'Haar' + DIM wäre zwar prinzipiell als 'kleines Haar' o.ä. interpretierbar, aber diese Lesart ist hier sehr unplausibel. Die Sprecherin redet ja von den Haaren der Dame im Allgemeinen, dabei ist es unwichtig, ob diese nun kurz oder lang sind. Die Semantik des Diminutivs hat hier also anscheinend nichts mit der Intension des Gattungsbegriffs zu tun. Auffällig ist allerdings, dass gerade diejenigen Formen einen Diminutiv haben, die auf potenziell weniger schmeichelhafte Aspekte ihrer Erscheinung verweisen: 'alt' und 'weiße Haare'. Man gewinnt den Eindruck, dass die Funktion der Diminutive etwas damit zu tun hat, dass die Sprecherin einen Konflikt lösen will, der darin besteht, dass sie etwas Positives über die Person sagen will, dabei aber Dinge erwähnen muss, die tabuisiert sind bzw. nicht allgemein geeignet sind, einen positiven Eindruck hervorzurufen. Sie erwähnt die weißen Haare, fügt aber sogleich hinzu: «mas däo personalidade». Die Funktion des Diminutivs scheint einen Bezug nicht zur Semantik der Wortbildungsbasis zu haben, sondern zum ganzen Sprechakt. Es ist, als ob die Diminutive die eigentlich nicht unbedingt schmeichelhafte Erwähnung des Alters und der weißen Haare in einem anderen Licht dastehen ließen. Dieser Eindruck macht sie «abtönungsverdächtig". Bestätigt sich die Vermutung, wäre gezeigt, dass Abtönung nicht an den Formtyp Partikel gebunden ist, denn Diminutive sind ja ganz offensichtlich keine Partikeln. Johnen (1995) bezeichnet die portugiesischen Diminutive als Abtönungsverfahren und weist darauf hin, dass sie manchmal auch im Deutschen mit Modalpartikeln übersetzt werden können, besonders bei direktiven Sprechakten: (7)1. de Loyola Brandäo: Näo veräspais nenhum, zit. Johnen 1995, 52 «Duas mulheres esquentam marmitas, me oferecem um bocadinho. Näo, näo quero, vai fazer falta. Onde comem dois, comem tres. Näo e verdade. Dois comem mal, tres väo comer pior. Que luxo e esse mopo? Com fome e orgulhoso.
111
Estou com muita fome mesmo. Entäo, pega um ouvinho, näo vai fazer falta coisa nenhuma. Amanhä ä tarde meu marito traz outra marmita. So que vai ser ovo, outra vez».
Der Diminutiv in der Aufforderung pega um ouvinho scheint etwas mit der Absicht des Sprechers zu tun zu haben, die Bedenken des Aufgeforderten zu zerstreuen, den anderen etwas wegzuessen. So müsste diese Aufforderung nach Johnen (1995, 52s.) übersetzt werden mit Na also, nimm dir doch schon ein Ei oder Na also, nimm dir nur ruhig ein Ei. Dass der Diminutiv mit einer deutschen Modalpartikel übersetzt werden kann, ist ein heuristisch interessanter Befund, der die Intuition stärkt, dass Diminutive Abtönungsform sein könnten. Diese Arbeit ist jedoch mit dem methodologischen Anspruch angetreten, Übersetzungen nicht als Kriterium für Abtönung zählen zu lassen (cf. Kap. 1.4.2). Insofern beweist ein solcher Beleg für uns noch nichts. Es ergeben sich nun mindestens die folgenden Probleme: -
Was ist genau die Funktion der «affektiven» Diminutive und inwiefern ist dies Abtönung?
-
Was ist ihre Beziehung zu den «minorativen» Diminutiven?
Diesen Fragen ist dieses Kapitel gewidmet. 4.2. Der Verweis auf nicht-ernste Sprechsituationen In der Literatur wird manchmal ein Bezug des Diminutivs zum Sprechakt erwähnt. Johnen 1995 zeigt, dass der Sprechakttyp ein Faktor in der Bestimmung der Interpretation von affektivem -inho ist. Eine originelle Theorie hierzu wird von Dressler/Merlini Barbaresi (1994) geboten. An diesen Ansatz kann in dem in der vorliegenden Arbeit vertretenen Rahmen recht leicht angeschlossen werden. 4.2.1. Kinder-zentrierte Sprechsituationen Der Grundgedanke bei Dressler/Merlini Barberesi ist, dass affektive Diminutive typisch sind für «nicht-ernste» Sprechsituationen, insbesondere für kinderzentrierte, haustierzentrierte und geliebtenzentrierte Sprechsituationen. Ein affektiver Diminutiv kennzeichnet somit den Sprechakt als «nicht-ernst» oder als «nicht ganz so ernst», auch wenn es sich nicht selbst um eine kinder-/ haustier-/ geliebtenzentrierte Situation handelt. Kinder-zentrierte Sprechsituationen werden als das Urbild dieser pragmatischen Konstellation angenommen, 3 die beiden anderen Situationstypen werden bei Dressler/Merlini Barbaresi (1994, 191) als «metaphorische» Übertragungen bezeichnet. Diese «morphopragmatische» Funktion haben die Diminutive als eine einzelsprachlich kodierte Funktion, zusätzlich zu ihrer minorativen
3
Diesen Gedanke hat schon viele Jahre früher Silvia Skorge (1956, 251) gefasst: «Em todas as linguas que conhecem diminutivos, deve ser nos quartos de crianfa que estes säo ouvidos mais frequentemente».
112
(«morphosemantischen») Bedeutung. Auf das genaue Verhältnis dieser beiden Funktionen komme ich in 4.3.3. zurück. «Kinder-zentriert» (child-centered) ist für Dressler/Merlini Barbaresi (1994, 173-175) ein relativer Begriff, der nach mindestens vier Parametern variiert: (8) Parameter der Kinder-Zentriertheit einer Sprechsituation 1. hierarchischer Status (im Sinne einer pragmatischen Gesprächsrollenhierarchie): 1. Hörer, 2. Sprecher oder «Bystander» (nicht selbst sprechender Zuhörer), 3. Diskursreferent; 2. Zahl der in 1. genannten Gesprächsrollen, die tatsächlich von einem Kind ausgefüllt werden; 3. Alter des Kindes; 4. thematische Zentralität des Kindes.
In einer maximal kinder-zentrierten Sprechsituation wird ein kleines Kind angesprochen und das Kind selbst ist auch Thema des Gesprächs. In einer weniger kinderzentrierten Sprechsituation (die aber trotzdem noch als insgesamt kinder-zentriert gilt) können z.B. Erwachsene über Kinder sprechen. In einer in diesem Sinne «kinder-zentrierten» Sprechsituation müssen also Kinder nicht einmal zu den Anwesenden gehören. Dressler/Merlini Barbaresi 1994 gehen davon aus, dass die Frequenz von Diminutiven mit dem Grad an Kinder-Zentriertheit der Sprechsituation zunimmt. Das Beispiel (9) zeigt, dass Diminutive als Index für Kinder-Zentriertheit fungieren können. Hier spricht eine 17jährige Schülerin über ihren kleinen Bruder: (9)CRPC «X: mas eu geralmente vou sempre para lä gosto mais de ir para lä e entäo assim, a primeira coisa que eu lä chego vai logo assim ο meu irmäozito ό mana ensinas-me a fazer as contas? ensino pois. pois olha ja fiz isto mas agora a prova dos noves näo me da certa! lä tenho eu de lhe ensinar as contas mas e assim engragadito ο garoto e tudo e por acaso passam-se lä uns tempos formidäveis».
Sie verwendet die Diminutive irmäozito und engragadito, um auf den kleinen Bruder zu referieren. Die Sprechsituation ist nach der Hierarchie von Dressler/Merlini Barbaresi nur mäßig kinder-zentriert, denn das Kind ist zwar nicht als Gesprächsteilnehmer, aber immerhin als Diskursreferent präsent. Ist das Kind der Hörer und gleichzeitig Thema des Gesprächs, so ist das Maximum an Kinder-Zentriertheit erreicht. Die Diminutivfrequenz in solchen Sprechsituationen beschrieb sehr plastisch schon Skorge (1956, 251): (10) «O afecto faz com que as mulheres que se dirigem a uma criansa pequena juntem ο sufixo diminutivo a qualquer palavra da fräse näo tendo importäncia quais os substantivos ou adjectivos que säo sufixados, e sendo apenas essencial encontrarem ο meio de exprimir os sentimentos dos seus coraföes a transbordar: vozinha, cäo > cäozinho, rua > ruazinha (23b) ele 'er' > *elezinho "'kleiner er', adeus 'auf Wiedersehen' > *adeuzinho 'kleines Auf Wiedersehen'
Hingegen bezieht sich in der Interpretation als Abtönungsform das Suffix semantisch nicht mehr auf die Wortbildungsbasis, sondern auf den ganzen Sprechakt. Entsprechend ist der «Landeplatz» des Suffixes nun nicht mehr ausschließlich auf referierende Ausdrücke beschränkt (cf. Dressler/Merlini Barbaresi 1994,218-228). Man findet daher auch prädikative Adjektive, Adverbien und Satzwörter mit Diminutiv: (24a) «Somos ja täo unidinhas!» (Skorge 1957, 298) (24b) cedinho 'früh', adeuzinho 'tschüßchen', devagarinho 'schön langsam', malzinho 'schlecht'
Durch die Abtönung des ganzen Sprechaktes kann die Funktion des Adjektivs im Endeffekt sogar intensiviert werden (devagarinho 'schön langsam', juntinho 'ganz nah'). Die größere morphologische Freiheit in Bezug auf den Landeplatz ist eine formale Konsequenz der semantischen Reanalyse des Diminutivs. Ist einmal die Abtönungsfunktion des Diminutivsuffixes in der Sprache etabliert, so entfällt auch der kompositionale Zusammenhang zwischen diesem Suffix und referenzfähigen Wortbildungsbasen wie Substantiven bzw. Adjektiven. 9 Die Lockerung der morphologischen Beschränkungen ist ein formaler Reflex des semantischen Reanalyseprozesses. Ist die Form einmal semantisch reanalysiert, so gewinnt sie neue distributionelle Möglichkeiten, die der neuen Bedeutung entsprechen. Genau wie quandmeme nach der Reanalyse zur Abtönungspartikel in einer anderen syntaktischen Position steht (nicht mehr am Ende der Verbalphrase oder des Satzes, sondern unmittelbar nach dem finiten Verb, cf. Kap. 3.4.2.), so kann auch der Diminutiv nach seinem Funktionswandel zur Abtönungsform morphologisch an Basen suffigieren, die ihm in der «minorativen» Funktion verschlossen waren.
Für das Deutsche kann man hier Bildungen wie Hallöchen oder (regional beschränkt) Adele nennen.
126
4.4. Ausblick: Augmentative Die Analyse der Diminutive lässt sich in gewisser Weise analog auf Augmentative ausweiten. Dies möchte ich hier kurz fur das Spanische andeuten. Der spanische Augmentativ -ort, -ona hat eine produktive notionelle, vergrößernde (und gleichzeitig tendenziell pejorative, cf. Rainer 1993,635) Funktion: (25a) casa > caseron 'großes Haus' (25b) familia > familion 'große Familie'
(25c) rico > ricon 'superreich' (cf. Rainer 1993, 635)
Daneben hat er aber auch (besonders im amerikanischen Spanisch, cf. Rainer 1993, 637) eine abschwächende Funktion, allerdings in geringerem Ausmaß als der Diminutiv: «It is important to notice a subtle and contradictory attenuative case of -on, when used with certain words and in certain circumstances. An outstanding example of this is sinvergonzon [...], which tends to be used rather like ''proper or regular rogue or devil' in English, i.e. the addition of a stressing element (in Spanish a suffix, in English an adjective) suggests a certain familiarity or intimacy of speech which acts as an attenuant, the bald basic form thus resulting more severe than the so-called augmentative: sinvergiienza = 'rogue', 'rotter' » (Gooch 1967, 10s.).
Der Gebrauch von vergrößernd-pejorativen Augmentativen ist typisch für kumpelhaft-vertraute Sprache: «It will be observed that many of these terms [sc. mit Augmentativen suffigierte Wörter, RW] belong especially to what may be called schoolboy language» (Gooch 1967, 10). Mit diesen Bemerkungen Goochs ist eigentlich schon alles gesagt. Der Augmentativ kann als Indiz fur die Sprechsituation des kumpelhaft-vertrauten Sprechens gelten, wenn man sich auf die Diskursregel einer solchen Sprechsituation bezieht, derzufolge Größe besonders beachtenswert ist. Daher kommen wohl in diesem Diskurstyp viele notionell vergrößernde Augmentative vor.10 In solcherart vertrauter Kommunikation werden negative Urteile weniger bedrohlich, bzw. Dinge, die ansonsten negativ zu bewerten sind, können dort sogar zu einem Lob Anlass geben. Mit Augmentativen können Sprecher daher die Situation des kumpelhaft-vertrauten Redens zitieren; sie übertragen so die mit dieser Situation verbundenen positiven Einstellungen auf ihren eigenen Sprechakt und entschärfen eigentlich negativ bewertete Charakterisierungen wie sinvergiienza 'schamloser Mensch'. Der abschwächende Effekt kommt also nicht durch eine lexikalischsemantische Operation zustande, sondern ist ein illokutionärer Effekt. Während der abtönende Effekt des Diminutivs dadurch zustande kommt, dass er die für die Rede mit Kindern typische Sprechsituation der liebevollen Zuwendung evoziert, kann der Augmentativ abtönen, indem er die Vertraulichkeit der kumpelhaften «schoolboy language» evoziert, wo gerade die Übertreibung zum guten Ton gehört. 10
Dressler/Merlini Barbaresi (1994,445) verneinen allerdings (ohne Begründung) die Existenz eines spezifischen Situationstyps, der Augmentative favorisiert.
127
5. Prosodische Abtönung
Nachdem wir nun die Partikel quand meme als Abtönungselement identifiziert haben und das Modell der Abtönung auch auf eine Nicht-Partikel (den Diminutiv) übertragen konnten, möchte ich dieses Modell nun für den Bereich der suprasegmentalen Phonologie erproben.
5.1. Intonation als Abtönungsverfahren: Vorüberlegungen 5.1.1. Die Pilotstudie von Schubiger (1972) In einer vergleichenden Studie suggeriert Schubiger (1972), dass bestimmte markierte Intonationskonturen im Englischen die Funktion einer Äußerung in ähnlicher Weise wie Modalpartikeln in deutschen und französischen Äußerungen nuancieren können: 1 (1) (2)
(3)
«A: I'm sorry about the mess. Β: VYou couldn't help i t » (Schubiger 1972, 184). «(To a girl standing idly about.) n G i v e me a \hand, Anna. Aidez-moi done » (Schubiger 1972, 185). «Α: I ought to invite her. B: Well then inVvite her. Eh bien invite-la » (Schubiger 1972, 186).
Schubiger bringt in ihrem Aufsatz eine Vielzahl deutsch-englischer (bzw. teils auch deutsch-englisch-französischer) Übersetzungspaare von Einzeläußerungen bzw. adjacency pairs. Diese unterscheiden sich, wie in (l)-(3), jeweils dadurch, dass die deutsche bzw. französische Variante eine Modalpartikel enthält, für die es in der englischen Variante keine segmentale Entsprechung gibt. Dafür hat die englische Variante jeweils eine Intonation, die von der Standardintonation des in der jeweiligen Äußerung realisierten Sprechaktes abweicht. Diese abweichende Intonation ist in den Beispielen ( l ) - ( 3 ) mit dem in Fußnote 1 erläuterten Notationssystem markiert. Schubiger zufolge bewirkt die Intonation der englischen Beispiele einen Zur Wiedergabe der Intonation wird hier zunächst ein an O'Connor/Arnold 1961 angelehntes Notationssystem verwendet. Grundelemente sind ein steigender (/), ein fallender (\) und ein fallend-steigender Ton (V) auf der Hauptakzentsilbe der jeweiligen Intonationseinheit. Abrupt steigender bzw. fallender Akzentton werden mit geraden Strichen ( n bzw. u ) markiert.
129
pragmatischen Effekt, der demjenigen der Modalpartikel in den deutschen Beispielen entspricht. Diese Entsprechung ist nach Schubiger insofern systematisch, als sich prinzipiell je einer Modalpartikel bzw. je einem ihrer sprechaktspezifischen Verwendungstypen eine Intonationskontur zuordnen lässt. Die folgende Tabelle (4) stellt hier nur beispielhaft eine Auswahl der von Schubiger diskutierten Typen gegenüber: (4) doch in vorwurfsvollen Erinnerungen Das ist doch dasselbe.
Fallende Kontur That 's the nsame
doch in Vorwürfen, die auf inkonsistentes Verhalten des Hörers hinweisen Gestern war 's dir doch recht!
Steigende Kontur
\thing.
It was nail /"right
/yesterday.
doch in emotionaler gefärbten, herausfordernden Äußerungen Du hast mich doch gar nicht gefragt.
Steigend-fallende Kontur
eben in Aufforderungen So komm eben mit dem Zug.
Fallende Kontur Come by \train nthen.
denn in Fragen: Was geht denn das mich an?
Steigende und fallende Kontur /What 's that got to do with \us?
nur in Angeboten Fahren Sie nur weiter.
Fallende und steigende Kontur \Go /on.
You didn 't Aask me.
In den zitierten Beispielen sowie in den weiteren von Schubiger genannten lässt sich die von ihr suggerierte pragmatische Gleichwertigkeit durchaus nachvollziehen. Gegenüber der Standardintonation bringt die zitierte Intonation eine Nuance ein, die die Funktion der Äußerung in ähnlicher Weise zu modifizieren scheint wie dies die Modalpartikel gegenüber einem ansonsten gleich lautenden Trägersatz ohne Partikel tut.2 Offen bleibt in Schubigers Aufsatz allerdings, mit welchen semantischen, pragmatischen und phonologischen Mechanismen diese Äquivalenz hergestellt wird. Man gewinnt aus diesen Beispielen den Eindruck, dass auch die Intonation zu den Abtönungsmitteln gehört. Diese Funktion suprasegmentaler Phonologie soll in diesem Kapitel genauer untersucht werden. Damit wird dann die von Schubiger beobachtete Äquivalenz im hier entwickelten theoretischen Rahmen expliziert werden können.
Damit wird natürlich nicht ausgeschlossen, dass in partikelreichen Sprachen wie dem Deutschen ebenfalls durch die Intonation Nuancierungen erbracht werden können, die einen ähnlichen Effekt hervorbringen können wie Modal- und Abtönungspartikeln.
130
5.1.2. Ausgangsintuition und erste Beispiele Beim Versuch, den Beitrag von Intonationskonturen zu Abtönungsphänomenen zu erforschen, gehe ich von folgender Annahme aus: (5)
Eine Intonationskontur in einer Äußerung evoziert eine Sprechsituation, für die diese Kontur typisch ist, steht dabei aber in Konflikt zu dem prosodischen Muster, das mit dem in der Äußerung realisierten Sprechakt konventionell verknüpft ist.
So kann man z.B. sagen, dass die aufsteigende Kontur in It was nall nright /yesterday (cf. oben [4]) in Verbindung mit einer (ebenfalls aufsteigenden) Frageintonation gebracht werden kann. Es wird somit die Sprechsituation einer Rückfrage evoziert («warum fragst du das?»), die die gleiche vorwurfsvolle Nuance vermittelt wie die Partikel doch im deutschen Pendant. Gleichzeitig steht die fragetypische aufsteigende Kontur insofern in Konflikt mit dem in der Äußerung realisierten Sprechakt, als diese Äußerung eben keine Frage ist, sondern eine Assertion. Ein sehr ähnliches Beispiel gibt Bolinger (1972, 14) mit folgendem Dialog: (6)
«A: Why did you do it? Β: /Because I wanted to».
Die Antwort von Β ist als Sprechakt eine Assertion, wird aber hier mit (aufsteigender) Frageintonation realisiert. Dies gibt ihr wieder die Implikatur einer Rückfrage der Art «was geht dich das an?», denn die aufsteigende Kontur ist eigentlich inkompatibel mit dem Sprechakt Assertion, evoziert aber die Situation der Frage. 3 Ein weiteres Beispiel dafür, die Fragesituation in einem Sprechakt zu evozieren, der selbst keine Frage ist, kann die Namensmeldung am Telefon mit aufsteigender Intonationskontur sein (cf. Lepschy 1989, 135): (7)
«/Libreria Dante»
Die Namensmeldung am Telefon ist eine phatische Identifikation der Gesprächsteilnehmer (cf. Schegloff 1972, 351-357) und daher im engeren Sinne kein illokutionärer Akt und somit auch keine Frage. Sie ist ein auf die äußere Organisation des Sprechens bezogener Sprechakt (cf. Koch 1987), d.h. ihre Finalität ist «auf das Sprechen selbst gerichtet» (Koch 1987,312) und bereitet damit erst illokutionäre Akte im engeren Sinne vor (cf. Kap. 2.1.). Die aufsteigende Intonation evoziert jedoch eine Fragesituation und vermag daher den Anrufer zum Sprechen einzuladen, «als ob er gefragt worden wäre». Der eigentlich initiative erste Redezug des Anrufers wird so höflich-fiktiv zu einem reaktiven Zug umdefiniert. In den genannten Beispielen hat man es jeweils mit Äußerungen zu tun, deren Intonationskontur (in allen hier diskutierten Fällen: eine aufsteigende Fragekontur)
Dies ist übrigens ein Beispiel dafür, dass eine abgetönte Äußerung auch weniger höflich als ihr nicht abgetöntes Pendant sein kann (cf. 7.1.4.). «Celui qui a compose le numero [...] definit la nature de l'activite (debat, negotiation, small talk etc.), fixe le sujet ä traiter et est responsable du (premier tour> ()» (Dausendschön-Gay/Krafft 1991, 132). Cf. auch die dort zitierte konversationsanalytische Literatur zu Telefongesprächen.
131
nicht zu der mit dem Sprechakt (eine Assertion bzw. eine phatische Namensmeldung) konventionell verknüpften Intonationskontur passt. Es ist aber nicht so, dass die Fragekontur die Äußerungen zu Fragen macht, sondern sie evoziert lediglich die Situation des Fragestellens und nuanciert den Sprechakt damit in einer Weise, die auch, wie die Beispiele (l)-(4) zeigen, mit Modalpartikeln erbracht werden kann. Das ist mit der Formulierung in (5) einzufangen versucht worden. Um nun diese Intuition theoretisch angemessen zu explizieren, sind zunächst einige vorbereitende Erörterungen zum Thema «Intonation» erforderlich.
5.2. Intonationskonturen als einzelsprachliche Ausdrucksmittel Eine Voraussetzung dafür, Intonationskonturen als Abtönungsmittel zu untersuchen, ist, sie als sprachliche Zeichen mit einer Ausdrucks- und einer Inhaltsseite zu betrachten. In der heutigen Intonationsforschung kann dies wohl als eine allgemein akzeptierte Voraussetzung gelten.5 Aus dieser Voraussetzung leiten sich unmittelbar die Folgeannahmen ab, dass (8a) (8b) (8c)
Intonationskonturen nicht Manifestation einer wie auch immer «natürlichen» Laut- oder Stimmäußerung sind; es sprachspezifische Unterschiede in Bezug auf Intonationskonturen gibt; Intonationskonturen fur sprachhistorische Prozesse zugänglich sind.
gearteten
Intonationskonturen sind also sprachliche Formen wie andere, z.B. Morpheme oder Wörter, auch. Als solche vermögen sie insbesondere sprachliche Funktionen zu übernehmen, d.h. bedeutungstragend zu sein. Nun scheint in der Intonationsforschung jedoch keine allgemeine Einigkeit darüber zu bestehen, wie genau die einzelsprachlichen Systemkategorien zu repräsentieren sind, die sich phonetisch als Intonationskurve oder Satzmelodie darstellen, sprich; was diese sprachlichen Formen sind, und vor allem darüber, auf welcher Beschreibungsebene eine Form-FunktionZuordnung anzusetzen ist. Generell lässt sich jedoch beobachten, dass die Entwicklung zu einer immer feinerrastrigen Beschreibung geht, d.h. die syntagmatischen Formeinheiten der Intonation sind in der jüngeren Forschungsgeschichte immer kleiner geworden. 5.2.1. Zur Erforschung der Intonation der romanischen Sprachen Im Allgemeinen muss die Intonation der romanischen Sprachen als nur sehr unzureichend erforscht bezeichnet werden. Es gibt oft nur einige wenige Arbeiten je
5
So explizit und detailliert argumentierend Wunderli/Benthin/Karasch (1978, 355-373). Die Autoren setzen sich hier insbesondere mit der in den 50er und 60er Jahren prominent von Martinet und anderen vertretenen Auffassung auseinander, dass Intonation nichts einzelsprachlich Konventionalisiertes und überhaupt ein marginales sprachliches Phänomen sei. Martinets Ansicht ist insbesondere im Zusammenhang damit zu sehen, dass die Annahmen in (8) dem Prinzip der double articulation zuwiderlaufen (sie implizieren eine Bedeutungszuweisung schon bei, oder sogar noch vor, der ersten Artikulation).
132
Sprache. Noch heute existiert für die Intonation auch nur einer romanischen Einzelsprache keine ähnlich detaillierte und sprechaktspezifisch ausgeführte Beschreibung, wie sie schon 1961 O'Connor und Arnold für das Englische vorgelegt haben. In der französischen Intonationsforschung ist nach wie vor das System von Delattre (1966) sehr präsent. Delattre nahm zehn verschiedene Intonationskurven an, die sich jeweils aus einer Bewegung zwischen vier Tonhöhenniveaus zusammensetzen und die illokutionsbezogenen Bedeutungen wie «question», «echo», «commandement» usw. zugeordnet sind, z.B.: (9) _
Question
4-1
Interrogation
2-4
Continuation majeure
4-1
Commandement
2-4_
Implication
4-1
Exclamation
2-4..
(Delattre 1966)
Für das Italienische nehmen, im Anschluss an Hallidays (1967) Beschreibung des Englischen, Lepschy (1978) und Voghera (1992) fünf Töne an: (10) (Lepschy 1978, 133) 1 fallend
2 steigend
(discendente)
esprime certezza; viene usato per le frasi dichiarative; anche per le interrogative che contengono termini interrogativi (chi, quale, quando ecc.) [...]
(ascendente)
esprime incertezza; viene usato per le interrogative che richiedono come risposta un si ο un no [...]
3 konstant (costante
ascendente)
esprime informazioni incomplete; viene usato per indicare sospensione [...]
4 fallend-steigend ascendente)
(discendente-
esprime un dubbio relativo a un'affermazione; viene usato nelle domande a eco, ο in domande che esprimono sorpresa; puö indicare enfaticamente la sospensione, come mettendo in dubbio una presupposta affermazione precedente [...]
5 steigend-fallend discendente)
(ascendente-
esprime un'affermazione energica, insistita; viene usato per contraddire ο correggere affermazioni precedenti (formulate ο presupposte); puö anche avere valore concessivo, indicando che ci sono delle riserve ο delle implicazioni.
Chapallaz (1979) geht, in Anlehnung an die sog. «Britische Schule» (cf. O'Connor/ Arnold 1961), für das Italienische von einem System mit nur drei Tönen aus, einem fallenden, fallend-steigenden und steigend-fallenden Ton. Auch diese drei Töne werden illokutiv charakterisiert. In gewissermaßen onomasiologischer Perspektive unterscheidet schließlich Canepari (1988) tonia conclusiva, sospensiva und interrogativa und untersucht, wie diese Funktionen in den einzelnen italienischen Dialekten realisiert werden.
133
Für das Spanische unterscheidet Quilis ( 1 9 9 0 ) drei Tonhöhen. Illokutiv charakterisierte Intonationskurven werden als B e w e g u n g e n über diese drei Tonhöhen beschrieben. Ähnlich nimmt Morais Barbosa ( 1 9 9 4 ) für das Portugiesische eine fallende, steigende und kontinuale Kontur an, die respektive «afirma9äo», «interrogafäo» und «suspensäo» repräsentieren. Zusammengefasst gilt für alle diese Arbeiten Folgendes: ( I I a ) Als Beschreibungsgrößen werden dynamische Intonationskonturen angenommen, d.h. Bewegungen zwischen verschiedenen Tonhöhen. ( I I b ) Die Bedeutungen werden Intonationskonturen zugewiesen, die sich über die ganze Äußerung erstrecken. (11c) Die Bedeutungen sind den ganzen Satz betreffende Charakterisierungen wie «interrogativ», «konklusiv», «exklamativ» und damit von einem ähnlichen Format wie z.B. die Bedeutungen von Satztypen (Fragesatz, Deklarativsatz usw.). (1 Id.) Formal komplexe Konturen (d.h. die mehr als eine Bewegung implizieren) wirken auch semantisch komplexer. So erscheinen die den komplexen Töne 4 und 5 in Lepschys Darstellung zugeordneten Funktionen als Untertypen des Sprechaktes «Affirmation» (und damit semantisch merkmalreicher als die einfache Affirmation). 6 W e n n man nun prüft, inwieweit sich die zitierten Arbeiten angesichts dieser Befunde dafür eignen, die in (5) angedeutete Intuition zu explizieren, s o zeigen sich folgende Probleme: (12a) Die Option, die Zuordnung von Konturform und Konturbedeutung holistisch fiir jeweils ganze Äußerungen vorzunehmen (IIb), schränkt die Untersuchbarkeit der Intonation stark ein. Man kann nicht in einer Kontur signifikante Teile isolieren. Allenfalls können Konturen ganzer Äußerungen daraufhin geprüft werden, inwieweit sie eine bestimmte Sprechsituation evozieren. (12b) Der Befund ( l l d ) macht die empirische Beschränkung der Option ( I I b ) deutlich. Die Isomorphie von formaler und semantischer Komplexität in Intonationskonturen deutet darauf hin, dass es bedeutungstragende Intonationseinheiten auch unterhalb der Äußerungsgrenze gibt und dass insofern ( I I b ) möglicherweise wichtige Verallgemeinerungen nicht zu erfassen vermag. Es scheint also einiges darauf hinzudeuten, dass sich der Bedeutungsaufbau v o n Intonation kompositional vollziehen kann, d.h. in Teilen, die kleiner sind als eine der ganzen Äußerung entsprechende Kontur. D a s heißt j e d o c h nicht, dass eine holistische A n a l y s e wertlos wird. Genau w i e sich die Bedeutung z.B. eines Satzes gesamthaft als Satzbedeutung oder kompositional als syntaktisch gesteuertes Zusammenspiel der in ihm enthaltenen Wortbedeutungen darstellen lässt, s o lässt sich auch Intonation in holistischer, auf die ganze Äußerung bezogener, oder in kompositionaler W e i s e , d.h. im Zusammenwirken kleinerer Teile, beschreiben. Man kann erwarten,
6
Halliday (1967, 30) regt an, die komplexeren Konturen als ein sowohl formales als auch semantisches Zusammenspiel von Frage und Antwort zu analysieren. Der italienische Ton 4 wäre somit eine schwache Affirmation, die nämlich durch eine nachfolgende Frage in Zweifel gezogen wird (was sich auch in der Abfolge fallend-steigend ausdrückt). Der Ton 5 hingegen wäre eine besonders starke Affirmation, die den in einer vorgängigen Frage suggerierten Zweifel ausschlägt (was sich in der Abfolge steigendfallend widerspiegelt).
134
dass ein kompositionales Verfahren aufwändiger, aber auch genauer ist. Die zu erwartende größere Genauigkeit sollte dann auch ermöglichen, zu feineren Bedeutungen zu kommen als den in (1 lc) erwähnten Kategorien wie «Frage», «Exklamation» usw. Genau dies zu leisten verspricht das Beschreibungssystem von Janet Β. Pierrehumbert.
5.2.2. Das Beschreibungssystem von Janet Β. Pierrehumbert In der anglistischen und später auch germanistischen Intonationsforschung hat sich das in Pierrehumbert (1980) erstmals eingeführte und in Pierrehumbert/Hirschberg (1990) dargestellte «autosegmental-metrische» Beschreibungssystem als durchschlagender Erfolg erwiesen. Grundüberlegung ist hierbei, ein System mit möglichst wenigen diskreten Tonebenen anzunehmen, genauer gesagt, mit nur zwei Ebenen, nämlich einer hohen (H) und einer tiefen (L). Die Annahme von «digitalen» Tonebenen (gegenüber «analogen» Konturen bzw. Bewegungen) erweist sich insbesondere dann als vorteilhaft, wenn man versucht, auch in der Intonation konsequent zwischen Phonetik und Phonologie zu unterscheiden. Man kann leichter System- von Realisierungsaspekten der Intonation trennen, wenn es auf der Systemebene nur eine kleine Zahl von Einheiten gibt, die dann auf je verschiedene Weise auf phonetische Grundfrequenzkurven abgebildet werden können. Nimmt man hingegen, wie in (IIa), als Systemeinheiten selbst Kurven an, so muss deren Übertragung auf phonetische Grundfrequenzkurven je individueller Sprechereignisse zu einem sehr aufwändigen Unterfangen werden. Betonte Akzenttöne werden mit einem Asterisk (*) ausgezeichnet. Geht der Akzentton über zwei Tonebenen, werden beide mit einem «+» verbunden. Die einzelnen Akzenttöne sind zu Intonationsphrasen zusammengefasst. Das Ende einer Intonationsphrase wird mit einem «Grenzton» markiert, der als «%» gekennzeichnet wird. Der Grenzton kann selbst wieder Η oder L sein. Im Folgenden wird dieses Beschreibungssystem an einigen einfachen Äußerungen des Französischen, Italienischen und (europäischen) Portugiesisch veranschaulicht.' (13) (14) (15)
«Elle est malade, non?» (Di Cristo 1998, 204) Η L* H* H% «In altre parole Roma produce poco e consuma molto» (Rossi 1998, 229) Η* L H * Η* L Η* LL% «Ο que e que disseste?» (Cruz-Ferreira 1998, 171) Η* L Η* H%
Die Reduktion auf nur zwei Tonebenen wird insbesondere dadurch möglich, dass das sog. downstepping im Sinne einer Redundanzregel phonologisch ausgenutzt wird. Mit downstepping ist das übereinzelsprachliche phonetische Phänomen ge-
Die Beispielsätze habe ich den entsprechenden Artikeln aus Hirst/Di Cristo 1998 entnommen und das dort verwendete Beschreibungssystem in das von Pierrehumbert/Hirschberg übertragen.
135
meint, dass sich typischerweise hohe und tiefe Töne abwechseln, gleichzeitig aber die Tonhöhe zum Ende der Äußerung hin generell abnimmt, sodass die unmarkierte Frequenzkurve einer gekippten Treppe ähnelt (daher der Ausdruck downstepping): (16) (nach Hirst/Di Cristo 1984, 556)
Η Η L
Η L
Die phonologischen Tonebenen Η und L bei Pierrehumbert abstrahieren von diesem Phänomen: Der phonologisch hohe Ton Η ist am Satzende phonetisch tiefer als der phonologisch tiefe Ton L am Satzanfang. Umgekehrt kann das downstepping durch eine (markierte) Abfolge von gleichen phonologischen Tönen gewissermaßen überschrieben werden. So wird eine Sequenz von drei phonologischen Tönen Η* Η* H* als drei phonetisch gleich hohe Töne realisiert (Pierrehumbert/Hirschberg 1990, 280-282). Pierrehumbert und Hirschberg verfolgen nun auch semantisch insofern einen strikt kompositionalen Ansatz, als sie den einzelnen Tönen, nicht größeren Konturen, Bedeutungsaspekte zuweisen. So gilt für den H*-Ton, dass er «conveyfs] that the items made salient by the H* are to be treated as in the discourse» (Pierrehumbert/Hirschberg 1990,289); hingegen «[t]he L* accent marks items that S [= speaker, RW] intends to be salient but not to form part of what S is predicating in the utterance» (Pierrehumbert/Hirschberg 1990, 291).
5.3.1-Topikalisierung und Fall-Rise Kontur In der jüngeren Literatur ist der Semantik und Pragmatik eines bestimmten, in vielen Sprachen ähnlichen, intonatorischen Phänomens viel Aufmerksamkeit geschenkt worden. Es handelt sich um eine fallend-steigende Kontur, wie in folgenden englischen und deutschen Beispielen (cf. Ward/Hirschberg 1985, Pierrehumbert/Hirschberg 1990, Büring 1997, Jacobs 1997, Molnär/Rosengrcn 1997, Hetland 1999). (17) (18)
«A: Do you speak Ladino? Β: I speak \Spa/nish» (Ward/Hirschberg 1985, 765). «Glaubst du, Fritz würde diesen Anzug kaufen? VICH würde ihn sicher WICHT kaufen» (Büring 1997, 56).
Im Beispiel (17) ist eine fallend-steigende Kontur auf den zwei Silben der Konstituente Spanish, im Beispiel (18) auf der einsilbigen Konstituente ich. Die fallende Bewegung ist dabei auf einem betonten Element; in Pierrehumberts Notation müsste sie als L*+H wiedergegeben werden (cf. Pierrehumbert/Hirschberg 1990, 294-296, Büring 1997, 57, Jacobs 1997, 127).8 Im größten Teil der Literatur sind die in (17)
Ward/Hirschberg (1985) notieren die Intonation der ganzen Intonationsphrase als L*+H
136
und (18) gezeigten Konturen als jeweils völlig unterschiedliche Phänomene untersucht worden. Lediglich Hetland (1999) geht davon aus, dass das intonatorische Phänomen in beiden Beispielen und in beiden Sprachen im Wesentlichen gleich ist. Diese Annahme möchte ich hier weiter stärken und begründen, dass die Konturen sowohl ausdrucke- als auch inhaltsseitig als gleich analysiert werden können. Ich stelle dabei zunächst die beiden Phänomene getrennt vor.
5.3.1. Die I-Topikalisierung Für das Deutsche ist die fallend-steigende Kontur viel im Zusammenhang mit einem syntagmatisch umfassenderen Intonationsphänomen diskutiert worden, der «I-Topikalisierung». 9 I-Topikalisierung ist das in (18) veranschaulichte Muster mit zwei akzentuierten Konstituenten, die erste davon (ich) mit Fall-Rise-Akzent und die zweite (nicht) mit einem fallenden (H* L) Akzentton. Mit der I-Topikalisierung weist der Sprecher, wie insbesondere von Büring (1997) und im Anschluss daran von anderen ausgearbeitet wurde, darauf hin, dass zu seiner Aussage relevante Alternativen bestehen in dem Sinne, dass dieselbe Aussage auch in Bezug auf andere Aussagegegenstände (Topiks) gemacht werden könnte, im Beispiel (18) etwa: «Je nachdem, ob Fritz meinen Geschmack teilt oder nicht, würde er vermutlich den Anzug auch nicht oder eben doch kaufen». Je nachdem, wie das tatsächliche Topik zu dem in der Situation erwarteten Topik steht, lassen sich mit Büring drei Typen von I-Topikalisierung unterscheiden: (19a) Kontrastive I-Topikalisierung A: Glaubst du, Fritz würde diesen Anzug kaufen? B: VICH würde ihn jedenfalls WICHT kaufen. (19b) Eingrenzende I-Topikalisierung A: Was hatten die Popstars an? B: Die VWEIBlichen Popstars trugen \KAFtane. (19c) Implikationelle I-Topikalisierung A: Hat deine Frau fremde Männer geküsst? B: VMEIne Frau hat \KEIne fremden Männer geküsst.
Nun im Einzelnen zu diesen Typen: Mit einer kontrastiven I-Topikalisierung (Beispiel [18] = [19a]) in einer Antwort wählt der Sprecher ein anderes Topik als in der Frage nahe gelegt. Er macht eine Aussage nicht über den in der Frage thematisierten Fritz, sondern über sich selbst. Er lehnt so das vom Fragenden vorgegebene Topik performativ ab. Mit diesem Verhalten verletzt er ein sehr hochrangiges Gebot kooperativer Konversation (cf. Sachs/Schegloff/Jefferson 1974, Roulet 1981, 22), nämlich, auf eine Frage eine entsprechende Antwort zu geben. Nur über die der I-Topikalisierung eigenen Funktion des Suggerierens von Alternativen wird das Topik, nach dem gefragt wurde (Fritz),
L-H%. Der Nukleus der Kontur ist aber auch hier L*+H, und insofern ist die Vergleichbarkeit zur Wurzelkontur der I-Topikalisierung offensichtlich (Hinweis von Hanneke van Hoof). Das «I» im Terminus I-Topikalisierung verweist auf «Intonation». Mit der Benennung wird also auf die wichtige Rolle der Intonation angespielt.
137
noch notdürftig mitversorgt. Diese Variante ist «kontrastiv» in dem Sinne, dass tatsächliches und erwartetes Topik sich nicht überschneiden. Die Mengen {ich} und {Fritz} überschneiden sich nicht. Mit der eingrenzenden I-Topikalisierung (19b) wird als Topik eine Teilmenge des erwarteten Topiks gewählt. Gefragt wurde im Beispiel nach den Popstars, die Antwort wird aber nur für einen Teil der Menge der Popstars, nämlich der weiblichen, gegeben. Die für die I-Topikalisierung typische Intonation implikatiert, dass die Antwort noch für andere Popstars (männliche) gegeben werden könnte. Die Mengenrelation kann übrigens auch umgekehrt, von einer Teilmenge zu einer Obermenge, verlaufen: (20)
A: Wie ist das Wetter in Tübingen? B: In \DEUTSCH/land ist das Wetter \IMmer mäßig.
In Bs Antwort ist das Topik «Deutschland» nicht eine Teilmenge des in der Frage eingeführten Topiks, sondern umgekehrt eine Obermenge des in der Frage eingeführten Topiks. 10 Pragmatisch ist die eingrenzende I-Topikalisierung insofern «milder» als die kontrastive I-Topikalisierung, als der Sprecher zwar nicht für die ganze vom Fragenden eingeführte Referenzmenge (in [19b] die Popstars) die gewünschte Antwort bringt, aber immerhin für einen Teil davon. In dieser Hinsicht noch «harmloser» ist die sog. implikationelle I-Topikalisierung (19c). Der Sprecher beantwortet die Frage für das vom Fragenden eingeführte Topik (hier: meine Frau). Erwartetes und tatsächliches Topik decken sich. Der Sprecher suggeriert lediglich, dass noch andere Alternativen (die Frau von jemand anderem) relevant sein könnten. Insofern als der Sprecher in diesen Beispielen eine Antwort gibt, die nicht hinreichend auf die vom Anderen gestellte Frage eingeht (bzw. im Fall der implikationellen I-Topikalisierung andere mögliche Fragen als relevant suggeriert), kann I-Topikalisierung als eine «offensive» sprachliche Technik bezeichnet werden. Indem der Sprecher andere relevante Topiks implikatiert, deutet er an, dass die gestellte Frage nicht zu seiner Definition des übergeordneten Gesprächszusammenhangs passt. Er gibt zu verstehen, dass er die Relevanzunterstellung, die der Frage zugrunde liegt, nicht oder nur eingeschränkt akzeptiert. I-Topikalisierung ist in der Literatur übereinzelsprachlich belegt, mindestens für das Deutsche (Büring 1997), das Englische (Hetland 1999) und das Ungarische (Molnär/Rosengren 1997). Auch im Italienischen kann man Beispiele für diese Kontur finden:
10
Die Mengenrelation ist hier nicht etwa so zu verstehen, dass {Tübingen} eine Teilmenge von {Deutschland} wäre (das stimmt natürlich nicht), sondern so, dass das Adverb immer über eine Menge von Wetterbeobachtungen oder -Stichproben (als Ereignissen) quantifiziert, von denen ein Teil in Tübingen gemacht wurde.
138
(21) (22) (23)
Pensi che questa maglietta piacerebbe a Paola? A VME non piacerebbe! Ti e piaciuto il Piemonte? \To/RIno mi e piaciuta, si. Che brutte mele! La \MI/a e buona!
In den diskutierten Beispielen kam die I-Topikalisierung immer in Antworten auf unmittelbar voraufgehende Fragen vor. Molnär/Rosengren (1997) zeigen jedoch, dass I-Topikalisierung nicht an Antworten gebunden ist: (24) (25)
(26)
«Die vEPik von Grass hat Reich-Ranicki stets ge\LOBT, aber vEInen Roman hat er ver\R!Ssen (, nämlich Ein weites Feld}». «A: Endlich hat Grass wieder mal ein Buch herausgebracht. B: Ja, das ist schon gut. Leider hat aber vALlen Kritikern das Buch keines\WEGS gefallen. (Einige haben es sogar verRISsen)». «Den dritten Aufsatz schließlich werden vALle Kritiker \NICHT gut finden».
Jedoch lassen sich die Beispiele (19)-(20) einerseits und (24)-(26) andererseits insofern verbinden, als in allen Fällen die I-Topikalisierung sich auf das jeweilige Diskursthema bezieht. In den Frage-Antwort-Paaren ist das fur die Antwort relevante Diskursthema in aller Regel durch die Frage vorgegeben; 1 1 die Beispiele (24)-(26) wirken kohärent nur in Kontexten mit einem Diskursthema, zu dem die I-topikalisierten Elemente in unmittelbarem Zusammenhang stehen: Für (24) könnte dies etwa «Texte von Günter Grass» sein, für (25) «Rezeption von Grass' Werk», für (26) «Besprechung einer Sammlung von Aufsätzen».
5.3.2. Die Fall-Rise-Kontur Nach Ward/Hirschberg (1985) und Pierrehumbert/Hirschberg ( 1 9 9 0 , 2 9 4 - 2 9 6 ) implikatiert der Sprecher mit Fall-Rise eine Unsicherheit darüber, ob und wie die mit diesem Akzentton gekennzeichnete Konstituente auf einer bestimmten pragmatischen Skala zu situieren ist. Ich wiederhole hier das Beispiel (17) (Ward/Hirschberg 1985, 765): (17)
«A: Do you speak Ladino? Β: I speak \Spa/nish ».
Β gibt mit seiner Antwort zu verstehen, dass er nicht sicher ist, ob Spanisch (statt Judenspanisch, ladino) zu sprechen für den von Α verfolgten kommunikativen
11
Es kommt hier allerdings die Besonderheit hinzu, dass Fragender und Antwortender unterschiedliche Diskursthemen unterstellen. Ein Fragender definiert performativ das Diskursthema, denn über die Antworterwartung macht er starke Vorgaben für den weiteren Verlauf des Diskurses. Wenn der Antwortende auf die Frage angemessen eingeht (also im Normalfall), trägt er die Definition des Fragenden mit. Bei I-Topikalisierung hingegen geht der Antwortende auf die Frage nicht in der vom Fragenden gewünschten Weise ein und gibt damit zu verstehen, dass er dessen Diskursthemendefinition nicht akzeptiert, was wiederum in aller Regel bedeutet, dass der Antwortende das vor der Frage gültige Diskursthema nicht verlassen will.
139
Zweck ausreicht. Β unterstellt hier eine pragmatische Skala von Sprachen, deren Ordnung die Eignung dieser Sprachen für den von Α verfolgten Zweck wiedergibt. Β ist nicht sicher, ob Spanisch für A's Zwecke ausreicht, d.h. ob Spanisch auf dieser Skala hoch genug steht. Ähnlich sind folgende Beispiele (O'Connor/Arnold bei Hetland 1999, 79) zu interpretieren: (27)
«A: Only a \few are going, /aren't they? Β: \Every/body. VAU of them».
Die relevante Skala ist eine Ordnung von Mengen von Personen. Β ist sich wohl nicht sicher darüber, ob die Menge, von denen «alle» gehen, diejenige Personenmenge ist, auf die sich Α bezieht. Ähnlich folgendes Beispiel (Ladd 1980 bei Hetland 1999, 78): (28)
«A: Have you seen our books? Β: I've got a Vcouple of them».
Der Fall-Rise auf couple of ist hier wohl so zu verstehen, dass Β sich nicht sicher darüber ist, ob Α ihm noch nicht bekannte Bücher anbieten kann, d.h. darüber, ob A und Β von derselben Menge Bücher sprechen. Im Gegensatz zu der als «offensiv» charakterisierten I-Topikalisierung kann man Fall-Rise geradezu als defensiv bezeichnen. Mit dem Fall-Rise implikatiert der Sprecher, dass er sich nicht sicher ist, ob seine Antwort ein relevanter Beitrag zu dem vom Fragenden definierten lokalen Gesprächsthema ist, nimmt sich also stark zurück. In Bezug auf das Verhältnis der angenommenen Relevanz des eigenen Redebeitrags zur (angenommenen) Relevanz des lokalen Diskursthemas sind also I-Topikalisierung und Fall-Rise genau spiegelbildlich zueinander: Bei der I-Topikalisierung wird der eigene Redebeitrag als relevanter als das durch die Frage definierte lokale Diskursthema angenommen, beim Fall-Rise hingegen wird der eigene Redebeitrag als potenziell weniger relevant als das durch die Frage definierte lokale Diskursthema wahrgenommen. 5.3.3. Zur inhaltlichen Analyse der L*+H Kontur: Eine Interaktion von Intonation und Informationsstruktur Büring (1997) und Jacobs (1997) behandeln die I-Topikalisierung als einheitliche Konstruktion und untersuchen sie holistisch, d.h. sie ordnen der Gesamtkontur Funktionen zu. Im Gegensatz hierzu will ich mit Hetland (1999) aber davon ausgehen, dass die Funktion der I-Topikalisierung sich kompositional aus Funktionen der ersten (L*+H) und Funktionen der zweiten (H* L) Kontur zusammensetzt. Diese Trennung erlaubt es, die I-Topikalisierung mit der Fall-Rise-Kontur des Englischen zu vergleichen, die ja als (L*+H) notiert wird, also in Pierrehumberts Beschreibungssystem der ersten Kontur der I-Topikalisierung entspricht. Die erste Kontur der I-Topikalisierung wird auch «Wurzelkontur» genannt und manchmal entsprechend mit dem Wurzelzeichen ( V ) notiert (Jacobs 1997, 92). Ich nehme also im Folgenden an, dass Wurzelkontur und Fall-Rise intonatorisch identisch sind und somit die gleiche sprachliche Form repräsentieren. Diese Annahme wird insbesondere dadurch gestützt, dass sie in Arbeiten zu den beiden Phänomenen unabhängig vonein-
140
ander mit der gleichen Notation wiedergegeben wird (cf. Büring 1997, 57 und Jacobs 1997, 127 für die erste Kontur der I-Topikalisierung, Pierrehumbert/Hirschberg 1990, 294-96 fur den Fall-Rise). Ich möchte nun zeigen, dass Wurzelkontur und Fall-Rise nicht nur ausdrucksseitig, sondern auch inhaltlich gleich sind. Meine Argumentation wird dabei im Wesentlichen auf der These basieren, dass die oberflächlichen inhaltlichen Unterschiede zwischen beiden Konturen sich aus dem Befund erklären lassen, dass die Wurzelkontur typischerweise eine thematische Konstituente trifft, Fall-Rise hingegen eine rhematische. Die These ist, dass die mit Fall-Rise und Wurzelkontur konventionell assoziierte Semantik gleich ist; lediglich in Kombination mit unterschiedlichen informationsstrukturellen Werten ergeben sich im Diskurs unterschiedliche Wirkungen. Büring (1997) beschreibt die Beziehung zwischen tatsächlichem und erwartetem Topik der I-Topikalisierung semantisch als Mengenrelationen, Ward/Hirschberg wählen für den Fall-Rise mit den Skalen eine pragmatische Beschreibung. Beim Fall-Rise implikatiert der Sprecher Unsicherheit über eine Skalenrelation (Unsicherheit darüber, ob überhaupt eine Skala anzusetzen ist, Unsicherheit darüber, welche Skala gilt, und schließlich Unsicherheit über die Ordnung von diskursrelevanten Entitäten auf einer Skala). Die Skalenrelation ist pragmatisch, weil sie sich nur aus dem jeweiligen Diskurszusammenhang ergibt. Die Mengenbeziehungen hingegen können auch unabhängig vom jeweiligen Diskurszusammenhang betrachtet werden und sind daher eine semantische Beschreibung. Man kann nun sicherlich auch die mengentheoretische Beschreibung Bürings in eine Skalenrelation übersetzen und damit die beiden Akzenttöne noch besser vergleichen: Der Sprecher der I-Topikalisierung siedelt das Topik der tatsächlichen Äußerung auf einer pragmatischen Relevanzskala höher als das erwartete Topik an. Diese Aussage ist eine theoretische Umformulierung des oben gemachten Befundes, dass der eigene Redebeitrag als relevanter als das Diskurstopik wahrgenommen wird. 12 Hierfür ist es gleichgültig, in welcher mengentheoretischen Beziehung tatsächliches und erwartetes Topik zueinander stehen, d.h. ob das tatsächliche Topik eine Teil- oder Obermenge des erwarteten Topiks ist, ob sich beide Topik-Mengen identisch sind oder ob sie keine Schnittmenge aufweisen. Vergleicht man nun die besprochenen Beispiele zu Wurzelkontur und zu FallRise, so fällt ins Auge, dass die Wurzelkontur im Allgemeinen thematische Konstituenten trifft, Fall-Rise hingegen im Allgemeinen rhematische. Dies ist die zentrale Beobachtung für die Vergleichbarkeit der beiden Konturen. Ich wiederhole hier
12
Für «implikationeile» I-Topikalisierung (cf. [19c]: Hat deine Frau fremde Männer geküsst - \MEUne Frau hat \keine fremden Männer geküsst) mag man diese Aussage anzweifeln. Es ließe sich einwenden, dass hier der Sprecher jemandes anderen Frau als relevanter als die eigene darstellen will. Es scheint mir jedoch, dass sich dies in diesem speziellen Fall aus einer Art sekundärem Umkehreffekt ergibt, derart, dass der Umstand, dass «jemandes anderen» Frau (d.h. jemand, die nicht unmittelbar Diskursthema ist) überhaupt in den Zusammenhang der Skala des «Fremdgehens» gebracht wird (auch wenn auf dieser Skala «niedrigen) als die eigene positioniert), hier als die primäre Wirkung der Äußerung erscheint.
141
noch einmal zwei Beispiele mit einer (thematischen) Wurzelkontur (20) und einer (rhematischen) Fall-Rise-Kontur (17): (20) (17)
«A: Wie ist das Wetter in Tübingen? B: In \DEUTSCH/land ist das Wetter \IMmer mäßig». «A: Do you speak Ladino? Β: I speak \Spa/nish».
Übersetzt man nun die Begriffe «Thema» als «das, worüber gesprochen wird» (Satzgegenstand) bzw. «Rhema» als «das, was über etwas gesagt wird» (Satzaussage), so kann man den Unterschied zwischen Wurzelkontur und Fall-Rise folgendermaßen umreißen: (29a) Mit der Wurzelkontur deutet der Sprecher an, dass die Aussage, die er über den Satzgegenstand macht, auch in Bezug auf andere Satzgegenstände relevant sein könnte. Neben dem tatsächlich gewählten Satzgegenstand (Thema) beansprucht der Sprecher damit Geltung auch noch für andere Satzgegenstände, er implikatiert also eine Festlegung auf noch mehr Aussagen außer der tatsächlich gemachten. So kommt der beschriebene offensive Effekt zustande. (29b) Mit dem Fall-Rise deutet er hingegen an, dass über den Satzgegenstand auch andere Aussagen außer dem, was er wirklich darüber sagt, relevant sein könnten. Sind diese Satzaussagen (Rhemata) paradigmatische Alternativen (wie Spanisch vs. Judenspanisch in [17]), läuft dies darauf hinaus, dass der Sprecher eine Festlegung vermeidet. So kommt der beschriebene defensive Effekt zustande.
Ich möchte die völlig unterschiedliche Wirkung, die das Andeuten von pragmatisch relevanten Alternativen hervorrufen kann, je nachdem, ob zu Thema oder Rhema Alternativen erwogen werden, noch einmal an einem einfachen Beispiel veranschaulichen. Wenn ich in dem Satz Das Buch gefällt mir zum Thema das Buch Alternativen angebe, gebe ich zu verstehen, dass mir außer dem Buch noch andere Dinge gefallen - so, als ob tatsächliche und implikatierte Aussage durch ein und verknüpft wären. Deute ich hingegen zum Rhema gefällt mir Alternativen andeute (die Wahl der sprachlichen Mittel, mithilfe derer sich diese Andeutung vollzieht, spielt dabei keine Rolle), vermeide ich, mich darauf festzulegen, dass mir das Buch gefällt, und schwäche meine Aussage damit entsprechend ab. Ich suggeriere, dass mir das Buch z.B. auch nicht gefallen könnte. Es ist, als ob tatsächliche und implikatierte Aussage durch ein oder verknüpft würden. Die Interaktion von Implikaturtyp und informationsstrukturellem Wert (Thema bzw. Rhema) vermag also entgegen gesetzte pragmatische Wirkungen zu erzielen. Die unterschiedlichen pragmatischen Wirkungen von L*+H können auf dieselbe Implikatur zurückgeführt werden. Die Unterschiede kommen dadurch zustande, dass die gleiche Implikatur mit unterschiedlichen informationsstrukturellen Werten zusammenspielt. Wurzelkontur und Fall-Rise scheinen damit nicht nur ausdrucksseitig, sondern auch inhaltlich gleich zu sein.
5.3.4. L*+H als Abtönung: Pragmatische Überlegung Gleichgültig, ob L*+H eine thematische oder eine rhematische Konstituente trifft, der mit ihr verknüpfte pragmatische Effekt lässt sich als Abtönung gemäß der in Kap. 2 entwickelten Definition ausweisen. 142
Trägt eine thematische Konstituente den Akzentton L*+H (also im Fall der I-Topikalisierung), so wird damit, wie in Kap. 5.3.1. dargelegt wurde, angedeutet, dass noch andere Themen außer dem tatsächlich gewählten relevant sein können. Der Standardfall hierfür ist die Antwort auf eine Frage. Der Antwortende tut so, als ob nach dem Thema gefragt worden wäre, das er selbst tatsächlich in seiner Äußerung realisiert, und umgeht damit partiell den diskursiven Zwang, auf die gestellte Frage eine pertinente Antwort zu geben. Man kann dies auch als Konflikt zwischen Konversationsmaximen beschreiben: Die Qualitätsmaxime, das Gebot zur Aufrichtigkeit, verpflichtet den Antwortenden, die Frage getreu zu beantworten, die Quantitätsmaxime hingegen, die in dem jeweiligen Zusammenhang angebrachten, d.h. ausreichenden und erforderlichen Informationen zu geben. In den genannten Beispielen verletzt der Sprecher also die Quantitätsmaxime, bzw. deutet die eigentlich relevanten Informationen nur schwach an, und hält sich dafür an die Qualitätsmaxime. In Kap. 2.3.1. wurde Abtönung als Antizipation von Hörerreaktionen bestimmt. Sie ermöglicht dem Sprecher, seine Äußerung in Bezug auf den jeweiligen Diskurs zu perspektivieren. Das Perspektivierungsproblem stellt sich in der Situation der Fragen (19a-c) in besonderem Maße. Der Sprecher steht einerseits unter dem lokalen Druck, die gegebene Frage getreu zu beantworten, andererseits muss er sich dem aus der etwas weiträumigeren Diskursstruktur erwachsenden Problem stellen, die wirklich relevanten, also nicht nur die lokal erfragten, Informationen zu liefern. Er verletzt also in jedem Fall eine Konversationsmaxime. Der Akzentton L*+H ermöglicht ihm, diese Verletzung abzumildern. Indem der Sprecher so tut, als ob nach dem in seiner Äußerung realisierten Thema gefragt worden wäre, kann er den der nicht erfüllten Maxime entsprechenden Inhalt zumindest fiktiv doch noch evozieren. L*+H auf thematischen Konstituenten ist ein Abtönungsverfahren insofern, als dieser Akzentton als sprachliche Form die Funktion hat, die illokutionäre Perspektive der Äußerung zu ändern. Nebenbei bemerkt ist dies auch eine Form von Polyphonie. Der Sprecher bessert gewissermaßen einen eigentlich nur bedingt in seine Sprechsituation passenden Sprechakt in Bezug auf diese «Passung» nach. Auch in Verbindung mit rhematischen Konstituenten kann L*+H als Abtönungsverfahren bezeichnet werden. Mit dem Akzentton L*+H auf rhematischen Konstituenten in Antworten gibt der Sprecher Unsicherheit in Bezug auf die Einordnung seiner Antwort auf einer durch die Frage definierten pragmatischen Skala zu verstehen. Auch hier geht der Sprecher nicht hinreichend auf die Frage ein, bzw. er befurchtet, dies nicht zu tun oder nicht tun zu können. Insofern ist hier genau wie in Verbindung mit thematischen Konstituenten die Antwort prekär. Es ist, als ob seine Antwort nicht die Antwort auf die wirkliche Frage wäre, sondern auf eine imaginäre, polyphon evozierte, zweite Frage, so wie wenn er, nachdem er auf die wirkliche Frage eine negative Antwort gegeben hätte, nun eine zweite Frage beantworten würde, in der der Fragende eine Art von «zweiter Wahl» abprüft («wenn schon nicht Judenspanisch, dann wenigstens Spanisch?»).
5.3.5. L*+H als diachrones Zitat der elliptischen Frage: Semantische Überlegung Um den Akzentton L*+H als Abtönungselement auszuweisen, muss er nicht nur die im engeren Sinne pragmatischen, sondern auch die historisch-semantischen Krite-
143
rien der in Kap. 2 erläuterten Definition erfüllen. Es muss also gelingen, eine konventionelle Zuordnung dieser Kontur zu einem Sprechakttyp zu finden, welcher typischerweise einer Sprechsituation zugehört, die mit dem abtönenden Gebrauch von L*+H evoziert wird. Jacobs (1997, 127) macht die vorsichtige Anregung, die charakteristische Form dieses Akzenttons mit der Frageintonation in Verbindung zu bringen. Beide Intonationen sind aufsteigend. Ich möchte nun im Folgenden Jacobs' Vermutung dezidiert stärken und dafür argumentieren, den Akzentton L*+H in seinen abtönenden Verwendungen als diachrones Zitat der elliptischen Frage zu interpretieren. Elliptische Fragen sind Fragen, in denen nur eine, typischerweise nominale, Konstituente erscheint. Aus dem sprachlichen und nichtsprachlichen Kontext ergibt sich, was der Sprecher mit dieser verkürzten Formulierung meinte. Häufig werden elliptische Fragen mit und eingeleitet: «und Erwin?», «et toi?». Um die Annahme plausibel zu machen, dass der Akzentton L*+H ein Zitat der elliptischen Frage ist, muss zum einen - inhaltlich - gezeigt werden, dass die abtönende Funktion von L*+H zur Semantik der elliptischen Frage passt, d.h. dass ihr Verhältnis semantisch das gleiche ist wie dasjenige zwischen anderen abtönenden Elementen und deren diachronen Quellfunktionen; zum anderen muss - formal - gezeigt werden, dass der Akzentton L*+H und die Intonation der elliptischen Frage prosodisch hinreichend identisch sind. Auf das erste (semantische) Problem gehe ich hier ein, auf das zweite (phonologische) im folgenden Abschnitt. In 5.3.1. wurde schon angedeutet, dass der illokutionäre Effekt des Akzenttons L*+H sowohl auf thematischen als auch auf rhematischen Konstituenten sich auch dahingehend umschreiben lässt, dass eine Fragesituation evoziert wird. Der Sprecher tut so, als ob nach genau der Konstituente gefragt worden wäre, die in seiner eigenen Äußerung den Ton L*+H trägt; damit mildert er, bei thematischen Konstituenten, die diskursive Regelverletzung ab, nicht direkt auf die vorher gestellte tatsächliche Frage bzw. auf das etablierte Diskursthema eingegangen zu sein. Eine Frage als initiativer Sprechakt legt dem Angesprochenen eine Reihe von diskursiven Obligationen absteigender Stärke auf: 1. überhaupt zu reagieren, 2. den jeweils komplementären responsiven Sprechakt zu erbringen, und 3. im Sinne des Wunsches zu reagieren, der dem initiativen Sprechakt zugrunde lag (cf. Roulet 1981, 22). Der Specher verletzt hier die zweite dieser Obligationen (auf die jeweilige Frage pertinent einzugehen). Man kann sich dies folgendermaßen vorstellen: (30)
Tatsächliche Frage: Was hatten die Popstars an? Imaginäre Frage: Und die weiblichen Popstars? Tatsächliche Antwort: Die /WEIBlichen Popstars trugen \KAFtane.
Der Sprecher entschuldigt sich gewissermaßen dafür, auf eine Frage nicht einschlägig geantwortet zu haben, indem er eine andere, imaginäre, Frage evoziert, auf die er dann seine wirkliche Antwort gibt. Nun zu rhematischen Konstituenten: hier markiert der Akzentton L*+H Unsicherheit des Sprechers über die Relevanzzuordnung seiner Antwort; auch dies ist 144
mit der Evozierung einer Fragesituation kompatibel, insofern als der Sprecher weiß, dass er auf die tatsächlich gestellte Frage abschlägig antworten muss, und daher eine imaginäre zweite Frage des Anderen vorwegnimmt, auf die er positiv antworten kann. Er evoziert die Situation, auf diese zweite, imaginäre Frage zu antworten. Damit kommt er «soweit er kann» den Bedürfnissen des Fragenden entgegen: (31)
Tatsächliche Frage: Do you speak Ladino?
Imaginäre Antwort: No.
Imaginäre zweite Frage: And Spanish?
Tatsächliche Antwort: I speak \Spa/nish.
Mit diesem Verhalten verletzt der Antwortende (leicht) die diskursive Obligation, auf eine Frage die entsprechende Antwort zu geben, zugunsten einer (unvollkommenen) Erfüllung der diskursiven Obligation, dem Bedürfnis des Fragenden zu entsprechen (hier also: Judenspanisch sprechen zu können). Im Wissen, auf eine Frage nicht die gewünschte Antwort geben zu können, antwortet er auf eine imaginäre zweite Frage, von der er vermutet, dass sie ungefähr die Wünsche des Gesprächspartners zufrieden stellt, und die er positiv beantworten könnte, so wie: Haben Sie Äpfel? - Wir haben Birnen. Dies ist ein Beitrag zu «harmonischem» Gesprächsverhalten, wobei der Diskursfrieden mit sachlich kooperativem, sprachlich aber tendenziell unkooperativem Verhalten erkauft wird: Auf eine Frage nicht die komplementäre Antwort zu geben ist sprachlich unkooperativ, hier aber sachlich durchaus kooperativ, weil der Gefragte nicht einfach nur die tatsächlich geäußerten Informationswünsche des Anderen reaktiv bedient, sondern versucht, «mitzudenken» und im Rahmen seiner Möglichkeiten die sachlichen Probleme, die dessen Frage vermutlich zugrunde lagen, mitzulösen. In den genannten Beispielen war die imaginäre zweite Frage eine elliptische Frage, «und die weiblichen Popstars?», «and Spanish?» Mir scheint, dass der durch L*+H hervorgerufene Effekt, eine Fragesituation zu evozieren, sich am leichtesten dann nachvollziehen lässt, wenn man sich die Frage als elliptische Frage vorstellt. Eine elliptische Frage ist kein syntaktisch vollständiger Fragesatz, sondern ein oft mit «und» eingeleitetes Element niedrigerer syntaktischer Ordnung, wie «et Pierre?», welches im Diskurs als Sprechakt Frage gewertet wird. Die elliptische Frage setzt einen Redekontext voraus, in dem schon eine Alternative zu dem in der elliptischen Frage thematisierten Element erörtert wurde oder zumindest implizit präsent war. Dieses Element kann sowohl thematisch als auch rhematisch sein, d.h. die elliptische Frage kann ein Element ins Spiel bringen, welches Thema eines entsprechenden syntaktisch vollständigen Fragesatzes wäre, oder sie kann ein Element ins Spiel bringen, welches Rhema eines entsprechenden syntaktisch vollständigen Fragesatzes wäre. Zunächst ein Beispiel für eine thematische elliptische Frage: (32) (LIP, FA1) «B: dove andate in gita non ho mica capito? A: in Abruzzo Pescara parco nazionale peste [lacht] Pescara B: ah
145
A: parco nazionale L'Aquila L'Aquila parco nazionale Pescara B: quanto tempo? D: te al parco nazionale non ci sei stato? A: tre giorni? B: Pescara parco nazionale L'Aquila tre giorni? D: vabbe un giorno lo girano per il parco A: un giorno si gira tutto il parco D: un giorno stanno all'Aquila e poi staranno al mare qualche giorno A: un giorno B: e il viaggio scusal A: mamma vado al bagno? D: eh? B: e il viaggio scusa! A: vado al bagno? D: si B: mamma ma il viaggio non lo non lo consideri?»
Α erzählt hier von einer bevorstehenden Reise in die Abruzzen, die insgesamt eine Woche dauern soll; insbesondere spricht er vom Zeitbedarf der einzelnen Etappen. Β fragt nun mit e il viaggio, scusa? nach dem Zeitbedarf für die Anreise in diese Gegend selbst und für die Rückreise. Α versteht die Frage anscheinend nicht, was Β zu der expliziteren Nachfrage mamma ma il viaggio non lo consideri? veranlasst, in der il viaggio eine thematische Konstituente ist. Nun ein Beispiel für eine rhematische elliptische Frage: (33) (LIP, M A I ) «B: ahah Dune ahah dai quand'e che lo fanno io me lo vedo
A: adessol no Β: dai Ε: Dune lo fanno bello B; io non l'ho mai visto»
Hier geht es um den Film Dune, den die Beteiligten auf Video aufzunehmen vorhaben. Β spricht davon, dass er ihn sich ansehen will. Α wirft adesso? ein, was eine rhematische Konstituente in einem entsprechenden vollständigen Satz vertritt. Der Umstand, dass die elliptische Frage im Kontext bereits präsente Alternativen aufgreift, macht sie besonders geeignet dafür, in Abtönungssituationen evoziert zu werden. In Abtönungssituationen wird ja nicht irgendeine Fragesituation evoziert, sondern eine Situation, in der eine Frage gestellt wird, die eng mit dem jeweiligen Diskursthema zusammenhängt. Elliptische Fragen verweisen nun durch ihre hohe Kontextgebundenheit per se auf andere Elemente des Diskurses. 5.3.6. L*+H als Abtönung: Phonologische Überlegung Ich möchte nun zeigen, dass die Kontur L*+H nicht nur semantisch-pragmatisch, sondern auch phonologisch als Verweis auf eine elliptische Frage gewertet werden kann. Zu den im Sprachvergleich weit verbreiteten Charakteristika der elliptischen Frage scheint es zu gehören, dass diese eine aufsteigende Kontur hat (Bolinger 1978, 503). Elliptische Fragen haben damit eine ähnliche prosodische Charakteristik
146
wie typischerweise Satzfragen (mit ja oder nein zu beantwortende Fragen), nicht jedoch wie Wortfragen (Ergänzungsfragen), welche nämlich eine fallende finale Kontur haben wie typischerweise Aussagesätze. Diese steigende Kontur haben elliptische Fragen auch dann, wenn sie nicht eine Satzfrage, sondern eine Wortfrage vertreten (Bolinger 1978, 503). Nimmt man an, dass die - aufsteigende - Intonation L*+H mit dem Sprechakt Frage nicht nur inhaltlich, sondern auch ausdrucksseitig in Verbindung zu bringen ist, so kann also nur die Intonation der elliptischen Frage in Betracht gezogen werden. Denn nur die Intonation dieser Frage ist, wie der Akzentton L*+H selbst, immer aufsteigend und gleichzeitig in Hinblick auf den Gegenstand der Frage als Illokution unbeschränkt. Die Satzfrage hat zwar eine aufsteigende Intonation, ist aber eben als Sprechakt auf Entscheidungsfragen beschränkt und kann daher nicht plausiblerweise als vom Akzentton L*+H «zitiert» gelten, der ja illokutiv auch Wortfragen evozieren kann. Die Wortfragen hingegen kommen als ausdrucksseitiges Urbild des Akzenttons L*+H schon deshalb nicht in Betracht, weil sie im Gegensatz zu diesem eine fallende Intonation haben. Aus diesen Überlegungen ergibt sich folgende These: (34)
Wenn in einer Sprache ein prosodisches Abtönungsverfahren existiert, welches funktional als «Zitat einer Fragesituation» beschrieben werden kann, so hat es die gleiche intonatorische Form wie die elliptische Frage in derselben Sprache.
Diese These verlangt nicht, dass die Abtönungsfunktion «Zitat einer Fragesituation» im Sprachvergleich eine ganz bestimmte prosodische Form hat. Sie behauptet nur, dass die prosodische Form dieser Abtönungsfunktion die gleiche ist wie die der elliptischen Frage in der jeweiligen Einzelsprache. Ich versuche nun, diese These anhand von drei Sprachen zu belegen, f ü r die in der Literatur die betreffenden Phänomene beschrieben worden sind. Für das Deutsche, diejenige Sprache, die in der Forschung zur I-Topikalisierung als erste intensiv untersucht wurde, lässt sich die These leicht belegen. Büring (1997, 57) sagt vom Topik-Akzent, er sei «marked by a rising pitch L*H». Auch Jacobs (1997, 127) spricht von diesem Tonmuster. Nun hat Caroline Fery in ihrem Buch über deutsche Intonation auch ein Beispiel für eine elliptische Frage. Sie notiert es folgendermaßen: (35)
«Die Bahn?» (Fery 1993, 115) L*H
Mit jeweils völlig unterschiedlichen Forschungsinteressen kommen also Büring und Jacobs einerseits und Fery andererseits zur gleichen intonatorischen Beschreibung von Topik-Akzent und elliptischer Frage. 1 3
13
Jacobs nennt das Muster «L*-H», Büring und Fery «L*H». Ich betrachte diese Schreibweisen als notationelle Varianten der hier befolgten Schreibweise «L*+H», denn beide Autoren behandeln die Muster als jeweils einen Akzentton. Genau dies ist auch mit dem Zeichen «+» in meiner, direkt Pierrehumbert folgenden, Notationsvariante gemeint.
147
In Bezug auf das Ungarische zeigen Molnär/Rosengren (1997), dass auch in dieser Sprache die Wurzelkontur als phonologische Einheit mit dem semantischen Effekt der I-Topikalisierung assoziiert ist. Ein Beispiel der Autorinnen: (36)
«Ez
igaz, de
te is
jol
tudod,
Das (ist) wahr, aber du auch wohl weißt, hogy VMINden kritikusnak \NEM tetszett az utolsö Grass-regeny».
dass
allen
Kritikern
nicht gefiel
der letzte Grass-Roman.
(Molnär/Rosengren 1997, 229, ihre Glossen)
Wenn man davon ausgeht, dass der ungarische Akzentton, den Molnär/Rosengren mit dem Zeichen V erfasst haben, in der Pierrehumbertschen Schreibweise als L*+H notiert wird, so haben die genetisch nicht verwandten Sprachen Deutsch und Ungarisch also fur die Inhaltseinheit I-Topikalisierung die genau gleiche Ausdrucksform, nämlich den Akzentton L*+H. Nun behandelt Ladd (1996), der im Wesentlichen der Pierrehumbertschen Notation folgt, auch die ungarische Frageintonation und nennt folgendes Beispiel für eine elliptische Frage (Ladd 1996, 116): (37)
«A tanär?» L*HL%
Der Lehrer? Auch im Ungarischen hat die elliptische Frage also den Akzentton L*H und sie entspricht damit, wie im Deutschen, prosodisch dem Akzentton der I-Topikalisierung. 14 Im Französischen sind die Verhältnisse etwas komplizierter, aber durchaus konform mit der These (34). Sehr aufschlussreich ist hier M. Rossi (1999, 73-79). Die Intonation der französischen elliptischen Frage ist, nach übereinstimmender Auffassung renommierter französischer Intonatologen, absteigend (so ausdrücklich Di Cristo 1998, 207 und M. Rossi 1999, 75). Die französische elliptische Frage ist demnach im prosodischen Sprachvergleich eine große Ausnahme. Rossi macht nun explizit eine Verknüpfung zwischen der elliptischen Frage und einem bestimmten Typ von Thematisierung, der der I-Topikalisierung sehr ähnlich zu sein scheint. Die Äußerung (38)
«Ton frere, qu'est-ce qu'il en pense?» (M. Rossi 1999, 73)
ist eine Thematisierung der Konstituente ton frere. Sie kann mit zwei verschiedenen Intonationskonturen realisiert werden, die mit verschiedenen semantischen und pragmatischen Nuancen assoziiert sind:
14
Lediglich der mit % markierte Grenzton der ungarischen elliptischen Frage ist hier L und passt insofern nicht zum Akzentton in der I-Topikalisierung. Das heißt jedoch nicht, dass die beiden prosodischen Muster von I-Topikalisierung und elliptischer Frage sich nicht entsprechen. Vielmehr ist der Grenzton L% anscheinend ein allgemeines Merkmal der ungarischen Frageintonation (Ladd 1996, 115-118). L% in der elliptischen Frage beeinträchtigt daher nicht die Vergleichbarkeit der beiden hier besprochenen Konturen.
148
212 /
ISS
X
•s X A
r
frfera
λ\
X\~
cju'aat...
'
04
iper.se
20D Γι.
1 es Λ —ι
\
Β (39)
r frCre
1 1
S6 ca ύ ' β i t . . .
njania
Grundfrequenzen der verschiedenen Realisierungen von Ton frere, qu 'est-ce qu 'il en pense? (M. Rossi 1999, 74)
Im Notationssystem von Pierrehumbert könnte man diese beiden in (39) akustisch beschriebenen Varianten folgendermaßen phonologisch repräsentieren: (40)
Ton frere qu'est-ce qu'il en pense? L Η* H* L* (Variante A) Η L* H* L* (Variante B)
Variante Α (mit L H* auf der topikalisierten Konstituente) ist die pragmatisch unmarkierte Form einer Frage mit Linksdislokation. Die Entität ton frere ist hier, so M. Rossi (1999, 75), als Diskursthema etabliert und es wird nach dem Prädikat qu'estce qu 'il en pense gefragt. In der Variante Β (mit Η L* auf der topikalisierten Konstituente) wird hingegen außerdem noch auf den Status von ton frere als Diskursthema angespielt, so als ob man fragte: ton frere, on parle bien de ton frere? Hierzu sagt M. Rossi (1999, 75): «En realite la topicalisation par ΧΨ [= Intonation der Variante B, RW] [...] annonce une sorte de reponse ä une question implicite, ou plus exactement est l'indice d'une question que l'allocutaire aimerait bien voir posee sur l'objet explicite du debat [...].[L]a solution pour ['interpretation de Χ Φ : cet intoneme est une copie de Γ intonation de question; le contour raelodique de Χ Ψ est le meme que celui que Ton trouve sur la question introduite par et dans Et ton frere, par exemple».
Mit anderen Worten, die Variante Β ist prosodisches Indiz einer I-Topikalisierung! (Der Begriff I-Topikalisierung fallt bei Rossi allerdings nicht, und er macht auch keine Verbindung zu anderen Sprachen.) Der Sprecher tut so, als ob nach dem Thema, was er selbst in seine Äußerung einbringt, schon gefragt wäre: «une question que l'allocutaire aimerait bien voir posee». Markiert wird dies dadurch, dass diese
149
Intonation eine «copie de l'intonation de question» ist, und zwar der elliptischen Frage («la question introduite par et dans Et ton frere»), Natürlich gibt es auch im Französischen I-Topikalisierung in Deklarativsätzen. So nennt M. Rossi (1999, 75) das Beispiel (41)
«Votre fils, il ne les fait pas, ses devoirs»
Hier hat die Nominalphrase votre fils die gleiche intonatorische Markierung wie ton frere in der Variante Α von Beispiel (40), und der inhaltliche Effekt ist analog. Von den Beispielen für I-Topikalisierung in anderen Sprachen unterscheidet sich dies funktional nicht, nur formal: Der Akzentton ist nicht L*+H, sondern Η L*. Auch im Französischen kann also die Abtönungsfunktion «Evozieren einer Fragesituation» mit demselben - prosodischen - Signifiant ausgedrückt werden wie die elliptische Frage. In allen hier betrachteten Sprachen - Deutsch, Französisch, Ungarisch - ist somit die prosodische Form der Abtönungsfunktion «Evozieren einer Fragesituation» jeweils die gleiche wie die der elliptischen Frage, auch wenn im Vergleich der Sprachen untereinander diese Form nicht gleich ist. Folgt man der Verallgemeinerung Bolingers (1978, 503), nach der die elliptische Frage meistens aufsteigend verläuft, so scheint Französisch der markierte Fall zu sein. Insgesamt ist damit belegt, dass Prosodie analog zu Partikeln oder anderen segmentalen Formen abtönend wirken kann. Von vielleicht nicht nur anekdotischem Wert mag schließlich die folgende Beobachtung sein: Das Wort «Abtönung» ist terminologisch der Domäne des Akustischen entnommen und damit eine Metapher. Die interaktionale Wirkung der Abtönungspartikeln wurde in der frühen Forschung synästhetisch mit akustischen, speziell wohl musikalischen, Phänomenen in Beziehung gesetzt. In diesem Kapitel wurde gezeigt, dass Abtönung auch selbst ein akustisches, nämlich prosodisches, Phänomen sein kann. Insofern gibt es also Formen der Abtönung, für deren Bezeichnung der Terminus gar keine Metapher ist, sondern wirklich Ab-tönung!
150
6. Rechtsversetzung im Italienischen
Als letztes Beispiel für nicht-partikelförmige Abtönung möchte ich nun die Pragmatik der «Rechtsversetzung» im Italienischen besprechen. Zwar ist in der Literatur die Pragmatik dieser Konstruktion auch im Zusammenhang mit anderen romanischen Sprachen angesprochen worden, jedoch ist das Italienische hier die bei weitem bestuntersuchte Sprache, sodass leichter an Vorarbeiten angeknüpft werden kann. A m Ende dieses Kapitels deute ich noch für eine andere syntaktische Konstruktion, französisch t 'as qu 'ä, eine Analyse als Abtönungsform an. Die Rechtsversetzung ist eine syntaktische Konstruktion, bei der eine pronominale Konstituente, oft das direkte Objekt, kataphorisch eine referenzidentische, aber nicht in die Proposition integrierte, nicht-pronominale Konstituente vorwegnimmt: (1) (2)
L'ho visto tuofratello Lo so che e arrivata
Die pronominalen direkten Objekte l' bzw. lo greifen kataphorisch vor auf die nominale Konstituente tuo fratello bzw. auf die sentenziale (satzförmige) Konstituente che e arrivato. Diese Konstruktion ist in der Sprachwissenschaft unter einer ganzen Reihe von Perspektiven untersucht worden: Rechtsversetzungen gehören zusammen mit dem spiegelbildlichen Konstruktionstyp der Linksversetzung zu den «segmentierten Sätzen». Diese sind in der Gesprochene-Sprache-Forschung als typisch für die Mündlichkeit erkannt worden (Koch/Oesterrreicher 1990, 89-96). Segmentierungen, also auch Rechtsversetzungen, sind typisch für die Mündlichkeit, weil dieser Konstruktionstyp Planänderungen bei der Formulierung zu akkommodieren vermag. Für die konzeptionelle Mündlichkeit ist kennzeichnend, dass Sprecher ihre Äußerungen erst beim Sprechen selbst (gewissermaßen in Echtzeit) syntaktisch entwerfen (planen). Wenn nun der Sprecher beim Sprechen selbst seinen Formulierungsplan ändert bzw. verfeinert, kann «segmentierte», nicht-integrierte Rede zustande kommen. In dieser Perspektive ist die Rechtsversetzung speziell als Phänomen konversationeller Reparatur («Afterthought») analysiert worden: Der Sprecher merkt erst, nachdem er das Pronomen bereits ausgesprochen hat, dass dessen Referent möglicherweise dem Hörer gar nicht klar sein könnte, und schiebt daher das referenzidentische nicht-pronominale Satzglied nach, um die Referenz des klitischen Pronomens zu vereindeutigen (cf. hierzu besonders die detaillierte Studie zum Englischen von Geluykens 1994). Die offensichtlich relativ hohe Frequenz von segmentierten Konstruktionen wie der Rechtsversetzung hat auch immer wieder die Frage aufgeworfen, ob sie wirklich eine markierte Alternative zur kanonischen Satzstellung sind oder ob nicht vielmehr die segmentierte Konstruktion, besonders in gesprochenen Varietäten, schon der
151
Normalfall ist. Wenn die zweite Alternative zutreffen sollte, wäre das klitische «Pronomen» gar kein textphorisches Element mehr, sondern ein Kongruenzmarker am Verb. Bei der Rechtsversetzung im Italienischen würde dies auf eine «Objektkonjugation» hinauslaufen. Objektkonjugation bedeutet, dass das Verb Kongruenzmerkmale mit dem direkten Objekt teilt, hier Genus und Numerus des Referenten dieses Objekts. 1 Vereinzelt ist die Rechtsversetzung auch als Abtönungsphänomen analysiert worden (Ulrich 1985, 272-284, Koch/Oesterreicher 1990, 71, Koch 1993b, 185s.). Dass die Rechtsversetzung einen besonderen pragmatischen Status hat (ohne sie jedoch in Zusammenhang mit Abtönung zu bringen), wird auch in F. Rossi (1999) diskutiert.2 Koch und Oesterreicher beziehen sich auf das Italienische, Ulrich auf das Rumänische. In dieser Perspektive ist eine bestimmte Funktion der Rechtsversetzung also nicht eine mit universalen Merkmalen der Mündlichkeit zu begründende Formulierungs-Eigenheit der gesprochenen Sprache und auch kein Vorbote einer verallgemeinerten Objektkonjugation, sondern eine spezifische eigene Konstruktion mit einer spezifischen Bedeutung. Die abtönende Funktion der Rechtsversetzung ist auch nur insoweit an die Mündlichkeit der Konstruktion gebunden, als Abtönung selbst typisch für die Mündlichkeit ist (cf. Kap. 1), nicht jedoch allein wegen des für die Mündlichkeit spezifischen Drucks zur Formulierung in Echtzeit (cf. Koch 1993b, 187). In diesem Kapitel möchte ich den abtönenden Charakter der Rechtsversetzung für das Italienische genauer untersuchen.
6.1. Der abtönende Effekt der Rechtsversetzung: Erste Annäherung Betrachten wir zunächst einige Beispiele für Rechtsversetzung im Italienischen. Ich beschränke mich hier auf Rechtsversetzungen des direkten Objekts. Es gibt jedoch keinen Grund, warum die hier entwickelten Thesen zur Rechtsversetzung nicht auch für andere Satzglieder als das direkte Objekt gelten sollten: (3)
LIPNE13 «A: come vi siete fusi? C: ma io ho conosciuto Pino Β: ahah come rhai conosciuto Pint/! C: la prima volta che l'ho conosciuto va be tanto c'a fa sta domanda e meglio ca sta domanda [risate]»
C wird hier von einem Moderator nach dem Zustandekommen ihrer Beziehung mit Pino gefragt. Die Rechtsversetzung in der Frage come l 'hai conosciuto Pino ist hier insofern sehr auffällig, als Pino im unmittelbar voraufgehenden Turn in einer Aussage mit dem gleichen propositionalen Gehalt wie die Frage selbst erwähnt wurde und daher die Referenz des klitischen Pronomens 1' in der Frage vollkommen ein1
2
Koch 1993b zeigt jedoch in einer empirischen Untersuchung, dass von einer wirklichen Objektkonjugation im Italienischen noch nicht die Rede sein kann. F. Rossi 1999 bringt insbesondere einen hervorragenden, sehr ausfuhrlichen Literaturüberblick, der auch die älteren Arbeiten würdigt.
152
deutig ist! Die Rechtsversetzung von Pino kann daher kaum als «Afterthought» motiviert sein. Ein weiteres Beispiel: (4)
LIP FA2 «C: e un altro gli ho detto? bellino a distanza di tanti mesi eh scrivi come ti ricordi come ricordi il primo giorno di scuola della prima superiore A: oddio C: ahah te lo faresti bene questol A: eh non non me lo ricordo tanto bene il primo giorno di scuola comunque lo farei C: ma dai il primo giomo se ci pensi te lo ricordi il primo giorno A: mi ricordo la XYZ C: ah B: ma quale il primo giorno di scuola? C: di quest'anno A:ahah»
In diesem Ausschnitt sind gleich drei Rechtsversetzungen anzutreffen. Symptomatisch scheint mir hier - wie auch im vorherigen Beispiel - zu sein, dass die rechtsversetzten Satzglieder sich auf «prägnante Erlebnisse» (Kennenlernen des Freundes, erster Schultag) beziehen. Ich möchte in einer ersten Annäherung die abtönende Wirkung dieser Konstruktion folgendermaßen (intuitiv) beschreiben: Der mit einem klitischen Pronomen vorweggenommene Referent wird besonders plastisch evoziert, und es wird dabei ein mit diesem Referenten verbundener Wissenshintergrund angedeutet (so ähnlich wie wenn dazugesagt würde «du weißt schon was ich meine», oder auch als ob der Sprecher es sich nicht nehmen lassen wollte, den eigentlich schon durch das Pronomen identifizierten Referenten noch einmal mit seiner vollen Bezeichnung evozieren zu dürfen). In den Beispielen (3) und (4) werden so Pino und der erste Schultag als Diskursreferenten besonders aufwändig «ausgeleuchtet». Ich versuche im weiteren Verlauf dieses Kapitels, diese Intuition zu explizieren und in Auseinandersetzung mit der Forschung zu plausibilisieren.
6.2. Rechtsversetzung vs. Linksversetzung Der Begriff Rechtsversetzung lädt zunächst dazu ein, diese Konstruktion mit ihrem scheinbar symmetrischen Gegenpart, der Linksversetzung, zu vergleichen: (5) (6)
Pino, Γ ho conosciuto l'anno scorso. L'ho conosciuto l'anno scorso, Pino.
Die Konstruktionen haben die doppelte Repräsentation des direkten Objekts durch ein klitisches Pronomen /' und ein referenzidentisches Substantiv {Pino) gemeinsam. Sie unterscheiden sich ausdrucksseitig nur dadurch, dass bei Linksversetzung das Substantiv links des Kernsatzes genannt wird, bei Rechtsversetzung hingegen rechts dieses Kernsatzes. Auch inhaltlich haben die Konstruktionen einiges gemein. Während das direkte Objekt in einem nicht-segmentierten Satz nämlich in einer Fokusposition steht (also rhematisch ist):
153
(7a) (7b)
Ho conosciuto Pino l'anno scorso. Ho conosciuto Pino.
ist es sowohl bei Links- als auch bei Rechtsversetzung thematisch (cf. Bossong 1981). Die Rechtsversetzung ist somit eines der syntaktischen Verfahren zur Veränderung des informationsstrukturellen Status von Satzgliedern. Ein anderes dieser Verfahren ist z.B. die Cleft-Konstruktion: (8)
Ε Pino che ho conosciuto l'anno scorso.
Diese Konstruktion hat die Wirkung, den fokalen Status des direkten Objekts noch zu verstärken (konstrastive Rhematisierung). Zwar sind sowohl Links- als auch Rechtsversetzung Verfahren der Thematisierung, aber nicht in gleicher Weise. Die beiden Verfahren sind nicht austauschbar. Bei beiden hat man zunächst den Eindruck, dass sie den Referenten in noch näher zu spezifizierender Weise hervorheben. Dies geschieht jedoch in völlig unterschiedlicher Weise: In ihrer Pionierstudie über Linksversetzung im Italienischen zeigen Duranti/Ochs (1979), dass der Referent des linksversetzten Satzglieds immer definit und typischerweise gegeben sind, d.h. er ist meist im Diskurs schon einmal erwähnt worden, aber nicht unmittelbar vorher. Der Referent eines linksversetzten Satzglieds ist meist nicht in den voraufgehenden ein oder zwei Sätzen erwähnt worden. Nominale und pronominale Subjekte sowie Referenten klitischer Pronomina hingegen werden im Durchschnitt häufiger im unmittelbar voraufgehenden Diskursstück erwähnt. Die linksversetzten Konstituenten stellen aber typischerweise einen Themenwechsel (topic shift) dar: Der Sprecher kehrt zu einem bereits früher besprochenen Thema zurück, oder er bringt einen zu einem bereits besprochenen Thema verwandten neuen Aspekt ein. Auf der Ebene ihrer pragmatischen Funktion sind Linksdislokationen ein häufig gebrauchtes Mittel, um das Rederecht zu erkämpfen. Ein sehr hoher Prozentsatz der Linksversetzungen sind turn-initial, und sehr häufig überlappen sie mit dem voraufgehenden Redezug, und zwar so, dass dem vorhergehenden Sprecher regelrecht ins Wort gefallen wird (Duranti/Ochs 1979, 405). Es scheint daher irgendetwas an Linksversetzungen zu geben, was sie dazu geeignet macht, das Rederecht zu erkämpfen. Zu dieser interaktionalen Funktion eignen sich Linksversetzungen aufgrund ihrer referenzsemantischen Charakteristik: «LDs [Left-Dislocations, RW] are effective means of seeking and occupying the floor because they nearly always relate to some general concern under consideration. The leftdislocated referent itself may have appeared in the prior talk and, hence, constitute an explicit legitimizer of subsequent talk [...]. Or, the left-dislocated referent is semantically linked to general concerns at hand [...]. LDs may be successful topic-shifters in part because, while shifting focus of attention, they nonetheless are semantically relevant to the prior focus of attention. Indeed, part of the beauty of LDs is that they maintain a subject as well as a focus of attention, and the referent of that subject is often part of the immediate situation or immediate discourse history [...] » (Duranti/Ochs 1979,406s.).
Die Rechtsversetzung hat demgegenüber referenzsemantisch und interaktional ein völlig anderes Profil. Was das Interaktionale betrifft, so ist relativ offensichtlich, dass Rechtsversetzungen sich nicht für «floor-begging» eignen, allein schon weil
154
das Element, um das es geht, erst am Ende der Äußerung gesagt wird. Ihre Funktion muss eine andere sein. Auf referenzsemantischer Ebene haben Rechtsversetzungen mit den Linksversetzungen gemein, dass das jeweilige Element definit ist. Sehr häufig ist das Element auch gegeben, in dem Sinne, dass der Sprecher es beim Hörer als bekannt voraussetzen kann, wie in den Beispielen (3) und (4). Ihre Diskursgeschichte scheint jedoch geradezu in komplementärem Gegensatz zu denjenigen der linksversetzten Elemente zu sein: Entweder sie sind unmittelbar vorher oder aber gar nicht erwähnt worden. Unmittelbare Vorerwähnung kann man in (3) und (4) beobachten, aber auch in den folgenden Beispielen: (9)
LIP FBI «B: mh be mi displace perche poi e allora sarä abbastanza a sarä gente A:ahah B: scuola bene? A: si si Β: ahah la pagella non te la danno? A: eh? B: non te la danno la pagella? A: giä data»
(10)
LIP FA 10 «B: e quanto gli ho dato e i conti Pho fatto sulla base delle ricevute A: perfetto B: io se vuoi ti lascio anche le ricevute A: no ora non me le lasci le ricevute»
(11) LIPRA3 «D: pero eh posso di na cosa A: pero solo perche cosi lavoriamo su un altro testo e venite con gli studenti se ne avete voglia perche ci sarebbe tempo eh Anna sicuramente dirä di no pero sarebbe un modo di farvi entrare in un lavoro sia Ugo che magari non lo fa con gli studenti perö lo fa questo lavoro» In den folgenden Beispielen hingegen ist das rechtsversetzte Element in dem jeweils transkribierten Diskursabschnitt überhaupt nicht vorher erwähnt worden: (12)
LIPRC10 «A: capisco che lei non ce spero che questo problema le si risolva presto ecco questo lo dico proprio per lei B: solo che lei forse pensa che uno quando studia che ha una certa diciamo tranquillitä psicologica tutto riesce A: ma io ho l'impressione veramente se devo dire la verita che lei non abbia capito come si studia ma un po' questo e il solito discorso che voi fate questo cioe di avere delle idee generali molto vaghe di non ricontrollare bene il testo cioe il problema grosso e di non saper leggere questa e la veritä e io ho l'impressione che lei non sappia leggere questo proprio glielo dico al di la del fatto che adesso lei ora e turbata eccetera quindi ο non me lo fa il secondo anno ο lo fa in modo tutto diverso perche se no lei parte molto male capito cosa voglio dire? cioe eh dovrebbe prendere cioe lei non sa leggere bene un testo da una parte ha delle idee generali che ha letto una storia che ha studiato e dall'altra parte c'e un testo che non verifica quello che lei ha ha di cose generali e questo mi dis e questo e quello che io non voglio tanto allora queste cose ve le ho dette mille volte mentre facevo [Unterbrechung]»
155
(13)
LIPNB61
«Α: chi e? Β: chi puö essere? sono XYZ A: uhe XYZ come stai? B: non c'e male A: che mi dici allora? B: comunque /'abbiamo vinto il concorso ahah A: ah brava brava»
Im Ausschnitt (12) ist der Referent secondo anno den Gesprächspartnern sicherlich bekannt, aber er ist dem Gespräch selbst nicht erwähnt worden. Beim Ausschnitt (13) kann man davon ausgehen, dass Α erwartete, das Β von dem Auswahlverfahren (concorso) berichten würde (und insofern kann der concorso als gegeben betrachtet werden), aber in dem Gespräch selbst ist hiervon keine Rede gewesen. Der folgende Ausschnitt ist einem Telefongespräch entnommen. Der Bart {barba) ist zwischen Α und Β in dem schon länger andauernden Gespräch nicht vorerwähnt worden und insofern auch nicht als Diskurseferent «gegeben». Α leitet damit einen Themenwechsel ein: (14) LIPRB1 «A: che dici me la faccio la barba? Β: si A: non e lunga? B: fattela»
Die Nicht-Vorerwähnung von Referenten gilt natürlich auch (typischerweise trivial) für satzformige direkte Objekte, die insbesondere beim Verb sapere extrem oft rechtsversetzt werden (cf. auch D'Achille 1990, 112s.): (15)
LIPRJB2
«A: senti se ci vai poi fammi sapere perche eh non so mi devo iscrivere anch'io B: ah ah A: anche se tu adesso lo sai che a questo punto sarai ben messa perche cominciare a mettersi in graduatoria con l'abilitazione significa che tu cominci a lavorare seriamente».
Schon in der frühen Forschung zur italienischen Rechtsversetzung (Meriggi 1938 und Goossen 1954) wurde erkannt, dass die Rechtsversetzung eine besondere pragmatische Note hat. Ihre Funktion erschöpft sich nicht in der mit der pronominalen Wiederaufnahme verbundenen Thematisierung des segmentierten Satzglieds - sie ist nicht einfach ein Spiegelbild zur Linksversetzung. Gossen (1954, 105) weist darauf hin, dass Fragen mit rechtsversetztem direkten Objekt wie me lo fate un piacere? «leicht verstärkt, jedenfalls gefühlsbetonter, oft gemütvoller» werden. Die frühen Autoren weisen auch schon darauf hin, dass der Referent des rechtsversetzten Satzglieds bekannt oder auch nur in dem jeweiligen Frame inferierbar sein muss: «A [der Referent des rechtsversetzten Satzglieds] muß aber nicht unbedingt im Gespräch schon gefallen sein, es kann sich auch lediglich um einen zwangsläufigen, im Zusammenhang selbstverständlichen Begriff handeln» (Gossen 1954, 102). Thematizität heißt bei Links- und Rechtsversetzung also nicht das gleiche. Während das linksversetzte Satzglied in dem Sinne thematisch ist, dass ein bereits früher gefallenes bzw. inferierbares Element erneut zum Diskursthema gemacht wird, ver-
156
hält es sich bei der Rechtsversetzung etwas anders. Mit rechtsversetzten Satzgliedern werden nicht Diskursthemen «befördert» oder «abgewählt». Sie sind in dem jeweiligen Zusammenhang typischerweise schon präsent. Oft werden sie in kurzen Abständen wiederholt, wie oben im Beispiel (4) il primo giorno. F. Rossi (1999) untersucht die Rechtsversetzungen u.a. im Film Ladri di bicicletta (Vittorio De Sica, 1948). Das am häufigsten rechtsversetzte Satzglied in diesem Film ist ausgerechnet bicicletta. Sie bilden somit eine Art «basso continuo» des Gesprächs: «[SJebbene sullo sfondo e spesso (ma non sempre) giä dato, l'elemento dislocato a destra ha un'importanza fondamentale: quella di marcare un forte legame tra parlante e interlocutore (camaraderie) e, in certi casi, quella di sottolineare I'orizzonte tematico di riferimento (anche se l'elemento dislocato a destra non e un topic, svolge tuttavia solitamente la funzione di tema dell'enunciato). II fenomeno e reso esplicito dall'uso della DD [dislocazione a destra, RW] fatto in Ladri. II sostantivo piü dislocato e bicicletta [...], vero Leitmotiv [...] di tutto il film» (F. Rossi 1999, 186, Hervorhebungen im Original).
Der interaktionalen Funktion der Rechtsversetzung werden wir uns im folgenden Abschnitt zuwenden.
6.3. Der Abtönungseffekt der Rechtsversetzung Um die pragmatische Nuance der Rechtsversetzung zu charakterisieren, vergleicht F. Rossi (1999, 186s.) sie mit der entsprechenden Variante ohne pronominale Vorwegnahme. In dem von ihm untersuchten Film Nata ieri (1951) kommt ein Angestellter einige Minuten zu spät zur Verabredung mit seinem Chef. Dieser fragt ihn wutentbrannt «Non lo sai che ora e? ». Rossi bemerkt hierzu: «[L]a domanda [...] e senza dubbio pragmaticamente piü felice di . Sopratutto con l'aiuto dell'intonazione (e anche, naturalmente, facendo riferimento alia situazione extralinguistica: espressione furente del padrone, conoscenza del pessimo carattere di quest'ultimo, consapevolezza del ritardo ecc.), ma anche grazie alia spia pragmatica (e solo superficialmente morfosintattica) della catafora pronominale, l'interlocutore e in grado di interpretare correttamente il senso dell'enunciato: mentre alia seconda domanda si potrebbe rispondere