199 97 35MB
German Pages 338 [336] Year 2007
Christoph Gabriel
Fokus im Spannungsfeld von Phonologie und Syntax
Editionen der Iberoamericana Ediciones de Iberoamericana Serie A: Literaturgeschichte und -kritik / Historia y Crítica de la Literatura Serie B: Sprachwissenschaft / Lingüística Serie C: Geschichte und Gesellschaft / Historia y Sociedad Serie D: Bibliographien / Bibliografías
Herausgegeben von / Editado por: Mechthild Albert, Walther L. Bernecker, Frauke Gewecke, Jürgen M. Meisel, Klaus Meyer-Minnemann, Katharina Niemeyer B: Sprachwissenschaft / Lingüística, 7
Christoph Gabriel
Fokus im Spannungsfeld von Phonologie und Syntax Eine Studie zum Spanischen
Vervuert Verlag • Frankfurt am Main
2007
Gedruckt mit Unterstützung des Förderungsund Beihilfefonds Wissenschaft der VG Wort.
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar ISBN (Vervuert) 978-3-86527-357-4 D.P.L:B-46319-2007 © Vervuert Verlag, 2007 Wielandstr. 40 - D-60318 Frankfurt am Main info @ iberoamericanalibros.com www.ibero-americana.net Alle Rechte vorbehalten Die vorliegende Arbeit wurde als Habilitationsschrift am 19. September 2005 eingereicht beim Fachbereich 7 (Sprach- und Literaturwissenschaft) der Universität Osnabrück. Umschlagentwurf: Michael Ackermann unter Verwendung einer Fotografie von Alberto Bruni Gedruckt auf säure- und chlorfreiem, alterungsbeständigem Papier gemäß ISO-Norm 9706 Printed in Cargraphics
Inhaltsverzeichnis
Abkürzungen Vorbemerkungen
7 11
1. Einleitung 1.1 Themenstellung und Ziel 1.2 Kapitelüberblick
13 13 17
2. Grundlagen 2.1 Informationsstruktur 2.1.1 Thema und Rhema 2.1.2 topic und comment 2.1.3 Fokus-Hintergrund-Gliederung, Fokustypen und Fokusprojektion 2.1.4 Zusammenfassung 2.2 Fokusmarkierung 2.2.1 Verfahren der Fokusmarkierung 2.2.2 Fokusmarkierung im Spanischen 2.2.3 Fokusmarkierung im Französischen und im Italienischen. 2.2.4 Zusammenfassung
19 19 20 23
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung 3.1 Zur neueren derivationellen Syntaxtheorie: Das Minimalistische Programm und die Linke Peripherie 3.1.1 Das feature checking-ModeW (Chomsky 1995) 3.1.2 Das Sonde-Ziel-Modell 3.1.2.1 Kongruenz und Bewegung 3.1.2.2 Agree und phrasale Bewegungen 3.1.2.3 Kopfbewegungen 3.1.2.4 Phasen 3.1.3 Split-C und die Linke Satzperipherie 3.1.3.1 Rizzi (1997) und Weiterentwicklung 3.1.3.2 Split-C im Spanischen
31 53 54 54 64 73 82 85 88 88 98 99 105 116 126 130 131 149
6 3.1.4 EPP, Verbbewegung, Klitika und die zugrunde liegende Wortstellung des Spanischen 3.1.5 FHG-induzierte Wortstellungseffekte als O-Syntax 3.1.6 Zusammenfassung 3.2 Intonation 3.2.1 Das Autosegmental-Metrische Modell 3.2.2 Anwendung auf das Spanische 3.2.3 Zur diatopischen Variation in der spanischen Intonation .. 3.2.4 Italienische und französische Intonation im AM-Modell.. 3.2.5 Zusammenfassung 3.3 Optimalitätstheorie 3.3.1 Die Syntax-Prosodie-Schnittstelle in OT 3.3.2 Zur Modellierung von Sprachvariation in OT 3.4 Modellbildung: Minimalistische OT
159 167 174 175 177 187 202 216 227 228 236 247 253
4. Datenerhebung, Analyse und Modellierung 4.1 Versuchsdesign 4.2 Versuchspersonen 4.3 Auswahl, Quantifizierung und Modellierung der Daten 4.3.1 FHG bei neutraler Wortstellung: Enger vs. weiter Fokus.. 4.3.2 Kontrastiv fokussierte Konstituenten 4.3.3 Fokussierte Subjekte 4.3.4 Fokussierte direkte Objekte in Doppelobjektkonstruktionen 4.4 Spanisch, Französisch und Italienisch kontrastiv
257 257 269 272 274 282 289
5. Schlusswort und Ausblick
301
6. Bibliografie
307
7. Anhang 7.1 Stimuli der experimentellen Datenerhebung Französisch und Italienisch 7.2 Vorlesetext und Transkripte Spanisch
325
294 296
325 333
Abkürzungen
»
0 * ? ?? CT (ö AKT AKK AM anim A Adv AP
ar. az. C(P)
CL (S/0/d0/i0) CLLD
D, DP def
' d o m i n i e r t ' (z.B. CONSTRAINT A » CONSTRAINT B 'A dominiert
B') Nullsuffix, leeres Segment ungrammatisch markiert, marginal stark markiert, äußerst marginal Silbe (kleinste prosodische Gliederungsebene) Phonologisches Wort (prosodische Gliederungsebene oberhalb von Silbe (c) und Fuß (F)) Aktiv Akkusativ Autosegmental-Metrisch(es Modell der Intonationsphonologie) Merkmal [±belebt] Adjektiv Adverb 1. Akzentphrase (prosodische Gliederungsebene oberhalb des Phonologischen Worts (co) im Modell von Jun/Fougeron 2000, 2002) 2. Adjektivphrase, maximale Projektion des lexikalischen Kopfes A Argentinisches Spanisch (im Sinne des für die Region Buenos Aires typischen porfeno-Dialekts) Azeri, Aserbaidschanisch engl. complementizer (' Komplementierer', subordinierende Konjunktion), funktionaler Kopf in der erweiterten Projektion des Verbs bzw. dessen maximale Projektion engl, clitic ('Klitikon'), ggf. spezifiziert als Subjekt- oder (direktes oder indirektes) Objektklitikon engl, clitic left dislocation (Linksdislokation mit resumptivem, d.h. die an den linken Satzrand versetzte Konstituente wiederaufnehmendem Klitikon) Determinant, Determinansphrase (referenzielle Nominalphrase) Merkmal [±definit]
8
dekl dO dt. Expl f, F F
FHG Fin(P)
finn. flor. FOC Foc
FocP Force(P)
fr. gäl. H H H%, %H H* inh
Merkmal [±deklarativ] direktes Objekt Deutsch Expletivum Genus femininum (als Merkmal bzw. in morphologischen Glossaren) 1. diakritisches Zeichen zum Anzeigen der Fokusdomäne; steht bei indizierter Klammerung tiefgestellt außerhalb der Klammern (F[. . ,]F) 2. formales Merkmal für Informationsfokus; steht bei indizierter Klammerung tiefgestellt direkt beim merkmaltragenden Kopf innerhalb der Klammern ([ F ...]) 3. Fuß (prosodische Gliederungsebene oberhalb der Silbe (a) und unterhalb des Prosodischen Worts (co)) Fokus-Hintergrund-Gliederung Funktionaler Kopf der Linken Satzperipherie, der Finitheitsmerkmale kodiert und beispielsweise durch präpositionale Komplementierer wie it. di overt realisiert werden kann, bzw. dessen maximale Projektion (vgl. Rizzi 1997) Finnisch Florentinisch Fokuspartikel/-morphem 1. formales Merkmal für kontrastiven Fokus; steht bei indizierter Klammerung tiefgestellt direkt beim merkmaltragenden Kopf innerhalb der Klammern ([ F o c ...]) 2. Funktionaler Kopf der Linken Satzperipherie, in dessen Spezifikator kontrastiv fokussierte Konstituenten bewegt werden (vgl. Rizzi 1997) Fokusphrase, maximale Projektion von Foc (vgl. Rizzi 1997) Funktionaler Kopf der Linken Satzperipherie, der Merkmale des Satzmodus kodiert und beispielsweise durch Komplementierer wie sp./fr. que oder it. che realisiert sein kann, bzw. dessen maximale Projektion (vgl. Rizzi 1997) Französisch Gälisch Hochton hoher Phrasenton, d.h. intermediärer hoher Grenzton (engl. phrase accent) hoher finaler bzw. initialer Grenzton (engl, boundary tone) hoher Akzentton (engl, pitch accent) Charakterisierung eines formalen Merkmals als [±inhärent]
9 INT
int iO IP
ip it. kat. kh. kik. klat. knt. KONTR
L LL%, %L L* LI, L2 LOK
Lok m, M mx. NEG
MP nl. NOM
o OBJP
Obl
OT PASS PERF
Pers
Interrogativpartikel oder -morphem (z.B. ttü. m/; klat. -ne) Charakterisierung eines formalen Merkmals als [±interpretierbar] indirektes Objekt 1. Intonationsphrase (höchste prosodische Gliederungsebene) 2. maximale Projektion des funktionalen Kopfes I, der Merkmale für Tempus und Kongruenz kodiert (engl, inflection phrase) Intermediärphrase (engl, intermediate phrase; prosodische Gliederungsebene unterhalb der Intonationsphrase (IP)) Italienisch Katalanisch Kharia (Munda-Sprache; Indien) Kikuyu (Bantu-Sprache; Kenia, Tansania) Klassisches Latein Kantonesisch kontrastive(s) Fokuspartikel/-morphem Tiefton tiefer Phrasenton, d.h. intermediärer Grenzton (engl, phrase accent) tiefer finaler bzw. initialer Grenzton (engl, boundary tone) tiefer Akzentton (engl, pitch accent) Erstsprache, Zweitsprache (morphologischer Kasus) Lokativ Lokalkomplement oder -adjunkt Genus maskulinum (als Merkmal bzw. in morphologischen Glossaren) Mexikanisches Spanisch Negation Minimalistisches Programm Niederländisch Nominativ Objekt Objektpartizip (ttü. -En) Obliquus Optimalitätstheorie Passiv Perfekt, vollendete Vergangenheit Person
10
PhP
PI port. POSS
PPP PRO pro proExpl PRS rm. S sard. schw. Sg sp. spez SUBJP
sw. T(P)
x±def
TT%, %T T* Top(P)
tsch. ttü. V(P) Vp(n) wf.
Phonologische Phrase (prosodische Gliederungsebene oberhalb des Phonologischen Worts (co); in der Literatur oft auch durch '' symbolisiert) Plural Portugiesisch Possessivmorphem Partizip Perfekt Passiv phonetisch leeres Subjekt infiniter Sätze phonetisch leeres Subjektpronomen leeres Expletivum Präsens Romani Subjekt S ardisch Schwedisch Singular Spanisch Merkmal [±spezifisch] Subjektpartizip (ttü. -dik) Swahili funktionaler Kopf des aufgespaltenen I-Bereichs, der im Minimalistischen Modell nach Chomsky (1995) Merkmale für Tempus, Kongruenz und Subjektkasus kodiert, bzw. dessen maximale Projektion (engl, tense phrase) f±] definiter T-Kopf tonal nicht spezifizierter Phrasenton (engl, phrase accent) tonal nicht spezifizierter finaler bzw. initialer Grenzton (engl. boundary tone) tonal nicht spezifizierter Akzentton (engl, pitch accent) funktionaler Kopf des aufgespaltenen C-Bereichs, der Merkmale für Topikalität beinhaltet und in dessen Spezifikator topikalisierte Konstituenten bewegt werden, bzw. dessen maximale Projektion (vgl. Rizzi 1997) Tschechisch Türkeitürkisch Verb(alphrase) Versuchsperson(en) Wolof (westatlantische Sprache; Senegal)
Vorbemerkungen
Bei der vorliegenden Arbeit handelt es sich um eine überarbeitete und aktualisierte Fassung meiner Habilitationsschrift, die im Februar 2006 vom Fachbereich 7 (Sprach- und Literaturwissenschaft) der Universität Osnabrück als schriftliche Habilitationsleistung angenommen wurde.
Ich möchte an dieser Stelle folgenden Personen und Institutionen danken: In erster Linie gilt mein Dank der Betreuerin und Erstgutachterin, Trudel Meisenburg (Osnabrück), sowie Georg Kaiser (Konstanz), der ein weiteres Gutachten verfasst hat. Beiden verdanke ich wichtige Hinweise. Weiterhin möchte ich allen Kollegen und Kolleginnen sowie meiner Familie und allen Freunden und Bekannten, die mich während der Arbeit an der Habilitationsschrift unterstützt haben, herzlichen Dank aussprechen. Dem Förderungs- und Beihilfefonds Wissenschaft der VG Wort danke ich für die Übernahme der Druckkosten. Mein Dank gilt auch den Herausgebern für die Aufnahme in die Reihe Editionen der Iberoamericana des Vervuert-Verlags (Frankfurt).
Osnabrück und Hamburg, im Mai 2007
Christoph Gabriel
1. Einleitung
1.1 Themenstellung und Ziel Eine der wichtigsten Aufgaben von Sprache, wenn nicht sogar die wichtigste überhaupt, besteht in der Übermittlung von Information. Dies bedeutet jedoch nicht, dass all das, was ein Sprecher im Rahmen eines Satzes an Information transportiert, für den Hörer auch neu sein muss. Der Regelfall ist vielmehr, dass bekannte (oder zumindest als bekannt vorausgesetzte) Informationen, wie sie sich aus dem sprachlichen oder nicht-sprachlichen Kontext ableiten lassen, im Satz wieder aufgenommen werden und damit satzsemantisch gesehen einen 'Hintergrund' bilden, von dem sich die im entsprechenden Kontext neue Information abhebt. Diese kann nun wiederum die gegebenen Hintergrundinformationen entweder in neutraler Weise ergänzen, und zwar indem sie deren semantische Leerstellen 'auffüllt', oder sie kann Teile davon kontrastiv korrigieren bzw. hervorhebend bestätigen. Das sprachliche Material, das in dem genannten Sinne neue Information transportiert, konstituiert inhaltlich den Mitteilungsschwerpunkt eines Satzes, oder anders ausgedrückt: es steht im Fokus. So verwundert es nicht, dass eben dieses Material salienter ist als das übrige, dass ihm also auf Ausdrucksebene Prominenz zukommt. Neben der Aufteilung in Hintergrundinformation und Fokus ist es auch möglich, dass ein Teil der transportierten Information ein sog. topic konstituiert, zu dem im weiteren Verlauf der Äußerung ein Kommentar abgegeben wird (comment). Hierbei muss die kommentierte Information nicht zwangsläufig zum Hintergrund gehören, sondern sie kann durchaus ganz oder zum Teil neu sein; ebenso ist ein comment nicht unbedingt mit neuer Information gleichzusetzen. Wichtig ist, dass jeder Äußerung eine spezifische, zum Teil recht komplexe informationsstrukturelle Gliederung zukommt. Um diese zu erfassen, sind in der Literatur begriffliche Gegensatzpaare wie Thema und Rhema, topic und comment sowie Hintergrund und Fokus geprägt worden. Die systematische Beschäftigung mit Fragen der Informationsverteilung im Satz und über die Satzgrenze hinaus hatte Ihren Anfang im ersten Drittel des letzten Jahrhunderts vor allem im Umkreis der Prager Schule genommen, wo
14
Christoph Gabriel
auch der bis heute in eher funktionalistisch ausgerichteten Arbeiten dominierende Begriff der Funktionalen Satzperspektive geprägt wurde. Die informationsstrukturelle Gliederung eines Satzes hat wiederum maßgebliche Auswirkungen auf die strukturelle Organisation und äußere Form der entsprechenden Äußerung. Die Ausdrucksverfahren, die eine Einzelsprache einsetzt, um Informationsstruktur zu vermitteln, beispielsweise um sprachliches Material als Fokus zu markieren und es auf diese Weise von der Hintergrundinformation abzuheben, decken ein weites Spektrum von phonologischen über morphologische bis hin zu syntaktischen Verfahren ab. Dabei können die potenziell zur Verfügung stehenden Ausdrucksmittel miteinander kombiniert werden, und zwar je nach Sprache mit unterschiedlich starker Gewichtung und in unterschiedlichen Abhängigkeiten voneinander. Übereinzelsprachlich lässt sich feststellen, dass Fokus mit Prominenz einhergeht, d.h. dass das sprachliche Material, welches neue Information repräsentiert, in irgendeiner Weise salienter ist als dasjenige, welches die als bekannt vorausgesetzte versprachlicht. Hierbei kommt der prosodischen Prominenz eine Vorrangstellung zu, und zwar insofern als die meisten Sprachen über die Möglichkeit verfügen, in jeweils wohl definierten Bereichen eine solche Hervorhebung mit Mitteln der suprasegmentalen Phonologie zu leisten, d.h. durch die Zuweisung des (Satz-)Akzents und/oder durch die Gestaltung der prosodischen Phrasierung, deren phonetische Korrelate sich in Form von tonaler Gestalt (Tonhöhenverlauf, FO), Intensität (Lautstärke) und/ oder Dauer fassen lassen.1 Hierbei kann die lautliche Prominenz alleiniger Träger der Fokusmarkierung sein, sie kann lediglich als Nebenerscheinung syntaktischer oder morphologischer Verfahren auftreten oder es kann eine Interaktion zwischen der phonologischen und der syntaktischen Komponente vorliegen. Prosodische Prominenz geht in der Regel Hand in Hand mit bestimmten segmentalen Korrelaten, und zwar insofern, als phonologische Prozesse wie etwa Assimilationen, Gleitlautbildung oder bestimmte Sandhi-Prozesse durch die hierarchisch übergeordneten Ebenen der prosodischen Phrasierung blockiert werden können. In vielen Sprachen wird Fokus jedoch nicht primär prosodisch, sondern vorwiegend durch morphologische und/oder syntaktische Mittel markiert: Bei Ein Beispiel für den seltenen Fall einer Sprache ohne prosodische Manifestation von Fokus ist die in Senegal, Gambia und Südmarokko gesprochene westatlantische Sprache Wolof (auch: Dyolof), die nach Rialland/Robert durch „lack of any specific intonation for utterances containing a focus" charakterisiert ist (2001: 897). Fokusmarkierung wird hier durch morphologische Mittel geleistet: „One of the characteristic features of Wolof grammar is the expression of information structure in the verbal morphology" (Rialland/Robert 2001: 895). Für Beispiele vgl. Abschnitt 2.2.1 der vorliegenden Studie.
/.
Einleitung
15
morphologischer Fokusmarkierung liegen gesonderte grammatische Morpheme vor, die die informationsstrukturelle Gliederung signalisieren, etwa indem eine fokussierte Konstituente durch ein entsprechendes Affix markiert wird; nutzt die betreffende Sprache syntaktische Mittel zum Ausdruck von Informationsstruktur, dann geschieht dies oft mithilfe von bestimmten syntaktischen Bewegungsoperationen, die über den kerngrammatischen Bereich hinausgehen und die Stellungsmuster hervorbringen, welche von der jeweiligen unmarkierten ('kanonischen') Wortstellung abweichen. Grund hierfür kann zum einen sein, dass eine bestimmte syntaktische Position den informationsstrukturellen Wert der betreffenden Konstituente anzeigt und beispielsweise eine fokussierte Konstituente in diese Position bewegt werden muss, oder dass prosodisch prominente Elemente nur in bestimmten Positionen erlaubt sind und deshalb gegebenenfalls nicht in ihrer Basisposition verbleiben können. Darüber hinaus werden in zahlreichen Sprachen besondere Konstruktionen wie Dislokations- und Herausstellungsstrukturen verwendet, um eine bestimmte informationsstrukturelle Gliederung zu signalisieren. Sowohl morphologische als auch syntaktische Signalisierung von Informationsstruktur geht oft mit prosodischer Prominenz einher. Auch diesbezüglich verhalten sich die Sprachen sehr unterschiedlich. Mit der Fokus-Hintergrund-Gliederung im Spanischen konzentriere ich mich im Rahmen der vorliegenden Arbeit auf ein Thema, das in jüngerer Zeit vielfaltige Beachtung erfahren hat und das in zahlreichen Einzelstudien sowohl aus einem vorwiegend derivationell-syntaktischen Blickwinkel als auch aus Sicht der prosodischen Phonologie eingehend beleuchtet worden ist.2 Dabei stützen sich Arbeiten, die sich explizit mit der intonatorischen Seite von Fokusmarkierung befassen oder diese zumindest mit einbeziehen, weitgehend auf die Auswertung experimentell erhobener Daten. Hierbei gleichen sich die genannten Studien in Bezug auf die folgenden Aspekte: Zum ersten wird jeweils auf möglichst homogene Sprechergruppen zurückgegriffen. Zum zweiten beschränkt sich der Versuchsaufbau auf die lautliche Realisierung von vorgegebenen Strukturen in vorgegebenen Kontexten, wodurch das Auftreten von syntaktischer Variation, verbunden mit unterschiedlichen Intonationskonturen, von vornherein ausgeschlossen ist - und damit in Bezug auf die theoretische Modellierung auch keine Probleme aufwirft. Auffällig ist weiterhin die widersprüchliche Bewertung bestimmter Daten in der Literatur: So werden beispielsweise Strukturen mit einem nicht-kontrastiv fokussierten (und proAls neuere syntaktisch ausgerichtete Arbeiten sind u.a. Ordóñez (1999, 2000), Casielles Suárez (1997, 2004), Zubizarreta (1998, 1999) und Domínguez (2004a, b) zu nennen; den prosodischen Blickwinkel repräsentieren beispielsweise Garcia Lecumberri (1995), Nibert (1999, 2000), Face (2001, 2002a, 2002b), Hualde (2002a) und Cabrera Abreu / Garcia Lecumberri (2003).
16
Christoph Gabriel
sodisch hervorgehobenen) Subjekt in Initialposition (Typ: f[S]FVO) in phonologischen Arbeiten meist für grammatisch erachtet (u.a. Hualde 2002a), während syntaktisch ausgerichtete Arbeiten dazu tendieren, die Abfolge f[S]FVO auszuschließen und stattdessen gewisse fokusinduzierte Bewegungsoperationen vorherzusagen (u.a. Zubizarreta 1998, 1999). Auch die im Rahmen der Optimalitätstheorie (OT) entstandenen Arbeiten, die sich dezidiert der Fokusmarkierung im Spanischen widmen (u.a. Gutiérrez Bravo 2002a, 2002b, 2006, Samek-Lodovici 2001), stützen sich teils auf Grammatikalitätsurteile, die einer empirischen Überprüfung nicht immer standhalten. Grundsätzliches Problem vorliegender Studien ist, dass Wortstellungsvariation, wie sie in experimentell erhobenen Korpora auftritt, nicht mit einbezogen wird. Ein zentrales Anliegen der vorliegenden Arbeit besteht somit unter anderem darin, bei der Datenerhebung durch ein hinreichend flexibles Versuchsdesign diejenigen Lücken zu schließen, die in bereits vorliegenden Studien zu konstatieren sind, und für die erhobenen Daten ein Modell vorzuschlagen, welches die konstatierte Sprachvariation in angemessener Weise zu fassen imstande ist. Hierbei gilt es, zwischen zwei grundsätzlich andersartigen Typen von Variation zu unterscheiden: Einerseits beruht Sprachvariation darauf, dass in unterschiedlichen pragmatischen Kontexten verschiedene Wortstellungsmuster und Intonationskonturen adäquat sind. Die entsprechenden Wortstellungs- und Intonationsvarianten stellen demnach zwar Variation, jedoch keine wirkliche Optionalität dar, sondern vielmehr Pseudo-Optionalität im Sinne von Müller (1999, 2000, 2003), und sie lassen sich im Rahmen klassischer derivationeller oder optimalitätstheoretischer Modelle korrekt vorhersagen, wenn man pragmatisch motivierte Merkmale wie beispielsweise die den unterschiedlichem Fokustypen entsprechenden in den Berechnungsapparat mit aufnimmt (Zubizarreta 1998, Gabriel 2004b). Andererseits lässt sich ein beträchtliches Ausmaß an Sprachvariation ausmachen, bei dem es sich um im Wortsinne freie Variation (und damit um wirkliche Optionalität) handelt: Dies ist genau dann der Fall, wenn sich das Auftreten einer in den Daten konstatierten Oberflächenform kaum in eindeutiger Weise auf einen bestimmten wohl definierten Kontext festlegen und damit auch nicht im Rahmen eines traditionellen regel- oder constraint-basierten Modells korrekt vorhersagen lässt. Ebenso wenig hilfreich ist hier die Annahme unterschiedlicher Sprachregister und damit unterschiedlicher (Register- und/oder Sprecher-)Grammatiken. Vielmehr lassen sich in Bezug auf das Auftreten der konstatierten Varianten bestenfalls Näherungswerte angeben, und diese können wiederum allein aus den konkreten Vorkommensfrequenzen abgeleitet werden. Diese zweite Art von Sprachvariation entzieht sich auf den ersten Blick vollkommen jedem formalen Zugang, da sie sich weder mithilfe der Merkmale der derivationellen Ansätze (vgl. Henry 2002) noch durch bestimmte Anordnungen von optimali-
17
1. Einleitung
tätstheoretischen Beschränkungen modellieren lässt, es sei denn man verlegt sich auf den allzu einfachen Kunstgriff optionaler Merkmale oder variabel angeordneter Regeln oder Constraints. Dies wiederum birgt immer die Gefahr, das betreffende formale Modell von innen her auszuhöhlen und letztlich mit den eigenen Mitteln zu widerlegen. Die Problematik des Umgangs mit freier Variation wiegt allerdings nur so lange schwer, als man versucht, diese gewaltsam in ein Modell zu pressen, welches hierfür von seiner Konzeption her nicht genügend Flexibilität aufweist. Will man freie Variation im Rahmen einer formalen Herangehensweise nicht ausklammern, ist es unabdingbar, sich eines Ansatzes zu bedienen, für den wirkliche Optionalität keine Aporie darstellt, sondern der diese im Gegenteil als Normalfall in das Modell integriert. Wie sich zeigen wird, bietet hier die im Wesentlichen von Boersma (1999) und Boersma/Hayes (2001) konzipierte Stochastische Optimalitätstheorie einen fruchtbaren Ansatz, in den sich problemlos Aspekte der neueren minimalistischen Syntaxtheorie sowie des für die Analyse der Intonationskonturen zugrunde gelegten Autosegmental-Metrischen Modells der Intonationsphonologie (AM-Modell) integrieren lassen.
1.2 Kapitelüberblick Die vorliegende Studie gliedert sich wie folgt: In einem ersten Schritt werden zunächst die für eine Beschäftigung mit Fokusmarkierung notwendigen Grundlagen aus den Bereichen Informationsstruktur und Funktionale Satzperspektive zusammengefasst und die übereinzelsprachlich zur Markierung fokalen Materials genutzten sprachlichen Mittel exemplarisch dargestellt, bevor die Situation des Spanischen und der im Rahmen dieser Arbeit kontrastiv herangezogenen romanischen Sprachen Französisch und Italienisch charakterisiert wird (Kapitel 2: „Grundlagen"). Das folgende Kapitel 3 („Theoretischer Hintergrund, Forschungsüberblick und Modellbildung") widmet sich der Darstellung des für diese Studie gewählten theoretischen Rahmens, der sich für die Modellierung der syntaktischen Komponente auf das minimalistische Sonde-Ziel-Modell (Chomsky 2000, 2001) und bezüglich der prosodischen Aspekte der Fokusmarkierung auf das AM-Modell der Intonationsphonologie (Pierrehumbert 1980, Pierrehumbert/Beckman 1988) stützt. Beide Herangehensweisen werden im Rahmen eines stochastischen OT-Modells nach Boersma/Hayes (2001) miteinander verbunden. Dazu stelle ich die theoretischen Vorgaben der neueren minimalistischen Syntaxtheorie, des AM-Modells und der Optimalitätstheorie dar und zeige unter Rückgriff auf bereits vorliegende Arbeiten, wie sich die grundlegenden syntaktischen und prosodischen Besonderheiten des Spa-
18
Christoph Gabriel
nischen und der beiden Kontrastsprachen Italienisch und Französisch mithilfe der angeführten Modelle erfassen lassen. Der Schwerpunkt liegt hierbei jeweils auf der Modellierung der Fokusmarkierung. Im Anschluss hieran skizziere ich das Modell für die Analyse der erhobenen Daten. Zu Beginn des vierten Kapitels („Datenerhebung, Analyse und Modellierung") wird die Konzeption der für die vorliegende Studie durchgeführten experimentellen Datenerhebung motiviert. Hieran schließen sich für ausgewählte Aspekte aus dem Bereich der fokusinduzierten Wortstellungs- und Intonationsmuster jeweils Vorschläge für eine optimalitätstheoretische Modellierung an, wobei der in den erhobenen Daten konstatierten Variation durch das Einbeziehen der jeweiligen Vorkommenswerte Rechnung getragen wird. Des Weiteren wird eine Skizze für eine diesbezügliche kontrastive Analyse der drei Sprachen Spanisch, Französisch und Italienisch vorgelegt. Das abschließende Kapitel fasst die Ergebnisse der Arbeit zusammen und bietet einen kurzen Ausblick auf weitere Forschungsdesiderata.
2. Grundlagen
Im Folgenden gebe ich einen kurzen Abriss über die Entwicklung der Auseinandersetzung mit Fragen der Funktionalen Satzperspektive und der Informationsstruktur und definiere die für die vorliegende Arbeit angenommenen Grundbegriffe (Abschnitt 2.1). Anschließend gehe ich exemplarisch auf die unterschiedlichen sprachlichen Mittel ein, die in den Sprachen der Welt zur Markierung fokussierten Materials genutzt werden, bevor die Verfahren der Fokusmarkierung im Spanischen und in den beiden romanischen Kontrastsprachen Französisch und Italienisch - zunächst auf vorwiegend deskriptiver Basis - zusammenfassend dargestellt werden (Abschnitt 2.2).
2.1 Informationsstruktur Zwar lässt sich das Bewusstsein darüber, dass Sätze eine informationsstrukturelle Gliederung aufweisen, bis in die Antike zurückverfolgen - man denke an die durch die aristotelische Prädikatenlogik geprägte grundlegende Aufteilung des Satzes in Satzgegenstand (Subjekt) und Satzaussage (Prädikat) - , doch setzte eine systematische Beschäftigung mit Fragen der Informationsstruktur erst im ersten Drittel des 20. Jahrhunderts ein. Zu nennen sind hier zunächst die Arbeiten von Otto Behaghel, der im Rahmen seiner in den zwanziger Jahren des vorigen Jahrhunderts entstandenen mehrbändigen Monografie zur deutschen Syntax unter anderem auf die Interdependenzen zwischen kommunikativer Absicht und Wortstellung eingeht und dessen diesbezügliche Beobachtungen als sog. Behagheische Gesetze bekannt geworden sind. Das erste dieser Gesetze besagt, dass das geistig eng Zusammengehörige auch eng zusammengestellt wird. [ . . . ] Ein zweites machtvolles Gesetz verlangt, daß das Wichtigere später steht als das Unwichtige, dasjenige, was zuletzt noch im Ohr klingen soll (Behaghel 1932: §1426).
20
Christoph Gabriel
Damit wird zum einen erfasst, dass komplexere Konstituenten, da sie vom Hörer mit mehr Aufwand verarbeitet werden müssen, tendenziell eher weiter rechts1 stehen als weniger komplexe,2 und zum anderen, dass die alten Begriffe vor den neuen [stehen]. Es ist also ganz verfehlt, wenn immer wieder behauptet wird, voran stehe das Glied, das zuerst ins Bewußtsein trete; voran steht vielmehr das Glied, das bereits im Bewußtsein vorhanden ist. Es ergibt sich ferner, daß man den einzelnen Satz nicht für sich allein betrachten darf, sondern nur im Zusammenhang mit dem vorhergehenden (Behaghel 1932: §1426).
Sprachliches Material, das im gegebenen Kontext neue Information kodiert und damit in Bezug auf die Mitteilungsabsicht wichtiger ist, steht demnach vorzugsweise am Schluss des Satzes. Zwar nimmt Behaghel keine gesonderte Ebene an, auf der die informationsstrukturelle Gliederung eines Satzes repräsentiert ist, und er verwendet auch keine der noch zu besprechenden gängigen informationsstrukturellen Dichotomien, doch sind mit dem Bewusstsein darüber, dass Informationsstruktur und äußere Gestalt des Satzes in systematischer Weise miteinander zusammenhängen, die wesentlichen Bestandteile einer systematischen Auseinandersetzung mit Fragen der Informationsstruktur und deren sprachlicher Vermittlung deutlich in nuce angelegt. In den folgenden Unterabschnitten wird es nun darum gehen, die unterschiedlichen, für das Erfassen der Informationsstruktur entwickelten Gegensatzpaare Thema/Rhema, topic/comment oder Hintergrund/Fokus genauer zu beleuchten. 2.1.1 Thema und Rhema Etwa zeitgleich mit Behaghels Arbeiten nimmt auch im Umfeld des Prager Zirkels (Prazsky Lingvisticky Krouzek) eine intensive Auseinandersetzung mit der pragmatischen Implikation von Wortstellung ihren Anfang; der in diesem Zusammenhang von Sprachwissenschaftlern wie Vilem Mathesius, Edouard Die Redeweise, dass sich sprachliches Material, das im zeitlichen Verlauf später artikuliert wird, 'weiter rechts' befindet, ist von der Laufrichtung der Lateinschrift beeinflusst. Da in meiner Arbeit lateinisch verschriftete Sprachen im Mittelpunkt stehen, möchte ich daran festhalten und spreche entsprechend auch beim Wortanfang vom 'linken Rand'. Beispiele hierfür sind etwa koordinierte DPn, die vorzugsweise dergestalt angeordnet werden, dass die weniger komplexen vor den komplexeren stehen (z.B. sp. comprö [DP un diario] y [DP una de esas revistas de crucigramas que se venden en todos los kioscos] 'er/sie kaufte eine Zeitung und eines von diesen Rätselheften, die an allen Kiosks verkauft werden') oder auch die markierte Abfolge der internen Argumente wie in fr. Elle donne [io à son frère] [¿oie journal qu'elle a acheté au kiosque] 'Sie gibt ihrem Bruder die Zeitung, die sie am Kiosk gekauft hat'.
2. Grundlagen
21
Benes und Frantisek Danes geprägte Terminus der Funktionalen Satzperspektive (vgl. Danes et al. 1974) ist bis heute in der strukturalistisch geprägten Linguistik üblich. Ein bekanntes Beispiel für die Auseinandersetzung mit Informationsstruktur und Wortstellung im Kontext der Prager Schule stellen die Überlegungen des Anglisten Mathesius dar, der im Einklang mit Bühlers Organon-Modell annimmt, dass die kommunikative Funktion von Sätzen in der Übermittlung neuer Information besteht. Um neben der (semantischen) Bedeutungsebene eines Satzes auch die (pragmatisch bedingte) Mitteilungsabsicht des Sprechers zu erfassen, postuliert Mathesius eine informationsvermittelnde Struktur, die durch die Unterscheidung zwischen Altem und Neuem charakterisiert ist (vgl. hauptsächlich Mathesius 1915, 1939). Das für den entsprechenden informationsstrukturellen Gegensatz gebräuchliche Begriffspaar Thema/Rhema (d.h. alte vs. neue Information) wurde nach den Angaben von Danes et al. (1974) von Hermann Ammann eingeführt (vgl. Ammann 1928). Mathesius konzentriert sich auf informationsstrukturell motivierte Wortstellungsunterschiede zwischen dem Englischen und dem Tschechischen und argumentiert, dass diese daher rühren, dass die auf der angenommenen informationsvermittelnden Ebene kodierte Thema/Rhema-Gliederung in den beiden Sprachen in unterschiedlicher Weise von der Syntax abgebildet werde. Greifen wir zur Verdeutlichung eines der Beispiele von Mathesius auf: In beiden Sprachen weist ein einfacher transitiver Deklarativsatz in neutraler Lesart die Abfolge SVO auf (2-1). Dagegen erscheint ein Thematisches Subjekt, das sich vom thematischen Rest des Satzes abhebt, im Tschechischen abweichend von der Grundwortstellung in der Endposition (2-2.a), während es im englischen Äquivalent bei unveränderter Wortstellung in der kanonischen Subjektposition am Satzanfang verbleiben kann und dann anstelle einer syntaktischen Umstellung obligatorisch durch von der regulären Zuweisung des Satz- oder Nuklearakzents (engl, nuclear stress) abweichende prosodische Hervorhebung des Subjekts 3 gekennzeichnet ist (angezeigt durch Großschreibung der prominenten Silbe; 2-2.b). 4
3
4
Daneben verfügt das Englische bekanntlich auch über die Möglichkeit, Thematisches Material durch bestimmte syntaktische Konstruktionen als solches zu kennzeichnen; vgl. den sog. Spaltsatz (engl, cleft construction)-, it was father who wrote this letter. Die Prinzipien der Zuweisung des Nuklearakzents - Satzakzent bzw. Wortgruppenakzent bei nicht-satzwertigen Äußerungen - werden in Abschnitt 2.1.3 besprochen.
22
Christoph Gabriel (2-1) a.
(in neutralem Kontext) tsch. tatinek napsal tenhle Vater schrieb diesen
dop is5 Brief
(Mathesius 1975 [1961]: 8 5 )
b. engl, father wrote this letter
(ibid.)
'Der Vater hat diesen Brief geschrieben.' (2-2)
(als adäquate Antwort auf die Frage 'Wer hat diesen Brief geschrieben?') a.
tsch. [Thema tenhle
b.
diesen Brief schrieb engl. [ R h e m a M r t w K T i ™ wrote this
dopis
napia/J[Rhema
tatinek]
(ibid.) (it
Vater letter]
(ibid.)
'Diesen Brief hat [Rhema der Vater] geschrieben.'
Dass der hier exemplifizierte Kontrast - syntaktische Umstellung vs. prosodische Hervorhebung in situ - auch innerhalb der romanischen Sprachen eine Rolle spielt, wird zu zeigen sein, wenn in den Abschnitten 2.2.2 und 2.2.3 die Verfahren der Fokusmarkierung im Spanischen, Französischen und Italienischen einer genaueren Betrachtung unterzogen werden. Ohne auf die informationsstrukturell bedingten Wortstellungsunterschiede zwischen Englisch und Tschechisch weiter eingehen zu können, ist hier als zentraler Punkt festzuhalten, dass sich mit den genannten Arbeiten ein Drei-Ebenen-Modell etabliert hat, welches neben der formal-grammatischen und der semantischen eine dritte, pragmatisch motivierte Repräsentationsebene vorsieht: So nimmt u.a. Danes in seinem programmatischen Aufsatz A three-level approach to syntax (1964) zusätzlich zum „level of the grammatical structure of sentence" und „level of the semantic structure of sentence" als dritte Ebene den „level of the Organization of utterance" (Danes 1964: 225) an. Wie der Kontrast in (2-2) zeigt, ist die Art und Weise, wie die pragmatische und die formal-grammatische Ebene ineinandergreifen, einzelsprachlich bedingt, und zwar etwa dergestalt, dass die Thema/Rhema-Gliederung in manchen Sprachen vorwiegend durch die Syntax vermittelt wird (Endposition des rhematischen Subjekts im Tschechischen), während in anderen Sprachen die prosodische Gestaltung vorrangiges Korrelat der informationsstrukturellen Gliederung ist (prosodische Hervorhebung des rhematischen Subjekts in situ im Englischen).6 Allerdings wurde rasch erkannt, dass die angenommene Zweiteilung in Thema und Fremdsprachliche Beispiele werden durchgehend übersetzt, sofern es sich nicht um unmittelbare Wiederholungen oder um anderssprachige Äquivalente bzw. Varianten bereits übersetzter Strukturen handelt. Beispiele aus nicht-indoeuropäischen Sprachen werden zusätzlich morphologisch glossiert; bei Sprachen, die nicht lateinisch verschilftet sind, richte ich mich nach der in der jeweiligen Quelle verwendeten Transliteration. Der Einfluss der informationsstrukturellen Gliederung auf die intonatorische Gestaltung wird später anhand des Spanischen eingehend diskutiert; vgl. Abschnitte 2.2.2, 3.2.2 und 4.3. Zusätzlich zur prosodischen und syntaktischen Vermittlung informationsstruk-
2. Grundlagen
23
Rhema im Sinne einer Dichotomie alte vs. neue Information der potenziellen Vielgestaltigkeit informationsstruktureller Gliederung kaum ausreichend gerecht zu werden vermag. Dies führte dazu, dass parallel zur Dichotomie Thema/Rhema weitere Termini ins Spiel gebracht wurden, welche die informationsstrukturelle Gliederung anders beleuchten, sich aber zum Teil inhaltlich mit den Begriffen Thema und Rhema überschneiden und in der Forschung teilweise synonym mit diesen verwendet werden. Weiterhin wurde das Augenmerk verstärkt darauf gerichtet, dass neben der unterschiedlichen Anordnung einer begrenzten Anzahl von Satzgliedern (vgl. 2-l.a vs. 2-2.a) weitere sprachliche Mittel zum Ausdruck der Informationsstruktur dienen können: Neben komplexeren syntaktischen Konstruktionen, die, wie etwa die unterschiedlichen Rechts- und Linksdislokationsstrukturen oder der Spaltsatz, vor allem für konzeptuelle Mündlichkeit typisch sind, gerieten hier vor allem die Platzierung des Satzakzents und die Intonation genauer ins Blickfeld. 2.1.2 topic und
comment
Das zweite einflussreiche Begriffspaar, das zum Erfassen der informationsstrukturellen Ebene geprägt wurde, ist die Dichotomie topic/comment, wobei unter topic der Gegenstand einer Aussage zu verstehen ist, der den betreffenden Satz inhaltlich an den vorausgegangenen Diskurs anbindet und der im Rahmen derselben satzwertigen Äußerung durch weitere Informationen ergänzt oder kommentiert wird (comment). Die weitgehende inhaltliche Übereinstimmung mit der von der aristotelischen Prädikatenlogik begründeten logischen Einteilung in Subjekt als Satzgegenstand und Prädikat als Satzaussage ist augenfällig. Zubizarreta, die allerdings den Terminus tema als Gegenpol zu comentario und damit im Sinne von topic verwendet, schreibt hierzu: [S]e puede decir que el tema [ . . . ] es el sujeto de un predicado logico. El predicado del tema corresponde al 'comentario' (1999: 4218).
Wendet man die informationsstrukturelle Einteilung in topic und comment auf die Beispiele in (2-2) an, so fallen hierbei die Termini Thema, topic und Subjekt (im Sinne von Satzgegenstand) insofern zusammen, als sie jeweils der nominativmarkierten DP, also dem grammatischen Subjekt, entsprechen (tsch. [DP tatinek] bzw. engl. [DPfather]). Gleiches gilt für die Begriffe Rhema, comment und Prädikat ('Satzaussage'), die jeweils den restlichen Konstituenten tureller Gliederung besteht grundsätzlich die Möglichkeit der morphologischen Markierung; vgl. hierzu Abschnitt 2.2.1.
Christoph Gabriel
24
des Satzes entsprechen (tsch. [vPtenhle dopis napsal] bzw. engl. [vP wrote this letter]). Allerdings ist trotz der inhaltlichen Vergleichbarkeit von topic und Satzgegenstand nicht jede Subjekt-DP zwangsläufig als fopic-Konstituente aufzufassen. Ebenso wenig ist ein topic grundsätzlich auf vorerwähntes sprachliches Material beschränkt. Entscheidend für den Status einer Konstituente als topic ist vielmehr die Absicht des Sprechers, die hierdurch versprachlichte Entität bzw. den jeweiligen Sachverhalt als Gegenstand der Rede zu etablieren und damit die inhaltliche Anbindung an den vorherigen Diskurs zu gewährleisten. Dies kann durch den Rückverweis auf konkret im sprachlichen Kontext vorerwähntes Material erfolgen (etwa durch entsprechend gebundene Pronomina oder mithilfe des definiten Artikels), jedoch ist ausschlaggebend, dass der Hörer das als topic markierte sprachliche Material inhaltlich einem möglichen Aussagegegenstand zuordnen kann, wozu eine Verortung im außersprachlichen Kontext ausreichend ist. Die beiden Möglichkeiten der inhaltlichen Anbindung an den vorausgehenden Diskurs - konkrete Vörerwähnung im sprachlichen Kontext oder Rekonstruierbarkeit aus dem außersprachlichen Kontext - lassen sich mit Reinhart (1981) als Satz- bzw. Diskurs-fopic bezeichnen.7 Den Unterschied zwischen diesen beiden Arten von inhaltlicher Verankerung im Kontext exemplifiziert Zubizarreta anhand eines nach Reinhart (1981) konstruierten Beispiels: (2-3)
sp.
El Sr. González es un científico muy erudito, pero su originalidad deja mucho que desear (Zubizarreta 1999: 4218) 'Herr González ist ein sehr belesener Wissenschaftler, aber seine Originalität lässt doch sehr zu wünschen übrig.'
Während [ DP e/ Sr. González] aufgrund der sprachlichen Erwähnung in (2-3) ein mögliches Satz-topic darstellt, ist ein sog. Diskurs-io/n'c nicht an konkretes sprachliches Material gebunden, sondern muss lediglich aus dem jeweiligen Zusammenhang als Gegenstand der Diskussion rekonstruierbar sein. In diesem Sinne lässt sich also auch la habilidad científica del Sr. González ('die wissenschaftlichen Fähigkeiten des Herrn González') als topic von (2-3) identifizieren. Einen Sonderfall stellen die in der anglophonen Tradition als hanging topics und in der spanischsprachigen Literatur meist als tema vinculante bezeichneten Konstituenten dar, die grundsätzlich linksperipher außerhalb des Kernsatzes angesiedelt sind und fakultativ durch Floskeln wie sp. en cuanto a,
Dem entsprechen bei Reinhart die Termini engl, sentence topic bzw. discourse Zubizarreta (1999) verwendet die Begriffe tema oracional bzw. tema discursivo.
topic;
2.
25
Grundlagen
en lo que respecta a oder con respecto a (jeweils etwa 'was . . . betrifft') eingeleitet werden. 8 Die pragmatische Funktion solcher hanging topics besteht darin, dass der Sprecher hierdurch einen Wechsel des Diskursgegenstandes herbeiführt. Auch hier gilt, dass eine Anbindung an den vorherigen Diskurs aufgrund konkreter sprachlicher Vorerwähnung oder durch den Kontext gegeben sein muss: So ist in (2-4.a, b und c) davon auszugehen, dass el Sr. González entweder im vorangegangen Gespräch konkret erwähnt wurde oder dass der Sprecher zumindest annimmt, die betreffende Person sei dem Hörer als möglicher Kandidat für die zu besetzende Stelle bekannt. Die Integration der das hanging topic versprachlichenden Konstituente in den Satzrahmen kann durch ein pronominales Klitikon (2-4.a), durch ein Epitheton (2-4.b), auf rein referenzieller Basis (2-4.c) oder auch durch Zuordnung über ein inalienables Zugehörigkeitsverhältnis und damit aufgrund des Weltwissens erfolgen (2-4.d; Beispiele teilweise angelehnt an Zubizarreta 1999: 4221). (2-4) a.
b.
c.
d.
sp.
(Kontext: Gespräch über die möglichen Kandidaten für eine zu besetzende Stelle) {En cuanto al /En lo que respecta al / Con respecto al /El] Sr. González, creo que la responsable de la sucursal lo prefiere 'Was Herrn G. betrifft, glaube ich, dass die Filialleiterin ihn bevorzugt.' El Sr. González, parece que el desgraciado no tiene ningún chance 'Was Herrn G. betrifft, scheint es, dass der Unglücksmensch keine Chance hat.' El Sr. González, estoy seguro de que nadie confia en ese idiota 'Was Herrn G. betrifft, da bin ich sicher, dass sich keiner auf diesen Idioten verlässt.' (Kontext: Gespräch über Herrn González' Fahrzeuge) La bicicleta, parece que los frenos le fallan constantemente 'Was das Fahrrad betrifft, scheint es, dass die Bremsen ständig versagen.'
Dass ein hanging topic grammatisch nicht in den Kernsatz integriert ist, zeigt sich daran, dass bei der herausgestellten Konstituente jeweils die den syntaktischen Status anzeigende Präposition fehlt, so beispielsweise bei (2-4.a) die im Standardspanischen bei direkten Objekten [+anim] obligatorisch zu setzende Präposition a und im Fall von (2-4.c) die im Lexikoneintrag des Verbs festgeschriebene Präposition en. Betrachten wir nun mit den DislokationsstrukDie Frage nach der syntaktischen Modellierung dieser Konstruktionen bleibt an dieser Stelle noch ausgespart; ich verweise hierfür auf meine Ausführungen in Abschnitt 3.1.3.
Christoph Gabriel
26
turen ein weiteres syntaktisches Verfahren der íop/c-Markierung, das abweichend von den oben diskutierten Fällen keinen Wechsel des Diskursgegenstands impliziert: (2-5)
a. sp. a.' a."
Al Sr. González, la responsable de la sucursal *(lo) prefiere La responsable de la sucursal *(lo) prefiere, al Sr. González Estoy seguro que al Sr. González, la responsable de la sucursal *(lo) prefiere 'Den Herrn González, den bevorzugt die Filialleiterin.' / 'Ich bin sicher, dass die Filialleiterin ihn bevorzugt, den Herrn González.'9 b. Las manzanas, se *(las) comió María b.' Se *(las) comió María, las manzanas b." Estoy seguro de que las manzanas, se *(las) comió María 'Die Äpfel, die hat Maria aufgegessen.' / 'Ich bin sicher, dass Maria die aufgegessen hat, die Äpfel.' c. Manzanas, María 0 come todos los días c.' *María 0 come todos los días, manzanas c." Estoy seguro de que manzanas, María 0 come todos los días / * Estoy seguro de que María 0 come todos los días, manzanas 'Äpfel isst Maria jeden Tag welche.' / 'Äpfel bin ich sicher, dass Maria jeden Tag welche isst.' d. it. (Sono sicuro che) delle mele, Maria ne mangia tutti i giorni e. kat. (Estic segur de que) pomes, Maria en menja tots eis dies f. sp. (Estoy seguro de que) al teatro María 0 va todos los fines de semana 'Ich bin sicher, dass Maria da jedes Wochenende hingeht, ins Theater.' / 'Ins Theater geht Maria jedes Wochenende.' g. fr. (Je suis sûr qu')au théâtre, Marie y va tous les week-ends
Wie sich in den Beispielen (2-5 .a) zeigt, sind im Gegensatz zum Fall des hanging topic die entsprechenden präpositionalen Elemente (hier: a) obligatorisch. Weitere formale Unterschiede zwischen hanging topics und dislozierten io/Hc-Konstituenten bestehen darin, dass letztere im Gegensatz zu ersteren eingebettet vorkommen können (vgl. die spanischen Beispiele 2-5.a", b" und c" sowie die anderssprachigen Äquivalente) und zudem nicht auf den linken Satzrand beschränkt sind, sondern, wie die Varianten (2-5.a\ b' und c') zeigen, auch rechtsperipher auftreten können (vgl. auch Di Tullio 1997: 358). 10 Spanische eingebettete Linksdislokationsstrukturen können in der Übersetzung nur durch Rechtsdislokationen wiedergegeben werden, da im Deutschen keine eingebetteten Voranstellungsstrukturen möglich sind; vgl. hierzu im Einzelnen Abschnitt 3.1.3. Weitere formale Unterschiede zwischen hanging topics und dislozierten fopi'c-Konstituenten, die u.a. die Möglichkeit (bzw. - im Falle der Dislokation - die Unmöglichkeit)
2. Grundlagen
27
Die pronominale Reprise durch ein Klitikon ist immer dann zwingend, wenn im Repertoire der jeweiligen Sprache Einheiten vorliegen, die dies leisten können - daher die in der englischsprachigen Literatur übliche Bezeichnung clitic left dislocation (CLLD). Linksdislokationen ohne pronominale Reprise sind im Spanischen wegen des begrenzten Inventars pronominaler Klitika allerdings vergleichsweise häufig. Beispiele hierfür sind zum einen Konstruktionen mit linksdislozierten pluralischen DPn [-def], deren D-Position im Spanischen aufgrund des Nicht-Vorhandenseins eines Teilungsartikels grundsätzlich leer ist (2-5.c)," und zum anderen mit a eingeleitete PPn, die thematischen Rollen wie LOK oder ZIEL entsprechen (2-5.f). Im Französischen, Italienischen und Katalanischen liegen mit fr. en und y, it. ne und ci bzw. kat. en/ne und hi jeweils klitische Formen vor, die die pronominale Reprise solcher Konstituenten ermöglichen: So wird die herausgestellte indefinite Objekt-DP im italienischen und im katalanischen Äquivalent zu (2-5.c) durch it. ne bzw. kat. en aufgenommen (vgl. 2-5.d, e); im französischen Äquivalent zu (2-5.f) entspricht das Klitikon y dem linksdislozierten Lokalkomplement (vgl. 2-5.g). Wohlgemerkt kann die Versetzung topikalisierten Materials an den rechten Satzrand nur dann erfolgen, wenn die fop/c-Konstituente durch ein Klitikon wieder aufgenommen wird, während die Möglichkeit zur Linksversetzung wie in (2-5.c) auch ohne pronominale Reprise besteht. Wie Stark (1997: 37ff.) in ihrem Abriss zur Entwicklungsgeschichte des io/Ji'c-Begriffs ausführt, geht der Terminus im Sinne von „what the sentence is about" auf Hocket (1958: 201) zurück. Inhaltlich vergleichbare Termini tauchen jedoch bereits in älterer Literatur auf, so etwa bei dem im vorangegangenen Abschnitt erwähnten Vilém Mathesius, der u.a. von vychodisko (tsch. 'Basis, Anfang, Ausgangspunkt', 1939: 234) spricht, oder bei Charles Bally, der in Zusammenhang mit der Analyse segmentierter Sätze wie fr. cette lettre, je ne l'ai jamais reçue 'diesen Brief, den habe ich nie erhalten' ausführt, dass hierbei ein in Form der herausgestellten Konstituente cette lettre versprachlichtes „sujet psychologique ou thème" (1941: 36) durch ein „prédicat psychologique, le propos" inhaltlich ergänzt werde. Und auch bei Autoren des 19. Jahrhunderts wie Georg von der Gabelentz und Hermann Paul war bereits in vergleichbarer Weise explizit von einem 'psychologischen Subjekt' und einem 'psychologischen Prädikat' die Rede: Was bezweckt man nun, wenn man zu einem Anderen spricht? Man will dadurch einen Gedanken in ihm erwecken. Ich glaube, hierzu gehört ein Doppeltes: erstens,
11
der Extraktion aus Relativ-, Adverbial- oder Subjektsätzen betrifft, werden bei Zubizarreta (1999: § 64.2) ausführlich diskutiert. Zu diesen bare nouns vgl. ausführlich Casielles Suärez (2004: 81, 109ff.).
28
Christoph Gabriel dass man des Anderen Aufmerksamkeit (sein Denken) auf etwas hinleite, zweitens, dass man ihn über dieses Etwas das und das denken lasse; und ich nenne das, woran, worüber ich den Angeredeten denken lassen will, das psychologische Subjekt (von der Gabelentz 1869: 378). Das psychologische Subjekt ist die zuerst in dem Bewusstsein des Sprechenden, Denkenden vorhandene Vorstellungsmasse, an die sich eine zweite, das psychologische Prädikat anschliesst (Paul 1975 [1880J: 124).
Die meines Wissens neueste und umfangreichste Überblicksdarstellung zur Entwicklung des iop/c-Begriffs findet sich bei Casielles Suärez (2004: Kap. 2). Der Tenor der dortigen Ausführungen lässt sich dahingehend zusammenfassen, dass sich die von den unterschiedlichen Autoren gegebenen Definitionen von topic (bzw. der entsprechenden Vorläuferbegriffe) zwar in den wesentlichen Punkten gleichen, dass sich aber bei den einzelnen 'Vorläufern' oft nicht eindeutig sagen lässt, ob es sich tatsächlich um Vorgänger des topicoder vielmehr des im vorangegangenen Abschnitt diskutierten ThemaBegriffs handelt. Auch Casielles Suärez selbst nimmt keine grundsätzliche Unterscheidung vor und handelt die Begriffe topic und theme von Anfang an gemeinsam ab. Meinunger (2000: 15) geht kurz auf die Thema-Rhema-Gliederung ein, verzichtet im weiteren Verlauf seiner Untersuchung zu den syntaktischen Korrelaten der topic/comment-Gliederung im Deutschen aber ganz auf den Thema-Begriff. Di Tullio (1997: 362f., 370f.) wiederum unterscheidet zwar zwischen tema und töpico, jedoch in der Weise, dass thematisches Material genau (und nur) dann als töpico bezeichnet wird, wenn es durch eine besondere syntaktische Konstruktion als solches markiert wird, was wiederum der von Gundel (1988: 210f.) vorgeschlagenen Unterscheidung zwischen pragmatic topic und syntactic topic entspricht.12 Demnach wäre etwa das Subjekt des Satzes (2-3), hier wiederholt als (2-6.a), als tema aufzufassen, während beispielsweise die linksversetzten Objekte in (2-6.b und c) jeweils als töpico analysiert werden müssten.
Vgl. die folgenden Passagen: „No existe coincidencia en la definición de términos como tema, rema, foco y tópico. Las definiciones se solapan e incluso se contradicen. [ . . . ] tratamos tópico y foco como variantes marcadas de tema y rema, respectivamente" (Di Tullio 1997: 370f.). „An expression which refers to the topic and which occupies a syntactic position for topics will be referred to as a syntactic topic [ . . . ] . While syntactic topics always refer to pragmatic topics [ . . . ] , a pragmatic topic is not always encoded as a syntactic topic" (Gundel 1988: 211).
2. Grundlagen
(2-6)
29
a. sp.
[telIia El Sr. González] es un científico muy erudito
b.
[tópico^ Juan] lo vi anoche
en el cine
(Di T u l l i o 1997: 3 6 2 )
' J u a n , den h a b e ich gestern A b e n d im K i n o gesehen.'
b. ar.
[tópico^ esta plaza] la cuidan Aerolíneas Argentinas y usted ' U m diesen Platz k ü m m e r n sich A e r o l í n e a s A r g e n t i n a s und Sie.'
In einer solchen Sichtweise müsste weiterhin unterschieden werden zwischen 'bloßen' thematischen Subjekten wie in (2-6.a = 2-7.b) und solchen, die zusätzlich zu ihrem Status als Thema durch Herausstellung als tópico ausgewiesen sind (2-7.b). Da hierbei jedoch anders als bei linksversetzten Objekten wegen des fehlenden Subjektklitikons im Spanischen keine pronominale Reprise möglich ist, lässt sich die Subjekttopikalisierung nicht an der Oberflächensyntax, sondern nur anhand der prosodischen Gliederung festmachen. 13 Ich nehme an, dass die linksversetzte Subjektkonstituente eine eigene Intonationsphrase (IP) bildet, die durch einen hohen finalen Grenzton H% abgeschlossen wird.14 Anders dagegen liegt der Fall, wenn außer dem Subjekt noch eine weitere Konstituente durch Linksversetzung topikalisiert ist, wie beispielsweise das Lokaladjunkt en el kiosco in (2-7.c), das zwischen Subjekt und Kernsatz interveniert und damit die kernsatzexterne Position des Subjekts auch in der syntaktischen Oberflächenstruktur deutlich macht. Aus diesem
Im Französischen hingegen werden linksdislozierte Subjekte im Kernsatz durch entsprechende Subjektklitika aufgenommen, weshalb sie auch oberflächensyntaktisch eindeutig markiert sind: (i) (Kontext: 'Was hat Marie gemacht?') fr-
[ n i c m a [topic
Marie], elle] a acheté le journal au kiosque
'Marie, die hat die Zeitung gekauft.' Die wesentlichen Begriffe des hier zugrunde gelegten Autosegmental-Metrischen (AM-)Modells werden in Abschnitt 3.2 erläutert. Bei den sog. Grenztönen, die bestimmte tonale Einheiten abschließen, wird im AM-Modell unterschieden zwischen (IP-)Grenztönen (engl, boundary tones), die Beginn und Abschluss der prosodischen Einheit der Intonationsphrase (IP) markieren ( % T bzw. T%), und (ip-)Grenztönen, die die hierarchisch tiefer angesiedelte Einheit der Intermediärphrase (ip; engl, intermediate phrase) abschließen (T-). Letztere werden - terminologisch verwirrend - in der anglophonen Literatur meist als phrase accents ('Phrasenakzente') bezeichnet, was wissenschaftsgeschichtlich begründet ist (vgl. hierzu Abschnitt 3.2). Im Beispiel (2-7.b) zeigt der angenommene hohe (IP-)Grenzton H % zum einen die ansteigende, progrediente Tonkontur an, zum anderen wird durch eine kurze Sprechpause deutlich, dass zwischen dem linksdislozierten Subjekt und dem Kernsatz eine starke prosodische Grenze besteht. Ein an derselben Position situierter intermediärer hoher (ip-)Grenzton H- entspräche einer weniger starken prosodischen Grenze (ohne Sprechpause), wie sie u.a. dann zu verzeichnen ist, wenn andere Konstituenten als das Subjekt als linksperiphere topics auftreten (vgl. Beispiel 2-7.c). Weiterhin dient intermediäre Phrasierung im Spanischen u.a. auch zur Signalisierung der informationsstrukturellen Gliederung sowie zur prosodischen Desambiguierung oberflächensyntaktischer Mehrdeutigkeiten; vgl. im Einzelnen Abschnitt 3.2.2.
30
Christoph Gabriel
Grund ist bezüglich der prosodischen Phrasierung hier ein intermediärer Grenzton ausreichend. (2-7)
a.
b.
sp.
((El Sr. González es un científico muy erudito )¡p )IP I I L- L%15 ((El Sr. González ),p )ip ((es un científico muy erudito )jP )IP II II H-H% L-L% 'Der Herr González, der ist ein sehr belesener Wissenschaftler.'
c.
(Kontext: 'Was macht Maria am Kiosk?') ((María )¡p (en el kiosco )¡p (compra el periódico I I HH'Maria, am Kiosk, da kauft sie die Zeitung.'
)¡p )n>16 II L- L% (LR16)
Bezüglich der prosodischen Gliederung von Beispiel (2-7.c) ist zu betonen, dass die Abgrenzung des linksdislozierten Materials optional auch durch einen hohen (IP-)Grenzton H%, verbunden mit einer kurzen Sprechpause, erfolgen kann. Es ergäbe sich also die folgende prosodische Gliederung: (2-7)
c.'
((María
)¡p (en el kiosco )ip )]P ((compra el periódico I H-
II H- H%
)ip )iP II L- L%
Zubizarreta (1999: 4223f.) schließlich verzichtet auf den topic-Begnff und verwendet - wie bereits zu Beginn dieses Abschnitts angemerkt - den Terminus tema als Gegenpol zu comentario. Daneben macht sie mit dem Begriffspaar foco/presuposición 'Fokus/Präsupposition' von der dritten der zentralen Dichotomien Gebrauch, die entwickelt wurden, um die pragmatische Ebene und deren potenzielle Einflüsse auf die sprachliche Gestaltung der betreffenden Äußerung zu fassen. Auf diese Gliederung der informationsstruktu-
Beim Zusammenfall eines tiefen intermediären Grenztons L- mit einem ebenfalls tiefen IP-Grenzton L% wird ersterer durch letzteren neutralisiert. Gleiches gilt für die Kombination H- H%, vgl. Abschnitt 3.2.1. Die Kürzel für Belege aus dem Korpus sind wie folgt zu lesen: NN = Namenskürzel der Vpn (zwei bis drei Großbuchstaben), Nummer des Versuchsteils bzw. der Audiodatei und des Stimulus (voneinander abgegrenzt durch Unterstrich). Der spanische Teil des Experiments wird in Kapitel 4 ausführlich dargestellt; ebenfalls findet sich dort eine zusammenfassende Darstellung der für meine Studie relevanten Ergebnisse.
2. Grundlagen
31
relien Ebene in Hintergrund und Fokus, die für die vorliegende Studie von zentraler Bedeutung ist, gilt es im Folgenden genauer einzugehen. 2.1.3 Fokus-Hintergrund-Gliederung, Fokustypen und Fokusprojektion Ebenso wie die Begriffe Thema und topic bzw. Rhema und comment in der Literatur teils synonym, teils voneinander abweichend verwendet werden, ist die im Folgenden zu besprechende Fokus-Hintergrund-Gliederung (FHG) zwar nicht identisch mit den durch die bereits besprochenen Begriffspaare geleisteten Systematisierungen der informationsstrukturellen Ebene, doch ergeben sich auch hier gewisse inhaltliche Überschneidungen. So bezeichnet beispielsweise Di Tullio - parallel zu ihrer Verwendung der Begriffe Thema und topic (vgl. den letzten Abschnitt, Anm. 10) - sprachliches Material, das neue Information transportiert, dann als rema, wenn es sich in der kanonischen Endposition des Satzes befindet und verwendet den Terminus foco genau (und nur) dann, wenn die betreffende Konstituente in einer hiervon abweichenden syntaktischen Position erscheint und darüber hinaus prosodisch besonders hervorgehoben ist: El rema [ . . . ] aporta información nueva. Típicamente está al final de la oración, en cuyo caso no recibe necesariamente un énfasis particular. En cambio, si no ocupa tal posición - es decir, si aparece en la parte reservada canónicamente a la información dada está obligatoriamente destacado mediante recursos enfáticos - prosódicos y sintácticos: es el foco (Di Tullio 1997: 359; Hervorhebung im Original).
Wie bereits im vergangenen Abschnitt betont, muss bei der Auseinandersetzung mit Fragen der Informationsstruktur grundsätzlich unterschieden werden zwischen einer abstrakten Repräsentationsebene, auf der die informationsstrukturelle Gliederung kodiert ist, und den jeweiligen Korrelaten auf der Ausdrucksebene. Dass dies auch für die FHG Gültigkeit hat, ist einleuchtend. Da im Zentrum der vorliegenden Studie die Vermittlung der FHG insbesondere in spanischen Deklarativsätzen steht, konzentriere ich mich im weiteren Verlauf dieses Abschnitts auf die hierfür notwendigen Grundlagen und stelle anschließend hieran im folgenden Abschnitt (2.2) die entsprechenden sprachlichen Ausdrucksmittel zusammenfassend dar. Die Einführung der allgemeinen Grundlagen erfolgt zunächst beispielhaft anhand des Deutschen. Die FHG eines Deklarativsatzes lässt sich mithilfe einer entsprechenden Wh-Frage veranschaulichen, auf die der betreffende Satz eine angemessene Antwort bildet. Betrachten wir hierzu zunächst einige deutsche Aussagesätze, die in Bezug auf die Wortstellung identisch sind, sich aber sowohl informati-
32
Christoph
Gabriel
onsstrukturell als auch prosodisch unterscheiden. D i e Lokalisierung des Satzoder Nuklearakzents ist durch Großschreibung der jeweils prominenten Silbe gekennzeichnet; der auf der Satzakzentstelle realisierte fokale Akzentton des Deutschen wird im Einklang mit Uhmann (1991: 248f.), von Stechow (1991: 806) und Fery (1993: 129) als (spät) fallender Ton H*L (engl, late fall) symbolisiert. 17 (2-8) a.
dt.
(Kontext: 'Was gibt es zu berichten?') Maria hat die ZEltung gekauft I H*L (Kontext: 'Was hat Maria gemacht?')
b.
Maria hat die ZEltung gekauft (Kontext: 'Was hat Maria gekauft?')
c.
Maria hat die ZEltung gekauft
d.
(Kontext: 'Wer hat die Zeitung gekauft?') MaRIa hat die Zeitung gekauft I H*L
Während sich die als mögliche Antworten auf die Fragen in (2-8.a, b und c) angeführten Deklarativsätze weder syntaktisch noch in Bezug auf die Satzakzentstelle voneinander unterscheiden, fällt bei (2-8.d) die hiervon abweichende Positionierung des Satzakzents auf. Artikuliert ein Sprecher den Satz in dieser Weise, nämlich mit einem prosodisch hervorgehobenen Subjekt in Initialposition, impliziert dies, dass er die folgenden Informationen als dem Hörer bekannt voraussetzt: (2-9)
17
18
a. Es gibt eine Person x. b. x hat eine Handlung ausgeführt, nämlich den Kauf eines Objekts y. c. y ist eine (bestimmte) 18 Zeitung.
Die Zuweisung des Satzakzents an eine bestimmte Konstituente bzw. Silbe erfolgt nach einzelsprachlich determinierten Prinzipien, die weiter unten genauer besprochen werden; welche Silbe innerhalb der betreffenden Konstituente die prominenteste ist, obliegt im Deutschen der im Lexikon festgeschriebenen Akzentstelle im prosodischen Wort. Für Genaueres zur tonalen Gestalt des Deutschen, zum Repertoire anzunehmender Akzenttöne und zu deren Oberflächenrealisierung vgl. u.a. Uhmann (1991), Fery (1993), Grabe (1998) und Grice/Baumann (2002: 271-274). Der Kontext legt die spezifische Lesart des definiten Artikels in [DP die Zeitung] nahe; eine generische Interpretation (im Sinne von 'Zeitungen als solche') scheidet hingegen aus. Eine nicht-spezifische Lesart scheint jedoch durchaus möglich zu sein; vgl. Wendungen wie (die) Zeitung lesen, wo die (optionale) Verwendung des bestimmten Artikels nicht unbedingt eine spezifische Interpretation erzwingt. Bezüglich einer solchen
2. Grundlagen
33
Die informationsstrukturelle Gliederung von (2-8.d) MaRla hat die Zeitung gekauft lässt sich nun wie folgt charakterisieren: Die Gesamtheit der in (2-9) angeführten Informationen entspricht den (mutmaßlich) gemeinsamen Annahmen von Sprecher und Hörer und bildet die Präsupposition, also den Hintergrund, von dem sich neue Information abhebt. Derjenige Anteil der Information, der die in der Präsupposition offene Variable x auflöst und damit die fehlende Information ergänzt, wird als Fokus bezeichnet (hier: 'Maria'); die Gesamtheit der Konstituenten, die diesem auf Ausdrucksebene entsprechen, bilden die Fokusdomäne. Diese ist im konkreten Beispiel auf die Subjekt-Konstituente [DP Maria] beschränkt. In der entsprechenden Wh-Frage (hier: 'Wer hat die Zeitung gekauft?') korreliert der Fokus mit dem Wh-Wort wer. Betrachten wir nun, wie sich die informationsstrukturelle Gliederung der Beispiele in (2-8) formalisieren lässt. Aus Gründen der Anschaulichkeit werden die entsprechenden Deklarativsätze wiederholt und mit der die Entsprechungen der FHG anzeigenden Klammerung versehen. Die Domäne des Fokus ist hierbei durch den (rechts und links der Klammern) subskribierten Index F angezeigt. (2-10) a.
b.
c.
d.
dt.
f[Maria hat die ZEItung gekauft]? Präsupposition: 3 x (x ist ein Ereignis) Fokus: x = Maria hat die Zeitung gekauft. Maria r[hat die ZEItung gekauft]F Präsupposition: 3 x (x ist eine Handlung, Maria hat x ausgeführt) Fokus: x (in dem Sinne, dass Maria die Handlung x ausgeführt hat) = die Zeitung gekauft Maria hat y[die ZEItung]r gekauft Präsupposition: 3x (Maria hat x gekauft) Fokus: x (in dem Sinne, dass Maria x gekauft hat) = die Zeitung hat die Zeitung gekauft f\MaR1a\f Präsupposition: 3x (x hat die Zeitung gekauft) Fokus: x (in dem Sinne, dass x die Zeitung gekauft hat) = Maria
Wie wir gesehen haben, besteht im Deutschen die Möglichkeit, die unterschiedlichen Fragen in (2-8) jeweils mit Strukturen zu beantworten, die in Bezug auf die lineare Abfolge der Satzglieder identisch sind.19 Die prosodische Gestaltung ist jedoch gewissen Modifikationen unterworfen: Sowohl im Fall nicht-spezifischen Interpretation bei (die) Zeitung kaufen gehen die Sprecherurteile vermutlich stärker auseinander. Dies kann hier jedoch nicht weiter vertieft werden. Dass auch von den angegebenen Strukturen abweichende Abfolgen möglich sind, soll hierdurch selbstverständlich nicht in Abrede gestellt werden: Ebenso wie etwa die romanischen Sprachen verfügt auch das Deutsche mit Herausstellungsstrukturen wie Links- und Rechtsdislokationen und Spaltsätze, über komplexe syntaktische Konstruk-
34
Christoph Gabriel
einer neutralen, gesamtfokalen Lesart wie in (2-10.a) (engl, whole focus reading, Satzfokus), als auch dann, wenn die Fokusdomäne entweder Verb und Objekt-DP (2-10.b) oder nur das direkte Objekt umfasst (2-10.c), fällt der Satzakzent auf das am tiefsten eingebettete Argument, also auf das Objekt [DP die ZEItung]. Wird hingegen das Subjekt fokussiert, wie es bei einer adäquaten Antwort auf Frage (2-8.d) erforderlich ist, verlagert sich der Satzakzent auf die Initialposition. Der offensichtliche Zusammenhang zwischen Fokus und Prominenz lässt sich in Form der auf Chomsky (1971) zurückgehenden Fokusprominenzregel (FPR, engl. Focus Prominence Rule) zusammenfassen, die zunächst nichts weiter besagt, als dass fokusmarkiertes Material prominenter sein muss als präsupponiertes. Die FPR wird hier in der formalisierten Version von Zubizarreta (1998) wiedergegeben, die annimmt, dass sich die Auswirkungen der informationsstrukturellen Gliederung eines Satzes auf dessen syntaktische und phonologische Gestalt unter Zuhilfenahme des pragmatisch motivierten Merkmals [F] modellieren lassen (wobei gilt: [+F] = 'Fokus', [-F] = 'Nicht-Fokus', also Präsupposition). Dabei wird angenommen, dass die einzelnen Knoten an einem bestimmten Punkt der Derivation, nämlich nach Abschluss der kernsyntaktischen Operationen (vgl. hierzu Abschnitt 3.1.5), entsprechend der jeweiligen FHG mit dem Merkmal [±F] versehen werden. Focus Prominence Rule: Given two sister nodes C, (marked [+F]) and Cj (marked [-F]), C, is more prominent than Cj (Zubizarreta 1998: 88). 20
Machen wir uns dies anhand des Beispiels mit fokussiertem Subjekt (2-8.d) p[MaRIa]p hat die Zeitung gekauft klar. Ist von zwei (syntaktischen) Schwesterknoten einer der beiden durch das Merkmal [+F] charakterisiert (hier: Cj = Subjekt [spec,cp=DP Mar/a]), dann ist das entsprechende sprachliche Material prominenter als dasjenige, welches von dem Knoten dominiert wird, welcher der Präsupposition entspricht (hier: Cj = [c hat die Zeitung gekauft]). Bei (2-8.c) ist der Fall anders gelagert: Hier ist das in der VP-internen Komplementposition basisgenerierte und in situ verbleibende Objekt [DP die Zeitung] fokusmarkiert und damit Träger des Merkmals [+F]. Der verbale Schwesterknoten [ v gekauft] hingegen ist Bestandteil der Präsupposition und damit als [-F] gekennzeichnet. Qua FPR muss also das Objekt prominenter sein als die
20
tionen, deren Gebrauch informationsstrukturell bestimmt ist (vgl. hierzu u.a. Frey 2004, 2005). Umgekehrt lässt sich hieraus schließen, dass ein prosodisch hervorgehobenes Wort fokusmarkiert ist. Selkirk (1995) formuliert dies wie folgt: „An accented word is F-marked" (555).
35
2. Grundlagen
Verbform. Betrachten wir für beide Beispiele jeweils die Darstellung im Strukturbaum.21 (2-11)
a.
C, |+F] > Satzakzent fällt auf MaRla
(= 2-10.d)
CP
Spec,CP - DP Maria (+FJ A'
C
c, I-F] IP
I +C hat
Spec.lP
A
V
Spec.VP= DP I
b.
I
VP
- J A
DP die Zeitung |-F]
-
V gekauft [-F]
(= 2 - l O . c ) CP
Spec.CP = DP Maria [-F]
A
C' i +C hat
A
IP Spcc.lP VP
-JA Spec,VP = DP I
1 Cj [-FJ
V
DP die Zeitung |+F]
gekauft [-F]
C, f+F] > Satzakzent fällt mfZEltung
Die FHG der beiden verbleibenden Beispiele aus (2-10) lässt sich erklären, wenn man mit Selkirk (1984, 1995) annimmt, dass das Fokusmerkmal [F] von der Konstituente, der es zugewiesen wird, bis hoch zum Wurzelknoten des Satzes projizieren kann. Die hier skizzierten Strukturbäume entsprechen dem traditionellen Prinzipien- und Parametermodell nach Chomsky (1981), in dessen Rahmen angenommen wird, dass die deutsche V P kopf-final parametrisiert ist und die für germanische Sprachen typischen V2-Effekte durch eine Bewegung der flektierten Verbform nach C, verbunden mit der obligatorischen Besetzung der traditionellen Vorfeldposition zu modellieren sind: Im konkreten Fall wird das hier aus Gründen der Übersichtlichkeit direkt unter I in die Struktur eingesetzte Hilfsverb hat nach C angehoben; die obligatorische Besetzung von Spec,CP erfolgt hier durch Subjektanhebung. Im weiteren Verlauf der Studie gehe ich in Bezug auf den syntaktischen Strukturaufbau von den minimalistischen Grundannahmen nach Chomsky (2000, 2001. 2004) aus, die im Einzelnen in Abschnitt 3.1 besprochen und anhand von spanischen Daten exemplifiziert werden.
36
Christoph Focus Projection (i)
Gabriel
Rules (Selkirk 1984: 2 0 7 )
F-marking of the head of a phrase licenses the F-marking of the whole phrase.
(ii) F-marking of the internal argument of a head licenses the F-marking of the head.
Die Fokusdomäne einer gegebenen Struktur lässt sich dann definieren als die Gesamtheit der Terminalen, die einem Teilbaum entsprechen, der nicht von einem weiteren F-markierten Knoten dominiert wird; vgl. auch Szendröi (2004), die wie folgt formuliert: „Interpret the largest [+F]-marked constituent as focus" (239). Ich exemplifiziere nun das Prinzip der Fokusprojektion gemäß den Fokusprojektionsregeln (i) und (ii) anhand der Beispiele (2-10.a, b und c), hier in umgekehrter Reihenfolge wiederholt als (2-12.a, b und c). Steht nur das interne Argument im Fokus, so projiziert das Fokusmerkmal [F] gemäß (i) vom nominalen Kopf [N Zeitung] bis zur DP-Ebene (maximales erweitertes Projektionsniveau), aber nicht weiter nach oben (2-12.a). In diesem Fall spricht man auch von engem Fokus. Bei weitem Fokus hingegen 'perkoliert' das Fokusmerkmal über die maximale Projektion des F-markierten Kopfes hinaus: Sind beispielsweise sowohl die Verbform als auch das interne Argument fokussiert, wird das Fokusmerkmal [F] gemäß (ii) auf den thetarollenzuweisenden Kopf V übertragen und dann gemäß (i) von dort bis zur VPEbene nach oben weitergegeben (2-12.b). Bei einer Satzfokuslesart schließlich projiziert [F] gemäß (i) bis zur höchsten erweiterten Projektionsebene CP, womit auch die in Spec,CP situierte Subjekt-DP im Bereich der Fokusdomäne liegt (2-12.c). Wichtig ist hervorzuheben, dass in allen drei Fällen der lexikalische Kopf [N ZEItung] der Objekt-DP Träger des Satz- oder Nuklearakzents ist. Die durch die größere Projektionshöhe des Fokusmerkmals determinierte Erweiterung der Fokusdomäne bewirkt also weder eine Verlagerung der Satzakzentstelle noch die Zuweisung von Nebenakzenten o.ä. und hat somit diesbezüglich keine Auswirkungen auf die prosodische Gestaltung des Satzes.22
Zur prosodischen Markierung der Fokusdomäne im Spanischen durch einen intermediären hohen Grenzton H- vgl. Hualde (2002a, 2003a) sowie Abschnitte 3.2 und 4.3.1.
2. Grundlagen
(2-12)
37
a. dt.
Maria
hat
Maria
hat
F[Vp
F[DP die If ZEItungWr
gekauft
F[DP die [gZEItung]]
gekauft]f
iii^—
———
o: c.
F[CP Maria
hat
F[VP \\n?die [$ZEftung]]
—^
gekauft]]
In (2-10.d) MaRIa hat die Zeitung gekauft ist hingegen keine Perkolation des Fokusmerkmals von der Subjekt-DP weiter nach oben bis zur CP-Ebene möglich, da das Subjekt kein (VP-)internes, sondern ein externes Argument darstellt und somit eine Weitergabe von [F] qua Fokusprojektionsregel (ii) ausgeschlossen ist. Allerdings sind die beiden in Selkirk (1984) formulierten Projektionsregeln noch nicht ausreichend, um allen Fällen von Fokusprojektion Rechnung zu tragen. Bei englischen Sätzen wie (2-13)
(Kontext: 'Und was passierte dann?') a.
engl. F[The SUN came
out]f
'Die Sonne kam heraus.' b.
(Kontext: 'Was ist los?') F[/4 BAby's
crying]F
'Ein Baby weint.'
ist die Satzfokuslesart nur dann erklärbar, wenn man davon ausgeht, dass das dem (overt in Spec,TP 23 befindlichen) Subjekt zugewiesene Fokusmerkmal auch an die VP-interne Basisposition des Subjekts weitergeleitet wird. Fasst man dann das Subjekt als 'tiefenstrukturell' internes Argument auf, dann kann laut Fokusprojektionsregel (ii) das F-Merkmal vom Subjekt an das Verb weitergegeben werden, von dort aus hoch bis zur TP-Ebene perkolieren und auf diese Weise die Satzfokuslesart bewirken. Um dies zu ermöglichen, nimmt Selkirk (1995) eine dritte Fokusprojektionsregel hinzu (vgl. hierzu auch die ausführliche Diskussion in Breul (2004: 130ff.).
23
Der funktionale Kopf T kodiert die verbalen Merkmale für Tempus und Subjektkongruenz; die entsprechende maximale Projektion TP der neueren Versionen des Minimalistischen Programms entspricht der IP (engl, inflection phrase) des klassischen Prinzipienund Parametermodells der generativen Grammatik (Chomsky 1981); vgl. ausführlich Abschnitt 3.1 dieser Arbeit.
38
Christoph
Gabriel
Focus Projection Rules (Selkirk 1995: 561) (i) F-marking of the head of a phrase licenses the F-marking of the whole phrase. (ii) F-marking of the internai argument of a head licenses the F-marking of the head. (iii) F-marking of the antecedent of a trace left by NP- or w/j-movement licenses the F-marking of the trace.
Für das Spanische ist die dritte Fokusprojektionsregel allerdings nicht relevant, da bei Satzfokuslesart das prosodisch hervorgehobene Subjekt nachgestellt wird und damit für die Fokusprojektionsregeln (ii) unproblematisch ist. (2-14) a.
sp.
b.
(Kontext: 'Was ist los?') ASigue goteando la caNIllah (Di Tullio 1997: 361) 'Der Wasserhahn tropft immer noch.' (Kontext: 'Was ist passiert?') f[Comenzó el viento NORte, y sopló, y sopló, y sopló]p (BAU6_2) 'Der Nordwind begann, und er blies und blies und blies.'
Wenn das Subjekt hingegen in präverbaler Position erscheint, dann ist es nicht Träger des Satzakzents; vielmehr ist die am tiefsten eingebettete Konstituente, hier die infinite Verbform goteando prosodisch hervorgehoben. (2-15) sp.
(Kontext: 'Was ist los?') canilla sigue goteANdo]?
F[La
(Di Tullio 1997: 361)
Wie durch die angegebene Fokusdomäne angedeutet, ist bei (2-15) gleichfalls eine Satzfokuslesart denkbar. Allerdings ist die Abfolge F[SV]f nur dann angemessen, wenn das Subjekt la canilla im Sinne eines Diskurs-iop/c zumindest potenziell im weiteren (inner- oder außersprachlichen) Kontext präsent ist. Hierzu reicht es aus, wie Di Tullio (1997: 361) ausführt, dass im Vorfeld der gegebenen Äußerung beispielsweise allgemein von Haushaltsproblemen die Rede war (zur generellen Unmarkiertheit der Abfolge VS vgl. Abschnitt 3.1.4). Strukturen mit initialem prosodisch hervorgehobenem Subjekt wie La caNllla sigue goteando, welche den für die Fokusprojektionsregeln (i) und (ii) problematischen englischen Sätzen (2-13) entsprechen, sind im Spanischen grundsätzlich mit einer sog. kontrastiven Lesart verbunden. Solche kontrastiven Foki, die einen Bestandteil der Präsupposition verneinen und korrigieren oder auch hervorhebend bestätigen, verhalten sich in Bezug auf die Projektion des Fokusmerkmals grundlegend anders. Dies sei hier wieder zunächst anhand des Deutschen erläutert.
2. Grundlagen
39
Erscheint (2-12.a) Maria hat die ZEItung gekauft nicht als Antwort auf die in (2-8.c) als Kontext gegebene Frage 'Was hat Maria gekauft?', sondern im Zusammenhang mit einer Äußerung wie 'Maria hat doch das Rätselheft gekauft, nicht wahr?' (2-16), dann ist - anders als beim bisher behandelten Fokustyp - keine Weitergabe des entsprechenden Merkmals vom fokusmarkierten Kopf aus im Baum nach oben möglich. Für den kontrastiven Fokus gelten also die oben besprochenen Fokusprojektionsregeln nicht. Um Verwechslungen zu vermeiden, symbolisiere ich das Merkmal für kontrastiven Fokus durch [Foc] und spreche im Bedarfsfall beim nicht-kontrastiven Fokus von neutralem oder Informationsfokus. 24 Die Fokusdomäne wird in beiden Fällen durch den (außerhalb der Klammerung) subskribierten Index F symbolisiert. (2-16) dt.
(Kontext: 'Maria hat doch das Rätselheft gekauft, nicht wahr?') Nein. Maria hat die F[Foc ZEItung]F gekauft.
Ich gehe davon aus, dass in (2-16) die Fokusdomäne auf den nominalen Kopf beschränkt ist und nicht die gesamte DP erfasst. Zwar ändert sich, wenn der Sprecher das Rätselheft durch die Zeitung korrigiert, aufgrund des veränderten Genusmerkmals auch die overte Form des Determinanten, doch ist dies nicht Bestandteil der kontrastiven Fokussierung, sondern folgt aus den formalgrammatischen Eigenschaften des nominalen Kopfes [ N Zeitung], von dem der Determinant die entsprechenden Merkmalbelegungen übernimmt. 25 Wie die folgenden Beispiele zeigen, können auch funktionale Kategorien wie beispielsweise D-Elemente kontrastiv fokussiert werden, was sich prosodisch darin niederschlägt, dass sie den Satzakzent erhalten.
24
25
In der Literatur sind hierfür teilweise andere Termini gebräuchlich. So spricht beispielsweise Rochemont (1986) von presentational focus, der gegen kontrastiven Fokus abgegrenzt wird (s.u.). Im Sonde-Ziel-Modell nach Chomsky (2000, 2001, 2004), das ich für die weitere Modellierung zugrunde lege, wird angenommen, dass Determinanten D-Köpfe sind, die bei der Entnahme aus dem Lexikon zwar in Bezug auf referenzielle Merkmale wie Definitheit und Spezifizität spezifiziert sind, jedoch keine Merkmalbelegungen für Genus, Numerus und Kasus aufweisen. Letztere erhalten sie im Zuge der Übereinstimmungsrelation Agree mit dem nominalen Kopf N bzw. mit einem kasusinstanziierenden funktionalen Kopf (vgl. im Einzelnen Abschnitt 3.1.3.1). Andere D-Köpfe sind bereits bei der Entnahme aus dem Lexikon für bestimmte der sog. -Merkmale spezifiziert: So können Personalpronomina Merkmalbelegungen für Person, Numerus und Genus aufweisen (z.B. sp. tu oder ar. vos [Pers.:2, Num.:Sg]; sp. el [Pers.:3, Num.:Sg, Gen.:m]), und bei Possessivdeterminanten ist der Possessor durch Person-, Numerus- und teilweise auch Genusmerkmale festgelegt, vgl. z.B. sp. nuestri-o, -a, -os, -as) [Pers.:l, Num.:Pl], dt. sein(e) [Pers.:3, Num.:Sg, Gen.:m]. Die konkrete overte Form des Possessivdeterminanten (z.B. sp. nuestroperro, nuestras casas, dt. sein Buch, seine CDs) wird dann durch Agree mit dem jeweiligen nominalen Kopf festgelegt.
Christoph Gabriel
40 (2-17) a.
dt.
b.
(Kontext: 'Maria hat doch ihre Zeitung gelesen, nicht wahr?') Nein. Maria hat p[pIKMEIne]f Zeitung gelesen. (Kontext: 'Maria hat doch den Zeitung gekauft, nicht wahr?') Ja, da haben Sie Recht. Aber das heißt f[f,xDIE\f Zeitung.
In (2-17.a) wird durch den abweichend spezifizierten Possessivdeterminanten die in der Präsupposition enthaltene Annahme bezüglich des Possessors korrigiert; ausschlaggebend ist hierfür die Selektion eines entsprechend spezifizierten possessiven D-Kopfes, d.h. meine(n) anstelle von ihre(n). Die in (2-17.b) erfolgte Korrektur hingegen ist eher metasprachlicher Art, denn es geht hierbei nicht um semantische, sondern lediglich um formale Eigenschaften des Determinanten, dessen overte Form in Bezug auf die Numerus- und Genusmarkierung lediglich einen Reflex der in N kodierten «^-Merkmale darstellt. So muss ein Sprecher, der Satz (2-17.b) äußert und seinen Gesprächspartner damit nicht 'präsuppositional', also inhaltlich, sondern lediglich formal korrigiert, annehmen, dass das im Lexikon des Gesprächspartners gespeicherte [N Zeitung] eine vom deutschen Standardlexikon abweichende Genusspezifizierung aufweist, was wiederum die unkorrekte Artikelform nach sich zieht. Trotz dieses Unterschieds (inhaltliche vs. formale Korrektur) gleichen sich (2-17.a) und (2-17.b) in Bezug auf die prosodische Gestaltung: Da jeweils dem D-Kopf als Träger der - inhaltlich oder formal korrigierenden Information das Merkmal [Foc] zugewiesen wird, muss dieser entsprechend der FPR prosodisch hervorgehoben werden. Auch ist in beiden Fällen die Fokusdomäne jeweils auf die D-Position begrenzt: Das Merkmal [Foc] projiziert nicht bis zur DP-Ebene, da andernfalls auch der nominale Kopf fälschlicherweise Bestandteil der Fokusdomäne wäre. Schließlich kann eine formale Korrektur durch kontrastive Fokussierung auch nur einen Bestandteil des phonologischen Wortes, beispielsweise ein Wortbildungsmorphem (2-18.a) oder auch nur ein Segment innerhalb des lexikalischen Morphems (2-18.b), betreffen. Entsprechend müsste man - wie in den Beispielen durch Klammerung angedeutet - davon ausgehen, dass die Fokusdomäne hierbei auf eine Analyseeinheit unterhalb der Wortebene beschränkt ist. (2-18) a. b.
dt.
(Kontext: Das heißt (Kontext: Das heißt
Gespräch mit einem Schweizer Dialektsprecher) Regieroc[RUNG]fX, nicht Regierig! Gespräch mit einem norddeutschen Dialektsprecher) Ziegenftx[KA\To^se, nicht Ziegenk[e]se!
Wichtig ist, dass in solchen Fällen kontrastiver Fokussierung der Satzakzent auch auf Silben realisiert werden kann, die im phonologischen Wort als metrisch schwach gelten müssen. So ist z.B. der fokale Akzentton H*L in
41
2. Grundlagen
(2-18.b) mit der Silbe -kä- assoziiert, die im Kompositum „,(Ziegenkäse)(tsi
gnn
X ke
yon
X X kc
c. X Jtsi
X X ,„(ti
. X ipn Foclke lr.it
,1 „ ; H*l.
In all den angeführten Fällen von kontrastiver Fokussierung kann aus pragmatischen Gründen, etwa um bestimmte Emotionen zu transportieren, eine besonders starke Hervorhebung des fokussierten Elements durch sog. emphatische Realisierung des Wort- bzw. Satzakzents erfolgen. Als typische Oberflächenkorrelate derartiger emphatischer Überhöhung führt Kohler für das Deutsche eine „Verbreiterung des Tonumfangs sowie größere Dauer und Intensität" ( 2 1995: 195) an, und auch im Spanischen lässt sich emphatische Akzentuierung an eben diesen Parametern festmachen (vgl. Aguilar 2000a: 99). Für das Französische, das, anders als das Spanische und das Deutsche, keinen lexikalisch distinktiven Wortakzent, sondern einen festen, auf der letzten vollen Vokalsilbe eines Inhaltsworts lokalisierten Wortgruppenakzent aufweist, ist nach Kohler ( 2 1995: 116) typisch, dass bei emphatischer Hervorhebung anstelle des Final- ein Initialakzent realisiert wird, vgl. etwa IMpossible, mon eher! 'Unmöglich, mein Lieber!'. Allerdings ist die Akzentverlagerung von der letzten auf die erste Silbe eines Inhaltsworts im Französischen eine häufig genutzte, wenn auch nicht obligatorische Strategie der Fokussierung, 26 und so gilt auch hier, dass bei emphatischer Hervorhebung
26
Während Di Cristo (1998: 210) annimmt, dass bei kontrastiver Fokussierung die im Nonnalfall akzentuierte Silbe von der Akzentuierung ausgeschlossen ist, zeigen Jun/ Fougeron (2000: 224), dass auch bei kontrastiver Fokussierung Finalbetonung möglich ist. Auch meine Daten stützen die Annahme, dass bei kontrastiver Fokussierung keine obligatorische Akzentverlagerung an den Beginn der Intonationseinheit vorliegt; vgl. Abschnitt 2.2.3.
42
Christoph Gabriel
lediglich diejenigen Mittel verstärkt werden, die bei kontrastiver Fokussierung ohnehin systematisch genutzt werden. In einer solchen Sichtweise lässt sich die emphatische Akzentuierung als emotional bedingte Übersteigerung bereits vorhandener Akzente in den sog. paralinguistischen Bereich (vgl. Ladd 1996: 33ff.) verweisen und von einer weiteren Betrachtung ausschließen. Ein anderes Phänomen, das für gewöhnlich unter Emphase gefasst wird, ist die für bestimmte Sprechstile typische Tendenz zur generellen intonatorischen Hervorhebung von Nebenakzentstellen, die normalerweise für die Tonzuweisung nicht relevant sind. This phenomenon, w h i c h is c o m m o n l y known as secondary or emphatic stress, is illustrated with the following Spanish example, where primary, lexical stress is indicated with acute accent marks and secondary, emphatic stress with grave accent marks: los répresentántes de la drganización se reunirán mañana ... 'the representatives of the organization will meet tomorrow . . . ' In Spanish the use of this secondary stress is highly marked and is only frequent in the speech of television and radio announcers (Hualde 2002b: 5). 27
Die Besonderheiten bestimmter Sprechstile betreffen jedoch nicht die hier interessierende Vermittlung der FHG und fallen somit ebenso wenig in den Untersuchungsbereich der vorliegenden Studie wie die emphatische Überhöhung bereits vorliegender Akzente. Im Englischen kann jedoch, wie Ladd (1996: 200f.) zeigt, die emphatische Realisierung des Nuklearakzents (durch graduelle Verstärkung der Parameter Tonhöhe, Intensität und/oder Dauer) auch zur Differenzierung zwischen engem und weitem Fokus genutzt werden, vgl.: (2-20)
a. b.
engl. I gave him F|five LF FRANCS]F
(weiter Fokus)
I gave him five F[F FRANCS1 (enger Fokus, emphatischer Satzakzent) 'Ich habe ihm fünf Francs gegeben.'
Kommen wir auf die Besonderheiten des kontrastiven Fokus zurück. Die Annahme, dass hierbei keine Fokusprojektion erfolgt, trägt auch der Tatsache Rechnung, dass keine weiten kontrastiven Fokusdomänen möglich sind (2-2l.a). Sollen mehrere adjazente Einheiten kontrastiv fokussiert werden, dann muss für jedes einzelne Element der Präsupposition, das korrigiert wird, 27
Für weitere Beispiele emphatischer Sprechstile vgl. Aguilar (2000a: 100) und Hualde (2003a: 173f.). Zu den phonetischen Korrelaten spanischer Nebenakzente vgl. DiazCampos (2000), der konstatiert, dass sich Haupt- und Nebenakzente sowie unbetonte Silben im Wesentlichen durch unterschiedliche Länge auszeichnen. Für eine Gegenposition vgl. Prieto / Van Santen (1996), die Evidenz für die tonale Realisierung wortinitialer Nebenakzente ausgemacht haben.
43
2. Grundlagen
ein eigenes Fokusmerkmal und damit jeweils eine gesonderte Fokusdomäne angenommen werden (2-2 l.b, c). Wie Ladd (1996) hervorhebt, sind derartige Strukturen mit multiplen kontrastiven Foki in „relatively unusual circumstances" wie beispielsweise bei sehr bewusster Sprechweise („very deliberate speech") durchaus möglich. Da aber aufgrund der Fokusprominenzregel ein fokusmarkierter Kopf (bzw. die metrisch prominente Silbe des entsprechenden phonologischen Worts) prominenter sein muss als ein nicht fokusmarkierter Schwesterknoten und sich zwei adjazente kontrastiv fokussierte Elemente damit sozusagen gegenseitig an Prominenz übertreffen miissten, sind Strukturen mit multiplen kontrastiven Foki grundsätzlich prosodisch problematisch. Im konkreten Fall ist zwar, wie Ladd bemerkt, eine emphatische Realisierung mit „very prominent accents on both five and francs" (1996: 162) durchaus vorstellbar. Bezüglich der Platzierung des Satzakzents fragt sich dann aber, welche der beiden fokussierten Einheiten Träger desselben sein soll, da mehrere vollkommen gleichwertige Satzakzente, insbesondere bei linearer Adjazenz, jeder Intuition widersprechen. Es ist also nicht verwunderlich, dass Sprecher, die mehrere Elemente einer Präsupposition korrigieren wollen, in der Regel auf das insgesamt zwar weniger ökonomische, aber prosodisch unproblematischere Verfahren der Aufspaltung in mehrere Teiläußerungen zurückgreifen (vgl. 2-21.c vs. 2-21.d). 28 (2-21) a. b.
c. d.
(Kontext: 'Sie haben ihm sieben Gulden gegeben, nicht wahr?') engl. *No, I gave him F[ five [Foc FRANCS]^ No, I gave him F[Foc FIVE\f F[Foc FRANCS]^ (nach Ladd 1996: 162) 'Nein. Ich habe ihm fünf Francs gegeben.'
dt.
(Kontext: 'Julia hat doch das türkische Rätselheft gekauft, nicht wahr?') ?? Nein, FIFOC MaRIa]F hat die [ F O C SPAnische]F [ F O C ZEItung]F gekauft Nein. Das war F[Foc MaRIa]F (und nicht Julia). Und außerdem hat sie eine F[FocZ£7i«ng]F gekauft (und kein Rätselheft). Und die Zeitung war eine F[Foc SPAnische\f (und keine türkische). F
F
Bei neutralem Fokus sind multiple Fokusdomänen weniger problematisch, jedoch tendieren auch hier die Sprecher zur Aufspaltung in mehrere Teilsätze oder Konjunkte, zumindest dann, wenn die fokussierten Konstituenten einen unterschiedlichen syntaktischen Status aufweisen. Dies zeigt u.a. Féry (2001) für das Französische: „Most speakers realized the sentence Isabelle mange son poulet (et) avec des baguettes as an answer to Que mange Isabelle et avec quoi ? 'What is Isabelle eating and with what?' with the conjunction et between the two focused phrases" (176).
44
Christoph Gabriel
Eine Differenzierung zwischen kontrastivem und Informationsfokus ist insofern essenziell, als sich in zahlreichen Sprachen die beiden Fokustypen in Bezug auf die möglichen Oberflächenrealisierungen grundlegend unterscheiden. Wie noch genauer zu zeigen sein wird, betrifft dies insbesondere auch das Spanische (vgl. Abschnitt 2.2.2).29 Hervorzuheben ist schließlich, dass das für den kontrastiven Fokus Gesagte auch für eine Unterform dieses Fokustyps gilt, die dadurch charakterisiert ist, dass ein Bestandteil der Präsupposition nicht korrigiert, sondern emphatisch bestätigt wird. Entsprechend ist (2-16) auch in einem Kontext wie 'Maria hat tatsächlich die Zeitung gekauft?' möglich: Ja, wirklich. Maria hat [DP die FfFocZ£/iMnglF] gekauft. Die tatsächlichen Vorkommensfrequenzen derartiger Strukturen dürften allerdings eher gering sein. Zu den entsprechenden Fakten des Spanischen vgl. Casielles Suärez (1997: 132). In der Literatur sind die besprochenen Fokustypen vielfach diskutiert und durch die Annahme differenzierterer Unterscheidungen verfeinert worden. So nimmt etwa Gundel (1994, 1999) neben einem 'semantischen' Fokus, der im Wesentlichen unserem Informationsfokus entspricht, und einem (mit dem bisher Gesagten deckungsgleichen) kontrastiven Fokus einen weiteren Fokustyp an. Dieser ist - im Gegensatz zu den ersten beiden Typen, die sie unter dem Etikett 'sprachlicher Fokus' (engl, linguistic focus, vgl. 1999: 300) zusammenfasst - psychologischer Natur. An entity is in (psychological) focus if the attention of both speech participants can be assumed to be focused on it because of its salience at a given point in the discourse (Gundel 1999: 294).
Solche 'psychologisch' fokussierten Entitäten entsprechen auf sprachlicher Ebene oft Einheiten, die im Sinne der diskutierten Fokus-Hintergrund-Gliederung dem präsupponierten Material zuzurechnen sind (hier die im folgenden Beispiel unterstrichenen Pronomina). (2-22)
29
engl. (Speaker sees addressee looking at a picture of a woman and savs:) She still looks like her mother, doesn 7 she? (Gundel 1999: 294; Hervorhebung original) '(Der Sprecher sieht den Angesprochenen das Bild einer Frau betrachten und sagt:) Sie sieht immer noch wie ihre Mutter aus, nicht wahr?'
Für entsprechende Evidenz aus dem Englischen vgl. Selkirk (2002). Brunetti (2003) hingegen legt einen Vorschlag für die Modellierung des Italienischen vor, der auf die Unterscheidung eines kontrastiven und eines nicht-kontrastiven Fokusmerkmals verzichtet.
2. Grundlagen
45
Zwischen Gundels sprachlichem und psychologischem Fokus besteht eine asymmetrische Wechselbeziehung, und zwar insofern, als sprachlicher Fokus, zumindest wenn es sich um kontrastiven Fokus handelt, psychologische Fokussierung nach sich zieht (vgl. Gundel 1999: 301), psychologischer Fokus jedoch, wie das in (2-22) wiedergegebene Beispiel zeigt, nicht mit sprachlicher Fokussierung im oben ausgeführten Sinne einhergehen muss. Da ich mich im weiteren Verlauf der vorliegenden Arbeit mit der konkreten Realisierung der beiden von Gundel unter dem Oberbegriff des 'sprachlichen' Fokus zusammengefassten Fokustypen auseinandersetze, ist die von Gundel zusätzlich zum neutralen vi. kontrastiven Fokus eingeführte Dichotomie psychologischer vi. sprachlicher Fokus für meine Zwecke nicht weiter relevant. Der Unterscheidung zwischen neutralem und kontrastivem Fokus entspricht auch die in Rochemont (1986) vorgenommene Differenzierung in presentational und contrastive focus. Den Gegensatz zwischen Fokus und Präsupposition formalisiert er, indem er festhält, dass präsupponiertes Material c-construable ('construable from the context') sein muss, was bedeutet, dass das betreffende Element an den Diskurs semantisch angebunden sein muss: „A string P is c-construable in a discourse 8 if P has a semantic antecedent in 8" (1986: 47). Dabei kann die Anbindung an den vorangegangen Diskurs entweder „formally", also durch Rückverweis auf konkret vorerwähntes Sprachmaterial, oder „informally" erfolgen, d.h. durch Rekonstruierbarkeit mithilfe des (außersprachlichen) Diskurs- oder Weltwissens. Unter Fokus ist dann all das zu verstehen, was zum Zeitpunkt der Äußerung der entsprechenden Aussage nicht c-construable ist. Rochemonts formale Differenzierung zwischen presentational focus und kontrastivem Fokus soll hier nicht Gegenstand der Diskussion sein; für eine ausführliche Kritik an seiner Definition des kontrastiven Fokus vgl. Casielles Suärez (2004: 140ff.). Das von Vallduvi (1992) vorgeschlagene Modell wiederum hat den Vorteil, dass sich hierbei FHG und topic/comment-Slruktur zusammenfassen lassen. Betrachten wir hierzu das folgende Beispiel: (2-23) dt.
(Kontext: 'Für wen kauft Maria die Zeitung?') Die Zeitung, die kauft Maria für ihren Bruder
Die Analyse der informationsstrukturellen Gliederung von (2-23) macht deutlich, dass die Beschränkung auf eine der beiden Dichotomien unzureichend ist: Beschränkt man sich auf das Gegensatzpaar topic/comment, wird das linksversetzte Objekt [ DP die Zeitung] als topic identifiziert und vom Rest des Satzes, der als comment fungiert, abgetrennt. Betrachtet man das sprachliche Material, das dem comment entspricht, so wird deutlich, dass dieses bezüglich des Gegensatzes präsupponierte vs. neue Information Elemente unterschiedli-
46
Christoph
Gabriel
chen Status beinhaltet, nämlich einerseits die fokale Konstituente [ P P f ü r ihren Bruder] und andererseits diejenigen Konstituenten, die präsupponierter Information entsprechen (hier: die kauft Maria). Zur präsupponierten Information zählt jedoch wiederum auch die durch Linksversetzung topikalisierte Konstituente [DP die Zeitung]. Um die beiden offensichtlich ineinandergreifenden Dichotomien miteinander zu verbinden, hat Vallduvi (1992) vorgeschlagen, zunächst eine der FHG entsprechende Aufteilung in focus und ground vorzunehmen; die dem ground entsprechende Sequenz von Ausdrücken lässt sich dann bei Bedarf in einen link und einen tail aufspalten. Der erstgenannte Begriff entspricht hierbei der /o/nc-Konstituente (im Sinne von Di Tullios töpico), deren pragmatische Aufgabe darin besteht, eine Verbindung ('link') zum vorangegangenen Kontext sicherzustellen; der Terminus tail bezieht sich auf diejenigen Elemente, die präsupponiertes Material versprachlichen, ohne jedoch hierbei explizite Diskursanbindung im Sinne eines „aboutness feeling" (Meinunger 2000: 17) zu leisten. Beispiel (2-23) wäre nach der von Vallduvi vorgesehenen Einteilung zu analysieren wie in (2-24.a) angegeben; folgt man der Aufteilung der ground-Seqaenz in link und tail nicht, sondern verwendet weiterhin das traditionelle Gegensatzpaar topidcomment, so überschneiden sich die beiden entsprechend vorgenommenen Systematisierungen wie in (2-24.b) skizziert. (2-24)
a.
dt.
Die Zeitung, . > y
die kauft Maria v j v
link
tail
\
für ihren Bruder
~~Y ground topic
focus comment
_A
t \ Die Zeitung,
die kauft Maria
für ihren Bruder K v '
Hintergrund/Präsupposition [-F]
Fokus [+F]
Zudem kann, wie bereits weiter oben gezeigt, die Fokusdomäne durchaus Material enthalten, welches zwar nicht Bestandteil der Präsupposition ist, jedoch im Sinne eines Diskurs-fo/?i'cs zumindest durch den außersprachlichen Kontext präsent ist. Vgl. das Beispiel (2-15), hier wiederholt als (2-25). (2-25)
(Kontext: Gespräch über Haushaltsprobleme) sp.
F[[t0picLa
canilla] sigue goteANdo)F
(Di Tullio 1997: 3 6 1 )
2. Grundlagen
47
Um dem gerecht zu werden, ist es sinnvoll, sich nicht auf eine einzige Dichotomie zu beschränken, sondern zusätzlich zur FHG den Begriff topic als Analysegröße zu verwenden. Eine weitere begriffliche Überschneidung und sozusagen das Gegenstück zur eben diskutierten Problematik ergibt sich bei (im Deutschen durch Bewegung nach Spec,CP) topikalisierten Konstituenten, die ihrerseits wiederum kontrastiv fokussiertes Material beinhalten können, ein Phänomen, welches in der Literatur meist mit dem Begriff des contrastive topic gefasst wird (vgl. hierzu auch Vallduvi/Vilkuna 1998). (2-26)
(Kontext: 'Wo hat Maria die Zeitungen gekauft?') dt.
Präsupposition: 3 x (Maria hat am Ort x die Zeitungen gekauft) [topic Die F[Foc SPAnische] Zeitung] hat sie ¥[¥am Kiosk]? gekauft, [topic die pfpot TÜRkische] 0 J hingegen FLF"w Supermarkt]F
Dass es sich bei den beiden Adjektiven in (2-26) um kontrastiv (und nicht um neutral) fokussiertes Material handelt, zeigt sich daran, dass der Sprecher hiermit keine in der Präsupposition offene Variable x mit neuer Information auffüllt, wie es etwa bei (2-27) der Fall ist. (2-27) dt.
(Kontext: 'Was für eine Zeitung hat Maria gekauft') Maria hat eine F[F SPAnische]? Zeitung gekauft
Vielmehr wird die stillschweigende Annahme, die infrage stehenden Zeitungen seien allesamt am selben Ort gekauft worden (vgl. die Präsupposition in 2-26), durch die Hinzunahme zweier modifizierender Adjektive korrigiert. In beiden Fällen, also unabhängig davon, ob das Adjektiv kontrastiv oder neutral fokussiert wird, ist die Fokusdomäne jeweils auf selbiges beschränkt: In (2-26) ist aufgrund des Status als kontrastiver Fokus ohnehin keine Fokusprojektion möglich; in (2-27) ist zwar die Perkolation von [F] qua Fokusprojektionsregel (i) bis zur maximalen Projektionsebene der Adjektivphrase (AP) möglich, doch ist eine zusätzliche Weitergabe des Merkmals im Baum nach oben gemäß Fokusprojektionsregel (ii) nicht möglich, da die Adjektivphrase in der entsprechenden Struktur keinen Argumentstatus hat. Ein letzter Vorschlag zur Systematisierung der FUG, der hier kurz vorgestellt werden soll, ist die von Lambrecht (1994) vorgeschlagene Unterscheidung dreier unterschiedlicher Arten von Fokusstrukturen that correspond to three basic communicative functions: that of predicating a property of a given topic (presentational focus [ . . . ] ) ; that of identifying an argument for a given proposition (argument focus [ . . . ] ) ; and that of introducing a new discourse referent or of reporting an event (Lambrecht 1994: 336).
Christoph Gabriel
48
Im Folgenden werden die drei Fokustypen anhand des bereits besprochenen deutschen Beispiels illustriert. (2-28) a. dt.
b.
c.
(Kontext: 'Was hat Maria gemacht?') Maria r[hat die ZEItung gekauft]T
Funktion: topic/comment Fokustyp: predicate o. presentational focus (Kontext: 'Wer hat die Zeitung gekauft?') f[MaRIa\f hat die Zeitung gekauft Funktion: identificational Fokustyp: argument focus (Kontext: 'Was ist passiert?') p[Maria hat die ZEItung gekauft]F Funktion: event reporting Fokustyp: sentence focus
Wohlgemerkt bezieht sich die von Lambrecht vorgeschlagene Einteilung in Prädikat-, Argument- und Satzfokus auf verschiedene Arten von Fokusstrukturen im Sinne einer unterschiedlichen Gliederung der FHG, nicht jedoch auf unterschiedliche Fokustypen im Sinne der oben besprochenen Differenzierung zwischen neutralem und kontrastivem Fokus. Unter den bisherigen Annahmen lässt sich vielmehr sagen, dass sich die drei Beispiele darin unterscheiden, dass jeweils unterschiedliche Zuweisung des Satzakzents und/oder unterschiedliches Fokusprojektionsverhalten vorliegt: In (2-28.a, c) erhält - wie bereits ausgeführt - das am tiefsten eingebettete Argument den Satzakzent; in (2-28.b) wird dieser aufgrund der andersartigen Fokussierung der Subjektkonstituente zugewiesen. Die Beispiele (2-28.a) und (2-28.c) unterscheiden sich schließlich dadurch, dass im ersten Fall das Fokusmerkmal [F] weniger hoch projiziert. Projiziert [F] nur bis zur D-Ebene (Fokusprojektionsregel (i)), dann resultiert enger Fokus wie oben in (2-12.a) Maria hat F[DP die [f ZEItung]]P gekauft. In Lambrechts Systematik wäre in diesem Fall von Argument-Fokus zu sprechen. Dieser Argument-Fokus, der grundsätzlich einer engen Fokuslesart entspricht, ist wiederum der einzige der drei bei Lambrecht angenommenen Fokustypen, der mit einem kontrastiven Fokusmerkmal kompatibel ist. Grundsätzlich lässt sich festhalten, dass sich die vorgeschlagene Einteilung unproblematisch in ein System übersetzen lässt, das von zwei unterschiedlichen Fokusmerkmalen [F] und [Foc] ausgeht und die Differenzen in Bezug auf die Ausdehnung der Fokusdomäne mithilfe der Selkirkschen Fokusprojektionsregeln modelliert. Kommen wir nach diesem Überblick über die Literatur zum Schluss des Abschnitts auf den Zusammenhang von Fokusprominenzregel (FPR) und Zuweisung des Satzakzents zurück. Wie aus den Beispielen (2-10.a, b und c), hier wiederholt als (2-29.a, b und c), ersichtlich ist, fällt der Satzakzent in germanischen Sprachen wie beispielsweise dem Deutschen regelmäßig auf das
2. Grundlagen
49
am tiefsten eingebettete interne Argument. Davon unabhängig sind die (entsprechend den Fokusprojektionsregeln erfolgende) Weitergabe des Merkmals [F] im Strukturbaum nach oben und die hieraus resultierende Reichweite der Fokusdomäne. (2-29) a. b. c.
dt.
f[Maria
hat die ZEItung gekauft]F Maria f\hat die ZEItung gekauft]F Maria hat ¥[die ZEItung]r gekauft
Dass die fragliche Konstituente tatsächlich Argumentstatus haben muss, wird deutlich, wenn man die ersten beiden der in (2-30) gegebenen Beispiele miteinander vergleicht: Während in (2-30.a) [in einer Zeitung] internes Argument des Verbs und damit Schwesterknoten des verbalen Kopfes ist, hat die oberflächensyntaktisch parallel gebaute PP in (2-30.b) Adjunktstatus und erhält damit den Satzakzent nicht. Der Kontrast zwischen (2-30.c) und (2-30.d) zeigt den Unterschied zwischen dem 'Subjekt' eines unakkusativen Verbs, das als internes Argument in der VP-intemen Komplementposition basisgeneriert wird und dementsprechend den Satzakzent erhält, und einem externen Argument, das in neutraler Lesart nicht prosodisch hervorgehoben wird. (2-30) a. b. c. d.
dt.
(Kontext: 'Was gibt es zu berichten?') f[Maria hat den ganzen Tag in einer ZEItung gelesen]F f\Maria hat den ganzen Tag in einem Sessel geLEsen]F angekommen]F F [MaRIa ist AMaria SCHLÄFT]?
Allerdings ist unter der Annahme, dass der Satzakzent regelmäßig das am tiefsten eingebettete Argument trifft, unklar, wie sich erklären lässt, dass in Beispiel (2-10.d), hier wiederholt als (2-31), der Satzakzent nicht auf das am tiefsten eingebettete Argument, sondern auf das satzinitiale Subjekt fällt. (2-31) dt.
(Kontext: 'Wer hat die Zeitung gekauft?') hat die Zeitung gekauft
f[MaRIa\f
Ein weiteres Problem kommt hinzu, wenn man die folgenden Daten des Spanischen in Betracht zieht: (2-32) a. b. c.
sp.
(Kontext: 'Was f [María estaba p[María estaba ¡{María estaba
gibt es zu berichten?') leyendo todo el día en un siLLON\f leyendo todo el Día]F leyendo todo el día en un DIArio]?
50
Christoph Gabriel (Kontext: 'Wer hat die Zeitung gekauft?') d. d.' e. e.'
l*f\MaRia\f comprö el diario ?* F[MaRIa]F lo comprö Comprö el diario ¥[MaRIa\¥ Lo comprö F[MaRIa]f
Die Beispiele (2-32.a, b und c) zeigen, dass im Unterschied zum Deutschen der Satzakzent im Spanischen immer die am tiefsten eingebettete Konstituente trifft, und zwar unabhängig davon, ob diese Argumentstatus hat (2-32.c) oder lediglich Adjunkt ist (2-32.a, b). Selektionale Kriterien, wie sie für die Zuweisung des Satzakzents im Deutschen maßgeblich sind, spielen im Spanischen offensichtlich keine Rolle. Mit den Beispielen (2-32.d, e) wird bereits auf eine Problematik verwiesen, die im weiteren Verlauf der vorliegenden Studie eingehend zu diskutieren sein wird: Während in der Literatur zur spanischen Syntax meist angenommen wird, dass ein (nicht-kontrastiv) eng fokussiertes Subjekt in Anfangsposition ungrammatisch sei und stattdessen in der Schlussposition des Satzes erscheinen müsse (u.a. Zubizarreta 1998: 20-22, 1999: 4229, 4232; Ordóñez 2000: 29f.; Gutiérrez Bravo 2002b: 51; Zagona 2002: 211; Samek-Lodovici 2001: 347, o.J.: 23)30, wird die in (2-32.d) exemplifizierte Abfolge F[S]FVO in phonologisch orientierten Arbeiten (u.a. Toledo 1989: 226; Garcia Lecumberri 1995: 246, 341; Hualde 2002a: 106, 2003a: 160) als unproblematisch akzeptiert. Die im Rahmen dieser Studie erhobenen Daten und die Grammatizitätsurteile der Versuchspersonen (vgl. hierzu im Einzelnen Kapitel 4) sprechen ebenfalls gegen den in der (syntaktisch ausgerichteten) Literatur propagierten strikten Ausschluss von f [S]FVO. Ohne hier bereits auf die sich in diesem Zusammenhang unmittelbar aufdrängende Frage nach dem Umgang mit Sprachvariation eingehen zu können, seien zwei Dinge festgehalten: Erstens erfolgt die Zuweisung des Satzakzents in unterschiedlichen Sprachen - hier gezeigt am Deutschen und am Spanischen - nach einzelsprachlichen Regeln, und zweitens besteht ein komplexes Wechselspiel zwischen Satzakzentzuweisung und Fokusprominenzregel (FPR). Um dem gerecht zu werden, hat Zubizarreta (1998) vorgeschlagen, die auf Chomsky/Halle (1968) zurückgehende Nuclear Stress Rule (NSR) im Sinne einer modularisierten Satzakzentzuweisungsregel aufzuspalten, und zwar in eine sog. S(election-driven)-NSR, die auf Kategorien Anwendung findet, die in einem (thetatheoretischen) Selektionsverhältnis zueinander stehen, und eine sog. C(onstituent-driven)-NSR, die sich unabhängig
30
Es ist hervorzuheben, dass dies nur für nicht-kontrastive Subjekte in Initialposition gilt; die Abfolge F[FOCS]FVO hingegen wird von den genannten Autoren für grammatisch befunden.
2. Grundlagen
51
davon auf die durch asymmetrisches c-Kommando zum Ausdruck gebrachte strukturelle Dominanz bezieht. Revised Nuclear Stress Rule (Zubizarreta 1998: 19) S-NSR: Given two sister nodes Q and Cj, if C, and Cj are selectionally ordered, the one lower in the selectional ordering is the more prominent. C-NSR: Given two sister nodes Cj and Cj, the one lower in the asymmetric c-command relation is the more prominent.
Übereinzelsprachliche Unterschiede wie etwa die zwischen dem Deutschen und dem Spanischen lassen sich dann modellieren, indem angenommen wird, dass in einer gegebenen Sprache entweder nur eine der beiden Regeln aktiv ist oder die eine der beiden Regeln die andere dominiert, wobei die hierarchisch tiefer angesiedelte Regel nur dann greift, wenn die höhere nicht greifen kann. Für das Deutsche ist in einer solchen Sichtweise anzunehmen, dass S-NSR C-NSR dominiert, für das Spanische hingegen (wo unabhängig vom argumentalen Status die am tiefsten eingebettete Konstituente den Satzakzent erhält; vgl. Beispiele 2-32.a, b und c), dass nur C-NSR aktiv ist. Um der Tatsache gerecht zu werden, dass im Deutschen ein eng fokussiertes Subjekt in Initialposition möglich ist, nimmt Zubizarreta an, dass im Deutschen nur diejenigen Knoten für NSR 'metrisch sichtbar' sind, die durch das Merkmal [+F] charakterisiert sind (vgl. 1998: 78).31 Für das Spanische hingegen muss angenommen werden, dass alle Knoten unabhängig von der Markierung als [±F] 'metrisch sichtbar' und damit für NSR zugänglich sind: Während die Fokusprominenzregel FPR die prosodische Prominenz des eng fokussierten Subjekts fordert, müsste der Satzakzent qua (C-)NSR der am tiefsten eingebetteten Konstituente (hier: el DIArio) zugewiesen werden. Es zeigt sich aber, dass in jedem Fall die im engen Fokus stehende Konstituente den Satzakzent erhält, dass sich also sozusagen die Fokusprominenzregel (FPR) gegen die Satzakzentzuweisungsregel (NSR) durchsetzt. Der wiederum hieraus unausweichlich erwachsende Konflikt zwischen den beiden grundlegenden phonologischen Regeln lässt sich dann nur beilegen, indem das gesamte nicht-fokusmarkierte Material (hier: comprö el diario) in eine Position bewegt wird, von der aus es das ([F]-markierte) Subjekt dominiert. Es lässt sich also sagen, dass bei der Vermittlung von Informationsstruktur im Spanischen die Erfordernisse der Prosodie wichtiger genommen werden als die der Syntax, welche aus Gründen der Derivationsökonomie grundsätzlich Ableitungen mit möglichst wenig Bewegungsoperationen bevorzugt (vgl. hierzu Abschnitt 3.1.5). Für die skizzierte Art von proGleiches gilt auch für das Englische; vgl. das prosodisch prominente Subjekt in Mathesius' Beispiel (2-2) FAther wrote this letter.
52
Christoph
Gabriel
sodisch ausgelöstem Bewegungsverhalten hat sich der von Zubizarreta (1998) geprägte Begriff p-movement (engl, prosodically motivated movement) eingebürgert, den ich für die vorliegende Studie übernehme. Halten wir uns abschließend vor Augen, wie FPR und (C- bzw. S-)NSR bei multiplen Foki zusammenwirken. (2-33)
(Kontext:'Wer kauft was?')
dt.
F[FMaria]?
kauft ¡{die [f Zeitung]]?
Da im Deutschen nur Knoten [+F] für NSR zugänglich sind, stehen für die Zuweisung des Satzakzents nur Subjekt- und Objekt-DP zur Verfügung (im Strukturbaum 2-34 grau unterlegt). Weil die beiden Kategorien zueinander in keinem thetatheoretischen Selektionsverhältnis stehen, greift die hierarchisch höherstehende S-NSR nicht, und die tiefer eingebettete Konstituente [ DP die ZEItung] erhält aufgrund von C-NSR den Satzakzent. CP
(2-34) Spec.CP = DP Maria [+PJ
A
C' V + I+ C kauft[-Fl
A
1P
S ec
P -.IP VP
IA
V+l
kauft |~i J
Spec.VP = DP
/|\
MjriQ I
C-NSR: Satzakzent fällt auf ZEItung
DP die Zeitung l+i'J
V
ktttrft |-F] I
Die Anwendung der Fokusprominenzregel auf die Struktur in (2-34) ist weniger eindeutig: Da die metrische Unsichtbarkeit von als [-F] markierten Knoten nur für NSR postuliert wird, müsste man davon ausgehen, dass alle Knoten für FPR zugänglich sind. Entsprechend sollte man erwarten, dass die SubjektKonstituente \DP Maria] wegen des Merkmals [+F] prosodisch prominenter ist als das vom Schwesterknoten C' dominierte Material kauft die Zeitung, welches mit dem Objekt zwar eine [F]-markierte Konstituente enthält, insgesamt jedoch durch das Merkmal [-F] der projizierenden Verbform charakterisiert ist. In der Tat scheinen derartige Strukturen mit multiplen Foki eine von den Beispielen in (2-12) abweichende prosodische Gestaltung aufzuweisen, und zwar insofern, als im Deutschen bei Antworten auf multiple Fragen durchaus mehrere Akzenttöne - hier auf dem Subjekt und dem Objekt - realisiert werden können (vgl. Uhmann 1991: 196).
2.
53
Grundlagen
Anders als Informationsfokus ist kontrastiver Fokus nicht an das Zusammenspiel von (modularisierter) NSR und FPR gebunden: Unabhängig von den Prinzipien der Satzakzentzuweisung kann er in situ durch einen fokalen Akzentton realisiert werden, wovon auch nicht-akzentogene funktionale Kategorien wie etwa Determinanten (vgl. 2-17) und metrisch schwache Silben innerhalb eines phonologischen Wortes betroffen sein können (vgl. 2-18 und 2-19). Interessant ist bei dem skizzierten Ansatz von Zubizarreta, der von einem Wechselspiel zwischen Satzakzentzuweisung und Fokusprominenz ausgeht, vor allem auch die Tatsache, dass er aufgrund der angenommenen Hierarchisierung von Regeln - im Deutschen: S-NSR » C-NSR, im Spanischen: FPR » (C-)NSR sowie genereller Vorrang prosodischer Erfordernisse vor syntaktischen - eine Reformulierung im Sinne optimalitätstheoretischer Beschränkungen geradezu herausfordert. Wie bereits im einleitenden Abschnitt gesagt, wird im Rahmen der vorliegenden Studie ein solcher Weg beschritten.
2.1.4 Zusammenfassung In den vorangegangen Abschnitten habe ich mit den drei Gegensatzpaaren Thema/Rhema, topic/comment und Hintergrund/Fokus die gängigen Dichotomien besprochen, die in der Literatur vorgeschlagen worden sind, um die informationsstrukturelle Ebene von Sätzen besser in den Griff zu bekommen. Dabei hat sich gezeigt, dass die einzelnen Begriffspaare, die jedes für sich auf dem Gegensatz zwischen alter und neuer Information aufbauen, zwar nicht vollkommen gleichwertig sind, dass aber deutliche inhaltliche Überschneidungen vorliegen. Um der potenziellen Vielgestaltigkeit der informationsstrukturellen Ebene und den entsprechenden Oberflächenkorrelaten gerecht zu werden, verwende ich im Einklang mit Vallduvi (1992), aber ohne dessen Termini link, tail und ground sowie die damit verbundene Unterteilung des präsupponierten Materials zu übernehmen, zwei der bisher diskutierten Begriffspaare: Für meine Überlegungen maßgeblich ist die Fokus-HintergrundGliederung (FHG), deren sprachliche Vermittlung im Zentrum der Überlegungen steht. Um darüber hinaus bestimmte to/woKonstruktionen wie u.a. die häufig vorkommende Linksdislokation adäquat erfassen zu können, verwende ich zusätzlich zur FHG das Gegensatzpaar topic/comment. Hieraus können sich bei der konkreten Analyse bestimmte Überschneidungen ergeben: So kann das der Präsupposition entsprechende sprachliche Material eine (durch syntaktische Herausstellung als solche markierte) iopic-Konstituente beinhalten und ansonsten mit einem Teil des commeni-Materials übereinstimmen. Der als comment zu charakterisierende Teil eines Satzes wiederum kann seinerseits zum einen sprachliches Material umfassen, das Bestandteilen der Prä-
54
Christoph Gabriel
supposition entspricht, und zum anderen solches, das den Fokus versprachlicht (vgl. die Darstellung in 2-24.b). Zwei besprochene Phänomene haben weiterhin deutlich werden lassen, dass die Beschränkung auf eine einzige Analysedimension unzureichend ist: So kann beim Satzfokus die Fokusdomäne sprachliches Material umfassen, welches zwar in Bezug auf die konkrete Äußerung nicht als präsupponiert gelten kann, jedoch im Sinne eines Diskurstopic für die Gesprächsteilnehmer bereits zumindest durch den außersprachlichen Kontext präsent ist (vgl. 2-25). Ein Gegenstück hierzu bilden die sog. kontrastiven topics, die wiederum ein kontrastiv fokussiertes Element enthalten (vgl. 2-26). Grundlegend ist weiterhin die Differenzierung zwischen neutralem und kontrastivem Fokus: Während neutraler Fokus eine Leerstelle in der Präsupposition (offene Variable x) durch neue Information 'auffüllt' und Fokusprojektion sowie multiple Foki im Sinne einer diskontinuierlichen Fokusdomäne erlaubt, werden durch kontrastiven Fokus inhaltliche oder formale Korrekturen vorgenommen. Fokusprojektion und multiple Foki sind hierbei ausgeschlossen; ebenso wenig ist kontrastiver Fokus dem Zusammenspiel von Satzzuweisungs- und Fokusprominenzregel unterworfen.
2.2 Fokusmarkierung Die Fokusprominenzregel (FPR) besagt, dass in den Sprachen der Welt fokussiertes Material salienter sein muss als präsupponiertes. Hierfür stehen in den einzelnen Sprachen Mittel zur Verfügung, die jeweils unterschiedlichen formalen Ebenen angehören. Im Folgenden wird ein kurzer Überblick über die unterschiedlichen Oberflächenkorrelate der FHG in verschiedenen Sprachen gegeben. Dabei gehe ich zunächst allgemein auf mögliche Strategien der Fokusmarkierung ein und bespreche hierbei insbesondere die morphologischen Verfahren in typologisch so unterschiedlichen Sprachen wie Wolof, Türkisch, Kharia und Lateinisch (Abschnitt 2.2.1), bevor ich die teilweise bereits ansatzweise besprochenen Verfahren der Fokusmarkierung durch intonatorische und syntaktische Mittel im Spanischen und in den beiden romanischen Kontrastsprachen Französisch und Italienisch zusammenfassend darstelle (Abschnitte 2.2.2 und 2.2.3).
2.2.1 Verfahren der Fokusmarkierung In Abschnitt 2.1 wurde zur Veranschaulichung der besprochenen informationsstrukturellen Dichotomien mit dem Deutschen und dem Spanischen auf zwei Sprachen zurückgegriffen, die zum Ausdruck der FHG syntaktische und
2. Grundlagen
55
phonologische Mittel nutzen. Darüber hinaus verfügen das Deutsche und das Spanische auch über bestimmte lexikalische Mittel, die zur Fokusmarkierung verwendet werden. So ist beispielsweise das Auftreten einer sog. Fokus- oder Gradpartikel wie sp. sólo 'nur' an die Bedingung geknüpft, dass diese unmittelbar Skopus über eine fokussierte Konstituente hat (2-35.a und c). Hingegen sind Strukturen, in denen sólo präsupponiertes Material dominiert, nicht oder kaum akzeptabel (2-35.b und d). Wie die jeweiligen Übersetzungen der Beispiele deutlich machen, gilt dies auch für deutsche Fokuspartikeln wie beispielsweise nur. (2-35) a.
b.
c. d.
sp.
(Kontext: 'Was hat Maria gekauft?') Maria comprò F[sólo un DIArio\f (Probablemente se le olvidó comprar también la revista de crucigramas) 'Maria hat nur eine Zeitung gekauft. (Wahrscheinlich hat sie vergessen, auch das Rätselheft zu kaufen.)' *Sólo María compró F [im DIArio]r *V[Eine Zeitungjp hat nur Maria gekauft.' (Kontext: 'Wer hat die Zeitung von heute gelesen?') El diario de hoy, lo leyó T[sólo MaRIa]F 'Die Zeitung von heute, die hat nur Maria gelesen.' *Sólo el diario de hoy, lo leyó F[MaRIa]F *'Nur die Zeitung von heute, die hat Maria gelesen.'
Wichtig ist, dass derartige Fokus- oder Gradpartikeln grundsätzlich zusätzlich zu anderen, formalen Korrelaten der FHG hinzutreten können (prosodische Prominenz in 2-35.a und c, Endstellung der Fokuskonstituente in 2-35.c), dass sie aber für sich alleine keine Fokusmarkierung leisten können. So ist die Abfolge in (2-35.b) nur mit einer anderen informationsstrukturellen Gliederung (kontrastive Lesart; Kontext: 'Nur Julia hat eine Zeitung gekauft, nicht wahr?') und damit auch mit einer unterschiedlichen prosodischen Gestaltung denkbar: Sólo ^[MaRIa^^ comprò un diario. Die in (2-35.d) exemplifizierte lineare Abfolge, bei der die Fokuspartikel unmittelbar dem links-dislozierten Objekt vorausgeht, ist dagegen auch in einem anderen Kontext und mit einer abweichenden prosodischen Gestaltung nicht denkbar, da die unmittelbar von sólo dominierte Konstituente [dpel diario de hoy] durch das im Kernsatz auftretende resumptive Klitikon lo eindeutig als topic und damit als Bestandteil der präsupponierten Information markiert ist (CLLD). 32 Da lexikalische Mittel Ohne Klitikon wäre hier wiederum eine kontrastive Lesart möglich: (i) (Kontext: 'Maria hat alle Zeitungen gelesen, nicht wahr?') sp. rlSólo el diario de [hoc HOY]]^ leyó Maria (y no todos los diarios) Hierbei handelt es sich um eine sog. Fokusvoranstellungsstruktur (foco antepuesto), auf die im folgenden Abschnitt genauer eingegangen wird.
56
Christoph
Gabriel
- zumindest in den hier interessierenden Sprachen - kein primäres Korrelat der FHG sein können, werden sie im Rahmen der vorliegenden Studie von einer weiteren Betrachtung ausgeschlossen.33 Werfen wir nun einen Blick auf Sprachen, in denen zur Vermittlung der informationsstrukturellen Gliederung teilweise oder vorwiegend auf morphologische Mittel zurückgegriffen wird. Hierbei ist eine Klassifizierung der entsprechenden Einheiten als (klitische) Partikeln oder Affixe oft nicht unproblematisch, da diese zum Teil deutliche Affixeigenschaften aufweisen, zum Teil aber eher locker an das Bezugswort bzw. die Bezugskonstituente angebunden sind und insofern eher in die Nähe der oben anhand von spanischen Daten exemplifizierten lexikalischen Markierungen durch freie Funktionswörter rücken. Als seltenen Fall einer Sprache, die zur Fokusmarkierung keine phonologischen Mittel nutzt, sondern morphologische mit syntaktischen Verfahren kombiniert, führe ich die u.a. im Senegal gesprochene westatlantische Sprache Wolof an, die zur Markierung von kontrastivem Fokus verbale Affixe, in Verbindung mit einer syntaktischen Bewegung des fokussierten Materials in die Anfangsposition des Satzes, nutzt. Betrachten wir die folgenden von Rialland/Robert (2001) übernommenen Beispiele; aus Gründen der Übersichtlichkeit umklammere ich jeweils den verbalen Komplex, der je aus einem invariablen lexikalischen Kern sowie einem teils voran-, teils nachgestellten Morphem besteht, in welchem in gebündelter Form die Merkmale für Tempus, Subjektkongruenz in Person und Numerus, Negation sowie für die informationsstrukturelle Gliederung kodiert sein können. (2-36) a.
b.
wf.
[ v lekk na] mburu mi (Rialland/Robert 2001: 898) essen PERF.3SG Brot D +def '[.[Er/sic hat das Brot gegessen.] F ' [ v lekkuma] mburu mi essen:NEG.PERF. ISG Brot D +def ceebbi \vlaa lekk] (Rialland/ Robert 2001: 897) ReisD+dcf
KONTR.OBJ.PERF.1SG
essen
'Ich habe nicht das Brot gegessen. Ich habe den F [ F o c Reis] F gegessen.'
Beispiel (2-36.a) weist die als zugrunde liegend angenommene Wortstellung (S)VO und damit eine neutrale (Satzfokus-)Lesart auf; der „inflectional marker conveying the grammatical modifications of the verb" (Rialland/Robert 2001: 895) kodiert Tempus und Subjektkongruenz (3. Person Singular), ist 33
Für Genaueres zu den Fokuspartikeln des Spanischen vgl. Kovacci (1999: 772-778); zum Deutschen siehe u.a. Zifonun/Hoffmann/Strecker (1997: 888-893).
2. Grundlagen
57
aber in Bezug auf etwaige informationsstrukturelle Merkmale nicht spezifiziert. Wird hingegen, wie im zweiten Satz aus Beispiel (2-36.b), die ObjektDP kontrastiv fokussiert, erscheint diese nicht in der postverbalen Basis-, sondern in der Initialposition des Satzes. Zusätzlich zu dieser syntaktischen Markierung liegt hier mit der sog. 'emphatischen' Konjugation eine morphologische Fokusmarkierung vor, und zwar insofern, als aus der overten Form des verbalen Flexionsmorphems laa nicht nur die Subjektkongruenz (1. Person Singular) ersichtlich ist, sondern hieraus auch eindeutig abzulesen ist, dass das Komplement kontrastiv fokussiert wird.34 Wichtig ist zu betonen, dass eine zusätzliche intonatorische Markierung des kontrastiven Fokus nicht vorliegt, d.h. dass sich die Intonationskontur des zweiten Satzes aus (2-36.b) ceeb bi laa lekk nicht von einer neutralen Struktur wie der in (2-36.a) unterscheidet.35 Rialland/Robert fassen wie folgt zusammen: The prosodic system of Wolof has an unusual typological feature: focus is not marked by intonation, entails no change in the melodic contour of the utterance, and has no role in its prosodic substructuring. This situation can be explained by a morphosyntactic feature of the language, the expression of focus by a special set of conjugations. Focus is thus grammaticalized, and morphologically expressed in the verb inflection; it therefore does not require a further suprasegmental marking (Rialland/Robert 2001: 932).
Betrachten wir anschließend hieran einige Beispiele aus typologisch so unterschiedlichen Sprachen wie der im indischen Bundesstaat Jharkand gesprochenen Mundasprache Kharia36, der Bantusprache Kikuyu, den beiden südwestlichen Turksprachen Türkeitürkisch und Aserbaidschanisch sowie dem Klassischen Latein. Diese Sprachen gleichen sich allesamt darin, dass sie -
34
35
36
Wäre hingegen das Subjekt kontrastiv fokussiert (Typ: 'ICH habe das Brot gegessen, und nicht er'), müsste die entsprechende Form maa (+Verb) lauten; stünde die Verbform selbst im Fokus (Typ: 'Ich habe das Brot geGESsen, und nicht weggeworfen.'), dann käme bei der 1. Person Singular das Morphem dama zum Einsatz. Für entsprechende Konjugationstabellen vgl. Rialland/Robert (2001: 895) und die dort zitierte Literatur. In beiden Fällen liegt eine sog. flache Kontur vor, die durch zwei phrasenbegrenzende Tieftöne und einen finalen tiefen Grenzton L% gekennzeichnet ist (wobei auf den einleitenden Tiefiton ein Hochton folgen kann; vgl. (ii)). Die beiden Grundmuster für Äußerungen mit einer Intonationsphrase lassen sich nach Rialland/Robert (2001: 931) wie folgt charakterisieren: (i) ,p( a a ...aa )IP L LL% (ii) ,P( a a ...aa ),P L H L L% Ich danke John Peterson (Osnabrück) für die entsprechenden Beispiele aus dem Kharia; die in den Beispielen verwendete Transliteration richtet sich nach Peterson (2007).
58
Christoph Gabriel
anders als das Wolof - die Vermittlung der FHG nicht durch verbale Affixe, sondern mithilfe von an die jeweilige fokussierte Konstituente tretenden grammatischen Morphemen leisten.37 Hierbei ist wiederum zu unterscheiden zwischen Sprachen, die dieses Verfahren auch im Bereich der Deklarativa nutzen (Kharia und Kikuyu), und solchen, in denen eine morphologische Markierung der Fokusdomäne auf Fragesätze begrenzt ist (Türkisch und Lateinisch). Ich beginne mit dem Kharia. (2-37) a.
b.
c.
kh.
Behar akbar-te soq-o? ? (John Peterson, p.c.) wer Zeitung:oBL kaufen: A K T . P E R F ( 3 S G ) W 'Wer hat die Zeitung gekauft?' f\Meri-ga\f soq-o? Mary:roc kaufen:AKT.PERF(3SG) 'Mary hat (die Zeitung) gekauft.' (Kontext: 'Peter hat die Zeitung gekauft, oder?') T\fXMeri-ko]Y soq-o? Mary:KONTR
k a u f e n : A KT. PERF(3 SG)
'Mary hat (die Zeitung) gekauft (und nicht Peter).'
Der Kontrast zwischen (2-37.b und c) exemplifiziert die in Abschnitt 2.1.3 besprochene Unterscheidung zwischen neutralem und kontrastivem Fokus: Während das durch die Wh-Frage (2-37.a) als Informationsfokus identifizierte Subjekt in (2-37.b) mit dem neutralen Fokussuffix -ga markiert wird, erzwingt die Verwendung des Morphems -ko in (2-37.c) eine kontrastive Lesart. Ein weiteres Beispiel für eine Sprache, in der für den Ausdruck der FHG morphologische Mittel vorliegen, ist die in Kenia und Tansania gesprochene Bantusprache Kikuyu (vgl. Schwarz 2003), die mit ne über eine klitische Fokuspartikel verfügt. Diese findet sowohl in Fragesätzen als auch in Deklarativa zur Markierung der Fokusdomäne Verwendung. Betrachten wir hierzu die folgenden Beispiele: Für weitere Sprachen, die die Fokusdomäne mithilfe von morphologischen Mitteln markieren, siehe Gundel (1988: 220f.), die u.a. Beispiele aus dem Quechua anführt. Die geklammerten Merkmale für 3. Person Singular entsprechen keinem morphologisch overten Suffix und stellen die im entsprechenden Fall anzunehmenden Default-Werte dar. Auf die Diskussion um die Annahme von Null-Suffixen in entsprechenden Kontexten, was im konkreten Fall als soq-o? -0 zu notieren wäre, soll an dieser Stelle nicht eingegangen werden. In gleicher Weise betrifft dies auch die weiter unten angeführten Beispiele aus dem Türkeitürkischen, wo die erste und die zweite Person im Perfektparadigma durch die Affixe -Im, -In (Singular) bzw. -tk, -ntz (Plural) ausgedrückt werden, der Default-Fall der dritten Person jedoch keiner morphologischen Markierung entspricht. Die Desambiguierung Singular vi. Plural erfolgt im Bedarfsfall durch das Anfügen des (nominalen) Pluralsuffixes -lEr an die jeweiligen Tempus- und/oder Modusmorpheme, z.B. al-di-lar kauf: PERF:(3)PL 'sie haben gekauft'.
2. Grundlagen
59
(2-38) a.
kik. nekee Abdul aranyuire? Ne mae Abdul aranyuire Foc:was39 Abdul trank FOCWasser:AKK Abdul trank 'Was hat Abdul getrunken? - Abdul hat Wasser getrunken.' Abdul aranyuire kee?Abdul aranyuire mae Abdul trank was Abdul trank Wasser:AKK 'Was hat Abdul getrunken? - Abdul hat Wasser getrunken.' Abdul nearanyuire mae? Abdul nearanyuire mae Abdul Focrtrank WassenAKK Abdul FOC:trank Wasser:AKK 'Hat Abdul Wasser getrunken? - (Ja.) Abdul hat Wasser getrunken.' (Schwarz 2003: 54)
b.
c.
Der beiden Frage-Antwort-Paare in (2-38.a) und (2-38.b) zeigen, dass bei Wh-Fragen das Fragewort entweder in die Anfangsposition des Satzes bewegt wird oder in situ verbleiben kann. Erfolgt Wh-Bewegung, dann wird das Fragewort (hier: kee 'was') zusätzlich durch die (proklitische) Fokuspartikel ne markiert. Eine angemessene Antwort entspricht jeweils der Konstruktion des entsprechenden Interrogativsatzes: Während bei (2-38.a) im Antwortsatz das eng fokussierte Objekt in die Anfangsposition bewegt und mit der Fokuspartikel ne versehen wird, verbleibt es in (2-38.b) in situ.40 In (2-38.c) liegt hingegen eine Ja/Nein-Frage vor, die obligatorisch mit einer Satzfokuslesart verbunden ist. Die Fokuspartikel ne klitisiert hier bei neutraler Wortstellung (SVO) an das Verb; der antwortende Deklarativsatz ist nur durch die Intonation vom entsprechenden Fragesatz zu unterscheiden (Schwarz 2003: 55). Ohne an dieser Stelle weiter auf die Daten des Kikuyu eingehen zu können, ist für unsere Zwecke festzuhalten, dass hier die Vermittlung der FHG nicht allein durch morphologische Mittel, sprich durch Position und Skopus der Fokuspartikel ne, sondern auch durch die Wortstellung (und Intonation) geleistet wird. Werfen wir nun einen Blick auf die südwestlichen Turksprachen Türkeitürkisch und Aserbaidschanisch. Anders als in den bisher besprochenen Sprachen Wolof, Kharia und Kikuyu ist hier die Verwendung morphologischer Mittel auf Ja/Nein-Fragen beschränkt, wobei die Fokusdomäne durch die Position der nachgestellten Interrogativpartikel mi angezeigt wird. Die Großschreibung des Vokals besagt, dass dieser gemäß der sog. kleinen oder vierförmigen Vokalharmonie variiert, was für eine enge Anbindung an das vorausgegangene Wort (und damit für eine Klassifizierung als Suffix) spricht. Allerdings spricht die Tatsache, dass der Wortakzent nicht auf das Interroga-
39
40
In morphologischen Glossaren steht FOC für 'Fokuspartikel, -morphem'. Dies ist nicht zu verwechseln mit dem Merkmal Foc, welches den kontrastiven Fokus bezeichnet. Ein Bedeutungsunterschied zwischen den beiden Fragekonstruktionen besteht nach Schwarz (2003: 55) nicht.
60
Christoph Gabriel
tivmorphem übergeht, w i e e s bei suffigierten M o r p h e m e n normalerweise der Fall ist, g e g e n eine Integration von mi in das p h o n o l o g i s c h e Wort und damit eher für eine Charakterisierung als (klitische) Partikel. 41 (2-39) a.
ttü.
b.
c.
d.
e.
az.
Ay§e gazeteyi aldi mi? Ay§e Zeitung:AKK kaufen:PERF(3SG) INT 1. Lesart: 'Hat Ay§e die Zeitung gekauft?' (neutral) / 2. Lesart: 'Hat Ay§e die Zeitung geKAUFT (und nicht geklaut)?' Ayje mi gazeteyi aldi? Ay§e INT Zeitung:AKK kaufen:PERF(3SG) 'Hat AY§e die Zeitung gekauft?' Ay$e gazeteyi mi aldi? Ay§e Zeitung:AKK INT kaufen:PERF(3SG) 'Hat Ayje die ZEItung gekauft?' Bu ma^in tszami? (Rahmati/Bugday 1998:8) dieses Auto neu:INT 1. Lesart: 'Ist dieses Auto neu?' (neutral) / 2. Lesart: 'Ist dieses Auto NEU (und nicht vielleicht doch schon etwas älter)?' Bu mafinmi tszg? (ibid.) dieses Auto:INT neu 'Ist dieses AUto neu?'
D i e Endpositionierung von mi in (2-39.a) erlaubt e n t w e d e r e i n e neutrale Satzfokuslesart oder e i n e Lesart mit fokussierter Verbform, w o b e i die D i f f e r e n z i e rung z w i s c h e n den beiden interpretatorischen Varianten prosodisch erfolgt ( e b e n s o i m aserbaidschanischen B e i s p i e l 3-39.d). D a g e g e n entspricht die Fok u s d o m ä n e in ( 2 - 3 9 . b und c ) j e w e i l s genau derjenigen XP, über w e l c h e die Interrogativpartikel mi S k o p u s hat. G l e i c h e s lässt sich auch anhand der aserbaidschanischen B e i s p i e l e zeigen: In (2-39.d) liegt e n t w e d e r (neutraler) Satzf o k u s oder Fokussierung d e s Adjektivs vor; 42 in ( 2 - 3 9 . e ) umfasst die Fokusdomäne die unmittelbar von mi dominierte Konstituente [bu ma§m] 41
42
43
43
Man vergleiche die jeweils endbetonten türkeitürkischen Verbformen a(al!)m 'kauf!', 'ihr habt gekauft' mit entsprechenden w(al-Dl) (swer] (ALC5 7, C M M 5 7, M A 5 J 7 , L R 5 7 )
'seinem/ihrem Bruder' b.
mi^obligación
/mi o/
[mjoj (Navarro Tomás
25
1991 [1932]: 7 1 )
'meine Pflicht' c.
quiere^hablar
/re a/ —> [r(a)a]
(ibid.)
'er/sie will sprechen' d.
le da^el diario /da el/ —> [öal]
(MK5_3)
'er/sie gibt ihm die Zeitung'
keine vokalische Realisierung möglich ist, z.B. hierro 'Eisen' *[i.ero]. Zum Status der Diphthonge im Spanischen vgl. auch Hualde (1999).
72
Christoph
e.
Gabriel
le dio^el diario /dio el/ —> [5jol] (LR5_7) 'er/sie gab ihm die Zeitung' mutuo^amor /tuo a/ —> [twoa] (Navarro Tomás 251991 [1932]: 72) 'gegenseitige Liebe' siete I u^ocho /te u o/ —> [te.wo] (Navarro Tomás 251991 11932]: 151) 'sieben oder acht' pro llamaba Milicia [ma(:)] / La^Habana [la(:)] (Guitart 2004: 203) 'Er/sie ruft Alicia an.' / 'Havanna'
f. g.
h.
Ob die in (2-54) exemplifizierten Sandhi-Prozesse tatsächlich eintreten oder nicht, hängt nicht nur von der Sprechgeschwindigkeit, sondern auch essenziell von der informationsstrukturellen Gliederung der jeweiligen Äußerung ab. So scheint sinalefa tendenziell dann blockiert zu sein, wenn die Kontraktion über den (linken oder rechten) Rand einer fokussierten Konstituente hinweg erfolgen müsste. Wie die beiden folgenden Beispiele zeigen, betrifft dies sowohl neutralen (engen) als auch kontrastiven Fokus. (2-55) a.
sp.
(Kontext: 'Was gibt Maria ihm Bruder?') María le da F[e/ DIArio]? a su hermano (MK2_5) / *le da^el diario 'Maria gibt ihrem Bruder die Zeitung.' (Kontext: 'Maria gibt die Zeitung Julias Bruder, nicht wahr?') No. Maria le da el diario a [ F O C SU]F hermano (ALC2_7) / *suJiermano 'Nein. Maria gibt die Zeitung IHrem (eigenen) Bruder.'
b.
F
Sofern keine informationsstrukturelle Grenze überschritten wird, ist sinalefa jedoch unproblematisch: Die entsprechende Vokalkontraktion tritt sowohl innerhalb von präsupponiertem Material als auch in der Fokusdomäne auf (vgl. Abschnitt 4.3.1). (2-56) sp.
(Kontext: 'Was macht Maria am Kiosk?') (María) (en el kiosco)¡v F[compra el periódico}?
I
H-
(LR16)
I
H-
Ein kurzer Seitenblick auf das Europäische Portugiesisch ist an dieser Stelle insofern interessant, als auch hier bestimmte phonologische Prozesse in Abhängigkeit von der durch die FHG bestimmten prosodischen Gliederung erfolgen bzw. nicht erfolgen: So bilden iop/c-Konstitueriten nach Frota (2002) eine eigene Intonationsphrase (IP) aus, was bewirkt, dass ein wortfinaler Sibilant
2.
73
Grundlagen
am rechten Rand der entsprechenden IP - ebenso wie in präkonsonantischer und in absoluter Auslautposition - postalveolar als [J] realisiert wird (2-57.a). Ist dagegen bei gleicher Wortstellung das Subjekt (kontrastiv oder neutral) fokussiert, dann liegt hier keine IP-Grenze vor, und der entsprechende Sibilant wird - wie in anderen IP-internen VCV-Kontexten - als stimmhafter alveolarer Frikativ [z] realisiert (2-57.b). (2-57) a.
b.
port. (A[z\ angolana\\\)\r(ofereceram especiaria\7.\ aos jornalista[\\)\p 'Die Angolanerinnen, sie boten den Journalisten Gewürze an.' C4[z) ANGOLANA[z] ofereceram especiaria[zJ aos jornalista\\Y)\p 'Die ANGOLANERINNEN boten den Journalisten Gewürze an.' (Frota 2002: 320)
Die zusammenfassende Darstellung der sprachlichen Mittel, die im Spanischen zur Vermittlung der FHG genutzt werden, hat nicht zuletzt deutlich werden lassen, dass das Zusammenspiel von syntaktischer und phonologischer Komponente in stärkerem Maße Variation erlaubt, als in weiten Teilen der Literatur angenommen wird. So lässt sich insbesondere die weit verbreitete Auffassung, eng fokussierte (und qua FPR prosodisch hervorgehobene) Konstituenten seien nur in satzfinaler Position grammatisch, zumindest in der rigiden Form, wie sie beispielsweise Zubizarreta (1998, 1999) vertritt, kaum aufrecht erhalten. Interessant ist weiterhin, dass die Akzeptabilität von in Anfangsposition fokussierten Subjekten offensichtlich in Abhängigkeit von der andernfalls zu bewegenden Menge an overtem Material deutlich zunimmt: So scheinen die Sprecher bei voll besetzter Objektposition die Anfangsposition des (nicht-kontrastiv) eng fokussierten Subjekts deutlich zu bevorzugen, während bei klitischen Objekten eindeutig das Gegenteil der Fall ist. Offensichtlich spielen also Fragen der derivationellen Ökonomie bei der Wahl der sprachlichen Mittel durch den Sprecher durchaus eine Rolle. Eine plausible Modellierung muss in der Lage sein, derartige Faktoren mit einzubeziehen. Im folgenden Abschnitt werden die entsprechenden Strategien der Fokusmarkierung im Französischen und im Italienischen in knapper Form dargestellt. Auch hier ist bereits auf entsprechende Variation hinzuweisen.
2.2.3 Fokusmarkierung im Französischen und im Italienischen Vergleicht man die im Französischen und im Italienischen genutzten Verfahren der Fokusmarkierung mit denen des Spanischen, so ist zunächst festzuhalten, dass auch hier die Vermittlung der FHG im Wesentlichen durch die Inter-
74
Christoph Gabriel
aktion von Syntax und Phonologie geleistet wird. Allerdings ist die Gewichtung von syntaktischer und phonologischer Komponente jeweils anders beschaffen: Während das Spanische mit seiner großen Anzahl prinzipiell möglicher Wortstellungsmuster syntaktisch recht flexibel ist und durch Umordnung der Konstituenten auf das zumindest der Norm nach vergleichsweise strikte prosodische Gesetz des obligatorisch rechtsperipheren Nuklearakzents reagieren kann, ist die Wortstellung des Französischen deutlich weniger manipulierbar. Dies wird wiederum durch eine größere Mobilität des Satzakzents und durch eine weitere Distribution spezieller syntaktischer Konstruktionen wie der phrase clivée (Spaltsatz) ausgeglichen. Das Italienische schließlich nimmt, wie zu zeigen sein wird, zwischen diesen beiden Polen eine Art Mittelstellung ein. Betrachten wir nun genauer die Versprachlichungsstrategien des Französischen und des Italienischen, die den im vorangegangenen Abschnitt besprochenen spanischen Strukturen entsprechen. Die anhand deutscher und spanischer Beispiele gezeigte Möglichkeit der Ausweitung der Fokusdomäne mittels Fokusprojektion bei neutraler Wortstellung und rechtsperipherem Satzfokus (vgl. Beispiele 2-12 bzw. 2-42 und 2-43) besteht im Französischen und im Italienischen gleichermaßen und muss hier nicht gesondert besprochen werden. Betrachten wir zuerst die Möglichkeiten der neutralen Fokussierung des direkten Objekts in Konstruktionen mit einem zwei- bzw. dreiwertigen Verb und einem Lokaladjunkt. (2-58) a. b.
fr.
c. c.' d. it. e. f. (2-59) a. fr. b. b.' c. d. e. f.
it.
(Kontext: 'Was kauft Maria am Kiosk?') * Marie achète F[unjournal]F au KIOSQUE Marie achète au kiosque F|un jourNAL]F (kein Beleg) Marie achète F[un jourNAL]Fau kiosque (FMI_2) Marie achète F[UN jourNAL]F au kiosque (HG1_2) *Maria compra F[un giornale\Fal CHIOSco Maria compra al chiosco F[un giorNAle\F (MZ1_2) Maria compra F[un giorNAle]F al chiosco (AC1 _2) (Kontext: 'Was gibt Maria ihrem Bruder?') * Marie donne F[le journal]F à son FRÈRE Marie donne à son frère F[le jourNAL]F (kein Beleg) Marie donne à son frère F[le journal qu 'elle a acheté au kiosque]F (HG2 5) Marie donne F[le jourNAL]F à son frère (JD2_5) * Maria da F[il giornale]Fa suofraTELlo Maria da a suo fratello F[il giorNAle]F (kein Beleg) Maria da F[il giorNAle]Fa suo fratello (AP_2)
SVLok F [0] F SV F [0] F Lok SV F [0] F Lok SVLok F [0] F SV F [0] F Lok
SViO F [dO] F SViO F [dO] F SV F [dO] F iO SViO F [dO] F SV F [dO] F iO
2.
Grundlagen
75
Wie auch im Spanischen sind jeweils die Strukturen, welche mit den Abfolgen bzw. die zugrunde liegende Anordnung der Komplemente und einen rechtsperipheren Nuklearakzent aufweisen, unangemessene Antworten auf die Frage nach dem direkten Objekt (Verletzung der Fokusprominenzregel in 2-58.a und 2-59.a). In Bezug auf die Lösungsstrategien unterscheiden sich die beiden hier diskutierten Sprachen jedoch beträchtlich vom Spanischen, und zwar insofern, als hier die Verwendung der syntaktischen Strategie (Umordnung der Konstituenten) deutlich eingeschränkt ist. Die in (2-58.b, 2-59.b) gezeigte Abfolge SVLok F [0] F bzw. SViO F [dO] F ist zwar laut Zubizarreta (1998: 147) für das Französische eine mögliche Option, doch weist mein französisches Korpus keine entsprechenden Belege auf. Anders ist die Sachlage, wenn das fokussierte direkte Objekt durch einen Relativsatz erweitert ist wie in (2-59.b'). Die dem ersten Behaghelschen Gesetz entsprechende (vgl. Abschnitt 2.1) und in der generativen Tradition als heavy shift beschriebene Tendenz, syntaktisch komplexe Konstituenten am rechten Rand des Satzes zu platzieren, bestätigt sich auch darin, dass die französischen Vpn im Rahmen des Grammatikalitätsbewertungstests beim durch einen Relativsatz erweiterten fokussierten direkten Objekt fast ausschließlich für die in (2-59.b') exemplifizierte Anordnung optieren, während bei einem nur aus einer DP bestehenden fokussierten Objekt durchgehend die prosodische Hervorhebung des fokussierten Materials in situ bevorzugt wird (2-58.C, c', 2-59.c). Interessant ist, dass bei der prosodischen Hervorhebung des eng fokussierten direkten Objekts in situ im Französischen eine größere Flexibilität herrscht als in Sprachen mit lexikalisch distinktivem Wortakzent. So kann - wie in (2-58.c') durch die Großschreibung angedeutet - zusätzlich zu dem regelmäßig auf der letzten Silbe eines mot phonétique realisierten Wortgruppenakzent ein Initialakzent treten (für Genaueres hierzu vgl. Jun/ Fougeron 2000, 2002 und Abschnitt 3.2.2). Es lässt sich also sagen, dass das Französische im Gegensatz zum Spanischen eine deutliche Tendenz zur Fokussierung in situ aufweist, wobei nur besonders komplexe Konstituenten eine Ausnahme bilden. Wie die Beispiele (2-58.e, f) zeigen, sind im Italienischen sowohl Fokussierung in situ als auch Umordnung der Konstituenten möglich, zumindest wenn es um ein direktes Objekt und ein Lokaladjunkt geht. 56 Handelt es sich hingegen um zwei interne Argumente, dann ziehen die Sprecher eine Verlagerung des Akzenttons auf das in situ befindliche direkte Objekt einer Umord-
D e m entsprechen die Ergebnisse des Grammatikalitätsbewertungstests: Jeweils die Hälfte der Vpn bevorzugt die Umordnung der Konstituenten ( 2 - 5 8 . e ) bzw. prosodische Hervorhebung des fokussierten direkten Objekts in situ (2-58.f); vgl. i m Einzelnen Kapitel 4.
76
Christoph Gabriel
nung der Konstituenten deutlich vor: Das Korpus weist für die Variante (2-59.e) keinen Beleg auf, und auch die von Frascarelli befragten Informanten stufen die Abfolge SViOF[dO]F als marginal ein (vgl. Frascarelli 2000: 104f.; 188, Anm. 27). Wenden wir uns anschließend dem Fall des neutral fokussierten Subjekts zu: (2-60) a. b. c. d. e. f. g. h.
fr.
it.
(2-61) a. b. c. d. e. f. g. h.
fr.
it.
(Kontext: 'Wer entführt Tarzan?') F [Blanche NEIGE] f kidnappe Tarzan (FM34) F [BLANCHE Neige]F kidnappe Tarzan (KT34) C'est ^[Blanche Neige]? qui kidnappe Tarzan (JD3_4) * {Kidnappe Tarzan / le kidnappe) F[Blanche NEIGE]? rapisce Tarzan (AC3_4) f[BiancaNEve]f E r[BiancaNEve]f che rapisce Tarzan (EC3 4) llRapisce Tarzan f[BiancaNEve]F 57 Lo rapisce r[BiancaNEve]f (Kontext: 'Wer gibt die Zeitung seinem/ihrem Bruder?') (AG2_3) r[MaRIE]f donne le journal à son frère f[MArie\f donne le journal à son frère (KT2_3) C'est f[MaRIE]r qui donne le journal à son frère * [Donne le journal à son frère / Le lui donne} F lMArie]? da il giornale a suo fratello (MZ2_1) f[MaRIA]f E f[MaRIA]f che da il giornale a suo fratello 11 Da il giornale a suo fratello F[MaRIA]F Glielo da f[MaRIA]f
Bei der Markierung von nicht-kontrastiv fokussierten Subjekten stellt das Französische insofern eine Art Gegenpol zum Spanischen dar, als hierbei die Endstellung kategorisch ausgeschlossen ist, und zwar vollkommen unabhängig davon, ob die internen Objekte durch klitische Proformen oder volle DPn repräsentiert werden (2-60.d, 2-6l.d). Stattdessen erfolgt Fokusmarkierung durch prosodische Hervorhebung in situ, wobei auch hier wiederum Variation in Bezug auf die Platzierung des fokalen Akzenttons gegeben ist; vgl. in Blanche NEIGE und MaRIE in (2-60.a, 2-6l.a) bzw. BLANCHE Neige und MArie in (2-60.b, 2-6l.b). Eine weitere Option zur Markierung eines neutral fokussierten Subjekts ist die Wahl des Spaltsatzes (2-60.C, 2-6l.c). Das Italienische gleicht dem Spanischen darin, dass es bei klitischen Objekten eindeutig die finale Position des fokussierten Subjekts bevorzugt (2-60.h, 2-6l.h). Etwas anders ist die Sachlage jedoch bei Konstruktionen mit einer oder mehWie Samek-Lodovici zeigt, kommt Fokusendstellung auch in Kombination mit rechtsdislozierten iop/c-Konstituenten vor, vgl. it. Le ha parlato >.|Gianni]^ a Maria (SamekLodovici 2004: 20f.).
77
2. Grundlagen
reren vollen Objekt-DPn: Die oben in Anlehnung an Belletti (2001: 70f.) vorgenommene Bewertung der Stellungsvarianten (2-60.g und 2-61.g) als stark markierte Strukturen wird durch die Grammatikalitätsurteile der italienischen Vpn in meinem Korpus eindeutig gestützt (vgl. Abschnitt 4.3.3). Abweichend hiervon nimmt Samek-Lodovici an, dass die Abfolge VO F [S] F im Italienischen grammatisch sei: „[In Italian] focused subjects follow objects" (2001: 343). Als Beleg führt er folgendes Frage-Antwort-Paar an: (2-62)
it.
Chi chiamerà la polizia? - Chiamerà la polizia F [Man'a] F (Samek-Lodovici 2001: 343) 'Wer wird die Polizei rufen?' - 'MaRIa wird die Polizei rufen.'
Nach den Angaben bei Costa (2001b) ist VO F [S] F sogar die im entsprechenden Kontext einzig mögliche Abfolge (vgl. auch Costa 2001a: 101f.): (2-63)
it. a. b.
Chi ha scritto lettere d'amore? *y[Beatrice\y ha scritto lettere d'amore Ha scritto lettere d'amore F[Beatrice\F (Costa 2001 b: 188) 'Wer hat Liebesbriefe geschrieben?' - 'BeaTRIce hat Liebesbriefe geschrieben.'
Auch Ordónez (2000) nimmt zwar an, dass VOS im Italienischen prinzipiell möglich sei, weist jedoch darauf hin, dass in Bezug auf die Bewertung derartiger Strukturen unter den Autoren wenig Einigkeit herrscht (vgl. 2000: 73). Seiner Meinung nach spielen hierbei weitere Faktoren wie beispielsweise die Beschaffenheit von Objekt- und Subjekt-DP in Bezug auf die Definitheit eine gewisse Rolle. Allerdings bleibt er diesbezüglich in seinen Ausführungen relativ vage, und so wird auch nicht ganz klar, wieso die fragliche Wortstellung teils bei einem indefiniten Subjekt (2-64.a), teils bei einem indefiniten Objekt (2-64.b, c) als grammatisch bewertet werden sollte. 58 (2-64) a. b. c.
it.
Ha recensito il libro ¡-¡un professore]F 'Ein ProFESsor hat das Buch rezensiert.' Le ha cantato una canzone r[Paolo\f 'PaOlo hat für sie ein Lied gesungen.' Ti ha dipinto un quadro r[Sandro\r 'SANdro hat für dich ein Bild gemalt.'
(Ordónez 2000: 72) (ibid.) (ibid.)
Plausibler erscheint hier die von Belletti (2001) vorgeschlagene Herangehensweise. Die Autorin betont, dass die Abfolge VOS im Italienischen zwar
Die beiden von mir befragten Informanten akzeptieren die entsprechenden Strukturen bestenfalls als marginal grammatisch.
78
Christoph Gabriel
grundsätzlich möglich, im Normalfall aber stark markiert und nur dann als vollkommen akzeptabel einzustufen sei, wenn die dem fokussierten Subjekt vorausgehende Abfolge aus Verb und Objekt eine für den jeweiligen sprachlichen Kontext prototypische Situation versprachlicht und damit semantisch weniger komplex ist, wie das einer Fußballreportage entnommene Beispiel (2-65.a) zeigt. Wird durch V+Obj hingegen auf eine Handlung Bezug genommen, die im gegebenen Kontext zwar möglich, aber nicht prototypisch ist, dann ist VOS bestenfalls marginal grammatisch (vgl. 2-65.b). (2-65) a. it.
Mette la palla sul dischetto del rigore F[Ronaldo\F (Belletti 2001: 71) 'RoNALdo legt den Ball auf die Elfmetermarke.'
b.
llSpinge l'arbitro r[Ronaldo]f
{ibid.)
'RoNALdo stößt den Schiedsrichter.'
In einer solchen Sichtweise, die die Semantik mit einbezieht, scheint auch die im Vergleich mit (2-60) und (2-61) höhere Akzeptabilität von (2-64) plausibel: Die dort bezeichneten Handlungen 'ein Buch rezensieren', 'ein Lied singen' und 'ein Bild malen' stellen jeweils Vorgänge dar, die im Weltwissen der Sprecher als 'Normalfalle' prototypischer Handlungsweisen gelten können. Damit sind die entsprechenden Konstruktionen zwar nicht syntaktisch, jedoch semantisch-pragmatisch weniger komplex als eindeutig weniger prototypische Handlungen wie 'Tarzan entführen' (2-60.g), 'seinem Bruder die Zeitung geben' (2-61.g) oder 'den Schiedsrichter stoßen' (2-65.b). Genau hier scheint sich ein Anknüpfungspunkt zu der in Abschnitt 2.3.1 erwähnten Abhängigkeit syntaktischer Bewegungen vom Grad der Komplexität der beteiligten Kategorien zu ergeben: Ebenso wie die (FHG-induzierte) Bewegung eines Verbs mit klitischem Objekt in Beispiel (2-60.h) it. Lo rapisce f[BiancaNEve]f aufgrund der geringeren Komplexität ökonomischer ist als die Bewegung eines Verbs mit einer oder mehreren vollen Objekt-DPn (vgl. 2-60.g, 2-6l.g), so scheint auch der Grad an semantisch-pragmatischer Komplexität bei der Wahl zwischen syntaktischer Bewegung und prosodischer Hervorhebung in situ eine gewisse Rolle zu spielen. Kommen wir nun auf die komplexen syntaktischen Strategien zu sprechen, die das Französische und das Italienische bei der Fokusmarkierung nutzen. Interessant ist hierbei zunächst, dass Spaltsätze weder im Französischen noch im Italienischen auf kontrastive Lesart beschränkt sind. Während selbige im Spanischen vorzugsweise, aber - wie die Korpusbeispiele im vorangegangenen Abschnitt gezeigt haben - nicht ausschließlich beim kontrastiven Fokus verwendet werden, setzen Sprecher des Französischen und des Italienischen den Spaltsatz auch zur Markierung von neutral fokussierten Konstituenten ein
2. Grundlagen
79
(vgl. die Korpusbeispiele 2-60.C, f). Ein Unterschied zwischen Französisch und Italienisch besteht nun wiederum darin, dass französische Sprecher - zumindest bei fokussierten Subjekten - der phrase clivée gegenüber der prosodischen Hervorhebung in situ für gewöhnlich den Vorzug geben (vgl. Féry 2001: 161), während die entsprechende Struktur im Italienischen weniger frequent ist. Eine Erklärung für das hohe Vorkommen des Spaltsatzes im Französischen lässt sich eventuell darin sehen, dass diese Konstruktion es ermöglicht, dass das fokussierte Subjekt im Rahmen einer Präsentativstruktur des Typs c 'est + DP in der phonologisch prominenten Endposition erscheint (vgl. fr. ¡¡.(C'est Blanche NEIGE)iP), und zwar ohne dass hierfür eine Umordnung der Konstituenten vonnöten wäre. Die präsupponierte Information (hier: fr. qui kidnappe Tarzan) wird anschließend in Form eines Relativsatzes nachgeliefert. In Bezug auf die Markierung von kontrastivem Fokus gleichen das Französische und das Italienische dem Spanischen darin, dass die entsprechende (lexikalische oder funktionale) Kategorie in jeder syntaktischen Position in situ prosodisch hervorgehoben werden kann. Zumindest beim kontrastiv fokussierten Subjekt findet diese Option jedoch sowohl im Französischen als auch im Italienischen nur wenig Verwendung, da die Mehrheit der Sprecher hier den Spaltsatz bevorzugt. (2-66)
(Kontext: 'Tarzan entführt Schneewittchen, nicht wahr?')
a. fr.
Non, c'est F[F [rjm]), an die prosodische Einheit der Phonologischen Phrase gebunden sind (2-69.a). Interessant ist nun, dass derartige Prozesse genau dann tendenziell blockiert sind, wenn das nachgestellte Adjektiv eng fokussiert wird und aus diesem Grund eine eigene Phonologische Phrase ausbildet (2-69.b). Durch Großschreibung wird angedeutet, dass bei enger Fokussierung von bis
81
2. Grundlagen
zu dreisilbigen Wörtern eine Tendenz zur Anfangsbetonung vorliegt (vgl. Jun/ Fougeron 2000: 224f.). (2-69)
(Kontext: 'Wovon sprechen Sie?') a.
fr.
D'une ?w(loupe grossissante)
/De
la falangite
matemelle)
[dynlubgifosisat] / [dalaläqmateKnel] (Kontext: 'Von welcher Lupe/Sprache sprechen Sie?') D'une loupe nr(GROSsissante) / De la langue nr(MAternelle) [dynlupgKosisät] / |dolaläg ( ; , , mateKnelJ
b.
Für das Italienische lässt sich als Beispiel für den Einfluss der informationsstrukturellen Gliederung auf segmentale Prozesse das sog. raddoppiamento oder rafforzamento sintattico (RS) anführen. Hierunter versteht man die Längung eines Anlautkonsonanten einer betonten Silbe nach einem oxytonen Mehrsilber wie in mangerà [p:]asta 'er/sie wird Pasta essen' oder einem akzentogenen Einsilber wie in più [fi]orte 'stärker' (Schmid 1999: 170f., Waltereit 2004: 40-42). Ebenso wie die oben angeführten Assimilationsvorgänge des Französischen ist auch dieser externe Sandhi-Prozess an die Ebene der PhP gebunden, und zwar insofern, als RS innerhalb einer PhP i.d.R. nicht eintritt (Frascarelli 2000: 26f.), vgl. (2-70.a vs. b). (2-70)
(Kontext: 'Was wird Carlo tun?') a.
it.
Carlo
F[mangerà
pasta con gli amici]F
p h p{Carlo) ^(mangerà
pasta)
(Frascarelli 2000: 29)
P h P (con
gli
amici)
'Carlo wird mit seinen Freunden Pasta essen.' (Kontext: 'Was wird Carlo mit den Freunden essen?') b.
Carlo mangerà PhP (Carlo)
¡¡[pasta]? con gli amici
php (mangerà)
ph p([p:]ajta)
#
(ibid.) PhP(con
gli
amici)
Innerhalb einer größeren Fokusdomäne bildet ein nicht-verzweigendes Komplement wie [ D P pasta] zusammen mit dem regierenden verbalen Kopf eine PhP aus. Bedingung hierfür ist allerdings, dass die betreffende Konstituente nicht die Schlussposition des Satzes einnimmt. Aus diesem Grund erfolgt in (2-70.a) kein RS. Anders ist die Lage in (2-70.b), wo die Objekt-DP im engen Fokus steht und deswegen eine eigene PhP ausbildet. Die Raute '#' kennzeichnet eine kurze Sprechpause, die nach der fokussierten Konstituente realisiert wird. Zusätzlich hierzu erfolgt RS: Die informationsstrukturell bedingt von (2-70.a) abweichende prosodische Phrasierung schlägt sich im segmentalen Korrelat der Gemination [pi] nieder.59
59
Wie Frascarelli (2000: 29) gezeigt hat, tritt dieser Kontrast nur dann zutage, wenn nach dem nicht-verzweigenden Komplement eine weitere Konstituente wie beispielsweise
82
Christoph
Gabriel
2.2.4 Zusammenfassung In diesem Abschnitt wurde zum einen ein exemplarischer Überblick über die in den Sprachen der Welt zum Ausdruck der FHG und insbesondere zur Markierung fokalen Materials genutzten sprachlichen Mittel gegeben, zum anderen habe ich die entsprechenden Fakten des Spanischen und der beiden hier interessierenden romanischen Vergleichssprachen Französisch und Italienisch einer genaueren Betrachtung unterzogen. Dabei sind vor allem drei Dinge deutlich geworden. Erstens obliegt die Vermittlung von FHG und insbesondere von Fokus in keiner der betrachteten Sprachen einzig und allein einer sprachlichen Ebene, sondern es handelt sich vielmehr in allen Fällen um 'Schnittstellenphänomene'. So nutzt beispielsweise die westatlantische Sprache Wolof sowohl verbale Affixe als auch die Wortstellung und kombiniert somit morphologische und syntaktische Verfahren in systematischer Weise miteinander, während sich auf intonatorischer Ebene kein Korrelat der FHG ausmachen lässt. Sprachen wie etwa das Türkeitürkische, die morphologische Mittel wie Fokus- oder Interrogativpartikel nur in begrenztem Maße einsetzen, leisten die Vermittlung der FHG im Wesentlichen durch eine Kombination von phonologischen und syntaktischen Mitteln. Letzteres gilt auch für die romanischen Sprachen. Zweitens ist interessant, dass sich Sprachen, die beispielsweise phonologische und syntaktische Verfahren miteinander kombinieren, jeweils darin unterscheiden, dass den einzelnen Mitteln eine unterschiedliche Gewichtung zukommt. So ist das Spanische beispielsweise bei der syntaktischen Vermittlung der FHG deutlich flexibler als das Französische, dessen Wortstellung weniger Variation erlaubt und das die entsprechende Starrheit durch eine größere Flexibilität bezüglich der Positionierung des Nuklearakzents im Satz ausgleicht. Die Strategien der Fokusmarkierung in Deklarativsätzen mit klitischer bzw. voller Objekt-DP haben schließlich deutlich werden lassen, dass das Italienische sozusagen zwischen diesen Polen anzusiedeln ist: So sind im Italienischen etwa eng fokussierte satzfinale Subjekte im Gegensatz zum Französischen zwar prinzipiell möglich, jedoch sind die entsprechenden VOF[S]F-Strukturen in Bezug auf das tatsächliche Vorkommen stark eingeschränkt, da das Italienische eine deutlich geringere syntaktische Mobilität von präsupponiertem Material aufweist als etwa das Spanische. Drittens hat sich gezeigt, dass in allen Bereichen in deutlich stärkerem Maße Sprachvariation vorliegt, als in den gängigen Darstellungen angenom[pp con gli amici] folgt. Befände sich das direkte Objekt [pppaiia] in satzfinaler Position, dann würde es - unabhängig von der informationsstrukturellen Gliederung - immer eine eigene PhP ausbilden, und auch bei einer Satzfokuslesart wäre RS nicht blockiert: p[php(Carfo) nv(manf>erä) PhP ([p:]aiia)] F .
2. Grundlagen
83
men wird. Dies tritt spätestens dann deutlich zutage, wenn man entsprechendes Datenmaterial erhebt. So lässt sich beispielsweise die Behauptung, im Spanischen müsse ein neutral fokussiertes Subjekt postverbal stehen, kaum aufrechterhalten, wenn man sich die Vielfalt der in den konkreten Daten verwendeten Versprachlichungsstrategien vor Augen hält. Die prosodische Hervorhebung in situ ist also offensichtlich kein Privileg des kontrastiven Fokus. Ebenso lassen sich bestimmte syntaktische Hervorhebungsstrukturen wie etwa der Spaltsatz und die Fokusvoranstellung nicht auf eine kontrastive Lesart reduzieren. Von der genauen Beschaffenheit der jeweiligen Intonationskonturen war noch gar nicht die Rede. Wie sich in Zusammenhang mit einer genaueren Analyse des erhobenen Datenmaterials in Kapitel 4 zeigen wird, liegt auch hier in großem Maße Sprachvariation vor. Das Ziel der nachfolgenden Kapitel muss somit ein zweifaches sein: Zum einen gilt es, einen theoretischen Rahmen bereitzustellen, der in der Lage ist, in ausreichend flexiblem Maße einerseits das Ineinandergreifen der unterschiedlichen Komponenten der Grammatik - Syntax und Phonologie - und andererseits das Auftreten von Variation zu erfassen (Kapitel 3). Zum anderen muss das bereitgestellte Instrumentarium eine Modellierung der erhobenen Daten ermöglichen. Dies gilt sowohl für die sprachinterne Modellierung des Spanischen und der entsprechenden dialektalen Variation als auch für den Sprachvergleich zwischen Spanisch, Französisch und Italienisch.
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
Im vorangegangenen Kapitel haben wir gesehen, dass die informationsstrukturelle Gliederung einer Äußerung in verschiedenen Sprachen auf unterschiedliche Art und Weise vermittelt werden kann: Syntaktische, morphologische und phonologisch-prosodische Mittel stehen hierbei zur Verfügung, wobei die einzelnen Komponenten jeweils unterschiedlich gewichtet sein können. Wie in Abschnitt 2.2.2 gezeigt, nutzt das Spanische syntaktische und phonologisch-prosodische Mittel, wobei diese beiden Komponenten der Grammatik insofern ineinandergreifen, als die phonologische Realisierung der FHG durch Akzenttöne (engl, pitch accents) qua FPR syntaktische Prozesse auslöst bzw. auslösen kann, und zwar insofern, als dann bestimmte Bewegungen in der overten Syntax erfolgen. Weiterhin betrifft die Vermittlung der FHG im Spanischen nicht nur die suprasegmentale Ebene, sondern es lassen sich zusätzlich gewisse segmentale Korrelate ausmachen, die daraus resultieren, dass durch die Beschaffenheit der FHG bestimmte Sandhi-Prozesse wie sinalefa und alargamiento silábico blockiert werden. Schließlich weist das Spanische in nicht unerheblichem Maße Variation auf, und zwar insofern, als einer durch einen bestimmten Kontext determinierten FHG durchaus verschiedene Oberflächenrealisierungen entsprechen können, die sich kaum unterschiedlichen Register- oder Sprechergrammatiken zuweisen lassen. Die Daten des Spanischen lassen sich nur in angemessener Weise modellieren, wenn ein theoretischer Rahmen zugrunde gelegt wird, der den konkreten Erfordernissen Rechnung tragen kann. Dies bedeutet zum einen, dass sich das Ineinandergreifen von syntaktischer und phonologischer Komponente in flexibler Weise handhaben lässt. Zum anderen muss das Modell in einem wohldefinierten Maße Sprachvariation zulassen, ohne dass auf den allzu einfachen Kunstgriff der Annahme verschiedener Register- oder Sprechergrammatiken oder auf die Annahme von optionalen bewegungsauslösenden Merkmalen rekurriert wird. Da das Spanische FHG-induzierte Wortstellungsvariation aufweist, ist für eine Modellierung der entsprechenden Daten ein Grammatikmodell unabdingbar, das die Herleitung der linearen Abfolge einzelner Konstituenten ex-
86
Christoph Gabriel
plizierbar macht und das auseinander abgeleitete Wortstellungsmuster zueinander in Beziehung zu setzen vermag. Die Herleitung von Wortstellung steht bekanntlich im Bereich der generativen Syntaxtheorie im Zentrum des Interesses, und gerade in jüngerer Zeit sind in diesem theoretischen Rahmen vermehrt Vorschläge ausgearbeitet worden, die zum Ziel haben, durch die Integration der informationsstrukturellen Komponente in das Grammatikmodell unterschiedlichen fokusinduzierten Wortstellungsvarianten Rechnung zu tragen (Zubizarreta 1994, 1998, 1999 und weitere Arbeiten, die den dort vorgestellten Ansatz weiterentwickeln wie z.B. Domínguez 2004a, 2004b, Gabriel 2004b; vgl. auch Haidou 2004: 220-225 zum Neugriechischen). Im Folgenden werden die theoretischen Grundlagen der neueren derivationellen Syntaxtheorie, insbesondere die beiden jüngsten Entwicklungsstufen des Minimalistischen Programms, namentlich das feature checking-Modell nach Chomsky (1995) und das Sonde-Ziel-Modell (Chomsky 2000, 2001, 2004), sowie das von Rizzi (1997, 2001, 2004a) vorgeschlagene Modell der Linken Satzperipherie (fine structure ofthe left periphery) unter Bezugnahme auf vorwiegend spanische Daten dargestellt und diskutiert (vgl. Abschnitt 3.1). Ebenso ist die phonologisch-prosodische Seite in angemessener Weise zu berücksichtigen. Wie bereits im zweiten Kapitel gezeigt, betrifft dies vor allem den Konflikt zwischen der durch die nuclear stress rule (NSR) geregelten Platzierung des Satzakzents und der Fokusprominenzregel (FPR) sowie die Zuweisung (kontrastiver) fokaler Akzenttöne. Ein weiterer zentraler Punkt ist die overte Abgrenzung der Fokusdomäne durch prosodische Phrasierung. Wie noch genauer zu zeigen sein wird, ist das vornehmliche Korrelat prosodischer Phrasierung die Intonation. Zu berücksichtigen sind jedoch auch die segmentalen Korrelate der FHG, die sich u.a. aus der Tatsache ergeben, dass die Position und Beschaffenheit des fokussierten Materials einen Einfluss auf phonologische Prozesse wie sinalefa und alargamiento silábico haben kann. Eine zentrale Stellung kommt in der neueren Intonationsphonologie dem von Pierrehumbert (1980) anhand des Englischen entwickelten Modell zu, das seit Ladd (1996) terminologisch als Autosegmental-Metrisches Modell (AM) gefasst wird. In diesem theoretischen Rahmen haben u.a. Sosa (1999), Nibert (1999, 2000), Face (2001, 2002a, 2002b, 2003) und Hualde (2002a, 2002b, 2003a, 2003b) zum Teil recht umfassende Analysen spanischer Daten vorgelegt.1 Bezüglich des offensichtlichen Ineinandergreifens von phonologischer und syntaktischer Komponente sind im generativen Rahmen Versuche zu einer entsprechenden Erfassung und Integration in ein kohärentes System
Die Arbeit von Cabrera Abreu / Garcia Lecumberri (2003) stellt eine der wenigen Studien dar, die sich im Rahmen des rektionsphonologischen Modells nach Kaye/Lowenstamm/Vergnaud (1989, 1990) der Problematik annehmen.
3. Theoretischer Hintergrund, Forschungsüberblick
und Modellbildung
87
vorgelegt worden, wobei Di Tullio (1997), Zubizarreta (1998) und Domínguez (2004a, 2004b) eine derivationelle Herangehens weise verfolgen und Autoren wie Barkovic (1998), Costa (2001a, 2001b), Gutiérrez-Bravo (2002a, 2002b, 2006) und Samek-Lodovici (2001, 2004, o.J.) Vorschläge für eine optimalitätstheoretische Modellierung machen. Ein Modell, das den unterschiedlichen Realisierungen der FHG im Spanischen in all ihren Facetten gerecht werden will, muss auch die konstatierte Sprachvariation berücksichtigen. Gerade im neueren generativen Rahmen scheint dies auf den ersten Blick problematisch zu sein, da die streng merkmalgetriebenen Derivationen, wie sie im Minimalistischen Programm angesetzt werden, nur eine einzige Oberflächenform hervorbringen können und damit Optionalität im Wortsinne ausschließen (vgl. Henry 2002). Zwar sind unterschiedliche fokusinduzierte Wortstellungsvarianten für Modelle, die pragmatische und prosodische Merkmale neben den formal-grammatischen Merkmalen zulassen, so lange unproblematisch als sich in eindeutiger Weise eine bestimmte Oberflächenform mit einem informationsstrukturell bedingten Kontext in Verbindung bringen lässt, doch lässt sich auf diese Weise kaum 'wahre Optionalität' im Sinne einer weitgehenden Gleichwertigkeit zweier oder mehrerer Oberflächenformen modellieren. Gleiches trifft auch für die klassische Optimalitätstheorie nach Prince/ Smolensky (2004 [1993]) zu, da hier jeweils nur eine der Outputformen als Sieger aus dem Evaluationsprozess hervorgehen kann und mehrere miteinander konkurrierende und als gleichermaßen akzeptabel bewertete Formen konzeptuell ausgeschlossen sind (vgl. hierzu Abschnitt 3.3). In neuerer Zeit sind jedoch gerade im optimalitätstheoretischen Rahmen zahlreiche Modelle zum Erfassen von Variation vorgelegt worden, die von der Annahme einer starren hierarchischen Abfolge der entsprechenden Beschränkungen Abstand nehmen und insofern die erforderliche Flexibilität ins Modell zu integrieren suchen (Reynolds/Nagy 1994; Anttila 1997, 2002; Boersma/Hayes 2001). Auch diese Ansätze sind im Folgenden aufzuarbeiten (Abschnitt 3.3.2) und im weiteren Verlauf der Studie in Bezug auf ihre Operationalisierbarkeit für die Modellierung der vorliegenden spanischen Daten zu überprüfen. Zum Abschluss des Kapitels wird aufbauend auf die erarbeiteten Grundlagen ein Modell vorgeschlagen, dessen Ziel es ist, die drei eingangs angeführten Aspekte - (1) syntaktische Derivation, (2) tonale Gestalt, (3) Sprachvariation in den Bereichen syntaktische und prosodische Fokusmarkierung in angemessener Weise zu berücksichtigen (Abschnitt 3.4).
88
Christoph Gabriel
3.1 Zur neueren derivationellen Syntaxtheorie: Das Minimalistische Programm und die Linke Peripherie Dieser Abschnitt bietet einen Überblick über die jüngeren Entwicklungen der generativen Syntaxtheorie, namentlich des Minimalistischen Programms (MP).2 Dabei wird - vorzugsweise anhand von spanischem Datenmaterial die Weiterentwicklung vom feature checking-Modell (Chomsky 1995) zum Sonde-Ziel-Modell (Chomsky 2000, 2001) skizziert (Abschnitte 3.1.1 und 3.1.2), bevor mit der zunächst von Rizzi (1997) primär mit Blick auf das Italienische vorgeschlagenen Aufspaltung des C-Bereichs im Sinne einer fine structure of the left periphery ein Modell dargestellt und diskutiert wird, das für die meinem Untersuchungsbereich zuzurechnenden Dislokations- und Spaltsatzstrukturen von Wichtigkeit ist. Insbesondere in Zusammenhang mit dem Sonde-Ziel-Modell kann nicht auf eine ausführliche Darstellung der technischen Details verzichtet werden, da eine detaillierte Anwendung des Modells auf das Spanische meines Wissens noch nicht vorliegt. Ich habe mich deshalb entschlossen, in den Abschnitten 3.1.2.2 und 3.1.2.3 eine syntaktische Ableitung Schritt für Schritt nachzuvollziehen. 3.1.1 Das feature cÄecfcing-Modell (Chomsky 1995) Aus minimalistischer Sicht wird jede Einzelsprache als eine mögliche Instanziierung der universellen menschlichen Sprachfähigkeit aufgefasst. Jede dieser Instanziierungen ist charakterisiert durch ein Lexikon, in welchem die einzelsprachlich determinierten Laut-Bedeutungs-Verbindungen (lexikalische sowie overte und phonetisch leere funktionale Kategorien) inventarisiert sind, und durch eine mentale Grammatik oder - anders ausgedrückt - durch ein Berechnungssystem Chl (engl, computational system of human language), welches Paare von Repräsentationen des Typs (n, Ä.) erzeugt. Dabei steht n für die entsprechende Repräsentation auf der Ebene der 'Phonetischen Form' (PF), die der phonologischen Komponente und dem artikulatorischen Apparat als Basis für die Erzeugung konkreter lautlicher Ereignisse dient; unter X sind die entsprechenden Repräsentationen der 'Logischen Form' (LF) zu verstehen, die Grundlage für die semantische Interpretation sind. Die für eine be-
Für eine grundlegende Einführung verweise ich auf die übereinzelsprachlich ausgerichteten Bände von Grewendorf (2002), Eguren / Fernández Soriano (2004) und Lasnik/ Uriagereka (2005). Vgl. weiterhin Mensching (2003), der den Ableitungsmechanismus auf der Basis des minimalistischen Modells nach Chomsky (1995) anhand romanischer Beispiele exemplifiziert, sowie die auf das Französische zentrierte Zusammenfassung der Grundlagen in Gabriel (2002, 2003: 12-14).
3. Theoretischer Hintergrund, Forschungsüberblick
und
Modellbildung
89
stimmte Derivation erforderlichen lexikalischen und funktionalen Kategorien - zusammenfassend als LI (engl, lexical items) bezeichnet - werden im Rahmen eines durch die Äußerungsabsicht des Sprechers und die jeweiligen kommunikativen Bedingungen determinierten Auswahlprozesses (Operation Select) dem Lexikon in Form von Merkmalbündeln entnommen, welche sich aus je einer Matrix semantischer, phonetisch-phonologischer und formalgrammatischer Merkmale zusammensetzen. Zu den letzteren, die meist als FF(LI) abgekürzt werden (vgl. engl. formal features ofa lexical item), zählen sowohl Merkmale, die die kategoriale Zugehörigkeit eines Elements bestimmen ([±N, ±V]), als auch Kasus- und Tempusmerkmale sowie die sog. -Merkmale hingegen müssen auf LF für die semantische Interpretation zugänglich sein. Ob ein Überprüfungsvorgang mit overter Bewegung verbunden ist, sich also in der linearen Abfolge der Konstituenten niederschlägt, oder ob lediglich auf LF ein Abgleich der formalen Merkmale erfolgt (sog. kovertes Checking), ist im minimalistischen Modell nach Chomsky (1995) von der sog. Stärke oder Schwäche formaler Merkmale abhängig: Weist beispielsweise ein finiter T-Kopf (T+r'n) sowohl ein starkes D- als auch ein starkes V-Merkmal auf, dann erfolgt zusätzlich zu der für die Merkmalüberprüfung notwendigen Bewegung von FF(LI) in den T-Bereich auch die Anhebung der Matrix phonologischer Merkmale, womit sowohl Subjekt- als auch Verbbewegung in der overten Syntax erfolgen. 7 Ich lege im Folgenden die erstmals in Chomsky (1993) pro-
6
7
CD(H) umfasst alle Positionen innerhalb der maximalen Projektion des überprüfenden Kopfes H, also Spec,HP sowie [ H X[H]] (Kopfadjunktion an H) und [ H P [XP] HP] (XPAdjunktion an HP). Die Annahme eines starken V-Merkmals in T gründet sich auf die Stellung finiter bzw. infiniter Verben in der jeweils zu modellierenden Sprache. Steht beispielsweise das finite Verb wie im Französischen links von Adverbien wie toujours 'immer' oder souvent 'oft', die Skopus über die gesamte Handlung haben (und sich im Anschluss an Pollock (1989) sinnvollerweise als Linksadjunkte zu vP analysieren lassen), dann ist in T+r'n ein starkes V-Merkmal anzunehmen; vgl. fr. les garçons, écrivent, [r?souvent [,,P les garçon Si ccriventj des lettres] 'Die Jungen schreiben oft Briefe.' Im englischen Äquivalent the boys, [vPoften [vP the boys, write letters] hingegen verbleibt das Verb innerhalb von vP, und dementsprechend wird ein schwaches V-Merkmal in T n " angesetzt. Während der Kontrast zwischen Französisch und Englisch eindeutig ist, scheint die Situation im Spa-
92
Christoph Gabriel
pagierte 'Kopiertheorie der Bewegung' (engl, copy theory of movement) zugrunde, derzufolge bei overter Bewegung eine Kopie der betreffenden Kategorie an der Ausgangsposition verbleibt. Überflüssige Kopien werden auf PF getilgt; auf LF hingegen müssen alle Kopien für die Rekonstruktion von Argumentstruktur und Skopuseigenschaften zugänglich sein.8 Da Bewegung bereits verketteter Elemente aufgrund der komplexen Mechanismen weniger ökonomisch ist als die Entnahme eines Elements aus der Numeration, erfolgt Bewegung immer nur dann, wenn - wie im Fall der hier angesprochenen Subjektanhebung - kein Element mehr in N vorliegt, das - wie etwa ein (leeres oder phonetisch realisiertes) Expletivum - die entsprechenden Anforderungen anstelle des hier bewegten Subjekts erfüllen könnte. Die formal-grammatischen Merkmale und rollensemantischen Eigenschaften der in der Numeration N präsenten Kategorien werden nachfolgend zusammengefasst; zur besseren Übersichtlichkeit gebe ich bei den lexikalischen und den overten funktionalen Kategorien anstelle der Matrizes phonologischer Merkmale jeweils die orthografische Form an; auf die Angabe semantischer Merkmale wird verzichtet.
nischen wegen der variableren Stellung verschiedener Adverbien etwas komplexer zu sein. Vgl. hierzu die Diskussion in Abschnitt 3.1.4. Als Oberflächenevidenz hierfür führt Nunes (2004) in seiner Monografie zur Kopiertheorie Daten aus Sprachen wie Romani (i) und Deutsch (ii) an, wo im Gegensatz zum spanischen Beispiel in (iii) bei bestimmten Bewegungsoperationen mehrere Kopien phonetisch realisiert werden können: (i) rm. [cp kas[ misline [cp kas¡ o Demiri dikhlä k&H\'!]\ wen denken:2sG wen D +dcf Demir sehen:PAST.3sG wen 'Wen denkst du, dass Demir gesehen hat?' (Nunes 2004: 38) (ii) dt. [Cp Wert, denkst du [cp wen, sie meint Hans [CP wen, Harald wert, liebt?]]] (Nunes 2004: 39) (iii) sp. [CP ¿ Quién, [TP me dijiste [CP quién, que [Tp quién, [| P quién, te lo había dicho?]]]]] (Eguren / Fernández Soriano 2004: 174) 'Wer hast du mir gesagt, hat es dir gesagt?' In (iii) werden die Kopien der Wh-Phrase, die in der Basisposition (Spec,vP des eingebetteten Satzes) und an den Zwischenlandeplätzen (Spezifikatorpositionen von T und C des eingebetteten Satzes) zurückbleiben, jeweils getilgt, sodass das bewegte Element nur in der Zielposition am Anfang des Satzes (Spezifikator der Matrix-CP) phonetisch realisiert wird. Dagegen wird in (i) und (ii) jeweils nur die Kopie in der Ausgangsposition getilgt, sodass sich die einzelnen Stufen der zyklischen Bewegung anhand der Zwischenlandeplätze nachvollziehen lassen. Da es sich jeweils um Objektextraktion handelt, kommen als Zwischenlandeplätze nur die Spezifikatorpositionen der eingebetteten CPn in Frage, wobei im deutschen Beispiel in (ii) wegen der doppelten Einbettung eine phonetisch realisierte Kopie mehr vorliegt als in (i). Für weitere Beispiele von Bewegungsstrukturen mit mehreren overt realisierten Kopien aus germanischen Sprachen wie Friesisch, Afrikaans und Schwyzertütsch vgl. Grewendorf (2002: 207f.).
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
(3-2)
cartas escribieron chicos fblunas los 0 0 0
N [PI. f.] V [3. PI., perfecta simple] N [PI. m.] D"def [PI. f.] D +dcf [Pl. m ] v [V su "\ Akkusativ] +r,n T [Dstark, Vstark, Nominativ] C [+dekl(arativ)]
93
}
lexikalische Kategorien
>
funktionale Kategorien
Der Aufbau der syntaktischen Struktur erfolgt nun durch sukzessive Anwendung des Verkettungsmechanismus Merge. Wie bereits gesagt, ist die Verkettung der ausgewählten Kategorien von deren rollensemantischen Eigenschaften abhängig: So kann die Verbform [ v escribieron] nur dann mit einer weiteren Kategorie verkettet werden, wenn sich hierdurch die Sättigung einer Position aus dem Thetaraster ergibt. Da nur referenzielle Syntagmen thematische Rollen erhalten können (vgl. Longobardi 1994), muss, damit beispielsweise die interne Rolle vergeben werden kann, eines der in N befindlichen Substantive zunächst mit einem Determinanten verkettet werden. Die Anwendung von Merge auf [N cartas] und [D unas] (bzw. auf [N cartas] und den leeren Determinanten [ D 0]) ergibt eine komplexe Kategorie, die durch die formal-grammatischen Merkmale von D charakterisiert ist, also den Status einer DP hat: {0/unas {0/unas} {cartas}} bzw. [ D P (unas) cartas]. Würde hingegen N projizieren, dann wäre weder die Bindung der referenziellen Rolle von [N cartas] gewährleistet, noch könnte die entstandene komplexe Kategorie (cartas { draps I anglais 'Tuchhändler aus England' Ist das Adjektiv wie in (i) Adjunkt zu draps, kann der latente Liaisonkonsonant /(z)/ (im gehobenen Sprachregister) realisiert werden und erscheint dann im Onset der ersten Silbe des folgenden Wortes ([dBa.zägle]); ist anglais hingegen Adjunkt zu marchand und damit höher adjungiert wie in (ii), erfolgt keine liaison. Weitere Evidenz für die Verarbeitung syntaktischer Information auf PF liefert die sog. wanna-Kontraktion des Englischen: (iii)engl. Iwanttogonow —» / wanna go now 'Ich will jetzt gehen.' (iv) engl, [cp who(m), doyou want who(m),,„go„„„-.] —> *who(m) doyou wanna go now? (wörtl.) 'Wer willst Du dass jetzt geht?' Während in (iii) die Kontraktion erfolgen kann, ist die Verschmelzung von want und to in (iv) zu wanna ausgeschlossen. Grund hierfür ist, dass sich zwischen want und to ein phonetisch leeres Element befindet, das die Kontraktion blockiert, und zwar die getilgte Kopie (vormals: Bewegungsspur), die nach der Anhebung der [whp whom] aus dem eingebetteten Satz nach Spec,CP des Matrixsatzes zurückbleibt.
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
99
3.1.2.1 Kongruenz und Bewegung Entsprechend den Annahmen der 1995er Version des Minimalistischen Programms sind Kongruenzphänomene an die Überprüfung von Merkmalen gebunden. Merkmalüberprüfung ist wiederum von Bewegung abhängig und erfolgt lokal innerhalb der Checking-Domäne CD(H) des überprüfenden Kopfes H. Starke Evidenz für einen engen Zusammenhang zwischen Kongruenz und Bewegung liefern Konstruktionen mit periphrastischen Verbformen und klitischen Objektpronomina im Französischen und im Italienischen. 16 (3-6)
a. b.
fr. it.
(les lettres), ... Les garçons les, ont écrites [ekuit] tes, (le lettere), ... I ragazzi le, hanno scritte te, jeweils: (die Briefe)] . . . 'Die Jungen haben siei geschrieben.'
Auffällig ist, dass das Partizip immer dann morphologisch realisierte Kongruenz mit dem in Komplementposition basisgenerierten Objekt aufweist - hier handelt es sich jeweils um klitische Objektpronomina - , wenn dieses am Partizip vorbei in eine höhere Position - hier zum finiten Hilfsverb - bewegt wird (und in einer speziellen Kongruenzphrase die entsprechenden (^-Merkmale abgleicht; vgl. Gabriel 2002: 171 ff.).17 Im Gegensatz hierzu erfolgt keine Kongruenzmarkierung, wenn eine volle Objekt-DP in Komplementposition basisgeneriert wird und in der Basisposition verbleibt:
Das Spanische hingegen hat die morphologisch realisierte Kongruenz zwischen direktem Objektpronomen und Partizip im Laufe der Sprachgeschichte eingebüßt: Während in mittelalterlichen Texten der flektierte Gebrauch des Partizips wie in la avemos veida e bi[e]ne percibida 'wir hatten sie (Sg.f) gesehen und gut wahrgenommen' (El Auto de los Reyes Magos, 12. Jh., zit. n. Lapesa 1980: 213) und das nicht kongruierende Partizip parallel auftreten, dominiert bereits in den Texten des Siglo de oro in den entsprechenden Kontexten eindeutig das unveränderliche Partizip (vgl. Lapesa 1980: 400). Im heutigen Spanisch tritt overte Partizipialkongruenz nur bei der Passivdiathese auf. Im Französischen stellt die Partizipialkongruenz allerdings in den meisten Fällen ein rein grafisches Phänomen dar. So wird etwa die Femininmarkierung -e (die sich normalerweise lautlich entweder gar nicht oder durch die Aussprache des latenten Auslautkonsonanten auswirkt, vgl. ravi, ravie: jeweils [(«avi]\fait, faite: [fe] vi. [fet]), nur bei der Lyrikrezitation oder im Gesang als auslautendes Schwa realisiert, und auch dort nur, wenn keine vokalisch anlautende Silbe unmittelbar folgt; vgl. etwa die 'mehrsilbige' Vertonung von Formen wie ravie [(Ba.vi.s] 'geraubt' in Kontexten wie beispielsweise Et je consentirais qu'elle te fût ravie ? 'Und ich sollte damit einverstanden sein, dass es [das Leben] dir geraubt werde?' (Oreste zu Pylade in Christoph Willibald Glucks Iphigénie en Tauride III, 4; Libretto: Nicolas-François Guillard). Den Vertonungskonventionen entsprechend wird hier das Partizip auf drei Notenwerte verteilt, wobei die zweite Silbe [vi] auf die schwere Zählzeit fällt. Das Pluralkennzeichen -s schließlich tritt als latenter Konsonant /(z)/ nur in //aùwi-Kontexten zutage, deren konkrete Vorkommenshäufigkeiten sehr gering sein dürften.
100
Christoph Gabriel (3-7)
a. b.
fr. it.
Les garçons ont écrit!*écrites des lettres I ragazzi hanno scritto/*scritte delle lettere jeweils: 'Die Jungen haben Briefe geschrieben'
Allerdings kann auch eine volle Objekt-DP mit dem Partizip kongruieren, und zwar genau dann, wenn auch sie bewegt wird, wie es beispielsweise bei Relativsätzen der Fall ist. Ohne dies an dieser Stelle weiter ausführen zu können, lege ich hier die von Kayne (1994) vorgeschlagene Analyse zugrunde, derzufolge der Relativsatz als CP in Komplementposition zum D-Kopf einer DP basisgeneriert wird und das Relativum aus der Komplementposition des verbalen Partizips an diesem vorbei nach Spec,CP bewegt wird:18 (3-8)
a. b.
fr. it.
[dples [CP [spec.cplettres,] qu 'ils ont lettres, écrites lettres,]] [ DP le [cp [spec.cp lettere,], che pro hanno lettere, scritte lettere,]] jeweils: 'die Briefe, die sie (fr.: m; it. m/f) geschrieben haben'
Im minimalistischen Modell nach Chomsky (1995) wird davon ausgegangen, dass auch dann Kongruenz zwischen Objekt und Verb vorliegt, wenn diese sich nicht in Form von verbalen Affixen niederschlägt. Dies gilt sowohl für das Verhältnis zwischen den Objekt-DPn und den Partizipien in (3-7) als auch für die Beziehung zwischen Objekt und finitem Verb in transitiven Konstruktionen wie in (3-1) sp. los chicos escribieron unas cartas. Anders als etwa das Ungarische (vgl. Megyesi 1998) oder einige Dialekte des Baskischen (vgl. Trask 1996: 241), wo das finite Verb mit dem Objekt kongruiert, verfügen die romanischen Sprachen jedoch nicht über entsprechende verbale Affixe. 19 Der hier eingezeichnete Zwischenlandeplatz ist der Spezifikator einer unmittelbar über der VP situierten AgrP, in der die Kongruenz zwischen Partizip und Relativum überprüft wird. Das im Folgenden vorzustellende Sonde-Ziel-Modell verzichtet auf derartige Kongruenzphrasen. Das Spanische weist jedoch aufgrund der klitischen Dopplung des indirekten Objekts [+anim] (i) und des durch ein starkes Pronomen realisierten (und durch a markierten) direkten Objekts (ii) deutliche Züge einer regelmäßigen Objektkongruenz auf. Diese ist jedoch von der Beschaffenheit des entsprechenden Komplements abhängig und wird nicht durch verbale Affixe realisiert, wie es bei der spanischen Subjektkongruenz der Fall ist. (i) sp. *(Le) encanta el teatro a mi padre 'Mein Vater begeistert sich für das Theater.' (ii) *(Lo)viael 'Ich habe IHN gesehen.' Im castellano rioplatense ist klitische Dopplung direkter Objekte nicht auf das Merkmal [+anim] beschränkt: (iii) ar. Yo lo voy a comprar el diario antes de subir (Suner 1988: 400) 'Ich werde die Zeitung kaufen, bevor ich hochgehe.' Unabhängig von der Belebtheit des Objekts ist die Spezifizität (und nicht die Definitheit) Bedingung für die klitische Dopplung; vgl. (iv) und (v).
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
101
Wichtig ist, dass auch Kongruenzphänomene, die keine PF-Realisierung aufweisen, einer Merkmalüberprüfung bedürfen. Diese erfolgt jedoch als reiner Merkmalabgleich nach Spellout und ist nicht an syntaktische Bewegung gebunden (vgl. Abschnitt 3.1.1). Wir können also unter den gegenwärtigen Annahmen festhalten, dass (morphologisch) realisierte Kongruenz mit overter Bewegung verbunden ist.20 Andererseits lässt sich aber nicht sagen, dass morphologisch nicht realisierte Kongruenz keine Bewegung benötige, da auch hier Lizenzierung durch Checking erforderlich ist. Der einzige Unterschied besteht darin, dass die Bewegung in die Checking-Domäne hier nicht als Kopf- oder XP-Bewegung in der overten Syntax, sondern lediglich als FF-Anhebung in der koverten Syntax erfolgt. Betrachten wir anschließend hieran die Subjektkongruenz: Hierbei gilt generell für die romanischen Sprachen, dass diejenige DP, die sich in der Subjektposition Spec,TP befindet, mit dem finiten Verb kongruiert. Dies ist unabhängig davon, ob es sich dabei um das externe Argument eines transitiven oder intransitiven Verbs handelt (3-9.a bzw. b) oder um das interne Argument, das im Passiv (3-9.c) und bei Konstruktionen mit unakkusativen Verben (3-9.d) aus der VP-internen Komplementposition nach Spec,TP bewegt wird. (3-9)
a. sp. a.' fr.
b. sp. b.' fr. c. sp. c.' fr. d.
sp.
[tpLOS chicos escribieron T [ v P los chicos [ypescribieron cartas]]] [ Tp Les garçons écrivirent T [ t P les garçons [vp écrivirent des lettres]]] 'Die Jungen schrieben Briefe.' [TpLOS chicos duermen T [vPlos chicos [\f duermen]]] [ T p¿gí garçons dorment T [ v P f c s garçons [Vp dorment]]] 'Die Jungen schlafen.' \TP Las carias fueron [ V p escritas las cartas] [Tp Les lettres furent [Vp écrites les lettres]] 'Die Briefe wurden geschrieben.' (tp LOS chicos llegarán T l v p llegarán los chicos muy de mañana]]
(iv) ar. A principios de 1930 yo (*lo) buscaba un secretario que supiera ruso [-spez] (nach: http://www.ceip.org.ar/escritos/Libro4/html/T07V306.htm; 9. Juni 2005) 'Anfang 1930 suchte ich einen Sekretär, der Russisch sprechen sollte.' (v) En realidad, él lo buscó a un compañero mío, Carlos Brunetti [+spez] (http://www.lavoz.com.ar/2004/0206/Espectaculos/nota220118 1 .htm; 9. Juni 2005) 'In Wirklichkeit suchte er einen meiner Freunde, Carlos Brunetti.' Zur sog. differenziellen Objektmarkierung im Spanischen vgl. Rothe (1966) und Berschin/Fernández-Sevilla/Felixberger (1987:199). Auf die Besonderheiten des argentinischen Spanisch gehen von Heusinger / Kaiser (2003: 57ff.) ein. Zu einigen Ausnahmen bei der Partizipialkongruenz im Französischen (Typ exceptées les femmes 'ausgenommen die Frauen') vgl. ausführlich Gabriel (2002: 212ff.).
102
Christoph Gabriel d.' fr.
[ TP Les garçons arriveront T [Vparriveront les garçons de très bonne heure]] 'Die Jungen werden früh morgens ankommen.'
Für Expletiva, die gleichfalls das starke D-Merkmal in T löschen können, gilt dies nur eingeschränkt: Während das fr. Expletivum il mit dem finiten Verb kongruiert, gleichen sich das deutsche es und die leeren Expletiva (proExpl) des Spanischen21 und des Italienischen22 darin, dass hierbei jeweils die in der Basisposition verbliebene Subjekt-DP mit dem Verb in Person und Numerus übereinstimmt.23 Es liegt in diesen Sprachen also jeweils overte Kongruenz zwischen Subjekt und Verb vor, und zwar ohne dass eine entsprechende Anhebung nach Spec,TP erfolgt: (3-10) a. b. c. d.
fr. sp. it. dt.
Il est arrivé quelques/des/*les garçons proEjtpi llegaron unos/ auffasst, ein Gedanke, der in Abschnitt 3.1.5 weiter entwickelt werden wird. Kommen wir jedoch zunächst wieder auf die Modellierung von Kopfbewegungen im Sonde-Ziel-Modell zurück. Ein zweiter Grund für die Verortung von Kopfbewegungen auf PF ist darin zu sehen, dass die technischen Vorgaben des alten Checking-Modells der Andersartigkeit von Kopf- und XP-Bewegung nicht adäquat Rechnung zu tragen vermögen: Die Annahme prinzipiell gleichartiger bewegungsauslösender Merkmale Dstark und Vstark erfordert letztlich die stillschweigende Übereinkunft darüber, dass starke D-Merkmale auf gesamte DPn Anwendung finden und nicht etwa nur die Anhebung des jeweiligen D-Kopfes auslösen und dass - im Gegensatz hierzu - ein starkes V-Merkmal lediglich die Kopfbewegung des Verbs und eben nicht die Anhebung der gesamten VP nach Spec,TP auslöst. Die ausschließliche Anwendung von V-Merkmalen auf Kopfbewegung bzw. von D-Merkmalen auf XP-Anhebungen ist jedoch pure Stipulation und folgt nicht aus unabhängiger theoretischer Motivation. Das gleiche Problem zeigt sich auch im C-Bereich: Auch hier gibt es letztlich keinen Grund dafür, dass das in C angenommene verbale [wh]-Merkmal die Bewegung von V+v+T nach C auslöst (und nicht etwa der ganzen TP nach Spec,CP). Die Notwendigkeit der oben skizzierten Stipulation ist jedoch nicht mehr gegeben, wenn man davon ausgeht, dass XP-Bewegungen EPP-induziert sind, Kopfbewegungen jedoch von PF-Bedingungen abhängen.18 Chomsky fasst wie folgt zusammen:
Als dritter Grund dafür, Kopfbewegungen aus der narrow syntax auszugliedern, lässt sich anführen, dass Kopfbewegungen, zumindest wenn man die Standardanalyse als Adjunktionskonfiguration [ x Y X] zugrunde legt, die sog. Extensionsbedingung (engl. Extension Condition) verletzen, derzufolge jede syntaktische Operation die bestehende Struktur erweitern muss: „Computational Operations always extend the phrase marker" (Lasnik/Uriagereka 2005: 213). Sowohl die Anwendung von Merge auf Kategorien, die der Numeration N entnommen werden (z.B. V + Objekt-DP), als auch die Bewegung bereits verketteter Kategorien (z.B. die kanonische Subjektanhebung nach Spec,TP) tragen zum Strukturaufbau bei, indem sozusagen der Baum 'nach oben' vergrößert wird. Bei der Adjunktion von Köpfen an Köpfe hingegen wird lediglich eine Manipulation innerhalb des bereits bestehenden Strukturbaumes vorgenommen. Für Grundsätzliches zur Extensionsbedingung vgl. Chomsky (2000: 136f.); zu den Konsequenzen für die Kopfbewegung siehe u.a. Zwart (2003: 3) und Eguren / Fernández Soriano (2004: 300, 344).
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
121
These conclusions [ . . . ] follow naturally if overt V-to-T-raising, T-to-C-raising, and N-to-D-raising are phonological properties, conditioned by the phonetically affixal character of the inflectional categories (Chomsky 2001: 38).
Wie ist es nun genau zu verstehen, wenn gesagt wird, dass Verbbewegung durch den 'phonetischen Affixcharakter von Flexionskategorien' hervorgerufen wird? Wie lässt sich in einer solchen Sichtweise der Kontrast zwischen Sprachen mit Verbbewegung (Französisch, Spanisch) und solchen ohne Verbbewegung (Englisch) erfassen? Zunächst einmal ist zu unterstreichen, dass die Annahme von abstrakten [±starken] V-Merkmalen im alten Modell zwar ermöglicht, Verbbewegung formal in den Griff zu bekommen, aber letztlich rein stipulativ ist.39 Dass auch der oft bemühte Zusammenhang zwischen ausgeprägter Verbalmorphologie und overter Verbbewegung einerseits und wenig ausgeprägter Verbalmorphologie und ausbleibender overter Verbbewegung andererseits bestenfalls näherungsweise besteht und somit kaum als Basis für eine formale Motivation erfolgender bzw. ausbleibender Kopfbewegungen dienen kann, lässt sich leicht anhand eines Vergleichs zwischen Französisch und Englisch zeigen: Während sich z.B. im Präsensparadigma die Verbformen der ersten bis dritten Person Singular der regelmäßigen Verben des Französischen auf Lautebene nicht unterscheiden (vgl. [(3)eki$i], [(ty)ekKÍ], [(il)ekBi]), ist im Englischen die 3. Person durch -s gesondert markiert (s/he writes). Würden verbale Flexionsmorphologie und Verbbewegung in eindeutiger Weise miteinander korrelieren, dann müsste man davon ausgehen, dass im Englischen das finite Verb angehoben wird und im Französischen in der Basisposition verbleibt. Das Gegenteil ist jedoch der Fall. 40 Derartige Inkonsistenzen können vermieden werden, wenn man erst gar nicht versucht, die Bewegung verbaler Köpfe mit den Mitteln der Kernsyntax und mithilfe von fragwürdig motivierten formalen Merkmalen zu erfassen. Eguren / Fernández Soriano (2004) betonen zudem zurecht, dass sich in der Sichtweise des Sonde-Ziel-Modells nicht mehr an der Annahme des 1995er Modells festhalten lässt, dass alle Kategorien bereits voll flektiert (oder zumindest voll spezifi-
39
Vgl. hierzu beispielsweise Roberts/Roussou (1999: 1015), die der jeweils angenommenen Merkmalstärke bestenfalls den Status eines diakritischen Zeichens für erfolgende bzw. ausbleibende Bewegung beimessen oder Culicover (1997), der hierin nicht mehr (aber auch nicht weniger!) als ein „formal descriptive device" (351) sieht. Für eine ausführliche Kritik am Konzept der Bewegungsauslösung durch starke Merkmale vgl. auch Grewendorf (2002: 195f.).
40
Vgl. auch Zwart (2003: 4f.), der für germanische Sprachen wie Deutsch, Jiddisch, Niederländisch, Friesisch und Englisch aufzeigt, dass keine eindeutige Korrelation zwischen verbaler Flexionsmorphologie und Verbbewegung besteht. Vgl. jedoch Müller (2000: 78), der auf Studien hinweist, die eine solche Korrelation bei bestimmten germanischen Dialekten zu erkennen glauben.
122
Christoph Gabriel
ziert) dem Lexikon entnommen werden (vgl. das Beispiel einer Numeration in 3-2): „[Eso] implica que no puede mantenerse sin más precisiones la idea de que las piezas léxicas entran en una derivación completamente flexionadas [...]. Habría que suponer, en particular, que en las lenguas con ascenso de Va T los afijos de Concordancia constituyen piezas léxicas independientes (346, Anm. 128)." In der Tat wird im Sonde-Ziel-Modell angenommen, dass sowohl Verbformen als auch die entsprechenden v- und T-Köpfe nicht mit bereits festgelegten Merkmalwerten aus dem Lexikon entnommen werden. Die jeweilige Merkmalbelegung ergibt sich vielmehr erst durch Agree. Beispielsweise erhält - wie oben anhand der Kongruenz zwischen fueron und [DP las cartas] in (3-19) gezeigt - der finite T-Kopf seine (^-Spezifizierung erst dann, wenn die (vollständige) Sonde von T+fin eine ausreichend spezifizierte ()>-Menge findet und die entsprechenden Merkmalwerte auf die eigenen Merkmale überträgt. Die Auffassung, dass Verbbewegung durch reine Outputbedingungen konditioniert ist, legt zudem die Annahme nahe, dass eine finite Verbform wie escribieron 'sie schrieben' als verbaler Stamm escrib- ohne Affixe dem Lexikon entnommen und in den V-Knoten eingesetzt wird und dass die konkrete Verbform escribieron das Ergebnis einer postsyntaktischen Operation im Bereich der Phonologischen Komponente O ist, was demnach auch nicht mit den syntaktischen Mitteln, also beispielsweise in Form von Adjunktionen, zu beschreiben ist. Finite Verbformen sind also in Bezug auf dovremmo dire questo a Gianni domani]]
b.
Zweitens könnte man auch dann von einem aufgespalteten C-Knoten ausgehen, wenn die Satzstruktur aufgrund fehlender Evidenz durch linksdislozierte Konstituenten hierfür keinen Anhaltspunkt bietet: (3-39)
it.
credo [FnrccPche [FjnpFin [j? dovremmo dire questo a Gianni domani]]]
Rizzi optiert für die zweite der beiden Varianten und nimmt an, dass den beiden Köpfen Fin und Foc unterschiedliche overte Realisierungen, nämlich it. di bzw. che entsprechen. Empirische Evidenz für die Aufspaltung in Foc und Fin sowie für die hierarchische Anordnung der entsprechenden Projektionen liefern auch linksdislozierte XPn des Italienischen, die dem 'finiten Komplementierer' [Force che] folgen, dem 'infiniten Komplementierer' [Fi„ di] jedoch vorausgehen. Die drei Punkte ' . . . ' in der jeweils über den Beispielen (3-40.a, b) angegebenen reduzierten Klammerstruktur symbolisieren die zwischen FinP und ForceP intervenierenden maximalen Projektionen der Köpfe Foc und Top. Da weder unterhalb von Fin noch oberhalb von Force entsprechende Projektionen intervenieren und damit auch keine Spezifikatoren als Landeplätze für linksdislozierte XPn zur Verfügung stehen, muss bei einem eingebetteten Infinitivsatz eine topikalisierte XP in der linearen Abfolge links vom Komplementierer [ R „ di] erscheinen (vgl. den Kontrast 3-40.a v.v. 3-40.c), bei einer eingebetteten finiten TP jedoch rechts des Komplementierers [Force che] (vgl. den Kontrast 3-50.b vs. 3-40.d). (3-40)
[ ForceP Force
a. it. Credo,
...
il tuo libro,
[FinP
Fin
[ TP
di
... J
apprezzarlo molto
'Ich glaube, e s sehr zu schätzen, dein Buch.' 4 7 [ForceP
b.
Credo
Force
...
che
il tuo libro,
[ FinP Fin
[TP
... J
loro lo apprezzerebbero molto
'Ich glaube, dass sie es sehr schätzen würden, dein Buch.' Auch hier kann die deutsche Übersetzung die italienische Satzstruktur nur näherungsweise wiedergeben.
136
Christoph
c. d.
*Credo di il tuo libro apprezzarlo molto *Credo, il tuo libro, che loro lo apprezzerebbero
Gabriel
molto (Rizzi 1997: 288)
Rizzi zeigt weiterhin, dass in Relativsätzen der Landeplatz von Wh-Phrasen höher sein muss als die Position von topikalisiertem Material, da im Italienischen relativierte Wh-Phrasen (sog. Relativ-Operatoren) topikalisiertem Material vorangehen: (3-41) a.
it.
b.
un [ForceP uomo a cui Force [Topp il premio Nobel [FinP Fin [ TP lo daranno senz 'altro]]]] 'ein Mann, dem sie ihn ohne weiteres geben werden, den Nobelpreis' *un [porcep Force uomo, il premio Nobel, a cui [TopP [ RnP Fin [ TP lo daranno senz'altro]]]] (Rizzi 1997:298)
Anders ist die Situation bei interrogativen Wh-Bewegungen, da im Italienischen die Wh-Phrase obligatorisch einer topikalisierten XP folgt. Demnach kann Spec,ForceP nicht als Landeplatz für bewegte Wh-Operatoren dienen; diese müssen einen strukturell tieferen Landeplatz ansteuern. (3-42) a.
it.
b-
*[FORCEP a chi Force [xopp il premio Nobel [ F Ì „ P Fin [T P lo daranno?]]]] 'Den Nobelpreis, wem werden sie den geben?' [ForceP Force [TopP il premio Nobel [Fllcpfl chi Foc [FinP Fin [ TP lo daranno?]]]]] (Rizzi 1997: 298)
Hierbei muss es sich um den Spezifikator der Fokusphrase handeln, denn bewegte Wh-Operatoren sind - unabhängig von der linearen Anordnung - mit linksperipheren fokussierten XPn inkompatibel: (3-43) a. b.
it.
*a chi F[il premio NOBEL]F dovrebbero dare? (Rizzi 1997: 298) 'Wem werden sie F[den Nobelpreisjp geben müssen?' *F[il premio NOBEL\r a chi dovrebbero dare? (ibid.)
Die traditionelle Analyse, die eine Wh-Bewegung nach Spec,CP vorsieht und von einer einzigen funktionalen Kategorie im C-Bereich ausgeht, kann jedenfalls die lineare Abfolge von topikalisierten und fokussierten XPn sowie von Wh-Phrasen nicht ausreichend erklären. Eine Aufspaltung des C-Bereichs scheint also unumgänglich zu sein, sobald man sich mit komplexeren Sätzen beschäftigt. Grewendorf hält zusammenfassend fest: Rizzi (1997) zufolge besteht die primäre Funktion des C-Systems darin, als Schnittstelle zu fungieren zwischen einem propositionalen Gehalt (... IP) und einer
3. Theoretischer Hintergrund, Forschungsüberblick und
Modellbildung
137
übergeordneten Struktur, die durch einen höheren Satz oder Eigenschaften des Diskurses repräsentiert sein kann (2002: 67).
Im C-System kodierte Informationen sind einerseits solche, die sich auf die übergeordnete Struktur beziehen und mithilfe bestimmter Komplementierer (sp. que bzw. [ c e ] , fr. que bzw. de\ it. chi bzw. di etc.) oder einer spezifischen C-Morphologie den Satz als interrogativ, deklarativ, exklamativ, relativ, komparativ etc. identifizieren und andererseits solche, die auf die formale Beschaffenheit des eingebetteten Satzes bezogen sind und bestimmte Korrelationen zwischen C und T betreffen (z.B. erfordert sp. que die Finitheit der Verbform in der TP und damit einen finiten T-Kopf)- Daraus ergibt sich die Begrenzung des C-Systems 'nach oben' durch einen Knoten für den Satztyp (Force) und nach unten durch einen Knoten für Finitheit (Fin). Die in (3-36) wiedergegebene Hierarchisierung der maximalen Projektionen der funktionalen Köpfe Foc und Top* zwischen den das C-System begrenzenden Knoten erfolgt - wie oben gezeigt - entsprechend den in (3-34) und (3-37) skizzierten potenziell möglichen Abfolgevarianten topikalisierter und fokussierter XPn am linken Rand italienischer Sätze. Rizzi betont, dass die Köpfe Foc und Top* nur dann präsent sind, wenn entsprechende Positionen in der Linken Peripherie zu besetzen sind: „the heads Topic and Focus [ . . . ] are activated when needed, i.e. when there is a topic and/or focus constituent to be accommodated in the left periphery of the clause" (2001: 287). Minimalistisch ausgedrückt bedeutet dies, dass die konkrete Ausdifferenzierung des C-Bereichs und die damit verbundenen Bewegungsoperationen davon abhängig sind, ob für eine gegebene Derivation funktionale Köpfe wie Top und/oder Foc aus dem Lexikon entnommen werden. Dies bedeutet zugleich, dass unterschieden werden muss zwischen einem präverbalen Subjekt, das zwar Bestandteil der Präsupposition, aber nicht linksdisloziert ist und deshalb die kanonische Subjektposition Spec,TP besetzt, und einer topikalisierten Subjekt-DP, für die nach Rizzi (1997) eine Position im C-Bereich anzunehmen ist. In Zusammenhang mit der Besprechung des iop/c-Begriffs anhand von spanischen Beispielen habe ich darauf hingewiesen, dass sich dieser Unterschied in Sprachen, die keine Subjektklitika aufweisen, nicht oberflächensyntaktisch, sondern nur prosodisch durch die sog. 'Komma-Intonation' diagnostizieren lässt: Die Dislokation des Subjekts wird dann durch die Ausbildung einer eigenen IP angezeigt, was sich durch den Grenzton H% und eine kurze Sprechpause bemerkbar macht (vgl. Abschnitt 2.1.2, Beispiele 2-7.a, b). Betrachten wir nun vor diesem Hintergrund einige italienische Beispiele. Als adäquate Antworten auf die Frage 'Was macht Maria?' sind die in (3-44) gegebenen Strukturen denkbar: Während der Sprecher im a-Beispiel die ökonomische Strategie mit leerem Subjektpronomen pro wählt, wird in
Christoph Gabriel
138
(3-44.b) das präsupponierte Subjekt im Antwortsatz aufgenommen. Als syntaktische Position ist hier jeweils die kanonische präverbale Subjektposition Spec,TP anzunehmen. Die gleichfalls eine adäquate Antwort darstellende Struktur in (3-44.c) kombiniert volle DP und leeres Pronomen, wobei für erstere nach den Vorgaben von Rizzi (1997) eine linksperiphere Position (Spec,TopP) anzunehmen ist. Unter der Annahme, dass eine Bewegung präsupponierten Materials in die Linke Peripherie genau dann erfolgt, wenn im C-Bereich mit Top ein entsprechender funktionaler Kopf vorliegt, der in Analogie zum EPP-Merkmal in v und T über ein bewegungsauslösendes Merkmal verfügt, welches die Eröffnung und Besetzung von Spec,TopP erfordert,48 lässt sich für die Herleitung von (3-44.c) Folgendes annehmen: In der Numeration N liegt ein funktionaler Kopf Top vor, der entsprechend der für das Italienische angenommenen Hierarchie mit der FinP verkettet wird und in dessen Spezifikatorposition das topikalisierte Subjekt bewegt wird. Da die resultierende Oberflächenabfolge wegen des fehlenden Subjektklitikons nicht von der kanonischen Satzstellung SVO zu unterscheiden ist, muss eine prosodische Abgrenzung des linksdislozierten Materials erfolgen, was sich in der sog. 'Komma-Intonation' (hoher Grenzton H% und anschließende kurze Sprechpause) niederschlägt. Zur besseren Übersichtlichkeit werden für die einzelnen Varianten jeweils informationsstrukturelle, syntaktische und prosodische Gliederung gesondert angeführt. (3-44) a. it. a.' a."
(Kontext: 'Was macht Maria?') ¡{Compra il giornale al chiosco]? [Tp prò compra il giornale al chiosco] ( C o m p r a il giornale al chiosco)^
b. b.' b."
L% Maria F[compra il giornale al chiosco]F [ TP Maria compra il giornale al chiosco] (Maria compra il giornale al chiosco)IP4
pia- no de 'Schwanz' 'Flügel'
pia-
no x x co- la
Die Disposition von Haupt- und Nebenakzentstellen in komplexen Wörtern ist von einzelsprachlichen morphologischen Prinzipien wie beispielsweise von der Abfolge der Bestandteile in Determinativkomposita abhängig. So folgt etwa im Deutschen und im Englischen das Determinandum dem prosodisch durch den Hauptakzent hervorgehobenen Determinans; in den romanischen Sprachen ist die Abfolge umgekehrt, und in entsprechenden Komposita fällt der Hauptakzent somit auf den zweiten Bestandteil. Die Distribution und Realisierung von Akzenttönen wird auch durch phrasale Regeln bestimmt, was sich sowohl auf die Bildung von Komposita als auch auf die freie syntaktische Kombinatorik und damit auf die nächsthöhere prosodische Ebene bezieht. Treffen in der Redekette beispielsweise zwei metrisch starke Silben aufeinander, die unterschiedlichen phonologischen Wörtern angehören und mit denen in isolierter Aussprache jeweils ein Akzentton assoziieren könnte, dann wird die hieraus eigentlich resultierende Realisierung zweier adjazenter gleichartiger Akzenttöne (sog. accent clash) durch unterschiedliche Strategien verhindert. Dies kann entweder zur Verlagerung der (lexikalisch festgelegten oder postlexikalisch zugewiesenen) Akzentstelle (Beispiele 3-92.a, b) bzw. zu Deakzentuierung (Beispiel 3-92.c) oder Herunterstufung von Akzenten führen (Beispiel 3-92.d). Die Herabstufung (downstep) des Akzents im spanischen Beispiel (3-92.d) wird hier durch das im No-
Die Verschiebung des Akzents von der vorletzten auf die erste Silbe dient im Polnischen zur Signalisierung kontrastiver Fokussierung (vgl. Cruttenden 2 1997: 142).
5. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
181
tationssystem ToBI übliche Diakritikon '!' angezeigt; die konkret realisierten Akzenttöne werden an dieser Stelle nicht weiter spezifiziert. 77 a. b. c. d.
engl .ponTOON
+ BRIDGE —> PONtoon BRIDGE 'Pontonbrücke' fr. beauCOUP+ PLUS — » BEAUcoup PLUS 'viel mehr' engl. GRAND + PIAno — » GRAND piano sp. comPRÓ + PEras - » pro comprö PEras (neutraler Kontext)
if y* 'Er/sie hat Birnen gekauft.'
In der Literatur erklärt man derartige Erscheinungen meist unter Verweis auf das sog. Obligatory Contour Principie (OCP; Goldsmith 1979), welches die unmittelbare Adjazenz von identischen Segmenten beziehungsweise - übertragen auf die Intonation - von identischen Tönen ausschließt, oder durch die Annahme bestimmter Anpassungsregeln (readjustment rules), die für die Tilgung bzw. Verlagerung überschüssiger Akzente zuständig sind (so etwa Di Cristo 1998 für das Französische; vgl. Abschnitt 3.2.4).78 Als ein dritter Punkt, der die Realisierung von Akzenttönen nachhaltig beeinflussen kann, ist die Informationsstruktur zu nennen. So bewirkt beispielsweise die Fokussierung eines satzinitialen Subjekts in situ in zahlreichen Sprachen Deakzentuierung oder Reduktion der postnuklearen Akzenttöne, wodurch das präsupponierte Material auch prosodisch in den Hintergrund tritt (zum Spanischen vgl. den folgenden Abschnitt). Abgesehen von derartigen Faktoren lässt sich in natürlicher Sprache innerhalb jeder Intonationsphrase (IP) eine sukzessive Herabstufung der Akzenttöne feststellen, die physiologisch bedingt und damit vorhersagbar ist (engl. downstep, sp. escalonamiento descendente, fr. déclinaison).79 Deshalb kann dieser physiologisch bedingte downstep nicht Bestandteil der phonologischen tonalen Repräsentation sein (vgl. Hualde 2003a). Will man die Herabstufung der Akzenttöne im Sinne einer oberflächennahen Transkription signalisieren,
77
78 79
Für das im Rahmen der vorliegenden Studie angenommene Tonrepertoire des Spanischen vgl. den folgenden Abschnitt. Zur Anwendung des auf dem AM-Modell basierenden Notationssystems ToBI (Tone and Break Indices) auf das Spanische vgl. Beckman et al. (2002) und Sosa (2003a). Im Rahmen der vorliegenden Studie wird nur im Bedarfsfall auf die dortigen Notationskonventionen zurückgegriffen. Post (2000, 2002) spricht hierbei von clash resolution. Kohler (o.J.) gibt im Rahmen des Kiel Intonation Model (KIM) für den downstep als Faustregel an, dass jedes FO-Maximum um 6% niedriger ist als das vorangehende.
Christoph Gabriel
182
dann werden die jeweiligen Töne mit dem Diakritikon '!' versehen; vgl. das folgende Beispiel aus dem Korpus: (3-93)
(Kontext: 'Was passiert hier?")
sp.
{Maria le estd dandom
L*H Sprecher G C 2 1
L!H*
el penödico a su herMAno )IP L*!H
L!H*
L%
Interessant ist, dass der letzte Akzentton (herMAno) mit 130,1 Hz einen deutlich geringeren FO-Wert aufweist als der initiale Akzentton auf Maria (163,3 Hz) und trotzdem als der prominenteste wahrgenommen wird. Phonetisches Korrelat ist hierbei die Dauer: Die letzte Tonsilbe ist als Träger des Nuklearakzents mit 0,137 s deutlich länger als die pränuklearen Silben, die in Bezug auf die Dauer Werte zwischen 0,069 und 0,086 s aufweisen. 81 Tritt bei einem pränuklearen Akzentton die zu erwartende Herabstufung nicht ein, dann hat dies eine pragmatische Funktion, und zwar insofern, als hierdurch die informationsstrukturelle Gliederung der betreffenden Äußerung signalisiert wird. So ist in dem folgenden Beispiel die dem Fokus unmittelbar vorausgehende Konstituente durch den ausbleibenden downstep des hohen Teiltons auf der metrisch starken Silbe von Alemania gekennzeichnet (angezeigt durch das Diakritikon '¡'). 82
80
Man beachte, dass es hier aufgrund der unmittelbaren Adjazenz von metrisch starken Silben (estd dando) nicht möglich ist, beide Akzenttöne ohne Modifikation zu realisieren. Anders als bei der in Beispiel (3-92.d) skizzierten Lösung durch Akzentreduktion, erfolgt hier jedoch kontextbedingte Deakzentuierung.
81
Auf die Längung finaler Nuklearsilben weist auch Hualde (2002a: 108) hin. Toledo (1989) zeigt am Beispiel des argentinischen Spanisch, dass auch Nuklearakzente, die sich aufgrund von Fokussierung nicht in Finalposition befinden (Typ: F [S] F VO), von der Längung der entsprechenden Silbe betroffen sind.
82
Hinzu kommt ein Phrasenton H-, der den rechten Rand des präsupponierten Materials markiert (vgl. Abschnitt 3.2.2).
183
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung (3-94)
(Kontext: 'Wann kommt dein Bruder aus Deutschland?') sp. (Mi hermano
I I L*H
viene de Alemania
L*H
I L*jH
f\maNAna\v
I L!H*
)n> (Hualde 2003a: 166)
I L%
'Mein Bruder kommt F [morgen] F aus Deutschland.'
Töne können jedoch nicht nur mit metrisch starken Silben, sondern auch mit prosodischen Grenzen verbunden sein. Hierbei ist zu unterscheiden zwischen den (IP-)Grenztönen (engl, boundary tones), die mit den Rändern der Intonationsphrase (IP) assoziieren, 83 und den Phrasentönen (engl, phrase accents), die als intermediäre Grenztöne mit den Rändern der hierarchisch tiefer angesiedelten Ebene der Intermediärphrase (ip, engl, intermediate phrase) verbunden sind. Da durch die Kombination von Grenz- und Phrasentönen ohnehin bitonale Muster entstehen können, 84 kommt man bei diesen im Gegensatz zu den Akzenttönen mit monotonalen Grundeinheiten aus. Wichtig ist, dass die Assoziierung von Grenz- und Phrasentönen zwar jeweils mit prosodischen Grenzen erfolgt, dass sich die Alignierung jedoch auf die mit der betreffenden Grenze adjazente(n) Silbe(n) bezieht, da jede phonetische Materialisierung von Tönen notwendigerweise lautliches Material voraussetzt. Fallen mehrere Töne auf einer Silbe zusammen, dann kann der hierarchisch höhere den hierarchisch tieferen Ton überlagern. Dies ist beispielsweise der Fall, wenn auf der Tonsilbe eines pänultimabetonten Wortes wie herMAno oder maNAna in IP-finaler Position der finale Nuklearakzent LH* realisiert wird: Der auf der letzten verbleibenden Silbe realisierte Tiefton entspricht dann dem hierarchisch höheren (IP-)Grenzton L% (und nicht dem Phrasenton L-). Zum besseren Verständnis ist an dieser Stelle ein Exkurs zum Terminus 'Phrasenton' (phrase accent) angebracht, den Pierrehumbert (1980) aus der bereits erwähnten Arbeit von Bruce (1977) zum Schwedischen übernommen hat. Das in Stockholm gesprochene Schwedisch leistet in bestimmten Kontexten lexikalische Differenzierung durch tonale Kontraste. So sind die isoliert geäußerten definiten Nominalphrasen [DPanden] 'die Ente' (and 'Ente' + enklitischer Determinant -eri) und [DPanden] 'der Geist' (ande 'Geist' + enklitischer Determinant -ri) zwar auf segmentaler Ebene identisch, doch sie unterscheiden sich durch die unterschiedliche Alignierung des fallenden Akzenttons (HL* bzw. H*L). Bei isolierter Aussprache manifestiert sich dies
83
Ob es sich um einen initialen oder finalen Grenzton handelt, wird durch die Position des Prozentzeichens vor oder nach dem Tonsymbol angezeigt, z.B. %H = hoher initialer Grenzton, L% = tiefer finaler Grenzton.
84
So führt Hualde etwa die Schlusskontur L- H% als „descenso incompleto con subida de continuación final" an (2003a: 169). Die typische finale Kontur des Deklarativsatzes (L-L%) hingegen ist nur als monotonales Muster wahrnehmbar.
184
Christoph
Gabriel
in Form eines einfachen bzw. doppelten Tonhöhengipfels. Wichtig ist hierbei, dass der entsprechend wahrnehmbare Kontrast nicht in allen syntaktischen Kontexten zutage tritt, sondern nur dann virulent wird, wenn Fokussierung vorliegt - aufgrund der pragmatischen 'Wertlosigkeit' einer Äußerung, die ausschließlich aus präsupponiertem Material besteht, ist isolierte Aussprache notwendigerweise mit Fokussierung der betreffenden Konstituente verbunden. Fokussierung erfordert im Schwedischen einen Hochton H, der als „floating tone" charakterisiert werden kann und der sich zwischen den mit der metrisch starken Silbe assoziierenden Akzentton und den finalen Grenzton L% einpassen muss (vgl. Gussenhoven 2004: 21 lf.). Aus den unterschiedlichen alignment-Eigenschaften des fallenden Akzenttons ergibt sich nun, ob alle zugrunde liegenden (Teil-)töne realisiert werden können oder nicht. Vgl. hierzu die nach Hualde (2003a: 171) und Gussenhoven (2004: 211) stilisiert dargestellten FO-Konturen. Die overt realisierten Töne sind fett gesetzt und entsprechen jeweils den auf der FO-Kontur eingezeichneten Punkten; nicht auf der Oberfläche erscheinende Töne sind durchgestrichen. (3-95) a.
schw.
( ort
HL*
den )]P
H L%
'die Ente' sog. Akzent I
b.
( àn
H*L
den )|P
H L%
'der Geist' sog. Akzent II
Im Fall von [wanden] 'die Ente' (Akzent I) aligniert der tiefe Teilton des Akzenttons HL* mit der metrisch starken Silbe. Da es sich bei isolierter Aussprache um absoluten Anlaut handelt, wird der vorausgehende hohe Teilton nicht realisiert (HL*), wodurch sich aufgrund der sich unmittelbar anschließenden Realisierung des fokalen Hochtons und des tiefen Grenztons der Höreindruck eines einfachen Tonhöhengipfels ergibt. Dieser wahrnehmbare pitch peak entspricht dem fokalen Hochton (3-95.a). Anders ist der Fall beim Akzent II, wo der hohe Teilton des fallenden Akzenttons (H*L) mit der metrisch starken Silbe aligniert: Hier müssen der fokale Hochton und der tiefe Grenzton sozusagen auf engstem Raum im Zeitfenster der zweiten Silbe realisiert werden, und es resultiert ein zweifacher wahrnehmbarer Tonhöhengipfel (3-95.b). Den fokalen Hochton bezeichnet Bruce (1977) als phrase accent, was Hualde wie folgt motiviert: ,,[S]us características son similares a las del acento tonal asociado con la sílaba tónica, pero sirve para otorgar prominencia a la frase asociada" (2003a: 172). Pierrehumbert (1980) übernimmt den Terminus phrase accent für ihre Analyse des Englischen, um auf einen signifikanten Tonhöhenpunkt zu verweisen, der in den meisten Fällen bei postfokaler Deakzentuie-
3. Theoretischer Hintergrund, Forschungsüberblick
und
Modellbildung
185
rung zwischen dem letzten Akzentton und dem finalen Grenzton zu verzeichnen ist. Vgl. hierzu das Originalbeispiel von Pierrehumbert, das ich hier mit der von Gussenhoven (2004: 127) hinzugefügten stilisierten FO-Kontur wiedergebe. (3-96)
(Kontext: 'Fast alle Städte haben ja eine Kegelbahn ...')
engl.
Does MAnitowac have a bowling alley? I
I
I
L* HH% 'Hat F[Manitowac]F eine Kegelbahn? (ebenso wie andere Städte, von denen ich weiß, dass sie eine solche haben)'
Aufgrund der informationsstrukturellen Gliederung des Interrogativsatzes erhält die metrisch starke Silbe in ^ ( M A n i t o w a ^ a den Nuklearakzent, und es tritt postfokale Deakzentuierung ein. Deshalb assoziiert mit der metrisch starken Silbe in nXbowling cilley)(0 kein weiterer Akzentton. Trotzdem ist zwischen dem satzinitial lokalisierten fokalen Akzentton (L*) und dem finalen hohen Grenzton (H%) kein gleichmäßiger Tonhöhenanstieg zu verzeichnen. Dieser erfolgt vielmehr in zwei Etappen, wobei die Tonhöhe des ersten Teilanstiegs bei have erreicht wird. Pierrehumbert analysiert diesen salienten Punkt in der FO-Kontur als Phrasenton (H-). Bei der Einführung der intermediate phrase (ip) in Beckman/Pierrehumbert (1986) wird der Phrasenton dann als Grenzton dieser hierarchisch tiefer angesiedelten phrasalen Einheit reanalysiert. Während Pierrehumbert den ursprünglichen Terminus beibehält, wird in neueren Ansätzen, die Phrasentöne als intermediäre Grenztöne auffassen, oft auf eine terminologische Differenzierung der beiden Grenztontypen verzichtet. So spricht beispielsweise Hualde (2003a) einheitlich von tonos de juntura oder tonos de frontera und unterscheidet somit terminologisch nicht zwischen IPund ip-Grenztönen. In Intonationssprachen werden ip-Grenztöne u.a. eingesetzt, um bei Aufzählungen Progredienz zu signalisieren, um die informationsstrukturelle Gliederung anzuzeigen sowie um syntaktische Mehrdeutigkeiten zu desambiguieren. Die jeweiligen Fakten des Spanischen werden im folgenden Abschnitt besprochen; generell zum Status der Phrasentöne in der neueren Intonationsphonologie vgl. Grice et al. (2000). Die hierarchisch höheren IP-Grenztöne können am linken Rand der IP fakultativ auftreten, nämlich dann, wenn der Stimmeinsatz einen signifikant höheren FO-Wert aufweist als der tonale Schlusspunkt der vorausgehenden IP. Durch finale Grenztöne wird vor allem der Satzmodus angezeigt, wobei ein
186
Christoph Gabriel
hoher Grenzton H% in den meisten Sprachen dem interrogativen Modus (Ja/ Nein-Fragen), ein tiefer Grenzton L% dem deklarativen Modus entspricht. Betrachten wir an dieser Stelle das Modell der wohlgeformten Intonationsphrase nach Beckman/Pierrehumbert (1986), das das bisher Gesagte zusammenfasst und wie folgt zu lesen ist: Am linken Rand der IP kann ein fakultativer hoher Grenzton erscheinen (%H); der Grenzton am rechten Rand ist hingegen obligatorisch (H% oder L%) und kann mit einem gleichfalls hohen oder tiefen intermediären Grenzton (H-, L-) zusammenfallen. Die subskribierte Ziffer 1 besagt, dass das in der entsprechend markierten Klammer befindliche Element in jeder IP mindestens einmal vorkommt. So muss eine Intonationsphrase (IP) aus mindestens einer Intermediärphrase (ip) bestehen, und diese muss wiederum mindestens einen Akzentton beinhalten. Wichtig ist hierbei, dass bei mehreren Akzenttönen aber wiederum nur ein Phrasen- bzw. ip-Grenzton (T-) vorliegt. H* L* (3-97) L + H* H + L* Halten wir uns zum Schluss des einführenden Abschnitts vor Augen, mit welchen prosodischen Ebenen die jeweiligen Töne verbunden sind: Akzenttöne assoziieren mit der Silbenebene, Phrasentöne mit der ip- und Grenztöne mit der IP-Ebene. (3-98)
IP
(%H)
T*
T-
T%
Im folgenden Abschnitt zeige ich, in welcher Weise sich die Intonation des Spanischen mithilfe des AM-Modells erfassen lässt.
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
187
3.2.2 Anwendung auf das Spanische Die messbare kontinuierliche FO-Kontur ist das Ergebnis der phonetischen Interpolation zwischen einzelnen phonologisch relevanten und mit bestimmten Silben und prosodischen Grenzen assoziierten Tönen. Ziel der AM-basierten Modellierung eines einzelsprachlichen Intonationssystems ist es, die an der Oberfläche realisierten Tonkonturen (in schematisierter Form) zu inventarisieren und hieraus das Repertoire von als zugrunde liegend anzunehmenden Tönen abzuleiten. Betrachten wir zunächst, welche overten Realisierungen von Akzenttönen im Spanischen vorliegen. Im vergangenen Abschnitt haben wir bereits gesehen, dass Akzenttöne sowohl als L*H (late rise) als auch in Form von LH* (early rise) realisiert werden. Das in diesem Zusammenhang angeführte Beispiel (3-90), hier wiederholt als (3-99), lässt vermuten, dass es sich um einen phonologischen Kontrast zwischen einem neutralen und einem kontrastiven Akzentton handelt. (3-99) a.
sp.
(neutraler Kontext: 'Was ist los?') le da el diario a su herMAno]F
F [Maria
(MA2_1)
I
L*H b.
(Kontext: 'Julia gibt ihrem Bruder die Zeitung, nicht wahr?') MaRIah le da el diario a su hermano (MA2 4)
FIFOC
I LH*
Es wäre also von zwei zugrunde liegenden kontrastierenden Akzenttönen /L*H/ und /LH*/ auszugehen. Einen solchen phonologischen Kontrast setzt Face (u.a. 2001: 241f., 2002a: 90f„ 2002b und passim) an, der die Korrelate des kontrastiven Fokus im Spanischen von Madrid in zahlreichen Arbeiten ausführlich untersucht hat. Hualde (2002a) argumentiert gegen eine solche Kontrastanalyse, indem er darauf hinweist, dass die Verschiebung des Gipfels aus der starken Silbe heraus nach rechts nicht unbedingt eine kontrastive Lesart zur Folge haben muss, sondern dass dies kontextuell bedingt und damit allophonisch sei. So unterscheidet sich der finale nukleare Akzentton von den pränuklearen Akzenttönen dadurch, dass ersterer im Gegensatz zu den vorausgehenden Akzenttönen als early rise (LH*) realisiert wird, und zwar unabhängig davon, ob enger oder weiter neutraler oder aber kontrastiver Fokus vorliegt; vgl. das folgende Beispiel, das mit der angezeigten Tonkontur mit drei unterschiedlichen Fokus-Hintergrund-Gliederungen kompatibel ist: (3-100)
(Kontext: 'Was passiert hier?') (Kontext: 'Wo kauft Maria die Zeitung?')
weiter Fokus enger Fokus
188
Christoph Gabriel (Kontext: 'Maria kauft die Zeitung im Supermarkt, nicht wahr?') kontrastiver Fokus sp. (Maria compra el diario en el KIOSco )]P
I
I
I
L*H L*H
L*H
I
I
LH*
L%
Andere romanische Sprachen hingegen weisen in der IP-finalen Position diese Neutralisierung nicht auf: So liegt im europäischen Portugiesisch ein finaler Kontrast zwischen dem neutralen nuklearen Akzentton HL* und dem kontrastiven Akzentton H*L vor (vgl. Frota 2002: 321), und im neapolitanischen Italienisch kontrastieren weiter und enger (neutraler oder kontrastiver) Fokus, angezeigt durch die neutrale fallende Schlusskontur HL* L%, von der sich der Akzentton LH* abhebt, der engen Fokus signalisiert (vgl. D'Imperio 2002: 58). Wie im folgenden Abschnitt zu zeigen sein wird, zeichnet sich auch der in Buenos Aires und der Küstenregion bis hinunter nach Südpatagonien gesprochene argentinische Prestigedialekt, das sog. porteno-Spanische, dadurch aus, dass sich informationsstrukturelle Kontraste in IP-finaler Position durch unterschiedliche tonale Konturen manifestieren. Im Standardspanischen kann der overt realisierte Ton LH* jedoch nicht wie man mit Blick auf den Kontrast in (3-99) zunächst vermuten könnte - als eindeutiges Indiz für kontrastive Fokussierung gewertet werden. Vielmehr liegt in IP-finaler Position eine Neutralisierung vor, und zwar dergestalt, dass der nicht-kontrastive Akzentton, der pränuklear als L*H (late rise) realisiert wird, in finaler Position auf der Oberfläche mit dem kontrastiven Akzentton LH* zusammenfällt. Grund für die Realisierung des IP-finalen Akzenttons als LH* ist der tiefe Grenzton L%, der zwar nicht mit einer Silbe assoziiert, aber eine solche zur Alignierung braucht: Wird demnach auf der letzten Silbe der IP ein Tiefton realisiert, dann ist diese für eine Verschiebung des Tonhöhengipfels des vorausgehenden Akzenttons blockiert. Die Realisierung des finalen Nuklearakzenttons als LH* ist demnach durch den anschließenden tiefen Grenzton L% determiniert: „The different alignment between prenuclear and nuclear accents seems to follow from the fact that in case of nuclear accents there is another low tone that must be realized within the word. This low boundary tone would prevent the displacement of the accentual peak towards the right" (Hualde 2002a: 107). Weiterhin besteht eine starke Tendenz zur Realisierung eines Akzenttons innerhalb der Grenzen des entsprechenden phonologischen Wortes (vgl. Lüstern et al. 1995), was bedeutet, dass der neutrale Akzentton immer dann als LH* realisiert wird, wenn er mit der letzten Silbe eines Wortes assoziiert. So wird der pränukleare Akzentton, der mit der endbetonten Verbform comprö
189
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
'er/sie hat gekauft' verbunden ist, von allen 18 Vpn des Korpus (und damit dialektübergreifend) als schnell ansteigender Ton LH* realisiert. (3-101)
(Kontext: 'Was hat Maria gemacht?') sp.
(Maria
comprö el diario en el KIOSco
I I L*H
I LH*
L*H
I LH*
)i P
(u.a. BAU5_2) 8 5
I L%
Eine kontrastive Lesart ist hier durch den Kontext ausgeschlossen. Es erscheint also sinnvoll, von einem einzigen zugrunde liegenden Akzentton auszugehen, der auf der Oberfläche in Form von kontextbedingten allophonischen Varianten erscheint. Als Lösung bietet sich hierfür die Klammernotationsweise an, die Hualde von Ladd (1996) übernommen hat, und die anzeigt, dass jeder der beiden Teiltöne mit der metrisch starken Silbe assoziieren kann: (3-102)
* [ . . . (G) ...] word I L+H
/(LH)*/
(vgl. Hualde 2002a: 106)
Legt man für das Spanische den Akzentton /(LH)*/ zugrunde, dann ist auf diese Weise abgedeckt, dass am rechten Rand sowohl der IP als auch des phonologischen Wortes co (d.h. bei Endbetonung) ein schneller Tonhöhenanstieg LH* realisiert wird.86 Es fragt sich allerdings, wie mit dem in (3-99) gezeigten Kontrast zwischen dem pränuklearen L*H und dem kontrastiven LH* umzugehen ist. Hualde schlägt in Analogie zu seinem Vorgehen beim finalen Nuklearakzent vor, anstelle einer zugrunde liegenden Opposition bei kontrastiver Lesart die (notwendigerweise enge) Fokusdomäne durch einen tiefen Phrasenton L- zu begrenzen, der die Verlagerung des Tonhöhengipfels nach rechts blockiert (ebenso Nibert 2000). Hieraus ergibt sich für (3-99.b) die folgende Repräsentation.
Die hier verzeichnete Kontur wird von insgesamt 7 Vpn realisiert; 9 Vpn realisieren anstelle des finalen LH* einen reduzierten Akzentton (L*). Der pränukleare Akzentton auf comprö betrifft jedoch ausnahmslos alle 18 Sprecher. Face (2001: 242) spricht sich gegen die von Hualde verwendete Klammemotation nach Ladd aus, da diese im AM-Modell keine Standardnotation darstelle.
Christoph Gabriel
190 (3-103)
sp.
( f[FocMaRia]f
)ip
le da el diario a su hermano
I I / (LH)* L- / LH* LUnbestrittener Vorteil dieser Analyse ist die Beschränkung des Inventars zugrunde liegender Akzenttöne auf eine einzige Einheit. Problematisch erscheint jedoch die hiermit verbundene Annahme, dass ein intermediärer Grenzton L-, der sinnvollerweise nur am rechten Rand des phonologischen Wortes platziert ist, die Verschiebung des Tonhöhengipfels auf Wortebene blockieren und damit sozusagen innerhalb einer hierarchisch tieferen prosodischen Ebene operieren kann. Dies ist bei den sog. palabras llanas (pänultimabetonte Wörter) unproblematisch, da für eine potenzielle Verschiebung des Tonhöhengipfels nur eine einzige nachtonige Silbe zur Verfügung steht, die bei Präsenz eines tiefen Phrasentons L- für dessen Alignierung genutzt werden muss und somit für den Akzentton blockiert ist (3-104.a').87 Bei den (antepänultimabetonten) palabras esdrüjulas jedoch stünde bei Alignierung des ip-Grenztons mit der Ultima immer noch die Pänultima für eine potenzielle Verschiebung des Tonhöhengipfels zur Verfügung: Trotzdem erfolgt bei kontrastiver Fokussierung die Realisierung als LH*. Vgl. hierzu jeweils die Alignierung des hohen Teiltons bei diario und periödico, jeweils bei kontrastiver Fokussierung. (3-104)
a.
sp.
DIA- rio )i.'ip / (LH)*
b.
pe-
RIÓ-
a.'
L- /
di-
/ (LH)*
co )ip
b.'
Lb."
87
* pe-
S pe-
DIA¿¿ir rio ' iv N-x'l L H L
j,
) i .p
RIÓ-
di- co )j
L
H L
RION LH
di- co )j'.p I L
Eine Tilgung des Phrasentons zugunsten des Akzenttons ist ausgeschlossen, da ersterer in der prosodischen Hierarchie höher steht.
3. Theoretischer Hintergrund, Forschungsüberblick
und
191
Modellbildung
Die Annahme eines am rechten Rand der kontrastiv fokussierten Konstituente platzierten tiefen Phrasentons L- sagt zwar korrekt voraus, dass bei (3-104.a') die Alignierung des hohen Teiltons mit der ersten Silbe erfolgt, jedoch lässt sich hierdurch nicht motivieren, dass das in (3-104.b') skizzierte alignment ausgeschlossen ist. Geht man hingegen von einem zugrunde liegenden kontrastiven Akzentton /LH*/ aus, dann ist von vornherein festgelegt, dass an der Oberfläche nur der schnell ansteigende Ton LH* erscheinen kann. Allerdings bleiben auch in einer solchen Sichtweise noch Fragen offen: Zunächst ist unklar, wieso bei antepänultimabetonten Wörtern wie periódico in IP-finaler Position eine Verschiebung des Tongipfels auch dann ausgeschlossen ist, wenn keine kontrastive Fokussierung vorliegt und dementsprechend /(LH)*/ als zugrunde liegender Akzentton angenommen werden muss. Hier lässt sich argumentieren, dass eine IP-Grenze auch immer zugleich eine ip-Grenze ist, woraus bei einem Deklarativsatz die finale Kontur L-L% resultiert. Eine Verschiebung des Tongipfels nach rechts ist dann durch die beiden sich überlagernden Tieftöne blockiert (angedeutet durch die Pfeile). (3-105)
(Kontext: 'Was kauft Maria am Kiosk?') sp.
((María
compra
un
peRIO
dico
)¡p
)i P
(ALC1_2)
I I I / (LH)* L- L% / LH*I < - < - L- L% Sprecher ALC1_2 Ma-
Ür
a
com-
pra un
pe-
tiär
di-
CO
s LH* — - /
0
- —
-
•
- - -
Tune)
^
1.320S4
Zweitens fragt sich, weshalb auch bei nicht-kontrastiver Fokussierung in situ keine Verlagerung des Tonhöhengipfels nach rechts erfolgt. Legt man hier den nicht-kontrastiven Akzentton /(LH)*/ zugrunde, dann müsste - da hier nach Hualde keine ip-Grenze folgen sollte - auch die Realisierung als L*H möglich sein, was de facto aber nicht vorkommt.
Christoph Gabriel
192 (3-106) sp.
(Kontext: 'Was gibt Maria ihrem Bruder?') {(Maria le da un peRIOdico a su hermano )ip )ip I / (LH)* LH*
(ALC2_5)
I I L- L % /
Sprecher A L C 1 2 Ma- ri- ti le dz un
pe- rió- ii- co a su her- maswer ma
no np
I
1 X. 0
LH*
Ttnt(»)
2JUM
Ich werde im weiteren Verlauf dieser Arbeit argumentieren, dass Sprecher, die neutralen engen Fokus durch prosodische Hervorhebung in situ signalisieren, diesen genauso behandeln wie kontrastiven Fokus. Demnach würde in solchen Fällen auch hier der kontrastive Akzentton /LH*/ zugrunde liegen (vgl. Abschnitt 4.3.2). Kommen wir an dieser Stelle nochmals auf die möglichen Oberflächenrealisierungen des nicht-kontrastiven Akzenttons zurück. Wichtig ist, dass die Allophonie hierbei nicht auf die Verschiebung des Tonhöhengipfels über die tonal markierte Silbe hinaus beschränkt ist (/(LH)*/ —» L*H, LH*). Vielmehr erscheint der Nuklearakzent in finaler Position auch häufig in reduzierter Form als monotonaler Tiefton L* an der Oberfläche. Eine solche Reduktion des finalen Nuklearakzents zeigt sich beim folgenden, dem Lesekorpus entnommenen Stimulus: 10 von insgesamt 18 Vpn, realisieren hier, unabhängig ihrer dialektalen Zugehörigkeit, eine fallende Schlusskontur.88
88
Dialektal kann der finale Tiefton L* die unmarkierte Realisierung des nicht-kontrastiven Akzenttons in IP-finaler Position sein. So ist beispielsweise das porfeno-Spanische dadurch gekennzeichnet, dass der finale (nicht-kontrastive) Akzentton in Deklarativsätzen durchgehend als Tiefton realisiert wird (vgl. Sosa 1999: 187). Bei finaler kontrastiver Fokussierung ist hier jedoch vor dem schließenden tiefen Grenzton L% ein steigender Ton zu verzeichnen. In anderen Varietäten erscheint in dieser Position L* allerdings nicht durchgehend, was die Analyse als allophonische Variante des neutralen Akzenttons plausibler erscheinen lässt (für Genaueres zur dialektalen Variation vgl. Abschnitt 3.2.3).
3. Theoretischer Hinlergrund, Forschungsüberblick
(3-107) sp.
und
193
Modellbildung
(Kontext: 'Was hat Maria gemacht?') (Maria comprö el diario en el KIOSco I I I / (LH)* (LH)* L*H LH* Sprecherin AR5 2 Ma
)]P (AR5 2)
I I (LH)* L% / L* L%
(LH)* L*H
prö
kg
kjss
Interessant ist, dass die Realisierung des IP-finalen Nuklearakzents als Tiefton auch Konstituenten betrifft, die im neutralen engen Fokus stehen, dass beim kontrastiven Fokus hingegen keine derartige Akzentreduktion zu verzeichnen ist. Betrachten wir hierzu den Kontrast zwischen den beiden folgenden Beispielen: (3-108) a.
sp.
(Kontext: 'Wo hat Maria die Zeitung gekauft?') (Maria comprö el diario r[en el KIOSco]F I I I / (LH)* (LH)* L*H LH* Sprecherin MA5_4 Ma- ü-
a com-prö
L*H
22 .«07»
b.
LH* X A-
el
(LH)* L*H
I (LH)* L*
dia- rio en el
kios-
L*H
\
)ip (MA5 4) I L% L%
CO
L* X.
24.3111
Time (•)
(Kontext: 'Maria hat die Zeitung im Supermarkt gekauft, nicht wahr?') (No. Maria comprö el diario r[en el KIOSco ]F )ip (MA5 9) /
I I (LH)* L*H
I (LH)* (LH)* LH* L*H
I (LH)* LH*
I L% / L%
194
Christoph Gabriel Sprecherin M A 5 _ 9 No. Ma- rl-
L*H
a com- pri
el dia- rio enel kios-
LH*
L'H n/-
60.6217
Tùne(i)
-
K.•r-
CO
LH»
«3.4676
Auch dies scheint darauf hinzudeuten, dass bei nicht-kontrastivem und kontrastivem Fokus unterschiedliche Akzenttöne zugrunde liegen: Während im Fall des nicht-kontrastiven Tons /(LH)*/ eine ganze Bandbreite von allophonischen Realisierungsmöglichkeiten vorliegt (L*H, LH* und L*), ist das Oberflächenkorrelat des kontrastiven Akzenttons /LH*/ auf LH* beschränkt.89 Kommen wir nun auf die Funktion der intermediären Grenztöne zu sprechen. In Zusammenhang mit der Diskussion der Akzenttöne habe ich den Vorschlag von Hualde angesprochen, anstelle eines zugrunde liegenden kontrastiven Akzenttons einen tiefen Phrasenton L- anzusetzen, der den rechten Rand der (kontrastiven) Fokusdomäne begrenzt. Ich habe argumentiert, dass die Annahme eines zugrunde liegenden kontrastiven Akzenttons besser der Tatsache gerecht wird, dass dieser im Gegensatz zum nicht-kontrastiven Akzentton stets als schnell ansteigender Ton LH* realisiert wird. Zudem lässt sich bei mehreren nachtonigen Silben allein durch einen intermediären Grenzton Lkaum motivieren, dass die Verschiebung des Tonhöhengipfels blockiert ist. Es fragt sich jedoch, ob damit gänzlich von der Annahme intermediärer Grenztöne am rechten Rand der kontrastiven Fokusdomäne Abstand genommen werden kann. Betrachten wir hierzu das folgende Beispiel, bei dem das gesamte postfokale Material als tiefes Plateau realisiert wird. Im Fall von MaRla le dio el diario a su hermano (Stimulus 5 7) liegt bei 3 von 18 Vpn vollkommene Deakzentuierung vor (u.a. MA5 7); bei 7 weiteren Sprechern werden die postfokalen Akzenttöne zum Teil getilgt, wobei der unmittelbar auf den Fokus folgende Akzentton eher getilgt wird als die späteren (u.a. MMS5 7). Nimmt man an, dass der rechte Rand der Fokusdomäne durch einen tiefen Eine andere Analyse, auf die hier nur hingewiesen werden soll, nimmt für das Spanische einen zugrunde liegenden monotonalen Akzentton H* an, dessen Gipfel aufgrund unterschiedlicher Alignierung auf der Oberfläche als late rise bzw. early rise realisiert werden kann (Nibert 1999, 2000; Prieto 2001; Garcia Lecumberri 1995; Cabrera Abreu / Garcia Lecumberri 2003: 40). Die Annahme eines bitonalen Akzenttons (LH)*, in der ich Hualde folge, scheint den unterschiedlichen Oberflächenkorrelaten jedoch besser gerecht zu werden.
3. Theoretischer Hintergrund, Forschungsüberblick
195
und Modellbildung
Phrasenton markiert ist, dann ergibt sich das tiefe Plateau aus dem Zwang, unmittelbar nach der fokussierten Konstituente das tiefe Tonniveau zu erreichen. (3-109)
(Kontext: 'Julia hat ihrem Bruder die Zeitung gegeben, nicht wahr?')
a. sp.
((MaRIa )ip (le dio el diario a su hermano\ )|P I I II LH*LSprecherin MA5_7
Ma-
(MA5 7)
L- L%
dio el dia-
suher-
swer
LH' L-L%
• tiefes Plateau
b.
((MaRIa ),p (le dio el diario a su hermano )ip )]P I I I I I I LH* LSprecherin MMS5 7
L*H
dio el
dp:l
L*
dia-
(MMS5 7)
L- L%
su her-
ftwer
LH* (L-: < tiefes Plateau -->LH'
L-L%
Als weitere Konstruktion, bei der mit hoher Wahrscheinlichkeit postfokale Deakzentuierung eintritt, ist die Fokusvoranstellung (foco antepuesto) zu nennen. So erfolgt bei Un DIArio comprö Maria en el kiosco (Stimulus 5 1 0 ) in 6 Fällen vollständige postnukleare Deakzentuierung und Realisierung eines tiefen Plateaus (vgl. hierzu die FO-Kurve der Sprecherin MA5 in 3-59 aus Abschnitt 3.1.3.1); bei einer weiteren Sprecherin (BAU5 7) tritt teilweise Deakzentuierung ein, wobei auch hier der unmittelbar auf die vorangestellte Fo-
196
Christoph
Gabriel
kuskonstituente folgende Akzentton getilgt wird.90 Auch in der Literatur finden sich zahlreiche Belege für postfokale Deakzentuierung, so u.a. bei Domínguez (2004a: 150) für die kastilische Norm und bei Barjam (2004: 61) für das in Buenos Aires gesprochene Spanisch. Ortiz Lira, der verschiedene lateinamerikanische Dialekte und insbesondere das chilenische Spanisch in Bezug auf die postfokale Deakzentuierung präsupponierten Materials mit dem Englischen verglichen hat, hebt den fakultativen Charakter derartiger Akzenttilgungen hervor und charakterisiert sie als „alternativa prosódicamente aceptable, aunque definitivamente menos común que en inglés" (Ortiz Lira 1995: 194). Tatsache ist jedoch, dass auch dann, wenn keine oder nur teilweise postfokale Deakzentuierung vorliegt, die Differenz zwischen dem F0-Wert des fokalen Hochtons LH* und dem nachfolgenden 'Tal' im Tonhöhenverlauf deutlich größer ist als diejenige zwischen einem pränuklearen Tonhöhengipfel und dem darauf folgenden 'Tal'. Vgl. hierzu den neutralen F0-Verlauf in Beispiel (3-93), hier wiederholt als (3-110.a) und durch die Notation der als zugrunde liegend angenommenen Töne ergänzt, mit der vom selben Sprecher realisierten Kontur eines F[S]FVO-Satzes ohne postfokale Deakzentuierung (3-1 lO.b). Im ersten Fall beträgt die Differenz 19,7 Hz, im zweiten Fall 50,2 Hz. Diesem eklatanten Unterschied kann durch die Annahme eines die Fokusdomäne begrenzenden Phrasentons L- Rechnung getragen werden. (3-110) a.
sp.
(Kontext: 'Was passiert hier?') ((María le está dando el periódico
I I / (LH)* L*H
I (LH)* (LH)* L!H*
I (LH)* L!*H
a su herMAno
)jp )IP
I I I (LH)* L- L% / L!H* L-L% (GC2J)
Sprecher GC2 1
0.71908«
90
Time(i)
2.39646
Insgesamt realisieren nur 9 von 18 Vpn die angebotene foco an/epueiio-Konstruktion in angemessener Weise mit einem kontrastiven Akzentton auf der initialen Konstituente. Für eine Interpretation dieses Befundes vgl. Abschnitt 4.3.2.
197
3. Theoretischer Hinlergrund, Forschungsüberblick und Modellbildung
(Kontext: 'Julia gibt ihrem Bruder die Zeitung, nicht wahr?') b.
((MaRIa
/
I
LH* LH*
\{le
I
dio
eldiarioasuherma.no
I
LL-
(LH)* L!H*
I
) ip
I
(LH)* L*!H
I
(LH)* LL!H*
)iP(GC5_7)
I L%
Sprecher GC5_7 Ma-
le dio el dia- rio djo:l
a
dr
a
su herswer
mo-
no
59.4 Hz
r
V
; /
/
109,2 Hz - - -
T
0
1-25705
Ich möchte also mit Hualde (2002a) von einem intermediären Grenzton Lausgehen, der den rechten Rand der kontrastiven Fokusdomäne begrenzt. Wie bereits erläutert, soll hiermit jedoch kein Verzicht auf die zugrunde liegende Opposition eines kontrastiven und eines (neutralen) pränuklearen Akzenttons - /LH*/ v.v. /(LH)*/ - verbunden sein. In der Literatur ist vorgeschlagen worden, auch die Abgrenzung der Fokusdomäne bei neutralem Fokus mithilfe von intermediären Grenztönen zu modellieren. So zeigt Hualde (2002a: 110f.), dass sich enger (neutraler) von weitem Fokus durch die jeweilige Platzierung eines hohen Phrasentons H- unterscheiden lässt, der den rechten Rand des präsupponierten Materials begrenzt: (3-111)
(Kontext: 'Was hat Mariano dir gegeben?') a.
sp.
{{Mariano
me dio \ v (Ala moneda
de oro]?)v
| H-
))P
| L-
(Hualde
| 2002a: 110) L%
(Kontext: 'Was hat Mariano gemacht?') b.
{{Mariano
)jp ( f [ m e dio la moneda
I
de orojF
H'Mariano hat mir die Goldmünze gegeben.'
)jP
I
V
I
L- L%
Diese Beobachtung lässt sich in meinen Daten dialektübergreifend bestätigen. Neben der Realisierung von H- als tonalem Gipfelpunkt der Gesamtkontur lässt sich als ein weiteres Oberflächenkorrelat dieser intermediären Phrasierung die Tatsache anführen, dass bei demjenigen Akzentton, der dem intermediären Grenzton unmittelbar vorausgeht, kein downstep erfolgt. Man verglei-
198
Christoph
Gabriel
che zur Veranschaulichung die beiden folgenden Beispiele aus dem Lesekorpus: (3-112)
(Kontext: 'Wo hat Maria die Zeitung gekauft?') a.
sp.
{{Maria
comprö
I
I
/
el diario
I
),p(f\en
el KIOSco\F
I
(LH)* (LH)* (LH)* HL*H LjH* L*jH HSprecherin MEM5_4 Ma- Ú- a com-
el
prò
),P)IP
I I I
(LH)* L - L % / L* L-L%
dia-
en el
rio
kios-
co
k p s
k
0
f S L * H
L ¡ H *
L *
L * ¡ H
(Kontext: 'Was hat Maria gemacht?') {{María
)ip (^compró
I I
el diario
I
en el KÍOScoh
I
/ (LH)* H(LH)* (LH)* L*H HL!H* L*!H Sprecherin MEM5 2 Ma ci- a com- prò
• í L * H
el
dia-
)¡p )IP
I
I
I
(LH)* L- L% / L!H* L-L%
rio
en el
kios-
co
k p s
ks
'è. U H *
L.'IH L ! H *
Es ist allerdings zu betonen, dass die Möglichkeit der Markierung von Fokusdomänen durch entsprechende Platzierung von Phrasentönen nicht bei allen Sprechern auftritt und auch bei den Versuchspersonen, die dieses Verfahren nutzen, nicht durchgehend Anwendung findet. Wie sich in Zusammenhang mit der Darstellung der Ergebnisse der Datenerhebung noch genauer zeigen wird, kann dann auch eher von einer Möglichkeit gesprochen werden, die den Sprechern zur Verfügung steht, als von einem obligatorischen Verfahren (vgl. Abschnitt 4.3.1).
3. Theoretischer Hintergrund, Forschungsüberblick und
Modellbildung
199
Weiterhin lassen sich die prosodischen Grenzen, die bei Aufzählungen den einzelnen koordinierten syntaktischen Phrasen entsprechen, als Effekte intermediärer Phrasierung auffassen (vgl. Hualde 2003a: 167f.). Man vergleiche das folgende Beispiel, bei dem die einzelnen koordinierten Objekt-DPn jeweils einer ip entsprechen, die durch einen hohen, Progredienz anzeigenden Phrasenton begrenzt wird: (3-113)
sp.
((¿Quiere cerveza alemana\ (agua con gas)ip (o mate cocido?),p )iP I I II HHL- L% 'Möchten Sie deutsches Bier, Mineralwasser oder Matetee?'
Ein weiterer Bereich, in dem intermediäre Phrasierung genutzt wird, ist, wie u.a. Nibert (1999, 2000) und Hualde (2002a, 2003a) gezeigt haben, die prosodische Desambiguierung syntaktischer Mehrdeutigkeiten. Betrachten wir hierzu die folgenden Beispiele: (3-114) a. sp.
b.
((lilas )ip (y lirios amarillos )]p )IP I I I HL- L% 'Flieder und gelbe Schwertlilien' ((lilas y lirios )¡p (amarillos )ip )iP
(Nibert 1999: 232)
I I I HL- L% 'gelber Flieder und gelbe Schwertlilien' (Kontext: 'Was macht die alte Frau?') ((la vieja\ (lanza la amenaza)iV){f I I I HL-L% 'Die alte Frau stößt die Drohung aus.'
(Hualde 2003a: 168)
(mögliche Kontexte: 'Was stößt die alte Frau aus?' / 'Warum hat Maria Angst vor der alten Lanze?') ((la vieja lanza ),v(la amenaza Xp )IP (Hualde 2003a: 169) I I I L- L% HLesart 1: 'Die alte Frau stößt die Drohung aus.' Lesart 2: '(Mariaj ...) Die alte Lanze bedroht siej.' Wie Nibert (1999) mithilfe von Perzeptionstests nachgewiesen hat, ermöglicht die intermediäre Phrasierung in den Beispielen (3-114.a) und (3-114.b) eine eindeutige Zuordnung zu einer der beiden Lesarten, wobei im a-Beispiel die Adjektivphrase [ A pamarillos] Adjunkt zum zweiten Konjunkt ist, im b-Bei-
200
Christoph
Gabriel
spiel dagegen Skopus über die koordinierten Nominalphrasen hat. Im zweiten der hier angeführten Fälle leistet die Platzierung des Phrasentons H- die bereits oben besprochene Markierung der Fokusdomäne. So wird im c-Beispiel weiter Fokus, im d-Beispiel dagegen enger Fokus angezeigt. Aufgrund der Homonymie der Verbform lanza 'er/sie schleudert' mit dem Nomen lanza 'Lanze', des Determinanten la mit dem Objektklitikon und des Substantivs [N amenaza] 'Drohung' mit der entsprechenden Verbform der dritten Person Singular von amenazar 'bedrohen' ermöglicht die Struktur in (3-114.d) jedoch auch eine zweite syntaktische Interpretation - nämlich: la vieja lanza (Subjekt) la (klitisches direktes Objektpronomen) amenaza (Verb) - und damit eine zweite Lesart, die bei der Platzierung von H- nach la vieja nicht gegeben ist. Als letzter Punkt bezüglich der intermediären Phrasierung im Spanischen ist die Abtrennung linksdislozierter Konstituenten vom Kernsatz zu nennen, wobei die einzelnen topikalisierten XPn jeweils einer eigenen ip entsprechen. Interessant ist hierbei, dass die entsprechenden ip-Grenztöne H- von der Herabstufung durch downstep ausgenommen sind und dagegen vielmehr als hochgestufte Töne ¡H- realisiert werden. Dies hat zur Folge, dass derjenige Phrasenton, der den rechten Rand des gesamten topikalisierten Materials (hier: María en el kiosco) markiert und sich damit unmittelbar vor dem fokalen Bereich befindet, den höchsten F0-Wert der gesamten Kontur aufweist und damit der unmittelbar folgenden Fokusdomäne besondere Prominenz zukommen lässt. Zur Veranschaulichung wiederhole ich hier das Beispiel (3-62.b) aus Abschnitt 3.1.3.2 und füge die entsprechende F0-Kontur bei. (3-115) sp.
(Kontext: 'Was macht Maria am Kiosk?') ((María ),p(en el kiosco),p (compra elpeRIOdico )ip )IP (LR 1_6) I I HSprecher LR1_6 300i
I I
II L- L%
¡H-
Ma ri- a en el kios- co
LH»
•j 1
L¡H* — —
com- pra el pe ü¿- di- co pe rjo tti ko
a# L*!H
\
L!H»
In Bezug auf die IP-Phrasierung ist im Spanischen ein finaler Grenzton obligatorisch, der im Regelfall als Tiefton L% eine schließende Kontur darstellt
3. Theoretischer Hintergrund, Forschungsüberblick
und
Modellbildung
201
und als Hochton H% bei Ja/Nein-Fragen den interrogativen Modus anzeigt. Die tonale Schlusskontur von Pronominalfragen, bei denen der interrogative Modus durch Wh-Wörter lexikalisch markiert wird, entspricht hingegen im Wesentlichen derjenigen von Deklarativsätzen (vgl. Sosa 1999: 216, 2003b). Was den initialen Grenzton anbelangt, so besteht weitgehend Einigkeit darüber, einen solchen nur bei hohem Stimmeinsatz anzunehmen, wie es dialektübergreifend für Interrogativstrukturen typisch ist (vgl. Sosa 1999: 150f.). Bevor ich im folgenden Abschnitt kurz auf diejenigen Punkte der dialektalen Variation eingehe, die für die vorliegende Studie relevant sind, fasse ich das angenommene Tonrepertoire tabellarisch zusammen; herab- und heraufgestufte Töne (!T*, ¡T*) werden nicht gesondert als Allophone aufgeführt. (3-116)
Toninventar des S p a n i s c h e n Akzenttöne /(LH)*/
L*H LH*
L* /LH*/
pränuklear nuklear kontextbedingt am Wortende: / _ )M kontextbedingt am IP-Ende / _ >ip ),p freie Variante: / )lp ) IP kontrastiver Fokus
(ip-)Grenztöne (Phrasentöne) IL-I
Begrenzung der (kontrastiven) Fokusdomäne
/H-/
- Begrenzung von präsupponiertem präfokalem Material - Anzeigen von Progredienz bei koordinierten Strukturen - Auflösung syntaktischer Ambiguitäten - Abtrennung linksperipherer fopj'c-Konstituenten
(IP-)Grenztöne /L%/
abschließende Kontur, deklarativ
/H%/
interrogativ (Ja/Nein-Fragen)
/%H/
fakultativ (hoher Stimmeinsatz bei Interrogativa)
202
Christoph Gabriel
3.2.3 Zur diatopischen Variation in der spanischen Intonation Lautliche Variation ist nicht auf die segmentale Phonologie beschränkt, sondern manifestiert sich auch in der Prosodie; auch die einzelnen europäischen und amerikanischen Dialekte des Spanischen unterscheiden sich in Bezug auf ihre intonatorischen Eigenschaften. Eine diesbezügliche umfassende Darstellung kann und soll im gegebenen Rahmen jedoch nicht geleistet werden; ich beschränke mich vielmehr auf diejenigen Aspekte, die für die vorliegende Studie von Relevanz sind. Dies ist zum einen bestimmt durch die im Korpus vertretenen Varietäten. Beginnen wir mit den europäischen Versuchspersonen. Diese stammen zwar aus unterschiedlichen Regionen wie Madrid, Salamanca, Murcia, Logroño, Burgos, Valladolid, Extremadura sowie aus den zweisprachigen Gebieten Galizien und Katalonien (Festland und Balearen),91 sind jedoch durchweg als dem kastilischen Standard nahestehende Sprecher einzustufen. So lassen sich beispielsweise bei dem aus La Coruña (Galizien) stammenden Sprecher keine der für das galizische Spanisch typischen Merkmale wie etwa die im Vergleich zum Standard höhere Intensität betonter Silben oder der deutlich geringere Tonhöhenabfall finaler Konturen ausmachen (zu den intonatorischen Besonderheiten des in Galizien gesprochenen Spanischen vgl. Castro 2003). Auch die spanisch/katalanisch zweisprachigen Sprecherinnen unterscheiden sich bezüglich der Intonation nicht grundlegend von den übrigen Versuchspersonen. Eine Besonderheit des in Katalonien und auf den Balearen gesprochenen Spanisch, dessen Intonation meines Wissens noch nicht systematisch untersucht wurde, ist beispielsweise die Übertragung der fallenden Tonkontur katalanischer Ja/Nein-Fragen, die mit dem Komplementierer que eingeleitet werden (Typ: kat. Que ja has menjat? 'Hast Du schon gegessen?'), auf entsprechend konstruierte Fragesätze des Spanischen: (3-117)
sp.
((Que te dejas la barba?
)
)
I
I
(nach Sinner 2004: 287)
L- L% 'Lässt du dir den Bart stehen?'
Derartige Ja/Nein-Fragen, die nicht der standardspanischen Norm entsprechen, lassen sich aufgrund des einleitenden Komplementierers oberflächensyntaktisch eindeutig als Interrogativa erkennen, weshalb, ebenso wie bei den standardspanischen Pronominalfragen, keine besondere intonatorische Markierung (durch finalen Grenzton H%) vonnöten ist. Da meine Datenerhebung
91
Für die entsprechenden Sozialdaten vgl. die tabellarische Zusammenstellung in Abschnitt 4.2.
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
203
ohnehin nicht auf unterschiedliche Satzmodi, sondern auf die (syntaktische und intonatorische) Vermittlung informationsstruktureller Gliederung abzielte, nimmt es nicht wunder, dass derartige Fälle in den frei produzierten Teilen des Korpus nicht vorkommen. Es kann also für meine Zwecke von der innereuropäischen dialektalen Variation im Bereich der Intonation abstrahiert werden, und ich verzichte an dieser Stelle auf eine weitere Auseinandersetzung mit den entsprechenden diatopischen Besonderheiten. 92 In Bezug auf die durch die amerikanischen Versuchspersonen vertretenen Varietäten ist die Sachlage jedoch etwas anders. Die aufgenommenen Sprecherinnen stammen aus Mexiko (Irapuato; Zentralmexiko), El Salvador, Kolumbien (Bogotá) bzw. Argentinien (Buenos Aires) und weisen bezüglich der intonatorischen Gestaltung zum Teil bestimmte Eigenschaften auf, die in der Literatur als für die jeweiligen Dialekte typisch angeführt werden. Dies betrifft insbesondere die aus Buenos Aires stammende Sprecherin. Insofern wird im Folgenden kurz auf einige intonatorische Charakteristika der betreffenden amerikanischen Varietäten einzugehen sein. Abgesehen von der dialektalen Zugehörigkeit der Versuchspersonen ist jedoch generell zu fragen, welche Aspekte der Intonation überhaupt einen Anteil an der Vermittlung der informationsstrukturellen Gliederung von Deklarativsätzen haben und somit für meine Fragestellung relevant sind. Im letzten Abschnitt habe ich gezeigt, dass dies insbesondere die Abgrenzung der (kontrastiven) Fokusdomäne durch den tiefen Phrasenton L- bzw. die Markierung des rechten Randes des präsupponierten Materials durch den hohen Phrasenton H- sowie den kontrastiven Akzentton /LH*/ betrifft. IP-Grenztöne hingegen haben keinen Anteil an der Vermittlung der satzinternen informations-
Außer Castro (2003), die sich mit dem galizischen Spanisch auseinandergesetzt hat, befassen sich nur wenige Einzelstudien dezidiert mit den intonatorischen Besonderheiten europäischer Varietäten, so Quilis (1989) mit dem in Las Palmas de Gran Canaria gesprochenen Spanisch und Monroy Casas (2002) - unter einem konversationsanalytischen Blickwinkel - mit dem español murciano. Hinzuweisen ist hier jedoch auf das Überblickswerk von Sosa (1999), der trotz deutlicher Akzentsetzung bei den amerikanischen Varietäten auch peninsuläre Dialekte mit einbezieht (wobei die Datenbasis allerdings auf nur eine Versuchsperson pro Varietät beschränkt ist). Die gängigen Handbücher zur spanischen Dialektologie hingegen wie etwa das Manual de dialectología hispánica (Alvar 1996) beschränken sich bei der Darstellung der lautlichen Besonderheiten einzelner Varietäten fast ausschließlich auf Aspekte der segmentalen Phonologie; lediglich der von Antonio Quilis verfasste Beitrag zum Spanischen in Äquatorialguinea bezieht suprasegmentale Aspekte mit ein und weist auf den Einfluss der Bantusprachen hin: „Las lenguas bantúes son tonales, y esta estructura suprasegmental de la lengua materna aflora, lógicamente, cuando el guinoecuatoriano habla español, porque infiere en su entonación un comportamiento melódico especial: en términos generales, la configuración del fundamental se mantiene en los mismos niveles frecuenciales durante el enunciado" (Quilis 1996: 385).
204
Christoph
Gabriel
strukturellen Gliederung, sondern sind vorwiegend für die Markierung des Satzmodus relevant. Insofern kann ich mich bei der Darstellung der intonatorischen Besonderheiten der genannten amerikanischen Varietäten auf das Repertoire von Phrasen- und Akzenttönen beschränken und lasse die Beschaffenheit satzfinaler Konturen, wie sie durch die jeweils zugrunde liegenden finalen Grenztöne determiniert wird, im Folgenden unberücksichtigt. Es sei jedoch darauf hingewiesen, dass hier durchaus starke dialektale Variation zu verzeichnen ist, etwa dergestalt dass im venezolanischen und im karibischen Spanisch (Puerto Rico, Kuba) absolute Fragen anders als im Standard nicht durch H% markiert werden. Stattdessen tritt anstelle des normalerweise erfolgenden downstep eine deutliche Höherstufung des letzten Akzenttons ein (¡H*), der dann unmittelbar von einem tiefen Grenzton L% gefolgt wird (vgl. Sosa 1999: 203-209). Weiterhin sind bestimmte Varietäten wie beispielsweise das mexikanische Spanisch dadurch gekennzeichnet, dass - wiederum im Gegensatz zum Standardspanischen - auch Pronominalfragen durch einen hohen finalen Grenzton H% markiert werden. Hierbei spielen aber offensichtlich auch paralinguistische Faktoren wie etwa der Ausdruck von Höflichkeit durch eine steigende finale Tonkontur, eine große Rolle - ein Effekt, der wiederum auch im europäischen Spanisch zu beobachten ist. Ob jedoch zusätzlich zu dieser expressiven Funktion ein „rendimiento funcional dentro del sistema mexicano de los tonemas ascendentes en contraste con los descendentes" (Sosa 1999: 220) vorliegt, müsste noch auf größerer Datenbasis überprüft werden (die Ausführungen von Sosa stützen sich jeweils nur auf eine einzige Versuchsperson pro Dialekt sowie auf die bereits vorliegende Literatur). Da für meine Studie die intonatorische Gestaltung interrogativer Strukturen jedoch nicht weiter von Belang ist, soll an dieser Stelle der Hinweis auf ein von Guitart (2004) angeführtes Beispiel genügen. Guitart zeigt, dass aufgrund von interdialektalen Unterschieden bei der phonetischen Realisierung zugrunde liegender Akzenttöne ein (intendierter) Deklarativsatz durchaus als Fragesatz interpretiert werden kann. Dies ist beispielsweise möglich, wenn ein chilenischer Sprecher bei einer komplexen Struktur mit zwei koordinierten Aussagesätzen am Schluss des ersten Konjunkts den für das intonatorische Anzeigen von Progredienz typischen hohen Phrasenton H- realisiert und danach eine zögernde Sprechpause einschaltet (was nicht mit einer IP-Grenze gleichzusetzen ist): (3-118)
sp.
((Ayerfui al gimnasio
)ip ... (y me encontré con Lourdes
)¡p )iP
I
I I
H-
L-L% (Guitart 2004: 246) 'Gestern bin ich ins Fitnessstudio gegangen . . . und habe Lourdes getroffen.'
3. Theoretischer Hintergrund, Forschungsüberblick
und
Modellbildung
205
Wie Guitart ausführt, fasst ein kubanischer Sprecher das erste Konjunkt dann tendenziell als absolute Interrogation auf, da die Realisierung des intermediären Grenztons bei der Progredienzintonation im chilenischen Spanisch mittels eines Halbanstiegs (sp. semiascenso) in Bezug auf die relative Tonhöhe dem Vollanstieg der Frageintonation des kubanischen Spanisch entspricht. Ähnlich gelagert ist der Fall, von dem Fontaneila de Weinberg (1980) in ihrer vergleichenden Studie zu drei argentinischen Dialekten (Buenos Aires, Tucumán, Córdoba) berichtet: Da das intonatorische System von Tucumán keinerlei fallende Schlusskonturen aufweist, können Hörer aus Buenos Aires Deklarativsätze, die von Sprechern aus Tucumán realisiert werden, als Fragesätze interpretieren (vgl. Fontaneila de Weinberg 1980: 125). Derartige Missverständnisse, die - wenn vielleicht mit geringerer Wahrscheinlichkeit - in ähnlicher Weise auch zwischen Sprechern ein und derselben Varietät auftreten können, ändern jedoch nichts daran, dass in der Literatur von einer weitgehenden prinzipiellen Gleichartigkeit der intonatorischen Systeme unterschiedlicher Dialekte ausgegangen wird. So hält Guitart zusammenfassend fest: „En el mundo hispánico no hay malentendidos sistemáticos entre hablantes de lectos distintos que se deban a diferencias en la entonación" (2004: 246; Hervorhebung von mir). Kommen wir nun auf die interne intonatorische Gestaltung von Deklarativsätzen zu sprechen. Hierbei sind die interdialektalen Unterschiede deutlich geringer als bei den Interrogativkonstruktionen. So bemerkt Sosa, der die entsprechenden F0-Konturen ausgewählter amerikanischer und europäischer Varietäten (Buenos Aires, Bogotá, Ciudad de México, San Juan de Puerto Rico, Caracas, La Habana bzw. Sevilla, Barcelona, Pamplona, Madrid) untersucht hat: „Pudimos notar que, lingüística y funcionalmente, no existen variaciones significativas para las declarativas entre España y América" (Sosa 1999: 195). Im weiteren Verlauf seiner Ausführungen betont er den panhispanischen Gebrauch steigender Töne in pränuklearer Position, wobei von den untersuchten Dialekten nur das in Buenos Aires gesprochene porteño-Spanisch eine Ausnahme zu bilden scheint: „A nivel del pretonema la tendencia no marcada es el uso de acentos tonales L*+H (con la excepción del dialecto porteño)" {ibid.). Ein dialektübergreifendes Merkmal ist nach Sosa auch der Gegensatz zwischen einem kontrastiven und einem nicht-kontrastiven Ton, der sich in IP-finaler Position dadurch auszeichnet, dass bei einem höheren Grad von „énfasis o focalización" grundsätzlich ein Hochton vor dem finalen Fall realisiert wird: 93 „Tanto las variantes hispanoamericanas como peninsulares utilizan los dos tipos de tonemas, el L*L% y el H*L%, que contrastan exactamen-
Im Gegensatz hierzu kann, wie bereits gezeigt, ein nicht-kontrastiver finaler Nuklearakzent in reduzierter Weise als Tiefton L* realisiert werden.
206
Christoph
Gabriel
te de la misma manera desde el punto de vista comunicativo y pragmático: el H*L% marca un grado mayor de énfasis o focalización en la última palabra acentuada" (ibid.). Die Unterschiede zwischen den einzelnen Dialekten betreffen demnach nicht das intonatorische System als solches, sondern lediglich die Art und Weise der Implementierung zugrunde liegender Töne in die lautliche Oberfläche. Auf den Sonderfall des porteño-Spanischen wird noch genauer einzugehen sein. Im Folgenden befasse ich mich mit den für die Vermittlung von FHG relevanten intonatorischen Besonderheiten der im Korpus vertretenen amerikanischen Varietäten.94 Wie Sosa (1999: 188f.) zeigt, unterscheiden sich weder das Spanische von Bogotá (Kolumbien) noch die in Ciudad de México gesprochene Varietät in Bezug auf die verwendeten Akzenttöne vom Standardspanischen: Es liegen grundsätzlich bitonale steigende Akzenttöne vor, die positionell bedingt in Bezug auf ihre Alignierung differieren (im unmarkierten Fall erfolgt Realisierung als L*H im pränuklearen Bereich bzw. early rise in der IP-finalen Position). Als eine hervorstechende Besonderheit mexikanischer Intonation lässt sich die von Kvavik (1974: 359) als 'Zirkumflexkontur' beschriebene Schlusskontur mit einem nicht herabgestuften finalen Nuklearakzent L¡H* L% anführen, die in Deklarativsätzen auch bei nicht-kontrastiver Fokussierung frequent ist (Sosa 1999: 189f., vgl. auch Willis 2006). Man betrachte das folgende Beispiel, das eine weite Fokuslesart aufweist: (3-119)
(Kontext: 'Was macht Maria am Kiosk?') mx. ((María )ip (compra unpeRIÓdico /
I
I
I
I
(LH)* H(LH)* L*H HL*H Sprecherin BAU1_6 Ma-
dr
L*H
o
a
com-
(LH)* L¡H* pra un
pe-
)¡p
I
LL-
rió- di
)iP
(BAU 1 6 )
I
L%/ L% co
L¡H*
wm
L*H
19*2
Für einen Überblick über die Intonation amerikanischer Varietäten vgl. den Forschungsbericht von Revert Sanz (2001) sowie Diaz-Campos / Tevis McGory (2002); eine knappe Zusammenstellung der segmentalen Aspekte der Phonologie amerikanischer Dialekte bietet Vaquero de Ramirez (1996).
3. Theoretischer Hintergrund, Forschungsüberblick
und
Modellbildung
207
Die Tatsache, dass hier der finale Akzentton L¡H* durch einen verglichen mit dem Standardspanischen und anderen Varietäten hohen F0-Gipfel realisiert wird, macht zwar eine deutlich wiedererkennbare Eigenart des mexikanischen Spanisch aus, doch ist hiermit noch kein grundsätzlicher Unterschied zum Standard gegeben, da in beiden Fällen eine durch die IP-finale Position bedingte Alignierung des hohen Teiltons mit der metrisch starken Silbe vorliegt. Da auch kein Kontrast im Sinne einer Opposition zwischen L¡H* (kontrastiv) oder LH* (neutral) zu verzeichnen ist, scheint es nicht angemessen, diesen Aspekt in die phonologische Repräsentation zu übernehmen. Dies gilt umso mehr, als sich für Sprecher des mexikanischen Spanisch feststellen lässt, dass diese bei der phonetischen Realisierung von Hochtönen tendenziell F0-Werte nutzen, die relativ zur Grundfrequenz des jeweiligen Sprechers deutlich höher liegen als die entsprechenden Werte des Standardspanischen (vgl. Sosa 1999: 196). Hieraus ergibt sich der für das mexikanische Spanisch typische Höreindruck starker Tonhöhenkontraste. Die Intonation des in El Salvador gesprochenen Spanisch ist meines Wissens noch nicht untersucht worden; überhaupt liegen dem Forschungsbericht von Revert Sanz (2001) zufolge kaum Arbeiten zur Intonation mittelamerikanischer Varietäten vor.95 Lediglich zum Spanischen in Honduras, Nicaragua und Panama gibt es einige wenige dialektologische Studien, die Aspekte der Intonation zum Teil mitbehandeln, diesbezüglich aber wenig Spezifisches bieten. So beschränkt sich beispielsweise H. Lacayo in seiner Studie Cómo pronuncian el español en Nicaragua von 1962 darauf, die Nähe zum Standard hervorzuheben: ,,[E]n su nivel culto el español nicaragüense sigue los patrones del 'castellano normal'" (zitiert nach Revert Sanz 2001: 52). Dies scheint insofern auch für das benachbarte El Salvador zu gelten, als die entsprechenden Daten meines Korpus in Bezug auf Distribution und Beschaffenheit der Akzenttöne, ebenso wie die mexikanischen und die kolumbianischen Daten, keinen nennenswerten Unterschied zum Standard aufweisen. In Bezug auf die intonatorische Markierung des kontrastiven Fokus in situ kann ich nur auf meine Daten zurückgreifen. Hier gilt, dass sowohl die mexikanische als auch die aus Bogotá sowie die aus El Salvador stammende Versuchsperson im entsprechenden Kontext den auch im Standardspanischen verwendeten kontrastiven Akzentton LH* realisieren (vgl. Abschnitt 4.3.2). Schließlich unterscheiden sich die drei Varietäten auch in Bezug auf die Verwendung der Die Intonation des Spanischen der Antillen (insbesondere die der Varietäten Kubas, Puerto Ricos und der Dominikanischen Republik) ist indes besser erforscht, vgl. Revert Sanz (2001: 53-61). Hier ist neben der mehrbändigen materialreichen Studie zum kubanischen Spanisch von Garcia Riverön (1996a, 1996b, 1998), die Revert Sanz ausführlich referiert, vor allem Willis (2003, 2004) als neuere Arbeiten zum dominikanischen Spanisch zu nennen.
208
Christoph Gabriel
intermediären Phrasierung zur Markierung der Fokusdomäne nicht vom Standard: So zeigt die FO-Kontur in (3-119), dass auch im mexikanischen Spanisch das präsupponierte Material (hier das Subjekt) durch H- von der unmittelbar folgenden Fokusdomäne abgetrennt wird. Betrachten wir nun mit dem argentinischen Spanisch diejenige der im Korpus vertretenen Varietäten etwas ausführlicher, die für gewöhnlich als die vom kastilischen Standard am weitesten entfernte charakterisiert wird. Dies gründet sich vor allem darauf, dass zusätzlich zu lexikalischen Eigenarten, wie sie jede Varietät kennt, auch starke Auffälligkeiten im Gebrauch der Personalpronomina und in der Verbalmorphologie - bekannt als voseo96 - sowie deutliche Unterschiede im Bereich der segmentalen und suprasegmentalen Phonologie auftreten. In Bezug auf die segmentalen Aspekte sind zunächst der Zusammenfall der standardspanischen Phoneme /s/ und /6/ zu /s/ (sog. seseo) und die Realisierung von /s/ in präkonsonantischer Position als [h] zu nennen (z.B. kiosco [kjoh.ko]), beides Charakteristika, die auch andere lateinamerikanische Varietäten sowie das andalusische und das auf den Kanarischen Inseln gesprochene Spanisch auszeichnen. Den Charakter der lautlichen Andersartigkeit des porieno-Spanischen macht auf segmentaler Ebene jedoch vor allem der Zusammenfall der standardspanischen Phoneme /j/ und /A7 und die generelle Realisierung als postalveolarer Frikativ aus (sog. zeismo), wobei die stimmhafte Variante [3] zunehmend von der sich immer stärker durchsetzenden stimmlosen [J]-Aussprache verdrängt wird (vgl. Vaquero de Ramirez 1996: 40); vgl. die folgenden Beispiele: (3-120)a.
ar.
[plaja]/[pla3a]
vs.
sp.
b.
ar.
[bajena]/[ba3ena]
vs.
sp.
IplajaJ
playa 'Strand' [ba/(ena]/[bajena] ballena 'Walfisch'
Was die suprasegmentalen Charakteristika des porteno-Spanischen anbelangt, so werden in der Literatur vor allem zwei Besonderheiten angeführt, wobei die erste die Realisierung pränuklearer Akzenttöne, die zweite den (finalen) Nuklearakzent betrifft: Während sich der nicht-kontrastive Akzentton des Unter voseo versteht man den Gebrauch des starken Pronomens vos für die 2. Person Sg. in Verbindung mit einer vom Standardspanischen abweichenden Verbalmorphologie. Bestandteil der argentinischen Norm sind Imperativformen wie viví 'lebe!' (Standard: vive) und die Präsensformen wie (vos) querés 'du willst', (vos) cantás 'du singst', (vos) vivís 'du lebst' (Standard: (tú) quieres/ cantas/vives), die sich jeweils aus den Formen der 2. Person PI. herleiten: Beim Imperativ fehlt das auslautende -d, d.h. aus vivid [bi.'ßia] wird viví [bi.'ßi]; im Präsens wird der Diphthong der Ultima zum Einzelvokal vereinfacht: (vosotros) queréis 'ihr wollt' > (vos) querés etc., wobei die Endbetonung beibehalten wird. Für Generelles zum voseo vgl. Aragó (1996: 406-408).
3. Theoretischer Hintergrund, Forschungsüberblick
209
und Modellbildung
Standardspanischen als steigender Ton charakterisieren lässt, der im unmarkierten Fall seinen Gipfel auf der posttonalen Silbe erreicht (Realisierung als late rise L*H) und in bestimmten Fällen (nämlich bei Assoziierung mit einer am rechten Rand des phonologischen Wortes a> bzw. der IP befindlichen Silbe) als early rise (LH*) realisiert wird, ist die in Buenos Aires gesprochene Varietät dadurch gekennzeichnet, dass bei pränuklearen Akzenttönen der Tonhöhengipfel im Zeitfenster der jeweiligen metrisch starken Silbe erreicht wird. Demnach wird der neutrale Akzentton des porfeño-Spanischen für gewöhnlich als ein einfacher Hochton H* analysiert (vgl. Sosa 1999: 187f., Toledo 2000, Colantoni/Gurlekian 2004: 112; für eine Gegenposition vgl. Baijam 2004: 30f.), womit der pränukleare Akzentton dieser Varietät auf der Oberfläche dem kontrastiven Akzentton standardnaher Varietäten gleicht - auch bei /LH*/ erfolgt die Alignierung des Tonhöhengipfels im zeitlichen Rahmen der metrisch starken Silbe. Betrachten wir zur Illustration dieser besonderen alignment-Eigenschaft pränuklearer Akzenttöne einen Ausschnitt aus der freien Nacherzählung (Teil 4 des Experiments) durch die aus Buenos Aires stammende Sprecherin. Im Gegensatz zum Standardspanischen erfolgt hier nicht nur Assoziierung, sondern auch durchgehende Alignierung von H* mit der metrisch starken Silbe. Da an dieser Stelle keine Entscheidung bezüglich des phonologischen Status der Akzenttöne getroffen werden soll, verzeichne ich nur die auf der Oberfläche erscheinenden Töne. (3-121) a. ar.
b.
Mientras el viento del norte soplaba y sólo conseguía arrugar la capa del viajero, el sol le dio tanto calor que la quitó... que se la quitó 'Während der Nordwind blies und es lediglich schaffte, den Umhang des Reisenden zu zerknittern, gab ihm die Sonne so viel Hitze, dass er ihn auszog, ... dass er sich ihn auszog.' (y sólo conseguía arrugar la capa del viajero )¡p (MK62) H* H* Sprecherin MK6 2 Sir
H*
to con• se- BUÍ- ja rru- ggr
H*
la
H* H-
ÍB-
P)
Es fragt sich nun, welches zugrunde liegende Toninventar man für das poríeño-Spanische annehmen sollte. Festzuhalten
ist, dass im
porteño-Spa-
nischen andere Neutralisierungen vorliegen als in standardnahen Varietäten: Während bei letzteren in IP-finaler Position kein Kontrast zwischen neutralem und kontrastivem Fokus gegeben ist, erlaubt ersteres in dieser Position eine Differenzierung der beiden Fokustypen (long fall bzw. H * L % ) . Umgekehrt besteht in der argentinischen Prestigevarietät in allen anderen Positionen kein eindeutiger alignment-K¡m\r&sl
zwischen pränuklearen neutralen und kontras-
tiven Akzenttönen, während hierbei das Standardspanische mit der Opposition late und early rise ( L * H vs. L H * ) deutlich differenziert. In der folgenden Tabelle sind die angesprochenen Neutralisierungen durch graue Hinterlegung hervorgehoben; der erhöhte F0-Wert beim kontrastiven Akzentton im
por-
íeño-Spanischen ist durch den nach oben weisenden Pfeil (TFO) angezeigt. (3-125)
Realisierung der Akzenttöne im Standard- und im porteño-Spanischen
Standard
pränuklear
nuklear
neutral
L*H LH*
L H * IP-final
kontrastiv
LH*
LH*
neutral
H*
HL*
kontrastiv
H* (ÎF0)
H*
auch: L *
porteño
Das porfeno-Spanische den nur geringfügigen aZ/gnmeni-Kontrast zwischen neutralem und kontrastivem Fokus in nicht-finaler Position durch unterschiedliche F0-Werte des Tonhöhengipfels, im absoluten Anlaut verbunden mit hohem Stimmeinsatz ( % H ) , kompensiert, kann es eine eindeutige Markierung von kontrastivem Fokus leisten. Dies spricht für einen phonologischen Kontrast, der an den identifizierten Korrelaten des kontrastiven Fokus - höherer FO-Wert und/oder frühere Alignierung von H * im Zeitrahmen der betref-
Christoph Gabriel
214
fenden Silbe - festgemacht werden müsste. Baijam (2004: 31) hält den Tonhöhenunterschied für wesentlich und nimmt deshalb einen zugrunde liegenden 'heraufgestuften' Akzentton /L+AH*/ an.98 Eine Entscheidung darüber, welches der beiden phonetischen Korrelate das ausschlaggebende ist, soll an dieser Stelle bewusst nicht gefällt werden: Die Untersuchungen von Toledo (1989) und Baijam (2004) stützen sich jeweils auf Aufnahmen von nur drei bzw. vier Sprechern; in Gabriel (2006) habe ich Evidenz für die Relevanz sowohl der erhöhten F0-Werte als auch des silbeninternen frühen alignment gefunden, jedoch auch nur auf geringer Datenbasis. Colantoni/Gurlekian (2004) schließlich gehen nicht auf die Realisierung des kontrastiven Fokus ein. Ich möchte daher an dieser Stelle lediglich festhalten, dass für die hier besprochene Varietät in Bezug auf die zugrunde liegenden Akzenttöne vermutlich ein von standardnahen Varietäten abweichendes Repertoire anzunehmen ist. Einen diesbezüglichen Vorschlag habe ich in Tabelle (3-125) sowie in Gabriel (2006) skizziert. Kommen wir nun auf die Markierung der Fokusdomäne und damit auf die Unterscheidung von engem bzw. weitem neutralen Fokus zu sprechen. Betrachten wir hierzu nochmals den Beispielsatz (3-122.a), hier wiederholt als (3-126.a), sowie ein Beispiel aus dem Lesekorpus. (3-126) a.
ar.
(Kontext: 'Wem übergibt Schneewittchen Tarzan?') (( Blancanieves entregaa Tarzan )v(a los enaNltos\
I
I
H*
H*
II
)IP(MK4_2)
I I I
H* H-
HL*
L-
L%
'Schneewittchen übergibt Tarzan den Zwergen.'
b.
(Kontext: 'Was hat Maria gemacht?') ((Maria \r(comprö el diario en el KIOSco
I I
I I
H* H-
H*
I H*
HL*
) ip
) ]P
I
I
L-
(MK_5_2)
L%
'Maria hat die Zeitung am Kiosk gekauft.'
Während im a-Beispiel die am rechten Rand der IP situierte Präpositionalphrase im engen (Informations-)Fokus steht, liegt bei (3-126.b) eine weite Fokuslesart vor. In beiden Fällen wird die Grenze zwischen präsupponiertem und fokussiertem Material durch den maximalen FO-Wert der gesamten Tonkontur gekennzeichnet. Es gibt also Evidenz, dass auch das portefioSpanische intermediäre Phrasierung zur Markierung der Fokusdomäne nutzt. Da Barjam setzt in Analogie zum Standard für das porie/io-Spanische bitonale Akzenttöne an; das Diakritikon ' A ' bezeichnet den upstep des so markierten Teiltons. Die Annahme 'heraufgestufter' Töne in Initialposition erscheint jedoch wenig sinnvoll, da man zusätzlich von einem hohen initialen Grenzton %H ausgehen müsste. Dieser wiederum ist jedoch in Barjams Repertoire nicht enthalten.
3. Theoretischer Hintergrund, Forschungsüberblick
und
Modellbildung
215
die bereits vorliegenden Studien zum argentinischen Spanisch sich meines Wissens nicht mit der Abgrenzung der Fokusdomäne befassen, ist auch hier die Evidenz aus den Daten selbstverständlich zu gering, als dass aufbauend hierauf eine endgültige Entscheidung getroffen werden könnte. Weitere Forschung auf breiterer Datenbasis erscheint also unabdingbar. Anders als die drei weiteren amerikanischen Varietäten, die in meinem Korpus vertreten sind (Mexiko, El Salvador, Kolumbien), hebt sich das poríeño-Spanische in Bezug auf die Oberflächenrealisierung der Akzenttöne deutlich vom Standard ab, und zwar in derart starkem Maße, dass die Annahme abweichender zugrunde liegender Akzenttöne durchaus sinnvoll erscheint. Es wurde bereits darauf hingewiesen, dass die Möglichkeit der tonalen Differenzierung von kontrastivem und neutralem Fokus in IP-finaler Position ein Zug ist, den das porteño-Spanische mit dem Italienischen gemeinsam hat. Eine weitere offensichtliche Gemeinsamkeit mit dem Italienischen liegt in der grundsätzlichen Alignierung des Hochtons pränuklearer steigender Akzenttöne mit der metrisch starken Silbe, was eine Analyse als monotonale Akzenttöne nahelegt (H*). Wie sich im folgenden Abschnitt zeigen wird, ist auch dies ein typisches Merkmal der Intonation der meisten italienischen Dialekte. In der Tat kann für das in Buenos Aires gesprochene Spanisch italienischer Einfluss geltend gemacht werden, teils durch die direkte Kontaktsituation in Stadtteilen wie La Boca oder San Telmo, wo sich im 19. Jahrhundert zahlreiche italienische Einwanderer niederließen, teils durch die indirekte Vermittlung über das seinerseits italienisch beeinflusste lunfardo, einen mit dem französischen argot vergleichbaren, in der zweiten Hälfte des 19. Jahrhunderts im kriminellen Milieu entstandenen Slang, der über die Tangopoesie des frühen 20. Jahrhunderts popularisiert und sozial aufgewertet wurde." So nimmt es nicht wunder, dass die Intonation des in Buenos Aires gesprochenen Spanisch für gewöhnlich als stark 'italianisiert' charakterisiert wird: „Buenos Aires habla con entonación italiana" (B. Vidal de Battini, El español de la Argentina, 1964, zit. n. Colantoni/Gurlekian 2004: 107). Halten wir abschließend fest, dass sich in den für meine Zwecke relevanten Aspekten der Intonation - intermediäre Phrasierung, Markierung des kontrastiven Fokus durch bestimmte Akzenttöne, fakultative postfokale Deakzentuierung - nur das in Buenos Aires gesprochene Spanisch signifikant vom Standardspanischen abhebt. Doch auch hier liegt kein grundsätzlicher Unterschied vor, da auch diese Varietät über intonatorische Mittel verfügt, kontrastiven Fokus in unterschiedlichen Positionen eindeutig zu markieren: Zum ei-
99
Zu den unterschiedlichen Thesen zur Beeinflussung des porfeño-Spanischen durch das Italienische vgl. Colantoni/Gurlekian (2004: 114ff.). Generell zum lunfardo vgl. den einleitenden Artikel im Diccionario etimológico del lunfardo (Conde 2004: 11-22).
216
Christoph Gabriel
nen liegt ein im Vergleich zu neutralen Akzenttönen höherer FO-Wert vor, zum anderen ist frühe Alignierung des Hochtons mit der entsprechenden Silbe zu verzeichnen. Aufgrund der geringen Datenbasis in den vorliegenden Studien und im eigenen Korpus kann jedoch nicht entschieden werden, welches der beiden Oberflächenkorrelate ausschlaggebend ist und somit als der zugrunde liegenden Form zugehörig aufgefasst werden sollte. 3.2.4 Italienische und französische Intonation im AM-Modell Das Italienische ist als Sprache mit lexikalisch distinktivem Wortakzent (vgl. calamita 'Magnet' - calamita 'Unglück') in Bezug auf eine AM-basierte Modellierung des intonatorischen Systems grundsätzlich parallel zum Spanischen zu behandeln: Die Diskussion kann sich auf die Frage konzentrieren, wie die einzelnen Töne beschaffen sind, die mit metrisch starken Silben assoziieren, welche a//gnmeni-Eigenschaften vorliegen, welche Kontraste phonologisch relevant sind und welche Einheiten damit sinnvollerweise als zugrunde liegend angenommen werden sollten. Hinzu kommen Fragen der intermediären Phrasierung und der Gestaltung IP-finaler Konturen (Inventar und Funktion der Phrasen- und Grenztöne). Beim Französischen hingegen, das, wie weitgehend unbestritten ist, einen finalen und sich vermutlich immer stärker generalisierenden initialen Wortgruppen- oder Phrasenakzent aufweist (vgl. Di Cristo 1998: 198) und somit zumindest auf Wortebene über keine eindeutigen 'Ankerpunkte' für tonale Elemente verfügt, stellt sich, bevor eine Beschäftigung mit der Implementierung in die phonetische Oberflächenkontur erfolgen kann, zunächst einmal grundsätzlich die Frage, welche Silben überhaupt für die tonale Assoziierung in Frage kommen. Bevor ich im zweiten Teil dieses Abschnitts hierauf näher eingehe, skizziere ich zunächst vorliegende Anwendungen des AM-Modells auf das Italienische.100 Aufgrund der Tatsache, dass die heutige Italoromania von starken dialektalen Unterschieden geprägt ist (für einen Überblick vgl. Lepschy/Lepschy 1986), sind alle generalisierenden Aussagen zum intonatorischen System 'des Italienischen' mit gewisser Vorsicht zu genießen (vgl. hierzu D'Imperio 2002: 39f.). Allerdings gilt auch hier, ebenso wie bei den im letzten Abschnitt behandelten spanischen Varietäten, dass zu unterscheiden ist zwischen dialektalen Besonderheiten, die sich auf die Implementierung von Tönen in die Oberfläche beziehen (vgl. etwa die für das mexikanische Spanisch typische finale 'Zirkumflexkontur' LjH* L%), und grundsätzlichen Unterschieden, die phoioo p ü r e j n e zusammenfassende Darstellung der italienischen Intonationsforschung vgl. u.a. Bertinetto / Magno Caldognetto (1998), Rossi (1998), Schmid (1999: 112-118, 175-179) sowie Rabanus (2001: 85-97).
3. Theoretischer
Hintergrund,
Forschungsüberblick
und
217
Modellbildung
nologische Kontraste und damit das zugrunde liegende System betreffen. Da es sich bei der zur Kontrastierung mit dem Spanischen aufgenommenen italienischen Sprechergruppe durchgehend um Versuchspersonen handelt, die trotz unterschiedlicher geografischer Herkunft (Rom, Bologna, Neapel) als Sprecher standardnaher Varietäten einzustufen sind und damit in diatopischer Hinsicht als vergleichsweise unmarkiert gelten können,101 beschränke ich mich an dieser Stelle auf die Dastellung der in der Literatur als für die meisten italienischen Dialekte charakteristisch angeführten intonatorischen Eigenschaften. Hierbei handelt es sich zum einen um die pränuklearen monotonalen Akzenttöne (H*) und zum anderen um die fallende Schlusskontur HL* L% (vgl. Grice 1995). Betrachten wir die Intonationskontur eines Deklarativsatzes mit weiter Fokuslesart: (3-127)
(Kontext: 'Was passiert?') it.
((Biancaneve
rapisce TARzan
H*
H*
HL*
) ip
)n>
L-
L%
(MZ4_1)
'Schneewittchen entführt Tarzan.' Sprecherin MZ4_1 Bkm-
ca-
ve
ra
Bl-
sce
1Je-
zart
H*
/
w
2J47M
\
\
H*
\
r-dl
hl»
4.1M4J
Die Ähnlichkeit der hier angezeigten tonalen Kontur mit der von entsprechenden Strukturen des porteno-Spanisehen ist offensichtlich: Bei pränuklearen Akzenttönen assoziiert jeweils der Tonhöhengipfel mit der metrisch starken Silbe (Biancaneve. rapisce), was eine Analyse als zugrunde liegenden Hochton H* nahelegt, und der Nuklearakzent wird als fallender Ton HL* realisiert. Der von D'Imperio (2002: 58) für das neapolitanische Italienisch reklamierte finale Tonkontrast zwischen engem und weitem Fokus kann in meinen Daten jedoch nicht bestätigt werden: Unabhängig von der Ausdehnung der (neutralen) Fokusdomäne realisieren die Versuchspersonen durchweg in IP-finaler Position einen fallenden Ton (HL*; vgl. 3-128.a, b). Kontrastiver Fokus kann in dieser Position jedoch durch den steigenden Ton LH* markiert werden (3-128.c), den D'Imperio im neapolitanischen Italienisch auch bei engem neutralem Fokus in IP-finaler Position feststellt. ,01
Gleiches gilt auch für die französische Kontrastgruppe.
218
Christoph
(3-128) a.
it.
(Kontext:'Was passiert?') ((Maria compra il giornale al CHIOSco ).r )ip
I I
b.
c.
I
I
I
Gabriel
(APll)
I
H* H* H* HL* L- L% (Kontext: 'Wo hat Maria die Zeitung gekauft?') ((Maria ha comprato il giornale al CHIOSco )ip )iP
I
I
I
I
I
I
I
I
I
I
I
I
H*
H*
H*
(AP5_3)
H* H* H* HL* L- L% (Kontext: 'Maria hat die Zeitung im Supermarkt gekauft, nicht wahr?') ((Maria ha comprato il giornale al CHIOSco )ip )]P (AP5 6)
LH*
L- L%
Betrachten wir jeweils die FO-Konturen der drei Schlusskonturen: (3-129)
Schlusskonturen der Beispiele (3-128)
300i-
Hme(«) Die Darstellung in (3-129) zeigt deutlich den Gegensatz zwischen neutralem Nuklearakzent (HL*) und kontrastivem Akzentton (LH*) in IP-finaler Position. Wie steht es um die Signalisierung von kontrastivem und engem Informationsfokus in anderen Positionen? Aufgrund der Oberflächenbeschaffenheit der pränuklearen Töne (Alignierung des Hochtons mit der metrisch starken Silbe) ist zu erwarten, dass enger und kontrastiver Fokus in situ von den italienischen Sprechern in gleicher Weise signalisiert werden, wie es im porieno-Spanischen der Fall ist. In der Tat sind auch hier die Oberflächenkorrelate der hohe FO-Wert des Hochtons und der frühe Tonhöhenanstieg. Betrachten wir zur Illustration jeweils die tonale Realisierung des präverbalen Subjekts Maria, zuerst bei satzfokaler Lesart mit pränuklearem Hochton (3-130.a), dann bei enger (neutraler) und kontrastiver Fokussierung (3-130.b, c). In (3-130.d) werden schließlich die tonalen Konturen miteinander verglichen: Links das a-Beispiel mit pränuklearem Hochton H* und spätem alignment (angedeutet durch den langen Pfeil); rechts die Kontur bei engem
3. Theoretischer Hintergrund, Forschungsüberblick
und
219
Modellbildung
Fokus (b-Beispiel, gestrichelte Linie) mit spätem alignment (langer Pfeil) und hohem FO-Wert sowie bei kontrastiver Fokussierung (c-Beispiel, durchgezogene Linie: frühes alignment, kein erhöhter FO-Wert). (3-130) it.
(Kontext: 'Was passiert?') ((Maria compra il giornale al CHIOSco
I I
b.
I
I
)ip V
(APl
l)
I I
H* H* H* HL* L- L% (Kontext: 'Wer kauft die Zeitung am Kiosk?') ((MaRIa )|P (compra il giornale al chiosco )lp )IP
I l
(AP23)
I I
H* LL- L% (Kontext: 'Anna kauft die Zeitung am Kiosk, nicht wahr?') ((MaRIa )jp compra il giornale al chiosco )jP )ip (AP2 4)
I I
d.
I
H* LH*, pränuklear (a)
I
L- L% H*, enger Fokus (gestrichelte Linie, b) H* kontrastiver Fokus (durchgezogene Linie, c)
Ma-
187,2
ms,
Hz
Hz
Interessant ist hierbei, dass der Tonhöhengipfel bei neutraler enger Fokussierung einen deutlich höheren FO-Wert (187,2 Hz) aufweist als derjenige bei kontrastiver Fokussierung (139,5 Hz). Die tonale Gestaltung des kontrastiven Fokus unterscheidet sich vom pränuklearen Hochton allerdings durch früheres alignment (vgl. die Grafiken in 3-130.d, dargestellt durch Pfeile). Dies scheint auf den ersten Blick für die Annahme zu sprechen, dass sich kontrastive Fokussierung im Italienischen hauptsächlich an der frühen silbeninternen Alignierung festmachen lässt und ein erhöhter FO-Wert eventuell bei Emphase zusätzlich hinzutreten kann. Andererseits zeichnet sich bei einer anderen Versuchsperson ( M Z 2 4 ) das kontrastiv fokussierte Subjekt in Initialposition eher durch den erhöhten FO-Wert des Tonhöhengipfels als durch frühes alignment aus. Selbstverständlich muss auch hier gelten, dass aufgrund der
220
Christoph Gabriel
geringen Datenbasis diesbezüglich keine Entscheidung getroffen werden kann. Springender Punkt ist jedoch, dass den italienischen Sprechern Mittel zur Verfügung stehen, in nicht-finaler Position pränukleare und fokale Akzenttöne zu differenzieren. Hierbei wird offensichtlich kein Unterschied zwischen nicht-finalem kontrastiven und nicht-finalem neutralen Fokus gemacht: Erfolgt bei einem Satz mit einem im engen Informationsfokus stehenden Subjekt keine Umordnung der Konstituenten, dann werden für die prosodische Signalisierung des Fokus in situ dieselben Mittel genutzt, die auch für die Markierung des kontrastiven Fokus dienen (frühes alignment, hoher FO-Gipfel). Dass beim engen Fokus in nicht-finaler Position kein Unterschied zwischen neutraler und kontrastiver Fokussierung gemacht wird, zeigt sich auch daran, dass in beiden Fällen postfokale Deakzentuierung möglich ist, was sich jeweils in der Realisierung eines flachen Plateaus niederschlägt, vgl. oben Beispiele (3-130.b, c). Ebenso wie im Spanischen lässt sich die Möglichkeit postfokaler Deakzentuierung auch für das Italienische als Evidenz für die Annahme eines tiefen Phrasentons L- nach der Fokusdomäne werten (zur postfokalen Deakzentuierung im Italienischen vgl. auch D'Imperio 2002: 62f.). Ich komme nun zum Französischen.'02 Es wurde bereits gesagt, dass eine AM-basierte Modellierung aufgrund des gänzlich anders gearteten Akzentsystems dieser Sprache von Voraussetzungen ausgehen muss, die sich grundlegend von denen des Spanischen und des Italienischen unterscheiden. Zentrale Problematik ist hierbei, dass die Information bezüglich der Silben, die als 'Ankerpunkte' für tonale Elemente dienen können, nicht aus dem Lexikon übernommen werden kann. Zwar ist weitgehend unbestritten, dass das Französische einen Phrasenakzent aufweist, der jeweils die letzte volle (d.h. Nicht-Schwa-)Silbe einer solchen Entität trifft, doch werden Fragen der Abgrenzung und Definition dieser für die Akzentzuweisung grundlegenden Einheit - traditionell meist als mot phonique, groupe rythmique oder groupe accentuel bezeichnet - sowie der Distribution von potenziellen Nebenakzentpositionen und insbesondere des Status der häufigen Anfangsbetonung kontrovers diskutiert (vgl. u.a. Rossi 1999, Di Cristo 1999, 2000, Astesano 2001). Die Tatsache, dass der Gipfelpunkt einer Intonationskontur grundsätzlich auf der (positionsbedingt) akzentuierten Finalsilbe eines groupe rythmique realisiert wird, wenn sich dieser am Schluss einer Intonationseinheit be-
102
Ein Überblick zur französischen Intonationsforschung findet sich in Meisenburg/Selig (1998), wo AM-basierte Arbeiten jedoch nicht berücksichtigt werden. Als wichtige deskriptiv bzw. funktionalistisch ausgerichtete Arbeiten zum Französischen sind u.a. Passy (1890), Delattre (1966, 1969) und Wunderli (1990) zu nennen. Neuere Studien dieser Art sind etwa Léon (2002) und Martin (2004), der das Französische mit weiteren romanischen Sprachen vergleicht.
3. Theoretischer Hintergrund, Forschungsüberblick
und Modellbildung
221
findet, hat zu der Auffassung geführt, im Französischen liege ein Synkretismus von Akzentuierung und Intonation vor (so beispielsweise bei Togeby 1965, vgl. Di Cristo 1998 für eine Diskussion). Konsequenterweise fragt dann auch Rossi (1980), ob das Französische als eine akzentlose Sprache, als langue sans accent aufzufassen sei. Fönagy (1980) wiederum hat den französischen Akzent als einen accent probabilitaire charakterisiert, der sich gerade durch seine Vagheit auszeichne. Mit dieser wie auch immer zu fassenden Unbestimmtheit des französischen Akzents sind die verschiedenen Adaptionen des AM-Modells in unterschiedlicher Weise umgegangen. Post (2000, 2002) geht von postlexikalischer Akzentzuweisung aus und nimmt metrisch starke Silben auf Wortebene an, denen Akzenttöne zugewiesen werden. Dies betrifft sowohl den phrasenfinalen als auch den initialen Akzent (ähnlich auch Gussenhoven 2004: 266f.). Jun/Fougeron (1995, 2000, 2002) setzen dagegen mit /(L)H*/ zwar einen Akzentton an, der mit der Finalsilbe des letzten Inhaltswortes einer Akzentphrase AP (und damit mit einer auf der Wortebene betonten Silbe) assoziiert, 103 doch fassen sie den Initialakzent der AP als Phrasenton Hi auf ('i' steht hier für initial), der nicht an eine metrisch starke Silbe gebunden ist. Den unterschiedlichen Status von initialem und finalem Akzent motivieren Jun/Fougeron, indem sie zeigen, dass sich diese phonetisch grundlegend voneinander unterscheiden: So kann sich der nach einem initialen Hochton Hi auftretende (und zum folgenden Tiefton L hinführende) Fall, abhängig von der Silbenanzahl, über bis zu ca. 800 ms erstrecken, wohingegen der Tonhöhenabfall nach H* typischerweise lediglich ca. 100-200 ms andauert und damit als sehr abrupt zu charakterisieren ist. Weiterhin kann die mit einem Hochton assoziierte Silbe entweder deutlich gelängt sein, was beim finalen Hochton (in Abhängigkeit etwa von den silbenschließenden Konsonanten, den sog. consonnes allongeantes [v s z 3]), der Fall ist, oder sich im Vergleich zu anderen nicht-finalen Silben in der Dauer nicht wesentlich unterscheiden, wie es für den Initialakzent (Hi) typisch ist. Aus diesem zweigleisigen Verfahren - initialer Phrasenton Hi, finaler Akzentton (L)H* - ergibt sich die der Akzentphrase zugrunde liegende Kontur /LHiLH*/. Der großen Bandbreite an möglichen Realisierungen einer solchen AP tragen die Autorinnen Rechnung, indem sie ein Repertoire möglicher Instanziierungen der zugrunde liegenden Tonkontur aufstellen und neben der default-Realisierung (bei der alle Teiltöne auf der Oberfläche erscheinen) fünf Varianten annehmen, bei denen jeweils unterschiedliche Teiltöne getilgt werden. Die ein,o:l
„The location of stress is fixed at the word level, but its realization depends upon the position of a word within a phrase [ . . . ] . That is, the final full syllable of a word is realized with longer duration and higher intensity than non-final syllables only if it is the last full syllable of a phrase. In this case, the phrase-final syllable carries a primary stress, and is often realized with a rising pitch movement" (Jun/Fougeron 2002: 147).
222
Christoph Gabriel
zelnen Realisierungsvarianten werden jeweils bestimmten Kontexten zugeordnet (vgl. Jun/Fougeron 2000: 216f., verfeinert in 2002: 153f.). Fery (2001) schließlich spricht sich grundsätzlich dagegen aus, Betonung im Französischen auf der Wortebene festzumachen, womit die Assoziierung von Akzenttönen mit metrisch starken Silben ausgeschlossen ist. Stattdessen hebt sie die vorwiegend delimitative Funktion der markanten Punkte tonaler Konturen hervor und analysiert diese somit als Grenz- oder Phrasentöne, die mit prosodischen Grenzen assoziieren (ausgegangen wird von den Gliederungsebenen PhP und IP). Zentrales Argument für diese Position ist die Variabilität tonaler Gestaltung im Französischen, die sich schlecht mit dem Konzept des Akzenttons in Einklang bringen lasse.104 Interessant ist, dass sich auch Jun/Fougeron (2002) in der Überarbeitung ihres Modell der von Fery vertretenen Auffassung annähern und zwar insofern, als sie dem Finalakzent einen Mischstatus zwischen Akzent- und Phrasenton zugestehen und annehmen, dass dieser nicht nur mit der Silbenschicht, sondern auch mit der APEbene assoziiert, was den demarkativen Charakter zum Ausdruck bringen soll.105 Betrachten wir nun das Gesamtmodell der französischen Intonation nach Jun/Fougeron (2000, 2002), wobei zwischen der dem traditionellen groupe rythmique entsprechenden Akzentphrase (AP) und der obersten prosodischen Gliederungseinheit (IP) eine Intermediärphrase (ip) angesetzt wird. Wie sich weiter unten zeigen wird, ist dies vor allem für die Modellierung der Fokusvermittlung relevant.
104
„Several properties of French tones speak for this analysis, like their variability, their optionality, and the fact that they can associate with metrically weak syllables. The crucial property of French is that is does not have lexical stress, and all kinds of syllables can bear tonal movements, as well as articles, prepositions and schwa syllables. Boundary tones do not avoid such elements. The variability of tonal association also finds a natural explanation" (Fery 2001: 177).
105
Den begrenzenden Charakter des initialen Phrasentons hebt auch Welby (2002) hervor, die diesen als bitonalen Phrasenakzent (LH-) auffasst, der den linken Rand des ersten Inhaltswortes eines groupe rythmique markiert. In Perzeptionsexperimenten weist sie zudem überzeugend nach, dass der Initialakzent der Segmentierung der Redekette und damit der Worterkennung zuträglich ist.
J. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung (3-131)
223
Das Modell der französischen Intonation nach Jun/Fougeron (2002: 152), erweitert um die in Jun/Fougeron (2000: 231) angenommene ip-Ebene
(Wf = Funktionswort, Wc = Inhaltswort, AP = Akzentphrase, s = Schwasilbe)
Dem AM-Modell nicht unmittelbar verpflichtet ist die Studie von Di Cristo (1998). Hier wird explizit eine postlexikalische Akzentzuweisung angenommen, bei der der obligatorische Hauptakzent die letzte und ein fakultativer Nebenakzent die erste Silbe eines jeden Inhaltswortes trifft. Überschüssige Akzente werden dann in einem nächsten Schritt mithilfe einer Anpassungsregel getilgt (engl, readjustment).106 Die zeitlich-rhythmische Organisation geschieht auf einer eigenen Ebene und operiert auf Einheiten, die als 'prosodisches' oder 'phonologisches Wort' jeweils eine akzentuierte (und deshalb durch zusätzliche Längung charakterisierte) Finalsilbe und die ihr vorangehenden Silben umfassen. Dezidiert mit der intonatorischen Vermittlung von Fokus im Französischen haben sich Jun/Fougeron (2000) und Féry (2001) befasst, wobei insbesondere die zuerst genannten einen konkreten Vorschlag für eine AM-basierte Modellierung ausarbeiten. Nach Jun/Fougeron zeichnet sich die F0-Kontur eines Satzes mit einer nicht in Finalposition fokussierten Konstituente durch Deakzentuierung des postfokalen Materials (also durch Nichtrealisierung von zugrunde liegenden Tönen) und die daraus resultierende 'flache' Gestaltung der F0-Kontur aus. Bei Deklarativsätzen ist die postfokale Kontur dann durch ein tiefes, bei Fragesätzen durch ein hohes Plateau gekennzeichnet. Anhand des Vergleichs eines Satzes mit direktem Objekt und adjungierter PP (Marion mangera des bananes au petit déjeuner 'Marion wird Bananen zum Frühstück 106
„When a monosyllabic stress group is both preceded and followed by a stressed syllable in the same intonation unit, combine the last two groups into one" (Di Cristo 1998: 198). Auf diese Weise wird die aus drei Inhaltswörtern bestehende Äußerung [un BEAU I CHAT I GR IS) 'eine schöne graue Katze' als [un BEAU I chat GRIS] realisiert.
224
Christoph
Gabriel
essen', Jun/Fougeron 2000: 223) mit gesamtfokaler Lesart und der identischen Struktur mit in situ fokussiertem Objekt kommen die Autorinnen zu den folgenden Ergebnissen: 1. Die fokussierte Konstituente trägt einen FO-Gipfel, der entgegen dem Befund von Di Cristo (1998: 210) auch oft auf der letzten akzentogenen Silbe des fokussierten Worts realisiert wird. Offensichtlich ist die Lokalisierung des fokalen Hochtons innerhalb der betreffenden Akzentphrase (AP) stark sprecherabhängig, wobei eine deutliche Tendenz zur fokalen Anfangsbetonung bei Wörtern mit weniger als drei Silben besteht (so etwa beim zweisilbigen BLANCHEneige 'Schneewittchen' f'blöJ.nej], u.a. CC3 4, KT3 4). 2. Präfokales Material zeichnet sich generell durch reduzierte FO-Höhe und eine geringere Menge an AP-Grenzen aus. 3. Postfokales Material ist zwar deakzentuiert, aber nicht dephrasiert, denn die phrasenfinale Längung wird auch im postfokalen (und deakzentuierten) Bereich beibehalten. Für die Repräsentierung der Fokusintonation schlagen Jun/Fougeron (2000) vor, den postfokalen Plateauton (H bei Fragesätzen, L bei Deklarativa) als Phrasenton aufzufassen, also als einen Ton, der mit dem rechten Rand der zwischen AP und IP angenommenen Intermediärphrase (ip) assoziiert. Nach einem fokalen Akzentton (Hf) werden die Töne der AP-Ebene getilgt, und der ip-finale Grenzton (Lbeim Deklarativsatz) breitet sich als Plateau über die nunmehr 'tonlosen' postfokalen Silben bis zum vorausgehenden fokalen Akzentton (Hf) aus. Wichtig ist hierbei, dass T- nicht mit einer bestimmten Silbe, sondern mit der Grenze der Intermediärphrase assoziiert. Betrachten wir hierzu zwei Beispiele aus dem Korpus. In (3-132.a) wird das postfokale Material komplett deakzentuiert; der finale ip-Grenzton L- breitet sich bis zum auf jourNAL realisierten fokalen Akzentton aus (Hf, hier durch Fettdruck hervorgehoben). In (3-132.b) sehen wir, dass nach einem fokalen Akzentton nicht unbedingt alle zugrunde liegenden Töne komplett getilgt werden müssen: Das nach der Fokusdomäne zu verzeichnende tiefe Plateau weist vielmehr gewisse 'Reste' des zugrunde liegenden Tonmaterials auf; der in abgeschwächter Form an der Oberfläche realisierte Hochton H* auf der Endsilbe von kidnappe ist hier grau hervorgehoben. (3-132)
(Kontext: 'Was gibt Maria ihrem Bruder?')
a. fr.
(((MaI I
rie )AP (donne le jourNAL)AP (ä son frere)AP )ip )IP I I I I I
LHifc H*
fcHi
L
Hf
L Hi L H*
L- L% (JD25)
225
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung Sprecherin J D 2 5 jour-
frère
- tiefes Plateau
b.
-->
\Lr}L%
(Kontext: 'Wer entführt Tarzan?') (((C'est BlancheNEIGE )AP (qui kidnappe Tarzan )AP )ip )IP
I
I
I
LHiL
I Hf
LHiL
H*
II LHiLH*
L-L% (JD34)
Sprecherin JD3 4
Alternativ zum hier skizzierten Vorschlag nach Jun/Fougeron (2000) wäre eine Modellierung denkbar, die entsprechend der in Abschnitt 3.2.2 vorgestellten Analyse des Spanischen von einem tiefen Phrasenton L- ausgeht, der den rechten Rand der Fokusdomäne markiert und zugleich den Beginn des tiefen Plateaus signalisiert; vgl. das spanische Beispiel (3-110.b) ((MaRia),p L- (le dio el diario su hermano\ ) IP Unter diesen Voraussetzungen sind allerdings für (3-132.b) zwei Intermediärphrasen anzusetzen, d.h. ((C'est BlancheNEIGE)ip L- (qui kidnappe Tarzan),p)ip. Von einer solchen zusätzlichen prosodischen Grenze gehen auch Beyssade et al. (2004) aus, die in vergleichbaren Kontexten sogar einen IP-Grenzton L% ansetzen, z.B. Qui a acheté une mandoline ? 'Wer hat eine Mandoline gekauft?' - Mallarmé L% a acheté une mandoline (vgl. 2004: 478). In Bezug auf die Signalisierung von weitem bzw. engem Fokus hat Féry (2001: 166ff.) gezeigt, dass bei engem finalem Fokus die entsprechende Konstituente grundsätzlich als eigene PhP realisiert wird (was im Modell von Jun/ Fougeron 2000 einer eigenen AP mit einem overt realisierten H*/Hf entspricht), während bei den präfokalen Konstituenten bezüglich der Phrasierung eine größere Variabilität gegeben ist, vgl. die von Féry übernommenen Bei-
226
Christoph Gabriel
spiele in (3-133). Eckige Klammern zeigen die phonologische Phrasierung an; nicht eingeklammertes Material unterliegt postfokaler Dephrasierung.107 (3-133) a. b. c.
fr.
(Kontext: 'Wem gibt Marie das Fläschchen?') [Marie] [donne le biberon] [à son bébé.] (nach Féry 2001: 174) [C'est à son bébé] que Marie donne le biberon. [Marie!Elle donne le biberon] [à son bébé.J 'Marie/Sie gibt F [ihrem Baby] F das Fläschchen.' / 'Es ist ihr Baby, dem sie das Fläschchen gibt.'
Die tonale Gestaltung der fokalen Konstituente kennt wiederum eine ganze Bandbreite von Realisierungsmöglichkeiten, die hier nicht weiter besprochen werden sollen (vgl. Fery 2001: 175). Festzuhalten ist jedoch, dass die gesonderte Phrasierung der PP im angeführten Beispiel kein eindeutiges Indiz dafür ist, dass diese im engen Fokus steht. So ist die in Beispiel (3-133.a) angezeigte Phrasierung auch mit einer satzfokalen Lesart oder mit VP-Fokus kompatibel (Kontexte: 'Was passiert?' / 'Was macht Marie?'). Im Gegensatz hierzu kann beispielsweise im Spanischen durch Intermediärphrasierung mittels hoher Phrasen töne (H-) die Weite der Fokusdomäne eindeutig angezeigt werden; auf die Möglichkeiten der Differenzierung zwischen engem und weitem Fokus durch unterschiedliche Akzenttöne im neapolitanischen Italienisch wurde bereits hingewiesen. Das Französische nutzt hier im Bedarfsfall besondere syntaktische Konstruktionen wie den Spaltsatz (vgl. 3-133.b). Zusammenfassend lässt sich festhalten, dass die Frage nach dem Status der signifikanten Punkte, die sich in den Tonkonturen des Französischen feststellen lassen (phrasenfinale und -initiale Hochtöne), noch nicht eindeutig geklärt zu sein scheint. Die von Jun/Fougeron (2002) vorgeschlagene Mischcharakterisierung des initialen Hochtons als mit der AP-Grenze assoziierten Phrasenton und des finalen Hochtons als Akzentton, der zusätzlich mit der AP-Ebene verbunden ist, sowie die unterschiedlichen Möglichkeiten der Oberflächenrealisierung der sich hieraus ergebenden zugrunde liegenden Kontur /LHiLH*/ scheinen für meine Zwecke jedoch hinreichend flexibel zu sein.
107
Da Fery davon ausgeht, dass Töne im Französischen ausschließlich mit phrasalen Grenzen assoziieren, muss hier von Dephrasierung ausgegangen werden. Eine Unterscheidung zwischen Deakzentuierung und Dephrasierung, wie sie bei Jun/Fourgeron vorgenommen wird (s.o.), ist in ihrem Ansatz nicht möglich.
3. Theoretischer Hintergrund, Forschungsüberblick
und Modellbildung
227
3.2.5 Zusammenfassung Die unterschiedlichen Akzentsysteme der betrachteten Sprachen erfordern eine jeweils unterschiedliche Adaption des AM-Modells: Während das Spanische und das Italienische über einen lexikalisch distinktiven freien Wortakzent verfügen, bildet das Französische eine Ausnahme, da hier keine durch das Lexikon determinierten metrisch starken Silben vorliegen, mit denen Akzenttöne assoziieren können. 108 Entsprechende Vorschläge für die Adaption des Modells wurden in den vorangegangenen Abschnitten vorgestellt, wobei der Schwerpunkt der Ausführungen jeweils auf der tonalen Vermittlung der FHG lag. In Bezug auf die betrachteten Varietäten des Spanischen habe ich - mit Ausnahme des in Buenos Aires gesprochenen Dialekts - für die Annahme zweier zugrunde liegender Akzenttöne /(LH)/* und /LH*/ argumentiert, wobei letzterer als kontrastiver Fokusakzent zu fassen ist. Bei der Implementierung dieser Töne in die Oberflächenkontur kommt es positionsbedingt zu Neutralisierungen, was beispielsweise zur Folge hat, dass sich in IP-finaler Position enger neutraler und kontrastiver Fokus tonal nicht unterscheiden (realisiert wird jeweils LH*). Die Abgrenzung der Fokusdomäne kann im Spanischen durch intermediäre Phrasierung geleistet werden, wobei ein hoher Phrasenton H- den rechten Rand des präsupponierten Materials begrenzt. Ein tiefer Phrasenton L- hingegen markiert eine kontrastiv fokussierte Konstituente, was sich in Form der fakultativen postfokalen Deakzentuierung und der Realisierung als tonales Plateau niederschlagen kann. Die Aspekte der intermediären Phrasierung betreffen auch das porteno-Spanische, das in Bezug auf die Realisierung pränuklearer Akzenttöne und des kontrastiven Fokusakzents sowie bezüglich der eintretenden Neutralisierungen der tonalen Korrelate unterschiedlicher Fokustypen dem Italienischen ähnlich ist. Das Französische wiederum kennt zwar auch die Realisierung postfokalen Materials als (bei Deklarativsätzen tiefes) Plateau, jedoch macht bereits hier die in der Literatur
108
Den Versuch eines Brückenschlags zwischen Spanisch und Italienisch auf der einen und Französisch auf der anderen Seite unternimmt Hualde (2003b, 2004), der mit dem Okzitanischen eine Sprache untersucht, die zwar einen lexikalisch distinktiven Wortakzent aufweist, der in seiner Flexibilität jedoch stärker eingeschränkt ist als etwa im Spanischen (vgl. Meisenburg 2001). Hualde zeigt, dass im Okzitanischen nicht nur metrisch starke Silben, sondern auch Nebenakzentpositionen für die intonatorische Gestaltung und damit für die Assoziierung der Akzenttöne genutzt werden, was die Intonation dieser Sprache deutlich vom Spanischen abhebt und zugleich eine Gemeinsamkeit mit dem Französischen darstellt. Für letzteres überlegt Hualde, ob der Verlust des kontrastiven Wortakzents zu Umgestaltungen in der Intonation geführt haben könnte, in deren Folge tonale Bewegungen auch mit nicht prominenten Silben (d.h. mit Nebenakzentsteilen) assoziieren.
228
Christoph
Gabriel
verwendete Terminologie - handelt es sich um Deakzentuierung und/oder um Dephrasierungl - deutlich, dass eine Modellierung der französischen Intonation bereits an einem anderen Punkt ansetzen muss, als es bei einer Beschäftigung mit dem Spanischen oder dem Italienischen der Fall ist. Für meine Zwecke scheint das von Jun/Fougeron (2000, 2002) vorgeschlagene Mischsystem, das sowohl Akzent- als auch Phrasentöne annimmt, die notwendige Flexibilität zu bieten. Im Rahmen des Überblicks zur Intonation der drei hier interessierenden Sprachen wurde zudem deutlich, dass tonale Variation eine große Rolle spielt. Dies betrifft nicht nur positionsbedingte Varianten, die sich als in bestimmten Kontexten vorhersagbar auftretende Allotöne beschreiben lassen, sondern auch die freie Variation im Sinne einer weitgehenden Gleichwertigkeit mehrerer tonaler Realisierungen in ein und demselben Kontext (z.B. die Möglichkeit der Abgrenzung von Fokusdomänen durch einen hohen intermediären Grenzton H-; vgl. hierzu im Einzelnen Abschnitt 4.3.1). Für die Modellierung dieser Art von Optionalität leistet die Optimalitätstheorie, vor allem in Form der Stochastischen OT nach Boersma/Hayes (2001), gute Dienste. Die entsprechenden Grundlagen werden in den folgenden Abschnitten besprochen.
3.3 Optimalitätstheorie In den vorausgegangenen Abschnitten hat sich gezeigt, dass sowohl das minimalistische Syntaxmodell als auch die AM-basierte Intonationsphonologie gute Dienste zur Beschreibung der unterschiedlichen syntaktischen und prosodischen Vermittlungsstrategien der FHG leisten, dass jedoch beide Modelle an ihre Grenzen geraten, wenn es darum geht, Sprachvariation in adäquater Weise zu modellieren. So wurde beispielsweise in Abschnitt 3.1.4 in Zusammenhang mit der Diskussion des EPP im Spanischen deutlich, dass sich mithilfe des minimalistischen Merkmalsystems zwar relativ einfach die obligatorische Besetzung der präverbalen Position Spec,TP motivieren lässt, dass sich aber gerade das Spanische hier als problematisch herausstellt, da in dieser Position - anders als etwa im Französischen - bei unmarkierter Wortstellung nicht nur Subjektkonstituenten oder Expletiva, sondern auch XPn von anderem syntaktischen Status wie z.B. Dativkonstituenten anzutreffen sind. Weiterhin verbleibt das Subjekt, sofern es das einzige als volle DP realisierte Argument ist, im neutralen Kontext i.d.R. in der vP-internen Basisposition, und zwar unabhängig davon, ob es sich um ein 'unakkusatives', d.h. in Komplementposition basisgeneriertes Subjekt wie in (3-79.a) F[Llegö Maria]? 'Maria ist angekommen' handelt oder um ein externes Argument wie in (3-79.d) p[Llamö Maria]? 'Maria hat angerufen'. Auch in diesem Fall ist bei
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
229
einer klassischen Sichtweise des EPP schwer zu motivieren, weshalb das Subjekt nicht angehoben wird. Zwar lassen sich derartige Alternanzen auch in einem rein merkmalbasierten Rahmen modellieren, doch ist dies mit der Annahme unterschiedlicher T-Köpfe mit verschiedenen Merkmalen verbunden, was notgedrungen zu einer Vervielfältigung funktionaler Kategorien führt (siehe die Diskussion zum 'synkretischen' T-Kopf bei Zubizarreta 1998; vgl. Abschnitt 3.1.3.2). Dies lässt sich, wie sich zeigen wird, bei einer optimalitätstheoretischen Herangehensweise vermeiden. Die in den Daten konstatierte Variation ist also ein zentraler Punkt, der für das Einbeziehen der optimalitätstheoretischen Perspektive spricht. So lässt sich etwa der Kontrast zwischen dem präverbalen Subjekt in F [ M a r i a compra el diario]F 'Maria kauft die Zeitung' und dem postverbalen Subjekt in Compra el diario ¡¡[Maria]? erklären, wenn man annimmt, dass die Operationen der '3>-Syntax' in Anlehnung an das von Zubizarreta (1998) entwickelte p-movement von informationsstrukturellen Merkmalen gesteuert sind (vgl. Abschnitt 3.1.5). Jedoch ist eine solche Modellierung spätestens dann problematisch, wenn Optionalität ins Spiel kommt, wie sie immer dann zutage tritt, wenn man konkretes und insbesondere spontansprachliches Datenmaterial hinzuzieht: Hier wird klar, dass neben dem postverbalen fokussierten Subjekt die Fokussierung in situ ganz klar eine Option ist und dass diese bei Sätzen mit vollen internen Objekt-DPn sogar die bevorzugte Variante darstellt. Gleiches gilt auch für die intonatorische Vermittlung der FHG: Ob im Spanischen postfokale Deakzentuierung erfolgt, und - wenn ja - ob hiervon alle postfokalen Akzenttöne betroffen sind, lässt sich nicht eindeutig aufgrund des Kontextes vorhersagen. Ebenso kann in den standardnahen Varietäten des Spanischen bei satzfokaler Lesart die Schlusskontur eines Deklarativsatzes in Form von LH* L- L% realisiert werden oder es kann finale Akzentreduktion vorliegen (vgl. Abschnitt 3.2.2). Zahllose weitere Beispiele ließen sich anführen. Es gilt also, auf ein Modell zurückzugreifen, das Optionalität zulässt und als integralen Bestandteil der Grammatik auffasst. Hierfür bietet sich die stochastische Optimalitätstheorie nach Boersma/Hayes (2001) an. Der hier beschrittene Lösungsweg lässt sich wie folgt skizzieren. Wie in Abschnitt 3.1.4 vorgeschlagen, nehme ich an, dass das EPP lediglich die Eröffnung von Spec,TP stipuliert, die Löschung dieses Merkmals jedoch durch Kategorien von unterschiedlichem syntaktischen Status möglich ist. Die entsprechend den Prinzipien des minimalistischen Phrasenaufbaus entstandenen Strukturen werden vor der Übergabe an die Schnittstellen einer optimalitätstheoretischen Evaluation unterzogen. Welche der jeweiligen Konstituenten die präverbale Position besetzt oder ob diese overt leer bleibt und durch proExPi aufgefüllt wird, hängt von der Anordnung der Beschränkungen ab, die
230
Christoph
Gabriel
sich wiederum aus den konkreten Vorkommensfrequenzen der einzelnen Varianten ergibt. Im Folgenden erläutere ich zunächst die grundlegenden Annahmen der Optimalitätstheorie, bevor aufgezeigt wird, wie das ursprünglich für die segmentale Phonologie konzipierte Modell auf Fragestellungen der Syntax und Intonation übertragen wird (Abschnitt 3.3.1). Hieran anschließend befasse ich mich mit den Möglichkeiten optimalitätstheoretischer Modellierung von Sprachvariation (Abschnitt 3.3.2). Die klassische Optimalitätstheorie nach Prince/Smolensky (2004 [1993]) baut auf der Beobachtung auf, dass die Sprachen der Welt (bzw. ihre Grammatiken) durch zwei allgemeine Tendenzen gekennzeichnet sind, die miteinander in Konflikt stehen: zum einen durch die Vermeidung von markierten Strukturen (engl, markedness) und zum anderen durch größtmögliche Treue zur jeweils als zugrunde liegend angenommenen Form (engl, faithfulness). Diese grundsätzlichen Tendenzen werden jeweils in Form von Beschränkungen (Constraints) gefasst, die zum Teil sehr allgemein formuliert, zum Teil jedoch hoch spezifisch sind. Diese Constraints bilden ein universales, für alle Sprachen geltendes Repertoire, das wiederum in unterschiedlicher hierarchischer Anordnung den verschiedenen einzelsprachlichen Grammatiken entspricht. Einzelne sprachliche Formen (Kandidaten) werden dann entsprechend der jeweiligen Constraint-Hierarchie einem Auswahlprozess (Evaluation) unterworfen, wobei diejenigen Formen als ungrammatisch ausgeschlossen werden, die gegen in der Hierarchie höherstehende Constraints verstoßen. Grundsätzlich gilt hierbei das Prinzip der minimalen Verletzung, d.h. dass ein Kandidat A, der eine bestimmte Beschränkung verletzt, weiter 'im Rennen bleibt', wenn es einen Kandidaten B gibt, der denselben Constraint mehrmals verletzt. Verletzen alle Kandidaten den fraglichen Constraint, ist der hierarchisch nächsttiefere für die Wahl des optimalen Kandidaten ausschlaggebend. Die optimalitätstheoretische Auffassung von Markiertheit gründet sich auf den typologisch-deskriptiven Markiertheitsbegriff, demzufolge markierte Strukturen im übereinzelsprachlichen Vergleich seltener vorkommen und dadurch gekennzeichnet sind, dass sie stets das jeweilige unmarkierte Gegenstück implizieren. Als Beispiel hierfür lassen sich die vorderen gerundeten Vokale [ce 0 y] anführen, die nur in Vokalsystemen auftreten, die zugleich über die ungerundeten Entsprechungen [e e i] verfügen. Ein solches Vokalsystem ist das des Französischen; das Spanische und das Italienische hingegen weisen, ebenso wie die übrigen romanischen Sprachen, keine vorderen gerundeten Vokale auf (mit Ausnahme des Okzitanischen, dessen Vokalsystem das Phonem /y/ aufweist). In der Kombinatorik von Segmenten sind unmarkierte Strukturen durch artikulatorische Gegebenheiten determiniert, was u.a. bei Assimilationen zum Tragen kommt (s.u.).
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
231
Das Konzept der Markiertheit lässt sich auch anhand der Silbe aufzeigen. So hat eine ideale Silbe wie [pa] einen Anfangsrand (Onset) und ist offen (d.h. sie hat keine Coda). Weiterhin sind ihre Konstituenten nicht komplex (keine Diphthonge als Silbenkern, keine Konsonantencluster im Anfangs- und Endrand), und die Anordnung der Segmente in der Silbenschale entspricht der Sonoritätshierarchie (Zunahme der Schallfülle zum Silbenkern hin). Entsprechend lassen sich die folgenden Markiertheitsconstraints formulieren: 109 (3-134) a.
ONSET: Die Silbe hat einen A n f a n g s r a n d (vgl. Prince/Smolensky 2 0 0 4 LI993]: 20).
b.
NOCODA: Die Silbe hat keine C o d a (vgl. Prince/Smolensky 2004
c. d.
*COMPL: Die Konstituenten der Silbe sind nicht k o m p l e x . SON: Die Silbenschale respektiert die Sonoritätshierarchie.
[1993J: 41).
Einzelsprachliche Differenzen ergeben sich dann aus der unterschiedlichen Hierarchie solcher Beschränkungen. So ist etwa in einer Sprache wie dem Französischen, das aufgrund seiner Lautentwicklung einen vergleichsweise großen Bestand an Wörtern mit konsonantischem Auslaut aufweist (FEMINA > [fam]), NOCODA hierarchisch tiefer angesiedelt als etwa im Spanischen oder im Italienischen. Das Spanische wiederum respektiert die Sonoritätshierarchie stärker als etwa das Italienische oder das Französische. Dies zeigt sich z.B. an den sog. prothetischen oder Sprossvokalen wie in sp. estación 'Haltestelle', die den markierten Sonoritätsverlauf im Anlaut verhindern (Syllabierung: [es.ta]). Im Italienischen und Französischen hingegen sind Anlautsequenzen wie in fr. Station oder it. stazione unproblematisch. 110 Entsprechend ist anzunehmen, dass der Constraint SON im Spanischen einen hierarchisch höheren Platz einnimmt als in den beiden anderen romanischen Sprachen.
109
110
Es sei hier gesagt, dass das optimalitätstheoretische Konzept der Markiertheit zwar auf dem in der Sprachtypologie entwickelten beruht, aber nicht mit diesem gleichzusetzen ist: So werden grundsätzlich all diejenigen Beschränkungen der Familie der Markiertheitsconstraints zugeordnet, die sich auf die formale Seite der Kandidaten beziehen, ohne dass dies immer im engeren Sinne typologisch motiviert ist; vgl. McCarthy (2002: 13ff.) für eine diesbezügliche Diskussion. Das Türkeitürkische, das mit dem Spanischen die Vorliebe für regelmäßige CV-Sequenzen und die Abneigung gegen komplexe Silbenkonstituenten teilt, verhält sich hier genauso; vgl. ttü. istasyon 'Haltestelle'. - Im Französischen und Italienischen werden komplexe Anfangsränder, die gegen SON verstoßen, im größeren Zusammenhang allerdings durch Resyllabierung aufgebrochen (vgl. it. la stazione [las.ta]). Zur Vermeidung komplexer Silbenendränder wird bei derart anlautenden maskulinen Wörtern anstelle des Artikels il die Suppletivform lo gesetzt: *il strazio *[ils.tra] —> lo strazio [los.tra] 'die Qual'.
232
Christoph Gabriel
Unmarkierte Strukturen sind oftmals damit verbunden, dass auf der Oberfläche gewisse Modifikationen vorgenommen werden, wodurch die Identität mit der zugrunde liegenden Form in mehr oder minder starkem Maße maskiert werden kann. Ein Beispiel ist hier die regressive Assimilation bei Präfigierung mit dem negierenden Affix im Spanischen, vgl.: 135) a. b. c. d. e. f. g-
sp.
/in/ /in/ /in/ /in/ /in/ /in/ /in/
+ + + + + + +
—» /aktibo/ /posible/ — » /fatigable/ — > /tolerable/ - » —» /kapas/ /maduro/ — > /negable/
[inaktißo] [imposißle] [irqfatiyaßle] [intoleraßle] [irjkapas] [imaöuro] [ineyaßle]
inactivo imposible
'untätig' 'unmöglich' infatigable 'unermüdlich' intolerable 'unerträglich' 'unfähig' incapaz inmaduro 'unreif innegable 'unbestreitbar'
Während die (in der Grafie nur teilweise reflektierte) Anpassung des Nasalkonsonanten /n/ bei konsonantisch anlautender Basis an den jeweiligen Artikulationsort zu unmarkierten Segmentabfolgen führt, wird hierdurch in Kauf genommen, dass die Treue zwischen der als zugrunde liegend angenommen Inputform des Präfixes /in/ und den jeweiligen an der Oberfläche erscheinenden Outputformen [in], [im], [in]], [iq] und [i] nicht immer gewahrt bleibt. So liegt bei (3-135.b, c, e) ein Verstoß gegen den Treueconstraint IDENT(F) ('identity of features') vor, und zwar insofern, als eines der Lautsegmente in Bezug auf den Artikulationsort nicht mit dem entsprechenden Merkmal im Input übereinstimmt (z.B. [velar] anstelle von [alveolar] im Fall von [iqkapas]). In (3-125.f, g) wird der Nasalkonsonant des Präfixes elidiert, was eine Verletzung des Tilgungsverbots MAX-IO zur Folge hat. Zum Zwecke der maximalen Wiedererkennbarkeit von Wörtern, Wortformen und Wortbestandteilen im größeren sprachlichen Zusammenhang muss jedoch gewährleistet sein, dass sich Input- und Outputformen nicht allzu weit voneinander entfernen. Entsprechende Verstöße werden von den nachfolgend aufgelisteten grundlegenden Treueconstraints sanktioniert. 111
1
Es sei der Vollständigkeit halber angemerkt, dass in neueren optimalitätstheoretischen Arbeiten diskutiert wird, inwiefern neben der Input-Output-Korrespondenz auch die formale Identität zwischen verschiedenen Outputformen, insbesondere bei paradigmatischen Effekten, eine Rolle spielt. In dieser Sichtweise wird eine der Outputformen des Paradigmas als Basis definiert, mit der die weiteren Formen verglichen werden (vgl. McCarthy 2002: 172ff.). Für eine Anwendung solcher output-output (OO-)Treueconstraints auf die (De-)Palatalisierung in Formen wie sp. desdén, desdenes, desdeñar 'Verachtungen), verachten' vgl. Llorret/Mascaró (2005).
3. Theoretischer
(3-136) a. b. c.
Hintergrund, Forschungsüberblick
und
Modellbildung
233
DEP-IO: Outputsegmente sind im Input enthalten. (—» keine Epenthese) MAX-IO: Inputsegmente werden im Output repräsentiert. (—» keine Tilgung) IDENT(F): Outputsegmente haben dieselben Merkmale wie Inputsegmente. (—> keine Assimilation etc.)
Eine dritte Familie von Constraints betrifft die Übereinstimmung zwischen unterschiedlichen sprachlichen Ebenen und regelt insbesondere das Verhältnis zwischen grammatischer und prosodischer Struktur (sog. Alignmentconstraints; vgl. u.a. Truckenbrodt 2007: 437ff.). So lässt sich etwa im Deutschen eine starke Tendenz zur Übereinstimmung von linkem Wortrand und Silbenanfangsrand ausmachen (vgl. dt. das I All [das. ? al]/*[da.sal], die I Oma [di.? o.ma]/*[djo.ma]), wohingegen beispielsweise im Spanischen Wortgrenzen durch Resyllabierung und Sandhi-Phänome wie sinalefa bei unmarkierter Aussprache verschliffen werden; vgl. sp. las amigas 'die Freundinnen' [la.sa.mi.yas], mi^obligaciön 'meine Pflicht' [mjo.ßli.Ya.sjon], su^hermano 'sein/ihr Bruder' [swer.ma.no] (vgl. Abschnitt 2.2.2f. Das Französische wiederum lässt durch das Phänomen der liaison (Syllabierung eines latenten Auslautkonsonanten in den Anfangsrand der ersten Silbe des Folgewortes) in besonders starkem Maße die Maskierung des linken Wortrandes zu; vgl. fr. /le(z)/ +femmes 'die Frauen' [le.fam], aber /le(z)/ + amies 'die Freundinnen' [le.za.mi]. In Sprachen, die wie das Deutsche den linken Wortrand in besonderem Maße schützen (regelmäßiger Glottisschlag [?] vor vokalisch anlautenden Wörtern), ist hingegen die Übereinstimmung zwischen Wort- und Silbenanfang besonders wichtig. Die hierfür relevante Beschränkung A L I G N - L (vgl. 3-137.b) muss hier also hierarchisch höher angeordnet sein als etwa im Spanischen oder im Französischen. (3-137) a.
ALIGN : „The final edge of a morphological word corresponds to the final edge of a syllable" (Prince/Smolensky 2004 [1993]: 127).
b.
ALIGN-L(EFT): Der linke Rand eines morphologischen Wortes stimmt mit dem linken Rand einer Silbe überein.
Grundsätzlich liegt für jede Inputform eine theoretisch unbegrenzte Menge von Outputformen vor, die durch die Funktion GEN (Generator) erzeugt werden. Der in einem nächsten Schritt vonstatten gehende Auswahlprozess (Evaluation) wird in Form von Tableaux dargestellt. Der Asterisk '*' markiert hierbei die Verletzung eines Constraint, wobei mehrfache Verletzungen ein und derselben Beschränkung durch eine entsprechende Anzahl von '*' angezeigt
Christoph Gabriel
234
werden. Das Ausrufezeichen '!' steht für eine sog. 'fatale' Verletzung, die zum Ausschluss des betreffenden Kandidaten führt. Die optimale Form wird durch das Handzeichen nicht mehr relevante Verletzungen durch graue Unterlegung gekennzeichnet. Betrachten wir dieses Verfahren am Beispiel der oben angesprochenen spanischen Beispiele: (3-138)
Tableau: las
amigas
/la+s amiga+s/
ONSET
[las.a.mi.yas]
*!
ALIGN-L
•»"[la.sa.mi.yas]
*
Da ALIGN-L von ONSET dominiert wird, gewinnt diejenige Form, bei der der Anlaut des Inhaltswortes durch Resyllabierung maskiert wird. Für das sinale/A-Beispiel sujkermano benötigen wir zusätzlich die Beschränkung SYLLABLEECONOMY (SE), die sich mit Blick auf die Ausspracheökonomie motivieren lässt und die grundsätzlich Formen mit weniger Silben bevorzugt. Es handelt sich hierbei um einen Constraint, der nicht unverletzt bleiben kann, da jede im Output realisierte Silbe als eine Verletzung gewertet wird. Als optimale Form gilt dann diejenige, welche im Vergleich zu den anderen Kandidaten am wenigsten Silben (und damit SE-Verletzungen) aufweist. (3-139)
SYLLABLEECONOMY (SE): Je weniger Silben, desto besser (vgl. Tranel 2000: 40).
Betrachten wir hierzu das Tableau für su^hermano. Die Realisierung des zugrunde liegenden hohen Vokals /u/ als homorganer Approximant (Gleitlautbildung) wird als Verstoß gegen die Merkmalsidentität und damit als Verletzung von IDENT(F) gewertet. Da sich aus den hier betrachteten Daten keine Hierarchie der Constraints SE, ONSET und M A X - I O ableiten lässt, sind diese im Tableau gleichgeordnet (angezeigt durch gestrichelte Linien).112 (3-140)
Tableau:
su^hermano
/su ormano/ [su.er.ma.no] "" [swEr.ma.no] [ser.ma.no] [sur.ma.no]
112
SE
: MAX-IO
***
.
*** ***
IDENT(F)
ALIGN-L
*
; ;
ONSET !*
I* i*
* *
Da nackte Silben, also solche ohne Anfangsrand, im Spanischen vergleichsweise häufig auftreten, erscheint es intuitiv plausibler, dass MAX-IO die hier geordneten Constraints ONSET und SE dominiert (Ranking: MAX-IO » ONSET, SE), doch lässt sich diese Hierarchie aus den hier zur Diskussion stehenden Daten nicht herleiten.
J. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
235
Wie in Abschnitt 2.2.2 gezeigt, kann der Sandhi-Prozess sinalefa blockiert sein, wenn durch die hierbei eintretende Vokalkontraktion eine informationsstrukturelle Grenze, nämlich diejenige zwischen Fokusdomäne und präsupponiertem Material, überschritten würde. Intuitiv einleuchtend ist hierbei, dass auf diese Weise die phonische Integrität und damit die Salienz des kommunikativ besonders wichtigen fokussierten Materials gewährleistet wird. Dies lässt sich mithilfe des Alignmentconstraint ALIGNFOCSYLL (AFS) fassen (3-141.b), der eine Sonderform der allgemeiner gefassten Beschränkung ALIGNFOC d a r s t e l l t . (3-141) a.
b.
ALIGNFOC: Der rechte Rand einer XP, die fokussiertes Material enthält, stimmt mit dem rechten Rand der Intonationsphrase (IP) überein (vgl. Gussenhoven 2004: 160). ALIGNFOCSYLL (AFS): Die Ränder der Fokusdomäne stimmen mit Silbenrändern überein.
Betrachten wir das Tableau für den Fall des kontrastiv fokussierten Determinanten aus dem Korpusbeispiel María le da el diario a FIFOCSÍ/]F hermano (ALC2J7): (3-142)
Tableau: [ Foc SU] hermano /sujf enti ano/ [su.er.ma.no] [swer.ma.no] [ser.ma.no] [suf.ma.no]
AFS
SE *
!*
:
*
IDINI(F) «
**
* * *
ONSKT *
#»*
!*
MAX-K)
:
* ;
»
In den Tableaux (3-140) und (3-142) wurde die Zuweisung des Nuklearakzents nicht berücksichtigt. Will man in die optimalitätstheoretische Modellierung mit einbeziehen, dass dieser den kontrastiv fokussierten Determinanten und nicht die metrisch starke Silbe des folgenden Inhaltswortes hermano trifft, dann ist eine Reformulierung der in Abschnitt 2.1.3 eingeführten FokusProminenz-Regel (FPR) in Form eines Constraint notwendig. (3-143)
STRESSFOCUS (SF): F [X/XP] f ist prosodisch prominenter als [Y/YP],
SF besagt, dass von zwei Knoten deijenige, welcher fokusmarkiert ist, prosodisch prominenter ist. Um eine fälschliche Zuweisung des Nuklearakzents wie in *Maria le da el diario a p[poc.5«]F herMAno (y no al hermano de Julia) auszuschließen, muss man annehmen, dass SF undominiert ist.
236
Christoph Gabriel (3-144)
Tableau:
*T[Tocsu]rherMAno
/su|r ermano/ ['su.er.ma.no]
SF
fsu.er.'ma.no] [swcr.ma.no] fsur.ma.no]
*!
AFS
ONSI I
MAX-IO
SF.
*
* * * *
*
* * * *
!» !*
* * *
I**
!
: *
Mit der Hinzunahme des Constraint STRESSFOCUS (SF), der Formen wie herMAno ausschließt, bei denen Nuklearakzent und Fokus nicht übereinstimmen, haben wir den ursprünglichen Anwendungsbereich der Optimalitätstheorie, die segmentale Phonologie, bereits verlassen. Der folgende Abschnitt nun ist der Fragestellung gewidmet, wie sich die weiteren syntaktischen und intonatorischen Korrelate der Fokusmarkierung und insbesondere die Interaktion der beiden Komponenten optimalitätstheoretisch fassen lassen. * F [ F O C « < ] F
3.3.1 Die Syntax-Prosodie-Schnittstelle in OT In der optimalitätstheoretischen Phonologie dienen jeweils die zugrunde liegenden Formen, wie sie als Abfolgen von Phonemen im Lexikon inventarisiert sind, als Input. Dagegen ist im Bereich der Syntax weniger klar, was genau als Input angenommen werden soll. Ein grundlegendes Problem ist, dass es sich bei den zu bewertenden Kandidaten um Sätze und damit um hierarchische Strukturen und nicht etwa um lineare Abfolgen von Elementen handelt. Und diese hierarchisch organisierten Strukturen müssen, bevor sie einem Evaluationsprozess unterworfen werden können, erst nach bestimmten Prinzipien aufgebaut werden. Von welcher Konzeption des Input man bei der optimalitätstheoretischen Modellierung syntaktischer Fragestellungen ausgeht, hängt essenziell vom zugrunde gelegten Syntaxmodell ab.113 Geht man vom Minimalismus aus, dann liegt die Annahme nahe, dass jeweils eine Numeration N, die auf eine bestimmte Satzbedeutung hinzielt, den Input bildet und dass diejenigen Strukturen, welche sich nach den minimalistischen Prinzipien aus eben dieser Auswahl an lexikalischen und funktionalen LI aufbauen lassen, die Menge an zu bewertenden Kandidaten darstellen.114 Hält man sich
113
Müller (2000: 2f.) weist darauf hin, dass sich prinzipiell jede Syntaxtheorie optimalitätstheoretisch weiterentwickeln lässt. Die Anzahl derjenigen OT-Arbeiten, die nicht auf dem Prinzipien- und Parametermodell bzw. dem Minimalistischen Programm beruhen, sondern beispielsweise LFG-basiert sind, nimmt sich allerdings eher gering aus.
1,4
Für eine ausführliche Diskussion der Problematik vgl. Müller (2000: 13ff.). In den meisten neueren optimalitätstheoretischen Arbeiten wie z.B. Grimshaw/Samek-Lodovi-
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
237
nun vor Augen, dass Unterschiede in der linearen Abfolge erst aus den unterschiedlichen (kern- oder -syntaktischen) Bewegungen resultieren, dass jedoch der Aufbau des sog. lexical layers (der nach Vergabe aller verbaler Thetarollen an die innerhalb der vP basisgenerierten Konstituenten abgeschlossen ist) in immer gleicher Weise erfolgt (vgl. Abschnitt 3.1.1), dann kann als Input für die optimalitätstheoretische Evaluation genau diejenige Baumstruktur angesetzt werden, die dem Derivationsstadium unmittelbar vor dem Einsetzen der syntaktischen und phonologischen Bewegungen entspricht. Geht man davon aus, dass die Bewegung einer Kategorie nach Spec,TP zur Löschung des EPP informationsstrukturell bedingt sein kann (Beispiel: foco antepuestoKonstruktion), dann müssen auch genau an diesem Punkt der Ableitung die entsprechenden informationsstrukturellen Merkmale hinzukommen. Der Generator (GEN) erstellt nun auf der Basis des Input die zu bewertenden Kandidaten. Verdeutlichen wir uns nun im Folgenden anhand des Beispiels der Linksdislokation, welche Strukturen zu einer möglichen Kandidatenmenge gehören können. Wenn man davon ausgeht, dass linksdislozierte topics im Spezifikator einer TopP lokalisiert sind - so meine Modellierung des Spanischen (vgl. Abschnitt 3.1.3.2) - , dann kann ein Satz mit einem topikalisierten präsupponierten Objekt wie el diario, lo compró F[María]? (Kontext: 'Wer hat die Zeitung gekauft?') nicht Bestandteil derselben Kandidatenmenge sein wie p[María]f compró el diario, da beide aus unterschiedlichen Numerationen resultieren. Für den ersten Fall müssen mit dem funktionalen Kopf Top und dem doppelnden Klitikon dem Lexikon zwei Elemente entnommen werden, die für die Herleitung des zweiten Satzes nicht benötigt werden." 5 Gleiches gilt für den Spaltsatz María es quien compró el diario, der mit dem Kopulaverb es und dem den Relativsatz einleitenden Wh-Wort quien
115
ci (1998) oder Gutiérrez Bravo (2002a) werden keine Numerationen, sondern Argumentstrukturen, verbunden mit Informationen zur informationsstrukturellen Gliederung, als Input angesetzt; z.B. (i) [tu hermano llegó] Input: (Gutiérrez Bravo 2002a: 192) Setzt man eine Numeration N als Input an, dann ist die entsprechende Argumentstruktur über das Verb gleichfalls enthalten. Würde man aus der für die Linksdislokationsstruktur bestimmten Numeration den nicht-segmentierten Satz r[MaRIa]y. compró el diario ableiten, dann läge eine doppelte Verletzung des Constraint MAX-IO vor, weil zwei im Input präsente Kategorien (Top und lo) im Output nicht vertreten wären. Ohne dies an dieser Stelle weiter ausführen zu können, müsste man annehmen, dass es einen MAX-Constraint gibt, der auf Kategorien Anwendung findet und der in der Hierarchie höher anzusiedeln ist als derjenige, der sich auf einzelne Segmente bezieht. Dabei müsste wiederum das 'Nicht-Parsen' eines lexikalischen Elementes schwerer wiegen als das eines funktionalen. Am wenigsten schwer wiegt die Nicht-Verwendung eines Expletivums, die durch den Constraint MAX(EXPL) sanktioniert wird; vgl. (3-159).
Christoph Gabriel
238
zusätzliches Material benötigt. Aus ein und derselben Numeration N resultieren hingegen jeweils die folgenden Satzpaare, wobei es sich bei (3-145.a') und (3-145.c') um durch p-movement hergeleitete Varianten der jeweils zuvor angegebenen Strukturen handelt. (3-145) a. sp. a.' b. b.' c. c.'
(Kontext: 'Wer hat die Zeitung gekauft?') f\MaRIa\f comprö el diario Comprö el diario ¥[MaRla]¥ p[MaRIa]f lo comprö Lo comprö f[MaRla]f (Kontext: 'Was hat Maria ihrem Bruder gegeben?') Maria le dio F[un DIArio]f a su hermano Maria le dio a su hermano F[un D/Ario]F
Als Input für die in (3-145) angeführten Beispiele setze ich die nachfolgend skizzierten Baumstrukturen an, die jeweils mit den entsprechenden informationsstrukturellen Merkmalen versehen sind. (3-145)
a
-
TP
Spec.TP [EPP]
Spec,vP r[Maria] F
b"
V+v comprò
V temprò
DP el diario
TP Spec.TP [EPP]
P [a su hermano [«le]]
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
239
Ausgehend von diesen Grundstrukturen erzeugt der Generator (GEN) potenziell mögliche Stellungsabfolgen, d.h. es werden für eine vorliegende vPStruktur, deren einzelne Knoten durch informationsstrukturelle Merkmale spezifiziert sind, alle Möglichkeiten an Bewegungsoperationen durchgespielt, die von den Prinzipien der Kernsyntax (Bewegung einer Kategorie nach Spec,TP zur Löschung von EPP) und der O-Syntax (Realisierung von kettenfremdem Material unter T) abgedeckt sind. Dies bedeutet, dass der Generator außer den in (3-145.a/a', b/b' und c/c') angeführten Varianten, die im Korpus belegt sind bzw. von den Versuchspersonen im entsprechenden Kontext als grammatisch bewertet wurden, auch weitere Kandidaten erstellt, die dann im Rahmen des Evaluationsprozesses ausgeschlossen werden müssen. So kann beispielsweise aus der in (3-145.c") skizzierten Struktur neben den in (3-145.c/c') angegebenen Varianten auch die Abfolge mit Endposition des Subjekts hergeleitet werden: proExpi le dio dun DIArio]E a su hermano María. 116 Diese í»-syntaktisch erzeugte Struktur (Realisierung von kettenfremdem Material unter T; hier angezeigt durch Unterstreichung) verliert zwar im Rahmen des Evaluationsprozesses gegen die zuerst genannten Varianten, doch ist sie zunächst in gleicher Weise wie diese Bestandteil der zu evaluierenden Kandidatenmenge. Die von GEN erzeugten Stellungsvarianten können wiederum jeweils mit unterschiedlichen prosodischen Konturen verbunden sein, d.h. sie unterscheiden sich in Bezug auf Nuklearakzentzuweisung, prosodische Gliederung (Einteilung in IP und ip) und/oder eventuelle Deakzentuierung. Die Adäquatheit der prosodischen Gestaltung richtet sich insbesondere nach der jeweils intendierten FHG, d.h. sie ist abhängig von den im Input spezifizierten informationsstrukturellen Merkmalen: So wird beispielsweise ein kontrastiv fokussiertes Element durch einen besonderen Akzentton - in standardnahen Varietäten ist dies /LH*/, im porfeño-Spanischen ein eventuell durch erhöhten FO-Wert und frühe silbeninterne Alignierung spezifizierter Hochton /H*/; vgl. Abschnitt 3.2.3 und Gabriel (2006) - und eine anschließende intermediäre Grenze (tiefer Phrasenton L-) markiert; die Begrenzung des präsupponierten Materials erfolgt hingegen durch einen hohen Phrasenton H- (vgl. Abschnitt 3.2.2). Im Rahmen der Evaluation wird bewertet, ob tonale Einheiten mit den für die jeweilige intendierte informationsstrukturelle Gliederung adäquaten Ankerpunkten (Silben bzw. prosodische Grenzen) assoziieren. Eine Beschränkung, die derartige Zuordnungen bewertet, ist z.B. der am Schluss des letzten Abschnitts eingeführte Constraint STRESSFOCUS (SF). Weiterhin sind hier bestimmte Alignmentconstraints relevant, die sich auf die Übereinstimmung
116
Man beachte, dass der Generator Zugriff auf das noch in der Numeration N befindliche, aber noch nicht verkettete Expletivum proE%r,i haben muss.
Christoph Gabriel
240
zwischen unterschiedlichen Ebenen beziehen; vgl. die bereits definierten Beschränkungen ALIGNFOCSYLL (Übereinstimmung der Ränder der Fokusdomäne mit Silbengrenzen) und ALIGNFOC (Übereinstimmung des rechten Randes der Fokusdomäne mit dem rechten Satzrand und damit der Intonationsphrase IP). Welche Constraints brauchen wir darüber hinaus für die Bewertung der durch den Generator erstellten Kandidaten? Die zentralen syntaktischen Constraints STAY und EPP, mit denen nahezu alle neueren optimalitätstheoretischen Arbeiten operieren, lassen sich unmittelbar auf die Vorgaben der derivationellen Syntaxtheorie zurückführen. Während das von Grimshaw (1997: 374) vorgeschlagene 'Bewegungsverbot' STAY auf den minimalistischen Grundprinzipen derivationeller Ökonomie begründet ist, geht die Forderung nach einem Subjekt, wie sie u.a. Samek-Lodovici (2004) als Constraint formuliert, unmittelbar auf Chomskys (1982) Erweitertes Projektionsprinzip zurück (vgl. Abschnitt 3.1.2.2). (3-146) a. b.
STAY: Keine Bewegung. EPP: „Clauses have subjects" (Samek-Lodovici 2004: 8).
Mit Blick auf die bisher getroffenen Entscheidungen bezüglich der Modellierung des Spanischen ist es allerdings notwendig, die Formulierung der in (3-146) genannten Beschränkungen zu modifizieren. So muss bei STAY zwischen zwei Typen von Bewegungen unterschieden werden, was eine Aufspaltung dieser Beschränkung in zwei Teil-Constraints, hier bezeichnet als *COPY und STAY-®, mit sich bringt. *COPY bezieht sich auf die syntaktischen Bewegungen im eigentlichen Sinne und sanktioniert die hierbei in den Ausgangspositionen verbleibenden Kopien der bewegten Kategorien (vgl. 3-147.a). Der zweite 'bewegungsverhindernde' Constraint, STAY-®, betrifft die in Abschnitt 3.1.5 als '-syntaktische' Bewegungsoperationen charakterisierten Fälle von p-movement und verbietet die Realisierung von phonetischem Material, das nicht zu einer bestimmten Kette gehört, in einer von dieser Kette determinierten Position. Ein Verstoß gegen STAY-® liegt beispielsweise im Fall von (3-145.a') Comprö el diario [MaRIa] vor, da hierbei unter der Kopfposition der verbalen Kette (T) nicht nur das phonetische Material der Verbform comprö (Stamm + Affixe), sondern mit der Objekt-DP [el diario] auch kettenfremdes Material realisiert wird (für eine entsprechende Darstellung im Strukturbaum vgl. 3-87). (3-147) a. b.
Aufspaltung der Beschränkung STAY *COPY: Keine Kopien. STAY-: Kein kettenfremdes Material.
J. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
241
Bei STAY-3» sind mehrfache Verletzungen möglich. Da es bei Strukturen, die durch p-movement hergeleitet werden, offensichtlich eine Korrelation zwischen der Menge an kettenfremdem Material und der Akzeptanz der betreffenden Outputform durch die Sprecher gibt, wird kettenfremdes Material pro Silbe mit einer Verletzung gewertet. Auf diese Weise lässt sich beispielsweise motivieren, dass die Subjektendstellung bei einem dreiwertigen Verb i.d.R. als weniger akzeptabel aufgefasst wird als bei einem zweiwertigen. Da ich annehme, dass das im finiten T-Kopf situierte EPP-Merkmal nicht nur durch Subjektkonstituenten (volle DPn oder pro), sondern auch durch Elemente von anderem syntaktischen Status und durch pro Exp i gelöscht werden kann, ist der Constraint EPP wie folgt umzuformulieren. (3-148)
EPP: Der Spezifikator des höchsten funktionalen Kopfes des T-Bereichs ist overt, durch pro oder durch pw E x p i gefüllt.
Geht man mit Eguren / Fernández Soriano (2004: 324) davon aus, dass bei Konstruktionen mit postverbalen Subjekten das EPP-Merkmal durch pro Expl gelöscht wird (vgl. Abschnitt 3.1.2.1), dann liegt bei Compra el diario [MaRla] keine EPP-Verletzung vor." 7 Allerdings verstoßen Konstruktionen, die Expletiva enthalten, gegen den von Grimshaw (1997) eingeführten Constraint FULLINT: ,,[E]xpletives are normal lexical items, but with a lexical conceptual structure which is at least partially unparsed" (Grimshaw/Samek-Lodovici 1998: 203). (3-149)
FULLINT (Füll Interpretation): „Parse lexical conceptual structure. Failed by expletives and auxiliary do" (Grimshaw/Samek-Lodovici 1998: 194).
Die hier zugrunde liegende Idee, die ich für meine Arbeit übernehme, lässt sich wie folgt umreißen. Expletiva wie z.B. fr. il oder das entsprechende phonetisch leere Pendant des Spanischen sind insofern problematisch, als hierbei das konzeptuelle Potenzial der jeweiligen Form nicht ausgeschöpft wird: So fungiert pro, wenn es durch eine entsprechende Kategorie gemäß Bindungsprinzip B gebunden wird und damit einen referenziellen Wert erhält, als (phonetisch leeres) Subjekt und dient mit seinen . . . N/[i] > ... N/[n] > ... N/[t] > Onset: 0/[t] > . . . 0/[m] > ... 0/[i] > ... 0/[a] > ... Constraint-Ausrichtung Nukleus: *N/[tJ » ... *N/[n] » ... *N/[i] » .. *N/[a] Onset: *0/[a] » ... *0/[i] » ... *0/[m] » .. ,*0/[t]
Die Constraint-Ausrichtung in (3-151 .b) besagt, dass das Verbot von stimmlosen Plosiven wie [t] im Nukleus immer höher angesiedelt ist als etwa das Verbot von Nasalkonsonanten in derselben Position. Umgekehrt ist das Verbot
J. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
243
von offenen Vokalen im Onset übereinzelsprachlich höher angesetzt als das Verbot von Nasalen etc. Einzelsprachliche Variation entsteht dann dadurch, dass andere Beschränkungen an verschiedenen Stellen in die von der Harmonischen Ausrichtung vorgegebene Hierarchie intervenieren. Gutiérrez Bravo hat diese Methode in Anlehnung an Aissen (1999) auf die Syntax übertragen und eine thetarollenspezifische Skala für die Besetzung der präverbalen Position aufgestellt. Diese besagt, dass „agents are more prominent than both experiencers and themes, and experiencers are in turn more prominent than themes" (2002a: 122; Hervorhebung original). Es kann also gesagt werden, dass in der Subjektposition vorzugsweise eine Konstituente mit der Thetarolle auftritt. Ist kein Agens vorhanden, sondern wie etwa bei (3-79.i) A Juan le encantan las óperas de Donizetti ein Thema und ein Experiencer, dann erscheint diejenige XP, die Trägerin der Thetarolle ist, in der präverbalen Position Spec,TP, und zwar unabhängig von der jeweiligen Kasusmarkierung (das doppelnde Klitikon le zeigt an, dass es sich um eine dativische Konstituente handelt). Dies lässt sich wie folgt in Form von Constraints fassen: (3-152) a. b. c.
*Spec,TP/THEMA: Keine XP mit der Thetarolle in Spec,TP. *Spec,TP/ExPER: Keine XP mit der Thetarolle in Spec,TP. *Spec,TP/AGENS: Keine XP mit der Thetarolle in Spec,TP.
Entsprechend der thematischen Hierarchie ist für die uns betreffenden Constraints das folgende Ranking anzunehmen: (3-153)
*Spec,TP/THEMA » *Spec,TP/ExPER » *Spec,TP/AGENS (nach Gutiérrez Bravo 2002a: 133)
Eine noch offene Frage ist der Umgang mit der foco antepuesto-Konstruktion, die dadurch gekennzeichnet ist, dass eine Konstituente, die das Merkmal [Foc] aufweist, also ein kontrastiv fokussiertes Element beinhaltet, in der präverbalen Position Spec,TP platziert ist. Auch dies ist vom grammatischen Status der betreffenden XP unabhängig. Nimmt man nun einen Constraint an, der die Platzierung kontrastiv fokussierter Konstituenten in Spec,TP erzwingt (vgl. 3-154), dann verletzen alle Konstruktionen, die eine vorangestellte Fokuskonstituente aufweisen, diese Beschränkung nicht:
244
Christoph (3-154)
Spec,TP/Foc: [ X P . . .
( F o c ] X/Y]
Gabriel
in Spec.TP. 118
Es sei betont, dass sich der Constraint Spec,TP/Foc dezidiert auf kontrastiv fokussiertes Material bezieht und die nicht-kontrastive Fokussierung einer Konstituente in situ keine entsprechende Verletzung mit sich bringt. Andernfalls müsste man beispielsweise im Fall von María F[compró un diario]F (Kontext: 'Was hat Maria gemacht?') die Bewegung der gesamten vP nach Spec,TP erwarten. Nun ist es aber so, dass Fokusvoranstellung nicht obligatorisch auftritt, sondern lediglich eine Option neben der prosodischen Fokusmarkierung in situ darstellt, vgl.: (3-155)
(Kontext: 'Maria hat doch ein Rätselheft gekauft, oder?') a.
María compró
b.
Un F[FOC DlArio]f
un
flfocDIArio]^ compró
María
Während die Abfolge in (3-155.a) gegen Spec,TP/Foc verstößt, verletzt die in (3-155.b) gegebene Variante den in der Hierarchie hoch angesiedelten Constraint *Spec,TP/THEMA. Es muss also angenommen werden, dass Spec,TP/ Foc bei denjenigen Sprechern, die eine foco antepuesto-Konstruktion realisierten, einen hohen Stellenwert hat. Die entsprechende Hierarchie ist in (3-156) gegeben. (3-156)
S p e c , T P / F o c » *Spec,TP/THEMA » *Spec,TP/AGENS
Schließlich benötigen wir einen Constraint, der ausschließt, dass das Subjekt bei neutraler Lesart in der postverbalen Basisposition verbleibt, wenn zusätzlich hierzu ein als volle DP realisiertes Argument vorliegt. In diesen Fällen erfolgt die Löschung des EPP-Merkmals durch die Anhebung des Subjekts nach Spec,TP;119 vgl. die folgende Gegenüberstellung in (3-157). Bewegungen sind hier unabhängig davon, ob es sich um kernsyntaktische oder phonologische Operationen handelt, mittels Durchstreichung gekennzeichnet. (3-157)
1,8
119
(Kontext: 'Was ist passiert?') T E P P [ v P Maria compró
a.
[ T p María compró
b.
* [TP proEXPI compró T E P P [ v p Maria compró
un un
diario] diario]
Man beachte, dass auch im Deutschen kontrastiv fokussierte XPn in der Vorfeldposition auftreten können, vgl.: Eine [Foc ZEltung] hat Maria gekauft (und nicht etwa ein Rätselheft). Der entsprechende Constraint wäre demnach in Bezug auf die Position Spec,CP umzuformulieren. Dies gilt selbstverständlich nur für Dialekte, in denen V S O im Sinne einer neutralen Abfolge keine Rolle spielt; vgl. hierzu meine Ausführungen in Abschnitt 3.1.4.
3. Theoretischer Hintergrund, Forschungsüberblick
und
Modellbildung
245
Ich setze hierfür tentativ eine Beschränkung an, welche die vP-interne Realisierung des Subjekts gemeinsam mit einem anderen Argument blockiert: (3-158)
*[VPSUBJ . . . ARG]
Die Stellungsvariante (3-157.b) * Compró María un diario lässt sich auf diese Weise als ungrammatisch ausschließen, da sie - anders als die SVO-Variante in (3-157.a) - u.a. gegen die Constraints *[ V P SUBJ . . . ARG] und FULLINT verstößt. Dagegen stellt (3-157.a) eine Verletzung von M A X - I O dar, und zwar insofern, als hierbei das in der Numeration N präsente Expletivum pro£Xpi nicht in der Outputform vertreten ist, also nicht 'geparst' wird. Hierzu benötigen wir schließlich eine Aufspaltung des MAX-Constraint: (3-159) a.
MAX-IO: Inputsegmente werden im Output repräsentiert.
b.
MAX(EXPL): Im Input enthaltene Expletiva werden im Output repräsentiert.
Eine solche Verletzung wiegt aber nicht allzu schwer, weil M A X ( E X P L ) in der Hierarchie der Beschränkungen vergleichsweise tief anzusiedeln ist. Abschließend wird anhand eines konkreten Beispiels gezeigt, wie eine optimalitätstheoretische Evaluation im Einzelnen verläuft. Betrachten wir hierzu die beiden Stellungsvarianten (3-145.a/a') ; hier wiederholt als (3-160) und ergänzt durch einen weiteren Kandidaten, der sich von (3-145.a) durch den abweichend platzierten Nuklearakzent unterscheidet (als Input dient die oben in 3-145.a" skizzierte Struktur). Zur besseren Orientierung ordne ich die einzelnen Kategorien durch tabellarische Versetzung den jeweiligen syntaktischen Positionen zu, in denen die Realisierung durch die Phonologische Komponente O erfolgt; die jeweiligen Basispositionen werden aus Gründen der Übersichtlichkeit nicht verzeichnet. (3-160)
(Kontext: 'Wer hat die Zeitung gekauft?') [TP
T
y[MaRIa\r
comprö
b.
pro Exp i
comprö
c.
f \Maria\f
comprö
a.
sp.
[vp
[vp
] el
el diario
diario
F[MaRIa\f
el
DIArio
Während die Kandidaten (3-160.a) und (3-160.c) gegen ALIGNFOC verstoßen, liegt im Fall von (3-160.b) eine Verletzung von FULLINT vor, weil hier die EPP-Löschung durch ein Expletivum erfolgt. Kandidat (3-160.c) verstößt zudem gegen den in der Hierarchie undominierten Constraint SF und fällt somit als erster heraus. Da im hier angenommenen Ranking FULLINT von ALIGNFOC dominiert wird, gewinnt die Abfolge mit dem postverbalen Sub-
246
Christoph Gabriel
jekt. Die vierfache Verletzung von STAY-4» ist hier unerheblich, da der entsprechende Constraint hierarchisch tief angeordnet ist.120 (3-161)
Tableau: Comprö el diario SF
T[MaRIa\r
ALIGN
FULLINT
STAY-O
Foc Comprò el diario
MAX (EXPL)
*
****
f\MüRia\y
f\MaRIä\f el diario
comprò
f[Maria]p compro el DI Ario
*
*!
*
*!
Bei umgekehrter Anordnung von ALIGNFOC und FULLINT gewinnt hingegen die Abfolge mit dem fokussierten Subjekt in Initialposition: (3-162)
Tableau: y\MaRia}¥comprö SF
el
diario
FULLINT
ALIGN
STAY-O
FOC
Compro el diario F[MaRÌa]f f\MaRla]r el diario
f\Maria]f comprò el DIArio
****
*!
comprò
*
*!
*
MAX (EXPL)
*
*
Die Variation zwischen den beiden Stellungsabfolgen in (3-160.a) und (3-160.b) lässt sich also durch unterschiedliche Anordnungen der Constraints modellieren und wird folglich unterschiedlichen Grammatiken zugeordnet. Nur eine Abfolge kann jeweils als Sieger aus der Evaluation hervorgehen, womit es sich um einen Fall von Pseudo-Optionalität handelt. Eine weitere, ebenfalls bereits erwähnte Möglichkeit ist die Annahme, dass Sprecher, die bei Subjektfokussierung auf die Abfolge F [ S ] F V O zurückgreifen, die neutral fokussierte Konstituente hier so behandeln, als sei diese kontrastiv fokussiert. Entsprechend müsste dann auch im Input eine andere Disposition informationsstruktureller Merkmale vorliegen, und wir hätten es auch hier mit PseudoOptionalität zu tun, da ein abweichender Input und eine andere Kandidaten120
Eine andere Modellierung mit einem hiervon geringfügig abweichenden Ranking wird in Gabriel (2007) durchgespielt. Zentraler Gedanke ist jedoch stets, dass die hierarchische Position von A L I G N F O C bestimmt, in welchem Maße Strukturen mit nicht-finalem Fokus zugelassen sind.
247
5. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
menge Basis der Evaluation wären. Spielen wir die Variante trotzdem durch und betrachten zunächst das entsprechende Tableau für die subjektinitiale Abfolge. (3-163)
Tableau: F[F[)C MaRÎa]F comprö
el
diario
Spec, TP/ Foc *s" FIFOC MaRla\f el diario
FULLINT
comprö
Comprö el diario
MAX
Foc
(EXPL)
*
*
*
*!
F[FlK MaRÎa\r
ALIGN
Die Struktur mit finalem Subjekt lässt sich herleiten, wenn ALIGNFOC einen höheren Rang in der Hierarchie einnimmt: (3-164)
Tableau: Comprö
el diario
F[Foc
MaRIa]F
ALIGNFOC
Spec,TP/ Foc
FULL
MAX
INTON
(EXPL)
ATION F1f™ MaRIa]? comprö el diario
W Comprö el diario F[Foc MaRfa]r
*!
*
*
*
Wir müssten also auch in einer solchen Sichtweise davon ausgehen, dass zwei verschiedene Grammatiken vorliegen, die beispielsweise bestimmten Sprachregistern zugeordnet werden könnten. Damit ist ausgeschlossen, dass ein und derselbe Sprecher beide Konstruktionen nebeneinander verwendet, ohne dass er sich einer anderen Grammatik bedient. In Kapitel 4 wird in Zusammenhang mit der Auswertung des erhobenen Datenmaterials deutlich werden, dass eine solche Konzeption unbefriedigend ist. Allerdings liegen im optimalitätstheoretischen Rahmen Vorschläge für die Modellierung von freier Variation vor, die darauf abzielen, die genannte Problematik zu vermeiden und stattdessen Optionalität als integralen Bestandteil der Grammatik zu fassen. Im folgenden Abschnitt gebe ich eine kurze Übersicht über die entsprechenden Herangehensweisen. 3.3.2 Zur Modellierung von Sprachvariation in OT Einer der ersten Versuche, Optionalität in das optimalitätstheoretische Modell zu integrieren, stammt von Reynolds/Nagy (1994). Die Autoren nehmen an,
248
Christoph
Gabriel
dass einer oder mehrere Constraints in Bezug auf die Position in einer ansonsten festen Hierarchie beweglich sind. Solche sog. floating constraints - im folgenden Schema Constraint F - können demnach in der Anordnung der Beschränkungen an unterschiedlichen Stellen intervenieren. Dies lässt sich wie in (3-165) skizzieren: (3-165)
Variables Ranking mit einem floating constraint (F)
A
»
_
..
E
Aus einer derart konzipierten Grammatik lassen sich unterschiedliche Rankings ableiten, wobei wiederum jede dieser Hierarchien einen anderen Kandidaten favorisiert. (3-166) a. b. c.
Mögliche Rankings aus (3-165) A»B»F »C»D»E A»B»C»F»D»E A»B»C»D»F»E
Das hier skizzierte Modell lässt sich nun wie folgt auf die zum Schluss des letzten Abschnitts diskutierte Problematik anwenden: Definiert man nun die Beschränkung ALIGNFOC als einen floating constraint, der bezüglich seiner Position in der Hierarchie variabel ist, lassen sich die in den Tableaux (3-161) bzw. (3-162) exemplifizierten Rankings problemlos aus ein und derselben Grammatik ableiten. Gleiches gilt für die unterschiedliche Anordnung von Spec,TP/Foc,
FULLINT
und
ALIGNFOC in den
Tableaux
(3-163)
bzw.
(3-164).121 Auf diese Weise gelingt es zwar, Optionalität in die Grammatik zu integrieren, jedoch liegen keinerlei Mittel vor, um auszudrücken, dass eine der beiden Varianten mit höherer Wahrscheinlichkeit auftritt als die andere. Hält man sich jedoch vor Augen, dass die Sprecher sowohl bei neutraler als auch bei kontrastiver Lesart die Variante mit satzinitialem Subjekt eindeutig bevorzugen (vgl. die Beispiele 2-46 und 2-47 in Abschnitt 2.2.2 sowie die in Abschnitt 4.3.3 präsentierten Daten), dann erscheint es wünschenswert, diese 121
Eine prinzipiell vergleichbare Modellierung legt auch Oostendorp (1997) für die französische liaison vor. Der Autor schlägt vor, eine Beschränkung, die das Erscheinen von /¿aiion-Konsonanten an der Oberfläche erzwingt, zwischen verschiedenen Alignmentconstraints variabel anzuordnen. Anders als im Modell der 'schwimmenden Beschränkungen' nach Reynolds/Nagy (1994) werden hier jedoch unterschiedliche Registergrammatiken angenommen.
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung
249
deutliche Präferenz zugunsten einer Variante auch in der Constraint-Anordnung zum Ausdruck zu bringen. Ein Modell wie das der floating constraints ermöglicht dies nicht. Ein weiteres Problem der 'schwimmenden Beschränkungen' liegt darin, dass die Modellierung eines komplexeren Sachverhalts meist nicht mit einem solchen beweglichen Constraint auskommt; stattdessen ist man i.d.R. gezwungen, mehrere Beschränkungen als floater zu definieren und 'Schwimmbewegungen' in beide Richtungen zuzulassen. Für eine Diskussion dieser Problematik anhand der französischen h aspire-Wörter vgl. Gabriel/Meisenburg (2007). Ein weiterer Vorschlag, im optimalitätstheoretischen Rahmen mit Optionalität umzugehen, stammt von Anttila (1997, 2002, 2007), der sich auf der Basis einer umfassenden Korpusanalyse mit der Bildung der Pluralformen des finnischen Genitivs auseinandergesetzt hat.122 Anttila schlägt ein Modell mit sog. stratified grammars vor, wobei sich innerhalb einer ansonsten festen Anordnung eine oder mehrere Schichten mit hierarchisch untereinander nicht geordneten Constraints befinden können. Nimmt man beispielsweise an, dass eine Grammatik ein solches Stratum aufweist, in dem sich drei untereinander nicht geordnete Beschränkungen A, B und C befinden, dann lassen sich hieraus insgesamt sechs verschiedene Tableaux ableiten (vgl. 3-168). Wenn man auf dieser Basis zwei (hypothetische) Kandidaten 1 und 2 evaluiert, wobei Kandidat 1 gegen die Constraints A und B verstößt, Kandidat 2 hingegen nur Constraint C verletzt, dann ergibt sich in Bezug auf das Vorkommen der beiden Kandidaten eine Wahrscheinlichkeit von zwei zu einem Drittel: Kandidat 2 geht bei 4 von 6 Tableaux als Sieger hervor, Kandidat 1 hingegen nur in 2 Fällen. (3-167)
Variables R a n k i n g D
(3-168)
122
»
Stratum { A , B, C }
M ö g l i c h e R a n k i n g s aus ( 3 - 1 6 7 ) a.
D » A
» B
b.
D » A
c.
D » B
» C » A
» C » B » C
» E » E » E
—»
Sieger: Sieger:
—>
Sieger:
Im Finnischen kann der Genitiv Plural mit zwei verschiedenen Suffixen gebildet werden, wobei eine sog. schwache Endung (/-ien/ oder /-jen/) von einer starken (/-¡den/) unterschieden wird. Wird bei Einsilbern durchgehend die starke Form gewählt (z.B. finn. puu ' B a u m ' ( p u i d e n ) , tritt bei mehr als dreisilbigen Wörtern in großem Maße Variation auf. So tritt in Anttilas Korpus bei finn. naapuri 'Nachbar' in 37,2 % der Fälle die Form naapureiden auf, während die 'schwache' Variante naapurien einen Vorkommenswert von 62,8 % aufweist (vgl. Anttila 2002).
250
Christoph Gabriel
d. e. f.
D » B D » C D » C
» C » A » B
» A » B » A
» E » E » E
—> —> —»
Sieger: Kandidat 2 Sieger: Kandidat 1 Sieger: Kandidat 1
Je mehr Beschränkungen sich in einem solchen Stratum befinden, umso höher ist die Anzahl der Tableaux, die sich aus der entsprechenden Grammatik ableiten lassen: Drei ungeordnete Constraints ergeben 6 mögliche Hierarchien, vier ungeordnete Constraints bereits 24, etc. Von der Anzahl der ableitbaren Rankings hängt dann auch die potenzielle Grob- oder Feinkörnigkeit der Vorhersagen in Bezug auf das Vorkommen einer bestimmten Outputform ab: Handelt es sich beispielsweise wie in ( 3 - 1 6 7 ) um ein Stratum mit drei Constraints, dann können, wenn andere Verletzungen durch die Kandidaten vorliegen, außer der in ( 3 - 1 6 8 ) skizzierten Voraussage ( 6 7 % zugunsten von Kandidat 2; 33 % zugunsten von Kandidat 1) auch andere Prognosen resultieren. Möglich sind aber nur Zahlenverhältnisse, die jeweils dem Vielfachen eines Sechstels entsprechen, d.h. 1/6 zu 5/6 (d.h. 16,7 % zu 82,3 %), 2/6 zu 4/6 (d.h. 33 % zu 67 %), 3/6 zu 3/6 (d.h. 50 % zu 50 %), etc. Da das Raster bei zunehmender Anzahl von ungeordneten Beschränkungen 'feinkörniger' wird, steigt hiermit gewissermaßen auch die Wahrscheinlichkeit, dass sich entsprechend gemachte Vorhersagen mit den aus Korpusauszählungen resultierenden Vorkommenswerten decken (vgl. Anttila 1 9 9 7 ) . Konzeptuell problematisch ist jedoch, dass alle auf dieser Basis getroffenen Voraussagen auf arithmetischen Verhältnissen beruhen, die konkreten Vorkommenswerte der betreffenden Formen jedoch nicht einbezogen werden können. Appliziert man das Modell auf die variable Abfolge der Beschränkungen und FULLINT, wie sie sich in den Tableaux ( 3 - 1 6 1 ) bzw. ( 3 - 1 6 2 ) manifestiert, dann resultiert hieraus ein Stratum, das zwei nicht geordnete Constraints beinhaltet: ALIGNFOC
(3-169)
Stratum SF cir
ALIGN
Foc
Compro el diario
FULL INT
STAVO
*
****
MAX (['AH 1
?[MaRÌa]f
r[MaRla]f comprò el diario f[Maria]f comprò el DIArio
*\
*!
*
*
#
3. Theoretischer Hintergrund, Forschungsüberblick und Modellbildung SF
251
FULL
ALIGN
INT
Foe
Comprò el diario f\MaRÌa\f
}\Mari(i\y comprò el DI A rio
#>
MAX (EXPL)
****
*!
r\M(iRla]r compro el diario
STAY-