210 20 3MB
German Pages 256 Year 2014
Scrambling ohne Informationsstruktur?
studia grammatica 77
Herausgegeben von Manfred Bierwisch, Hans-Martin Gärtner und Manfred Krifka unter Mitwirkung von Regine Eckardt (Göttingen), Paul Kiparsky (Stanford)
Volker Struckmeier
Scrambling ohne Informationsstruktur?
Prosodische, semantische und syntaktische Faktoren der deutschen Wortstellung
DE GRUYTER
ISBN 978-3-11-034757-9 e-ISBN 978-3-11-034771-5
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2014 Akademie Verlag GmbH, Berlin Ein Unternehmen von De Gruyter ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com
Inhalt
Vorwort: Für eine komplexe grammatische Architektur zur Repräsentation von Scrambling 11 Einführung: Scrambling und monokausale Erklärungen
14
I
Empirische Eigenschaften von Scrambling im Deutschen
1
Zur allgemeinen Struktur des deutschen Satzes
2
Basisabfolge der Argumente und Restriktionen über Umstellungen der Basisabfolge 21
II
Technische Repräsentationen: core syntax
3 3.1 3.2
29 Theoretische Grundannahmen der vorliegenden Analyse Grammatiken und ‘Universaltheorien’ der Sprache 29 A- und A‘-Bewegungen der Government and Binding-Theorie erklären Scrambling nicht 30 Scrambling (und object shift) sind nicht als A- bzw. A‘-Bewegungen beschreibbar 31 A/A‘-Bewegungen: Wechselnde Definitionen in älteren Theorieformen 34 Wegfall der SpecHead-Relation und merkmalsgetriebener Bewegungen 34 Der A/A‘-Unterscheidung fehlt die empirische Grundlage 36 PF-Bewegungen erfassen syntaktische und semantische Merkmale von Scrambling nicht 39 Scrambling ist syntaktisch, nicht phonologisch restringiert 40
3.2.1 3.2.1.1 3.2.1.2 3.2.1.3 3.2.2 3.2.2.1
19
6
Inhalt
3.2.2.2 3.2.3 3.2.3.1 3.2.3.2 3.3 3.3.1 3.3.2 3.3.2.1 3.3.2.2 3.3.3
Semantische Effekte von Scrambling verbieten eine PF-Analyse 40 Basisgenerierung erfasst die Markiertheit syntaktischer Bildungen nicht ausreichend 42 Basisgenerierungsansätze erklären die Unmarkiertheit der Basisabfolge nicht 42 Basisgenerierung erklärt besondere Skopuseigenschaften der Basisabfolge nicht 45 Theoretische Annahmen im Rahmen dieser Arbeit 46 Für die vorliegende Analyse relevante syntaktische Operationen 47 Illustration der syntaktischen Operationen: Eine Beispielderivation 48 Nicht mögliche Derivationen führen zum crash 49 Mögliche Derivation konvergiert 51 Prosodie und Informationsstruktur in der vorliegenden Analyse 55
4.4.1 4.4.2 4.4.3 4.4.4 4.5 4.5.1 4.5.2 4.5.3
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen 60 Zum theoretischen Status von SpecHead 61 [Antifokus]-Merkmale 61 [Topik]-Merkmale 67 Basale Topik-Kommentar-Differenzen als Scrambling-Auslöser 74 Informational Separation 75 Semantic Subjects 76 Addresses 77 Frames 77 Andere semantische Faktoren 79 Generizität 79 Telizität 80 Links und ähnliche Konzepte 81
5 5.1 5.2
83 Analysen von Scrambling durch formale Bewegungsoperationen Scrambling als EF-getriebenes, optionales internal merge 83 Andere formale Auslöser von Scrambling 85
6
Obligatorische Bewegungen als Ursache von Stellungsoptionen: vP-TP-Bewegungen als zweite Scrambling-Operation 89
4 4.1 4.2 4.3 4.4
Inhalt
7 7.1 7.2 7.2.1 7.2.1.1 7.2.1.2 7.2.1.3 7.2.2 7.2.2.1 7.2.2.2 7.2.2.3
7
Distributed Deletion als Auswahl von Kopien bewegter Elemente 94 Möglichkeit der verteilten Tilgung 94 Restriktionen zur verteilten Tilgung der vP in SpecTP 97 Die Ausgabe der Kernsyntax ermöglicht Distributed Deletion 98 An den Grenzen der vP-TP-Definition: Scrambling über Subjekte? 98 Die vP-Bewegung erfasst auch informationsstrukturell markierte Elemente 105 Nominativische Argumente werden nicht zwangsweise umgestellt 105 PF-relevante Eigenschaften entscheiden über Abfolgen 107 Fokusexponenten werden in tiefer vP ausbuchstabiert 108 Kontrastive Topiks können in hoher vP-Kopie auftreten 112 [Definit] als Lizenz zum hohen Spellout 116
119 Mögliche technische Probleme der Analyse Sind die Voraussetzungen für Distributed Deletion stets gegeben? 119 8.2 Verletzt die Analyse Freezing-Generalisierungen? 121 8.3 Verletzt die Analyse der Partikeln den Head Movement Constraint? 125 8.4 Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus? 126 8.4.1 Vermeidung von Antilokalität: Der Ansatz 127 8.4.2 Partikeln als Teil der funktionalen Kaskade des Deutschen 127 8.4.2.1 Partikeln: Diachrone und synchrone Eigenschaften 129 8.4.2.2 Partikeln weisen keine homogenen Adverbeigenschaften auf 130 8.4.2.2.1 Partikeln unterscheiden sich distributionell von Adverbien 130 8.4.2.2.2 Modalpartikeln unterscheiden sich semantisch von Adverbien 133 8.4.2.3 Modalpartikeln als tiefste Bestandteile der C-Kaskade 134 8.4.2.3.1 Zur Distribution: Partikeln zwischen vP und T 135 8.4.2.3.2 Distribution 2: Antwortpartikeln als C-Elemente 136 8.4.2.3.3 Modalpartikeln – Bestandteil der Satztypmerkmale? 137 8.4.2.3.4 Vergleich der Analysen: Modalpartikeln als C oder AdvP 142 8.5 Kompatibilität zu alten Annahmen: Ist die Analyse LCA-konform? 147 8.5.1 Das LCA ist theoretisch obsolet und empirisch fragwürdig 148 8.5.2 Skizze einer LCA-kompatiblen Satzstruktur mit vP-TP-Bewegung 149 8 8.1
8
Inhalt
8.6 8.7 8.7.1 8.7.2 8.7.2.1 8.7.2.2 8.7.3 8.7.3.1 8.7.3.2 8.8 8.8.1 8.8.1.1 8.8.1.2 8.8.1.3 8.8.2
Kompatibilität zu zukünftigen theoretischen Entwicklungen: vP-TP-Bewegung ohne SpecT? 151 Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert 155 Ähnliche Analysen verwenden ähnliche Techniken 156 Blockhafte Syntax und PF-Einflüsse sind typische Eigenschaften germanischer Sprachen 158 Niederländisches Scrambling 160 Object shift 163 Sind auch typologische Unterschiede mithilfe von vP-TP-Bewegungen erklärbar? 167 Keine Superiorität im Deutschen: Hohe vP umgeht die PIC? 167 Keine vP-TP-Bewegung im Englischen – fehlen die Partikeln? 171 Allgemein-methodische Einwände 175 Die Analyse übergeneriert nicht in offensichtlicher Form 176 Einstellige Prädikate 176 Zweistellige Prädikate 176 Dreistellige Prädikate 177 Die Analyse untergeneriert nicht in nennenswerter Form – und ist erweiterbar 179
III
Die Evidenz: Eigenschaften und empirische Vorhersagen der Analyse
9
Wozu eine weitere generative Analyse?
10
183
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld 184 10.1 Die Position der Foki in der rechten vP-Kopie ist kein Zufall 187 10.2 Die bevorzugte Position der kontrastiven Topiks ist kein Zufall 189 10.3 Diskursneue Elemente können auch im linken Mittelfeld auftreten 190 10.4 Rekonstruktion der (vermeintlichen) Topikbewegung 191 10.4.1 Phonologische Ressourcen der Berechnung der Distributed Deletion 191 10.4.1.1 EoO-Bewegungen in der phonologischen und interpretativen Komponente 193 10.4.1.2 Phonologische Kriterien für die Distributed Deletion der vP 196
Inhalt
10.4.1.2.1 10.4.1.2.2 10.4.2 10.4.2.1 10.4.2.2 10.5 10.5.1 10.5.2
11 11.1 11.2 11.3 12
9
Bessere Akzentdomänen als Faktor für Spellout-Entscheidungen 197 Treten nominativische DPen präferiert im linken Mittelfeld auf? 205 Distribution ‚topikaler‘ Elemente als Performanzphänomen 207 Sprecher bevorzugen die Strukturen, die die Informationsstruktur klarer markieren 208 Produktionspräferenzen als Ursache vermeintlich ‚topikaler‘ Umstellungen 210 Zusammenfassung: Zur Architektur von Syntax und Phonologie 218 Beispiele: Spellout-Szenarien einzelner syntaktischer Strukturen 219 Ein letzter Vergleich: File card-Analysen restringieren Umstellungen zu stark 225
Zur Erklärung der syntaktischen Verhältnisse im Mittelfeld Zur Stellung des Subjekts im linken Mittelfeld 230 Zur Stellung der Pronomina: Klitisierung als phonologischer EoO? 230 Weitere Eigenschaften 231
12.1 12.2 12.3
Zur Erklärung der semantischen Verhältnisse im Mittelfeld des deutschen Satzes 234 Generizitäteffekte und ihr Verhältnis zu anderen Lesarten Skopusoptionen und Bindung 235 Fehlende Skopoi und unmögliche Bindung 236
13
Schlusswort und Ausblick
14
Literatur
244
15
Register
254
238
230
234
Vorwort: Für eine komplexe grammatische Architektur zur Repräsentation von Scrambling Die vorliegende Arbeit analysiert syntaktische, semantische und prosodische Faktoren der Wortstellungsvariation im Mittelfeld des deutschen Satzes. Die Arbeit schlägt als Ergebnis der Untersuchungen eine komplexe grammatische Architektur vor, die die Eigenschaften der syntaktischen Muster (und ihrer phonologischen und semantischen Effekte) zu erklären helfen soll. Als Ursache der relativen Wortstellungsfreiheit des Deutschen wird gemeinhin angenommen, dass diese Sprache über eine Operation (oder eine Gruppe von Operationen) verfügt, die als Scrambling bezeichnet wird. Die mit Scrambling verbundenen Phänomene haben in der Forschungsliteratur zum Deutschen einen festen Platz und es ist vermutlich nicht übertrieben, die Menge der mittlerweile verfügbaren Literatur als unüberschaubar groß zu bezeichnen. Untersucht und vergleicht man aber Arbeiten zum Thema, so stellt man fest, dass viele dieser Ansätze im Grunde nur wenige prinzipiell verschiedene Vorgehensweisen verfolgen – die dann in den verschiedensten Varianten durchgespielt werden. Die vorliegende Arbeit schlägt einen (meines Wissens) neuen Ansatz zum Scrambling im Deutschen vor und argumentiert zugleich, viele ältere Ansätze ganz oder in Teilen aufzugeben. Nötig für die Beschreibung des Scrambling sind meines Erachtens vor allen Dingen: – zum einen Repräsentationen, die die syntaktischen Auslöser von ScramblingBewegungen korrekt erfassen und – zum anderen die Möglichkeit, aussersyntaktische Einflüsse auf die Wortstellungsvariation in einer grammatischen Gesamtarchitektur repräsentieren zu können. Die vorliegende Arbeit schlägt daher einen Ansatz vor, um beide Arten von Einflüssen – zumindest prinzipiell – in eine theoretische Repräsentation einfließen lassen zu können. Damit geht einher, dass die Syntax in ihrem Aufgabenbereich beschnitten wird: Sie kann nicht mehr als ‚Universaltheorie des Satzes‘ gelten, sondern beeinflusst nur noch solche Eigenschaften, die sich mit den derzeit gegebenen theoretischen Mitteln auch tatsächlich syntaktisch beschreiben und erklären lassen. Das heißt ganz konkret, dass informationsstrukturelle Eigenschaften, die bislang als syntaktische Merkmale zentraler Bestandteil vieler syntaktischer Analysen waren, in der vorliegenden Analyse keine Rolle mehr spielen. Die Kernsyntax des Mittelfeldes des deutschen Satzes ist damit – entgegen vieler etablierter Analysen – nicht informationsstrukturell gesteuert. Wie sich zeigt, folgt aus dieser
12
Vorwort
Annahme aber anders herum nicht, dass die Wortstellung des Deutschen nicht durch informationsstrukturelle Prinzipien (mit-) bestimmt sein kann: Diese linearen Abfolgeeigenschaften werden aber nicht ausschließlich in der Syntax selbst bestimmt, sondern in Teilen auch in der Abbildung syntaktischer Strukturen in der phonologischen Komponente der grammatischen Architektur: Die Konstituentenstrukturen, die die Ausgabe der kernsyntaktischen Komponente darstellen, sind in vielfacher Hinsicht unterspezifiziert für Fragen der linearen Wortabfolgen. Dort, wo mehrere Wortfolgen syntaktisch lizensiert sind, trifft die phonologische Komponente Entscheidungen darüber, welche lineare Abfolgen der hierarchischen Konstituentenstruktur zugeordnet werden. Darüber hinaus wird auch dafür argumentiert, dass Aspekte, die gar nicht zum Beschreibungsbereich einer Kompetenzgrammatik gehören sollen – nämlich performative Faktoren – in die gesamtgrammatische Darstellung eingehen können und müssen. Dadurch kann die Tatsache abgebildet werden, dass oft mehrere Strukturen vollständig akzeptabel sind (d.h. von einer Kompetenzgrammatik abgeleitet werden müssen), aber manche der Strukturen dennoch (wenngleich oft schwach) bevorzugt werden. Was die empirischen Aspekte des Phänomenbereichs Scrambling angeht, so kann die vorliegende Arbeit natürlich auf die umfassende etablierte Forschungsliteratur zurückgreifen und tut dies auch weidlich. Das Hauptaugenmerk der Arbeit liegt demnach auch eher nicht vorrangig darauf, unentdeckte empirische Eigenschaften aufzuzeigen oder bisher geleistete empirische Arbeiten zu kritisieren. Vielmehr strebt die Arbeit an, eine theoretische Architektur einer Kompetenzgrammatik zu erarbeiten, die diesen empirischen Erkenntnissen tatsächlich gerecht wird: Nach meiner Einschätzung ist es hierzu insbesondere notwendig, prosodische Einflüsse auf die Wortstellung theoretisch repräsentieren zu können. Wie sich zeigt, ergeben sich aus den Vorhersagen der hier vorgeschlagenen Architektur aber auch einige neue empirische Aspekte, die meines Wissens andernorts noch nicht beschrieben worden sind. Wie alle wissenschaftlichen Arbeiten verdankt auch diese Arbeit ihre Existenz der Zusammenarbeit mit vielen Kolleginnen und Kollegen, vor allem Jürgen Lenerz, Anika Dewald, Dennis Ott, Sebastian Kaiser, Kay Gonzalez und Luis Lopez, André Meinunger und Werner Frey, Erich Groat und Kleanthes Grohmann, die in verschiedenen Phasen des Projektes kluge Fragen gestellt und wichtige Einwände formuliert haben. Viele weitere Kollegen haben Vorträge oder schriftliche Vorabversionen kommentiert und ich danke hier insbesondere Josef Bayer, Patrick Brandt, Leah Bauke, Stefan Baumann, Daniel Büring, Eric Fuß, HansMartin Gärtner, Günther Grewendorf, Martine Grice, Amina Hallab, Fabian Heck, Stefan Hinterwimmer, Manfred Krifka, Gereon Müller, Sonja Müller, Waltraud Paul, Cecilia Poletto, Beatrice Primus, Marc Richards, Martin Salzmann, Andreas
Für eine komplexe grammatische Architektur zur Repräsentation von Scrambling
13
Trotzke, Ewa Trutkowski und Tonjes Veenstra für ihre Anregungen. Mein persönlicher Dank geht an Andrea, Edith & Heinz, Karen & Peter, Karin, Kristian, Nina, Julia, Christian, Markus, Daniela, Ulrich, Milan, Marcel und Paula.
Einführung: Scrambling und monokausale Erklärungen Mit dem Begriff Scrambling wird ein Wortstellungsphänomen bezeichnet: Die Wortstellung ist in Sprachen wie z.B. dem Deutschen – verglichen mit anderen Sprachen wie z.B. dem Englischen – recht frei: 1. a) Gestern hat der Mann den Kindern den Kuchen gegeben. b) Gestern hat der Mann den Kuchen den Kindern gegeben. c) Der Mann hat den Kuchen gestern den Kindern gegeben. ... Es lässt sich für das Deutsche zeigen, dass tatsächlich kaum Umstellungen existieren, die als ganz und gar ungrammatisch gelten müssen. Als Ross den Begriff Scrambling 1967 einführte (d.h. vor nur etwas mehr als vierzig Jahren) galt, dass Scramblingsprachen nur äußerst schwer syntaktisch zu beschreiben waren: „the problems involved in specifying exactly the correct subset of the strings which will be generated by [the Scrambling rule] are far too complicated for me to even mention them here, let alone come to grips with them“ (Ross 1967: 43). Ist die Wortstellung des Deutschen also nicht restringiert – und damit frei? Diese Annahme wird dann erkennbar unhaltbar, wenn man die Kontexte hinzunimmt, in denen Sätze wie die in (1) geäußert werden, wie Lenerz (1977) zeigt: Informationsstrukturelle Gegebenheiten, die bestimmte Argumente, Adverbiale oder andere Konstituenten z.B. als diskursneu oder diskursgegeben ausweisen, beeinflussen die Wortstellung massiv. Antwort 2 im folgenden Satz ist nicht an und für sich ungrammatisch (sie kann in anderen Kontexten auftreten). Die Abfolge, bei der das Pronomen ihn dem indirekten Objekt den Kindern folgt, kann aber im Kontext der Frage in (2) im Normalfall nicht als kohärente Fortführung des Diskurses fungieren (was durch # markiert wird): 2. Frage: Wem hat der Mann den Kuchen gegeben? Antwort 1: Er hat ihn den Kindern gegeben. Antwort 2: # Er hat den Kindern ihn gegeben. Ausgehend von Erkenntnissen dieser Art wurde daher in den letzten dreißig Jahren häufig versucht, die Wortstellung des Deutschen vorrangig auf informationsstrukturelle Gegebenheiten zurückzuführen. Die vorliegende Analyse argumentiert dafür, diesen engen Ansatz aufzugeben – oder ihn doch zumindest signifikant zu erweitern: Es lässt sich zeigen, dass
Scrambling und monokausale Erklärungen
15
die aufgezeigten Wortstellungsvarianten des Deutschen nicht direkt von informationsstrukturellen Eigenschaften determiniert werden. Stattdessen haben sowohl prosodische Erwägungen wie auch die Satzsemantik einen gewichtigen Einfluss auf die Wortstellungsvarianten. Es gilt, diese Einflüsse in einem präzisen theoretischen Modell nachzuzeichnen und dabei die Idealisierungen und Verengungen der älteren Modelle zu überwinden: Die Wortstellung des Deutschen ist durch vielfältige Faktoren determiniert, die die grammatische Gesamtarchitektur (die mehr umfasst als nur Syntax) ganz verschiedenen Einflüssen unterwerfen. Die vorliegende Arbeit beschränkt sich weitestgehend auf die Untersuchung der Eigenschaften von Scrambling im Deutschen. Andere Sprachen, in denen vergleichbare Phänomene ebenfalls vorzuliegen scheinen (z.B. Russisch oder Japanisch) werden hier kaum berücksichtigt. Dies ist nicht nur aus Gründen des Umfanges der vorliegenden Arbeit angeraten, sondern auch empirisch legitim: Wie mir scheint, sind die Eigenschaften etwa von ‚Scrambling‘ im Japanischen und Russischen deutlich verschieden von denen des Scrambling im Deutschen. Meine Arbeit zum Scrambling (im Deutschen) geht wie folgt vor: In Teil I werden die empirischen Eigenschaften von Scrambling im Deutschen überblicksartig vorgestellt. In diesem Teil wird also zusammengefasst, welche empirischen Eigenschaften theoretische Repräsentationen zu erklären haben. Teil II versucht, die empirischen Eigenschaften von Scrambling in Opposition zu bringen zu den theoretischen Eigenschaften von Bewegungsoperationen in verschiedenen syntaktischen Modellen (vgl. z.B. Chomsky 2007, 2008). Es zeigt sich, dass der Versuch älterer Ansätze scheitert, die Wortstellungsvarianten des Deutschen vollständig auf informationsstrukturelle Eigenschaften (wie Topik, Fokus, etc.) zu reduzieren: Auch phonologische Faktoren nehmen einen subtilen, aber darstellbaren Einfluss auf die Wortstellung des Deutschen. Darüber hinaus scheinen manche Umstellungen von Konstituenten überhaupt nicht auf informationsstrukturelle Eigenschaften der umgestellten Elemente zurückzuführen zu sein, sondern ergeben sich aus satzsemantischen Eigenschaften, wie z.B. den Skopoi oder den Bindungslesarten dieser Elemente. Darüber hinaus sind die bekannten informationsstrukturellen Eigenschaften zwar an der Konstitution der Wortstellung beteiligt – aber wesentlich indirekter, als ältere Darstellungen vermuten lassen. Es bestätigt sich daher die Einschätzung Fanselows: „Correlations between positions and informational functions do not necessarily imply that information structure and word order are directly related by syntactic laws“ (2006: 137). Wie sich zeigt, stellt die Vielförmigkeit und Komplexität insofern ein Problem für alle syntaktische Theorien dar, als die Wortstellungsvarianten (entgegen allem Anschein) nicht allesamt optionale Umstellungen sein können. Vielmehr zeigen zumindest manche Umstellungen formale Eigenschaften obligatorischer
16
Einführung
Bewegungsoperationen und müssen daher auch als obligatorische Bewegungen repräsentiert werden. Diese syntaktische Repräsentation scheint nun zunächst völlig falsche Vorhersagen zu machen: Wenn syntaktische Operationen, die die Wortstellung determinieren, obligatorisch ablaufen, so sollten die Ausgaben dieser Operationen vorhersagbar sein – mit anderen Worten: Das Deutsche müsste (zumindest vis-à-vis genau kontrollierter Kontexte) eine rigide Wortstellung aufweisen. Dies ist aber nicht der Fall. Es wird daher vorgeschlagen, dass im Rahmen der syntaktischen Derivation auch für eine obligatorisch ablaufende Operation dennoch Varianten existieren, die die Ausführung der Operation betreffen (vgl. z.B. Biberauer 2003, Biberauer & Richards 2006, Miyagawa 2003). Diese (syntaktisch obligatorischen) Umstellungen werden auf der Ebene der Phonologischen Form (PF) zudem nicht eineindeutig interpretiert: Die PF ist in der Lage, auch aus strukturell-syntaktisch obligatorischen Umstellungen linear-phonologisch variable Wortstellungsmuster abzuleiten – was aus anderen Bereichen der Grammatik längst bekannt ist (etwa von sog. split movements, vgl. Fanselow & Cavar 2002). Die Wortstellung des Deutschen kann auf diese Weise – ohne jede zusätzliche theoretische Stipulation – als Ergebnis mehrerer syntaktischer Bewegungsprozesse dargestellt werden, deren Ausgabe aber erst durch die PF linear ausbuchstabiert wird. Teil III der Arbeit zeigt, dass diese Darstellung tatsächlich in der Lage ist, die vielfältigen Beziehungen zwischen Syntax, Semantik, Phonologie und Informationsstruktur (die in Teil I zusammengefasst wurden) besser abzubilden als ältere Vorschläge: Anhand einer Reihe bekannter Problemfälle wird gezeigt, dass die Vorhersagen des hier vorgeschlagenen Modells zutreffen und die Analyse damit einen überlegenen Beschreibungsansatz darstellt: Die Syntax generiert keine eindeutigen Wortketten, die die PF (trivial) auf lineare phonetische Sequenzen abbildet. Vielmehr gilt, dass die phonologischen, syntaktischen und semantischen Eigenschaften der im Deutschen erkennbaren Wortstellungsphänomene in denjenigen Bereichen der Grammatik verhandelt werden, die für diese Eigenschaften jeweils einschlägig – sprich: geeignet – sind: Phonologisch-prosodische Eigenschaften werden in der phonologischen Komponente repräsentiert, syntaktisch-konfigurationelle Eigenschaften hingegen in der Syntax. Satzsemantische Auswirkungen syntaktischer Umstellungen werden vermittels einer (in Teilen) transparenten Abbildung der Syntax auf die interpretative Komponente erklärt. Die verschiedenen Worstellungsmuster (und ihre prosodischen Bedingungen und semantischen Effekte) werden also nicht allesamt in der Syntax verhandelt: Wie sich im Verlauf der Arbeit zeigt, ist die kernsyntaktische Komponente mit der Abbildung der Wortstellungseigenschaften des Deutschen überfordert.
I. Empirische Eigenschaften von Scrambling im Deutschen
1 Zur allgemeinen Struktur des deutschen Satzes Im Rahmen der generativen Syntax nach Chomsky (vgl. z.B. 1965, 1981, 1999, 2004, 2007, 2008) wurden verschiedene Repräsentationen von Satzstrukturen im Deutschen vorgeschlagen. Aktuell wird die deutsche Satzstruktur oft dargestellt als Hierarchie der funktionalen Projektionen CP, TP und vP. Diese Darstellung lässt sich recht einfach in Beziehung setzen zu älteren Darstellungen, z.B. dem Topologischen Feldermodell: 3. [CP ...Vorfeld ... Vfin [TP ...linkes Mittelfeld... [vP ...rechtes Mittelfeld...]]] Scrambling kann dabei Umstellungen bewirken, die eine Konstituente vom rechten ins linke Mittelfeld bewegen (vgl. ähnlich Grewendorfs „higher and lower area of the German middle field“, 2005:100, sowie die Position der umgestellten und basisgenerierten Argumente bei Frey & Pittner 1998: 528). Dies wird daran deutlich, dass sich zum einen die Reihenfolgen von Argumenten im Satz ändern können (wie bereits oben gesehen), zum anderen aber auch bestimmte Elemente (die selbst unbeweglich sind) durch die Umstellung überschritten werden. Im folgenden Beispiel wird das Objekt also nicht nur vor das Subjekt gestellt, sondern geht auch einer Modalpartikel voran: 4. [CP ...Adverbial ... Vfin [TP ... Objekt...[ (Partikeln) [vP ...Subjekt...]] Vinfin]] Zum Beispiel: (Kontext: Normalerweise bringt Monika den Kindern Kuchen...) Aber gestern hat den KuchenObj wohlPart FRITZSubj gebacken. Die Partikeln sind hier nicht zufällig als Grenze zwischen linkem und rechtem Mittelfeld gewählt. In älteren Darstellungen werden hierfür Elemente gewählt, von denen mittlerweile bekannt ist, dass sie sich selbst bewegen können – oder aber keine Grundposition außerhalb der vP haben: – Verschiedene Klassen von Adverbien (die ereignisinternen und die prozessbezogenen im Sinne von Frey & Pittner 1998: 528) haben Basispositionen innerhalb der vP und eignen sich so nicht als ‚Grenzsteine‘ an der äußeren Grenze der vP (vgl. ebd.). – Zudem können sich Adverbien bewegen. Ihre Funktion als Indikator für Umstellungen ist also auch deshalb problematisch, weil schwer sicherzustellen ist, dass sich die ‚Grenzsteine‘ nicht selbst bewegt haben (Frey & Pittner 1998).
20
Zur allgemeinen Struktur des deutschen Satzes
Modalpartikeln sind aus mehreren Gründen besser geeignet, als Grenzelemente oberhalb der vP zu fungieren: – Es kann in keiner Weise gezeigt werden, dass sich Modalpartikeln (im Mittelfeld) bewegen: Modalpartikeln ändern ihre Reihenfolge untereinander nicht und treten nur im Mittelfeld des Satzes auf – aber nicht z.B. im Vorfeld (Bayer 2008, in Vorbereitung, Struckmeier: Im Erscheinen). – Modalpartikeln scheinen stattdessen zur ‚starren‘ Kaskade funktionaler Projektionen zu gehören, die den deutschen Satz konstituieren: Modalpartikeln sind Teilrealisationen von C-Merkmalen (vgl. Struckmeier, im Erscheinen, sowie Unterkapitel 8.4.2. der vorliegenden Arbeit).
2 Basisabfolge der Argumente und Restriktionen über Umstellungen der Basisabfolge Für die wie in (4) repräsentierte Satzstruktur sind Generalisierungen bekannt, die die ‚freie‘ Wortstellung des Deutschen restringieren: Zunächst haben offenbar nicht alle Wortabfolgen den gleichen Status. Vielmehr scheint es eine Basisabfolge der Argumente zu geben, die als Subjekt > indirektes Objekt > direktes Objekt beschrieben werden kann (vgl. neben vielen anderen Autoren z.B. Lenerz 1977, Höhle 1982, Frey 1993, Büring 2001, Molnarfi 2002, Grewendorf 2005). Diese Basisabfolge zeichnet sich durch die folgenden Eigenschaften aus: – Die Basisabfolge ist unmarkiert im Hinblick auf informationsstrukturelle (im Folgenden: IS-) Eigenschaften: Werden in einem Satz die Argumente in der Basisabfolge aufgereiht, so lässt sich jedes der Argumente durch Betonung zum Fokusexponenten des Satzes machen. Fokusexponenz drückt sich so aus, dass sich ein Argument als der Teil einer Antwort verstehen lässt, auf den eine Frage abzielt. Das Argument, welches als Fokusexponent fungiert, trägt die Hauptbetonung des Satzes (dargestellt durch KapitaliSIERung): 5. a) Frage: Antwort: b) Frage: Antwort:
Wer hat heute den Kindern den Kuchen gegeben? Heute hat der MANN den Kindern den Kuchen gegeben. Wem hat der Mann heute den Kuchen gegeben? Heute hat der Mann den KINDern den Kuchen gegeben hat.
c) Frage: Was hat heute der Mann den Kindern gegeben? Antwort: Heute hat der Mann den Kindern den KUCHen gegeben. –
–
Eine wichtige Einschränkung zu dieser klaren Abbildung von Eigenschaften auf prosodische Markierungen sind allerdings notwendig: Zum einen gilt, dass die Hauptbetonung in einem Satz stets nur eine betonte Silbe auszeichnet – der tatsächliche fokussierte Strukturbestandteil ist aber (nicht verwunderlicherweise) deutlich größer, wie bereits die o.a. Beispiele zeigen. Ergänzend muss darauf hingewiesen werden, dass die betonte Silbe prinzipiell die Fokussiertheit einer unbegrenzt komplexen Phrase signalisieren kann (vermittels der sogenannten Fokusprojektion, vgl. schon Selkirk 1984 und Rochemont 1986). Der Problembereich der Fokusprojektion spielt allerdings für die Belange der vorliegenden Arbeit keine besondere Rolle und wird daher im weiteren nicht en detail thematisiert. Des weiteren muss aber auch darauf hingewiesen werden, dass selbst die intonatorische Auszeichnung der einzelnen betonten Silbe auch genuin pro-
22
–
–
Basisabfolge der Argumente und Restriktionen über Umstellungen der Basisabfolge
sodischen Restriktionen unterliegt, sodass eine transparente Auszeichnung diskursneuer Strukturanteile auch aus diesem Grund nicht immer gegeben ist (vgl. z.B. Fery 2008). Da die Basisabfolge erlaubt, prinzipiell jedes Argument zu betonen, kann sie in den meisten Fragekontexten gebraucht werden: Keine von der Basisabfolge abweichende Abfolge ist im Hinblick auf die Menge der möglichen Fokusexponenten so vielseitig (vgl. Lenerz 1977, Höhle 1982). Die Basisabfolge ist zudem einzigartig, was mögliche Quantorenskopoi angeht, wie Frey (1993) zeigt: Die Basisabfolge erlaubt (zumindest unter Verumfokus, d.h. bei Betonung des finiten Verbs oder einer unterordnenden Konjunktion) oft nur eine einzelne Lesart, die sich aus der Oberflächenabfolge der quantifizierten Phrasen ableiten lässt. Alle von der Basisabfolge abweichenden Abfolgen sind hingegen skopusambig, d.h. sie erlauben mehrere Möglichkeiten der Interpretation, die nicht alle aus der Oberflächenabfolge herleitbar sind (vgl. Frey 1993: 195). Dies gilt sowohl für Scrambling über Adverbiale hinweg (6) wie auch für Scrambling von quantifizierten Ausdrücken (7): 6. WEIL [mindestens einer] [fast jedes Mal] geschlafen hat ‚weil für fast jedes Mal gegolten hat: Irgendjemand hat geschlafen‘ (∀∃) oder: ‚weil für einen gegolten hat: er hat fast jedes Mal geschlafen‘ (∃∀) 7. Dieses Semester HAT wohl [fast jedes Buch [mindestens ein Student gelesen]]. ‚Fast jedes Buch wurde von irgendeinem der Studenten gelesen.‘ (∀∃) oder: ‚Mindestens ein (bestimmter) Student hat fast jedes Buch gelesen.‘ (∃∀)
–
Die Annahme einer Basisabfolge wird auch dadurch nicht maßgeblich eingeschränkt, dass eine bestimmte Unterklasse der Verben regelmäßig die Abfolge Akkusativ > Dativ aufzuweisen scheint: Wie Meinunger argumentiert, sind diese Verben (wie z.B. aussetzen, unterziehen, zuführen, vorziehen, nachbilden,...) nämlich alle dadurch ausgezeichnet, dass sie ein (im weitesten Sinne) lokales Argument als Dativ einführen (2000: 58). Die Verben in dieser Unterklasse weisen zudem als morphologisches Erstglied ein präpositional anmutendes Element auf (vgl. die Erstglieder der o.a. Verben mit den klaren Präpositionen aus, unter, zu, vor, nach,...). Daher lässt sich das (ver-
Basisabfolge der Argumente und Restriktionen über Umstellungen der Basisabfolge
23
meintliche) Dativarguent in der (vermeintlichen) Abfolge Akkusativ > Dativ problemlos als „(the remnant of) a PP“ analysieren (ebd.). Die vermeintliche Dativ-DP wird von Meinunger also als PP analysiert werden, deren präpositionaler Kopf im Verb inkorporiert vorliegt (ebd.: 59). Damit fallen diese – prima facie von der Normalabfolge abweichenden – Stellungsmuster als Gegenbeispiele aus. Die Basisabfolge von Argumenten (des Typs [DP D NP]) kann damit (modulo der genannten Komplikation) mit Lenerz (und, in der Nachfolge, den oben genannten Autoren) als Subjekt > indirektes Objekt > direktes Objekt angesetzt werden. Abweichungen von der Basisabfolge unterliegen klaren Restriktionen: – Fokusexponenten sollen im Normalfall nicht umgestellt werden (Lenerz 1977, 2001a, 2001b). – Das rechte Mittelfeld enthält aber nicht nur fokussierte Elemente: Phrasen zum Beispiel, die keine besondere Auszeichnung als Fokus aufweisen, können im rechten Mittelfeld – in ihrer Basisposition, in-situ – stehen bleiben (vgl. ebd.). – Während Foki, die z.B. durch Fragekontexte definiert sind (Informationsfoki), im rechten Mittelfeld verbleiben sollen, treten sogenannte Kontrastfoki auch im linken Mittelfeld auf (vgl. Molnarfi 2004, Grewendorf 2005): 8. Sprecher A: Ich habe den Kindern gestern den Schnaps gegeben. Sprecher B: Du hast den ErWACHSenen doch wohl den Schnaps gegeben, und nicht den Kindern, oder? –
Zudem lassen sich im Deutschen kontrastive Topiks definieren, die durch einen intonatorischen Anstieg gekennzeichnet sind (schriftlich dargestellt durch das Symbol /). Diese informationsstrukturelle Kategorie betont, dass es relevante Alternativen zum kontrastiven Topik gibt (vgl. z.B. Büring 1997): 9. Frage des Kommissars: Wer tötete Lady Mondegreen? Antwort des Hausmädchens: /ICH weiß NICHT, wer das war. (Aber der GÄRTner, fragen sie den!)
–
Kontrastive Topiks treten, wie kontrastive Foki, auch im linken Mittelfeld auf (vgl. Jacobs 1997, Krifka 1998). Sie können aber auch in ihrer Basisposition verbleiben oder ins Vorfeld des Satzes gelangen. Kontrastive Topiks sind also (anders als etwa die Informationsfoki) in ihrer Stellungsfreiheit nur schwach durch ihre informationsstrukturelle Auszeichnung eingeschränkt. Für den intonatorischen Anstieg der Kontrasttopiks gilt, „daß die Akzente so gut wie
24
Basisabfolge der Argumente und Restriktionen über Umstellungen der Basisabfolge
alles treffen können, was in den jeweiligen syntaktischen Positionen aufgrund der ansonsten geltenden grammatischen Gesetze zulässig ist“ (Jacobs 1996: 7). Ich stimme auch Molnar & Rosengren (contra Jacobs 1996) zu, dass kontrastive Topiks in (diskursiv geeigneten) Nebensätzen auftreten können (vgl. Bsp. 1996: 54f.): 10. A: Fast alle Grass-Romane wurden doch begeistert aufgenommen. B: Das stimmt im Prinzip schon, aber du weißt ja auch, daß /ALLen Kritikern das letzte Buch keinesWEGS gefallen hat. (/EInige haben es sogar regelrecht verRISSen). Wenn die Basisabfolge durch Umstellungen von Argumenten und Adverbialen permutiert wird, lassen sich auch über das Endergebnis dieser Umstellungen bestimmte Generalisierungen formulieren: – Wenn in einem Kontext keines der Argumente fokussiert ist, so wird die Basisabfolge häufig auch im linken (!) Mittelfeld repliziert (vgl. z.B. Meinunger 2000, Putnam 2007): 11. dass [TP [Subj die Firma Müller] [iO meinem Onkel] [dO diese Möbel] (ja) erst gestern zugestellt] hat. –
–
Das Subjekt des Satzes findet sich oft (aber nicht immer) im linken Mittelfeld. Wenn das Subjekt im linken Mittelfeld positioniert ist, können andere Argumente nur relativ schwer per Scrambling über das Subjekt hinweg umgestellt werden (vgl. Lenerz 2001a, Rosengren 1994). Diese Generalisierung wird allerdings nicht von allen Autoren akzeptiert. Ich übernehme dennoch mit gewissen Einschränkungen die Generalisierung Lenerz‘ und Rosengrens: Wie Kapitel 7.2.1.1. zeigt, sind Ausnahmen von dieser Generalisierung nur äußerst aufwendig zu konstruieren. Wiewohl das Scrambling von vollen DPen über Subjekte hinweg in der vorliegenden Arbeit also als eher marginal angesehen wird, so muss das Scrambling von Pronomina über ein Subjekt hinweg doch als problemlos möglich angesehen werden. Sätze wie der folgende erscheinen mir völlig akzeptabel: 12. [CP weil [TP esdO PeterSubj wohl der FRAUiO gegeben hat.]]
– –
Die Stellung der Pronomina am linken Rand des Mittelfeldes (die Wackernagelposition) ist schon aus traditionellen Darstellungen bekannt. Allerdings muss diese Bewegung nicht zwangsläufig erfolgen. Entgegen
Basisabfolge der Argumente und Restriktionen über Umstellungen der Basisabfolge
25
anders lautender Behauptungen (z.B. bei Meinunger 2000: 82 oder Molnarfi 2002: 1121, 1134) können Pronomina z.B. auch einem vollen DP-Subjekt im rechten Mittelfeld folgen: 13. a) weil ja wahrscheinlich gestern Paul es ihm gegeben hat (Bsp. Lenerz 1992: 2) b) weil ja wahrscheinlich gestern ein Mädchen es ihm gegeben hat (Bsp. Lenerz 1993: 119) –
–
Wenn die Pronomina allerdings ins linke Mittelfeld gelangen, so replizieren sie interessanterweise dort wiederum ihre Basisabfolge. Während volle DPArgumente (vom Typ [DP D NP] die Basisabfolge Subjekt > indirektes Objekt > direktes Objekt zeigen, weisen Pronomina (d.h. DPen vom Typ [DP D]) die abweichende Abfolge Subjekt > direktes Objekt > indirektes Objekt auf. Es scheint also (contra Meinunger 2000) nicht so zu sein, dass im linken Mittelfeld eine einzige Kaskade von Positionen bereitsteht, die Elemente mit bestimmten Kasus obligatorisch in eine Reihenfolge bringt. Stattdessen wird im Normalfall diejenige Abfolge im linken Mittelfeld repliziert, die auch im rechten Mittelfeld als Basisabfolge gilt. Scrambling ist (anders als z.B. im Russischen) satzgebunden und kann die umgestellten Phrasen nicht z.B. in einen übergeordneten Hauptsatz anheben (vgl. Ross 1967, Lenerz 1977, Müller & Sternefeld 1994, Rosengren 1994, Haider & Rosengren 1998, Grewendorf 2005). Überquert das Scrambling einer Phrase aber eine Satzgrenze, resultiert klare Ungrammatikalität (dargestellt durch das Symbol *): 14. *Ich glaube ihn [CP dass Du ___ gesehen hast].
Welche theoretischen Mittel stehen nun im Rahmen der generativen Grammatik zur Erklärung dieser empirischen Generalisierungen zur Verfügung? Der folgende Teil II liefert einen Überblick über verschiedene Theoriestände und die jeweilige Behandlung von Scrambling-Daten im Rahmen dieser Theorievarianten.
II. Technische Repräsentationen: core syntax
3 Theoretische Grundannahmen der vorliegenden Analyse 3.1 Grammatiken und ‘Universaltheorien’ der Sprache Die bisher genannten Eigenschaften von Scrambling sind relativ unkontrovers und gehören daher zur der Menge empirischer Eigenschaften, die jede theoretische Repräsentation zu erfassen hat. Die hier vorgeschlagene Analyse bedient sich der Mittel der generativen Grammatik (vgl. z.B. Chomsky 1965, 1981, 1999, 2004, 2007, 2008). Die Daten selbst sind jedoch keinesfalls als Artefakte dieser Theorie zu betrachten, sie lassen sich vielmehr – wie soeben gesehen – auch im Rahmen relativ prätheoretischer Beschreibungen nachzeichnen. Die diskutierten Daten könnten zudem (wenn auch mit z.T. deutlich veränderten Mitteln) auch in anderen Theorieformen (HPSG, LFG und Simpler Syntax, um nur einige zu nennen) dargestellt werden. Die Wahl der Theorie ist in meinen Augen daher hier nicht entscheidend. Um dies zu belegen, wird an verschiedenen Stellen der Arbeit auch immer wieder darauf hingewiesen werden, wie mit den theoretischen Postulaten letztlich immer nur eine möglichst klare und effiziente Darstellung und plausible Erklärung der Daten angestrebt wird. Um die genannten Eigenschaften im Rahmen der generativen Grammatik Chomskys (im Folgenden kurz: der core syntax) erfassen zu können, muss jedem Satz der Sprache eine Struktur zugeordnet werden. Ziel der Untersuchungen ist es, eine intensionale Beschreibung des Wissens eines Sprechers um diese Strukturen zu erreichen. Dieses Wissen ist die Kompetenz dieses Sprechers. Ausdrücklich nicht angestrebt wird eine Beschreibung des konkreten Verhaltens eines konkreten Sprechers in einem konkreten Kontext. Missverständnisse in dieser Hinsicht begleiten die generative Syntax leider seit ihren Anfängen: To avoid what has been a continuing misunderstanding, it is perhaps worthwhile to reiterate that a generative grammar is not a model for a speaker or a hearer. It attempts to characterize in the most neutral possible terms the knowledge of the language that provides the basis for actual use of language by a speaker-hearer. When we speak of a grammar as generating a sentence with a certain structural description, we mean simply that the grammar assigns this structural description to the sentence. When we say that a sentence has a certain derivation with respect to a particular generative grammar, we say nothing about how the speaker or hearer might proceed, in some practical or efficient way, to construct such a derivation. These questions belong to the theory of language use - the theory of performance. (Chomsky 1965: 9, meine Hervorhebungen)
30
Theoretische Grundannahmen der vorliegenden Analyse
Kompetenz und Performanz des Sprechers sollten also aus Sicht Chomskys klar getrennt beobachtet werden. Beide Faktoren spielen je eigene Rollen für die tatsächlichen beobachtbaren sprachlichen Phänomene: Mit der Trennung von Kompetenz und Performanz soll gewährleistet werden, dass die sprecher-, verwendungs- und situationsunabhängigen strukturellen Eigenschaften von Sätzen beschrieben werden können. Das Wissen des Sprechers über diese strukturellen Eigenschaften ist ja – zumindest zu einem gewissen Grade – unabhängig von der Frage, wie, wo und wann der Sprecher dieses Wissen anwendet. Darüber hinaus scheinen Regularitäten in Sprachen zu existieren, die sich nicht z.B. dadurch erklären lassen, wie Sprecher und Hörer Sätze produzieren oder verarbeiten. Ein solcher Anteil irreduzibler Kompetenz wird auch von funktionalistischen Grammatiken – so sie explizit ausformuliert sind – angesetzt: „It must be emphasized that functional theories are not performance theories. [...] They are theories of systems, not of actual behaviour“ (Foley & VanValin 1984:15). Eine formale generative Grammatik, die die Kompetenz eines Sprechers beschreibt, muss zudem vollständig und präzise definiert sein: „It does not rely on the intelligence of the understanding reader but rather provides an explicit analysis“ (Chomsky 1965: 4). Vor dem Hintergrund dieser Vorgaben sind verschiedene Theoriestände erarbeitet worden, in deren Rahmen Scrambling-Phänomene untersucht wurden, beginnend in den 70er Jahren des vergangenen Jahrhunderts. In der vorliegenden Arbeit wird daher eingangs skizziert, wie diese Theorien Scrambling zu erklären suchten – und warum ältere theoretische Annahmen, insbesondere aus der Ära des sogenannten Government and Binding, sich als wenig interessant (und zum Teil sogar als hinderlich) erweisen, um Scrambling zu erklären: – Ein Überblick über die älteren theoretischen Werkzeuge wird in Unterkapitel 3.2. geleistet. – Unterkapitel 3.3. zeigt darauf folgend die aktuellen theoretischen Annahmen auf, die die vorliegende Arbeit zur Analyse der beobachteten Phänomene verwendet.
3.2 A- und A‘-Bewegungen der Government and Binding-Theorie erklären Scrambling nicht Das folgende Unterkapitel zeigt die Optionen auf, die sich in der Architektur des Government and Binding zur Repräsentation des Phänomens Scrambling eröffnen: – Das Phänomen wird als Ergebnis syntaktischer Bewegungsoperationen verstanden, die z.B. Argumentphrasen aus ihrer Thetaposition in ihre
A- und A‘-Bewegungen der Government and Binding-Theorie
–
–
–
31
Oberflächenpositionen überführen. Diese syntaktischen Bewegungen wurden im Rahmen der Bewegungstheorie des Government and Binding z.B. als A- bzw. als A‘-Bewegung charakterisiert (vgl. 3.2.1). Das Phänomen wird – häufig deshalb, weil es sich damals gängigen syntaktischen Klassifizierungsversuchen entzieht – als phonologische Bewegung interpretiert. Kapitel 3.2.2 zeigt aber, dass diese Auffassung nicht zutreffen kann: Scrambling-Bewegungen können zum einen semantische Effekte aufweisen, die für rein phonologische Bewegungen gänzlich unerwartet wären (vgl. 3.2.2.1.). Zum anderen aber mag die Motivation vieler Bewegungen phonologisch sein, die Restriktionen, denen diese Umstellungen unterliegen, sind aber zum Teil nicht phonologischer Natur, sondern vielmehr ausschließlich syntaktisch zu beschreiben (vgl. 3.2.2.2.). Da weder Bewegungsoperationen noch die Abbildung auf die PF-Komponente als zufriedenstellend angesehen werden können, wird die Wortstellungsfreiheit in anderen Analysen gar nicht als Ergebnis einer Wortfolgenänderung angesehen. Vielmehr sollen die verschiedenen Wortfolgen allesamt basisgeneriert werden – eine Umstellung, sei sie syntaktischer oder phonologischer Natur, ist daher in diesen Ansätzen nicht nötig. Wie Kapitel 3.2.3 jedoch zeigt, scheint diese Darstellung zumindest nicht alle semantischen und informationsstrukturellen Aspekte des Phänomens effizient und explanatorisch stark zu beschreiben.
3.2.1 Scrambling (und object shift) sind nicht als A- bzw. A‘-Bewegungen beschreibbar Das Phänomen Scrambling wurde auch in älteren Theoriestufen detailliert analysiert: Vielfach wurde dabei versucht, die Bewegungsoperationen, die als Ursache von Scrambling angenommen wurden, in eine (theoretisch deduzierte) Typologie von Bewegungsoperationen einzuordnen: Die Prinzipien- und Parametertheorie der Government and Binding-Ära sah vor, dass Bewegungsoperationen als A- oder A‘-Bewegungen typisiert werden können. Im folgenden Unterkapitel soll nun aber ausdrücklich keine umfangreiche Diskussion dieser Unterscheidung getroffen werden. Hierfür gibt es drei Gründe: – Zum ersten sind Überblicke über die Dichotomie bereits im Überfluss vorhanden: Autoren wie Bobaljik 2002, Chocano 2007, Corver & van Riemsdijk 1994, Fanselow & Felix 1987, Holmberg 2006, Müller & Sternefeld 1994, Putnam 2007 und Vikner 1994 diskutieren ausführlich, welche Eigenschaften A- bzwA‘-Bewegungen unterstellt werden und wie diese Eigenschaften in Scrambling-Bewegungen und im verwandten Phänomen object shift figurieren. Ich
32
–
–
Theoretische Grundannahmen der vorliegenden Analyse
verweise den Leser daher auf diese bereits sorgfältig geleisteten Vorarbeiten anderer Autoren – die ich nachfolgend nur deshalb kurz anschneide, um die Unzulänglichkeit der alten Bewegungstheorie zu demonstrieren. Zum zweiten ist die Unterscheidung zwischen A- und A‘-Bewegungen in der aktuellen Syntax praktisch nicht mehr formulierbar, wie Unterkapitel 3.2.1.2 zeigt. Die vorliegende Arbeit verwendet nun aber den aktuellen Theoriestand – und hat demzufolge keine Verwendung für eine Bewegungstypologie, die heute mit vollem Recht als „archaic“ bezeichnet werden kann (Putnam 2007: vii). Es besteht demnach auch keine Notwendigkeit, diese Theorie nur deshalb immer und immer wieder zu portraitieren, weil dies dem Duktus älterer (lies: vor zwanzig Jahren zeitgemäßer, heute aber veralteter) Diskussionen entsprach. Ich schließe mich der Meinung Richards‘ an: Die A/A‘-Dichotomie ist „no longer even compatible or well defined under the assumptions of current minimalist syntax“ (Richards 2004: 6). Scrambling oder object shift daher auf der Basis solcher Kategorien zu beschreiben ist „an incoherent and futile strategy“, die A/A‘-Unterscheidung fungiert nur noch als „irrelevant theoretical strait-jacket“ (ebd.: 7). Zum dritten – und dies mag die wichtigste Begründung sein – ist erkannt worden, dass die A/A‘-Dichotomie empirisch unzureichend ist. Die A/A‘-Unterscheidung ist, wie sich immer und immer wieder gezeigt hat, absolut ungeeignet, Bewegungsmuster in den Sprachen der Welt zutreffend und umfassend zu klassifizieren. Anders gesagt: Die postulierten Klassen von Bewegungen lassen sich – beim genaueren Hinsehen – empirisch nicht belegen. Wie Unterkapitel 3.2.1.3 zeigt, fallen auch gerade die hier diskutierten Wortstellungsoperationen (Scrambling und das skandinavische object shift) nicht klar und eindeutig in eine der beiden Klassen. Scrambling-Umstellungen insbesondere können weder als A- oder A‘-Bewegungen auch nur halbwegs akzeptabel beschrieben werden – wie die Forschungsdiskussion in der deutschen Linguistik seit Jahrzehnten zeigt: Viele Autoren haben immer wieder versucht, Scrambling als A-Bewegung oder aber als A‘-Bewegung darzustellen – und dieser Versuch endete in einer bemerkenswerten Art von Dilemma: Zahlreiche überzeugende Belege können dafür angebracht werden, dass Scrambling im Deutschen A-Bewegungs-eigenschaften hat (vgl. z.B. Meinunger 2000). Andererseits lässt sich auch der Nachweis führen, dass Scrambling A‘-Bewegungseigenschaften aufweist (vgl. z.B. Müller and Sternefeld 1993, Müller and Sternefeld 1994). Ein Konsens konnte also nicht nur historisch zufällig nicht erreicht werden – er ist ganz prinzipiell nicht zu erreichen: Die Daten und Belege beider Lager erweisen sich ja als gleichermaßen zutreffend! Die Bedeutung dieses empirischen Faktums wurde – was aus der Rückschau natürlich leichter zu erkennen ist – komplett übersehen: Die Diskussion angeblicher
A- und A‘-Bewegungen der Government and Binding-Theorie
33
A- und A‘-Bewegungseigenschaften von Scrambling ist – tadellos analysiert und empirisch genauestens belegt – nichts anderes als eine Sammlung von Belegen dafür, dass die entscheidende Voraussetzung der A/A‘-Typologie nicht gegeben ist: Diese Grundlage besteht in der Annahme, dass A- und A‘Bewegungseigenschaften en bloc und sortenrein in den Bewegungsoperationen vorzuliegen haben: A-Bewegungen haben A-Bewegungseigenschaften und keine A‘-Bewegungseigenschaften. A‘-Bewegungen hingegen müssen A‘Bewegungseigenschaften aufweisen, dürfen aber keine A-Bewegungseigenschaften haben. Diese Lage ist für Scrambling im Deutschen nun aber ganz einfach nicht gegeben: Die Eigenschaften, die jeweils der A-Bewegung bzw. der A‘-Bewegung unterstellt werden, liegen tatsächlich eben nicht en bloc und sortenrein vor: Scrambling und object shift zeigen vielmehr bestimmte Eigenschaften, die der A-Bewegung unterstellt wurden, aber auch andere Eigenschaften, die nur einer A‘-Bewegung zukommen sollten: „It is practically a lost cause to attempt to categorize Scrambling along the lines of the traditional A- or A‘-movement characteristics. Isomorphic reflexes for either movement type simply do not exist“ (Putnam 2007: 93). Wieso also überhaupt ein Unterkapitel zur A/A‘-Unterscheidung? A- und A‘Bewegungsoperationen werden in dieser Arbeit nur deshalb erwähnt, weil die beobachteten Teileigenschaften der verschiedenen Bewegungstypen (die Auslöser der Bewegung, die phonologische Sichtbarkeit der Bewegung, Skopus-, Bindungs- und Rekonstruktionseffekte durch die Bewegung, etc.) natürlich auch durch neue Ansätze beschrieben werden müssen: Diese Teileigenschaften sind ja wirklich (solange man sie nicht zu bündeln versucht) empirisch gut belegt. Eine einzige Einschränkung muss an dieser Stelle erwähnt werden: Da ich selbst parasitic gaps im Deutschen zuverlässig als ungrammatisch bewerte (bzw. ähnliche Strukturen einfach als elliptisch interpretiere), wird in der vorliegenden Arbeit auf eine Analyse vergleichbarer Strukturen verzichtet. Andere Autoren argumentieren ebenfalls, dass parasitic gaps im Deutschen nicht als Argumente in der A/A‘-Diskussion taugen (vgl. z.B. Bayer & Kornfilt 1994: 24f., Haider 2006: 262f. und Putnam 2007: 58). Es sei zusammenfassend absolut klar gesagt: Die vorliegende Arbeit verzichtet in theoretischer Hinsicht vollständig auf die A/A‘-Unterscheidung. Kein Phänomen wird auf der Basis stipulierter A/A‘-Unterscheidungen ‚erklärt‘. Die Arbeit versucht vielmehr, einem linguistisch viel interessanteren Anspruch gerecht zu werden: Inwieweit folgen die (einzelnen) Eigenschaften, die für die A/A‘-Unterscheidung angenommen wurden, aus allgemeineren syntaktischen Eigenschaften im Rahmen der aktuellen Theorie? Die Arbeit folgt damit einem ähnlichen Ziel wie Richards (2004): Die Analyse verzichtet auf die A/A‘-Unterscheidung und
34
Theoretische Grundannahmen der vorliegenden Analyse
betrachtet daher die Eigenschaften von Scrambling-Bewegungen „as basic and aims to capture them directly, rather than forcing OS/ Scrambling to be something that they patently are not“ (Richards 2004: 7).
3.2.1.1 A/A‘-Bewegungen: Wechselnde Definitionen in älteren Theorieformen In ihrer ursprünglichen Fassung bezeichnete die Unterscheidung zwischen A-Positionen und A‘-Positionen einen klar zu fassenden Unterschied: A-Positionen waren (potentielle) Argumentpositionen (denen eine Thetarolle zugewiesen werden konnte), A‘-Positionen waren keine möglichen Argumentpositionen (vgl. z.B. Chomsky 1981). Dieser Unterschied war auch deshalb mit einem eigenen Begriff zu belegen, weil die Menge der Argumentpositionen aus heutiger Sicht recht heterogen erscheint: Das Subjekt eines Satzes etwa wurde in dieser alten Theoriefassung nämlich nicht in der Projektion des Prädikats basisgeneriert, vielmehr verfügten Sätze nach dem Extended Projection Principle über Subjekte. Die ursprüngliche A/A‘-Dichotomie war deshalb nötig, um die Menge der Argumentpositionen (innerhalb und außerhalb der Projektionen von Prädikaten) zu benennen. Mit der Theorie der prädikatsinternen Subjekte wird die Unterscheidung auf Grundlage der Thetaverhältnisse aber im Grunde überflüssig, denn nun sind die potentiellen Thetapositionen diejenigen, die in der Projektion eines Kopfes liegen, der die entsprechenden Thetarollen zu vergeben hat (vgl. z.B. Sportiche 1988, Koopman & Sportiche 1991). Gleichzeitig konnten diese Basispositionen der Argumente natürlich nicht als Zielpositionen von Bewegungsoperationen verstanden werden. Eine veränderte Fassung der A/A‘-Unterscheidung basierte daher nun auf der Möglichkeit der Kasuszuweisung: Innerhalb der VP konnte der Objektskasus zugewiesen werden, innerhalb der IP der Subjektskasus. Die Komplementposition von V, sowie die Spezifikatorposition von I waren damit (eine wieder strukturell heterogene Klasse von) A-Positionen. Auch diese Formulierung musste jedoch geändert werden, als die SpecHead-Relation als Grundlage von Merkmalsüberprüfungen etabliert wurde (vgl. z.B. Chomsky 1995). Nun wurden (im wesentlichen) SpecAgr-Positionen als A-Positionen definiert, insofern sie L-related features aufwiesen (vgl. Chomsky & Lasnik 1993).
3.2.1.2 Wegfall der SpecHead-Relation und merkmalsgetriebener Bewegungen In der aktuellen Syntax werden Merkmalsabgleiche nun aber nicht mehr vermittels SpecHead-Relationen implementiert und Agr-Projektionen werden dadurch überflüssig (so auch im theoretischen Rahmen der vorliegenden Arbeit, die nicht mit Agr-Positionen oder SpecHead-Relationen operiert, s.u.). Von diesem Wegfall der Agr-Projektion als lexikalischem Kopf sowie der Abwertung der SpecHead-
A- und A‘-Bewegungen der Government and Binding-Theorie
35
Relation als theoretischem Konzept wurde aber auch wieder die Definition von A/A‘-Positionen betroffen – eine Definition wurde damit theoretisch nämlich de facto unmöglich: Unter einer Agree-basierten Theorie werden Kasus letztlich überhaupt nicht mehr in bestimmten Positionen zugewiesen oder gecheckt, sondern in Domänen, die ein kasuslizensierender Kopf (z.B. v, C/T) enthält (vgl. z.B. Chomsky 2000 et seq.). Die Konfigurationen, in denen die Kasuslizenz etabliert werden kann sind lediglich restringiert nach den Maßgaben der phase impenetrability condition, vgl. Chomsky 1999, 2004). Damit muss gelten, dass eine Definition von A- und A‘-Bewegungen auf der Basis der aktuellen Syntax nicht auf Basis bestimmter Zielpositionen definiert werden kann: Die Eigenschaften, die die A/A‘-Unterscheidung definieren sollen, liegen nun ja überhaupt nicht mehr in bestimmten Positionen vor, sondern werden in größeren strukturellen Domänen verfügbar! Eine weitere (verwandte) Neuerung ergibt sich aus der Annahme, dass Merkmalsüberprüfungen ganz generell nicht per Bewegung erreicht werden müssen: Wo in alten Theorien die Möglichkeit einer (nötigenfalls coverten) Bewegung als Möglichkeit der merkmalsgetriebenen Spec-Bewegung zur Merkmalsüberprüfung angesehen wurde, wird heute der (phonologisch ja ohnehin nicht nachweisbare) coverte Bewegungsschritt gänzlich vermieden: Die Operation Agree erlaubt es, Merkmale ‚auf Distanz‘ zu überprüfen. Die strukturellen Konfigurationen, die in der älteren Theorie die Möglichkeit der coverten Bewegung definierten, sind in essentiell die gleichen, die in der aktuellen Theorie die Möglichkeit der Agree-Operation definieren. Damit wird also empirisch gar keine neue Vorhersage gegenüber der älteren Theorieform erreicht – nichtsdestotrotz aber werden Bewegungen und Merkmalsüberprüfungen nun theoretisch getrennt. Eine A-Bewegung als Bewegung zwecks Überprüfung bestimmter Merkmalstypen (der L-related features, vgl. Chomsky & Lasnik 1993) anzusehen, ist damit theoretisch obsolet, denn Bewegungen dienen nicht mehr der Überprüfung von Merkmalen. Im Verlaufe der achtziger und neunziger Jahre wurde aber versucht, die theoretisch vorhergesagte Unterscheidung zwischen A- und A‘-Bewegungen auch empirisch nutzbar zu machen: Für jede Art der Bewegung wurden Eigenschaften zusammengetragen, die diesen Typ von Bewegung auszeichnen sollten, insbesondere im Bereich der Bindungs- und Skopusanalyse: – A-Bewegungen hinterließen (NP-) Spuren, die Bindungsprinzip A unterlagen, A‘-Bewegungen hingegen hinterließen andere Spuren (Variablen), die Bindungsprinzip C unterlagen. Hieraus ergab sich, dass A-Bewegung eine lokale Bewegung war (d.h., grob gesagt, nur innerhalb eines Satzes durchgeführt wurde). A‘-Bewegung jedoch konnte potentiell auch nicht-lokale Umstellungen implementieren (etwa die Wh-Bewegung aus eingebetteten Sätzen heraus, vgl. z.B. Müller 2011).
36 –
Theoretische Grundannahmen der vorliegenden Analyse
A-Bewegungen erlaubten keine Rekonstruktion (ihr semantischer Effekt war also an der Oberflächenposition der relevanten Elemente ablesbar). A‘-Bewegungen hingegen erlaubten Rekonstruktion (konnten also z.B. ohne nachweisbare Skopusänderungen applizieren).
Die A/A‘-Unterscheidung ist damit ein theoretisches Relikt, denn: – Die aktuelle syntaktische Theorie sieht Spuren (genereller: Elemente, die durch die Derivation erzeugt werden, anstatt aus dem Lexikon zu stammen) nicht vor. Bewegungen können daher keine Spuren erzeugen. Eine Unterscheidung von Bewegungen anhand der (letztlich ohnehin nur stipulierten) Eigenschaften von (NP- und Wh-) Spuren ist damit nicht mehr möglich. – Die Repräsentation syntaktischer Bewegungen auf der semantischen Schnittstelle wird mittlerweile insgesamt als variabler und vielschichtiger angesehen, als es die A/A‘-Unterscheidung überhaupt abbilden konnte: Die semantische Komponente muss ganz generell in die Lage versetzt werden, aus den verschiedenen Kopien, die durch Bewegungen erzeugt wurden, diejenigen auszuwählen, die für die Berechnung von Skopus- und Bindungsverhältnissen auszuwerten sind. Rekonstruktion (in der alten Theorie eine Operation der LF-Derivation) ist daher weder vorgesehen noch ist sie nötig: Sie ist durch das Auftreten gleichwertiger Kopien in allen Positionen, in die oder durch die ein Element bewegt wird, eine grundsätzlich verfügbare Interpretationsoption (und keine Operation). Eine Definition der Unterscheidung auf der Basis per se verschiedener Bewegungsoperationen (etwa: internal merge A vs. internal merge A‘) widerspricht diametral dem Ansatz der aktuellen Theorie: Operationen und Unterscheidungen sollen ja, nach Möglichkeit, in diesem theoretischen Rahmen abgebaut werden! Abweichungen von diesem übergeordneten Ziel werden nur dann geduldet, wenn die empirische Beweislage die Unterscheidungen jenseits jedes begründeten Zweifels erzwingt. Eine solche empirische Lage liegt aber für die A/A‘Unterscheidung absolut nicht vor. Wie das nächste Unterkapitel zeigt, sind die empirischen Vorhersagen der A/A‘-Unterscheidung im Gegenteil immer wieder falsifiziert worden.
3.2.1.3 Der A/A‘-Unterscheidung fehlt die empirische Grundlage Mit der Dichotomie der A- und A‘-Bewegungen werden Bündelungen von Eigenschaften postuliert, die für bestimmte Bewegungen in dieser Form – also en bloc – zu gelten haben: Bewegungen sollen im Rahmen dieser Unterscheidung keine ‚Mischform‘ darstellen, also Eigenschaften von A- und A‘-Bewegungen mit-
A- und A‘-Bewegungen der Government and Binding-Theorie
37
einander vereinbaren. Diese Vorhersage der A/A‘-Dichotomie ist längst empirisch widerlegt. Bereits Webelhuth (1984) weißt darauf hin, dass Scrambling im Deutschen Eigenschaften von A- und A‘-Bewegungen vereint – und dies sogar in der Bewegung eines einzelnen Elementes: 15. Peter hat die Gästei ohne ei anzuschauen einander ti vorgestellt. Der Satz zeigt das sogenannte Webelhuth‘sche Paradox auf: Auf der einen Seite wird durch das Scrambling der DP die Gäste eine neue Bindungsrelation etabliert (die Gäste kann in dieser Position einander binden), was eine Eigenschaft von A-Bewegungen ist. Auf der anderen Seite lizensiert dieselbe Bewegung eine parasitic gap – eine Eigenschaft von A‘-Bewegungen. Eine Lösung für dieses Paradox hat es meines Wissens nie gegeben. Als weitere Eigenschaft von A-Bewegungen wurden ursprünglich differenzierte Lokalitätsbeschränkungen angenommen: Eine A-Bewegung sollte nicht in der Lage sein, ein anderes A-Element zu überqueren (vgl. z.B. Vikner 1994: 490). Interessanterweise aber kann diese Anforderung schon in der syntaktischen Theorie der 90er Jahre nicht mehr durchgehalten werden, wenn Bewegungen zur Merkmalsüberprüfung eingesetzt werden sollen: Angenommen, ein AgrS- und ein AgrO-Knoten sind für die Kasuslizenz von Subjekt und Objekt respektive verantwortlich. Objekte bewegen sich nach SpecAgrOP, Subjekte bewegen sich nach SpecAgrSP. Wie sich zeigt, wird mit diesen Annahmen in jeder möglichen Konfiguration von AgrSP und AgrOP zwangsläufig eine ‚überkreuzende‘ Bewegung definiert – wodurch die Kasuslizenz mindestens eines Arguments nicht hätte durchführbar sein sollen: 16. a) *[AgrSP... Agr S [AgrOP ...AgrO [VP... Basispositionen der Argumente ...]]] (Ungrammatisch: Subjekt muss AgrO überqueren) b) *[AgrOP... Agr O [AgrSP... AgrS [VP...Basispositionen der Argumente ...]]] (Ungrammatisch: Objekt muss AgrS überqueren) Die Lokalitätsrestriktionen mussten damit immer wieder abgeschwächt werden, um die postulierten Kasuslizenzen überhaupt implementieren zu können – eine echte empirische Vorhersage war mit einem derart eingeschränkten und abgeschwächten System letztlich kaum noch möglich. Es ist müßig, die postulierten Eigenschaften von A- und A‘-Bewegungen in Gänze durchzugehen, da die Inkonsistenzen bereits an dieser Stelle deutlich erkennbar werden. Der Leser sei daher an dieser Stelle auf die zitierte Literatur zur A/A‘-Unterscheidung verwiesen. Anstelle einer weiteren Diskussion sei hier
38
Theoretische Grundannahmen der vorliegenden Analyse
lediglich noch auf zwei von Richards erarbeitete Übersichten verwiesen, die augenfällig zeigen, dass die Vorhersagen der A/A‘-Unterscheidung für Wortstellungsvarianten wie object shift und Scrambling schlichtweg unzutreffend sind. Zum einen werden nur wenige A‘-Bewegungseigenschaften von Scrambling und object shift tatsächlich eingehalten (Richards 2004: 6): Tab. 1: A‘-Bewegungseigenschaften von Scrambling und object shift A-bar properties
Object Shift
Scrambling
Licenses parasitic gaps
NO
YES
Weak crossover effects
NO
NO
Reconstructs
YES
NO
Affects any category (XP)
NO
NO
Possible rightward movement
NO
NO
Long-distance possible
NO
NO
Discourse effects
YES
YES
Zum anderen aber weisen Scrambling und object shift auch nicht alle A-Bewegungseigenschaften auf (ebd.): Tab. 2: A-Bewegungseigenschaften von Scrambling und object shift A-properties
Object Shift
Scrambling
Case-driven
YES/ NO
NO
Affects only arguments
YES
NO
Feeds binding
NO
YES
Fed by V-Raising (equidistance)
YES
NO
Predicate formation (applies where no external ϴ)
NO
NO
Auch Putnam urteilt: „Scrambling in German displays both A- and A‘-characteristics“ (2007: 55). In der Summe muss daher gelten, dass eine binäre Unterteilung von Bewegungen in Bewegungen mit A- oder A‘-Eigenschaften empirisch nicht nur nicht legitimiert ist – sie muss im Gegenteil als empirisch widerlegt gelten.
A- und A‘-Bewegungen der Government and Binding-Theorie
39
Damit sind weder empirisch noch theoretisch Argumente dafür zu finden, weiterhin A/A‘-Bewegungstypen anzunehmen. Andere Autoren haben nun aus den Unzulänglichkeiten der A/A‘-Unterscheidung abgeleitet, dass Scrambling gar nicht durch syntaktische Bewegungsoperationen zu erklären ist. In den folgenden zwei Unterkapiteln möchte ich zeigen, dass dieser Schritt ein non sequitur ist: Scrambling lässt sich (im Rahmen der verwendeten generativen Theorie) tatsächlich nur als syntaktische Bewegung repräsentieren.
3.2.2 PF-Bewegungen erfassen syntaktische und semantische Merkmale von Scrambling nicht Die Wortstellungsvarianten des Deutschen scheinen sich gängigen Klassifizierungen von syntaktischen Bewegungen zu entziehen. Daraus haben einige Autoren (in jüngerer Zeit etwa Chomsky 1999) den Schluss abgeleitet, dass Scrambling-Umstellungen überhaupt keine syntaktischen Bewegungen sind: Mit der PF-Komponente der grammatischen Architektur liegt ein zweites System vor, welches gerade auch in der Erklärung linearer Phänomene – und zu denen zählt die Wortstellung – gute Dienste leistet. Warum also sollten die beobachtbaren Wortstellungsmuster nicht durch ‚phonologische‘ Umstellungen (vergleichbar etwa Regeln aus Ross‘ stylistic component (1967) oder den ‚bedeutungserhaltenden Transformationen‘ früher Transformationsgrammatiken) erklärt werden? Gegen Analysen dieser Art sprechen, wie sich zeigt, insbesondere zwei Eigenschaften von Scrambling: – Die Restriktionen, denen die beobachtbaren Wortstellungsmuster unterliegen, sind semantisch-pragmatischer und syntaktischer Art. Insofern die PFKomponente die Restriktionen der syntaktischen Komponente nicht (völlig redundant) replizieren soll, ist die PF-Komponente nicht in der Lage, die beobachtbaren Einschränkungen von Scrambling-Bewegungen abzubilden (vgl. 3.2.2.1.). – Scrambling-Umstellungen können semantische Effekte haben. Scrambling im Deutschen ist daher klar zu trennen von Scrambling etwa im Japanischen: Während in dieser Sprache gerade die Asemantizität der Umstellungen bestimmte Analysen ermöglicht (vgl. z.B. Boskovic & Takahashi 1998), muss es für das Deutsche als klar erwiesen gelten, dass Scrambling mit klaren semantischen Effekten einhergeht. Insofern die PF-Komponente solche semantischen Effekte per definitionem nicht abbilden soll, ist sie architektonisch ungeeignet, Scrambling zu implementieren (vgl. 3.2.2.2).
40
Theoretische Grundannahmen der vorliegenden Analyse
3.2.2.1 Scrambling ist syntaktisch, nicht phonologisch restringiert Wenn Scrambling tatsächlich eine phonologische Operation sein soll (etwa ähnlich der Operation DISL, vgl. Chomsky 1999, ähnlich auch Chocano 2007), dann muss diese Operation so implementiert sein, dass sie die eingangs genannten Restriktionen, denen Scrambling unterliegt, nicht verletzt. Es ist aber offensichtlich, dass die PF-Komponente gar nicht in der Lage ist, alle diese Restriktionen zu respektieren – nämlich dann nicht, wenn diese Restriktionen nur syntaktisch definiert werden können. Es erscheint wenig effizient, bereits in der Syntax repräsentierte Unterscheidungen und Mechanismen in der PF noch einmal zu replizieren. Anders aber bleiben wohletablierte Restriktionen unerklärt, wenn Scrambling denn tatsächlich eine Operation der PF-Komponente sein sollte. Beispiele für syntaktische Restriktionen sind etwa: – Scrambling kann nicht aus syntaktischen Inseln heraus erfolgen: 19. *Ich habe des Professors ja [den Sohn [des Professors]] gesehen. –
Scrambling im Deutschen ist – anders etwa als vergleichbare Wortstellungsvariationen im Russischen und Japanischen (vgl. z.B. Putnam 2007: 72) – satzgebunden: 20. *Ich meine [den Sohn des Professors] dass Maria [den Sohn des Professors] mag
Auch die semantischen Eigenschaften von Scrambling können in der PF-Komponente nicht angemessen dargestellt werden, wie das folgende Unterkapitel zeigt.
3.2.2.2 Semantische Effekte von Scrambling verbieten eine PF-Analyse Die PF-Komponente ist der Ort in der grammatischen Architektur, der Operationen aufnimmt, die phonologische Effekte haben, jedoch keine semantischen. Wenn eine Operation demnach phonologisch overte Umstellungen mit semantischen Effekten verbindet, so ist die PF schlicht der architektonisch falsche Ort für diese Operation: Operationen dieser Art sollen nur in der syntaktischen Komponente applizieren. Scrambling ist nun aber (wie eingangs gezeigt) ein Phänomen welches – zumindest in vielen Fällen – phonologische und semantische Effekte miteinander verbindet. Zum einen werden durch Scrambling oft informationsstrukturelle Effekte erzielt: Eine nach links aus seiner Basisposition bewegte Argumentphrase wird (im Regelfall) als kontextuell Gegeben (im Sinne von Büring 2006) interpretiert. Nur Phrasen, die nicht von Scrambling erfasst wurden können im Normal-
A- und A‘-Bewegungen der Government and Binding-Theorie
41
fall Fokusexponenten sein (vgl. aber Kapitel 10.5. für Einschränkungen dieser Generalisierung). Nun mag man betreffs dieser informationsstrukturellen Effekte argumentieren, dass diese gar keine satzsemantischen Eigenschaften im engeren Sinne sind. Sie sollten daher auch nicht in der semantischen Komponente des generativen Modells (ehemals: LF) repräsentiert werden. Es muss aber gelten, dass zumindest in manchen Fällen diese informationsstrukturellen Eigenschaften auch Auswirkungen auf die wahrheitsfunktionale Bedeutung eines Satzes haben, wie Büring (2006) zeigt: Angenommen, ich möchte den Fleischer Müller umbringen, jedoch nicht den Zahnarzt Schmidt. Die verschiedenen informationsstrukturellen Eigenschaften von Antwort A und Antwort A‘ führen dann dazu, dass ich A, jedoch nicht A‘ wahrheitsgemäß äußern kann: 21. Frage: Wie war‘s beim Zahnarzt? A: Frag bloß nicht... ich würde den Metzger am liebsten UMbringen! A‘ Frag bloß nicht... ich würde am liebsten den METZger umbringen! Nun mag man immer noch argumentieren, dass die verschiedenen kontextuellen Bedeutungen der Antworten A und A‘ in einer anderen Komponente berechnet werden als der satzsemantischen Komponente, die von der Syntax im Rahmen der grammatischen Architektur der generativen Grammatik gespeist wird – tatsächlich ist die Repräsentation von IS-Effekten im Rahmen dieser Architektur ein bisher kontrovers diskutiertes Thema. Die bereits genannten Skopuseffekte von Scrambling aber müssen satzsemantisch repräsentiert sein: Sie sind, vor allen anderen satzsemantischen Eigenschaften, die raison d‘être der semantischen Komponente (vgl. zu LF-Bewegungen etwa May 1977, 1985). Wenn demzufolge per Scrambling permutierte Strukturen andere Skopuslesarten zulassen als nichtpermutierte (und dies wurde von Frey 1993 überzeugend gezeigt), dann erzeugt Scrambling exakt diejenigen Effekte, die eine PF-Operation im definierten architektonischen Rahmen nicht haben darf. Zudem lassen sich auch Bindungseffekte durch Scrambling erzielen, die in der aktuellen Syntax auf der semantischen Schnittstelle (nicht der PF) evaluiert werden müssen. In der Basisabfolge kann das direkte Objekte die Gäste im folgenden Beispiel nicht binden (a), in der durch Scrambling abgeleiteten Position hingegen schon (b): 22. a) *Gestern habe ich einanderi die Gästei vorgestellt. b) Gestern habe ich die Gästei einanderi vorgestellt. (Bsp. Chocano 2007: 129) Abschließend lässt sich daher festhalten: Scrambling-Vorgänge mit skopalen Auswirkungen oder Bindungseffekten können – unter den gegebenen architektoni-
42
Theoretische Grundannahmen der vorliegenden Analyse
schen Annahmen – keine Operation der phonologischen Komponente sein (vgl. für eine ähnliche Einschätzung auch Molnarfi 2004: 338, Putnam 2007: 91, Sabel 2005: 282).
3.2.3 Basisgenerierung erfasst die Markiertheit syntaktischer Bildungen nicht ausreichend Da sowohl syntaktische wie auch phonologische Bewegungsansätze im Rahmen der Government and Binding-Theorie in theorieinterne Widersprüche geraten, wurde von manchen Autoren vorgeschlagen, Scrambling-Abfolgen bereits in der Strukturerzeugung – also unabhängig von allen syntaktischen und phonologischen Permutationen – abzubilden (vgl. z.B. Bayer & Kornfilt 1994, Fanselow 2001, 2003, Neeleman & Reinhart 1998). Wie sich zeigt, haben diese Ansätze aber Schwierigkeiten damit, eine der Grundeigenschaften deutscher Wortstellung – die Unterscheidung von stärker und weniger stark markierten Abfolgen – überzeugend abzubilden. In den folgenden Unterkapiteln werden zwei Probleme umrissen: – Basisgenerierungsansätze haben letztlich nur wenige Möglichkeiten, die informationsstrukturelle Einzigartigkeit der Basisabfolge zu erklären (vgl. 3.2.3.1.). – Basisgenerierungsansätze haben Probleme damit, die besonderen Skopuseigenschaften der Basisabfolge zu erklären (vgl. 3.2.3.2.). – Insgesamt erscheint es zudem schwierig, den Zusammenhang zwischen den informationsstrukturellen und skopalen Besonderheiten der Basisabfolge auf effiziente Weise zu erklären.
3.2.3.1 Basisgenerierungsansätze erklären die Unmarkiertheit der Basisabfolge nicht Im Rahmen einer Basisgenerierungstheorie werden alle oberflächlich beobachtbaren Wortstellungen als Ergebnis komplexer Strukturerzeugung verstanden, z.B.: 23. a) [Subjekt [indirektes Objekt [direktes Objekt V]]] b) [Subjekt [direktes Objekt [indirektes Objekt V]]] c) [direktes Objekt [indirektes Objekt [Subjekt V]]] usw. Durch diese Annahme werden Bewegungsoperationen (oder PF-Permutationen) nicht mehr benötigt: Alle Abfolgen werden unterschiedslos mit den – entspre-
A- und A‘-Bewegungen der Government and Binding-Theorie
43
chend flexibel zu implementierenden – Mitteln der Basisgenerierung erzeugt: „The application of Merge is not constrained by any grammatical principle, so the order in which Merge applies [...] is free. Different linearizations can be generated directly by Merge“ (Fanselow 2001: 417). Während Analysen dieses Typs tatsächlich zunächst auf komplexe Bewegungsoperationen verzichten können, gereicht ihnen dies dennoch nicht zu insgesamt größerer theoretischer Sparsamkeit: In Bewegungsanalysen kann die unmarkierte Basisabfolge als das Ergebnis einer – weniger flexiblen – Projektion der thematischen Rollen des Verbs dargestellt werden. Mit anderen Worten: In dem Ausmaß, in dem Bewegungsanalysen die Bewegungskomponente verkomplizieren, können sie die Implementation der Strukturerzeugung vereinfachen. Diese Verschiebungen erscheint aber angesichts der aktuellen theoretischen Implementation von Strukturerzeugung und -veränderung als gesamttheoretisches Nullsummenspiel: Da sowohl external merge wie internal merge letztlich die selbe Operation sind (nämlich merge), kann in der aktuellen Theorie kein Gewinn an theoretischer Effizienz erreicht werden, wenn man internal oder external merge auf Kosten der vermeintlich anderen, letztlich ja aber theoretisch identischen Suboperation vereinfachen möchte: Merge wird nicht ‚einfacher‘, wenn bestimmte Instanzen von Merge auf Kosten anderer Instanzen von Merge vereinfacht. Basisgenerierungsansätze sind meiner Meinung nach daher in keiner definierbaren Weise ‚einfacher‘ als Bewegungsansätze. Empirisch scheinen Basisgenerierungsansätze darüber hinaus Schwierigkeiten damit zu haben, die informationsstrukturelle Unmarkiertheit der Basisabfolge auszudrücken: Da letztlich alle Wortstellungsmuster durch die immer gleichen Strukturerzeugungsoperationen generiert werden, ist nicht a priori klar, warum eine der Abfolgen kontextuell weniger restringiert sein soll als alle anderen. Bewegungsanalysen können hingegen die Basisabfolge als das Ergebnis der ‚reinen‘ Projektion der Thetarollen des Prädikats darstellen: Da die informationsstrukturellen Effekte durch Bewegungsoperationen erklärt werden sollen, ist die Basisabfolge schlicht diejenige Abfolge, die keiner solchen informationsstrukturellen Spezifizierung unterworfen wurde. Sie ist daher die informationsstrukturell (auch im technischen Sinne der Merkmalslizensierung) unmarkierte Abfolge. Es soll hier nicht der Eindruck erweckt werden, dass Basisgenerierungsansätze generell unfähig seien, eine informationsstrukturell besonders unmarkierte Basisabfolge zu bestimmen. Es muss aber die Einschätzung gelten, dass Basisgenerierungsansätze diese unmarkierteste Abfolge nicht ohne weitere Zusatzannahmen definieren können. Damit werden diese Ansätze zumindest in informationsstruktureller Hinsicht komplexer, als Bewegungsansätze es sein müssen. Wenn die Verschiebung der syntaktischen Komplexität von der Bewegung- in
44
Theoretische Grundannahmen der vorliegenden Analyse
die Strukturerzeugungskomponente demnach keine architektonische Vereinfachung mit sich bringt, dann geraten Basisgenerierungsansätze in den Verdacht, insgesamt doch die aufwändigeren Ansätze zu sein – entgegen dem erklärten methodologischen Ziel theoretischer Sparsamkeit. Auch für die Berechnung der Normalbetonung lässt sich möglicherweise zeigen, dass eine variablere Basisgenerierung komplexer zu behandeln ist als Analysen mit fester Basisabfolge (vgl. Molnarfi 2004: 349f.). Kernsyntaktisch ist zu fragen, welchen Restriktionen etwa Operationen unterliegen sollen, die zur Vorfeldbesetzung im Deutschen führen: Wenn auch das Subjektargument eines Satzes in erster Verkettung mit dem Verb verbunden werden kann, was verhindert dann Derivation wie die folgende: 24. Mögliche Basisgenerierungen der Argumente: a) [vP Obj...[VP Subj V]] b) [vP Subj...[VP Obj V]] Vorhergesagte Bewegungen nach SpecCP dann: a‘) [CP [VP Obj V] Vfin [TP ...[vP Subj [VP Obj V]] b‘) [CP [VP Subj V] Vfin [TP ...[vP Obj [VP Subj V]]] Wenn es also keine bevorzugte Basisabfolge gibt, die besagt, dass Objekt und Verb (nicht aber Subjekt und Verb) eine Konstituente bilden, warum sind dann die Beispiele in (a) und (b) nicht gleichermaßen unmarkiert: 25. a) [VP Den Postboten gebissen] hat der Hund erst einmal b)*[VP Der Hund gebissen] hat den Postboten erst einmal. (Bsp. Bayer & Kornfilt 1994: 38) Ich glaube zwar nicht, dass die Abweichung in Beispiel (b) in jedem Fall (insbesondere: unter jeder möglichen Intonation) auftritt, aber dennoch muss (a) hier als der deutlich unmarkiertere Fall gelten – wofür eine variable Basisgenerierung aber keine einfache Erklärung bereithält. Damit zeigt sich insgesamt, dass eine unrestringierte Basisgenerierung zumindest vor der Hand keine insgesamt klar erkennbar ‚einfacheren‘ Analysen liefert als eine Analyse mit fester Basisabfolge. Ein ähnliches Bild bietet sich auch bei der Darstellung von Skopusverhältnissen im Deutschen, wie das nächste Unterkapitel zeigt.
A- und A‘-Bewegungen der Government and Binding-Theorie
45
3.2.3.2 Basisgenerierung erklärt besondere Skopuseigenschaften der Basisabfolge nicht Mit Frey (1993) liegt eine für die vorliegende Arbeit besonders wichtige Veröffentlichung vor: Wie Frey zeigen kann, unterscheiden sich die verschiedenen Wortstellungsmuster des Deutschen nicht nur informationsstrukturell. Vielmehr führen syntaktische Umstellungen im Mittelfeld auch zu veränderten Bedingungen für die logisch-semantische Interpretation des Satzes: Lediglich die Basisabfolge von (quantifizierten) Argumenten ist (unter Verumfokus-Intonation) skopuseindeutig. Alle permutierten Abfolgen von quantifizierten Argumenten hingegen erlauben sowohl den Oberflächenskopus des umgestellten Arguments wie auch den inversen Skopus, der der Basisposition der Argumente entspricht: „Dies bedeutet also, daß durch ‚Bewegung‘ die Skopusoptionen einer Phrase erweitert werden können“ (Frey 1993: 185). Dieser Zusammenhang zwischen syntaktischer Bewegung und semantischer Interpretation wird nun in einer Bewegungsanalyse – nicht aber in einer Basisgenerierungsanalyse – besonders einleuchtend erklärt. Die Basisabfolge bietet für jedes quantifizierte Argument (jede Argument-QP) nur eine Position an, in der das Argument semantisch interpretiert werden kann (a). Finden Bewegungen einer QP statt, so stehen mehrere Positionen bereit, in denen die QP interpretiert werden kann (b). Diese Positionen können semantisch ausgewertet werden und ergeben die verschiedenen Skopoi auf sehr transparente Art und Weise: 26. a) Basisabfolge: [VP QPNOM [V‘ QPACC V]] b) Objekt-Scrambling: QPACC...[VP QPNOM [V‘ QPACC V]] Das (bereits o.a.) Skopusprinzip Freys (vgl. 1993: 206) wird hier transparent umgesetzt: QPAcc hat (in seiner hohen Kopie) Skopus über QPNom, QPNom aber auch über (die tiefe Kopie von) QPAcc. Basisgenerierungsansätze hingegen nehmen keinen vergleichbaren strukturellen Reflex an, der die verschiedenen Interpretationen der zwei – nun gleichermaßen basisgenerierten! – Abfolgen in (a) und (b) erklären könnte: 27. a) Eine Abfolge: [QPNOM [QPACC V]] b) Andere Abfolge: [QPACC [QPNOM V]] Natürlich wäre auch für die Abbildung der Skopusverhältnisse denkbar, weitere Zusatzannahmen zu formulieren, die die semantische Komponente anleiten, die Abfolge in a) anders zu interpretieren als die Abfolge in b). Dieser Schritt erscheint
46
Theoretische Grundannahmen der vorliegenden Analyse
zum einen aber wiederum theoretisch aufwändig. Die Basisgenerierungsanalyse muss erneut Zusatzannahmen machen, die für Bewegungsansätze nicht nötig sind. Zum anderen – und vielleicht bedeutsamer – erfassen auch solche Zusatzannahmen nicht in vergleichbar augenfälliger Weise wie die Bewegungsanalysen, welcher Zusammenhang zwischen der Informationsstruktur auf der einen Seite und der Skopusinterpretation auf der anderen Seite besteht: Eine Abfolge ist sowohl informationsstrukturell unmarkiert als auch skopal eindeutig. Andere Abfolgen sind sowohl informationsstrukturell spezifischer, wie auch in skopaler Hinsicht mehrdeutig. Es wäre – zumindest ohne noch mehr Zusatzannahmen – nicht zu vermuten, dass die informationsstrukturell markiertere Abfolge mehr Skopuslesarten zulässt als die informationsstrukturell weniger markierte Abfolge (und zwar insbesondere dann, wenn versucht wird, die beiden interpretativen Eigenschaften in verschiedenen Komponenten der grammatischen Architektur unterzubringen, wie oben hypothetisch angesetzt). Eine Erklärung dieses Zusammenhangs ist für Basisgenerierungsanalysen nur sehr schwierig herzustellen. Damit sind Basisgenerierungsanalysen aus meiner Sicht kaum in der Lage, die bekannten empirischen Eigenschaften von Scrambling-Strukturen intuitiv nachvollziehbar und theoretisch sparsam zu erklären. Vor allen Dingen werden die beobachteten Zusammenhänge zwischen den einzelnen empirischen Eigenschaften in Bewegungsanalysen nach meinem Dafürhalten wesentlich überzeugender zusammengebunden – Bewegungsanalysen sind damit nicht nur theoretisch sparsam, sondern machen auch eine besonders starke empirische Vorhersage. Damit sind alle Möglichkeiten der Repräsentation von Wort-(um)-stellungen im Rahmen der Government and Binding-Theorie erschöpft. Wie sich zusammenfassend zeigt, sind die theoretischen Prämissen dieses Theoriestandes nicht geeignet, eine Analyse von Scrambling empirisch zufriedenstellend und methodisch effizient durchzuführen. Sie sollen daher in der vorliegenden Arbeit nicht weiter verfolgt werden. Im folgenden Unterkapitel 3.3. wird vielmehr dargelegt, welche theoretische Rahmensetzung mit der aktuellen syntaktischen Forschung vorliegt. Nur dieser aktuellen Theorie ist die vorliegende Arbeit verpflichtet.
3.3 Theoretische Annahmen im Rahmen dieser Arbeit Um die Grundlagen meiner Analyse explizit zu machen, soll im Folgenden ein aktueller Vorschlag zur Implementation syntaktischer Strukturbildung und zur Repräsentation syntaktischer Umstellungen verwendet werden. In Unterkapitel 3.3.1. werden überblicksartig die Operationen vorgestellt, die im hier gewählten theoretischen Rahmen für die Strukturerzeugung und Strukturveränderung zur
Theoretische Annahmen im Rahmen dieser Arbeit
47
Verfügung stehen. Unterkapitel 3.3.2. diskutiert eine Beispielderivation. Im Unterkapitel 3.3.3. wird abschließend kurz vorgestellt, welche prosodischen und informationsstrukturellen Annahmen die Arbeit macht.
3.3.1 Für die vorliegende Analyse relevante syntaktische Operationen Technische Implementationen der Strukturbildung und Strukturveränderung werden im Rahmen der aktuellen Forschung in den Feinheiten nahezu kontinuierlich verändert und die verschiedenen Varianten werden kontrovers diskutiert. Die vorliegende Arbeit enthält sich bezüglich der verschiedenen Unterdifferenzierungen, die hier möglich sind, jedes Kommentars. Die hier angenommenen syntaktischen Operationen können als relativ unkontrovers gelten, da jede vergleichbare Theorie ähnliche oder gleiche Operationen vorsieht: – Die Strukturbildung im Rahmen einer Derivation wird durch external merge (EM) repräsentiert. External merge verkettet lexikalische Elemente zu binären, hierarchischen Konfigurationen. Auf diese Weise beginnt mit EM (ähnlich wie mit der X-bar-Projektion in älteren Theorieansätzen) die Strukturbildung – und damit die gesamte formale Ableitung einer Satzstruktur. Verkettet external merge hierbei Ausdrücke miteinander, die als Prädikate und Argumente aufgefasst werden können, repräsentiert EM die Argumentstruktur des Satzes. – Internal merge (IM) verkettet Elemente, die bereits vor der Anwendung von IM Bestandteil der syntaktischen Struktur waren (in älteren Modellen wurden durch X-bar erzeugte Strukturbestandteile durch Bewegung/ move-α in ähnlicher Weise ‚disloziert‘). Da sich aus diesen Umstellungen Auswirkungen für die Stellung auch skopus- oder bindungsrelevanter Elemente ergeben können, repräsentiert IM die Tatsache, dass in vielen Sprachen mit verschiedenen Wortstellungsmustern auch verschiedene Skopus- und Bindungslesarten sowie bestimmte Informationsstruktureffekte verbunden sind (vgl. Chomsky 2007, 2008). – Das heißt jedoch nicht, dass IM ‚teleologisch‘ operiert: IM ist nicht semantisch gesteuert, sondern appliziert ‚blind‘ (Chomsky 1999: 26). D.h., IM kann nicht applizieren, damit ein bestimmter Effekt für die Phonologie oder Semantik des Satzes entsteht: Da diese Eigenschaften erst den erzeugten Strukturen (nach Abschluss von IM) zukommen und daher erst durch die semantische Schnittstelle bzw. durch die phonologische Schnittstelle PF bearbeitet werden, kann IM nicht durch seine eigenen Ergebnisse gesteuert sein: Dies wird zusammengefasst in der Maßgabe No look-ahead (vgl. Chomsky 2007 et seq.).
48 –
–
–
–
Theoretische Grundannahmen der vorliegenden Analyse
Internal merge und external merge sind keine voneinander unterschiedenen Operationen, sie lassen sich lediglich dadurch unterscheiden, dass sie – wie gerade gezeigt – Objekte verschiedener Herkunft verketten. Es muss aber gelten, dass EM und IM keine voneinander unterschiedenen formalen Eigenschaften haben. Es gibt nur eine (strukturerzeugende und strukturverändernde) Operation Merge. Merge kann obligatorisch applizieren, genau dann wenn es durch formale Merkmale (z.B. das EPP von T) erzwungen wird. Im Rahmen dieser rein formalen Bewegungen ist nicht zwingend zu erwarten, dass durch EM oder IM semantische Effekte ausgelöst werden. Da external merge auf jedes beliebige syntaktische Objekt applizieren kann, muss auch internal merge frei applizieren können. Das Potential eines Objektes, in syntaktischen Strukturen verkettbar zu sein (sei es durch IM oder EM) wird als sogenanntes edge feature (EF) bezeichnet. Optionales IM führt also zu optionalen, EF-getriebenen Bewegungen. Optionale Bewegungen sind aber dennoch restringiert: „optional operations can apply only if they have an effect on outcome“ (Chomsky 1999: 28). Ohne effect on outcome (EoO) ist eine Bewegung nicht legitim (ebd.: 29). Biberauer & Richards fassen die Möglichkeiten wie folgt zusammen (2006: 40): Optional rules [...] feed obligatory interpretations; Obligatory rules [...] feed optional interpretations.
3.3.2 Illustration der syntaktischen Operationen: Eine Beispielderivation Im folgenden Abschnitt soll nun kurz demonstriert werden, wie die angenommenen Operationen im Rahmen der Derivation eines einfachen Satzes figurieren. Die hier gewählte Darstellung ist als grober (z.T. sogar sehr grober) Überblick zu verstehen – für eine umfangreichere Darstellung der Annahmen der Theorie sei der Leser ausdrücklich auf die einschlägigen Einführungswerke verwiesen (für leicht verschiedene Theoriestände zum Beispiel auf Radford 1997, Adger 2003, Hornstein et al 2005). Jede Derivation beginnt mit einer beliebigen Auswahl von lexikalischen Elementen. Diese Elemente werden per external merge verkettet, ggf. per internal merge umgestellt und, wo nötig, per Agree in Kongruenzrelationen gesetzt. Wichtig für das Verständnis des grammatischen Modells ist aber ausdrücklich, dass es sich bei einer Derivation niemals um den willentlichen Akt eines Sprechers handelt, der ‚etwas ausdrücken möchte‘. Vielmehr soll für prinzipiell jede Auswahl von
Theoretische Annahmen im Rahmen dieser Arbeit
49
lexikalischen Elementen überprüfbar sein, ob mit dieser Auswahl eine konvergierende Derivation möglich ist. Das heißt, dass im Rahmen einer Derivation überprüft wird, ob mit dieser Auswahl von lexikalischen Elementen eine Struktur gebildet werden kann, die: – gemäß den Eigenschaften der syntaktischen Operationen gebildet wurde – und der eine phonologische Repräsentation zugewiesen werden kann – und der eine semantische Repräsentation zugewiesen bekommen kann. Wenn alle drei Maßgaben erfüllt sind, so gilt, dass die derivierte Struktur: – (mindestens) einem Mitglied der Menge der möglichen Sätze (der jeweiligen Sprache) zukommt und – dass ihr bestimmte phonologische Eigenschaften zukommen und – dass sie bestimmte semantische Eigenschaften hat. Um das Prinzip zu veranschaulichen, sollen hier sehr kurz zwei Arten von Derivationen vorgestellt werden: eine konvergierende (also: regelkonforme) Derivation und zwei Derivationen, die einen crash erleiden – und daher keinem wohlgeformten Satz zugeordnet werden können.
3.3.2.1 Nicht mögliche Derivationen führen zum crash Es lässt sich leicht zeigen, dass es unendlich viele Derivationen gibt, die nicht konvergieren. Eine Großzahl von Mengen von lexikalischen Elementen lässt sich im Deutschen zudem schon rein intuitiv nicht nach den Regeln der Grammatik zu wohlgeformten Sätzen verbinden, zum Beispiel: 28. a) {auf, neben, unter} b) {Haus, Fluss} Wie weist die Kernsyntax die Unmöglichkeit nach, mit diesen lexikalischen Elementen akzeptable Sätze zu bilden? Für Beispiel (a) ist zunächst denkbar, dass die Operation external merge die lexikalischen Elemente verkettet, z.B. wie in: 29. Merge (auf, neben) Merge ([auf neben], unter)
⟶ ⟶
[auf neben] [[auf neben] unter]
Natürlich kann eine solche Derivation aber – gleich aus mehreren Gründen – nicht konvergieren. So wird z.B. die semantische Komponente weder akzeptieren, dass die Präposition auf durch den ersten Verkettungsschritt als Argument von neben interpretiert werden kann, noch umgekehrt. Das gleiche gilt auch für
50
Theoretische Grundannahmen der vorliegenden Analyse
die Verkettung von unter mit der Konstituente [auf neben]. Semantisch konvergiert die Derivation daher nicht. Und auch für die PF-Komponente ergeben sich unüberwindliche Probleme – die Abbildung der hierarchischen Konfiguration [[auf neben] unter] auf eine lineare Sequenz etwa ist nicht regelkonform möglich: Alle drei lexikalischen Elemente fordern als Prä-positionen, dass sie ihrem strukturellen Komplement in der PF-Repräsentation vorangehen. Dadurch kann die Struktur nicht erfolgreich linearisiert werden: 30.
Strukturell a) [[auf neben] unter] b) [[neben auf] unter] c) [unter [auf neben]] d) [unter [neben auf]]
Linear *auf neben unter *neben auf unter *unter auf neben *unter neben auf
Wie leicht zu sehen ist, ist die Maßgabe, dass jede Präposition ihrem Komplement vorangeht nicht zu lösen: Die jeweils zuletzt stehende Präposition kann ihre Linearisierungsvorgabe nicht umsetzen. Damit konvergiert Beispiel (a) weder an der semantischen noch an der phonologischen Schnittstelle. Alle alternativ denkbaren Derivationen werden ebenfalls (neben den genannten auch noch aus vielen anderen Gründen) zu dem gewünschten Ergebnis kommen: Aus den lexikalischen Elementen neben, auf und unter lässt sich im Deutschen kein wohlgeformter Satz bilden. Auch Beispiel (b) kann nicht konvergieren, denn die Derivation scheitert wiederum an diversen Problemen. Um nur einige wenige zu nennen: Weder Haus noch Fluss kann syntaktisch das jeweils andere lexikalische Element als Komplement verketten: Weder kann Haus ohne weiteres (d.h. ohne Kopula, ohne Determinerprojektion, etc.) als Argument von Fluss interpretiert werden, noch umgekehrt. Damit ist keine Konvergenz an der semantischen Schnittstelle möglich, wenn Haus und Fluss per external merge verkettet werden sollen. Zudem ist auch hier keine Konvergenz an der phonologischen Schnittstelle möglich: Da sowohl Haus wie auch Fluss Nomina sind, kommen beide lexikalischen Elemente mit einem Kasusmerkmal in die Derivation, welches durch die Derivation mit einem Wert zu versehen ist (etwa: [Kasus: Nominativ], [Kasus: Akkusativ], usw.). Nun ist aber leicht zu sehen, dass zwischen den lexikalischen Elementen Haus und Fluss keine Kasusrektion im traditionellen Sinne etabliert werden kann (in aktuellen Termini ausgedrückt: weder Haus noch Fluss verfügen über Sondenmerkmale, die das Kasusmerkmal des anderen lexikalischen Elements per Agree mit einem Merkmalswert versehen – valuieren – könnten). Durch die Maßgabe der inclusiveness wird darüber hinaus sichergestellt, dass Operationen nur zwischen lexikalischen Elementen bestehen können: Operationen werden nur von Merkmalen ausgelöst, die lexikalisch inhä-
Theoretische Annahmen im Rahmen dieser Arbeit
51
rent den an der Derivation beteiligten Elementen zugewiesen werden können. Mit anderen Worten: Die Kasuslizenz von Fluss und Haus kann nicht ‚aus dem Nichts‘ erreicht werden, etwa aus der Konfiguration, die von beiden gebildet wird, durch eine übergeordnete ‚Satzkonstruktion‘, o.ä.. Nur eine kasuslizensierende Sonde (z.B. die entsprechenden Merkmale eines v/V-Komplexes, einer C/T-Konfiguration oder auch einer Präposition) könnte dieses Kasusvaluierung herbeiführen. Wie leicht vorstellbar ist, ist die Zahl der nicht konvergierenden Derivationen unendlich groß: Für jede Menge von lexikalischen Elementen kann nämlich gezeigt werden, dass diese Menge evtl. nicht nur zu konvergierenden Derivationen, sondern auch zu nicht-konvergierenden Derivationen führen kann. Wie sich allerdings auch leicht vorstellen lässt, ist die Demonstration solcher crashs oft aber geradezu atemberaubend langweilig: Sie ist durch beliebige Fehlanwendungen syntaktischer Operationen ebenso zu erreichen wie durch eine von Anfang an ungeeignete Auswahl von lexikalischen Elementen (wie z.B. die oben verwendeten). Die einzige Aussage, die sich aus diesen technischen Demonstrationen von crashs aber immer wieder ergibt ist, wie ein Satz nicht auszusehen hat. Wenn aber einem akzeptablen Satz einer Sprache auch nur eine einzige konvergierende Derivation zugeordnet werden kann, so wird der Satz als möglicher Satz vorhergesagt. Die interessantere Frage ist daher: Wie kann eine konvergierende Derivation ablaufen?
3.3.2.2 Mögliche Derivation konvergiert Vorausgesetzt, die Auswahl von lexikalischen Elementen, die in eine Derivation eingespeist werden, umfasst die folgenden Bestandteile: 31. {Peter, isst, einen, Kuchen, {3.Singular, Indikativ, Präsens, EPP}T, C, v} Angenommen, die Derivation vollzieht zunächst eine Reihe von Vorgängen des Typs external merge: 32. Merge (isst, Kuchen) Merge (v, [Kuchen isst])
⟶ ⟶
[Kuchen isst] [[Kuchen isst] v]
Mit dem Kopf v liegt nun ein Kopf vor, der das Kasusmerkmal von Kuchen valuieren kann: das Kasusmerkmal erhält den Wert [Kasus: Akkusativ]. Zugleich erfordert v aber, dass ein weiteres Argument in die syntaktische Struktur verkettet wird. Appliziert external merge an dieser Stelle auf Peter, so ergibt sich: 33. Merge (Peter, [[Kuchen isst]v])
⟶
[Peter [[Kuchen isst]v]]
52
Theoretische Grundannahmen der vorliegenden Analyse
Wird nun das Element T verkettet, welches die Merkmale des Verbs steuert, so kann wiederum Agree stattfinden: Zum einen kann T das Kasusmerkmal des zuletzt verketteten Arguments Peter per Agree valuieren: Peter erhält den Kasusmerkmalswert [Kasus: Nominativ]. Zum anderen kann das Verb per internal merge mit seinen Tempus-, Modus- und Kongruenzmerkmalen assoziiert werden (im Sinne der syntaktischen Kopfbewegung älterer Theoriestände). T enthält nun allerdings, wie o.a., zusätzlich zu den Verbeigenschaften ein sogenanntes EPPMerkmal. EPP-Merkmale erzwingen, dass der Kopf, der das EPP-Merkmal in die Derivation einführt, ein weiteres Element an der Wurzel der derivierten Struktur verkettet. Da Agree die Kasuslizenz von Peter herbeigeführt hat, muss Agree (nach der Maßgabe Maximize Matching, vgl. Chomsky 1999) nach Möglichkeit auch das EPP-Merkmal mit Peter abgleichen. Auf diese Weise wird repräsentiert, dass (zumindest einer langstehenden Analysetradition nach, vgl. aber Kapitel 6 für eine alternative Annahme!) das nominativische Argument mit der Wurzel des Strukturbaums verkettet wird. Wird T also per external merge verkettet, so folgt daraus auch direkt eine Instanz von internal merge, die auf Peter appliziert: 34. Merge (T, [Peter [[Kuchen isst]v]]) ⟶ [Peter [Peter [[Kuchen isst]v]]isst-T] C-Elemente steuern die referentiellen Eigenschaften von propositionalen Strukturen (vgl. Struckmeier 2007 für einen aktuellen Vorschlag zur Typologie von referentiellen Köpfen). In dem Falle, dass kein subordinierendes C-Element verkettet wird, wird das Verb per internal merge in der C-Position verkettet (wiederum: entsprechend einer Kopfbewegung). Da C aber auch ebenfalls ein EPP-Merkmal aufweist, folgt auf die Verkettung von C per external merge eine weitere Instanz von internal merge, um ein Element (im gegebenen Beispiel wieder Peter) erneut an der Wurzel des Strukturbaums zu verketten: 35. Merge (C, [Peter [Peter [[Kuchen isst]v]] isst-T]) ⟶ [Peter isst-C [Peter [Peter [[Kuchen isst]v]] isst-T]] Damit ist die (hier stark vereinfachte) syntaktische Derivation abgeschlossen. Wie sich zeigt (und wie sich im weiteren Verlauf der Arbeit als wichtig erweisen wird), ist die Ausgabe der Syntax also eine strukturelle Konfiguration, die nur entfernte Ähnlichkeit mit der linearen Abfolge von Wörtern aufweist, die ein Satz wie Peter isst den Kuchen aufweist. Diese hierarchische Struktur wird von den Schnittstellen der Syntax ausgewertet: Eine phonologische Schnittstelle (PF für phonological form) wertet die phonologischen Eigenschaften der Struktur aus, eine semantische Schnittstelle die (satz-) semantischen.
Theoretische Annahmen im Rahmen dieser Arbeit
53
Folgende semantische Eigenschaften können (mindestens) aus der syntaktischen Struktur abgeleitet werden: 36. a) External Merge von Kuchen und isst besagt, dass Kuchen ein Argument von V ist (hier also als Patiens von isst interpretiert werden kann). b) External Merge von Peter mit der v-Konstituente besagt, dass Peter in der Proposition [Peter Kuchen isst] ebenfalls als Argument fungiert (hier: als Agens). c) Die T-Merkmale Tempus und Modus können semantisch ausgewertet werden und spezifizieren die Proposition weiter. d) Die C-Merkmale sind ebenfalls semantisch interpretierbar und steuern die Referenz der Gesamtstruktur: Mit dem selbstständigen deklarativen Hauptsatz, der hier gebildet wird, liegt autonome Referenz im Sinne von Struckmeier (2007) vor. Auch die phonologische Schnittstelle leistet mehrere Abbildungsvorgänge: – Der Strukturbaum wird linearisiert: Die (a priori gar nicht linearisierte) syntaktische Struktur wird auf eine lineare Sequenz abgebildet (die in der Darstellung oben bereits zielsprachlich korrekt angelegt wurde). Die Linearisierung eines Strukturbaums folgt in Teilen sprachspezifischen Eigenschaften (vergleichbar etwa der älteren Vorstellung von Linearisierungsparametern), zum Teil ist sie vermutlich auch für einzelne lexikalische Elemente idiosynkratisch spezifiziert. Da Linearisierungsprozesse in der vorliegenden Arbeit keine Rolle spielen, sollen sie hier nicht weiter erörtert werden. – Die Kopien der per internal merge (=mehrfach) verketteten Elemente werden nur zum Teil phonologisch overt ausbuchstabiert. Die Abbildung der syntaktischen Struktur auf eine lineare Wortfolge muss daher eine Auswahl zwischen Kopien treffen. Dieser letzte Punkt ist besonders wichtig für die vorliegende Arbeit: Es gilt, dass für alle per internal merge ‚bewegten‘ Phrasen (hier mindestens: Peter und isst) entschieden werden muss, an welcher Stelle in der linearen Struktur diese Elemente ‚ausbuchstabiert‘ werden sollen, d.h.: Welche der Kopien wird in der phonetischen linearen Abfolge repräsentiert (und welche nicht)? Die PF trifft im hier gegebenen Beispielen (aus Gründen, die hier nicht weiter erörtert werden brauchen) die Entscheidung, nur die jeweils strukturell höchsten Kopien von Peter und isst auszubuchstabieren – eine ähnliche Vorgabe wäre in älteren Theorien durch das Konzept der Spur ausgedrückt worden: Da Spuren phonologisch nicht ausgewertet werden konnten, war in den älteren Theorieständen die ‚hohe‘ Aussprache einer bewegten Phrase die einzig mögliche (solange keine coverten Bewegungen
54
Theoretische Grundannahmen der vorliegenden Analyse
etc. angesetzt wurden). Es ergibt sich die folgende Auswahl von Kopien auf der PF-Schnittstelle: 37. [Peter C-isst [Peter [Peter [[Kuchen isst] v]] isst-T]] Für Peter und isst wird jeweils die strukturell höchste Kopie ausbuchstabiert, für die Objektsphrase Kuchen ist die Entscheidung trivial: Sie liegt nur in einer einzigen Kopie vor. Die PF hat daher für die lineare Positionierung von Kuchen keine Auswahlmöglichkeiten. Wie sich zeigt, bestimmt daher die Syntax (durch die angesetzten Bewegungen) darüber, wie viele und welche Auswahlmöglichkeiten die PF-Abbildung letztlich hat. Das heißt, mit anderen Worten, dass syntaktische Derivationen auch immer (in gewissem Umfang) Linearisierungsvorgaben für die PF-Abbildung darstellen. Für das diskutierte Beispiel ergibt sich durch die Ausbuchstabierung der jeweils höchsten Kopien (und ohne die phonetisch nicht ausbuchstabierten funktionalen Knoten): 38. [Peter C-isst [Peter [Peter [[Kuchen isst] v]] isst-T]] = Peter isst Kuchen. Die Derivation konvergiert damit an beiden Schnittstellen und weist so den Satz Peter isst Kuchen als wohlgeformt aus. Zudem spezifiziert die Derivation, wie gesehen, diejenigen phonologischen und semantischen Eigenschaften, die dem Satz aufgrund seiner syntaktischen Zusammensetzung zukommt (womit ein Teil der Eigenschaften des Satzes vorhergesagt werden kann). Die vorliegende Arbeit verzichtet (wie bereits o.a.) darauf, diese technische Implementation noch genauer auszuformulieren: Die hier gemachten Annahmen entsprechen nach meinem Dafürhalten derzeit einem allgemeinen Standard und verlangen daher keine übermäßig spezifischen (damit möglicherweise aber auch umstrittenen) Theoriehintergründe. Zudem scheitern die etablierten Analysen zum Scrambling im Deutschen auch bereits daran, die hier genannten – unkontroversen – Grundannahmen zu erfüllen. Wie aber auch gezeigt werden kann, ist die hier gewählte Implementation – die bestimmte Eigenschaften des Satzes durch Schnittstellenmechanismen erklärt – besonders gut geeignet, die monokausalen Erklärungsmuster älterer (rein syntaktischer) Analysen zu überwinden. Die syntaktischen Annahmen sind damit genannt und kurz demonstriert worden. Für das Scrambling haben sich aber nun, wie o.a., auch prosodische und informationsstrukturelle Konstellationen als wichtig erwiesen. Im folgenden Unterkapitel wird (wiederum stark vereinfachend) aufgezeigt, welche Annahmen die vorliegende Arbeit für diese Theoriebereiche macht.
Theoretische Annahmen im Rahmen dieser Arbeit
55
3.3.3 Prosodie und Informationsstruktur in der vorliegenden Analyse Wenn in der Einleitung davon die Rede war, dass die vorliegende Arbeit nicht den Anspruch erhebt, zu den vorrangig empirischen Arbeiten zu diesem Thema zu zählen, so gilt dies auch ganz besonders für die prosodischen Eigenschaften des Deutschen: Diese werden in einer Vielzahl von Publikationen beschrieben, denen die vorliegende Arbeit absolut nichts hinzuzufügen hat. Vorzüge und Nachteile der verschiedenen Theorien, sowie die Unterschiede der Grundannahmen und Notationen werden hier ebenfalls nicht weiter kommentiert. Der Leser sei stattdessen verwiesen auf die reichhaltige Literatur zu diesem Thema, als Einstieg z.B. auf den Überblick in Grice & Baumann 2002. Wie sich zeigt, ist es aber im Rahmen der hier vorgeschlagenen Analyse völlig ausreichend, eine (aus phonetischer Sicht) einfache Darstellung zu wählen, die lediglich zwei intonatorische Muster als syntakto-semantisch besonders relevant hervorhebt. Fast alle in dieser Arbeit zitierten syntaktischen und semantischen Arbeiten zum Thema Scrambling verwenden fast exakt die gleichen Annahmen. Als besonders relevant haben sich in diesem Feld nämlich vorrangig zwei intonatorische Muster erwiesen, die in der vorliegenden Arbeit als rise und fall bezeichnet werden. Mit dem rise bezeichne ich einen Anstieg der f0-Kurve, wie er in der Markierung von kontrastiven Topiks (vgl. z.B. Büring 1997, 2006, 2007) verwendet wird. Dieser intonatorische Anstieg wird auch in einschlägigen Arbeiten zur Intonation des Deutschen als Kategorie geführt: – Bei Wunderlich fungiert dieser Anstieg z.B. als linker Brückenpfeiler im Rahmen seines Brückenakzents (sein Intonationsmuster F, vgl. 1988: 11). Er notiert das Muster als H* H (ebd.: 13). – Féry ordnet einem (von mehreren) intonatorischen Anstiegen ebenfalls dem Beginn ihrer Hutkontur zu und notiert dieses Muster als L*H, z.B. in: 39. a) GeSCHLAFen hat KEINer von uns. L*H H*L (Bsp. 1993: 129) b) ALLE Politiker hat so mancher NICHT verstanden L*H H*L (Bsp. 1993: 133) Diese Intonationskontur wird in der vorliegenden Arbeit per Großschreibung der betonten Silbe sowie mit einem ansteigenden Schrägstrich grafisch dargestellt. Im folgenden Beispiel wird so etwa die erste Silbe des Wortes Peter mit einem rise versehen: 40. /PETer hat gestern doch NICHT geschlafen. (Sondern MaRIa).
56
Theoretische Grundannahmen der vorliegenden Analyse
Die zweite Markierung betrifft die fall-Kontur. Diese Intonationskontur zeichnet als ‚Hauptbetonung‘ des Satzes zumeist den Fokusexponenten des Satzes aus. Sie entspricht verschiedenen Repräsentationen in den bereits genannten Arbeiten: – Wunderlichs rechter Brückenpfeiler (sein Intonationsmuster C) wird von ihm als %H L* notiert (vgl. 1988: 13). – Féry notiert diese Kontur als H*L (1993: 81ff), z.B. in: 41. a) Tom will MILCH trinken. H*L (Bsp. 1993: 82) b) Wo hast Du den WAGEN geparkt? H*L (Bsp. ebd: 85) –
Der fall wird in der vorliegenden Arbeit durch Großschreibung einer Silbe (aber ohne Schrägstrich) angezeigt. Im folgenden Beispiel wird repräsentiert, dass die erste Silbe des Wortes Katze mit einem fall intoniert werden soll: 42. Gestern hat Peter die KATze gefüttert.
Mit dieser Auswahl von (syntakto-semantisch erwiesenermaßen relevanten) Mustern steht die vorliegende Arbeit zum einen in der Tradition älterer Arbeiten, die in gleicher Weise von weiteren prosodischen Differenzierungen abstrahieren. Für die Abbildung der Syntax auf die Prosodie ergeben sich durch diese Abstraktion vermutlich ebenfalls keine größeren Verwerfungen: Obwohl nämlich bei der Produktion und Rezeption von prosodischen Konturen tatsächlich einiges an Variation phonetisch nachzuweisen ist, scheint diese Variation doch über die hier gemachten Unterscheidungen hinaus zumindest syntaktisch oft irrelevant zu sein (Stefan Baumann, p.c.). Zum anderen zeigt sich aber auch, dass bereits diese minimale Auswahl von (syntakto-semantisch definitiv relevanten) Intonationsmustern einige bisher ungelöste Probleme für die Analyse der Wortstellung im Deutschen aufwirft. Insbesondere die theoretische Repräsentation auch nur dieser zwei Intonationsverläufe ist im Rahmen aktueller generativer Architekturen überraschend problematisch: Wenn ein Einfluss dieser Intonationsmuster auf die Wortstellung nachzuweisen ist (und das ist er), kann die Syntax dies – ohne den oben beschriebenen look-ahead zu den Schnittstellen – erkennen? Mit Blick auf das Thema der Arbeit erscheint es also als zwingend nötig, (mindestens) diese zwei wohletablierten intonatorischen Muster architektonisch zu repräsentieren. Weitere phonetische Differenzierungen könnten im Übrigen aber, wenn ihr Einfluss auf das Phänomen Scrambling demonstriert worden ist, relativ unproblematisch in die hier vorgeschlagene Architektur aufgenommen werden.
Theoretische Annahmen im Rahmen dieser Arbeit
57
Was die informationsstrukturellen Annahmen der Arbeit angeht, so basiert sie maßgeblich auf den Arbeiten Schwarzschilds (1999) und Bürings (1997, 2006, 2007). Der Leser sei auch hier für die genauen Details auf diese Veröffentlichungen verwiesen. Die Theorieansätze von Büring und Schwarzschild erscheinen mir aus zweierlei Gründen geeignet für die Verwendung im Rahmen der vorliegenden Arbeit: Zum einen sind diese Theorien sehr klar definiert und eignen sich daher für die Verwendung im Rahmen generativer Grammatiken ganz generell: Sie vermeiden weitestgehend inhaltlich vage Beschreibungen der informationsstrukturellen Kategorien, die Autoren liefern stattdessen klar definierte (und auch testbare) Distributionskriterien, die die Verwendung (und Verwendungsrestriktionen) der distributionell definierten informationsstrukturellen Kategorien nachvollziehbar beschreiben. Zweitens liegen mit Büring (1997, 2006, 2007) Darstellungen vor, die die Eigenschaften dieser Kategorien explizit auch an Beispielen des Deutschen demonstrieren. Die vorliegende Arbeit kann damit auf etablierte und wohldefinierte informationsstrukturelle Kategorien zurückgreifen, die sich in ihrer Anwendung auf das Deutsche gut bewähren: Wie sich zeigt, sind bereits die klaren und einfachen Kategorien Bürings und Schwarzschilds nämlich in der Lage, alle für die vorliegende Arbeit wesentlichen informationsstrukturellen Kategorien präzise zu definieren. Leider ist eine solche begriffliche Klärung angesichts der Verwendung ähnlicher Begriffe auch unverzichtbar: Einen Überblick über die (verwirrende) Verwendung informationsstruktureller Begriffe liefert Musan (2002). Wie sie zeigt, sind fast alle informationsstrukturellen Begriffe, die überhaupt je eingeführt wurden (Fokus/ Hintergrund, Fokusexponent, Topik, Thema/ Rhema u.v.m.) jeweils in verschiedenster Form definiert und verwendet worden. Eine Diskussion dieser Definitionen und Verwendungen soll hier ebenso wenig geleistet wie eine Neudefinition irgendeiner dieser Kategorien angestrebt werden: Die vorliegende Arbeit bezieht sich mit den genannten Ausdrücken auf die Definitionen Bürings (die in Teilen auf Schwarzschild zurückgehen) um begriffliche Klarheit herzustellen – und nicht, um andere, abweichende Definitionen (und sei es auch nur implizit) zu bewerten. Das für den Begriff Fokus der vorliegenden Arbeit entscheidende Kriterium ist das der Gegebenheit. Die Arbeit bezeichnet daher mit den Ausdrücken gegeben/ Gegebenheit die kontextuellen Aspekte von Ausdrücken, die als diskursalt einzustufen sind. Diskursneue Ausdrücke hingegen werden als nicht-gegeben bezeichnet. Eine Diskurskategorie Neuheit existiert damit nur derivativ, eine eigene Auszeichnung oder Definition einer Kategorie diskursneuer Elemente ist für die vorliegende Analyse unnötig (vgl. ähnlich auch Schwarzschild 1999: 142): Die einzig nötige Größe ist die der Gegebenheit. Im Rahmen der hier gewählten Definition gelten alle Ausdrücke als Gegeben, für die gilt:
58 – – –
Theoretische Grundannahmen der vorliegenden Analyse
Sie sind wörtlich vorerwähnt worden (Büring 2006: 145, Schwarzschild 1999: 147f.) oder ein koreferenter Begriff (z.B. auch ein Synonym) ist vorerwähnt worden (Büring 2006: 145, Schwarzschild 1999: 147f.) oder ein hyponymer Begriff ist vorerwähnt worden (Büring 2006: 145, Schwarzschild 1999: 148).
Die abschließende Version einer semi-formalen Definition bei Schwarzschild lautet (1999: 151): An utterance U counts as GIVEN iff it has a salient antecedent A and a. if U is type e, then A and U corefer; b. otherwise: modulo type-shifting, A entails the Existential F-Closure of U.
Mit Klausel (b) können auch Konstituenten als Gegeben ausgewiesen werden, die keine Argumentphrasen sind, etwa VP, vP usw. Da die vorliegende Arbeit die Vorerwähntheit von Ausdrücken jeweils durch kontrollierte Kontexte herbeiführt, sollen darüber hinaus keine Aktivierungsgrade oder Grade von Salienz von Ausdrücken (oder Referenten) o.ä. angenommen werden: Die Ausdrücke (oder Referenten) werden entweder durch den Kontext (sehr) klar als Gegeben identifiziert oder aber sie gelten als nicht-Gegeben. ‘Semiaktive‘ Ausdrücke oder Referenten werden daher in der vorliegenden Arbeit nicht diskutiert (obschon sie phonetisch nachweisbar erscheinen, vgl. Baumann & Grice 2006). Aus dem Begriff der Gegebenheit leitet sich die f-Markierung eines Elementes ab: Ein Element gilt als f-markiert, wenn es: – nicht Gegeben ist und – es auch kontextuell nicht verfügbar (etwa: deiktisch aufzeigbar) ist. Vom kontextuell definierten Begriff der Gegebenheit ist die prosodische Markierung eines Fokusexponenten abzugrenzen: Wie sich zeigt, trägt oft ein diskursneues (nicht-gegebenes, also auch f-markiertes) Element die Hauptbetonung eines Satzes (z.B. im o.a. Sinne also den fall in einem Deklarativsatz). Mit dem Begriff der Fokusexponenz wird also ein Formaspekt der Prosodie beschrieben. Ein Wort zur Verwendung der Begriffe Fokus, f-markiert und Fokusexponent: Wo immer die Unterscheidung zwischen den diskursiven und den formbezogenen Aspekten des Begriffes Fokus irrelevant ist, verwendet die vorliegende Arbeit den Ausdruck Fokus als Sammelbegriff – er ist in dieser weit gefassten (möglicherweise auch leicht vergröbernden) Form auch in der Forschungsliteratur extrem weit verbreitet. Um die in der Arbeit zitierten Autoren bei ihrem eigenen Wort zu
Theoretische Annahmen im Rahmen dieser Arbeit
59
nehmen (anstatt sie ungedeckt auszulegen) werden in der Diskussion von Forschungsbeiträgen auch immer die Begriffe verwendet, die die zitierten Autoren selbst verwenden. Wo immer aber die Unterscheidung zwischen den formbezogenen und den kontextuell definierten Aspekten des Begriffs für die Zwecke der vorliegenden Arbeit nötig wird, unterscheidet die Arbeit zwischen der Fokusexponenz (auf dem Fokusexponenten), der Gegebenheit im Diskurs (auf Gegebenen, diskursalten Ausdrücken) und der Nicht-Gegebenheit im Diskurs (auf diskursneuen, nicht-Gegebenen oder f-markierten Ausdrücken). Als letzte Anmerkung zum Begriff Fokus sei hier gesagt, dass Aspekte der Fokusprojektion in der vorliegenden Arbeit nicht untersucht werden. Ich nehme vielmehr mit Schwarzschild an: „F-marking is syntactically unconstrained“ (1999: 167). Das kontrastive Topik ist eine informationsstrukturelle Kategorie, die andeutet, dass zu einem kontrasttopikalisierten Ausdruck noch diskursiv relevante Alternativen bestehen (vgl. Büring 1997). Durch diese Anforderung wird deutlich, warum im folgenden Beispiel die Antwort A nicht als vollständige Antwort auf die Frage F gewertet werden kann: 43. F: Was haben die Leute gemacht? A: Die /FRAUen haben alle geSCHMUNzelt. Aus der Anforderung an kontrastive Topiks, Alternativen offen zu lassen, folgt im gegebenen Beispiel also, dass auch noch andere Leute (vielleicht z.B. Männer oder Kinder) etwas gemacht haben (und zwar, so lässt sich als implikatiert verstehen, vermutlich nicht ebenfalls geschmunzelt). Für eine genauere Darstellung der Eigenschaften von kontrastiven Topiks und ihren Eigenschaften sei der Leser auf Büring (1997) verwiesen, für eine Zusammenfassung der Eigenschaften auf Büring (2006). Die hier angesetzten informationsstrukturellen Kategorien sind also alle bereits in der Forschung etabliert. Mit diesen Kategorien geht die vorliegende Arbeit, soweit ich sehe, im Prinzip konform auch mit anderen Überblicksdarstellungen (etwa Krifka 2007). Die angenommenen informationsstrukturellen Kategorien können daher – wie schon die syntaktischen und prosodischen – meines Erachtens als unkontrovers gelten. Wo immer von bestimmten Autoren zusätzliche informationsstrukturelle Annahmen gemacht werden oder besondere Definitionen zum Einsatz kommen, werden sie im Text explizit einzeln erläutert. Insbesondere der Begriff [Topik] (und in gewisser Weise auch der Begriff [Antifokus]) werden in den jeweils zu diesen Begriffen gehörenden Kapiteln wesentlich ausführlicher diskutiert, da sie in der Forschungsliteratur in je verschiedenen, nicht völlig deckungsgleichen Definitionen verwendet worden sind.
4 Scrambling mithilfe semanto-pragmatisch motivierter Projektionen Wie können nun, vor dem Hintergrund der oben vorgestellten generativen Theoriestände, die empirischen Daten zum Scrambling im Deutschen erklärt werden? Mit Lenerz (1977) konnte überzeugend gezeigt werden, dass auch informationsstrukturelle Kategorien, insbesondere aber die Kategorie [Fokus] (sein Rhema) einen wichtigen Einfluss auf die Wortstellung im Deutschen haben. Es überrascht daher nicht, dass in der Nachfolge versucht wurde, auch andere informationsstrukturelle Kategorien, etwa [Topik] oder [Antifokus] für die Forschung in diesem Bereich nutzbar zu machen. Vorschläge dieser Art werden in den folgenden Unterkapiteln diskutiert. Zur Einleitung sei vorher aber noch auf das theoretische Umfeld der syntaktischen Forschung hingewiesen, in deren Rahmen informationsstrukturelle Analysen zumeist durchgeführt wurden. In der generativen, ‚frühminimalistischen‘ Syntax der neunziger Jahren waren syntaktische Umstellungen durch folgende Prinzipien restringiert: – Greed: Ein syntaktisches Element bewegt sich nur dann, wenn die Bewegung seine eigene ‚Gier‘ befriedigt. D.h., Elemente bewegen sich, um Merkmale (z.B. morphologischer Art) lizensiert zu bekommen. – Procrastinate: Die Elemente versuchen dabei aber, sich nach Möglichkeit erst in der Ableitung nach LF zu bewegen, d.h. Bewegungen werden nach Möglichkeit solange verzögert, bis sie nicht mehr overt (vor dem Spellout), sondern covert (nach dem Spellout) applizieren. Wenn also Bewegungen zu Änderungen in der Abfolge von Elementen führen, so muss dies durch bestimmte Merkmale ausgelöst werden, die dem bewegten Element zugewiesen werden können, wenn es sich overt in die Spezifikatorposition einer funktionalen Projektion bewegt. Vor diesem Hintergrund erscheinen die Vorschläge Lenerz‘ nun zunächst wenig hilfreich, denn Lenerz (1977) beschreibt ja vor allen Dingen, wann sich eine Phrase (tendentiell) nicht bewegt. Einen Auslöser für die Bewegung liefert Lenerz aber nicht. Im Umkehrschluss wurde deshalb angenommen, dass die Bewegung von Nicht-Foki ebenfalls durch (von [Fokus] verschiedene) informationsstrukturelle Eigenschaften verursacht wird. Technisch wurde dies durch eine Reihe funktionaler Projektionen dargestellt, etwa Topikphrasen oder Antifokusphrasen. Diese Phrasen attrahieren syntaktische Elemente in ihre Spezifikatoren, und lizensieren dort die besonderen informationsstrukturellen Eigenschaften der bewegten Elemente (vgl. z.B. Frey 2004, Meinunger 2000, Molnarfi 2002).
Zum theoretischen Status von SpecHead
61
In den folgenden Unterkapiteln wird gezeigt, dass informationsstrukturelle funktionale Projektionen nicht nur in der aktuellen Theorie theoretisch obsolet sind – sondern darüber hinaus die alten Analysen auch empirisch nicht in der Lage sind, die Wortstellungseigenschaften des Deutschen korrekt darzustellen.
4.1 Zum theoretischen Status von SpecHead Es erscheint zunächst relativ müßig, darauf hinzuweisen, dass Spezifikatoren in der aktuellen Syntax keinerlei Status mehr zukommt: Spezifikatoren werden durch merge exakt genauso erzeugt wie jede andere strukturelle Position auch. Aktuelle Modelle gehen daher aber tatsächlich davon aus, dass die Lizensierung von Merkmalen in keinem einzigen Fall von einer (privilegierten) SpecHeadRelation abhängig ist: Ein Element bewegt sich m.a.W. nicht deshalb in den Spezifikator eines Kopfes, weil dieser ‚ein Merkmal zuweisen‘ kann. Stattdessen gilt, dass Merkmalswerte auch ‚auf Distanz‘, durch die Operation Agree übertragen werden können. Bewegung ist hierzu nicht zwingend nötig, kann aber, wie o.a., durch EPP-Merkmale erzwungen werden. Dass auch diese Formulierung der Theorie starke empirische Vorhersagen zum Zusammenhang zwischen Kongruenz und Wortstellung erlaubt hat z.B. Richards (2011) gezeigt. Diese theoretische Änderung konnte natürlich keiner der unten kritisierten Autoren vorhersehen. Dennoch gilt ganz unabhängig, wie nachfolgend gezeigt wird, dass SpecHeadAnsätze daran scheitern, die aktuellen Anforderungen an Bewegungen einzuhalten. Im Rahmen des SpecHead-Ansatzes wurden verschiedene Vorschläge mit dem Ziel unterbreitet, Scrambling-Bewegungen durch informationsstrukturell definierte Merkmale auslösen zu lassen. Die Vorschläge kreisen allesamt um zwei prinzipielle Optionen: – Scrambling ist Bewegung von [Topik]-markierten Elementen, – oder Scrambling ist ‚Fokusflucht‘, d.h. Bewegung von [Antifoki]. Beide Ansätze sollen nachfolgend kurz dargestellt und in ihren empirischen Vorhersagen beurteilt werden.
4.2 [Antifokus]-Merkmale Der rechte Satzrand ist (nicht nur) im Deutschen der Ort der ‚Normalbetonung‘ (vgl. Höhle 1982, Cinque 1993). Das am tiefsten eingebettete Argument, welches für [Fokus] markiert ist, wird intonatorisch hervorgehoben. Molnarfi leitet aus
62
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
dieser Konstellation die Behauptung ab, nicht-fokussierte Elemente müssten aus der Betonungsdomäne ‚fliehen‘: „Note that there can be no A PRIORI objection against such a proposal: [...] antifocus licensing should enable a constituent to escape the focus domain“ (2002: 1132).
Molnarfi schlägt daher vor, dass ein Elemente, welches als [Antifokus] markiert ist, in die Spezifikatorposition einer [Antifokus]-Phrasen bewegt werden muss (2002, 2004, vgl. auch Abraham & Molnarfi 2001). Dieser Ansatz ist meines Erachtens theoretisch und empirisch unattraktiv, wie ich nachfolgend belegen möchte. Aus theoretischer Sicht ist zunächst einmal festzustellen, dass [Anti-X]-Merkmale einen isolierten Vorschlag darstellen. ‚Fluchtbewegungen‘ der genannten Art mögen nicht a priori ausgeschlossen sein, es gibt aber keine vergleichbaren Merkmale in anderen Kontexten: Phrasen im Nachfeld (wie CPen, oder PPen) extraponieren nicht deshalb, weil sie ein [Antikasus]-Merkmal trügen. Ein Subjekt, welches von T attrahiert wird, bewegt sich nicht deshalb, weil es ein Merkmal [Anti-kein-Kasus] aufweist. Generell erweisen sich in der Geschichte des Faches solche Merkmale als zielführend, die Erkenntnisse zu sprachlich relevanten Eigenschaften beitragen. Mag auch a priori kein Grund bestehen, ein AntifokusMerkmal abzulehnen, so erscheint es a posteriori doch sinnvoller, Merkmale aufzustellen, die eine substantielle Eigenschaft X zu benennen und zu ergründen versuchen, als sich darauf zu beschränken, die relevante Eigenschaft bestünde nur in [nicht-Y]. Einen informationsstrukturell erhellenden Beitrag aber leistet Molnarfi mit der Annahme eines [Antifokus] nicht: Es muss nämlich gelten, dass die Eigenschaft, nicht fokussiert zu sein, für ein Element im Diskurs oft den default-Fall darstellt: Da Diskurse kohärent sind, müssen zumindest einige Äußerungselemente zu jedem gegebenen Zeitpunkt im Diskurs bereits vorerwähnt sein – anders herum sind oft nur wenige Elemente diskursneu: Empirisch belegt z.B. Uhmann in einer Korpusstudie, dass zwei Drittel aller dort untersuchten spontansprachlichen Sätze mindestens eine pronominale Proform für ein Argument aufweisen – mehr als eine volle Argument-DP (mit denen neue Referenten nichtdeiktisch eingeführt werden könnten) finden sich nur im Mittelfeld von 3,4% aller von ihr untersuchten Sätze (1993: 319f.). Nicht-Foki sind also keine in der Verwendung seltenen oder diskursiv ausgezeichneten Kategorien von Elementen. Nicht-fokussierte Elemente haben darüber hinaus als einziges gemeinsames Merkmal die Eigenschaft, eben nicht fokussiert zu sein – erkennbare syntaktische Konsequenzen folgen daraus aber nicht: Nicht-Foki treten im Vorfeld, linken und rechten Mittelfeld sowie im Nachfeld auf, eine obligatorische Bewegung von Nicht-Foki ist „obviously not the case in German“ (Büring 2006: 92). Nicht-Foki bilden keine kontinuierlichen Konstituenten und weisen keine morphologischen oder lexikalischen Gemeinsamkeiten auf. Genau diese heterogene Menge von
[Antifokus]-Merkmale
63
Elementen soll aber nun der Molnarfi‘schen Definition des Antifokus unterliegen: „I will argue that the common property all scrambled elements share is not a pragmatic feature sich as familiarity or topichood, but simply their lack of focus“ (2004: 332, ähnlich auch ebd.: 347). Wie isoliert Definitionen von Projektionen ex negativo sind, zeigt auch Fanselow: „The existence of such a position (defined by a head that may agree with everything but a focused phrase) would come as a surprise, however: there appear to be no languages with a [-wh] position (to which all phrases must move that are not positively specified for [+wh]) or a [-relative] position“ (2003: 211). Wie unten gezeigt wird, muss Molnarfi seine weite Definition von [Antifokus]-Elementen aber ohnehin revidieren – der Vorschlag widerspricht sich, mit anderen Worten, bezüglich der gerade zitierten Definition an anderer Stelle selbst. Molnarfis Annahmen passen auch nicht zu den genannten theoretischen Grundannahmen des aktuellen Theoriestandes. Molnarfi muss nämlich davon ausgehen, dass Bewegung durch einen look-ahead zur PF ausgelöst wird – Elemente bewegen sich, um der Fokusintonation zu entgehen (Molnarfi 2002: 1119): The function of scrambling is thus to render invisible to the nuclear stress rule anaphoric elements that have the required embedding depth, but not the ‚right‘ discourse value for focussing.
Diese Annahme ist nicht vereinbar mit der Maßgabe, dass IM nicht-teleologisch zu applizieren habe: Wenn die Syntax die Betonung auf der PF-Schnittstelle im Vorhinein erkennen soll, ist das ein klarer Fall von look-ahead. Soll die Bewegung aber ‚im Nachhinein‘, oder etwa auf der PF-Schnittstelle selbst, lizensiert werden wäre nicht weniger nötig, als nahezu den gesamten theoretischen Apparat der kernsyntaktischen Derivation ‚noch einmal‘ in die Spellout-Operation nach PF einzubetten: Alle syntaktischen Restriktionen, die für Scrambling im Deutschen bekannt sind, müssten hier nun analog der syntaktischen Komponente nachgebildet werden. Eine solche Architektur müsste also hierzu benötigten Operationen de facto zweimal beinhalten – ein klarer Verstoß gegen methodologische Grundsätze der Einfachheit. Selbst wenn Molnarfi (2004) einige der theoretisch veralteten Annahmen seiner älteren Analysen (Spuren, coverte Operationen, etc.) zugunsten neuerer Darstellungen überarbeitet, steht doch der Grundansatz Molnarfis damit insgesamt in seinem Kern gegen das erklärte Ziel der aktuellen Syntax, die manigfaltigen Stipulationen und empirisch nicht gedeckten Zusatzannahmen der älteren Theoriestände (insbesondere aber des Government and Binding in den 80er Jahren) endlich auszumerzen. Empirisch wiegt zudem schwer, dass Molnarfi im Grunde fast keine relevanten Vorhersagen erreichen kann: Es ist eine altbekannte Erkenntnis (Lenerz 1977, Höhle 1982), dass im Deutschen dasjenige fokussierte Element zum Fokusexpo-
64
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
nenten wird, welches am weitesten rechts im Satz auftritt und dass dieser Fokusexponent nur schwerlich ins linke Mittelfeld umzustellen ist. Für die Antifoki kann Molnarfi aber keine vergleichbar klaren Eigenschaften vorhersagen. Molnarfi kann die Bewegung der Antifoki nämlich nicht erzwingen, da Nicht-Foki auch unbetont im rechten Mittelfeld verbleiben können, wie Frey zeigt (2004: 165): 44. Was wird Eva wahrscheinlich heute mit Otto machen? [Nicht-Fokus Heute wird Eva wahrscheinlich Otto] [Fokus Krakau zeigen] Das unbetonte Objekt Otto folgt hier dem Adverb, welches laut Molnarfi die Grenze des rechten Mittelfeldes markieren soll. Der gleiche Satz ist auch mit einer Modalpartikel als Grenzstein möglich, und Otto verbleibt auch hier im rechten Mittelfeld: 45. Was wird Eva wahrscheinlich heute mit Otto machen? [Nicht-Fokus Heute wird Eva ja wohl Otto] [Fokus Krakau zeigen] Für nicht-fokussierte Phrasen gilt daher zum einen, dass man sie nicht betonen möge (was keine neue Restriktion ist), und zum anderen, dass sie bezüglich der topologischen Felder stehen können, wo immer sie wollen (was überhaupt keine Restriktion ist). Keine klare Restriktion kann Molnarfi auch bezüglich der zu erwartenden Abfolge im linken Mittelfeld erreichen: Da er die Antifokus-Projektionen im linken Mittelfeld letztlich nur rekursiv aufreihen möchte (vgl. 2004: 356) sollten alle Abfolgen der (nicht weiter unterschiedenen) nicht-fokussierten Phrasen im linken Mittelfeld gleichwertig sein. Auch die Auswahl der letztlich Scrambling-fähigen Ausdrücke muss von Molnarfi stärker spezifiziert werden, als das o.a. Zitat vermuten lässt: Es muss nämlich ausgeschlossen werden, dass jedes beliebige Element, dass nicht fokussiert ist, sich in die antifokalen Spezifikatorpositionen bewegt. Abraham & Molnarfi erkennen dieses Problem durchaus, denn dies hieße, dass „all other elements that do not carry stress should have to be licensed in a Spec-head configuration. Such an assumption, easily refutable by any superficial empirical investigation, would contradict everything we know about sentence structure in the Germanic languages“ (2001: 24). Ich stimme der Einstellung Abrahams & Molnarfis vollständig zu: Die Vorhersage, dass sich alle nicht fokussierten Elemente etwa im Deutschen nach links umstellen, ist bereits auf den ersten Blick falsch. Ich gebe allerdings zu bedenken, dass die [Antifokus]-Analyse sehr wohl Sorge dafür zu tragen hat, dass ihre Vorhersagen eben nicht „easily refutable by any superficial empirical investigation“ (vgl. o.) ist. Mit anderen Worten: Es muss sichergestellt werden, dass die [Antifokus]-Eigenschaft nur auf solchen Elementen zu finden ist, die tatsächlich
[Antifokus]-Merkmale
65
auch ins linke Mittelfeld umgestellt werden können. Damit kann aber dann auch die weit gefasste Ankündigung, Scrambling erfasse schlicht alle Elemente, die einen „lack of focus“ aufwiesen (vgl. Zitat oben), offenbar nicht ganz so ernst gemeint gewesen sein – die Definition der Antifoki wird daher wesentlich komplizierter: „A destressing license [...] can only be tied to discourse referential entities which are important for the interpretation of focus structure. Such elements are lexical categories, marked for the distinction ±definiteness, that is, basically, NP-arguments [sic], but not verbs, adjuncts of adjectives“ (2004: 361). Diese Spezifikation der möglichen Antifoki ist aus meiner Sicht aber nun extrem stipulativ: Warum Verben, Adjektive o.ä. (die ja auch fokussiert werden können) nicht auch als Antifoki taugen, erklärt Molnarfi nicht. Dass Elemente also nicht nur durch ihren „lack of focus“ (vgl. o.) als Antifoki definiert werden, gesteht Molnarfi aber nirgends explizit ein. Empirisch erscheint seine Definition zudem sehr eng: Die Tatsache, dass auch AdvPen, PPen und verbale Projektionen unter gewissen Umständen durchaus im linken Mittelfeld zu finden sind, kann Molnarfi nämlich unter der neuen Definition von [Antifokus] nicht mehr erklären: Diese Projektionen werden von der engeren Definition möglicher [Antifokus]-Elemente ja nicht mehr erfasst. Molnarfis Antifokus-Analyse erklärt damit aber letztlich nur einen Teil der Umstellungen im Deutschen, die das linke Mittelfeld avisieren, nicht aber Fälle wie: 46. Frage: Fährt Peter dieses Jahr endlich nach Mailand? Antwort: Peter ist [nach Mailand] doch schon LETZTes Jahr gefahren 47. Frage: Was würde Maria tun um zu gewinnen? Antwort: Ich glaube, dass Maria [um zu gewinnen] wohl so ziemlich ALLes tun würde. 48. Ich habe [dass zwei plus zwei /VIER ist] doch wirklich NIE bezweifelt (... ich bin nur INSgesamt schlecht im Kopfrechnen). Auch für Adverbialphrasen ist argumentiert worden, dass sie sich im Mittelfeld umordnen können (Frey & Pittner 1998). Diese Umstellungen werden durch die enge Definition des Merkmals [Antifokus] durch Molnarfi und Abraham & Molnarfi ebenfalls nicht mehr abgedeckt. Letztlich bleibt auch unklar, wo genau Antifokusmerkmale architektonisch applizieren sollen: Sind diese Merkmale syntaktischer oder phonologischer Natur? Wenn sich antifokale Elemente in die Spezifikatorpositionen von Antifokusprojektionen bewegen, inwieweit ist dieser Vorschlag unterschieden von einer Theorie mit „(arguably circular) theory of freely assignable features“ (Molnarfi 2004: 364)? Die Antwort auf diese Frage kann nota bene gerade nicht darin bestehen, dass mit der Nicht-Fokussiertheit ja eine unabhängige Größe in Form eines
66
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
Schnittstelleneffektes vorliegt: Wenn erst die Bewegung der [Antifokus]-markierten Phrase die Deakzentuierung der Phrase erlaubt, wie ist diese Eigenschaft der Nicht-Betontheit dann syntaktisch (oder semantisch) definiert? Welchen Reflex, welches Äquivalent, oder welches bereits syntaktisch relevante Korrelat hat die (phonetische?) Eigenschaft der Unbetonbarkeit? Molnarfi schlägt hier, soweit ich sehe, letztlich nur vor, das Merkmal [Antifokus] aus der Definitheit von DPen abzuleiten. Wenn dies aber der Fall ist, so sollten alle unbetonten definiten DPen sich zwangsweise im linken Mittelfeld wiederfinden (oder im rechten Mittelfeld engen Fokus auf sich ziehen, vgl. Abraham & Molnarfi 2001: 26) – was empirisch aber einfach nicht zutrifft: Definite DPen können sehr wohl auch unbetont in ihren Basispositionen verbleiben (etwa wenn Adverbien oder das Verb zum Fokusexponenten werden, vgl. Höhle 1982, Frey 1993 u.v.a.). Soll andererseits letztlich die Berechnung der Prosodie des Gesamtsatzes den Ausschlag über die Möglichkeit oder Unmöglichkeit von Scrambling geben, so muss die PF-Komponente über die Aussprache der Bewegungskopien entscheiden – und genau dies schlägt Molnarfi in neueren Arbeiten auch vor (2004: 365). Aber auch diese Annahme macht falsche Vorhersagen: Scrambling müsste nämlich, wenn sie ausschließlich von der Schnittstelle her (lies: prosodisch) motiviert ist, im Grunde immer dann unterbleiben, wann immer die Gefahr der ‚fälschlichen‘ Betonung eines antifokalen Elementes gar nicht besteht: Ist also z.B. ein Element eng fokussiert, welches keine Argument-DP ist (etwa ein Adverb oder ein Verb), ist die Fokusplatzierung damit entschieden. Im Satz gegebenenfalls auftretende definite DPen könnten in diesem Szenario nun also nicht mehr unzulässig betont werden. Es bestünde damit, so weit ich sehe, vermutlich kein Grund mehr, die nicht-fokusierten definiten DPen umzustellen. Dies führt nun offensichtlich zu falschen Vorhersagen, denn Untersuchungen zeigen, dass Scrambling z.B. unter Verumfokus möglich bleibt (vgl. z.B. schon Frey 1993, der alle seine Untersuchungen unter Verumfokussierung anstellt). Da das Deutsche auch hier letztlich eine optionale Umstellung von Elementen aus prosodischen Gründen zulässt, sind auch verwandte Vorschläge (etwa das p-movement im Spanischen, vgl. Zubizarreta 1998: 123ff) für das Deutsche nicht anwendbar: Wenn die Bewegung nicht-fokussierter Elemente wirklich (rein) prosodisch motiviert ist, sollte sie unterbleiben, wenn die prosodische Motivation fehlt. Im Ganzen schließe ich mich daher der Einschätzung Putnams an: „The presence of [AF] in its current form does not improve our understanding of the ‚optionality problem‘ involving West Germanic Scrambling; on the contrary, it is unfalsifiable and ad hoc in its stipulation“ (2007: 157). Eine wichtige und richtige (und für ihn auch zentrale) Erkenntnis scheint mir Molnarfis Ansatz (contra Putnam) aber sehr wohl zu beinhalten: Die Prosodie des Satzes ist eine wichtige Größe, die oft auch eine Motivation darstellt, nicht fokussierte Elemente ins
[Topik]-Merkmale
67
linke Mittelfeld umzustellen. Problematisch ist aber die Härte der Vorhersage, die Molnarfi treffen muss, sowie viele technische Aspekte seiner Analyse – die nach meiner Einschätzung daher insgesamt mehr Fragen aufwirft als sie beantwortet.
4.3 [Topik]-Merkmale Eine recht weit verbreitete Annahme ist, dass Scrambling durch das informationsstrukturelle Merkmal [Topik] ausgelöst wird: Topiks sind in verschiedener Weise definiert worden und zeigen in den Sprachen der Welt verschiedenartige Auswirkungen und Reflexe (vgl. z.B. schon Reinhart 1981). Dennoch argumentiert die vorliegende Analyse (entgegen den nachfolgend diskutierten Vorschlägen), dass Topiks im Deutschen keine syntaktisch relevante Kategorie sind: Während man versuchen kann, den diskursbezogenen Eigenschaften von Topiks auch im Deutschen nachzuspüren, lässt sich auf der anderen Seite nicht zeigen, dass diese informationsstrukturelle Größe irgendeinen Einfluss auf die syntaktische Positionierbarkeit eines topikalisierten Elementes nimmt. Mit dieser Einschätzung steht die Analyse nicht alleine da, denn in der Tat wurde diese Einschätzung auch von anderen Autoren bereits getroffen: „In der Tat möchte ich behaupten, dass das Konzept eines ‚unmarkierten‘ (also nicht-kontrastiven) Topiks im Deutschen (und vielleicht ganz allgemein) von keinerlei Bedeutung ist“ (Büring 2006: 157). Damit steht die Analyse im Gegensatz zu Arbeiten von Meinunger (2000) und Frey (2004): Diese beiden Ansätze sollen stellvertretend für bestimmte Klassen von Topik-Analysen diskutiert werden. So nimmt Frey an, dass es im Prinzip nur zwei Schulen für den Begriff Topik gibt (2004: 154): Entweder werden Topiks über die Bekanntheit (familiarity) eines Referenten im Diskurs definiert (z.B. von Rizzi 1997) oder aber die Relation aboutness wird zum Kriterium der Definition (z.B. schon bei Reinhart 1981): Ein aboutness-Topik zeichnet sich dadurch aus, dass die Aussage des Satzes (in genauer zu definierender Weise) eine Aussage ‚über das Topik‘ ist. Auch eine dritte logisch gegebene Möglichkeit, dass Topiks nämlich sowohl durch aboutness wie durch familiarity definiert sind, wurde von einigen Autoren vorgeschlagen (z.B. von Choi 1999 und Meinunger 2000). Im Rahmen der hier vorgestellten Analyse können nicht alle diese Vorschläge im Detail diskutiert werden. Stattdessen beschränkt sich die Darstellung darauf, Repräsentanten der genannten Klassen vorzustellen, um die allgemeinen Eigenschaften der Vorschläge auf ihre Tauglichkeit zur Beschreibung von ScramblingBewegungen im Deutschen zu überprüfen. Für die Annahme, dass familiarity alleine als Scrambling-Auslöser fungiert, sprechen – im Deutschen – nur wenige Fakten. Tatsächlich scheint das Gegenteil
68
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
relativ leicht zu belegen zu sein: So fasst Musan (2002) das Ergebnis einer empirischen Studie dergestalt zusammen, dass die Bekanntheit eines Referenten oft nicht nur die Scrambling-Bewegung nicht erzwingt – vielmehr führen Umstellungen dieser Art sogar zu eher unbefriedigenden Ergebnissen. Familiarity alleine scheint daher Scrambling nicht zu erzwingen. Dieselbe Meinung vertritt Frey, der eine ganze Reihe von Beispielen dafür anbringt, dass eine Phrase, die ein im Diskurs bereits bekanntes Individuum denotiert, nicht zwangsweise ins linke Mittelfeld bewegt werden muss: 49. Gestern hat Paul [eine nette Frau]1 kennengelernt. Er wird hoffentlich [die Dame]1 wiedersehen. (Bsp. Frey 2004: 164) Familiarity allein kann daher als obligatorischer Scrambling-Auslöser nicht in Frage kommen. Analysen, die vergleichbare Annahmen machen (auch etwa im Rahmen der Centering Theory, vgl. Rambow Ms.) haben daher, nach meiner Einschätzung, kaum Aussichten, die empirischen Verhältnisse im Deutschen korrekt zu erfassen. Überzeugender erscheint daher die Analyse Meinungers, der vorschlägt, dass Elemente attrahiert werden, die sowohl „familiar“ als auch „commented on“ (2000: 90) sind. Während dieser Vorschlag inhaltlich im Vergleich zu Molnarfi angenehm konkret ist, macht auch er empirisch zu harte Vorhersagen. Es gilt nämlich, dass auch Topiks, die im Diskurs eingeführt werden und über die eine relevante Aussage gemacht wird, nicht zwangsweise ins linke Mittelfeld verbracht werden Die Antworten im folgenden Beispiel (aus Lenerz 2001a: 180, 2001b: 253) zwingen weder dem (durch die Frage thematisierten) direkten Objekt noch dem indirekten Objekt eine feste Position am linken Rand des Mittelfeldes auf: 50. Frage: Wem hast Du das Buch gegeben? Antwort 1: Ich habe [dem/einem StuDENten]Foc [das Buch] gegeben. Antwort 2: Ich habe [das Buch] [dem/ einem StuDENten]Foc gegeben. Eine zwingende Umstellung des einen oder des anderen Objektes kann hier also nicht vorliegen. Wenn also Topikalität der einzige mögliche Faktor für die Umstellung von Objekten wäre, so müssten die jeweils weiter links auftretenden Objekte in Antwort 1 bzw. Antwort 2 je verschieden als Topiks fungieren – wofür ich aber keinerlei Anhaltspunkte erkennen kann. Minimal wäre damit eine Analyse anzusetzen, in der Topikalität nur als ein Auslöser von Scrambling (unter mehreren) fungiert.
[Topik]-Merkmale
69
Alternativ könnte auch versucht werden, durch eine veränderte Definition des bewegungsauslösenden Merkmals eine zutreffendere Charakterisierung der Umstellungen im Deutschen zu erreichen. Topiks etwa könnten auch so als Auslöser für Scrambling definiert werden, dass die aboutness-Relation allein das entscheidende Kriterium für Topikalität eines (worüber-) Elementes darstellt. Frey (2004) etwa behauptet, das Deutsche verfüge über eine mediale Topikposition (d.h. im linken Mittelfeld), in die alle Ausdrücke verbracht werden müssten, ‚über‘ die der Satz seine Aussage macht. Frey belegt seine Annahme in Teilen ähnlich wie Meinunger, kann aber über die Definition des aboutness-Begriffs bestimmte zusätzliche Vorhersagen erreichen: – Elemente, die sich nicht als aboutness-Topiks eignen (etwa wh-Indefinitpronomina) sollten nicht scramblen können (vgl. das folgende Beispiel (a)). – Elemente, die als aboutness-Topiks fungieren, müssen jedoch zwangsweise scramblen, da sie overt in den Spezifikator einer (medialen) Topikposition bewegt werden (vgl. das folgende Beispiel (b/c)). Als empirischen Beleg führt Frey Sätze an, die seiner Meinung nach zeigen, dass Scrambling im Deutschen strikt durch die informationsstrukturelle Kategorie des aboutness-Topiks determiniert wird: 51. a) *Jemand ist wo leider gestürzt.
(Bsp. Frey 2004: 174)
b) Ich erzähle Dir etwas über Fritz. Morgen wird den Fritz glücklicherweise eine reiche Dame heiraten. c) Ich erzähle Dir was über Fritz. #Morgen wird glücklicherweise eine reiche Dame den Fritz heiraten. Dass Wh-Indefinita nun aber ganz generell nicht nach links umgestellt werden können, ist empirisch falsch: 52. daß wer was nicht [VP ti gekauft hat] (Bsp. Lechner 1998: 279) 53. Da hat wer wem wohl was nicht gesagt. Wie Kapitel 10.5.2. zeigt, sind die Restriktionen beim Scrambling von Wh-Indefinita vermutlich eher prosodischer Natur. Freys Beispiele (b) und(c) wirken nun aber tatsächlich zunächst recht überzeugend. Möchte man jedoch zeigen, dass aboutness die relevante informationsstrukturelle Kategorie für die Applikation von IM ist, muss man zeigen, dass die aboutness-Relation nicht ohne Bewegung erreicht werden kann. Dies scheint mir nicht der Fall zu sein:
70
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
54. Sprecher A: Fritz ist ein armer Wicht. Er hat schon drei Mal geheiratet, aber immer Pech gehabt: Er heiratet Frauen, die sich in keiner Weise zu benehmen wissen.Richtige Rotzbälger! Sprecher B: Ich erzähle Dir jetzt mal was über Fritz: Morgen wird nämlich eine reiche DAMe den Fritz heiraten. 55. Sprecher A: Fritz ist ein armer Wicht. Er hat schon drei Mal geheiratet, aber immer Pech gehabt: Er heiratet verarmte adelige Damen, und sie nehmen ihn nach Strich und Faden aus. Sprecher B: Ich erzähle Dir jetzt mal was über Fritz: Morgen wird nämlich eine REICHe Dame den Fritz heiraten. Mir scheint in beiden Fällen die DP den Fritz als aboutness-Topik zu fungieren: Der Behauptung A‘s über Fritz, er habe immer Pech mit seinen Frauen, wird durch den Sprecher B widersprochen. Damit wird ein update zum bisherigen Wissen über Fritz geliefert – die von Sprecher B auch exakt nach den Vorgaben Freys angekündigt wird: Ich erzähle Dir was über [Topik]. Relevant für die Akzeptabilität meiner Beispiele ist ganz einfach, dass die Fokussiertheit der Subjekts-DP ausreichend vorbereitet wird. Wird die reiche Dame so zum Fokusexponenten, kann den Fritz unbetont in seiner Basisposition verbleiben, obwohl den Fritz als aboutness-Topik fungiert. Was die in-situ-Beispiele Freys meines Erachtens nämlich schlecht macht, ist tatsächlich die Wahl des Vorkontextes – allerdings nur in der Hinsicht, welche möglichen Fokusexponenten (nicht: Topiks!) existieren: Freys Vorkontext liefert keinerlei Informationen darüber, warum die reiche Dame relevant ist für die Handlung, führt aber Fritz (sogar verbatim vorerwähnt) als Gegeben ein. Damit gerät Freys Beispiel in eine intonatorische Zwickmühle: Wird den Fritz zum Fokusexponenten, muss den Fritz fokussiert sein. Aber warum sollte dies der Fall sein – die DP ist durch den Vorkontext Gegeben! Wird Fritz dennoch fokussiert, muss dies als enger Kontrastfokus interpretiert werden. Es fragt sich aber, womit den Fritz hier kontrastiert werden soll: 56. Ich erzähle Dir was über Fritz. #Morgen wird glücklicherweise eine reiche Dame den FRITZ heiraten. Betont man hingegen eine andere Konstituente als das Objekt den Fritz, so liegt damit nicht mehr die Höhle‘sche Normalbetonung vor, die üblicherweise dem am tiefsten eingebetteten syntaktischen Objekt die Hauptbetonung zukommen lässt (vgl. Höhle 1982). Demzufolge müsste ein enger Fokus auf einer anderen Konstituente, z.B. auf der DP eine reiche Dame (oder einem Bestandteil dieser DP) liegen. Freys Sätze bereiten die reiche Dame aber nicht besser als engen Fokus vor als es beispielsweise all-new-Sätze täten. In out-of-the-blue-Kontexten aber ist
[Topik]-Merkmale
71
Freys in-situ-Beispielsatz ebenfalls nicht kontextuell angemessen, wenn irgend ein anderes Argument als den Fritz zum Fokusexponenten wird – völlig unabhängig davon, ob eine aboutness-Lesart für Fritz erreicht werden soll oder nicht: 57. [Kontext: Sprecher kommt plötzlich zur Tür herein] a) Sprecher: #Morgen wird glücklicherweise eine reiche DAMe den Fritz heiraten. b) Sprecher: #Morgen wird glücklicherweise eine REICHe Dame den Fritz heiraten. c) Sprecher: #Morgen wird den Fritz glücklicherweise eine reiche DAMe heiraten. d) Sprecher: #Morgen wird den Fritz glücklicherweise eine REICHe Dame heiraten. Auch die Betonung von heiraten (oder irgendeiner anderen Konstituente) führt zu einer engen Fokuslesart, die durch Freys (fehlenden) Vorkontext nicht legitimiert ist: 58. Kontext:Ich erzähle Dir etwas über Fritz. a) #Morgen wird den Fritz glücklicherweise EINe reiche Dame heiraten. b) #Morgen wird den Fritz glücklicherweise eine reiche Dame HEIraten. c) #Morgen wird den Fritz glücklicherWEIse eine reiche Dame heiraten. Mit anderen Worten: Freys in-situ-Fälle sind definitiv kontextuell unangemessen. Sie sind dies aber nicht deshalb, weil hier die Wortstellungsanforderungen eines aboutness-Topiks verletzt würden. Sie sind vielmehr deshalb prosodisch problematisch, weil sie dem Satz nicht erlauben, einen Fokusexponenten zu bestimmen, der im von Frey gelieferten Kontext akzeptabel erscheint. Ein Rückblick auf die Ergebnisse Molnarfis aber zeigt, dass genau diese intonatorische Hervorhebung des Fokus die Vorbedingung dafür ist, dass nicht-fokussierte Phrasen (seine Antifoki) unbetont im rechten Mittelfeld verbleiben. Damit kann also gezeigt werden, dass nicht aboutness die entscheidende Größe für die Diskursinkohärenz der Frey‘schen Beispiele ist, sondern Gegebenheit. Auch die empirische Untersuchung Musans hat gezeigt, dass aboutness alleine keinen sicheren Rückschluss auf Umstellungen im Mittelfeld zulässt: „Die Akzeptabilität von Voranstellungen im Mittelfeld scheint insbesondere dann nicht besser zu werden, wenn Worüber-Elemente bewegt werden“ (2002: 214). Daher kann zum einen nicht davon ausgegangen werden, dass [aboutness] als Auslöser einer optionalen Instanz von IM angesehen werden kann. Darüber hinaus gilt aber auch außerhalb des hier gewählten theoretischen Rahmens,
72
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
dass die Generalisierung Freys (aboutness-Topiks müssen zwangsweise ins linke Mittelfeld verbracht werden) einfach nicht korrekt ist (vgl. für eine ähnliche Einschätzung auch z.B. Haider & Rosengren 1998, Fanselow 2003, Grewendorf 2005, Sabel 2005 u.v.a.). Ich gehe davon aus, dass Frey in seinen Arbeiten keinesfalls anstrebt, Scrambling ausschließlich über die informationsstrukturellen Eigenschaften von Argumenten und Adjunkten zu steuern (vgl. z.B. Frey 1993 zum Einfluss der Skopusverhältnisse auf die Wortstellung). Dennoch bleibt – gerade auch aufgrund der Verfügbarkeit alternativer Bewegungsauslöser – mehr als fraglich, ob die Kategorie [Topik] tatsächlich überhaupt benötigt wird, um Scramblingbewegungen auszulösen. Umgekehrt gilt, dass die vorhergesagten Bewegungen, bei geeigneter Konstruktion der Fokusverhältnisse, oft unterbleiben können. Zusammenfassend gilt daher, dass weder familiarity noch aboutness noch familiarity in Kombination mit aboutness eine so im Diskurs eingeführte DP in ihrer Basisposition ungrammatisch werden lassen. Eine Tendenz, Topiks verschiedener Sorten ins linke Mittelfeld zu bewegen besteht tatsächlich, einen Zwang kann ich hingegen nicht erkennen. Nach meiner grammatischen Intuition (und der meiner Informanten) bleibt die Basisabfolge eine mögliche (wenngleich leicht dispräferierte) Alternative auch in Topikalisierungskontexten. Damit stellt sich die vorliegende Analyse explizit gegen eine Reihe von Annahmen, die in der Literatur gemacht worden sind: Eine ganze Reihe von Autoren hat behauptet, dass Topiks im Deutsch obligatorisch scramblen (neben den oben genannten z.B. auch Grewendorf 2005). Die oben dargebotenen Daten ziehen dieses harte Urteil aber in Frage. Meines Erachtens ist eine flexiblere Darstellung nötig: Eine Präferenz für die Positionierung von topikalen Elementen im linken Mittelfeld ist durchaus gegeben. Es ist aber nicht der Fall, dass Sprecher des Deutschen keine Wahl in der Positionierung topikaler Elemente hätten. Feine Unterschiede in der Prosodie und in den Spezifika des Vorkontextes z.B. vermögen, wie gezeigt, die lineare Abfolge von Elementen im Mittelfeld des deutschen Satzes sehr wohl dahingehend zu verändern, dass topikale Elemente im rechten Mittelfeld akzeptabel sind. Für die vorliegende Analyse im Rahmen der aktuellen generativen Syntax heißt dies aber: Optionale Topik-Bewegungen im Mittelfeld des deutschen Satzes können nicht als Instanzen von optionalem internal merge deklariert werden: Wenn der semantische Effekt der Bewegung (die Interpretion/ Kennzeichnung als Topik) auch in der Basisposition eines Arguments möglich ist, sollte nach den eingangs genannten Anforderungen der aktuellen core syntax die Bewegung generell unterbleiben. Da dies offensichtlich nicht der Fall ist, müssen andere Faktoren identifiziert werden, die Scrambling auslösen. Gegner der generativen Syntax mögen diese Argumentation als eine irrelevante Idiosynkrasie des hier verwendeten syntaktischen Modells verstehen. Es bleibt aber festzuhalten, dass auch die Empirie der diskutierten Beispiele nicht
[Topik]-Merkmale
73
einfach und kategorisch zu bestimmen ist – unabhängig davon, welches theoretische Modell für die Erklärung der relevanten Phänomene gewählt wird. Dies liegt meines Erachtens nicht zuletzt daran, dass der Begriff des Topiks in der Literatur einfach nicht zufriedenstellend definiert ist. Mit dieser Einschätzung steht die vorliegende Arbeit nicht alleine da – im Gegenteil erklärt z.B. Vallduvi: „The conclusion that the notion of topic used in the topic-comment framework, as it stands, is not operationizable seems unavoidable“ (1993: 41). Dewald behauptet in einer Arbeit, die sich dem Topikbegriff widmet, sogar: „Wenn überhaupt Definitionen gebildet werden, so werden TOPIK-Definitionen gebildet, die entweder zu eng oder zu weit gefasst sind und deshalb nicht einmal die funktionalen Eigenschaften der unkontroversen Fälle erfassen können“ (Ms.: 7, ähnlich auch Dewald 2007). Ähnliche Einschätzungen treffen, neben vielen anderen Autoren, Reinhart (1981), Meinunger (2000) und Grewendorf (2005). Es ist bis heute daher meines Erachtens Primus zuzustimmen, die urteilt: „Despite the extensive attention that linguists of various schools have paid to the notion of topic, there is no accepted definition of it“ (1995: 880). Das Problem tritt sogar in verschärfter Form auf, wenn die informationsstrukturelle Kategorie an ihre formale Realisation geknüft werden soll, denn „the optimal notion of topic is not easy to find if we link it to syntactic phenomena such as topicalization. This is because these phenomena are not uniform across languages [...]. This might lead one to the unhappy conclusion that there are several kinds of topics, and that languages may mark some, but not all of them. A variety of phenomena connected to topichood could be described in this way, but it would not provide an explanation“ (Erteshik-Shir 2007: 26f.). Mit anderen Worten: Nicht nur ist die Kategorie Topik schwer zu definieren, sie scheint sich auch noch in den Sprachen der Welt, wenn überhaupt, auf sehr unterschiedliche Art und Weise zu manifestieren. Es ist lohnend, an dieser Stelle noch einmal an die eingangs genannten Ziele der generativen Grammatik zu erinnern: Angestrebt wird eine explizite Charakterisierung der grammatischen Verhältnisse in einer Sprache. Es geht um das Wissen des Sprechers darum, welche Strukturen möglich sind sowie um das Wissen des Sprechers darüber, welche Eigenschaften die grammatischen Strukturen aufweisen. Es geht andererseits nicht darum, wie ein gegebener Sprecher in einem gegebenen Kontext sprachlich vorgehen mag. Angesichts dieser klaren Zielsetzung ist für unseren derzeitigen Erkenntnisstand zum Scrambling im Deutschen Bescheidenheit angebracht: Weder können die vorgestellten Analysen eine explizite Charakterisierung des vorgeblichen Auslösers von Scrambling bieten (weil die Definition der Kategorien [Antifokus] und [Topik] problematisch bleibt), noch können sie über die Auswirkungen der informationsstrukturellen Markierung eine klare Auskunft geben (weil Scrambling von Topiks oder Antifoki, wie gesehen, nicht obligatorisch ist). Stattdessen erscheint es vielmehr
74
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
so, als ob von den genannten Autoren Präferenzen zu kategorischen Stellungsmustern umgedeutet werden. Die dargestellten Analysen scheitern daher nach meinem Dafürhalten in zweifacher Hinsicht daran, eine Beschreibung des Phänomens Scrambling im Rahmen einer generativen Analyse zu liefern: Sie charakterisieren zunächst einmal die grammatischen und ungrammatischen Sätze nicht korrekt, sondern übertragen stattdessen Präferenzen (vielleicht: der Autoren?) unzulässig auf das grammatische Modell. Zum anderen operieren sie dabei mit nur schwach definierten Kategorien, die – in dieser Form – nur schwerlich geeignet erscheinen, überhaupt Bestandteil einer vollständig expliziten Grammatik zu sein. Nun möchte die vorliegende Arbeit nicht in einen ähnlichen Fehlschluss verfallen und aus den konkreten Problemen einiger weniger konkreter Analysen schließen, dass Analysen dieses Typs generell nicht möglich sind. Es soll daher hier ein weiterer Versuch unternommen werden, bestimmte Aspekte der Topikalität als Auslöser von Scrambling versuchsweise anzunehmen. In der Literatur wurde nämlich auch diskutiert, dass das Merkmal [Topik] vielleicht ein Komposit aus basaleren Eigenschaften ist, die in den o.a. genannten Topikbegriffen in verschiedenster Weise zusammenfallen (vgl. Jacobs 2001). Im Folgenden soll daher kurz untersucht werden, inwieweit einzelne Faktoren der Topik-KommentarGliederung, aus denen der (dann selbst im Grunde überflüssige) Begriff [Topik] folgen mag, Einfluss auf die Wortstellung im Mittelfeld des deutschen Satzes nehmen mag.
4.4 Basale Topik-Kommentar-Differenzen als Scrambling-Auslöser Die Topik-Kommentar-Gliederung ist für Jacobs ein Sammelsurium verschiedener IS-Eigenschaften: „There is no unitary functional notion underlying all [topic-comment] constructions in natural languages“ (Jacobs 2001: 643). Jacobs schlägt daher vor, verschiedene Teildimensionen anzunehmen, die einem Satz eine Topik-Kommentarstruktur aufprägen können. Im Rahmen dieser Diskussion strebt Jacobs, dies muss klar gesagt werden, keine Untersuchung von Scrambling im Deutschen an. Dennoch aber soll hier versuchsweise untersucht werden, ob die Dimensionen der Topik-Kommentar-Differenzierung, die Jacobs untersucht, auch für Scrambling relevant sein könnten: Im Folgenden wird diskutiert, inwieweit sich die basaleren Dimensionen der Topik-Kommentar-Distinktion umdeuten lassen könnten als Auslöser für Scrambling-Bewegungen – obwohl dies ausdrücklich nicht die Absicht von Jacobs‘ Vorschlag ist.
Basale Topik-Kommentar-Differenzen als Scrambling-Auslöser
75
4.4.1 Informational Separation Jacobs geht davon aus, dass es einen Teilaspekt des Topikbegriffes gibt, der darin besteht, dass eine informationelle Trennung zwischen Teilen des Satzes besteht: „In (X Y), X is informationally separated from Y iff the semantic processing of utterances of (X Y) involves two steps, one for X and one for Y“ (2001: 645).
Es lässt sich meines Erachtens aus gleich mehreren Gründen nicht davon ausgehen, dass informational separation die Wortstellung entsprechend differenzierter Satzbestandteile X und Y in unserem Modell beeinflussen kann: – Zum einen ist diese Dimension der Informationsstruktur keine Eigenschaft einer einzelnen Phrase, sondern stellt eine Relation dar, die zwischen zwei Ausdrücken X und Y zu bestehen scheint. Damit ist die Dimension aber schwer als Merkmal einer bewegten Phrase zu definieren. – Zum zweiten ist diese Relation meines Erachtens nicht völlig explizit definiert und eignet sich daher nicht als Bestandteil einer generativen Grammatik (im hier verwendeten Sinne). – In dem Umfange, in dem man die Definition nachzuvollziehen versucht, basiert sie offensichtlich auf prozessualen, verarbeitungsbezogenen und letztlich psycholinguistisch zu belegenden Annahmen. Sie charakterisiert damit nicht das Wissen eines Sprechers, sondern das Vorgehen eines Sprechers und ist daher ungeeignet, in einer Kompetenzgrammatik zu figurieren. – Darüber hinaus kann ich kaum erkennen, dass die Relation erkennbaren Einfluss auf die Wortstellung im Mittelfeld des deutschen Satzes nimmt: Die von Jacobs selbst diskutierten Fälle thematisieren ausschließlich Möglichkeiten der Vorfeldbesetzung. Ich kann schlicht nicht erkennen, unter welchen diskursbezogenen (prozessualen? psycholinguistischen?) Umständen beispielsweise die Nennung mehrerer Objekte und Adjunkte (oder auch Modalpartikeln, Hilfsverben oder beliebiger anderer Elemente) „zwei Verarbeitungsschritte“ (oder fünf oder sieben?) enthält. Ebenso unklar ist mir, wie oder wann die Verarbeitung in einem „einzelnen Schritt“ vonstatten gehen könnte. Die Dimension der informational separation wird daher im Folgenden nicht als geeigneter Auslöser von Scrambling geführt.
76
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
4.4.2 Semantic Subjects Jacobs geht davon aus, dass Sätze ein semantisches Subjekt enthalten. Diese Größe definiert er wie folgt: „In (X Y), X is the semantic subject and Y the semantic predicate iff (a) X specifies a variable in the semantic valency of an element in Y, and (b) there is no Z such that (i) Z specifies a variable in the semantic valency of an element in Y and (ii) Z is hierarchically higher in semantic form than X.“ (2001: 647)
Ich halte die Eigenschaft einer Phrase, semantic subject zu sein, ebenfalls nicht dafür geeignet, die Scrambling-Fähigkeit dieser Phrase im Rahmen einer generativ-syntaktischen Analyse zu determinieren: – Auch diese Kategorie befasst sich wiederum vorrangig mit der Vorfeldbesetzung und eine Übertragung auf das Mittelfeld erscheint schwierig. – Die Kategorie ist zwar recht klar definiert, die Definition weist die Kategorie aber als Hybrid aus semantischen und syntaktischen Kriterien aus: Die Hierarchie in der semantischen Form wird nämlich dadurch mit spezifiziert, welche Skopoi die beteiligten Elemente syntaktisch nehmen (vgl. 2001: 648f.). Jacobs sagt ausdrücklich: „The square brackets in our semantic representations mirror the c-command relations in S-structure“ (ebd.: 649). Daher wäre die Verwendung der Kategorie als Auslöser von Scrambling (die Jacobs allerdings ja auch gar nicht vorschlägt) zirkulär: Vom Scrambling erfasst würde das, was (aufgrund seiner satzsemantischen Eigenschaften) auch syntaktisch „hierarchically higher“ steht. Schöner formuliert: Nach oben bewegt wird, was hinterher oben steht. – Versucht man aber, die Syntax aus der Definition auszuschließen, so scheinen die rein semantischen Aspekte der Definition keinen Einfluss auf Scrambling-Vorgänge zu nehmen: Kein Argument, egal welche semantischen Eigenschaften es hat, wird obligatorisch von Scrambling erfasst – eine solch auffällige Regularität scheint mir zumindest in der gesamten Forschungsliteratur nirgends erkannt worden zu sein. Im Folgenden werden semantic subjects daher nicht als Kandidaten für obligatorische Bewegungsoperationen gehandelt.
Basale Topik-Kommentar-Differenzen als Scrambling-Auslöser
77
4.4.3 Addresses Jacobs identifiziert als Teil des Topik-Begriffes die Eigenschaft eines Ausdrucks, als Adresse einer Informationsspeicherung zu fungieren: „In (X Y), X is the address for Y iff X marks the point in the speaker-hearer knowledge where the information is carried by Y has to be stored at the moment of the utterance of (X Y).“ (2001: 650)
Auch dieser Begriff erscheint nicht geeignet, in einer expliziten Kompetenztheorie als Scrambling-Auslöser geführt zu werden: – Zum einen führt die Definition wiederum Aspekte ein, die auf einen prozessualen und kontextbezogenen Charakter der Kategorie schließen lassen: Jacobs lässt z.B. offen, inwieweit der „moment of the utterance“ als konkreter Moment in einer konkreten Diskurssituation verstanden werden soll. – Führt man die Definition zurück auf eine abstrakte, beliebige Diskurssituation, so nähert man sich meines Erachtens der file card-Metapher an (vgl. wiederum Reinhart 1981 und nachfolgende Literatur). Diese ist, wie in der Diskussion der Vorschläge von Frey und Meinunger gezeigt, nicht geeignet, als allgemeiner Auslöser von Scrambling-Operationen zu fungieren: File card-fähige Phrasen scamblen häufig, müssen aber nicht ausnahmslos scramblen. – Darüber hinaus kann auch gezeigt werden, dass Phrasen, die sich nicht als file cards eignen, sehr wohl scramblen können (vgl. insbesondere auch Kapitel 10.5.2. der vorliegenden Arbeit). Es lässt sich also, wie gezeigt, weder von der file card-Fähigkeit auf das Scrambling-Potential schließen, noch umgekehrt. Auch die Kategorie address wird im Folgenden daher nicht als Auslöser von Scrambling akzeptiert
4.4.4 Frames Als vierte Teilkategorie des Topikbegriffes führt Jacobs sogenannte frame-Elemente ein: „In (X Y), X is the frame for Y iff X specifies a domain of (possible) reality to which the proposition expressed by Y is restricted.“ (2001: 656)
78
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
Jacobs beschreibt in seinen Beispielen vorrangig adverbiale Ausdrücke als frames: Der Geltungsbereich der Proposition des Satzes lässt sich demnach in folgender Weise restringieren: 59. Gesundheitlich geht es ihm gut. Finanziell geht es ihm aber nicht gut. Wie sich zeigt, ist die Eigenschaft es geht ihm gut durch die rahmensetzenden Adverbiale tatsächlich auf bestimmte Aspekte des gut-gehens eingeschränkt, da zwischen den Beispielen kein logischer Widerspruch (vgl. etwa: es geht ihm gut und es geht ihm nicht gut) auftritt. Obwohl die Definition des frame daher leicht nachvollziehbar erscheint, ist sie offenbar irrelevant für die Eigenschaften von Scrambling im Deutschen: – Die von Jacobs besprochenen Beispiele befassen sich mit Adverbialphrasen. Diese mögen zwar scramblen (wie von Frey & Pittner 1998 angenommen), sie sind aber natürlich bei weitem nicht die einzigen Phrasen, die dies tun. – Für DPen oder PPen, die scramblen, erscheint es aber weniger leicht nachvollziehbar, diese als ‚Domänen der Realität‘ zu interpretieren. Mir erscheint, dass die oben so leicht nachvollziehbare Definition der Kategorie frame es im Gegenteil kaum erlaubt, den Begriff frame auf DPen (oder auch viele PPen) zu übertragen. Daher kann die Eigenschaft, ein frame zu sein, zentrale Fälle von Scrambling nicht erklären (was Jacobs natürlich wiederum auch nicht behauptet). Zusammenfassend scheinen die vorgeschlagenen Konzepte eines holistischen Topikbegriffs Phrasen nicht dergestalt auszeichnen zu können, dass diese Phrasen zwangsweise ins linke Mittelfeld bewegt werden können. Auch die Teileigenschaften der Topik-Kommentar-Gliederung, wie sie von Jacobs untersucht werden, lassen sich nicht dahingehend uminterpretieren, dass sie zwingende Gründe darzustellen, bestimmte Bestandteile des Satzes im Mittelfeld des deutschen Satzes umher zu bewegen. Meines Wissens existiert damit kein TopikBegriff, der für die Wortstellung im deutschen Mittelfeld einschlägig wäre. Das Konzept der Topikalität ist daher ungeeignet, als Auslöser einer optionalen IMInstanz zu fungieren. Welche anderen semantisch-pragmatischen Eigenschaften ließen sich möglicherweise als Auslöser von Scrambling betrachten?
Andere semantische Faktoren
79
4.5 Andere semantische Faktoren Im den folgenden Unterkapiteln sollen kurz einige semantische Beobachtungen rekapituliert werden, die im Umfeld von Scrambling-Bewegungen bemerkt worden sind. Wie sich zeigt, genügt keiner dieser Effekte den Anforderungen, die an einen allgemeinen (und zwingenden) Auslöser von Scrambling-Bewegungen gestellt werden.
4.5.1 Generizität Laut Diesing (1992) erfahren indefinite DPen, die (u.a.) im Deutschen in eine linke Mittelfeldposition verbracht werden, semantische Umdeutungen. So können indefinite DPen in ihrer Basisposition oft existentiell interpretiert werden, in ihrer abgeleiteten Position im linken Mittefeld aber tritt die existentielle Lesart zurück, z.B. zugunsten einer generischen: 60. a) weil jaPartikel immer [ein Feuerwehrmann] bereitsteht (lies: weil zu jedem Zeitpunkt ein Individuum existiert, welches Feuerwehrmann ist und bereitsteht) b) weil [ein Feuerwehrmann] ja immer bereitsteht (lies: weil es eine generelle Eigenschaft von Feuerwehrmännern ist, immer bereit zu stehen) Damit ist in Fällen wie diesen ein klarer interpretativer Effekt mit der Umstellung einer indefiniten DP verbunden. Ließe sich der Generizitätseffekt also als Auslöser für Scrambling interpretieren? Mehrere Gründe verbieten diese Annahme: – Zum einen betreffen die Generizitätseffekte nur indefinite DPen und können daher nicht als allgemeiner Auslöser von Scrambling – d.h. auch für definite DPen, PPen, QPen usw. – verstanden werden (vgl. ähnlich auch z.B. de Hoop 2003): 61. a) weil der Peter gestern das Buch gestern gelesen hat b) weil das Peter das Buch gestern gelesen hat (Bsp. Chocano 2007: 104) –
Auch für indefinite DPen lässt sich aber nicht zeigen, dass der semantische Effekt strikt an die Bewegung ins linke Mittelfeld geknüpft ist: Frey (2004: 164) etwa weist darauf hin, dass indefinite DPen auch im linken Mittelfeld
80
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
u.U. spezifisch interpretiert werden können (a), und Lenerz hält für das Beispiel (b) auch eine existentielle Lesart für möglich (2001a: 187, vgl. ähnlich auch Frey 2004: 164, sowie Haider 2006: 213): 62. a) Weil eri müde war, hat ein Studenti leider während des Seminars geschlafen. b) weil Väteri natürlich auch gestern mit ihreni Kindern spielten –
Zum anderen aber lässt sich auch zeigen, dass die generische Lesart einer indefiniten DP auch in ihrer Basisposition erreicht werden kann. In folgendem Satz etwa erscheint mir die generische Lesart des indirekten Objekts die vorrangige Interpretation zu sein (für ähnliche Einschätzungen vgl. Haider 2006: 260 und Chocano 2007: 170f.): 63. Ich würde doch niemals einem Italiener Riesling servieren!
Es soll hier natürlich nicht bestritten werden, dass die Diesing‘schen semantischen Effekte existieren (und auch nicht, dass sie von Sprechern genutzt werden). Da die semantischen Effekte aber auch ohne Bewegung erreicht werden können, können sie im Rahmen der hier verwendeten syntaktischen Theorie nicht als Auslöser optionaler IM-Umstellungen vollends akzeptiert werden.
4.5.2 Telizität Meinunger liefert eine Beobachtung, die die Bewegung von Argumentphrasen mit verschiedenen Lesarten des Gesamtsatzes in Verbindung bringt (2000: 94f.): Demnach wird die im Satz beschriebene Handlung oft dann als telisch interpretiert, wenn ein Objekt ins linke Mittelfeld bewegt wird. So gilt im folgenden Beispiel (a), dass die Bibel mehrfach in Gänze gelesen wurde, während Beispiel (b) die Lesart nahezulegen scheint, dass die Bibel zwar oft, aber u.U. nur auszugsweise gelesen wurde: 64. a) weil ich die Bibel oft gelesen habe b) weil ich oft die Bibel gelesen habe Allerdings zeigt sich, dass der Faktor der Telizität in diesen Beispielen bestenfalls von nachrangiger Bedeutung ist: Wenn das interpretatorisch relevante direkte Objekt nämlich in seiner Basisposition verbleibt, kann trotzdem die telische Lesart auch in dieser Position erreicht werden. Fragt der Abt den jungen Anwär-
Andere semantische Faktoren
81
ter, warum er als Novize aufgenommen werden solle, so kann dieser (nach Meinunger 2000: 95) antworten: 65. weil ich doch die BIBel gelesen habe Da die DP die Bibel hier fokussiert ist, sollte sie das rechte Mittelfeld nicht verlassen. Dennoch kann der Satz bedeuten (und soll in der gegebenen Situation vermutlich bedeuten), dass die Bibel mehrfach vollständig gelesen wurde: Eine gelegentliche Bibelteilstücklektüre kann ja vom Anwärter (soweit ich dies beurteilen kann) nicht als besonders geeignete Eigenwerbung für eine Karriere im Dienste der Ehre Gottes aufgefasst werden.
4.5.3 Links und ähnliche Konzepte In der Literatur existieren verschiedene Konzepte, die gewisse Ähnlichkeiten mit den oben diskutierten Topikkonzeptionen aufweisen. Im Folgenden soll nur sehr kurz gezeigt werden, dass auch diese Konzepte für das Scrambling im Deutschen irrelevant sind. So hält Frey Vallduvís link für irrelevant für Fragen der Wortstellung im Mittelfeld des deutschen Satzes (2004: 166). Diese Begründung ist nachvollziehbar, da links laut Frey immer im Vorfeld zu stehen haben. Molnarfi wiederum zeigt, dass das Konzept des D-Linking für Scrambling irrelevant ist, da Elemente, die als D-Link fungieren, nicht immer im linken Mittelfeld positioniert sein müssen (2002: 1143, vgl. auch Abraham & Molnarfi 2001: 19). Ähnliche Probleme betreffen auch ähnliche Konzepte, wie das backward-looking center (vgl. z.B. Rambow, Ms.) oder das Merkmal [ref] (Putnam 2007) – sie sollen daher hier nicht mehr separat erörtert werden. Insgesamt muss gelten, dass semantische und pragmatische Faktoren in vielen Fällen Einfluss auf die Wortstellung im Deutschen nehmen können: Vielfach werden mit den Umstellungen nämlich Effekte dieser Art begünstigt. Dennoch ist zu vermerken, dass die Effekte oft auch dann erreicht werden können, wenn Alternativen zur syntaktischen Bewegung aufgewendet werden. Damit muss gelten, dass semantische und pragmatische Faktoren wie die oben genannten sich nicht dazu eignen, als allgemeine trigger von Scrambling zu fungieren, solange die Scrambling-Operation als Instanz von internal merge aufgefasst werden soll. Zudem gilt es zu respektieren, dass sich kategorische Generalisierungen, die Scrambling als zwingende Konsequenz aus bestimmten semantischen, pragmatischen oder informationsstrukturellen Markierungen betrachten, allesamt als zu hart erweisen. Jede Form von Analyse (unabhängig von ihrer theoretischen Orientierung), die Scrambling als formale Markierung von Informa-
82
Scrambling mithilfe semanto-pragmatisch motivierter Projektionen
tionsstruktur, Semantik oder Pragmatik betrachtet oder die syntaktische Bewegung als Reflex einer inhaltlichen Sprecherintention ansieht, muss sich daher mit den empirischen Problemen befassen, die oben zusammengestellt wurden: Funktionale Einflüsse der diskutierten Art begünstigen Scrambling im Deutschen zwar in vielen Fällen (teilweise deutlich) – wie sich gezeigt hat, ist aber nicht einmal die Gesamtheit aller hier diskutierten funktionalen Einflüsse in der Lage, für alle Fälle von Scrambling eine Erklärung beizusteuern. Damit erweist sich die Einschätzung Haiders als korrekt: „Scrambling is optional in the sense that there is no syntactic context that makes an unscrambled order ungrammatical. [...] The semantic and/ or pragmatic effects cannot be taken to be grammatical triggering factors of Scrambling since the specific interpretation effects that are claimed to trigger Scrambling are found in unscrambled structures as well“ (2006: 212f.). Eine syntaktische Kategorie hat sich in der oben geführten Diskussion immer wieder als besonders problematisch erwiesen: Für die definiten DPen konnte letztlich keine einzige überzeugende Ursache für ihre Dislozierung ins linke Mittelfeld geliefert werden. Diese Fälle als marginal zu betrachten, lässt sich aber empirisch nicht durchhalten. Wie (nicht erst) Molnarfi festellt, gilt für diese Kategorie: „definites are free to scramble“ (2002: 1112, vgl. ähnlich z.B. auch Abraham & Molnarfi 2001: 22 und Bayer & Kornfilt 1994: 34). Mit anderen Worten gilt für das Deutsche, dass semantisch-pragmatische und informationsstrukturelle Auslöser für Scrambling ausgerechnet diejenige Kategorie kaum zu erfassen scheinen, deren Stellungsfreiheit am uneingeschränktesten erscheint. Im folgenden Teil soll daher untersucht werden, ob formale Operationen (EFoder EPP-getriebene Bewegungen) in der Lage sind, die Umstellung insbesondere von definiten DPen zu erklären. Wie sich zeigt, lassen auch formale Operationen nicht immer eine Erklärung für das Scrambling definiter DPen im Deutschen zu, wenn Scrambling als optionale Instanz von internal merge repräsentiert werden soll.
5 Analysen von Scrambling durch formale Bewegungsoperationen Wie eingangs definiert, lassen sich Bewegungsoperationen auf zweierlei Weise einleiten: – Zum einen kann eine optionale Instanz von internal merge eine Phrase bewegen und zwar genau dann, wenn sich zeigen lässt, dass diese Umstellung einen effect on outcome (EoO) herbeiführt. – Zum zweiten lässt sich eine obligatorische Bewegung in den Spezifikator eines Kopfes erzwingen, der mit einem EPP-Merkmal ausgestattet ist. Bewegungen dieser Art benötigen keinen EoO. Vor diesem Hintergrund sollen die Bewegungen, die sich in der bisherigen Diskussion als besonders problematisch erwiesen haben – also insbesondere die Umstellung definiter DPen ins linke Mittelfeld – durch formale Mittel implementiert werden. Können diese Bewegungen als EoO-konforme Instanzen von internal merge aufgefasst werden? Wie sich zeigt, ist dies nicht immer der Fall.
5.1 Scrambling als EF-getriebenes, optionales internal merge Im folgenden (bereits eingangs genannten) Beispiel wird ein Kernproblem von Scrambling-Analysen aufgezeigt (vgl. Lenerz 2001a, 2001b): 66. Frage: Wem hast Du das Buch gegeben? Antwort 1: Ich habe [dem/einem StuDENten]Foc [das Buch] gegeben. Antwort 2: Ich habe [das Buch] [dem/ einem StuDENten]Foc gegeben. Dieses Beispiel zeigt, dass mit dem Scrambling definiter DPen kein syntaktosemantischer Effekt verbunden sein muss, der als EoO aufgefasst werden könnte: – Die Antworten 1 und 2 haben identische Bindungseigenschaften: Alle beteiligten Argumente sind R-Ausdrücke und müssen daher vor und nach der Bewegung ungebunden interpretiert werden. Es lässt sich daher kein EoO aus den Bindungsverhältnissen ableiten, da diese sich per definitionem nicht ändern dürfen (solange die Sätze überhaupt als grammatisch eingestuft werden sollen). – Die Antworten 1 und 2 enthalten auch keinerlei skopussensitive QPen o.ä., die nach der Bewegung mit neuen Skopusoptionen versehen sein könnten: Die
84
–
–
Analysen von Scrambling durch formale Bewegungsoperationen
ins linke Mittelfeld bewegten DPen nehmen keine LF-Skopoi im klassischen Sinne. Man könnte zwar vermuten, dass die Antworten 1 und 2 unterschiedliche Informationsstruktureigenschaften aufweisen. Für das gegebene Beispiel lässt sich ein solcher informationsstruktureller Unterschied jedoch meines Erachtens nicht belegen. Und selbst wenn sich ein solcher Unterschied durch bestimmte Informationsstrukturtheorien definieren ließe: Dieser Unterschied scheint im gegebenen Kontext auf jeden Fall keine relevante Rolle zu spielen – weder Antwort 1 noch Antwort 2 sind ja im gegebenen Kontext unangemessene Antworten. Damit wäre die (unbekannte) informationsstrukturelle Auszeichnung eines umgestellten Elementes auch ohne die Umstellung verfügbar – und damit kein möglicher Auslöser der Bewegung. Für die Vermutung, dass Scrambling als optionale Instanz von internal merge implementiert wird, müsste zudem erst noch bewiesen werden, dass die Antworten 1 und 2 Varianten darstellen, die sich durch einen – wie auch immer gearteten – EoO unterscheiden. Angesichts der empirischen Tatsachen aber muss man sich hier meines Erachtens der Meinung Lenerz‘ anschließen: “There should be a difference in meaning. [...] Such a difference in meaning is, however, hard to establish“ (1999: 23f.). Ähnliche Einschätzungen treffen übrigens u.a. auch Lenerz (2001a, 2001b, 2005), Müller (2000), Büring (2000) und Molnarfi (2002).
Während das gegebene Beispiel daher geeignet erscheint, die EoO-Konformität optionaler Scrambling-Bewegungen in Frage zu stellen, weisen wohlbekannte Rekonstruktionsphänomene darauf hin, dass Umstellungen im Mittelfeld oft auch gerade nicht semantisch ausgewertet werden dürfen: Lechner liefert überzeugende Beispiele dafür, dass in machen Fällen Bindungseffekte (die EoOs konstituieren würden) zur Ungrammatikalität des Satzes führen müssten! Da diese Ungrammatikalität nicht eintritt, muss davon ausgegangen werden, dass für die Fälle nur die rekonstruierte Basisabfolge interpretatorisch relevant ist – sodass aber von jeglichem Bindungs-EoO keine Rede mehr sein kann (Bsp. Lechner 1998: 296): 67. *weil [seinei Mutter] [jedeni] liebt weil [seinei Mutter] jederi [seinei Mutter] liebt Wie das erste Beispiel zeigt, kann die Objekt-Phrase jeden (aus ihrer hierarchisch tiefen Position heraus) das Element seine innerhalb der Subjektphrase nicht binden. Die angezeigte Koindizierung entspricht daher nicht der tatsächlichen Interpretation des Satzes. Damit stellt sich aber die Frage, warum das zweite Bei-
Andere formale Auslöser von Scrambling
85
spiel als grammatisch bewertet wird: Nach der Scrambling-Bewegung befindet sich das Objekt seine Mutter in einer hierarchisch höheren Position als jeder und sollte daher wiederum nicht von jeder gebunden werden können. Dennoch ist der Satz grammatisch – auch und gerade in der Lesart, nach der für jedes Individuum X gilt, dass es seine eigene (X‘ens) Mutter liebt. Fälle wie dieser zeigen, dass Scrambling selbst dann grammatisch zulässig sein kann, wenn der erwartete semantische Effekt der Umstellung gerade nicht eintreten darf, um die Grammatikalität des Satzes (in einer bestimmten Lesart) zu ermöglichen: Die gebundene Lesart ist hier bereits für die Basisabfolge zu erwarten, die Scrambling-Abfolge erscheint diese Lesart sogar weniger gut zu erklären. Vor diesem Hintergrund muss also beschieden werden, dass Scrambling (zumindest in diesen Fällen) nicht die Eigenschaften hat, die mit einer optionalen Instanz von EF-getriebenem internal merge assoziiert sind. Welche anderen formalen Auslöser ließen sich für Scrambling annehmen?
5.2 Andere formale Auslöser von Scrambling In der Literatur wurde verschiedentlich angenommen, dass anderweitige formale Auslöser für Scrambling-Bewegungen existieren: – Zum einen wurde Scrambling mit der Kasuslizenz eines Arguments in SpecAgr-Positionen in Verbindung gebracht (z.B. von Meinunger 2000). – Zum anderen wurden die beobachtbaren Abfolgeregularitäten auch direkt als Oberflächenrestriktionen definiert: Müller schlägt den OT-constraint SCRKRIT vor (2000: 241f.), mit folgenden Anforderungen:
SCR-KRIT +nom vor -nom (nominativische Ausdrücke stehen vor nicht-nominativischen) +def vor -def (definite Ausdrücke stehen vor nicht-definite Ausdrücken) +belebt vor -belebt (belebte Ausdrücke stehen vor unbelebten) -fok vor +fok (unfokussierte Ausdrücke stehen vor fokussierten) -akk vor +akk (nicht-akkusativische Ausdrücke stehen vor akkusativischen)
86
Analysen von Scrambling durch formale Bewegungsoperationen
Außerdem wird in der Literatur gelegentlich angenommen, dass Phrasen, die als Barrieren (im Sinne der Theorie vonGovernment and Binding) Adjunktionsbewegungen erlauben: Phrasen, die innerhalb der Barriere stehen, können die phrasale Adjunktionsposition der Barriere als escape hatch nutzen, um die Barriere überwinden zu können. Einige Autoren (z.B. Müller 2004) nehmen in diesem Sinne auch für das Deutsche an, dass vP-interne Argumentphrasen sich durch diesen „Notausstieg“ aus der vP bewegen können. All diese Ansätze erscheinen mir aus konzeptuellen Gründen eher un-attraktiv: – Die erste Annahme widerspricht direkt der eingangs genannten aktuellen Theorieform: Elemente können eine Relation, die zur Kasuslizenz führt, auch ‚auf Distanz‘, d.h. durch die Operation Agree, eingehen. Damit wird der Annahme Meinungers letztlich der explanatorische Wert genommen: Nötig wäre für die Bewegung ein (vermutlich optional zugewiesenes) EPP-Merkmal. Die Frage, in welchen Kontexten dieses EPP-Merkmal nun aufträte, wäre aber nichts anderes als wiederum die Frage nach dem Auslöser der Bewegung. Diese Einschätzung ist darüber hinaus nicht nur im Rahmen der für die vorliegende Analyse gewählten Theoriefassung zutreffend: Mit der Option, Bewegung in Spezifikatorpositionen auch auf den coverten LF-Zweig der Architektur der Grammatik zu verlegen, beraubte sich auch die ältere Theorie ja jeder empirischen Vorhersage bezüglich obligatorischer, merkmalsgetriebener Umstellungen. – Der constraint-Verbund Müllers scheint mir zwar empirisch gute Vorhersagen zu machen, jedoch sind seine Annahmen explanatorisch fast zirkulär: Die beobachteten Wortstellungstendenzen werden direkt zu sub-constraints umdeklariert, die zudem nur deshalb empirischen Bestand haben, weil sie im Rahmen der Optimalitätstheorie per definitionem auch als verletzbar eingestuft werden: Jeder der sub-constraints kann in bestimmten Konstellationen verletzt werden – mit anderen Worten, keiner der sub-constraints kommt über den Status einer Beschreibung von Oberflächentendenzen hinaus. Alle genannten constraints erscheinen mir damit zwar absolut nachvollziehbar und empirisch akkurat – attraktiver wäre aber nach meiner Einschätzung aber eine Analyse, die die beobachtete Wortstellungsvarianz aus unabhängigen theoretischen Grundlagen nicht-zirkulär ableitet. – Der dritte Ansatz ist aus verschiedenen Gründen theoretisch nicht mehr aktuell. Er wird jedoch in zeitgemäßeren Darstellungen dadurch repliziert, dass Phasenköpfe (zu denen insbesondere auch v zählt), Bewegungen in die Kaskade ihrer eigenen Spezifikatoren auslösen können: „EF of a phase head PH can seek any DP in the phase and raise it to Spec-PH“ (Chomsky 2008: 151). Die EF-getriebene Bewegung von Phrasen ähnelt damit frappierend der alten Adjunktionsbewegung an eine Barriere (wie etwa auch Boeckx & Grohmann 2007 anmerken).
Andere formale Auslöser von Scrambling
87
Allerdings gilt nun exakt für diese EF-getriebenen Bewegungen wiederum, dass ihre Zulässigkeit an den Schnittstellen danach bewertet wird, ob ein EoO die Bewegung legitimiert. Die Freiheit der Operation Move-α aus älteren Theorievarianten wird daher durch EF-getriebene Umstellungen nach SpecPH nicht erreicht. Damit fällt die dritte Lösung auf das bekannte Problem zurück: Welcher EoO besteht für die Bewegung nach SpecvP? Es soll an dieser Stelle nicht behauptet werden, dass mit der Bewegung einer Phrase nach SpecPH grundsätzlich kein EoO verbunden ist – das Gegenteil ist sogar oft der Fall: – Wie Frey (1993) überzeugend nachgewiesen hat, führt das Scrambling einer quantifizierten Phrase über eine andere quantifizierte Phrase hinweg oft zur Skopusambiguität. Die Basisabfolge ist hingegen, wie eingangs erwähnt, skopuseindeutig. Damit wird durch Umstellungen dieser Art ein klarer semantischer Effekt erzielt, der als EoO betrachtet werden kann. Scrambling kann in diesen Konstellationen daher problemlos als EoO-konforme Instanz von internal merge analysiert werden: 68. Dieses Semester HAT wohl mindestens ein Student fast jedes Buch gelesen. ‚Es gibt einen Studenten, der fast jedes Buch gelesen hat.‘ (∃∀) 69. Dieses Semester HAT wohl [fast jedes Buch [mindestens ein Student gelesen]]. ‚Es gilt für fast jedes Buch, dass irgendeiner der Studenten es gelesen hat.‘ (∀∃) oder: ‚Es gibt einen (bestimmten) Studenten, der fast jedes Buch gelesen hat.‘ (∃∀) –
Frey weist an anderer Stelle auch darauf hin, dass mit dem Scrambling von bindungsrelevanten Ausdrücken manchmal semantische Effekte im Bereich etwa der pronominalen Koreferenz erreicht werden können (2004: 184, vgl. auch Haider 2006: 215). Ist das Objektspronomen ihn in den folgenden Beispielen in seiner Basisposition, kann es mit Peter koreferent interpretiert werden. Die Operation Scrambling aber verhindert diese Lesart. In Beispielen wie diesem wird daher ein semantischer EoO durch die Bewegung erreicht. Umstellungen dieser Art können daher ebenfalls unproblematisch als Instanzen von internal merge analysiert werden:
88
Analysen von Scrambling durch formale Bewegungsoperationen
70. weil erfreulicherweise Petersi Mutter ihni unterstützen will *weil ihni erfreulicherweise Petersi Mutter unterstützen will Es muss allerdings gelten, dass mit diesen unproblematischen Fällen von EoOs nicht alle Fälle von Scrambling erklärt werden: –
–
Zum einen sind – wie oben gesehen – Koreferenzeffekte für ScramblingBewegungen nicht immer nachzuweisen. Was also löst Scrambling in den Fällen aus, in denen kein solcher Effekt erzielt wird, z.B. bei der Umstellung zweier definiter DPen, die, wie o.a., nicht als koreferent oder als gebunden bezeichnet werden können? Bindung kann auch dort nicht als Auslöser von Scrambling fungieren, wo die abgeleitete Position des bewegten Elementes zu einer Konfiguration führen sollte, die nach bindungstheoretischen Erkenntnissen ungrammatisch sein müsste: 71. Die Männer sind nicht allesamt unrasiert... a) weil ja PETeri sichi rasiert hat. (R-Ausdruck bindet Anapher) b) ?? weil ja sichi PETeri rasiert hat (R-Ausdruck offenbar nicht frei) c) weil sichi ja PETeri rasiert hat
–
–
(Scrambling der Anapher möglich – R-Ausdruck frei!)
Zum zweiten stellen auch Skopuseffekte – wie bereits gezeigt – z.B. für definitive DPen keine theoretische Möglichkeit dar, internal merge gegenüber der semantischen Schnittstelle zu legitimieren. Auch die Bewegung von Pronomina führt nicht zwangsläufig zu neuen Skopus- oder Bindungskonstellationen – insbesondere dann, wenn die Pronomina (in der Wackernagelposition) exakt die gleiche Abfolge einnehmen, die sie auch in der Basisabfolge aufweisen.
Insgesamt muss daher die Einschätzung getroffen werden, dass Scrambling zwar in manchen, nicht aber in allen Fällen als Instanz von optionalem, EF-getriebenen internal merge aufgefasst werden kann. Mit Sherlock Holmes ließe sich nun fragen, ob nach dem Ausschluss aller möglichen Lösungen nicht womöglich die unmögliche Lösung sich als die richtige erweist: Handelt es sich bei den bisher unerklärten Scrambling-Phänomenen, insbesondere also dem Scrambling von definiten DPen und Pronomen, um eine obligatorische, EPP-getriebene Bewegung?
6 Obligatorische Bewegungen als Ursache von Stellungsoptionen: vP-TP-Bewegungen als zweite Scrambling-Operation Möchte man die Möglichkeit in Betracht ziehen, dass Scrambling-Bewegungen zumindest teilweise durch obligatorische, EPP-getriebene Bewegungsprozesse herbeigeführt werden, so muss man sich – um ungedeckte Stipulationen zu vermeiden – dieser Annahme vor dem Hintergrund der untersuchten Sprache nähern: Welche EPP-getriebenen Bewegungen dieses Typs sind also z.B. für das Deutsche unabhängig belegt? Hier lässt sich aus der Masse von Vorschlägen (und Gegenvorschlägen) vermutlich nur ein klarer Kandidat für eine solche Art von Bewegung aufzeigen: Die Subjektbewegung ist die quintessentielle EPP-Bewegung. Tatsächlich ist bekannt, dass mit dieser Bewegung (z.B. im Englischen) oft keinerlei systematischer semantischer Effekt verbunden ist, da das Subjekt alle seine Eigenschaften (weiter Skopus, Bindung von Objekten, etc.) bereits innerhalb der vP aufweisen kann. Prüft man allerdings die Umstände der Subjektbewegung, so stellt man schnell fest, dass im Deutschen die Verhältnisse komplizierter zu sein scheinen: Es gilt, dass das EPP von T im Deutschen offenbar nicht immer (wie im Englischen) die Nominativ-markierte DP in SpecvP (vulgo: das ‚Subjekt‘) attrahiert (vgl. schon Webelhuth 1984: 207, im Rahmen der aktuellen Syntax auch Sabel 2005: 283). Das Subjekt kann, wie das folgende Beispiel zeigt, zum einen in seiner vP-Position verbleiben (a), muss zum zweiten nicht immer nominativischen Kasus tragen (b) und schlussendlich existieren auch Fälle (die unpersönlichen Passive), in denen überhaupt kein Argument für die Besetzung der vermeintlichen A-Position SpecTP zur Verfügung steht (c): 72. a) Nominativ nicht links: dass dem MannDAT (wohl) das BuchNOM geschenkt wurde b) Kein Nominativargument: weil mirDat vor DirDat graut. c) Überhaupt kein Argument: Gestern wurde hier getanzt. Es muss zudem sofort darauf hingewiesen werden, dass die theoretische Trickkiste der Government and Binding-Theorie hier nicht zum Einsatz gelangen kann: Während die Annahme leerer Element oft dazu genutzt wird, die Abwesenheit theoretisch erwarteter Stellungsmuster zu erklären, lässt sich diese Technik hier nicht anwenden: Ein leeres Expletivum anzusetzen, welches die SpecTP-Position EPP-konform implementieren könnte, ist in den genannten Fällen nämlich kaum
90
Obligatorische Bewegungen als Ursache von Stellungsoptionen
überzeugend. Die overte Expletiva des Deutschen (die ja sehr wohl verfügbar wären) sind in dieser Position nämlich gerade nicht möglich: 73. a) *dass es dem Mann das Buch geschenkt wurde b) *Gestern wurde es hier getanzt. Selbst dort, wo Expletiva im Mittelfeld auftreten, lösen sie oft die technischen Probleme nicht: Generell muss gelten, dass das expletive es im Deutschen nicht die Verbflexion bestimmt. Vielmehr bestimmen andere, nicht-expletive Argumente im Normalfall den Numerus des Verbs: 74. a) weil es doch wirPl sindPl/*binSg, die die Rechnung bezahlen b) weil es doch ichPl *sindPl/binSg, der die Rechnung bezahlt Damit aber werden die Fälle zum Problem, die kein nominativisches Argument neben dem Expletivum beinhalten: 75. a) weil mirSg geholfen wirdSg – aber auch: b) weil unsPL geholfen wirdSg Im Beispiel (b) weist das Auxiliar wird eine singularische Flexion auf, obwohl das Dativargument uns keine singularische Form ist. Welches Element steuert daher hier die singularische Flexion des Verbs? Nimmt man an, dass ein leeres Expletivum hier die SpecTP-Position besetzt, so kommt man nicht umhin festzustellen, dass dieses Expletivum für das Deutsche untypisch ist: Die Verbflexion scheint im genannten Beispiel ja eben nicht durch die vorhandenen Argumente gesteuert zu werden. Damit könnte das angesetzte coverte Expletivum aber nicht als (lediglich covertes) Gegenstück eines bekannten overten Expletivums angesehen werden: Das coverte Expletivum scheint andere Kongruenzeigenschaften zu haben. Das Element wäre, mit anderen Worten, nicht unabhängig attestiert – und damit ad hoc stipuliert. Letztlich müsste daher der Zusammenhang zwischen der SpecTP-Besetzung und der Steuerung der verbalen Flexion an diesem Punkt doch wieder idiosynkratisch erklärt werden und eine einheitliche Lösung könnte nicht mehr erreicht werden. Durch eine uneinheitliche Behandlung verschiedener Arten von T-Köpfen (die mal diese und mal jene Phrase in ihre Spezifikatorpositionen bewegen) und ihren jeweiligen Kongruenzeigenschaften (mal argumentenbasiert, mal default) geht die Essenz der funktionalen Kategorie T nun aber verloren: Das EPP von T soll universell sein und die Kongruenzeigenschaften des Kopfes T nach Möglichkeit invariant. Biberauer & Richards (2006) gehen daher
Obligatorische Bewegungen als Ursache von Stellungsoptionen
91
davon aus, dass das EPP von T im Deutschen uniform die einzige Kategorie attrahiert, die in jedem Fall vorhanden ist: v! Die vP-Bewegung erscheint in Anbetracht der oben diskutierten Eigenschaften von ‚Subjekten‘ im Deutschen dringend gefordert: Die Verhältnisse des Englischen (obligatorische Anhebung eines nominativen Arguments) lassen sich definitiv nicht empirisch zufriedenstellend auf das Deutsche (mit seinen vielfältigen Varianten der Argumentdistribution und Kongruenzlizensierung) übertragen. Biberauer & Richards schlagen vor, dass das deutsche T Sondenmerkmale enthält, die Zielmerkmale von v als Ziel identifizieren. Die Operation hebt (aus Gründen der Strukturerhaltung) die gesamte vP nach SpecTP anhebt: 76. [TP [vP Subj iO dO V] IM-Kopie der vP
[vP Subj iO dO V]] Per EM verkettetes ‚Original‘
Diese Darstellung erscheint nicht nur auf den ersten Blick ungewöhnlich – sie scheint sogar die Möglichkeit zu gefährden, Scrambling-Bewegungen ins linke Mittelfeld durchführen zu können: Wo sollen umgestellte Elemente Platz finden, wenn das linke Mittelfeld bereits die gesamte vP enthält? Natürlich sind diese Sorgen aber unbegründet: Durch die Möglichkeit, alle Argumente, die in der vP enthalten sind, auch ohne EoO, im Rahmen einer EPP-getriebenen, obligatorischen (und daher potentiell semantisch unmotivierten) Bewegung ins linke Mittelfeld zu bringen, entsteht ganz im Gegenteil die Möglichkeit, die oben genannten Problemfälle (eben das scheinbar unmotivierte Scrambling von definiten DPen und Pronomen) zu erklären. Folgende rein formalen Bewegungsmöglichkeiten sind im Deutschen damit der vorliegenden Analyse nach gegeben: Scrambling-Optionen des Deutschen: – Elemente, die sich EoO-konform bewegen können, verlassen die vP, bevor T verkettet wird. – Alle Elemente, die keinen Grund hatten, die vP zu verlassen, werden durch die Anhebung der vP nach SpecTP mit angehoben!
Die folgende Beispielderivation (in Anlehnung an die in 3.3.1. und 3.3.2. definierten syntaktischen Annahmen) mag das Verhalten dieses Systems verständlicher machen: – QPen können EoO-konform per EF von PH nach SpecvP bewegt werden (vgl. Frey 1993, Hinterhölzl 2004 für sehr ähnliche Vorschläge). IM generiert:
92
Obligatorische Bewegungen als Ursache von Stellungsoptionen
77. [QP2 [vP QP1 QP2 ObjFoc V] V] [QP2 fast jedem Studenten] [[QP1 mindestens ein Professor] [QP2 fast jedem Studenten] [die PRÜFung] versaut versaut. –
–
Der EoO einer Bewegung kann nota bene auch in vielen anderen Kontexten auftreten. Er kann z.B. daher rühren, dass QPen ihre skopale Ordnung ändern, oder dass ein DP-Argument bestimmte Adverbien oder ähnliche skopusnehmende Elemente überquert. Auf diese Weise ergeben sich eine große Vielzahl von Mittelfeldbewegungen, die die vP-Abfolge der Argumente EoOkonform permutieren. Mit der EoO-konformen Bewegung stehen also eine große Anzahl von Umstellungsoptionen bereit, die im Rahmen der vorliegenden Arbeit nicht thematisiert werden brauchen: Frey (1993), Hinterhölzl (2004) und andere Autoren thematisieren die semantisch erklärbaren Umstellungen bereits sehr genau. Die vorliegende Arbeit konzentriert sich daher weiterhin auf diejenigen Umstellungen, die keinen semantischen Auslöser zu haben scheinen. Nach der Verkettung weiterer Element (etwa einer Modalpartikel) bewegt sich die vP nach SpecTP: 78. [TP [vP QP1 QP2 ObjFoc V]] ... (Part)...[QP2 [vP QP1 QP2 ObjFoc V] V]
Da diese Struktur die Bestandteile QP1 und ObjFoc noch in mehreren Kopien enthält, entspricht sie keinem äußerbaren Satz (sodass kein Beispielsatz o.ä. gebildet werden kann). Bewegungen dieser Art sind theoretisch aber hinlänglich bekannt: Müller etwa schlägt vor, dass sich Phrasen als sogenannte remnants auch dann bewegen können, wenn Material aus den bewegten Phrase in früheren Derivationsschritten die bewegte Phrase bereits verlassen hat. Auf diese Weise entstehen Konfigurationen, die aussehen, als würden Elemente bewegt, die keine (oder zumindest keine vollständige) Konstituente zusammen bilden. Im folgenden Beispiel bewegt sich z.B. zunächst das direkte Objekt ein Buch aus der VP hinaus, bevor diese dann (allerdings ohne das direkte Objekt) ins Vorfeld bewegt wird (Bsp. Müller 2002: 212): 79. [VP,2 dem Jason1 t3 zum Geburtstag geschenkt] hat sie ein Buch3 t2 Die theoretischen Bedenken, die in älteren Theorieständen zum remnant movement diskutiert wurden, sind im vorliegenden Modell weitgehend irrelevant: Das Empty Category Principle (ECP) etwa, welches durch die remnants Müllers verletzt erschien, hat keine direkte Entsprechung im Rahmen des aktuellen Modells:
Obligatorische Bewegungen als Ursache von Stellungsoptionen
93
Da Bewegungen keine Spuren (also leere Elemente) sondern Kopien hinterlassen und die Relation der strikten Rektion ebenfalls nicht definiert werden kann, ist eine direkte Implementation eines vergleichbaren Prinzips auch kaum möglich. Die empirischen Vorhersagen, die auf der Basis des ECP gemacht wurden, werden zudem im Rahmen der aktuellen Theorie durch generellere Prinzipien der Strukturbildung überflüssig: Wenn es darum geht, Bewegungen in strukturell ‚tiefere‘ Positionen zu verhindern, wird dies z.B. durch die extension condition im Rahmen einer dynamischen Derivation ohnehin geleistet (vgl. schon Chomsky 1995). Aus theoretischer Sicht spricht daher rein gar nichts gegen die Annahmen von Biberauer & Richards (2006). Wie aber lassen sich die empirischen Eigenschaften des deutschen Mittelfeldes vor diesem theoretischen Hintergrund ableiten? Müssten Elemente, die mit der vP in die SpecTP-Position angehoben wurden, nun nicht zwangsweise im linken Mittelfeld auftreten? Treten die grundlegenden Probleme Freys und Meinungers (nämlich die letztlich zu harten Generalisierungen) damit auch in der vorliegenden Theorie noch einmal – und sogar in noch verschärfter Form – auf? Wie das folgende Kapitel zeigt, ist dies nicht der Fall: Die PF-Komponente muss (in regelhafter Form und für alle bewegten Elemente) darüber entscheiden, welche Kopie einer bewegten Phrase phonologisch ausgewertet wird. Damit entscheidet sich auf PF auch, welche Position diejenigen Elemente einnehmen, die in der vP bewegt wurden: Werden diese Elemente in der ‚hohen‘ vP-Kopie (die in SpecTP steht) ausbuchstabiert oder lässt sich erreichen, dass bestimmte Argumente auch in der ‚tiefen‘ Kopie der vP (anders ausgedrückt: der per EM verketteten Original-vP) phonologisch realisiert werden, sodass sich diese Argumente nicht zu ‚bewegen‘ scheinen?
7 Distributed Deletion als Auswahl von Kopien bewegter Elemente Für Bewegungen gilt im Rahmen der aktuellen Syntax generell, dass die Frage nach der phonologischen ‚Sichtbarkeit‘ einer Bewegung auf PF entschieden wird: Galt in der Theorie des Government and Binding noch, dass Spuren (lies: alle Positionen, die eine bewegte Phrase ‚verlassen‘ hatte) für die Aussprache nicht zur Verfügung standen, so gilt nun, dass die PF, in manchen Fällen, auch die nicht-höchste Kopie eines Elementes ausbuchstabieren kann. Damit wird nota bene keine Aufweichung der empirischen Vorhersagen gegenüber dem älteren Theoriestand herbeigeführt: In der GB war es ebenfalls möglich, eine ‚niedrige‘ Oberflächenposition mit einer ‚hohen‘ LF-Position zu verbinden: Die gesamte Daseinsberechtigung des LF-Zweigs der syntaktischen Architektur verdankt sich ja bekanntlich der Möglichkeit, die Operation move-α auch covert applizieren zu lassen! Ganz generell wurde damit (z.B. etwa beim quantifier raising) ein mismatch zwischen der oberflächlich beobachtbaren Reihenfolge und der interpretatorischen Auswertung akzeptiert. Die PF-Auswertung einer ‚nicht-höchsten‘ Kopie ist also syntakto-semantisch bereits abgesichert.
7.1 Möglichkeit der verteilten Tilgung Im Falle der vP-Bewegung nach SpecTP erscheinen die Verhältnisse jedoch einigermaßen speziell: Es kann ja hier nicht allein darum gehen, eine Spellout-Entscheidung für die gesamte vP zu erreichen! Wenn die Darstellung dazu dienen soll, das Stellungsverhalten einzelner Argumentphrasen zu erklären, so müssen die PF-Entscheidung auch einzelne Argumentphrasen betreffen – mit anderen Worten: Die PF setzt nicht die gesamte vP phonologisch in ihrer hohen oder tiefen Stellung um, sondern buchstabiert einzelne Bestandteile der vP in verschiedenen Kopien aus. Damit setzt die Analyse eine theoretische Möglichkeit ein, die für die Bewegungstheorie älterer Modelle technisch kaum implementierbar war. Liegt demnach in diesem Fall also eine technische Stipulation vor, die lediglich ad hoc die vorliegende Analyse ermöglichen soll? Dies ist nicht der Fall, denn für verteilte Tilgungen besteht im Deutschen wohletablierte unabhängige Evidenz: Auch andere Strukturen zeigen in dieser Sprache nämlich weitreichende Möglichkeiten, sogenannte split movements durchzuführen (vgl. Fanselow & Cavar 2002 für eine Diskussion der theoretischen Vorschläge). Vergleichbar dem vorliegenden Fall erscheint es auch hier so, als ob eine bewegte Phrase sich durch das split movement in mehrere Teile ‚aufspaltet‘, die sich unabhängig voneinander in
Möglichkeit der verteilten Tilgung
95
der Struktur positionieren (a). Für zumindest einige Sprecher (mich selbst eingeschlossen) sind auch mehrfache Splits möglich (b): 80. a) Hunde hab ich damals immer nur kleine __, die nicht beißen, gestreichelt. Bewegt wird: [kleine Hunde, die nicht beißen] b) Bücher durfte man interessante __ damals in den Osten ja keine __ mitnehmen. Bewegt wird: [keine interessante(n) Bücher] Fanselow & Cavar (2002) können überzeugend nachweisen, dass dieses Phänomen nicht durch syntaktische Subextraktion erklärt werden kann: Die Bewegungen scheinen zwar Lokalitätsrestriktionen generell zu respektieren, es lässt sich aber zeigen, dass die Phrase, aus der heraus angeblich subextrahiert wird, auch dann nicht als Barriere ‚mitgezählt‘ wird, wenn sie dies nach gängigen Annahmen des Government and Binding tun müsste. Alle Barrieren, die außerhalb der aufgespaltenen Phrase liegen, fungieren jedoch als Barrieren. Es scheint daher angemessen, eine Theorie zu formulieren, die die gesamte aufzuspaltende Phrase bewegt (sodass die Lokalitätsrestriktionen erklärt werden können), Teile der Phrase aber an verschiedenen Positionen im Strukturbaum phonologisch realisiert (sodass die nur teilweise Umstellung des in den Phrasen enthaltenen Materials erklärbar wird). Fanselow & Cavar streben dennoch eine einheitliche Repräsentation aller Bewegungsoperationen an, die auch für nicht-verteilte Aussprachen (und damit ganz generell) reguliert, wo durch die PF-Derivation welche Bestandteile der syntaktisch erzeugten Struktur ausbuchstabiert werden. Sie definieren die Möglichkeit zur (Distributed) Deletion für das Deutsche wie folgt: Suppose that XP bears a feature f1 that requires that XP be overtly realized in position A, and an additional feature f2 that forces XP into position B. Then XP is split up in [...] German. (Fanselow & Cavar 2002: 85)
Im Standardfall muss eine bewegte Phrase nun also nur eine einzige SpelloutPosition bekleiden, und kann daher unzerteilt in dieser Position ausbuchstabiert werden. Tritt aber der von Fanselow & Cavar beschriebene Merkmalswiderspruch auf, wird die Phrase ‚verteilt gelöscht‘, um allen Spellout-Anforderungen gleichzeitig gerecht zu werden.
96
Distributed Deletion als Auswahl von Kopien bewegter Elemente
Wann liegt der Merkmalswiderspruch vor? In ihren Beispielen diskutieren Fanselow & Cavar sehr häufig fokussierte Teile einer XP (2002: 72): 81. In /SCHLÖSSern habe ich noch in KEINen gewohnt. [In keinen /SCHLÖssern] habe ich [in KEINen Schlössern] gewohnt. f1 = [Kontrastives Topik] f2 = [Fokus] Diese Konfiguration liegt nun aber, wie sich zeigen lässt, auch im Falle einer bewegten vP häufig vor. Wird z.B. ein Objekt, welches in der vP enthalten ist, fokussiert, so muss die vP zwei Spellout-Anforderungen gerecht werden: 82. [TP [vP Subj v iO dOFoc V] f1 = [EPP-Ziel] auf v
Part
[vP Subj v iO dOFoc V] V] f2 = [Fokus] des dO
Wie dieses Beispiel zeigt, liegt also technisch für die vP-Bewegung just die theoretische Konfiguration vor, die Distributed Deletion der vP gestatten sollte. Wie unten gezeigt wird, kann die gezeigte Derivationsstruktur in späteren Bearbeitungsschritten tatsächlich in äußerbare Sätze überführt werden (auch wenn das gegebene Beispiel keinen solchen Satz darstellt). Es muss ausdrücklich betont werden: Die Distributed Deletion wurde von Fanselow & Cavar nicht vorgeschlagen, um damit spezifisch die Implementation von Scrambling zu erklären. Vielmehr geht es den Autoren darum, sogenannte split movements im Deutschen ganz generell technisch möglich zu machen. Fanselow & Cavar untersuchen auf diese Weise die Distribution von (Material aus) DPen und PPen. Die Übertragung dieser theoretischen Annahme auf vPen stellt also eine neue, aber keinesfalls stipulative Annahme dar: Es wäre, ganz im Gegenteil, überraschend, wenn vPen von einer generellen PF-Option ausgeschlossen wären. Damit steht mit der Distributed Deletion eine unabhängig benötigte und unabhängig begründete PF-Implementation zur Verfügung, die ohne jede weitere Stipulation in der Lage ist, die variablen Stellungsmuster von EoO-los bewegten Elementen zu erklären. Die Zirkularität der SpecHead-Ansätze wird in der vorliegenden Analyse daher bereits im Ansatz vermieden: Die verteilte Tilgung ist eine generelle Option des Deutschen, die sich in einer Vielzahl von Bewegungsprozessen nachweisen lässt. Aus theoretischer Sicht ist die vorliegende Annahme einer Distributed Deletion auch der vP daher meines Erachtens attraktiv.
Restriktionen zur verteilten Tilgung der vP in SpecTP
97
Zu klären bleibt aber noch, unter welchen empirischen Bedingungen welche Elemente in welcher Kopie der vP ausgesprochen werden.
7.2 Restriktionen zur verteilten Tilgung der vP in SpecTP Um die Theorie der Distributed Deletion an dieser Stelle nicht über Gebühr zu strapazieren, soll im Folgenden kurz gezeigt werden, dass die eingangs genannten empirischen Eigenschaften von Scrambling-Strukturen dazu geeignet sind, die verteilte Tilgung der vP wirksam zu steuern. Es muss allerdings von Anfang an betont werden, dass nicht alle Eigenschaften sprachlicher Strukturen für PF relevant sind: Im Gegenteil geht die neuere Forschung davon aus, dass es Hauptaufgabe (und möglicherweise sogar die raison d‘être) der Syntax ist, jeder Schnittstelle nur diejenigen Merkmale und Konfigurationen zukommen zu lassen, die dort auch interpretiert werden können. Verfügbar sind im gewählten theoretischen Rahmen daher auf PF lediglich Merkmale, die: – von der phonologischen und der semantischen Schnittstelle gleichermaßen ausgewertet werden können (z.B. Merkmale wie [Tempus] oder [Modus], die – zumindest in vielen Sprachen – sowohl semantische Relevanz wie auch phonologische Substanz haben) – oder aber rein phonologischer Natur sind (prosodische oder andere phonologische Merkmale). Semantische oder pragmatische Merkmale und Eigenschaften können auf der PF-Ebene aber nicht einschlägig sein, da sie für PF nicht interpretierbar sind. Daher kann und soll im Folgenden nicht versucht werden, Merkmale wie etwa [Topik] nun ‚doch noch‘ auf PF zu verwenden, gewissermaßen nur verschoben in der Architektur. Für das Merkmal [Fokus] hingegen scheint ganz klar zu gelten, dass es (zumindest) für die phonologische Schnittstelle verfügbar ist: Die Fokusexponenz wird ja in vielen Fällen (wie in Unterkapitel 3.3.3. gezeigt) dadurch berechnet, dass eines der f-markierten Elemente die Hauptbetonung trägt (vgl., wie schon o.a., z.B. Höhle 1982, Büring 2001, 2006, Schwarzschild 1999). Daher muss der PF-Schnittstelle dieses Merkmal für die Berechnung der prosodischen Struktur unzweifelhaft bekannt sein. Ähnliches lässt sich über das Merkmal [kontrastives Topik] sagen: Kontrastive Topiks werden durch einen Anstieg der f0-Kurve (in deklarativen Sätzen) phonologisch indiziert. Damit gilt für [Foki] und [kontrastive Topiks] unzweifelhaft, dass diese Merkmale (mindestens) für die phonologische Schnittstelle (vielleicht aber auch für beide Schnittstellen) relevant sind. Auch hier zeigt sich, mit anderen Worten, ein gewichtiger Unterschied zwischen Merkmalen wie [Fokus] oder [kontrastives Topik], welche intonatorisch
98
Distributed Deletion als Auswahl von Kopien bewegter Elemente
zweifelsfrei nachweisbar sind, und dem nur recht problematisch definierbaren [Topik], dessen Effekte auf der semantischen und der phonologischen Schnittstelle vergleichsweise unklar bleiben: Nur informationsstrukturelle Kategorien, die (potentiell) prosodisch markiert werden, können also ohne Stipulation für sich in Anspruch nehmen, PF-relevant zu sein – und damit potentiell auch zur Steuerung von PF-Operationen geeignet. Eine weitere Kategorie, die in verschiedenen Diskussionen zum Scrambling immer wieder fällt, ist die der Definitheit (vgl. schon Lenerz 1977 und viele nachfolgende Arbeiten). Auch für das Merkmal [definit] kann gelten, dass es sowohl semantisch relevant ist (für die Interpretation der Referenz der DP), wie phonologisch repräsentiert sein muss (z.B. für die Distribution von starken/schwachen attributivischen Flexionselementen, vgl. Struckmeier 2007). Welchen Einfluss vermögen demnach Merkmale wie [Fokus], [kontrastives Topik] oder [definit] auf die Distributed Deletion nehmen? Dies soll in den nächsten zwei Unterkapiteln vorgestellt werden.
7.2.1 Die Ausgabe der Kernsyntax ermöglicht Distributed Deletion Wir können nun folgende Annahmen für den Einfluss syntaktischer Operationen auf die PF-Implementation von Distributed Deletion machen: a) Die Distributed Deletion der vP in SpecTP betrachtet für ihre PF-Implementation nur solche Argumente und Adjunkte, die sich nicht bereits in früheren Derivationsschritten (EoO-konform) aus der vP hinausbewegt haben – oder aber nie in der vP enthalten waren. vP-TP-Bewegungen können (in Grenzen, die durch die Performanz gezogen werden) aber auch die größeren vP-Schalen erfassen, die durch die EoO-konformen Bewegungen erzeugt werden (vgl. Unterkapitel 7.2.1.1.). b) Fokussierte und kontrasttopikalisierte syntaktische Objekte werden von der vP-TP-Bewegung unterschiedlos mit nach SpecTP bewegt (vgl. 7.2.1.2.)
7.2.1.1 An den Grenzen der vP-TP-Definition: Scrambling über Subjekte? Wenn man nicht annehmen möchte, dass das Deutsche eine unlernbare und antifunktionale Sprache ist, so muss man folgerichtig annehmen, dass das Deutsche syntaktische Bewegungen, zumindest im Normalfall, auch in der PF-Komponente
Restriktionen zur verteilten Tilgung der vP in SpecTP
99
ausdrücken kann und soll: Die semantischen Effekte der Umstellung müssten ja sonst auch in solchen Strukturen auftreten, die die Umstellung nicht overt aufweisen! Damit sind Elemente, die die vP bereits per IM verlassen haben, bevor selbige vP nach SpecTP bewegt wird, aus der Berechnung der PF ausgeschlossen, was die Aussprache der per EM vP-intern verketteten Kopien angeht. Das Problem eines mismatches zwischen der phonologischen und der semantischen Komponente wird nota bene nicht von der hier vorgeschlagenen Analyse erzeugt (und auch nicht verschärft): Letztlich waren in der Government and BindingTheorie über die Operationen der Rekonstruktion, bzw. der coverten (LF-) Bewegung sowohl ‚semantisch nicht spürbare Bewegungen‘ wie auch ‚phonologisch unsichtbare, aber semantisch nachweisbare Bewegungen‘ zulässig. Demnach kann also auch Frey (1993) letztlich nur per Stipulation garantieren, dass Scrambling-Bewegungen gemäß seinem Skopusprinzip zum einen tatsächlich auf LF interpretativ ausgewertet werden (und nicht durch Rekonstruktion ‚semantisch unsichtbar‘ gemacht werden) und zum anderen die Skopusambiguität, die sich durch Scrambling erzeugen lässt, nicht auch die Basisabfolge betrifft (weil die Permutation der Basisabfolge durch eine coverte LF-Bewegung ja ‚phonologisch unsichtbar‘ möglich wäre). Eine echte Restriktion der Abbildung der semantischen Verhältnisse auf die lineare Wortstellung war damit in der Ära des Government and Binding und im Frühminimalismus nie wirklich gegeben. Und auch für aktuelle syntaktische Theorien zeigt sich immer wieder, dass die Übereinstimmung zwischen den semantischen und den Wortstellungsverhältnissen zum Teil erst durch entsprechende pan-grammatische Restriktionen sichergestellt werden mussten (z.B. Minimize Mismatch, vgl. Bobaljik 2002 oder Scope Transparency, vgl. Bobaljik & Wurmbrand 2012, vgl. ähnlich auch Sabel 2005: 298). Bewegungen sollten also – im Regelfall – auch für die PF sichtbar gemacht werden. Das bedeutet für die vorliegende Analyse konkret, dass QPen oder bindungsrelevante Elemente, die die vP EoO-konform verlassen haben, oft in der Zielposition ihrer EoO-Bewegung auftreten können (oder aber in noch höheren Positionen, wenn die Bewegung in den äußeren Spezifikator der vP nur der erste Schritt einer sukzessiv-zyklischen Bewegung war). Einfacher gesagt: die vPBewegung nach SpecTP kann erfasst oft nur die innerste vP-Schale, wie im folgenden Beispiel: 83. a) b) c) [TP[vP Subjekt Objekt] Part
[vP Objekt [vP Objekt
[vP Subjekt Objekt] [vP Subjekt Objekt]] [vP Subjekt Objekt]]]
Die Annahme, dass die kleinste vP nach SpecTP bewegt wird, ist letztlich also empirisch begründet – sie erklärt auch die Ambiguität solcher Strukturen, die
100
Distributed Deletion als Auswahl von Kopien bewegter Elemente
(zumindest bezüglich der Argumentabfolge) der vP-internen Abfolge zu entsprechen scheinen: 84. [TP[vP Subjekt Objekt] Part [vP Objekt [vP Subjekt Objekt]]] Distributed Deletion ergibt: [TP[vP Subjekt Objekt] Part [vP Objekt [vP Subjekt Objekt]]] Dies entspricht dem folgenden Beispiel: weil [TP... [vP fast jeder Mann mindestens eine Frau...] ja [vP mindestens eine Frau [vP [fast jeder Mann] [m.e.F.]...]] liebt] a) und zwar Marilyn Monroe (∃∀) b) , nämlich seine eigene Ehefrau (∀∃) Eine Frage, die die vorliegende Arbeit nicht gänzlich klären kann ist die, ob auch äußere Schalen der vP nach SpecTP bewegt werden können: Damit würde nämlich ein Szenario entstehen, in dem das Subjekt im linken Mittelfeld nicht das am weitesten linksstehende Element ist: 85. a) b) [vP Objekt c) [TP [vP Objekt [vP Subjekt Objekt]] Part [vP Objekt
[vP Subjekt Objekt] [vP Subjekt Objekt]] [vP Subjekt Objekt]]]
Distributed Deletion ergibt: [TP [vP Objekt [vP Subjekt Objekt]] Part [vP Objekt [vP Subjekt Objekt]]] In vielen Fällen erscheinen solche Umstellungen schlecht – was aber nun nicht direkt als Beleg dafür gesehen werden kann, dass sie kernsyntaktisch unmöglich seien sollten: Man muss sich vergegenwärtigen, dass dieses Szenario im Grunde nur auftreten kann, wenn eine ganze Liste von Anforderungen erfüllt ist: – Um die Aussprache beider hohen Argumentkopien zu legitimieren, darf weder das Subjekt noch das Objekt fokussiert sein. – Sowohl das Subjekt als auch das Objekt können zudem von der Distributed Deletion in der oberen vP-Kopie ausbuchstabiert werden – weil sie definite Argumente und/oder Kontrasttopiks sind.
Restriktionen zur verteilten Tilgung der vP in SpecTP
– –
–
101
Das Objekt muss sich EoO-konform über das Subjekt bewegt haben. Soll dieser EoO in Form einer skopalen Änderung bestehen, müssen sowohl das Subjekt als auch das Objekt QPen sein: Nur so kann die Änderung der relativen Abfolge der Argumente eine Skopusänderung (und damit einen EoO) herbeiführen. Um einen guten prosodischen Grund zu haben, das rechte Mittelfeld zu entleeren (lies: keine basisnähere Abfolge zu verwenden) sollten am besten beide Argumente als Kontrasttopik dienen und der Fokusexponent ausserhalb der vP liegen (z.B. auf einer Negation), damit eine prosodische Motivation besteht, die rises der Kontrasttopiks vor dem fall in der hohen vP-Kopie zu platzieren.
Diese Liste von Anforderungen ist so lang, dass es niemanden wundern würde, wenn Sätze mit dem beschriebenen Anforderungsprofil so konstruiert und komplex erschienen, dass sie (selbst bei eventuell gegebener kernsyntaktischer Grammatikalität) nicht als akzeptabel bewertet würden. Nach meinem Dafürhalten aber sind Sätze, die den genannten Anforderungen entsprechen, zwar definitiv ziemlich komplex – aber nicht inakzeptabel: 86. Syntax: [TP [vP Objekt [vP Subjekt Objekt V]] Part NegationFokus [vP Objekt [vP Subjekt Objekt V]] Aux] Beispiel dann: (Kontext: Eine Computerfirma wollte nur noch Computermodelle bauen, die absolut jeder Benutzer bedienen kann. Das Projekt scheiterte aber: In einem Versuchslauf mit Probanden konnte gezeigt werden, dass...) [TP [vP fast /JEDen Computer [vP mindestens /EIN User...]] wohl NICHT [vP fast /JEDen Computer [vP mindestens /EIN User fast jeden Computer verstanden]] hatte. = dass fast /JEDen Computer mindestens /EIN User wohl NICHT verstanden hatte. Wiewohl dieser Satz intonatorisch unruhig und semantisch kompliziert ist, scheint er mir keineswegs ungrammatisch zu sein. Ihm fehlen nach meiner Intuition auch die vorhergesagten Lesarten nicht: Durch die EoO-konforme Bewegung des Objekts über das Subjekt wird mit Frey (1993) Skopusambiguität vorhergesagt. Diese scheint mir im o.a. Beispiel vorzuliegen: Entweder hat ein einzelner User sich als besonders unverständig in der Computerbedienung erwiesen (∃∀) oder
102
Distributed Deletion als Auswahl von Kopien bewegter Elemente
aber, für die jeweiligen Computermodelle gab es (möglicherweise je verschiedene) Benutzer, die damit nicht zurecht kamen (∀∃). Nun mögen Sätze wie der gerade diskutierte nicht von allen Sprechern als gleichermaßen akzeptabel bewertet werden – bereits in vielen wesentlich einfacher gelagerten Beispielen kann man feststellen, dass auch Muttersprachler des Deutschen sich in ihren Urteilen nicht einig sind. Andere Sprecher des Standarddeutschen (noch viel mehr: Sprecher anderer deutscher Dialekte) könnten etwa eine stärkere Präferenz dafür haben, die Basisabfolge auch im linken Mittelfeld oberflächlich vorzufinden. Eine solche Zuweisung von Oberflächenrestriktionen wird von anderen Autoren auch theoretisch diskutiert (vgl. z.B. Fox & Pesetsky 2005) und soll daher an dieser Stelle auch nicht ausgeschlossen werden. Dennoch scheint mir mithilfe eines Skopus-EoOs auch die Abfolge Objekt > Subjekt > Partikel im Deutschen nicht unmöglich zu sein. Eine (technisch wohl zu implementierende) Restriktion dahingehend, dass nur die innerste Schale der vP für die Bewegung nach SpecTP zur Verfügung stünde, erscheint mir persönlich als empirisch unnötig. Ein Bindungs-EoO scheint in vergleichbaren Strukturen nun zunächst recht schwer herzustellen zu sein: Da Subjektsanaphern im Deutschen nicht existieren kann ein umgestellter Binder hier keinen eindeutigen EoO auslösen. Auch Bindung in Subjekts-DPen hinein scheint empirisch nicht einfach zu erzeugen zu sein: Im folgenden Satz, der eine EoO-konforme Bewegung des direkten Objektes mit einer anschließenden vP-TP-Bewegung verbindet, erscheint mir die Intonation so unruhig und die semantische Lage so komplex, dass ich den Satz nicht mehr zuverlässig bewerten kann: –
(Kontext: Die Urlaubsorganisation hatte alle Gäste ihren Gastgebern zuordnen sollen. Bei den Kurzzeitgästen hatte das auch geklappt – aber die Dauergäste waren ein Desaster,...) ? weil jedeni /DAUergast seini /GASTgeber wohl NICHT erwartet hatte. = [TP [vP jeden Dauergast [vP seini Gastgeber jeden Dauergast ...]] ja nichtFokus [vP jeden Dauergast [vP sein Gastgeber jeden D. erwartet]] hatte]
Ich bin mir bei diesem Beispiel nicht sicher, ob mit der Bewegung des direkten Objekts jeden Dauergast über das Subjekt hinweg überhaupt ein Bindungs-EoO erreicht werden kann – auch die Basisabfolge scheint mir die koreferente Lesart von seini und jedeni nämlich schon zu erlauben:
Restriktionen zur verteilten Tilgung der vP in SpecTP
103
87. (?) weil ja [seini Gastgeber jedeni Gast erwartet hatte] Das gegebene Beispiel bleibt daher inkonklusiv. Auch für Bindungs-EoOs lässt sich aber ein anderes Szenario denken, in dem eine äußere Schale einer vP bewegt wird. Wenn die Subjektsbindung nicht klar genug zu kontrollieren ist müssten dazu aber am besten Bindungsoptionen untersucht werden, die die Bindung von Objekten untereinander betreffen. Demnach müsste die Anforderungsliste für dieses Szenario nun wie folgt aussehen: – Die nach SpecTP bewegte vP enthält eine Anapher als indirektes Objekt. Das direkte Objekt hat sich EoO-konform bewegt um diese Anapher zu binden. – Keines der Argumente ist fokussiert, stattdessen sind einige Elemente kontrasttopikalisiert. – Der Fokus liegt wiederum auf einem vP-externen Element (z.B. wieder auf einer Negation). Unter diesem Szenario müssten nun also folgende Strukturen denkbar sein: 88. Peter hat [vP die Gäste [vP Peter einander die Gäste gezeigt]] ja nichtFokus [vP Peter einander die Gäste gezeigt]. = oder: oder:
Peter hat die /GÄSTE einander ja NICHT gezeigt. Peter hat die Gäste ein/ANDer ja NICHT gezeigt. Peter hat die /GÄSTe ein/ANder ja NICHT gezeigt.
Diese Sätze erscheinen mir als viel weniger konstruiert – und ungrammatisch sind sie meines Erachtens (und nach der Einschätzung meiner Informanden) definitiv nicht. Es ist daher vorstellbar, dass die Bewegung auch größerer vP-Schalen syntaktisch prinzipiell möglich ist. Natürlich können die prosodische Eigenschaften alternativer Strukturen (sogar stark) bevorzugt sein (wenn etwa zu viele zu eng gestaffelte rise-Konturen als prosodisch inakzeptabel empfunden werden). Vielleicht kann auch nicht jeder Sprecher die o.a. Beispiele intuitiv nachempfinden. Ich halte es aber für unschädlich, die Kompetenzgrammatik an dieser Stelle nicht zu restringieren: Die Anforderungsprofile an die oben diskutierten Sätze sind letztlich extrem umfangreich. Sie verlangen vom Sprecher die Perzeption verschiedener rise-Konturen (um die Umstellung vieler Elemente ins linke Mittelfeld zu motivieren), mentale Verwaltung einer großen Anzahl von Kontextbezügen (um die Kontrasttopikalisierung zu lizensieren) und die Verarbeitung komplexer semantische Effekte (um die EoO-Konformität der Umstellung der Bindungs- bzw. Skopuselemente zu gewährleisten). Ich halte es daher für absolut plausibel, dass
104
Distributed Deletion als Auswahl von Kopien bewegter Elemente
performative Beschränkungen jederzeit in der Lage sind, das Gefühl der Konstruiertheit und Marginalität dieser Sätze zu erklären. Die kernsyntaktische Grammatikalität dieser Sätze muss davon aber nicht berührt sein – wie z.B. in den folgenden grammatischen Sätzen: 89. (??) Derjenige, der denjenigen, der den Pfahl, der auf der Straße, die nach Kulmbach führt, steht, umgeworfen hat, anzeigt, erhält eine Belohnung. (Bsp. Vater 1996: 109) Vgl. das grammatisch äquivalente: Derjenige erhält eine Belohnung, der denjenigen anzeigt, der den Pfahl umgeworfen hat, der an der Straße steht, die nach Kulmbach führt. 90. (??) I do not envy rockstars their fans worship the adulation. (Bsp. Wasow Ms.) Hart ungrammatisch kann ich die oben diskutierten konstruierten Beispiele zur Bewegung einer ‚großen vP‘ also nicht finden – oder zumindest nicht in gleichem Ausmaße wie Sätze, die im Deutschen oder Englischen klar ungrammatisch sind: 91. *Die Haus steht an das Straße. (Das Deutsche erscheint gegenüber Wortstellungsvarianten wesentlich toleranter als gegenüber Kongruenzfehlern dieser Art.) 92. *__ did not Peter go. (Das Englische gestattet bezüglich der Wortstellung oft wesentlich kategorischere Urteile als das Deutsche.) Ich nehme insgesamt daher an, dass die vP-TP-Bewegung selbst an den Grenzen ihrer eigenen theoretischen Definition und an den Grenzen der empirischen Überprüfbarkeit keine klar inkorrekten Vorhersagen macht. Inwieweit Einschränkungen performativer Art bestehen kann die vorliegende Arbeit nicht untersuchen. Kernsyntaktisch aber scheint auch eine im wesentlich unrestringierte Auswahl von vP-Schalen für die vP-TP-Bewegung nicht zu empirischen Problemen zu führen.
Restriktionen zur verteilten Tilgung der vP in SpecTP
105
7.2.1.2 Die vP-Bewegung erfasst auch informationsstrukturell markierte Elemente Auch fokussierte Elemente werden innerhalb der bewegten vP nach SpecTP angehoben. Kontrastive Topiks unterliegen ebenfalls syntaktisch keinen Beschränkungen, die sich auf ihre informationsstrukturellen Eigenschaften zurückführen ließen (vgl. hierzu z.B. Sudhoff et al Ms.:148, 154): Wie im nächsten Unterkapitel gezeigt wird, ergeben sich gerade aus dieser syntaktischen Unrestringiertheit die richtigen empirischen Vorhersagen: Die Wortstellungsoptionen von kontrastiven Topiks und (Informations-) Foki lassen sich problemlos repräsentieren. Syntaktisch soll nicht ausgeschlossen werden, dass sich Foki (innerhalb der vP mit-) bewegen lassen – auch wenn sie dann in der unteren vP-Kopie phonologisch ausbuchstabiert werden – etwa wie in: 93. [vP SubjektFoc Objekt] Part [Objekt [vP SubjektFoc Objekt]] Als Bsp.: weil dochPart ... [vP [fast jeden Artikel]Obj [vP [mindestens ein StuDENT]Subj gelesen]] hat] Für kontrasttopikalisierte Elemente wird sich unten zeigen, dass sie prosodischen Distributionsrestriktionen unterliegen, syntaktisch aber ebenfalls im Inneren der vP mitbewegt werden können (vgl. Unterkapitel 12.3.).
7.2.1.3 Nominativische Argumente werden nicht zwangsweise umgestellt Eine weitere Restriktion der Distributed Deletion kann hier versuchsweise angenommen werden: Wenn sich zeigen ließe, dass Nominative tatsächlich (z.B. mit Müller 2000) vor anderen Argumenten stehen, oder auch die Objektskasus eine gewisse Reihenfolge bevorzugen, so ließen sich diese Präferenzen unproblematisch in die Implementation der Distributed Deletion auf PF eingliedern. Im Folgenden wird diese Möglichkeit aber zunächst nicht angestrebt, da mir die empirischen Vorhersagen zu restriktiv erscheinen. Durch die Annahme der vPBewegung werden aber ohnehin Abfolgepräferenzen für Argumente ausgedrückt: – Zum einen können nur Objekte EoO-konform über Subjekte bewegt werden, Subjekte hingegen benötigen andere EoOs: Das externe Argument in SpecvP kann sich ja nicht EoO-konform bewegen, wenn der EoO in einer geänderten Reihenfolge darin bestehen soll, dass das externe Argument einen Skopus über andere Argumente erhalten soll. Dieser höchste Skopus vis-a-vis den anderen Argumenten liegt für Subjekte ja bereits in der Basisabfolge vor.
106
Distributed Deletion als Auswahl von Kopien bewegter Elemente
Daher sind EoO-inkonforme Subjektsbewegungen ausgeschlossen – sie hätten weder einen Effekt auf die Wortstellung (die Basisabfolge bleibt unverändert), noch hätten sie potentielle semantische Effekte (keine neuen Skopoi oder Bindungsoptionen würden erzeugt): 94. *[vP Subjekt [vP Subjekt v Objekt V]] Zum anderen aber können Subjekte – wie alle anderen Argumente auch – dann EoO-konform scramblen, wenn es darum geht, eine neue Position vis-a-vis einem Nicht-Argument einzunehmen, etwa einer Negation: 95. [Subjekt [Neg [vP Subjekt v Objekt V]]] weil wohl alle Männer nicht alle Männer kamen weil wohl nicht alle Männer kamen
Vgl. z.B.: vs.:
Für die Abfolge der Argumente im linken Mittelfeld gilt, dass man ebenfalls bereits dann eine Aussage über Stellungspräferenzen ausdrückt, wenn man die Kasus der bewegten Argumente nicht direkt berücksichtigt: Die vP wird ja durch die Bewegung nach SpecTP nicht verändert, sodass sich auch im linken Mittelfeld nur diejenige Reihenfolge durch die vP-Bewegung erzeugen lässt, die bereits in der tieferen Kopie der vP vorlag. Damit sind zwei grobe Regularitäten für die syntaktischen Vorgänge aufgestellt: Um bestimmte semantische Effekte zu erzielen, kann die Syntax EoO-konforme Bewegungen durchführen. Durch solch eine EoO-konforme Bewegung kann sich die Reihenfolge der Argumente untereinander verändern (z.B. Objekt > Subjekt statt Subjekt > Objekt) oder aber es ändert sich die Position des EoO-konform bewegten Elements bezüglich eines semantisch relevanten Nicht-Arguments (z.B. Subjekt > Negation statt Negation > Subjekt). Festzuhalten ist, dass Subjekte in dieser Darstellung weniger EoO-konforme Bewegungen aus der vP heraus durchführen können. Subjekte sind, mit anderen Worten, häufiger noch (ohne anderweitige Spellout-Anweisung) in der vP enthalten, die sich nach SpecTP bewegt. Die Tatsache, dass Subjekte mit relativ hoher Wahrscheinlichkeit im linken Mittelfeld auftreten, wird daher von der Analyse hier vorbereitet. Wie die informationsstrukturelle Diskussion unten ergeben wird, haben Subjekte zudem häufig auch anderweitigen Anlass, in der hohen vP-Kopie aufzutreten. Damit sind nun natürlich noch längst nicht alle offenen Fragen bezüglich der Wortstellung des Deutschen geklärt: Wie drückt die Analyse aus, dass z.B. Informationsfoki nicht bewegt werden dürfen? Wie wird die Stellung von Argumenten,
Restriktionen zur verteilten Tilgung der vP in SpecTP
107
die innerhalb der vP bewegt werden, determiniert? Die vorliegende Analyse geht davon aus, dass diese Fragen gerade nicht durch die Syntax beantwortet werden können: Wie oben hinlänglich demonstriert, sind viele Umstellungen im Mittelfeld des Deutschen nicht semantisch motiviert und weisen auch keine klaren ISMarkierungen aus. Damit aber dürfen diese Umstellungen nicht durch Bewegungen in der Syntax ausgedrückt werden. Vielmehr müssen die Umstellungen als Teil der vP-Bewegung nach TP interpretiert werden, die – da obligatorisch und EPP-getrieben – keine semantisch-pragmatischen Effekte aufzuweisen braucht. Mit anderen Worten gehe ich davon aus, dass es ausnahmslos Argumente innerhalb der hohen Kopie von vP sind, die sich ohne semantischen EoO im linken Mittelfeld finden lassen. Syntaktisch gesehen sind durch die vP-Bewegung zunächst alle Argumente also im linken Mittelfeld. Da sie dort nun aber nicht immer ausgesprochen werden, muss die PF in der Lage sein, die Ausspracheposition der in der vP enthaltenen Argumente selbstständig festlegen zu können. Im folgenden Unterkapitel soll gezeigt werden, dass die phonologische Komponente Entscheidungen dieser Art tatsächlich treffen kann.
7.2.2 PF-relevante Eigenschaften entscheiden über Abfolgen Die im letzten Unterkapitel genannte syntaktische Analyse entscheidet nicht in allen Fällen, wo Elemente, die innerhalb der vP bewegt werden, linear phonologisch realisiert werden. Dies geschieht mit voller Absicht, denn: – die Syntax soll keinen look-ahead zur PF betreiben, um phonologische Eigenschaften vorweg zu nehmen, – stattdessen soll die PF von der Syntax eine Struktur geliefert bekommen, die bezüglich der linearen Wortstellung noch Entscheidungsmöglichkeiten offen lässt. Damit können genuin phonologische Kriterien – wenngleich ausdrücklich nur in einem durch die Syntax vorgezeichneten Umfange – Einfluss auf die Wortstellung nehmen – und zwar auf eine Weise, die keine semantischen Effekte erwarten lässt, da die Bewegung der vP nach SpecTP ja nicht semantisch motiviert ist. Zudem wird in Teil III gezeigt, dass sich auch keine indirekten semantischen Effekte aus der PF-Linearisierung von Elementen ergeben, die z.B. in der hohen vPKopie (in SpecTP) ausbuchstabiert werden. Die vorgeschlagene Analyse liefert damit eine Architektur, innerhalb derer genuin phonologische Einflüsse auf die Wortstellung problemlos dargestellt werden können: Die Syntax garantiert, dass Bewegungen nur gemäß syntaktischer Restriktionen (Inseln, Satzgebundenheit,...) applizieren. Die PF muss
108
Distributed Deletion als Auswahl von Kopien bewegter Elemente
daher keine ‚zweite Syntax‘ werden, um diese Restriktionen zu implementieren – sie muss nur (lineare) Spellout-Entscheidungen treffen! Die PF-Komponente braucht dabei auch keine semantischen Konfigurationen zu bilden, da die satzsemantisch relevanten Konfigurationen bereits von der syntaktischen Komponente angelegt sind. Mit anderen Worten kann die PF pure Phonologie betreiben – ein meines Erachtens attraktives Ergebnis. Sollte die zukünftige Forschung weitere (mir nicht gegenwärtige) genuin phonologische Einflüsse auf die Wortstellung im Deutschen herausarbeiten, so könnten diese Einflüsse im Rahmen der hier vorgeschlagenen Architektur problemlos implementiert werden. Die im folgenden Unterkapitel vorgestellten PF-Entscheidungskriterien für die Berechnung der Distributed Deletion sind bereits heute wohletabliert – einen Anspruch auf Vollständigkeit erhebt die Darstellung aber nicht.
7.2.2.1 Fokusexponenten werden in tiefer vP ausbuchstabiert Eng fokussierte Elemente innerhalb der vP werden in der unteren Kopie der vP ausgespellt: Die tiefe vP wurde verschiedentlich als ‚Fokusdomäne‘ interpretiert (vgl. z.B. Molnarfi 2002). Die ‚Normalbetonung‘ platziert zudem die Hauptbetonung des Satzes (im unmarkierten Falle) auf dem tiefsten Argument im Satz (vgl. z.B: Höhle 1982, Cinque 1997). Lenerz‘ Maßgabe, dass (Informations-) Foki nicht zu umzustellen seien, soll demnach hier als Spellout-Regularität aufgefasst werden: Die PF versucht hier, das am tiefsten eingebettete [Fokus]-markierte Element nach Möglichkeit in seiner tiefsten Position auszusprechen. In diesem Sinne lässt sich die korrekte Intuition Molnarfis, dass prosodische Gegebenheiten eine Rolle für die Wortstellung spielen, ohne dubiose Merkmale und die Problematik des look-ahead nachzeichnen. Auch der Vorschlag Meinungers muss letztlich ein look-ahead zur PF zulassen: „Everything which is not new information must escape from [the VP]“ (2000: 91). Die hier vorgeschlagene Analyse ist architektonisch attraktiver: Sie gestattet allen Elementen, sich syntaktisch innerhalb der vP mitbewegen zu lassen. In aktuellen Theorien hat diese syntaktische Bewegung aber nicht in jedem Fall eine Auswirkung auf die lineare Abfolge von Elementen im Satz – insofern, als die PF eine Auswahl derjenigen Kopie eines bewegten Elements auswählt, welche die lineare Position dieses Elements bestimmt. Für den Fokusexponenten wird auf diese Weise der Effekt der vP-TP-Bewegung niemals overt sichtbar, da die hohe Aussprache eines [Fokus]-Elements die erste PF-Restriktion zur Distributed Deletion verletzen würde (a): 96. a) ??Ich habe das GELD dem Kassierer gegeben. b) *Ich habe das GELD gegeben dem Kassierer. (Bsp. Büring 2001: 97)
Restriktionen zur verteilten Tilgung der vP in SpecTP
109
Die Annahme, dass die Regelverletzung in (a) letztlich eine prosodische ist, erklärt auch, warum (a) zwar als stark abweichend bewertet wird, aber vielleicht dennoch als besser als (b) bewertet wird (vgl. Büring: ebd. für dieselbe Einschätzung): Kernsyntaktisch ist (a) möglich, (b) jedoch nicht. (a) verstößt jedoch gegen eine Spellout-Regel und kann daher ebenfalls nicht als akzeptabel angesehen werden. Um Missverständnissen vorzubeugen, muss an dieser Stelle auf zweierlei hingewiesen werden: Zum einen können sich [Fokus]-markierte Phrasen bewegen, und zwar genau dann wenn: – sie dies um eines EoOs willen tun, oder – wenn sie von einem formalen Merkmal attrahiert werden. Wie in Kapitel 10.5 gezeigt wird, können z.B. Argumentphrasen sich sehr wohl aus der vP heraus bewegen, wenn dies z.B. mit einer neuen Skopuslesart verbunden ist. Es ist also mit dem vorangegangenen auch kein look-ahead dergestalt verbunden, dass die Syntax die Bewegung eines [Fokus]-Elementes in vorauseilendem Gehorsam vermeidet. Zum zweiten kann man präzisieren, auf welchen Aspekt der Fokussierung die PFKomponente abhebt: Architektonisch sonderbar wäre es etwa, wenn die PF-Komponente die Diskursneuheit (als einer möglichen Quelle der F-Markierung, vgl. Büring 2006, Schwarzschild 1999) bewertet und zur Grundlage ihrer Spellout-Entscheidung erhebt: Die PF sollte sich idealerweise mit phonologischen Eigenschaften der erzeugten Struktur befassen. In einem weniger schönen Szenario ließe sich die PF u.U. zwar auch durch formale Merkmale steuern, die sowohl für PF als auch LF gleichermaßen relevant sind: „The focus feature [...] is interpreted as most [sic] prominent accent in the phonological component, and as new, non-given information in the semantic/pragmatic one“ (Chocano 2007: 109). Mir scheint aber, dass die attraktivere Variante tatsächlich die empirische korrekte ist: Die Lenerz‘sche Restriktion, der Fokus möge nicht unnötig ins linke Mittelfeld bewegt werden, stellt meines Erachtens eine vorrangig phonologisch definierbare Restriktion dar: Am Beispiel des folgenden Satzes lässt sich etwa zeigen, dass auch diskursneue Elemente (die mit F indiziert werden) scramblen können – und zwar dann, wenn sie unbetont bleiben. Die Frage im folgenden Beispiel bewirkt so zwar, dass sowohl das indirekte, wie auch das direkte Objekt diskursneuF sind, das indirekte Objekt kann dennoch scramblen, wenn es nicht die Hauptbetonung des Satzes trägt: 97. F: Peter macht doch jedes Jahr genau einer Person, die er nicht kennt, ein überraschendes Geschenk zu Weihnachten. Wie war das denn dieses Jahr: Was hat Peter wem geschenkt?
110
Distributed Deletion als Auswahl von Kopien bewegter Elemente
A: Peter hat wohlPart [dem Bürgermeister] [den MOND]F gekauft. A‘: Peter hat [dem Bürgermeister] wohlPart [den MOND]F gekauft. Mir scheint, dass A‘ als Antwort im gegebenen Kontext u.U. schlimmstenfalls minimal dispräferiert gegenüber A ist. Eine kontextuell inkohärente Antwort (oder gar ungrammatisch) ist A‘ aber nicht. Mit dem (zugegebenermaßen abstrusen) Kontext soll darüber hinaus hier ausgeschlossen sein, dass dem Bürgermeister als Kontrasttopik fungiert: eine noch offene, relevante Alternative zum indirekten Objekt besteht im vorliegenden Kontext nach meiner Ansicht jedenfalls nicht mehr. Durch den Vorkontext wird vielmehr erreicht, dass eine einzige Antwort erwartet wird (Peter schenkt dem A ein X), keine Liste von Paaren (Dem A schenkt Peter ein X, dem B schenkt Peter ein Y, dem C...). Durch die Position des indirekten Objekts relativ zur Modalpartikel wohl wird aber deutlich, dass auch diskursneue Phrasen nicht zwangsläufig in ihrer Basisposition verbleiben müssen. Es resultiert auch keinerlei Ungrammatikalität (im kernsyntaktischen Sinne) oder Uninterpretierbarkeit (im semantischen Sinne), wenn ein diskursneues Element bewegt wird. Ein striktes Verbot, diskursneue Elemente umzustellen, kann ich daher für das Deutsche nicht erkennen. Wesentlich stärker abweichend erscheint mir aber das gleiche Beispiel, wenn man diejenige Phrase über die Modalpartikel hinwegbewegt, die prosodisch den Hauptakzent des Satzes tragen soll (selbst wenn sie als familiar gelten sollte): 98. (Kontext wie oben) F: Was hat Peter denn dieses Jahr wem gekauft? A: # Dieses Jahr hat Peter [den MOND]F wohlPart [dem Bürgermeister] gekauft. A‘: # Dieses Jahr hat Peter [dem Bürgermeister] [den MOND]F wohlPart gekauft. Unabhängig davon, ob das indirekte Objekt in-situ bleibt (wie in A) oder ebenfalls bewegt wird (wie in A‘), scheinen mir diese Antworten beide kontextuell weniger akzeptabel zu sein als etwa die Antworten A und A‘ in Beispiel 100. Auch ohne eng fokussierende Kontext erscheint es mir möglich, diskursneue (d.h. f-markierte) Konstituenten zu scramblen: Obwohl im folgenden Beispiel die gesamte VP weiten Fokus hat, kann das indirekte Objekt ins linke Mittelfeld
Restriktionen zur verteilten Tilgung der vP in SpecTP
111
gelangen, so lang mit dem direkten Objekt ein Fokusexponent im rechten Mittelfeld bereitsteht: 99. F: Was hat Peter gestern gemacht? A: Er hat gestern wohl [der örtlichen Schule] sein AUto geschenkt. A‘: Er hat [der örtlichen Schule] gestern wohl sein AUto geschenkt. Obwohl der örtlichen Schule nicht vorerwähnt ist, kann es im linken Mittelfeld auftreten – eine Präferenz für A oder A‘ kann ich hier kaum erkennen. Natürlich muss die Definitheit der DP der örtlichen Schule vom Hörer so interpretiert werden, dass die Existenz dieser Schule zu akkommodieren ist. Dennoch gilt, dass der örtlichen Schule im technischen Sinne als f-markiert gelten muss, da weder diese DP, noch ein synonymer oder hyponymer Ausdruck vorerwähnt ist. Eine Schule kann vermutlich wohl auch nicht als notwendiger Bestandteil eines frame verstanden, in dem Autos verschenkt werden o.ä.. Wichtig erscheint in diesem Szenario vielmehr einzig und allein, dass die ins linke Mittelfeld umgestellte Phrase der örtlichen Schule nicht die Hauptbetonung des Satzes trägt – aber nicht, ob sie vorerwähnt ist oder nicht. Diese besondere Bedeutung der Intonation für die kontextuelle Akzeptabilität eines Satzes findet sich auch in Kontexten, in denen der Kontext keine eng fokussierte Phrase vorgibt. Im folgenden Beispiel sind die DP die Mädchen und die PP an seiner Schule nicht vorerwähnt, können nach meinem Empfinden aber dennoch über die Modalpartikel wohl hinwegbewegt werden, ohne dass die Antwort inkohärent wird (vgl. A und A‘). Wird die betonte Phrase mit seinem Molch hingegen umgestellt, resultiert eine meines Erachtens wesentlich stärkere Abweichung (A‘‘ - A‘‘‘‘): 100. F: A:
Was ist passiert? Fritz hat wohlPart [die Mädchen]F [an seiner Schule]F [mit seinem MOLCH]F erschreckt. A‘: Fritz hat [die Mädchen]F [an seiner Schule]F wohlPart [mit seinem MOLCH]F erschreckt.
A‘‘: #Fritz hat [mit seinem MOLCH]F [die Mädchen]F [an seiner Schule]F wohlPart erschreckt. A‘‘‘: #Fritz hat [die Mädchen]F [mit seinem MOLCH]F [an seiner Schule]F wohlPart erschreckt. A‘‘‘‘: #Fritz hat [die Mädchen]F [an seiner Schule]F [mit seinem MOLCH]F wohlPart erschreckt.
112
Distributed Deletion als Auswahl von Kopien bewegter Elemente
Auch für A‘‘‘‘ gilt die phonologische Restriktion des unbeweglichen Fokusexponenten, obwohl der betonten Phrase mit einem Molch hier lediglich unbetonte Köpfe, aber keine weitere betonbare Phrase mehr folgen. Dies gilt sogar für den noch extremeren Fall, dass ausschließlich eine Modalpartikel auf den Fokusexponenten folgt – womit die minimale Konfiguration vorliegt, in der das Scrambling des Fokusexponenten überhaupt nachweisbar ist: 101. F: Macht Fritzchen viel Mist? A: Ja leider: Er erschreckt [an seiner Schule] [die Schüler] wohlPart [mit seinen KNALLfröschen]. A‘: #Ja leider: Er erschreckt [an seiner Schule] [die Schüler] [mit seinen KNALLfröschen] wohlPart. Damit kann gelten, dass es die Position des Fokusexponenten ist (und nicht jedes einzelnen diskursneuen Elementes), die durch die Lenerz‘sche Generalisierung Don‘t scramble focus! restringiert wird: Diskursneu sind in den o.a. Beispielen immer mehrere Phrasen – im rechten Mittelfeld verbleiben aber muss nur diejenige Phrase, die die Hauptbetonung des Satzes trägt. Die Nicht-Gegebenheit eines Elementes reicht also nicht aus, um die kategorische Unbeweglichkeit dieses Elementes vorherzusagen. Wenn sich aber aus der F-Markierung eines Elementes auch ergibt, dass dieses Element Fokusexponent ist, greift die Lenerz‘sche Restriktion. Diese Betonung wird nun aber erst auf PF berechnet. Sie sollte daher auch erst auf PF Einfluss auf die Stellung des Fokusexponenten nehmen. Das ist natürlich ein durchaus willkommenes Ergebnis für die hier vorgeschlagene Analyse: Auch hier zeigt sich, dass PF-Eigenschaften für die Wortstellung des Deutschen einschlägig sind. Alternative Analysen dürften für die Beschreibung der genannten Beispiele ein weiteres Mal mit dem Problem des look-ahead zu rechnen haben, wie z.B. in der Diskussion der [Antifokus]-Analyse gezeigt wurde.
7.2.2.2 Kontrastive Topiks können in hoher vP-Kopie auftreten Kontrastive Topiks können ebenfalls innerhalb der vP bewegt werden. Für die Positionierung von kontrastiven Topiks bestehen kaum empirische Restriktionen: Kontrastive Topiks treten sowohl im Vorfeld (a) wie im linken Mittelfeld (b) auf, und selbst im rechten Mittelfeld (c) lassen sich Vorkommen von kontrastiven Topiks konstruieren:
Restriktionen zur verteilten Tilgung der vP in SpecTP
102. a)
113
/ICH weiß ja diesmal NICHT, wer der Mörder ist. b) Diesmal weiß /ICH ja NICHT, wer der Mörder ist. c) Letztes Mal habe ich ja auch nicht /DEN Mann beschuldigt, der UNschuldig war.
Die Spellout-Position von kontrastiven Topiks erscheint tatsächlich wiederum eher phonologisch als syntaktisch oder semantisch gesteuert: Hutkonturen bedürfen einer gewissen Länge, um als solche phonetisch gekennzeichnet zu sein (Wunderlich 1988, Féry 1993). Laut Jacobs (1997) gilt für I-Topiks lediglich: Sie „dürfen vor allem nicht zu weit rechts ansetzen“. Der Vorschlag in der vorliegenden Analyse lautet also, dass die Berechnung der Distributed Deletion von vP diese Maßgabe der ‚Länge‘ berücksichtigt: Elemente innerhalb der vP, die Kontrasttopiks sind, können in genau den Positionen ausbuchstabiert werden, in denen sie ‚weit genug‘ entfernt sind vom Fokusexponenten. Dies wird im folgenden Beispiel gezeigt: Problematisch kurz wird die Brücke nämlich insbesondere dann, wenn die Hutkontur auf adjazente Silben fällt, und so (wie in Bsp. a) als enger Fokus fehlinterpretiert werden könnte (vgl. hierzu auch Mehlhorn 2001: 32, 38). Die PF-Komponente kann in diesen Fällen (etwas marginal), die Länge der Brücke zwar durch eingefügte prosodische Unterbrechungen (dargestellt durch ‖) herbeiführen (wie in b), besser erscheint jedoch in diesem Fall eine Implementation, die eine Kopie des kontrastiven Topiks ausbuchstabiert, die ohnehin ausreichend weit entfernt von der Hauptbetonung ist (wie in c): 103. Kontext: Stefanie ist wütend: Sie hat alle ihre Freunde eingeladen, aber sie befürchtet, dass niemand zu ihrer Party kommt. Deshalb verwünscht sie alle ihre Freunde, Jan, Peter, Fritz und Hans, bis ins siebte Glied. Ihre Mutter aber weiß: Stefanie täuscht sich... a) # weil doch /JAN KOMMT\. Brücke zu kurz, wirkt wie enger Fokus b) (?) weil doch /JAN ‖ KOMMT\. Möglich: Brücke durch Unterbrechung gelängt. c) weil /JAN doch KOMMT\ Optimal: PF buchstabiert hohe Kopie von Jan aus! Bezüglich der Kennzeichnung ‚‖‘ scheint mir Peters im Duden (2005: 127) eine ähnliche Unterscheidung zwischen der Realisation einer Hutkontur innerhalb einer Intonationsphrase (Ma/RIA und JOsef, notiert als LɩL*H➝!H*LLɩ) und der Aussprache in zwei Intonationsphrasen zu machen (für mich: Ma/RIA ‖ und JOsef, im Duden notiert als LɩL*HHɩ Hɩ !H*LLɩ).
114
Distributed Deletion als Auswahl von Kopien bewegter Elemente
Dass (a) tatsächlich nur phonologisch problematisch ist, nicht aber syntaktisch oder semantisch, lässt sich anhand der Tatsache demonstrieren, dass es tatsächlich die Anzahl der Silben des Subjektes ist, die hier zu Problemen führt. (a) ist vor allen Dingen deshalb suboptimal, weil Jan eine einsilbige DP ist. Auf einer Silbe lassen sich Anstieg und Plateauphase der Hutkontur natürlich kaum erreichen – aber ohne Anstieg und Plateau gelingt die Hutkontur nicht: „In Äußerungen mit I-Topiks [gibt es] keine weiteren Gipfelakzente zwischen den beiden Exponenten der Hutkontur [...]: Die f0 dazwischen bleibt auf einem ziemlich hohen Niveau“ (Mehlhorn 2001: 42). Damit erscheint eine intonatorische Plateauphase, d.h. ein Abschnitt ohne allzu große Auslenkungen der f0-Frequenz zwischen dem einleitenden rise und dem abschließenden fall, eine wichtige Eigenschaft der Hutkontur zu sein – sie wird auch bereits bei Wunderlich als Kennzeichen (seines Brückenakzents) genannt (vgl. 1988: 21). Eine solche Plateauphase der Intonation lässt sich auf einem einsilbigen Wort kaum salient ausführen, sie scheint perzeptiv aber wichtig zu sein: „Für die Wahrnehmung der Hutkontur ist neben der Tonhöhenbewegung auf den akzentuierten Silben wahrscheinlich auch die Kontur zwischen den beiden Exponenten der [Hutkontur] relevant. Hier passiert nämlich – im Gegensatz zu neutralen Sätzen – nicht viel“ (Mehlhorn 2001: 53). Damit wird vorausgesagt, dass eine phonologisch veränderte (lies: eine längere) DP auch insitu ausbuchstabiert werden können sollte. Diese Vorhersage trifft meines Erachtens zu, denn nach meiner Intuition verbessert sich der hier diskutierte Satz auch bei ‚tiefem‘ Spellout des Subjektes signifikant, wenn dieses Subjekt nur über eine ausreichende Anzahl Silben verfügt, um eine intonatorische Brücke mitsamt einer Plateauphase tragen zu können: 104. weil doch
/[DP JAN mit seinen Kumpeln] KOMMT\
Durch die Annahme, dass mit dem ‚hohen‘ Spellout eines kontrastiven Topiks eine phonologische Option genutzt wird, trägt zudem entscheidend dazu bei zu erklären, warum viele an und für sich marginal erscheinende Umstellungen im linken Mittelfeld wesentlich verbessert werden können, wenn sich der für kontrastive Topiks charakteristische Intonationsanstieg auf dem bewegten Element befindet. So kann Meinunger z.B. nicht erklären, warum das indefinite Objekt in (a) zwar nicht bewegt werden kann, wenn es unbetont bleibt, jedoch sehr wohl im linken Mittelfeld auftreten kann, wenn es (wie in b) kontrastiv betont wird (vgl. Meinunger 2000: 70): 105. a) *weil Brigitta Artikel über Scrambling immer schreibt b) weil Brigitta Artikel über /SCRAMbling IMMer schreibt
Restriktionen zur verteilten Tilgung der vP in SpecTP
115
Im Rahmen der hier vorgeschlagenen Analyse ist die Erklärung einfach: Die Phrase Artikel über Scrambling nimmt als DP hier keinen Skopus über das Subjekt Brigitta, und es werden auch keine skopusrelevanten Nicht-Argumente (etwa eine Negation) überquert. Bindungseffekte können durch die Bewegung ebenfalls nicht erreicht werden. Die Objekts-DP kann daher nicht EoO-konform bewegt werden: 106. *[Artikel über Scrambling] immer [[Brigitta] [Artikel über Scrambling] schreibt] Die indefinite Objekts-DP kann aber dann im linken Mittelfeld auftreten, wenn sich nur dadurch die intonatorische Hutkontur erreichen lässt, in dem Fall, dass Artikel über Scrambling kontrasttopikalisiert wird: 107. [vP Brigitta Artikel über /SCRAMbling schreibt] ... IMMER schreibt Damit ist die Analyse empirisch interessant, weil sie neue (Arten von) Möglichkeiten aufweist, wie Phrasen ins linke Mittelfeld gelangen können: – Kontrastiven Topiks etwa steht nicht nur der EoO-konforme Weg offen (Bewegung in die edge von vP): Die Spellout-Lizenz, denen sie aufgrund ihrer phonologischen (!) Eigenschaften unterliegen, stellt für kontrastive Topiks im Rahmen der Distributed Deletion der vP in SpecTP eine zweite Möglichkeit dar, links von Modalpartikeln, Negationselementen etc. zu erscheinen. – Die Analyse durchbricht auf diese Weise insbesondere auch die häufig vorzufindende Restriktion, Scrambling möge nur unter ‚normalen‘ Intonationsverhältnissen oder unter Verumfokussierung untersucht werden: Wenn die Syntax mehrere Spellout-Optionen für bewegte Elemente vorsieht, so müssen auch und gerade intonatorische Varianten für die Untersuchung der schlussendlich ausgewählten Spellout-Position berücksichtigt werden. – Damit könnten prosodisch präferierte Wortstellungsmuster (vgl. Büring 2001, 2006, 2007, Féry 1993, Wunderlich 1988 u.v.a.) auch durch eine Auswahlfunktion der PF-Komponente gegenüber ihren (syntaktisch gleichwertigen) Konkurrenten bevorzugt werden. – Viele weitere phonologische Kriterien (Betonungsverhältnisse in Phrasen und darüber hinaus, lautlich-stilistische Präferenzen, Echokonstruktionen etc.) können in der weiteren Forschung darauf hin untersucht werden, ob sie (insofern sie ja PF-relevante Eigenschaften sind) Einfluss auf die SpelloutLizenzen der Distributed Deletion nehmen.
116
Distributed Deletion als Auswahl von Kopien bewegter Elemente
Auch für das Merkmal [kontrastives Topik] muss nun aber klar gesagt werden, dass die Kernsyntax keine Verwendung für dieses Merkmal hat: Kontrastive Topiks stehen, wie gezeigt, nicht in festen Positionen (etwa: SpecKontrastTopikP). Die Bewegungen, die die kontrastiven Topiks gegebenenfalls erfassen, gehören (um es, wie schon oben, mit Jacobs zu sagen) zu den „ansonsten geltenden grammatischen [Gesetzen]“ (1996: 7): – Kontrastive Topiks werden innerhalb der vP wie jedes andere Argument (mit-) bewegt. Eine Sonderbehandlung aufgrund ihrer intonatorischen Markierung erfahren sie erst auf PF, nicht aber in der Kernsyntax. – Keine andere formale Operation (internal merge, Agree) adressiert das Merkmal [kontrastives Topik] – oder zumindest liegt keinerlei Evidenz dafür vor, dass dies geschieht. – Kontrastive Topiks sind auch in keiner Weise von anderweitigen syntaktischen Bewegungen ausgenommen – sie können so auch EoO-konform ins linke Mittelfeld gelangen, um dort einen neuen (Oberflächen-) Skopus einzunehmen. Nötig hierfür ist nur, dass das kontrastive Topik im Diskurs als eine Alternative unter mehreren vorbereitet wird: 108. Ein /GUTer Arzt würde sicherlich ALLe Patienten heilen, die zu ihm kommen. Und ein /MITTelmäßiger Arzt würde wohl immerhin noch MANCHen Patienten helfen. Wenn der Arzt aber eher vom Typ Geschäftsmann ist und will, dass sie immer wieder zu ihm kommen müssen, ... dann könnte er auch /ALLen Patienten NICHT helfen. (∀¬) Damit sind weder [Fokus] noch [kontrastives Topik] in erkennbarer Weise für die Syntax relevant. Welche Merkmale und Eigenschaften könnten noch auf der PFSchnittstelle figurieren?
7.2.2.3 [Definit] als Lizenz zum hohen Spellout Eine weitere Eigenschaft bewegter DPen, die offenbar Einflus auf diesen Vorgang nimmt ist die Definitheit: Definite DPen gehen oft nahezu unrestringiert anderen Phrasen voran (solange die Fokuszuweisung dies nicht verhindert). Ein semantischer Effekt dieser Umstellung ist oft nicht nachweisbar, sodass eine EoO-konforme Umstellung, wie gesehen, oft nicht plausibel ist. Eine interessante Überle-
Restriktionen zur verteilten Tilgung der vP in SpecTP
117
gung könnte nun dahin gehen, dass gerade der fehlende EoO, auch und gerade aus funktionaler Hinsicht, eine Spellout-Lizenz für definite DPen möglich werden lässt: Dadurch, dass mit der Umstellung definiter DPen selten ein semantischer Effekt verbunden ist, kann (anders als etwa bei den indefiniten DPen) durch eine nicht syntakto-semantisch gesteuerte Umstellung auch keine Ambiguität o.ä. (etwa zwischen generischen, existentiellen oder spezifischen Lesarten) erzeugt werden! Wenn sich der semantische Gehalt einer Struktur nicht ändert, wenn definite DPen in manchen Fällen in der tiefen, in anderen Fällen in der hohen vP-Kopie ausbuchstabiert werden, so wäre eine Spellout-Lizenz für definite DPen im Endeffekt vergleichbar dem klassischen Fall einer ‚stilistischen‘ Umstellung (wie schon bei Ross 1967): Auch solche Umstellungen sind ja aus Sicht der Kompetenzgrammatik im Prinzip möglich. Damit können definite DPen prinzipiell sowohl im linken wie im Mittelfeld aufreten – der PF-Spellout repliziert hier das (schon oben genannte) Diktum Molnarfis: „definites are free to scramble“ (2002: 1112). Das präferierte Auftreten der ‚hohen‘ Spellout-Position einer definiten DP wird dann vom Sprecher unter bestimmten Umständen gewählt, die (zumindest nach bisherigem Kenntnisstand) nicht in den Zuständigkeitsbereich der Syntax – und unter Umständen nicht einmal in den Zuständigkeitsbereich der Kompetenzgrammatik fallen. Wie Kapitel 10.4 zeigt, ist diese Option (indirekt) verantwortlich für die Tendenz, vermeintliche ‚Topiks‘ ins linke Mittelfeld umzustellen. Umgekehrt ist die Umstellung indefiniter DPen in vielen Arbeiten stärker restringiert worden: Schon Lenerz (1977) stellt die Generalisierung auf, dass Indefinita nicht per Scrambling umzustellen seien. Diese Generalisierung wird in semantisch spezifizierter Form (für die existentiellen Indefinita) auch von Diesing bestätigt (1992). Molnarfi gesteht indefiniten DPen keine AntifokusEigenschaft zu (vgl. 2002, 2004), sodass sie im Normalfall nicht vor der Fokusexponenz ins linke Mittelfeld ‚fliehen‘. Topikanalysen weisen typischerweise darauf hin, dass mit indefiniten Ausdrücken diskursneue Referenten eingeführt werden, die also nicht familiar sind und eher dem comment als dem Topik zuzuordnen sind (vgl. Meinunger 2000, Frey 2004). Damit ist die Tendenz, definite Ausdrücke per Scrambling umzustellen, indefinite hingegen nicht, keinesfalls eine neue empirische Erkenntnis der hier vorgeschlagenen Analyse – diese Unterscheidung folgt einer langstehenden empirischen Generalisierung zur deutschen Wortstellung. Formal gesehen ist der Vorschlag für das Deutsche ebenfalls keineswegs exotisch: Müller (2000: 241f.) etwa trifft eine ähnliche Annahme. Auch Fanselow (Ms.) geht davon aus, dass für das Deutsche Oberflächenrestriktionen existieren könnten, die das Scrambling von definiten über indefinite Phrasen begünstigen. Solche Oberflächenpräferenzen sind z.B. auch für das Niederländische nachgewiesen worden (vgl. van Bergen & de Swart 2010). Aus theoretischer Sicht haben
118
Distributed Deletion als Auswahl von Kopien bewegter Elemente
Fox & Pesetsky ebenfalls für oberflächenorientierte Abfolgerestriktionen argumentiert (2005). Der Präferenz ‚definit vor indefinit‘ ähnelt – wenngleich sehr abstrakt – auch anderen morpho-phonologischen Phänomenen des Deutschen: So folgt die Verteilung der attributivischen Endungen in der DP des Deutschen einer linearen Abfolge. Sprecher akzeptieren aber oft unterschiedlos verschiedene Varianten, solange sie diese gewisse lineare Abfolgerestriktion einhalten (nämlich *-n > -m, Amina Hallab, p.c.): 109. a) b) c) d)
mit kühlem, frischem, dunklem Bier mit kühlem, frischem, dunklen Bier mit kühlem, frischen, dunklen Bier *mit kühlem, frischen, dunklem Bier
(-m > -m > -m) (-m > -m > -n) (-m > -n > -n) (*-m > -n > -m)
Das Phänomen des Kasusschwund (Gallmann 1996) zeigt auf, dass auch diachron die Tendenz besteht, saliente nominale Markierungen bevorzugt ‚links vor rechts‘ zu realisieren: Die Kasusflexion tritt, in einer steigenden Anzahl von Kasus und Registern, nur noch am (links-stehenden) Artikel auf und verschwindet auf dem (rechts-stehenden) Kopf der Nominalphrase. Auch bestimmte Eigenschaften von Kopfbewegungen sind zumindest abstrakt ähnlich: So bewegt sich im Falle der V2-Bewegung stets das finite verbale Element – nicht aber infinite Prädikatsbestandteile. Es scheint also eine generelle Tendenz im Deutschen zu geben, ‚stark markierte‘ Elemente ‚nach links‘ umzustellen, starke Markierungen also ‚links vor rechts‘ auszubuchstabieren und im Gegenzug die ‚schwachen‘ Markierungen ‚rechts vor links‘ zu plazieren (und dort oft langsam erodieren zu lassen). Natürlich sind diese Vergleiche bisher eher metaphorischer Natur. Ich glaube dennoch, dass sich in diesem Bereich empirisch interessante Phänomene finden lassen (bzw. bereits gefunden wurden, vgl. z.B. die morphologischen Implikationen der Präferenz Early Immediate Constituents bei Hawkins 1990). Für die Spellout-Lizenz im Rahmen der Distributed Deletion muss jedoch gelten, dass sie technisch problemlos implementierbar ist und zumindest keine allzu unglaubwürdige Stipulation darstellt. Wie Kapitel 10.4.2.2. zeigt, entpricht diese Abfolge vielmehr (indirekt) auch performativen Anforderungen und ist daher als Grammatikalisierung dieser Prinzipien eine glaubhafte grammatische Option. Lässt sich dies auch für die syntaktischen und semantischen Aspekte der Theorie sagen? Das folgende Kapitel widmet sich Fragen der technischen Implementation der Analyse.
8 Mögliche technische Probleme der Analyse In diesem Kapitel sollen einige technische Probleme diskutiert werden, die sich der Analyse stellen könnten. Wie sich zeigt, sind die Probleme nicht schwerwiegend – und ihre Diskussion führt zudem zu einigen interessanten Beobachtungen zu den Eigenschaften von Scrambling im Deutschen.
8.1 Sind die Voraussetzungen für Distributed Deletion stets gegeben? Nach der Lektüre des letzten Abschnittes mag sich dem aufmerksamen Leser die Frage stellen, ob die Konfiguration für die Distributed Deletion der vP überhaupt in jedem Falle vorliegt: Was nämlich, wenn kein Fokus auf vP-internem Material liegt? Wie sich zeigt bricht die Analyse auch in diesem Szenario nicht zusammen: die Bewegung der vP kann, getrieben durch das EPP von T, unbehindert stattfinden und es befinden sich, wie gehabt, demzufolge zwei Kopien der vP in der syntaktischen Struktur. Wenn nun aber kein Merkmalswiderspruch für die Argumente innerhalb der vP vorliegt, so können die Argumente auch tatsächlich en bloc in SpecTP realisiert werden – es resultiert Meinungers ‚Normalabfolge im linken Mittelfeld‘: 110. [vP Subj > iO > dO] Part [vP Subj > iO > dO] Diese Struktur erscheint in mehrfacher Hinsicht als ‚unmarkiert‘: Zum einen wird die Bewegung der vP nach SpecTP nicht an ein semanto-pragmatisches Merkmal oder einen semantischen Effekt gekoppelt. Stattdessen wird die Bewegung als Effekt der formalen Bewegung nach SpecTP als asemantisch gekennzeichnet – mit anderen Worten: Eine wie auch immer geartete semantische Markierung findet hier nicht statt. Darüber hinaus kann gelten, dass diese Analyse erklärt, warum die unmarkierte Abfolge im linken Mittelfeld dieselbe ist wie die unmarkierte Abfolge im rechten Mittelfeld – denn dies könnte ja durchaus auch anders sein. Sieht man die unmarkierte Abfolge im linken Mittelfeld als Ergebnis der Bewegung der vP an, so wird diese Parallelität nicht als Zufall dargestellt: Die vP wird durch die Bewegung nicht verändert (es gilt NoTampering), die Basisabfolge der Argumente bleibt daher für die unmarkierte Abfolge im linken Mittelfeld erhalten. Dieser Punkt ist insbesondere deshalb wichtig, weil die Basisabfolge nicht für alle Elemente im Satz die gleiche ist: Pronomina etwa reihen sich in einer abweichenden Basisabfolge (Subj > dO > iO) im rechten Mittelfeld auf:
120
Mögliche technische Probleme der Analyse
111. a) Heute gibt ja [vP ERSubj esdO ihmiO ...] b) ?Heute gibt ja [vP ERSubj ihmiO esdO ...] Und tatsächlich: Werden Pronomina nicht fokussiert (was häufig der Fall ist), erfolgt die Wackernagelbewegung: 112. Heute gibt [TP [vP er >> es >> ihm ...] jaPart [vP er >> es >> ihm...]] Ansätze, die davon ausgehen, dass sich in diesen zwei Fällen einzelne Argumente (DPen oder Pronomina) ins linke Mittelfeld bewegen, werden Schwierigkeiten haben, diesen Zusammenhang zu erklären: Meinunger etwa schlägt zwar vor, dass sich im linken Mittelfeld eine Abfolge von Agr-Projektionen befinden, die Argumente mit dem ‚passenden‘ Kasus in ihre Spezifikatorpositionen bewegen. Dies verschiebt aber nur die Frage: Warum nämlich reihen sich die Agr-Projektion in dieser Reihenfolge auf? Warum sind darüber hinaus aber auch im linken Mittelfeld (wenngleich nur in den markierteren Fällen) Änderungen der Abfolgen von Argumenten möglich? Ich teile hier die Skepsis von Bayer & Kornfilt: „The AGR-projections enter the stage as some ‚deus ex machina‘ in order to provide for a derivation of the surface order. A natural question would be why in German AGR-S and AGR-O should change their places“ (1994: 29). Diese Frage ist nota bene auch und gerade für die unmarkierten Fälle zu stellen: Wenn Pronomina in einer anderen unmarkierten Abfolge im linken Mittelfeld auftreten als volle DP-Argumente, wie können sich die Agr-Projektionen dann immer in just den Reihenfolgen aufreihen, die – wie zufällig – den Abfolgen der Argumente in ihrer jeweiligen Basisabfolge entsprechen? Die nicht-verteilte Aussprache von vP ist also kein Problem, sie erklärt im Gegenteil die Parallelität der Argumentabfolgen im linken und rechten Mittelfeld. Die unabhängig definierte Eigenschaft syntaktischer Bewegungen, die bewegten Phrasen (hier: die bewegte vP) nicht zu verändern (no tampering), ersetzt daher in der vorgeschlagenen Analyse für das Deutsche die stipulierten Anforderungen, die in der Literatur zur Parallelität von Scrambling zu finden sind (vgl. den constraint PAR-MOVE in Müller 1999, 2001, sowie ähnliche Ideen in Müller 2000). Diese Vorschläge waren aus mehreren Gründen immer etwas mysteriös: Zum einen war nicht klar, warum syntaktische (also: strukturell definierte) Bewegungen überhaupt solchen (linear zu definierenden) Restriktionen unterliegen sollten. Zum anderen waren diese Restriktionen grundsätzlich verletzbar (vgl. in diesem Sinne z.B. Haider 2006: 254). Dass das Deutsche überkreuzenden Bewegungsmustern generell nicht abgeneigt ist zeigt sich im Übrigen nicht nur in der Analyse von Scrambling-Vorgängen: In der Analyse von Superioritätseffekten im Deutschen (vgl. Unterkapitel 8.7.3.1.) haben verschiedene Autoren stets darauf gesetzt, dass im Deutschen in anderen syntak-
Verletzt die Analyse Freezing-Generalisierungen?
121
tischen Konstellationen auch überkreuzende (und auch die lineare Reihenfolge ändernde) Bewegungen zulässig sind – warum also nicht auch im Mittelfeld? Ausblickend kann hier noch darauf verwiesen werden, dass problemlos auch weitere Einflüsse auf die Wortstellung, die phonologisch definierbar sind, zur Menge der Regularitäten der Distributed Deletion hinzugefügt werden können: Mit der hier vorgeschlagenen Analyse steht eine Architektur bereit, die auch anderen phonologisch nachweisbaren Restriktionen und Präferenzen einen Ort zuweisen können, an dem sie Wirkung zeigen können: Die PF kann, auf der Basis der Distributed Deletion, aus der Menge der Strukturen, die syntaktisch möglich sind, verschiedene lineare Abfolgen generieren. Sollten sich also prosodische Einflüsse auf die Wortstellung für das Deutsche konsistent nachweisen lassen, so ließen sie sich in die vorliegende Architektur problemlos eingliedern – nicht jedoch in die oben diskutierten syntaktische Analysen, die zu diesem Zwecke look-ahead zur PF betreiben müssten. Der modulare Aufbau der Grammatik kann in der vorliegenden Analyse dazu genutzt werden, jedes Modul nur seine je eigenen Repräsentationen bearbeiten zu lassen. Welche weiteren syntaktischen Restriktionen sind aber für die syntaktische Derivation möglicherweise einschlägig?
8.2 Verletzt die Analyse Freezing-Generalisierungen? Aus einer bewegten vP heraus können Elemente einer bekannten Restriktion nach dann nicht bewegt werden, wenn bewegte Phrasen nicht transparent für Subextraktionen sind: Bewegung ‚friert Phrasen ein‘ – es resultiert sogenanntes freezing (Wexler & Culicover 1980). Dies würde jedoch heißen, dass Elemente, die sich in der bewegten vP in SpecTP befinden, keine höhere Position, etwa SpecCP, erreichen können. Wie sich zeigt, ist die Annahme Wexler & Culicovers jedoch vermutlich nicht wirklich problematisch für die Verhältnisse im Deutschen ganz allgemein – und insbesondere nicht für die Bewegung der vP nach SpecTP: – Zum einen gibt es Gegenbeispiele für Freezing: Gerade für das Deutsche wurde verschiedentlich gezeigt, dass aus bewegten Phrasen sehr wohl subextrahiert werden kann (vgl. z.B. Fanselow 1991, Haider 1993, Frey 2000, Fanselow & Cavar 2002, Molnarfi 2004). Der Vorstellung vom Freezing liegt also möglicherweise einfach keine korrekte Generalisierung zugrunde – oder zumindest gilt die Generalisierung nicht für das Deutsche, um das es in der vorliegenden Analyse aber nun einmal geht. – Gerade auch die spezielle Konstruktion, die hier betrachtet wird, ist besonders einschlägig für die Ausnahmen zur Freezing-Generalisierung: Die häu-
122
–
–
Mögliche technische Probleme der Analyse
figste Art von Gegenbeispielen betrifft nämlich bewegte, nicht-finite verbale Projektionen. Diese scheinen sogar niemals intransparent für Subextraktionen zu werden (Grewendorf & Sabel 1994). Bewegt man nun allerdings eine vP – also eine verbale Projektion, der die Finitheitsmerkmale des C/T-Systems noch fehlen – so bewegt man eine nicht-finite verbale Projektion. In der vorliegenden Analyse wird also just die Art von Strukturen bewegt, für die Freezing auch in anderen, unabhängigen Fällen gerade nicht zu gelten scheint. Zum dritten besteht für die Bewegung gerade der vP im Rahmen der aktuellen Theorie eigentlich kein Grund, einen Freezing-Effekt zu erwarten – denn die vP ist eine Phase: Jedes Element, welches in der Projektion eines Phasenkopfes enthalten ist, kann diese Projektion über die edge des Phasenkopfes verlassen, bevor die Phasenprojektion selbst von einem höheren Kopf attrahiert werden kann. Dadurch aber befindet sich in der nächsthöheren Phase ohnehin eine Kopie des Elementes in der edge, die sich (separat von der Phasenprojektion) bewegen können sollte. Selbst wenn damit für die Bestandteile der Phasenprojektion selbst Freezing applizieren sollte, dürfte damit kein Freezing-Effekt jemals empirisch nachweisbar sein. Damit gilt für die Projektionen von Phasenköpfen vermutlich generell, dass Freezing-Effekte im Rahmen ihrer Bewegung nicht theoretisch erwartet werden. Zum vierten – wollte man denn unbedingt trotzdem annehmen, dass aus der vP nicht subextrahiert werden kann – könnte man annehmen, dass sich die gesamte vP nach SpecCP bewegt. Diese Möglichkeit kann nicht a priori ausgeschlossen werden, insofern sie in den folgenden Beispielen aus Haider (1990) ganz offenbar auch overt möglich ist. Eine vollständige Verbprojektion kann sich, inklusive aller Argumente, im Vorfeld befinden (a, b). Auch die Argumentkombinationen im Vorfeld von (c) sollten zudem der Generalisierung nicht widersprechen, nach der das Vorfeld nur maximal eine Konstituente beherbergen kann: 113. a) [Ein /AUßenseiter das /RENNen gewonnen] hat hier noch NIE\. b) [Jemand ein /HAUS gekauft] hat hier noch NIE\. c) [Kindern Bonbons] gibt man besser nicht. (Bsp. Molnarfi 2004: 358)
An dieser Stelle kann noch einmal daran erinnert werden, welche Möglichkeiten für internal merge bestehen: Entweder kann die Bewegung per EPP, oder aber per EF ausgelöst werden. Da es sich bei C ebenfalls um einen Phasenkopf handelt, kann C=PH alle Phrasen, die sich in seiner Domäne befinden, nach SpecCP anheben. Im Deutschen mag dies mit der zusätzlichen Restriktion verbunden sein, dass hier nur ein Spezifikator realisiert wird (V2-Stellung, keine mehrfache
Verletzt die Analyse Freezing-Generalisierungen?
123
Extraktion aus Nebensätzen, etc.), dennoch kann vP – aus der Spezifikatorposition von T – problemlos und ohne weitere Stipulation nach SpecCP angehoben werden. Selbstverständlich kann aber auch nicht ausgeschlossen werden, dass andere Phrasen nach SpecCP gelangen. Adverbiale etwa, die ausserhalb von vP generiert werden (nicht aber Modalpartikeln, die keine Vorfeldfähigkeit aufweisen) könnten auf diese Weise nach SpecCP attrahiert werden. Lässt sich auch annehmen, dass die gesamte vP nach SpecCP gelangt, dort aber – ähnlich wie in der SpecTP-Position – nicht vollständig ausbuchstabiert werden muss? Bekannt ist, dass auch VPs in die Vorfeldposition gelangen können. Und auch infinite Verben können (scheinbar ohne ihre Komplemente) in SpecCP auftreten – obwohl sie als Köpfe in der (Phrasenposition) SpecCP letztlich nicht zulässig seien sollten. Liegen hier also Subextraktionen von VP aus der vP in SpecTP vor oder wird die gesamte vP nach SpecCP verbracht und distribuiert getilgt? Die vorliegende Analyse befasst sich vorrangig mit den Strukturoptionen des Mittelfeldes, daher sollen im Folgenden nur einige kurze Spekulationen genannt werden – die allerdings in der Tat darauf hinweisen, dass die gesamte vP möglicherweise selbst dann in SpecCP steht, wenn dort nur VP-Material oder gar das Verb allein overt realisiert werden: – Ein bloßes Verb lässt sich (als Kopf) nicht allein nach SpecCP anheben: Köpfe scheinen im Deutschen ja (zumindest in den meisten Fällen) keine vollgültigen Vorfeldbesetzungen darzustellen. Nimmt man aber an, dass in diesen Fällen eine VP in SpecCP steht, so stellt sich die Frage, wie das Objekt, welches in VP basisgeneriert wird, die VP verlassen haben soll (vgl. Fanselow Ms.: 19f). Diese Frage ist besonders dringlich für solche Elemente, die, wie oben gezeigt, im Grunde keinen Anlass haben, die VP zu verlassen – etwa ein definites DP-Objekt, wenn dieses durch seine Bewegung keinerlei EoO erreichen kann. Strukturen dieser Art sind aber völlig grammatisch. Die Annahme, dass auch hier eine größere Phrase (zumindest aber VP) in SpecCP steht, würde eine Analyse ermöglichen, die keiner Subextraktion bedarf: 114. [vP Peter [VP den Mann geschlagenKT]] hatFokus [TP [vP Peter [VP den Mann geschlagenKT]] ja [vP Peter [VP den Mann geschlagenKT]]]. = Ge/SCHLAgen HAT Peter den Mann ja. Idiome dürfen, einer gängigen Meinung nach, nicht durch Bewegungen zerrissen werden (vgl. ähnlich z.B. schon Lenerz 1977). Es scheint aber so, dass VP-
124
Mögliche technische Probleme der Analyse
Idiome auch dann eine idiomatische Lesart bekommen können, wenn nur Teile von ihnen im Vorfeld auftreten. Dies wäre unter der Annahme, dass die gesamte verbale Projektion in SpecCP stehen kann, allerdings leicht erklärbar: 115. [vP Peter die Flinte ins /KORN geworfen] hat [vP Peter die Flinte ins Korn geworfen] ja [vP Peter die Flinte ins Korn geworfen]. = Die Flinte ins /KORN hat ja PETer geworfen. Tatsächlich wäre das Idiom hier durch keine syntaktische Bewegung zerteilt worden, die semantische Schnittstelle würde also ein linear ununterbrochenes Idiom geliefert bekommen. Interessanterweise erfordert diese Lesart aber fast immer einen kontrastiven Anstieg der Intonation im Vorfeld (vgl. Frey 2004). Dieser rise ist nun aber genau diejenige phonologische Markierung, die auch im Mittelfeld schon oft als Anzeichen dafür galt, dass das rise-markierte Element innerhalb der vP in SpecTP steht. Tentativ ließe sich für eine Analyse nach folgender Manier plädieren, in der auch ganze vPen nach SpecCP gelangen, dort aber distribuiert getilgt werden. – Auch Nichtkonstituenten können – entgegen langstehender Annahmen – in Einzelfällen ins Vorfeld gelangen. Bewegt man aber eine größere, verteilt distribuierte vP, so löst sich das Problem möglicherweise. Fanselow liefert ein einschlägiges Beispiel (2001: 420): 116. [Peter geben] hättest Du das Buch nicht dürfen. [vP Du Peter das Buch geben dürfen] hättest [vP Du Peter das Buch geben dürfen] nicht [vP Du Peter das Buch geben dürfen] Damit ist gezeigt, dass durch die Annahme einer vP-Bewegung nach SpecTP keine Probleme für die Subextraktion aus der bewegten vP heraus angenommen werden müssen: – Die empirischen Fakten unterstützen die Annahme, dass sich die gesamte vP zumindest unter gewissen Umständen vielleicht nach SpecCP bewegen könnte. – Subextraktionen aus nicht-finiten verbalen Phrasen sind aus anderen Kontexten bekannt. – Theoretisch ist freezing ohnehin keine erwartete Restriktion im Rahmen der aktuellen Syntax: Die Extraktionseigenschaften der vP werden alleine durch
Verletzt die Analyse der Partikeln den Head Movement Constraint?
–
125
ihre Konfiguration bestimmt. Wenn die vP also in ihrer Basisposition transparent für Extrationen ist – was vermutlich niemand bestreitet – dann sollte sie nach der Maßgabe des No Tampering auch nicht durch eine Instanz von internal merge dahingehend verändern lassen, dass sie nach der Bewegung plötzlich intransparent für Bewegungen sein könnte. Sollte freezing dennoch für bestimmte Phrasen (aus theoretisch völlig unklaren Gründen) gelten, dann sollte die Restriktion für die Projektion eines phaseninduzierenden Kopfes aber dennoch empirisch nicht nachweisbar sein, wie oben gesehen.
Ich gehe daher davon aus, dass die Restriktion freezing für die vorliegende Analyse kein Problem darstellt.
8.3 Verletzt die Analyse der Partikeln den Head Movement Constraint? Wenn Partikeln, wie in der vorliegenden Analyse angenommen, funktionale Köpfe im Mittelfeld des deutschen Satzes sind, so sollte sich das finite Verb im Hauptsatz nicht über sie hinweg bewegen können, da dies den head movement constraint verletzt. Damit sollte sich das Verb aus der tiefen vP-Kopie heraus weder nach T, noch nach C bewegen können – was nicht den empirischen Fakten zu entsprechen scheint (Eric Fuss, p.c.). Ich halte diesen Einwand nicht für schwerwiegend, da sich letztlich für alle Stellungen des Verbs im Deutschen Szenarien aufzeigen lassen, in denen der HMC beachtet wird: – Finite Auxiliare werden in T0 basisgeneriert – und gelangen daher in einer Position in die Derivation, die von Anfang strukturell höher angesiedelt ist als die Position der Partikeln. Der HMC greift daher für finite Auxiliare in keinem Fall. – Finite Vollverben werden in vP generiert - und könnten deshalb aber auch innerhalb dieser vP an den Partikeln vorbei nach SpecTP bewegt werden. Da die Bewegung der vP aber die Bewegung einer Phrase (keines Kopfes) ist, appliziert der Head (!) Movement Constraint hier nicht. Finite Vollverben könnten daher die C-Position HMC-konform erreichen. – Problematisch erscheint daher ausschließlich die Bewegung eines finiten Vollverbs aus der vP nach T0. Genau für diese Bewegung aber gilt, dass sie letztlich nicht durch Wortstellungsfakten belegbar ist: Da zwischen v0 und T0 keinerlei Elemente auftreten können, lassen sich sowohl in lexikalistischen wie auch syntaktischen Theorien der Verbflexion Wege finden, die Verbflexion von T0 mit dem Verb in v0 zu verbinden:
126 –
–
Mögliche technische Probleme der Analyse
Syntaktisch wäre eine Verbindung der Knoten sowohl mithilfe von Bakers (2002) phonologischer Operation merger (nicht zu verwechseln mit dem syntaktischen merge), wie auch mit dem Instrumentarium der Distributed Morphology problemlos möglich (vgl. für ähnliche Überlegungen vor dem Theoriehintergrund antisymmetrischer Strukturen auch z.B. Mahajan 2003: 223). Eine lexikalistische Theorie könnte das Verb voll flektiert in die syntaktische Derivation einbringen und die Merkmale von V/v durch die Operation Agree auch auf Distanz von T überprüfen lassen. Ähnliche Merkmalsabgleiche zwischen verbalen Köpfen sind aufgrund der komplizierten Verhältnisse in deutschen Verbclustern (Statusrektion, infinitivus pro participio, Reihenfolgerestriktionen etc.) ohnehin zwingend nötig und stellen daher keinerlei zusätzliche Stipulation dar. Die satzfinale Wortstellung des finiten Verbs kann daher in allen Szenarien korrekt vorhergesagt werden.
8.4 Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus? Syntaktische Analysen haben über die Jahre in verschiedenster Form Annahmen darüber formuliert, welche (strukturelle) Distanz Bewegungen maximal überbrücken können (vgl. z.B. die islands in Ross 1967, die barriers in Chomsky 1986 oder die phase impenetrability condition in Chomsky 1999, 2004). Durch all diese Restriktionen sollte sichergestellt werden, dass Bewegungen ‚lokal genug‘ sind (also keine arbiträr langen Relationen aufgespannt werden). Wie verschiedene Autoren nun aber ebenfalls gezeigt haben, scheinen auch umgekehrt syntaktische Restriktionen zu existieren, nach denen Bewegungen nicht ‚zu lokal‘ sein dürfen (vgl. Grohmann 2011 für eine umfassende Diskussion verschiedener Vorschläge): Innerhalb einer (genauer zu bestimmenden) syntaktischen Domäne dürfen ebenfalls keine Bewegungen stattfinden, es gilt die Anti-Locality-Hypothesis: „Movement must not be too local“ (Grohmann 2003). Insbesondere muss aber wohl in jedem Fall gelten, dass Bewegungen eines Elements aus der Komplementposition eines Kopfes in den Spezifikator desselben Kopfes nicht ohne weiteres möglich sind – sie sind ‚zu lokal‘ (vgl. z.B. Grohmann 2011: 273). Genau diese Konfiguration liegt aber vor, wenn sich eine vP nach SpecTP bewegt: Der T-Kopf wird als Schwester von vP verkettet, und die Bewegung der vP zielt auf die Spezifikatorposition der TP ab. Antilokale Restriktionen werden von Biberauer (2003) und Biberauer & Richards (2006) nicht thematisiert, dennoch wäre es wünschenswert, wenn die Bewegung der vP nicht ‚zu lokal‘ wäre.
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
127
8.4.1 Vermeidung von Antilokalität: Der Ansatz Es ist leicht zu erkennen, dass Antilokalitäts-Restriktionen für die Bewegung der vP nach SpecTP dann nicht gölten, wenn eine Projektion zwischen der TP und der vP aufträte. Dies wäre z.B. dann gegeben, wenn z.B. AdvPen (etwa nach der Maßgabe kartographischer Annahmen) Spezifikatorpositionen weiterer Mittelfeldprojektionen besetzten (also nicht an vP adjungiert verkettet werden). Der generelle Modus Operandi dieser Vorschläge würde zudem die Präsenz eines ‚leeren‘ Kopfes in jedem Satz zweifelsohne mühelos ermöglichen. Dennoch soll eine solche (stipulative) Annahme hier nicht getroffen werden. Attraktiver wäre es, eine Projektion zwischen vP und TP nachzuweisen, die: – auch overt realisiert werden kann und – deren overte Position ausnahmslos in der Mitte des Mittelfeldes liegt und – die einen syntakto-semantischen Grund hat, tatsächlich in ausnahmslos jedem Satz aufzutreten. Diese Maßgaben können nur dann erfüllt werden, wenn eine funktionale Projektion zwischen T und vP interveniert, die für die Bildung jedes einzelnen Satzes von integraler Notwendigkeit ist – die also mit anderen Worten den Satz mit konstituiert. Eingangs wurde erwähnt, dass Modalpartikeln stellungsfeste Elemente in der benötigten Position sind. Können wir daher davon ausgehen, dass Modalpartikeln (entgegen anderer Annahmen, vgl. Cardinaletti 2007, 2008 sowie Coniglio 2006, 2007) zur Kaskade der funktionalen Projektionen gehören, die im deutschen Satz vorzufinden sind? Der Nachweis für diese Annahme wird im nächsten Unterkapitel (basierend auf Struckmeier: im Erscheinen) geführt.
8.4.2 Partikeln als Teil der funktionalen Kaskade des Deutschen In diesem Unterkapitel soll kurz gezeigt werden, dass die deutschen Modalpartikeln plausibel analysiert werden können als Bestandteile der funktionalen Kaskade, die den deutschen Satz konstituiert. Dieses Unterkapitel fasst hierzu die Ergebnisse meiner eigenen Untersuchungen (insbesondere Struckmeier: im Erscheinen, basierend auf Struckmeier 2008) zusammen. Partikeln werden in dieser Darstellung als Köpfe einer obligatorischen Projektion PartP analysiert – sie sind daher nicht etwa eine Unterart von Adverbialphrasen. Wie in den folgenden Unterkapiteln aber gezeigt wird, ist diese Kategorisierung von viel größerer Bedeutung, als in den älteren Arbeiten erkannt worden ist.
128
Mögliche technische Probleme der Analyse
Als Modalpartikeln (im folgenden abgekürzt als Part) bezeichnet man üblicherweise Elemente (wie doch, eben, einfach, halt, ja, auch, denn, eigentlich, etwa, wohl, bloß, nur, und schon), wie z.B. im folgenden Satz: 117. Dieser Satz enthält jaPart dochPart wohlPart viele Partikeln. Elemente dieser Art wurden für sehr lange Zeit kaum untersucht – möglicherweise aus gleich mehreren Gründen: Zum einen sind Partikeln eine relativ junge Erscheinung im Deutschen. Nur vier Partikeln sind für das Mittelhochdeutsche belegt, alle anderen können erst im 16., 18. und in Teilen sogar erst im 19. Jahrhundert nachgewiesen werden (Burckhardt 1994: 139f.). Da die Partikeln sich, wie noch gezeigt wird, aus anderen Elementen per Grammatikalisierung entwickelt haben, kann unterstellt werden, dass Partikeln nur wenig Zeit hatten, ihre besonderen Eigenschaften auszuprägen (vgl. in diesem Sinne auch Burckhardt 1994: 140). Diese (von den lexikalischen Vorgängern abweichenden) Eigenschaften waren aber natürlich nötig, damit die Partikeln als besondere Klasse von Elementen überhaupt sprachwissenschaftlich nachweisbar wurden. Für einige Zeit galten die Partikeln sogar (wie vielleicht jede sprachliche Neuerung?) zunächst als Störenfriede: Die Partikeln, bescheinigt Reiners, „wimmeln wie Läuse in dem Fell unserer Sprache herum“ (Reiners 1949: 283). Es mag bei dieser Einschätzung auch nicht geholfen haben, dass die äußerliche Erscheinungsform der Partikeln sie als Klasse nicht leicht erkennbar macht: Sie entstehen aus Formen, die Adverben und Adjektiven ähneln, zum Teil aus Antwortpartikeln etc. und bildeten daher in ihrer Entstehung eine durchaus heterogene Menge von Elementen. Da die Partikeln auch keinerlei Flexion o.ä. zeigen, waren sie auch über morphologische Gemeinsamkeiten nicht paradigmatisch-distributionell als Klasse zu ermitteln. In Bezug auf ihre Form sind Partikeln also uneinheitlich. Und auch semantisch scheint der Beitrag von Partikeln zum Satz nur schwer zu fassen zu sein: Sie tragen nicht direkt zum propositionalen, syntakto-semantisch konstituierten Gehalt eines Satzes bei (vgl. z.B. Franck 1980 für eine ähnliche Einschätzung). Damit waren die Partikeln auch wissenschaftsgeschichtlich sowohl für phonologisch und morphologisch zentrierte Ansätze (etwa im 19. Jahrhundert) wie auch syntakto-semantisch basierte (ab der Hälfte des 20. Jahrhunderts) nie zentral. Für pragmatische Ansätze aber waren die Partikeln überaus interessant: Zum einen war die ‚Bedeutung‘ von Partikeln noch am ehesten als pragmatisch-diskursiver Beitrag zur Satzbedeutung darstellbar (vgl. z.B. Erben 1964, Weydt 1969, Brinkmann 1971). Zum anderen fungierten diese Elemente auch als Kronzeugen dafür, dass syntakto-semantische (nicht-pragmatische) und satzzentrierte (nicht-diskursive) Grammatiken nicht ausreichend sein sollten, um sprachliche Elemente wie die Modalpartikeln plausibel zu integrieren.
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
129
Mit den heutigen Mitteln der grammatischen Repräsentation aber lassen sich Partikeln sehr wohl auch syntakto-semantisch darstellen: Partikeln im Deutschen sind insofern eine syntaktisch homogene Klasse, als sie allesamt sensitiv sind für die syntaktischen Merkmale des C-Kopfes eines Satzes. Zwar ‚kongruieren‘ Partikeln nicht phonologisch overt mit C-Elementen, sie zeigen aber bestimmte Kookkurrenzrestriktionen mit bestimmten Typen von C-Köpfen. Wie unten gezeigt wird, sind diese Übereinstimmungen syntaktisch leicht zu erklären, fallen aber gerade nicht unter den (ja ebenfalls von C beeinflussten) pragmatischen Funktionen von Sätzen zusammen. Partikeln repräsentieren daher, aus der Sicht von Struckmeier (im Erscheinen) eine Teilmenge derselben Satztypenmerkmale, die auch von T- und C-Elementen ausbuchstabiert werden. In Unterkapitel 8.4.2.1. werden kurz die relevanten Eigenschaften von Partikeln zusammengefasst. 8.4.2.2. zeigt, dass diese Eigenschaften die Partikeln (contra Cardinaletti 2007 und Zimmermann 2004) nicht als adverbiale Unterklasse ausweisen. Das Unterkapitel 8.4.2.3. zeigt dann, dass Partikeln vielmehr auf interessante Weise als tiefster Teil der C-Kaskade im Deutschen analysiert werden können.
8.4.2.1 Partikeln: Diachrone und synchrone Eigenschaften Viele Autoren nehmen an, dass Partikeln nichts anderes sind als eine Unterklasse der Adverbien (z.B. Abraham 1991a, Cardinaletti 2007, Jacobs 1991, Zimmermann 2004). Diachron mag diese Einschätzung zumindest für manche Partikeln sinnvoll erscheinen, denn einige Partikeln entwickeln sich aus Adverbien – und bis heute haben viele Partikeln adverbielle Doppelgänger, die es schwierig machen, die Eigenschaften einer Partikel von den Eigenschaften des korrespondierenden Adverbs zu trennen (z.B. bei doch, eben, einfach, auch, eigentlich, bloß, schon, vgl. Meibauer 1994: 35). Sieht eine Partikel also aus wie ein Adverb und kann sich zumindest auch so verhalten wie ein Adverb, so muss – so die linguistische Argumentation – diese Partikel ein Adverb sein. Neben der fehlenden Flexion kann auch die Position in der Mitte des Mittelfeldes mit ‚hohen‘ Adverbien im Deutschen verglichen werden (vgl. z.B. Abraham 1991a: 240ff, Abraham 1988: 448f.): 118. [CP XP C [TP Subjekti ... [PartP (Part) [vP Subjekti [VP (Objekte) ... V]]]]] [CP Gestern hat [TP Peter [ ja [vP Peter [VP den Müll weggebracht]]]]] [CP Gestern hat [TP Peter [ leider [vP Peter [VP den Müll weggebracht]]]]] Partikeln können auch in anderen satzwertigen Konstruktionen, etwa den pränominalen Attributen des Deutschen (vgl. Struckmeier 2007) auftreten. Entgegen des Ansatzes Coniglios (der diese Elemente von seiner Beschreibung der Parti-
130
Mögliche technische Probleme der Analyse
keln ausnimmt, vgl. 2006: 59, 2007: 103), besteht aus meiner Sicht überhaupt kein Grund, diese Elemente nicht auf gleiche Weise zu behandeln (wie unten noch näher erläutert wird). Semantisch ähneln die Partikeln zumindest bei oberflächlichem Hinsehen den hohen Adverbien, indem sie Eigenschaften der gesamten Proposition modifizieren, Diskursanbindungen ermöglichen oder Sprechereinstellungen signalisieren: Schon für von der Gabelentz etwa ist die „psychologische Modalität“ der locus der Partikeln und den Grund ihrer Verwendung sieht er „nicht unmittelbar in der Sache, im Gegenstande der Rede, sondern in einem seelischen Bedürfnis meiner, des Redenden“ (1891: 453). Adverbien wie offensichtlich, vermutlich, leider und unglücklicherweise scheinen daher ganz ähnlich zu funktionieren. Warum also sollte man die Partikeln nicht einfach den Adverbien zuschlagen?
8.4.2.2 Partikeln weisen keine homogenen Adverbeigenschaften auf Auch wenn einige Partikeln sich unbestreitbar aus Adverbien entwickeln, so ist es dennoch nicht wahr, dass alle Partikeln dies tun: Die Partikel ja entwickelt sich z.B. aus einem vokativen Pronomen (Hentschel 1986: 38), doch aus einem demonstrativen oder anaphorischen Element (ebd: 43f.) und eben aus einem Adjektiv (ebd.: 52f.). Eine diachrone Begründung der Kategorienfrage kann also beileibe nicht so homogen ausfallen, wie selbst die hohe Anzahl von adverbialen Doppelgängern von Partikeln suggerieren mag. Zudem muss auch gelten, dass der Sprachwandel letztlich natürlich ohnehin immer die Möglichkeit eröffnet, dass die neu formierte Klasse eben nicht die Eigenschaften der alten weiterführt. Und genau dies scheint der Fall zu sein: In einer genaueren synchronen Beschreibung nämlich erweisen sich die Eigenschaften von Partikeln als subtil verschieden von denen der Adverbien.
8.4.2.2.1. Partikeln unterscheiden sich distributionell von Adverbien Adverbien (a) können im Deutschen, wie bereits eingangs erwähnt, ihre relative Reihenfolge zu einander ändern (vgl. wiederum Frey & Pittner 1998). Partikeln hingegen (b) zeigen eine bemerkenswerte Resistenz gegen Änderungen ihrer Reihenfolge (vgl. schon Helbig & Kötz 1985): 119. (a) Peter hat heute hier getanzt. Peter hat hier heute getanzt. (b) Peter hat ja doch getanzt. ??Peter hat doch ja getanzt.
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
131
In ihrer sehr sorgfältigen Untersuchung zeigt Thurmair, dass nur einige wenige Abfolgen von Partikeln möglich sind (1989: 286ff.). Coniglio (2006: 80) fasst ähnlich wie Thurmair die Distribution betonter (wie DOCH) und unbetonter Partikeln (wie doch) wie folgt zusammen: 120. ja>denn>doch>halt/eben>DOCH>wohl>eh/ sowieso/nur>bloß>schon/ruhig>mal/ JA Damit zeigen die Partikeln eine wesentlich strengere Mittelfeldabfolge als adverbiale Elemente. Darüber hinaus können Partikeln – anders als adverbiale Projektionen – im Normalfall nicht ins Vorfeld gelangen (vgl. Meibauer 1994: 38, Abraham 1991a: 244, Abraham 1988: 454, Lindner 1991: 167): 121. *Ja hat er halt getanzt. *Halt hat er ja getanzt. 122. Heute hat er ja hier getanzt. Hier hat er ja heute getanzt. Andererseits können Modalpartikeln aber offenbar in manchen Fällen an WhWörter klitisieren – was Adverbien wiederum in den gleichen Fällen nicht immer tun: 123. [Wie nur] habe ich den Schlüssel verlieren können? (Bsp. Abraham 1991a: 237) Vgl.: Wie schon könnte er das machen? Wer wohl würde so etwas sagen? (?) Wem denn hat der Lehrer ne Sechs gegeben? Ähnlich: Wer hier hat seinen Schlüssel verloren? Aber: *Wie hier habe ich den Schlüssel verlieren können? *Wie heute habe ich den Schlüssel verlieren können? *Wer heute hat den Schlüssel verloren? Viele Partikeln können darüber hinaus nicht die Hauptbetonung des Satzes tragen, und daher nicht z.B. als Exponenten des Informationsfokus fungieren
132
Mögliche technische Probleme der Analyse
(vgl. Bastert 1985: 38, Pasch et al 2003: 579, Thurmair 1989: 22), während Adverbien dies oft unproblematisch tun. Während es geradezu zu den definierenden Eigenschaften der Adjunktklasse Adverb gehört, rekursiv iteriert werden zu können, zeigen Partikeln extrem strenge Restriktionen bezüglich solcher Kombinatorik: Paare von Partikeln haben in spontan-mündlichen Diskurssituationen auffallend oft die Partikel doch als erste Partikel (Bastert 1985: 41, Abraham 1991a: 248) und insgesamt können aus 171 möglichen Paaren von Partikeln nur etwa 50 Kombinationen überhaupt als gebräuchlich gelten (Thurmair 1989: 280). Kombinationen von drei Partikeln sind selten, vier Partikeln treten kaum je gemeinsam auf (Thurmair 1989: 283). Eine weitere distributionelle Eigenschaft, die die Partikeln besonders klar von den Adverbien trennt, ist ihre Sensitivität für Satztypeigenschaften (vgl. schon Altmann 1987, Thurmair 1989): Manche Partikeln sind in manchen Satzarten schlicht nicht verwendbar. Wenn dies oft nicht auf den ersten Blick erkennbar wird, dann deshalb, weil die Partikeln ja (wie o.a.) teilweise adverbiale Doubletten haben. Diese Doppelgänger wiederum können – als gewöhnliche Adverbien – in jedem Satztyp auftreten. Möchte man also sicherstellen, dass die Distribution der Partikel – nicht des homophonen Adverbs – geprüft wird, so muss man Testsätze so konzipieren, das die lexikalische Bedeutung des Adverbs zu semantischen Widersprüchen führt (vgl. hierzu Wegener 1998). Da Partikeln die lexikalische Bedeutungskomponente der Adverbien abgeht, führt nur die Partikellesart zu einer nicht-widersprüchlichen Lesart des Satzes (vgl. hierzu auch ausführlicher das folgende Unterkapitel): 124. Wenn Du verwirren willst, dann mach die Sache einfach kompliziert. (Kein Widerspruch – aber dementsprechend auch einzig mögliche Lesart: Die Sache soll kompliziert (nicht einfach) gemacht werden) Auch die fehlende Betonbarkeit mancher Partikeln kann helfen, diese von adverbialen Doppelgängern zu unterscheiden. Entgegen Behauptungen Cardinalettis kann ich auch nicht erkennen, dass Modalpartikeln nicht in einem Satz mit ihrer adverbialen Doublette auftreten können: Die Beispiele, die Cardinaletti zur Illustration dieser Behauptung anführt, erscheinen mir oft völlig unproblematisch – wie z.B. das folgende Beispiel (vgl. Cardinaletti 2007: 98): 125. Du kannst das schon schon machen. (Aber...) Stark bevorzugt ist zudem in diesem Beispiel nach meiner Intuition das erste schon die Modalpartikel, das zweite schon hingegen das temporale Adverb. Während einige Sprecher die Unterscheidung zwischen der Partikel schon und dem Adverb
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
133
schon auch phonologisch ausdrücken (die Partikel kann mit kurzem oder langem Vokal, das Adverb hingegen nur lang ausgesprochen werden, Jürgen Lenerz, p.c.) gilt in meiner Varietät des Deutschen, dass selbst diese Unterscheidung nicht wirklich zwingend ist: Das Adverb und die Partikel können gleichermaßen mit langem wie mit kurzem Vokal ausgesprochen werden. Damit ist es (in meiner Aussprache) durchaus möglich, zwei segmental-phonologisch identische Vorkommen von schon aufeinander folgen zu lassen. Ein Vergleich mit anderen Adverbien ist hier illustrativ: Tritt ein Adverb in einem Satz zweimal auf, welches keine Entsprechung als Modalpartikel hat, so wird dies (anders als im gerade gesehenen Beispiel) als Wiederholung aufgefasst – und wirkt entsprechend sonderbar: 126. ?Peter hat das heute heute gemacht. ?? Peter hat glücklicherweise glücklicherweise gelacht. Die distributionellen Eigenschaften von Adverbien und Modalpartikeln unterscheiden sich damit so stark, dass Modalpartikeln nicht den Adverbien zugerechnet werden sollten. Wie steht es um die semantischen Eigenschaften der Partikeln?
8.4.2.2.2. Modalpartikeln unterscheiden sich semantisch von Adverbien Modalpartikeln haben – anders als ihre möglichen adverbialen Doubletten – die lexikalische Semantik ihrer Vorläufer abgelegt. Dies zeigt sich z.B. darin, dass Modalpartikeln nicht mehr inkompatibel sind mit Adverbien, deren lexikalische Semantik eigentlich zu insgesamt widersprüchlichen Aussagen führen sollte (vgl. Wegener 1998): 127. a) Er löst Probleme einfach zu kompliziert. b) Warum er das nur auch noch macht? In (a) erscheint es z.B. kein Problem zu sein, die Partikel einfach mit dem Adverb kompliziert zu kombinieren – obwohl sich die beiden Wörter widersprechen sollten, wenn die Partikel einfach noch die lexikalische Bedeutung des homophonen Adverbs einfach hätte. Mit (b) liegt ein ähnliches Beispiel vor. Dieses Verhalten der Modalpartikeln einfach und nur kontrastiert scharf mit dem der Adverbien einfach und nur: Stellt man einen Satz so um, dass z.B. einfach ins Vorfeld gelangt, wo es nur als Adverb interpretiert werden kann, so stellt sich tatsächlich der erwartete Widerspruch ein: 128. ?Einfach hat er das Auto kompliziert repariert.
134
Mögliche technische Probleme der Analyse
Dieser Satz ist grammatisch, aber semantisch widersprüchlich. Es ist dieser lexikalisch-semantische Beitrag der Adverbien, der sie z.B. auch leicht übersetzbar macht. Eine lexikalisch-semantische Bedeutung der Modalpartikeln hingegen ist semantisch zumindest äußerst schwer zur erfassen. – was ihre Übersetzung erschwert. Aber welchen Beitrag leisten Modalpartikeln dann überhaupt in einem Satz?
8.4.2.3 Modalpartikeln als tiefste Bestandteile der C-Kaskade Die erste Frage, die sich der Beschreibung der Modalpartikeln stellt, ist die nach ihrem syntaktischen Status: Fungieren Modalpartikeln im Satz als Phrasen, die an verbale Projektionen adjungiert werden (vgl. Cardinaletti 2007, Coniglio 2006)? Oder aber sind Modalpartikeln selbst funktionale Köpfe, die eine verbale Projektion als ihr Komplement nehmen (vgl. Struckmeier: im Erscheinen)? Die Argumente, mit denen z.B. Cardinaletti belegen möchte, dass Partikeln keine funktionalen Köpfe sein können, sind aus meiner Sicht fast schon bizarr zu nennen: Sie behauptet, Partikeln wären als funktionale Köpfe untauglich, da sie a) einen Wortakzent trügen, und b) weil sie länger seien könnten als eine Silbe (2007: 94). Eine solche Definitionsgrundlage für funktionale Köpfe im Deutschen ist mir nun aber nicht nur schlicht nicht bekannt (wo wären funktionale Köpfe jemals z.B. als einsilbig definiert worden?) – sie schließt auch eine ganze Reihe von zweifelsohne funktional zu nennenden Elementen im Deutschen als funktionale Köpfe aus: – Was a) betrifft, so sollten Artikel wie z.B. dies, ein, mein, kein, dem und Pronomina wie ihm und sie keine D-Elemente mehr sein können. Desgleichen wäre auch weil kein funktionaler Kopf mehr, und auch der Status von Auxiliaren als T-Köpfen müsste überprüft werden. – Bezüglich b) hat das Deutsche einige funktionale Elemente, deren Stämme mehrsilbig sind, z.B. einig-e, jeglich-e, ander-e im nominalen oder obgleich, obwohl, etc. in der Kaskade verbaler funktionaler Köpfe (im Sinne einer extended projection). In Anbetracht ihrer fehlenden lexikalischen Semantik muss daher angenommen werden, dass Partikeln funktionale Elemente sind – mehr noch, sie müssen funktionale Köpfe sein: Dies ist nicht nur theoretisch erforderlich (um die Köpfigkeit der Modalpartikelprojektion ohne weitere Stipulationen erklären zu können), sondern auch empirisch attraktiv: Über die Annahme, dass Modalpartikeln funktionale Köpfe sind, könnte sogleich erklärt werden, warum sie (zumindest ohne zusätzliches Material) nicht vorfeldfähig sind: Sie sind keine phrasalen Konstituenten. Geht man nun die Definitionen durch, die Abney für funktionale Elemente in seiner grundlegenden Arbeit (1987: 64f.) aufgestellt hat, so wird deutlich, dass
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
135
Modalpartikeln sich tatsächlich in jeder Hinsicht wie funktionale Köpfe verhalten: – Funktionale Köpfe sind nach Abney eine geschlossene Klasse. Auch Modalpartikeln sind eine geschlossene Klasse, insofern Sprecher z.B. keine neuen Modalpartikeln ad libitum hinzufügen können. – Funktionale Köpfe sind häufig unbetont. Auch Modalpartikeln sind häufig (wenngleich vielleicht nicht immer, s.o.) unbetont. – Funktionale Köpfe selegieren keine Argumente als Komplement. Modalpartikeln selegieren ebenfalls keine Argumente, sondern komplexe verbale Projektionen als ihr Komplement. – Funktionale Köpfe haben keine lexikalische Semantik – genau wie Modalpartikeln. – Stattdessen regulieren funktionale Köpfe die Interpretation ihrer propositionalen Komplemente. Genau dies tun Modalpartikeln, wie eingangs kurz umrissen, ebenfalls: Sie drücken (u.a.) Sprechereinstellungen zu ihren propositionalen Komplementen aus. Damit weisen Modalpartikeln ausnahmslos alle Eigenschaften von funktionalen Köpfen auf. Die Frage kann daher aus meiner Sicht nicht sein, ob Modalpartikeln funktionale Köpfe sind – sondern nur, was für funktionale Köpfe: Lassen sich die Modalpartikeln anhand ihrer Eigenschaften klar einer bereits etablierten Klasse funktionaler Köpfe zuweisen?
8.4.2.3.1. Zur Distribution: Partikeln zwischen vP und T Modalpartikeln treten, wie eingangs bereits kurz umrissen, in relativ festen Position in der Mitte des Mittelfeldes auf: Sie folgen dem finiten Verb im Hauptsatz, gehen aber der Basisposition der Subjekte voran – was sich anhand von floating quantifiers (a), Indefinitpronomina (b) oder fokussierten Subjekten (c) recht gut nachweisen lässt: 129. a) [CP Gestern haben [TP die Studenten eigentlich [vP alle gefeiert]]] b) [CP Gestern hat [TP die Studenten ja [vP wer gesehen]]] c) [CP Gestern hat [TP die Studenten ja [vP PETerFoc gesehen]]] Damit unterscheiden sich die Modalpartikeln distributionell von allen etablierten funktionalen Köpfen. Sie sind: – tiefer eingebettet als C (da sie C nachfolgen), – tiefer eingebettet als T (da sie sonst auch Subjekten im linken Mittelfeld vorangehen müssten) aber
136 –
Mögliche technische Probleme der Analyse
sie stehen strukturell höher als v (weil sie der gesamten Projektion von v einschließlich des Subjektes vorangehen).
Aus semantischer Sicht macht die Position der Modalpartikeln sogar Sinn: Wenn sie, wie gemeinhin angenommen (vgl. z.B. Zimmermann 2004: 261 und die dort zitierte Literatur), vollständige Propositionen als Komplemente nehmen, so sollten sie exakt die syntaktische Position einnehmen, die sie tatsächlich aufzuweisen scheinen. Dieses Argument lässt sich übrigens nicht auf eine Analyse übertragen, die die Modalpartikelprojektion als adjungierte Phrase ausweist: Die vergleichsweise freie Positionierbarkeit von Adjunkten würde hier die Position der PartP als mehr oder minder zufällig beschreiben. Schlimmstenfalls aber würde diese Analyse vorhersagen, dass PartPen die typische freie Distribution adjungierter Phrasen aufweisen sollten, was sie (wie gesehen) nun aber ganz und gar nicht tun.
8.4.2.3.2. Distribution 2: Antwortpartikeln als C-Elemente Modalpartikeln haben nicht nur adverbiale Doppelgänger: Manche Partikeln treten auch als Antwortpartikeln auf (oder zumindest treten homophone Formen mancher Partikeln in dieser Rolle auf): 130. Kaugummi ist nicht gut für die Zähne. – Doch! (Franck 1980: 172) 131. Deine Oma ist unausstehlich. – Schon. Aber sei bitte trotzdem nett zu ihr. (Franck 1980: 194f.) 132. Kommst Du morgen? – Ja. 133. Fußballmanager gehören doch alle verhaftet! – Eben. Nimmt man an, dass diese Partikeln C-Elemente sind, so ist die Analyse trivial: Die Partikel kann als eigene Projektion, d.h. als [+minimal, +maximal] ganz alleine eine konvergierende syntaktische Derivation ergeben: Die Partikel wird aus dem Lexikon verkettet, und die Derivation eines CP-Äquivalents ist beendet. Denkbar wäre aber auch, dass die Partikel in ihrer Projektion noch weitere Elemente an sich bindet. Wie sich zeigt, ist dies möglich: 134. a) Frage: Magst Du Kartographen? Antwort: [CPSolange sie nichts schreiben] schon/ ja. b) Frage: Magst Du Hunde Antwort 1: [DPKleine] schon/ ja. Antwort 2: [PP An der LEINe] schon/ ja. Antwort 3: [VPSie angucken] schon.
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
137
c) Frage: Magst Du denn keine Hunde? Antwort 1: [Wenn sie nicht beißen] doch/ wohl. Antwort 2: [Kleine] doch/ wohl. Antwortpartikeln projizieren also einen Spezifikator, der ein Element einer nahezu beliebigen Kategorie aufnehmen kann – und unterscheiden sich damit vom funktionalen Kopf T, der (universalgrammatisch variable, aber sprachspezifisch festgelegte) kategoriale Beschränkungen über seinen Spezifikator ausspricht (z.B. im Englischen: nur DPNOM besetzt SpecTP, im Deutschen, je nach Analyse, vP oder ebenfalls DPNOM). Der funktionale Kopf v hingegen erlaubt zwar Phrasen verschiedener Kategorien durch seine Spezifikatoren zu wandern (vgl. Chomsky 2005). Er unterscheidet sich aber von Antwortpartikeln darin, dass letztere eben nur genau eine Phrase in ihrem Spezifikator erlauben – wiederum genau wie ein C-Kopf im Deutschen: 135. Frage: Kommt die Katze auf den Tisch? Antwort 1: Auf den Tisch schon. Antwort 2: Diese Katze schon. Antwort 3: *Auf den Tisch diese Katze schon. Interessant an diesen Daten ist, dass DPen im Spezifikator der Partikel einen Kasus aufweisen, der ihrem Argumentstatus im Vorgängersatz entspricht. Wie Dennis Ott (p.c.) vorschlägt, könnte hier also eine elliptische Form von C-Projektion vorliegen – als deren Kopf dann wiederum die Modalpartikel zu analysieren wäre. Damit ist zwar nicht gezeigt, dass die Antwortpartikeln und die Modalpartikeln im Mittelfeld die selben Elemente sind. Was sich aber abzeichnet ist, dass Modalpartikeln zumindest nahe lexikalische Verwandte haben, die klare C-Eigenschaften aufweisen. Damit wird das Argument, Partikeln ähnelten (nur) den Adverbien sehr stark relativiert: Partikeln ähneln (soviel lässt sich mindestens sagen) auch homophonen C-Elementen. Um zu den Mittelfeld-Partikeln zurück zu kommen: Lassen sich auch für diese Modalpartikeln C-Eigenschaften nachweisen?
8.4.2.3.3. Modalpartikeln – Bestandteil der Satztypmerkmale? Es ist lange bekannt, dass Modalpartikeln nicht frei in allen Satztypen auftreten können (vgl. schon Altmann 1987, Thurmair 1989): Unterscheidungen etwa zwischen E-Fragen, W-Fragen, Imperativsätzen und Aussagesätzen lassen sich problemlos nachweisen (vgl. z.B. Franck 1980). Unter der (derzeit aktuellen) Annahme,
138
Mögliche technische Probleme der Analyse
dass die Finitheitsmerkmale des Verbs durch den C-Kopf in die Derivation gebracht werden (und an den T-Kopf nur derivativ vererbt werden), können all diese Satztypen sich allein auf der Basis der Merkmale des C-Kopfes unterscheiden. Genauer gesagt: die Spezifikation des C-Kopfes mit Bezug auf die Merkmale [±wh], [± ϕ] und die kategorielle Besetzung der C0-Position (Verbzweit versus Verbletzt) steuert die Distribution von Partikeln. Auf der anderen Seite lässt sich zeigen, dass pragmatische Differenzierungen hierzu weniger gut geeignet erscheinen: Direktive Sprechakte etwa verhalten sich nicht einheitlich bezüglich des Auftretens der Partikel doch – und nicht einmal erotetische Direktive bilden eine einheitliche Klasse (Bsp. nach dem Vorbild von Franck 1980: 184): 136. Ich mach noch ein bisschen Kaffee... a) Ihr trinkt doch auch noch ein Tässchen? b) *Trinkt ihr doch auch noch ein Tässchen? c) *Wer trinkt doch auch noch ein Tässchen?
(direktiv, erotetisch) (*direktiv, erotetisch) (*direktiv, erotetisch)
Aus der Sicht der syntaktischen Merkmalsspezifikation hingegen ist die Distribution von doch einfach zu beschreiben: doch kann nicht in Sätzen auftreten, deren C-Kopf die Merkmalsspezifikation [+wh] aufweist: 137. Ich mach noch ein bisschen Kaffee... a) Ihr trinkt doch auch noch ein Tässchen? b) *Trinkt ihr doch auch noch ein Tässchen? c) *Wer trinkt doch auch noch ein Tässchen? d) Trinkt Ihr doch auch noch ein Tässchen!
[-wh] [+wh] [+wh] [-wh]
Einzig für (a) könnte hier gefragt werden, ob die Einstufung als [-wh] gerechtfertigt ist. Wie Gunlogson (2003) jedoch überzeugend argumentiert sind Beispiele dieser Art (die sie als rising declaratives bezeichnet) keine Fragen. Für b-d sollte die Einstufung unkontrovers sein. In ähnlicher Weise erlauben Direktive (der nicht-erotetischen Art) die Partikel wohl genau dann, wenn der Satz aus syntaktischer Sicht als ϕ-complete eingestuft werden kann (d.h., grob gesprochen: Subjekt-Verbkongruenz aufweist): 138. a) b) c) d)
Können Sie wohl bitte das Fenster schließen? Schließt Du wohl das Fenster! *Schließ wohl das Fenster! *Das Fenster wohl geschlossen halten!
(direktiv, ϕ-complete) (direktiv, ϕ-complete) (*direktiv, ohne ϕ) (*direktiv, ohne ϕ)
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
139
Wie Thurmair (1989: 61f.) zeigt, sind denn und etwa zwar in V2-Fragen möglich (a), aber nicht in ob- oder Wh-Verbletztfragen (b, c). Die Möglichkeit des Auftretens von denn und etwa wird damit durch die syntaktische Kopfbewegung des finiten Verbs nach C0 gesteuert: 139. a) Wer hat denn/ etwa danach gefragt? b) *Ob denn/ etwa jemand danach fragt? c) *Wer denn/ etwa danach fragt?
(erotetisch, V in C) (*erotetisch, C in C) (*erotetisch, C leer)
Damit sollte klar sein, dass eine syntaktische Charakterisierung von Modalpartikeln anhand der Merkmale von C durchaus möglich ist – und vielleicht noch mehr: Vielleicht reagieren Modalpartikeln nicht nur auf die Merkmale von C, sondern konstituieren sie in Teilen? Wenn dies der Fall wäre, so sollte man erwarten, dass Partikeln für Satztypen auch tatsächlich konstitutiv sind – was nun auf den ersten Blick nicht der Fall zu sein scheint: Lassen sich Modalpartikeln nicht problemlos weglassen, ohne dass Ungrammatikalität resultiert? Dies scheint oft, aber nicht immer der Fall zu sein: 140. Wäre ich ?(doch) Millionär! (Bsp. Meibauer 1994: 31) Die angezeigte Bewertung ist zitiert nach Meibauer – nach meinem eigenen Dafürhalten ist dieser Satz ohne die Partikel sogar sehr stark markiert wenn nicht gar gänzlich inakzeptabel (??/*). Warum führt die Auslassung der Partikel hier zu Problemen? Betrachten wir ein anderes Beispiel: 141. a) Ob er wohl kommt? (eingebettete Frage oder emphatische V-letztfrage) b) ob er ____ kommt? (nur eingebettete Frage) 142. a) Bist Du wohl still? (nur direktiv/ nicht-erotetisch) b) Bist Du ___ still? (erothetisch oder nicht-erotetisch) (Bsp. von Zimmermann 2004: 257) Wie es scheint, führt das Weglassen oder Einführen einer Partikel zum Wegfall oder Erscheinen einer bestimmten Satztyplesart. Zimmermann schließt daraus, dass z.B. die Modalpartikel wohl als Satztypmodifikator fungiert. Ist aber angesichts des Beispiels von Meibauer nicht eine noch stärkere Repräsentation für Modalpartikeln denkbar? Wenn Modalpartikeln für die Konstitution bestimmter Satztypen nötig wären, so würde ihr Wegfallen zur Ungrammatikalität des Satzes unter diesem bestimmten Satztyp führen. Der Satz wäre, mit anderen Worten, nur noch grammatisch als Instanz eines anderen Satztyps. Dies ist nun aber kein
140
Mögliche technische Probleme der Analyse
Modifikationsverhältnis im engeren Sinne: Lässt man eine attributive Modifikation in einer DP weg oder setzt sie ein, so ändert dies nichts an den grammatischen Eigenschaften (etwa: der Selegierbarkeit durch Prädikate, der Argumentrolle, etc.) der Gesamt-DP: Die DP bleibt eine DP, mit oder ohne Attribut! Für Modalpartikeln scheint aber zu gelten, dass sie die Eigenschaften der CP in Teilen mitbestimmen: Wird die Partikel weggelassen, bleibt die C-Projektion nicht mehr dieselbe. Das kann nun nur so erklärt werden, dass die Partikel Eigenschaften der CP beisteuert, die der C-Kopf selbst nicht ausdrückt. Daher können bestimmte Satztypen nur mithilfe von Modalpartikeln erreicht werden – die damit zur Konstitution dieser Satztypen beitragen. Umgekehrt führt das Weglassen einer Partikel zu einer ungrammatischen Realisation eines intendierten Satztyps – und gegebenenfalls auch zur Ungrammatikalität des Satzes unter jedem möglichen Satztyp: Wie das Beispiel von Meibauer zeigt, gibt es Konstellationen, in denen ohne Modalpartikel gar kein grammatischer Satztyp mehr übrig bleibt! Dieser Effekt lässt sich in anderen Konstellationen – sogar stärker – demonstrieren. Das folgende Beispiel ist zwar als Echofrage denkbar, ohne bestimmten Kontext aber resultiert Ungrammatikalität in: 143. Wer *(wohl) danach fragt? Auch der folgende Satz wird ungrammatisch, wenn die Modalpartikel ausgelassen wird – da die Verberstform weder als E-Frage, noch als Verberstdeklarativ verstanden werden kann: 144. Schließt Du *(wohl) das Fenster! Eine der vielleicht interessantesten Eigenschaften von Modalpartikeln ist, dass sie in gewisser Weise eine modalisierende oder unterordnende Funktion zu haben scheinen. Möchte man die Bedeutung einer Partikel charakterisieren, so muss man üblicherweise den Satz, der die Modalpartikel enthält, subordinieren: 145. Peter ist wohl zuhause. ≈ Sprecher vermutet, dass Peter zuhause ist. (Bsp. Zimmermann 2004: 262) Genau wie subordinierende Elemente sind auch Modalpartikeln strikt auf das Vorhandensein eines propositionalen Vorkontextes angewiesen – auch wenn dieser natürlich in jeweils völlig verschiedener Weise syntaktisch angebunden ist:
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
141
146. a) Vorgänger 1: Ist Deutsch schwer? Dann: #Deutsch ist halt schwer. b) Vorgänger 2: Ich lerne Deutsch bestimmt nie! Dann: Deutsch ist halt schwer. Damit könnte man argumentieren, dass Modalpartikeln die Einbettung der vPProposition in Kontexte leisten – und damit den Modalpartikeln wiederum just die Aufgabe zusprechen, die andernorts gerne C-Elementen unterstellt wird (vgl. z.B. Rizzi 1997). Eine weitere Parallele zu den C-Elementen ergibt sich für die Betonung von Modalpartikeln: Nimmt man mit Coniglio an, dass Modalpartikeln in gewissen Fällen betont werden können, so scheinen sie ähnlich auf die Betonung zu reagieren wie C-Elemente. Betont man im Deutschen das Element, welches die C-Position einnimmt, so entsteht der semantische Effekt, dass die Wahrheit des Satzes betont wird (zum Verumeffekt vgl. schon Höhle 1992, jüngst auch Stommel 2011): 147. A: Peter hat das Buch nicht gelesen. B: Peter HAT das Buch gelesen.
(Betont: V in C)
148. Ich weiß nicht, wann Peter ein Buch schreibt, aber ich weiß, DASS er eines schreibt. (Betont: C in C) Manche Modalpartikel erzeugen nun aber ganz ähnliche Effekte (Bsp. Coniglio 2006: 64f.): 149. a) Sei JA vorsichtig! b) Würde er die Wahrheit nur JA bekennen! c) Ich verstehe SCHON, dass Du das nicht sagen darfst. Betont wird in keinem dieser Fälle die C-Position – dennoch entsteht ein zumindest Verum-ähnlicher Effekt. Das Gleiche gilt auch besonders auffällig für die Partikel wohl und (zumindest in manchen Dialekten des Deutschen) die Partikel ja: 150. A: Peter hat das Buch nicht gelesen. B: Peter hat das Buch WOHL gelesen. B‘: %Peter hat das Buch JA gelesen.
142
Mögliche technische Probleme der Analyse
Man vergleiche diese Situation mit normalem Informationsfokus, z.B. auf einem Argument: Hier wird das am tiefsten eingebettete Argument betont, welches fokussiert werden kann. Wird in den gerade diskutierten Beispielen auch dasjenige C-Element verumbetont, welches in der funktionalen Kaskade am tiefsten eingebettet ist? Wie es scheint, ist es durchaus möglich, Modalpartikeln im Deutschen auf überzeugende Art und Weise als C-Elemente zu charakterisieren. Bewiesen ist diese Analyse damit aber noch nicht. Kann gezeigt werden, dass diese Repräsentation bessere Vorhersagen zu den bekannten Distributionsfakten der Modalpartikeln im Deutschen macht als die konkurrierende Darstellung, die Modalpartikeln als Adv-Phrasen darstellen möchte?
8.4.2.3.4. Vergleich der Analysen: Modalpartikeln als C oder AdvP Die Vertreter einer Analyse von Modalpartikeln als Adv-Phrasen scheinen mir allesamt Vertreter eines kartografischen Ansatzes zu sein. In dieser Art von Ansätzen wird angestrebt, sämtliche Positionen, die bestimmte Elemente einnehmen können, in einer Art strukturellen ‚Gesamtkarte‘ zusammenzustellen. Kennzeichnend ist, dass die Stellungsoptionen von Elementen (z.B. Topiks, Kontrast- und Informationsfoki, Subjekten, Objekten, etc.) dadurch erklärt werden, dass diese in die Spezifikatorpositionen entsprechender funktionaler Projektionen (TopP, KontrastFokP, InformationsfokP, AgrSP, AgrOP usw) bewegt werden. Analog dazu nimmt diese linguistische Schule auch an, dass sich die möglichen Abfolgen von Adverbialphrasen im Satz empirisch zusammentragen lassen, um dann weitere Projektionen anzusetzen, die die Adv-Phrasen in ihren Spezifikatoren enthalten (vgl. z.B. Cinque 1999 zu den Adverbklassen des Italienischen). Fügt man alle Projektionen zusammen, so soll sich eine (sogar universalgrammatische) Gesamthierarchie funktionaler Projektionen ergeben. Empirisch stellen sich diesem Ansatz oft Schwierigkeiten in den Weg: Typologisch entlegene Sprachen wie das Deutsche entsprechen dem Italienischen nämlich oft nicht bis ins Detail. Wie Frey & Pittner (1998) zeigen können, haben zwar auch die Adverbien im Deutschen eine Grundabfolge. Diese Grundabfolge folgt jedoch in auffälliger Weise nicht den kartografisch angesetzten Gesetzmäßigkeiten: – Die Grundabfolge der Adverbien lässt sich im Deutschen anhand einer viel geringeren Zahl von Adverbklassen zutreffend beschreiben. Die Vielzahl von funktionalen Projektionen, die für das Italienische angeblich nötig sind, scheinen im Deutschen keine Funktion zu haben, da die Adverbklassen des Deutschen denen des Italienischen nicht entsprechen.
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
–
143
Die Gesamtzahl der potentiellen Adverbpositionen erscheint im Deutschen ungeheuer groß: Die Grundabfolge der Adverbien lässt sich hier nämlich weitreichend permutieren. Insofern diese Umstellung phonologische und semantische Effekte miteinander verbindet, scheinen sich Adverbien im Deutschen syntaktisch zu bewegen.
Trotz dieser Schwierigkeiten nehmen z.B. Cardinaletti (2007) und Coniglio (2006, 2007) an, dass die Adverbien des Deutschen sich letztlich genauso verhalten wie die Adverbien des Italienischen. Dazu versuchen sie zu zeigen, dass die CinqueHierarchie sich auf die Abfolge von Modalpartikeln und Adverbien im Deutschen übertragen lässt. Da nun aber die Cinque-Hierarchie eine rigide Wortstellung für Adverbien vorhersagt, die Modalpartikeln und Adverbien im Deutschen aber ihre relative Reihenfolge ändern können, schließen die genannten Autoren, dass sich die Modalpartikeln des Deutschen um die fest (also Cinque-konform) angeordneten Adverbien des Deutschen herumbewegen. Ich halte dieses Vorgehen für theoretisch unlogisch und empirisch völlig aussichtslos: Frey & Pittner demonstrieren in ihrer Darstellung der Adverbien, wie sich die Skopusambiguität bzw. -eindeutigkeit der Adverbien völlig parallel zu den Skopusfakten bezüglich quantifizierter Argumente darstellen lassen (1998). Wie es scheint, verfährt das Deutsche hier mit allergrößter Systematizität auch über Kategoriengrenzen hinweg. Gleichzeitig zeigen Frey & Pittner anhand klassischer Konstituententests auch, dass sich syntaktisch nur fünf Unterklassen von Adverbien unterscheiden lassen (1998: 528): 151. ... [TP Subjekt [T‘ [TopicP umgestellte Argumente [(Frame- und Bereichsadverbiale) [(Satzadverbiale)[(ereignisbezogene Adverbiale) [vP Subjekt [(ereignisinterne Adverbiale)... [v‘ [VP Objekte [V‘ (prozessbezogene Adverbiale) [V‘ Prädikatskomplex]]]]]]]]]] T0 ]] Diese Übersicht unterscheidet sich nicht nur in quantitativer Hinsicht vom Italienischen (wo wesentlich mehr Adverbpositionen angesetzt werden): Kommen zwei Adverbien nämlich aus derselben Unterklasse, so ist ihre relative Reihenfolge sogar frei. Dies ist nun aber auch in qualitativer Hinsicht von Cinques Vorhersagen verschieden, da dort davon ausgegangen wird, dass sich letztlich alle Adverbklassen in eine feste Hierarchie bringen lassen. Diese Darstellung ist nicht nur für das Deutsche plausibel: Wie z.B. Neeleman & Reinhart (1998) zeigen, ist auch für das Niederländische die Annahme plausibel, dass sich Adverbien auch in dieser Sprache syntaktisch recht frei positionieren.
144
Mögliche technische Probleme der Analyse
Im Dänischen können, ganz parallel zum Deutschen, Modalpartikeln ihre relative Reihenfolge nicht verändern (was gegen die kartografische Annahme spricht, dass sich Modalpartikeln bewegen können). Sie können aber ihre relative Abfolge gegenüber Adverbien verändern – was gegen die kartografische Annahme spricht, dass die Adverbien stellungsfest sein sollen (Bsp. Anne Kjeldahl, p.c.): 152. at han (i morges) da vel nok (i morges) bare sov længe ... dass er (am Morgen) Part Part Part (am Morgen) Part schlief lang ... ...(i morges) ...(am Morgen) ‚Dass er am Morgen lang schlief‘ 153. at han (formentlig) da vel (formentlig) nok (formentlig)... dass er (wahrscheinlich) Part Part (wahrsch.) Part (wahrsch.) bare sov længe Part schlief lang ‚Dass er wahrscheinlich lange schlief‘ Mit anderen Worten: Es sieht so aus, als ob Adverbien in den germanischen Sprachen oft sehr frei positionierbar sind. Die Modalpartikeln des Deutschen hingegen zeigen durch ihre Abfolgerestriktionen, dass sie sich zumindest nicht übereinander hinweg bewegen können – und theoretisch sollten sie dies auch gar nicht tun: Bewegungen von Elementen sollten ja, wie oben bereits hinlänglich diskutiert, per EoO motiviert sein. Welche Motivation aber könnte eine Modalpartikel haben, sich zu bewegen? Der semantische Bezug (etwa im Sinne eines Skopus) fällt als Motivitation aus, denn er scheint überhaupt nicht strukturell eingeschränkt zu sein (Bsp. Zimmermann 2004: 266): 154. Maria vermutet, dass Hein wohl auf See ist. Die Partikel wohl (im Nebensatz) drückt hier die Unsicherheit von Maria aus – die aber strukturell als Subjekt in einem übergeordneten Satz fungiert! EoOs im Sinne von syntaktischen Skopoi fallen damit für die Bewegung von Modalpartikeln aus. Wie eingangs gesehen scheinen Modalpartikeln aber auch keinerlei Kongruenzrelationen einzugehen – eine Bewegung analog zu kasusgesteuerten A-Bewegungen wäre damit selbst dann unplausibel, wenn die Theorie diese Möglichkeit
Sagt die Analyse Anti-Locality-Effekte für die Bewegung der vP voraus?
145
überhaupt noch vorsähe. Dennoch kann das Adverb (!) seine Position bezüglich der Partikel auch im gegebenen Beispiel problemlos ändern: 155. Maria vermutet, dass Hein (heute) wohl (heute) auf See ist. Ein Auslöser für die Bewegung der Partikel scheint mir hier nicht vorzuliegen. Dasselbe gilt in Matrixsätzen: Wenn kein übergeordnetes Subjekt verfügbar ist, wird die Unsicherheit, die die Partikel wohl ausdrücken kann, dem Sprecher unterstellt: 156. (# Ich weiß, wo Hein ist.) Hein ist wohl auf See. (Bsp. Zimmermann 2004: 258) In diesem Satz ist syntaktisch überhaupt kein Bezugselement erkennbar, bezüglich dessen sich die Modalpartikeln neu positionieren könnte. Ein Adverb kann sich aber auch in diesem Satz sowohl links wie rechts der Partikel plazieren: 157. a) Hein ist heute wohl auf See. b) Hein ist wohl heute auf See. Dass Adverbien im Deutschen keine feste Reihenfolge unterstellt werden kann, wird zusätzlich dadurch unterstrichen, dass mehrere Adverbien sich in verschiedenen Reihenfolgen anordnen lassen – etwa um verschiedene Fokussierungen zu ermöglichen: 158. a) Hein wäre wohl heute GERNe auf See. b) Hein wäre wohl gerne HEUTe auf See. Die Vertreter kartografischer Ansätze versuchen nun, die Beweglichkeit der Adverbiale in Frage zu stellen. Das ist theoretisch folgerichtig, erweist sich aber bereits bei oberflächlichster Betrachtung der Faktenlage im Deutschen als empirisch unhaltbar. Cardinaletti etwa unterstellt, dass die PP im folgenden Beispiel sich nicht über die Modalpartikel hinwegbewegen kann (2007: 91): 159. Er ist ja nach Mailand gefahren/ *nach Mailand ja gefahren. Wie sich aber leicht zeigen lässt, ist diese Behauptung schlicht falsch: Wird rechts der Modalpartikel ein plausibler Fokus angeboten und ist die PP Gegeben, so kann sie sich ohne Probleme über die Modalpartikel hinwegbewegen:
146
Mögliche technische Probleme der Analyse
160. Er muss nicht selbst nach Mailand fahren,... a) ... weil er nach Mailand ja seinen BRUDer schicken kann. b) ... weil nach Mailand ja sein BRUDer fahren kann. c) ... weil er nach Mailand ja schon LETZTes Jahr gefahren ist. Wie es scheint haben Adverbiale also als Gegebene Elemente auch die Möglichkeit, genau wie Argumente ins linke Mittelfeld zu gelangen – nichts vergleichbares steht aber den Modalpartikeln offen, die (da sie ohne lexikalische Semantik zumindest im Sinne von file card-Analysen referenzlos sind) überhaupt nicht erst Gegeben sein können! Auch skopale Bewegungen sind für Adverbien überhaupt kein Problem, wie Frey & Pittner zeigen können (1998: 512): 161. a) WEIL an mindestens einem Abend mit fast jedem Computer gearbeitet wurde (∃∀) b) WEIL mit mindestens einem Computer an fast jedem Abend gearbeitet wurde (∃∀, ∀∃)
Eine Übertragung der italienischen Satzkartographie auf deutsche Adverbklassen und Modalpartikeln ist, zusammenfassend, empirisch aussichtslos. Im Rahmen der hier gewählten Theorie hingegen gibt es plausible Gründe dafür, dass sich Adverbien (entgegen kartografischer Annahmen) bewegen können sollten. Im gleichen Rahmen aber sollten Modalpartikeln sich als stellungsfest erweisen. Die diskutierten empirischen Daten unterstützen die theoretische Vorhersage ohne jede Einschränkung. Wir haben damit gesehen, dass Modalpartikeln: – als funktionale Elemente zu verstehen sind, – die eine feste Position in der Mitte des Mittelfeldes einnehmen, – die als Kopfposition verstanden werden kann, – welche tiefer als T angesiedelt ist und – welche eine vollständige Proposition als Komplement nimmt. Damit tritt die Projektion der Modalpartikeln zwischen die TP und die vP: 162. [CP ... C [TP ... [PartP ...Part [vP ...] T]] Da Modalpartikeln den Grundpositionen aller Adverbien vorangehen, können die von Frey & Pittner (1998) vorgeschlagenen Adverbpositionen unterhalb der PartP problemlos repliziert werden. Für weitere technische Aspekte der Analyse (etwa zur Verbindung der Satztypmerkmale von C und Part, zur Lizensierung verschiedener Partikeln in verschiede-
Kompatibilität zu alten Annahmen: Ist die Analyse LCA-konform?
147
nen Satztypen usw.) sei der Leser auf Struckmeier (im Erscheinen) verwiesen: Die dort geführte Argumentation spielt im aktuellen Kontext aber letztlich keine Rolle und sei daher hier nicht weiter referiert. Mit Blick auf die Anforderungen an eine zwischen T und vP intervenierende Kategorie kann aber gelten, dass die Modalpartikeln des Deutschen alle benötigten Eigenschaften aufweisen: Sie treten mit ihrer Projektion zwischen die vP und die TP (in deren Spezifikator sich die vP bewegt). Eine potentielle Verletzung von Antilokalitätsbeschränkungen kann also umgangen werden: Die vP ist in dieser Darstellung nicht die direkte Schwester von T, da Modalpartikeln obligatorisch zwischen T und vP intervenieren. Ich gehe daher davon aus, dass diese Projektion selbst dann existiert, wenn keine overte Partikel im Satz auftritt: Da Part und C gemeinsam die Satztypeigenschaften der Gesamt-CP bestimmen, kann die phonologische Abwesenheit einer Part sehr wohl als Null-Partikel gewertet werden. Alternativ wäre es zudem problemlos möglich anzunehmen, dass auch andere C-Köpfe (wie Konjunktionen oder finite Verben) die Position zwischen T und vP per external merge füllen: Eine nachträgliche Kopfbewegung nach C wäre ja in jedem Fall problemlos technisch möglich. Es kann also unter dieser Analyse von Modalpartikeln gezeigt werden, dass die Antilokalitätsrestriktionen Grohmanns kein unüberwindliches Hindernis für die Annahme einer vP-TP-Bewegung sind: Analysen, in denen Grohmanns Antilokalitätskonfiguration nicht vorliegen sind, wie soeben gesehen, sehr leicht vorstellbar. Die weitere Forschung wird erweisen, inwieweit Analysen des vorgeschlagenen Typs empirisch zutreffend und theoretisch attraktiv sind – und inwieweit die Generalisierung Grohmanns empirisch zutreffend und theoretisch attraktiv ist.
8.5 Kompatibilität zu alten Annahmen: Ist die Analyse LCA-konform? Mit Kayne (1994) liegt eine enorm einflussreiche Analyse der Phrasenstrukturbildung menschlicher Sprachen vor: (Strukturelle) C-Kommandorelationen werden, dieser Hypothese nach, vom linear correspondence axiom (LCA) direkt auf (lineare) Präzedenzrelationen abgebildet, wobei alle Sprachen als homogen rechtsverzweigend und asymmetrisch dargestellt werden. Universell gehen daher Spezifikatoren, der Hypothese nach, dem Kopf einer Phrase voran (da der Spezifikator den Kopf asymmetrisch c-kommandiert) und der Kopf geht seinem Komplement voran (da der Kopf das im Komplement enthaltene Material asymmetrisch c-kommandiert). Die hier vorgeschlagene Analyse ignoriert diese Restriktion offensichtlich, indem sie z.B. eine rechtsköpfige T-Projektion annimmt. Es soll
148
Mögliche technische Probleme der Analyse
nachfolgend daher kurz gezeigt werden, dass dies zum einen in voller Absicht – und in Kenntnis der Kayne‘schen Hypothese – geschieht (8.5.1.). Zum anderen aber ist auch eine LCA-kompatible Version der Analyse – auch wenn ich sie hier nicht weiter verfolge – durchaus vorstellbar (8.5.2.). Unter antisymmetrischen Grundannahmen ließen sich darüber hinaus weitere Auslöser für die vP-Bewegung (die ohne ein EPP von T auskommen) herleiten (8.5.3.).
8.5.1 Das LCA ist theoretisch obsolet und empirisch fragwürdig Die vorliegende Analyse verletzt die Maßgabe des LCA, nur uniform rechtsverzweigende phrasale Strukturen zuzulassen, in einigen Punkten klar und deutlich. Ich halte dieses Vorgehen gleich aus mehrfacher Hinsicht für gerechtfertigt: – Zum einen muss die Annahme Kaynes, dass bereits in der core syntax lineare Relationen existieren, als theoretisch obsolet gelten: Da die semantische Komponente keinerlei Verwendung für Relationen dieser Art hat (alle satzsemantischen Eigenschaften werden in diesem Modell aus hierarchischen, nicht linearen Relationen berechnet) wird die Linearisierung einer syntaktischen Struktur weithin als Aufgabe der PF betrachtet (vgl. z.B. schon Chomsky 1995 et seq., ähnlich auch Richards 2004, López 2009). – Zum anderen erweisen sich die syntaktischen Annahmen Kaynes – wenn man sie in ihrer definitorischen Grundlage ernst nimmt – als wesentlich zu restriktiv: Adjunktionsstrukturen im Polnischen (vgl. Borsley 1997, 2001), und Deutschen (Struckmeier 2012) verletzen Kaynes Antisymmetriehypothese absolut systematisch. Die dabei beobachtbaren Eigenschaften zeigen ebenfalls allesamt auf eine Analyse, die den Stipulationen Kaynes diametral entgegensteht. Selbst das Englische und das Französische, anhand der Kayne seine Hypothese ursprünglich zu belegen versucht, weisen bei genauerem Hinsehen sehr wohl Eigenschaften auf, die dem LCA in Teilen klar widersprechen (vgl. schon Carlson 1977 sowie Aoun & Li 2003, Sauerland 2003, Struckmeier 2012). Empirisch ist das LCA damit praktisch nicht haltbar. – Versuche, das LCA durch zusätzliche Stipulationen mit den empirischen Daten kompatibler zu machen, helfen der Hypothese nicht: Durch diese (theoretisch in jedem einzelnen Fall nachweisbar problematischen) Zusatzannahmen wird das LCA gerade der Vorhersagen beraubt, die es empirisch interessant gemacht haben. Anders ausgedrückt: Wenn das LCA keinerlei empirische Vorhersagen mehr macht, ist es als wissenschaftliche Hypothese unnötig. Schlimmer noch: Wenn sich das LCA gegen jede Möglichkeit der Falsifikation immunisiert, ist es als wissenschaftliche Aussage inakzeptabel.
Kompatibilität zu alten Annahmen: Ist die Analyse LCA-konform?
149
Dennoch, könnte man argumentieren, hätte eine Analyse, die die hier vorgeschlagene vP-TP-Bewegung in einem LCA-kompatiblen Rahmen einsetzt, durchaus ihren Reiz: Unter einer solchen Analyse würden nämlich die typologischen Unterschiede zwischen etwa dem Englischen (mit seinen weitgehend rechtsverzweigenden Strukturen) und dem Deutschen (welches bisher kaum LCA-kompatibel erscheint) zumindest etwas nivelliert – angesichts der engen historischen Verwandtschaft der Sprachen vielleicht kein unattraktives Ergebnis. Im folgenden Unterkapitel soll daher kurz skizziert werden, wie eine LCA-kompatible Analyse von Scrambling per vP-TP-Bewegung aussehen könnte.
8.5.2 Skizze einer LCA-kompatiblen Satzstruktur mit vP-TP-Bewegung Die Satzstruktur des Deutschen wird, gängigen Annahmen nach, als LCA-inkompatibel dargestellt: 163. [CP (XP) Vfin [TP ... [vP ...] T0]] Der für die LCA-Diskusion relevante Punkt ist die Position des T-Kopfes: Wenn das LCA auch für das Deutsche zutreffen sollte, so müsste dieser Kopf – da er die Bestandteile der vP asymmetrisch c-kommandiert – der vP linear vorangehen: 164. [CP (XP) Vfin [TP ... T0 [vP ...]]] Damit würde nun aber die Vorhersage gemacht, dass das finite Verb (z.B. eines Nebensatzes) auch in der Mitte des Mittelfeldes auftreten können sollte: 165. [CP dass [TP Peter... schlägtT [vP den Mann...]]] Diese – inkorrekte – Vorhersage kann unter der Annahme einer vP-TP-Bewegung jedoch umgangen werden: Biberauer (2003) nimmt an, dass gerade die Bewegung der vP nach SpecTP ursächlich ist für die Verbletzt-Stellung im deutschen Nebensatz: 166. [CP dass [TP [vP Peter den Mann...]... schlägtT [vP Peter den Mann...]]] Bedingung für diese Analyse ist aber, dass sämtliches vP-internes Material (mit der Ausnahme des finiten Verbs) in der SpecTP-Position ausbuchstabiert wird: Andernfalls müssten vP-interne Argumente auch in einer Nachfeld-Position auftreten können (was für DPen bekanntlich nicht ohne weiteres zutrifft). Durch
150
Mögliche technische Probleme der Analyse
diese Spellout-Anforderung wird die in der vorliegenden Arbeit vorgeschlagene Möglichkeit, dass die PF Einfluss auf die lineare Position vP-interner Argumente nehmen kann, also unmöglich. Wie aber leicht zu sehen ist, ist dies nur unter der Annahme ein Problem, dass oberhalb der TP keine weiteren Projektionen verfügbar sind, in die sich die vP bewegen könnte: Für diese höheren Positionen wären flexiblere Spellout-Mechanismen u.U. wieder denkbar, ohne dass dies der Felderstruktur des Deutschen widerspräche. Angenommen etwa, die Partikeln erweisen sich als weitere Zielpositionen, die vP ansteuern kann: 167. [CP dass [PartP [vP Peter den Mann...] wohl [TP [vP Peter den Mann...]... schlägtT [vP...]]] Mit dieser Struktur liegt nun wiederum die gleiche Konstellation vor, die auch für eine Distributed Deletion-Analyse verwendbar wäre: Die Bewegung der vP von SpecTP nach SpecPart P verletzt keine Antilokalitätsbeschränkungen und ist, im Sinne einer sukzessiv-zyklischen Bewegung, auch anderweitig nicht theoretisch auffällig. In diesem Sinne könnte die vP-TP-Analyse von Scrambling also auch LCA-konform implementiert werden. Eine interessante Eigenschaft dieser Analyse ist, dass die erste Bewegung der vP aber eine antilokal auffällige Bewegung ist: die vP bewegt sich ja von der Komplementposition des T-Kopfes in die Spezifikatorposition desselben T-Kopfes! Folgt man den Annahmen Grohmanns (2003, 2011), so sollte diese Bewegung ähnliche Effekte hervorrufen wie etwa die von ihm diskutierten Linksversetzungsstrukturen. Spannenderweise ähneln sich in diesem Sinne nun auch tatsächlich Links- und Rechtversetzungsstrukturen im Deutschen zumindest abstrakt. Im Kernbereich des topologischen Feldermodells (genauer: innerhalb der Projektionen CP, TP und vP) wird ein linksversetztes Element durch eine pronominale Form ersetzt (vgl. z.B. Grohmann 2011: 282): 168. [Seinen Vater [CP Seinen Vater➲den mag [TP jeder ...]]] In einer Rechtsversetzungsstruktur könnte nun etwas ganz ähnliches geschehen, wenn die LCA-konforme Analyse der vP-TP-Bewegung gewählt wird: 169. [CP dass [vP Peter den Mann schlägt] [TP [vP Peter den Mann➲den schlägt] schlägtT [vP Peter den Mann schlägt]]] = dass Peter den schlägt, den Mann
Kompatibilität zu zukünftigen theoretischen Entwicklungen
151
Mir ist unklar, inwieweit diese Skizze einer Analyse tatsächlich in der Lage ist, die empirischen Eigenschaften der Rechtsversetzung im Deutschen abzubilden: Diese empirischen Eigenschaften sind bisher in weiten Teilen unbekannt, und bedürfen daher weiterer Forschung (vgl. aber Dewald 2012). Festzuhalten ist aber, dass auch eine LCA-konforme Analyse von Scrambling als vP-TP-Bewegung technisch a priori völlig unproblematisch ist. Mit dieser Analyse wäre zudem ein weiteres Problem lösbar, welches ein wenig abseits des erklärten Ziels der Arbeit liegt, hier aber nicht unerwähnt bleiben soll: Die Annahme einer vP-Bewegung nach SpecTP ist in der Lage, Scrambling in den Fällen zu beschreiben und zu erklären, in denen Scrambling das linke Mittelfeld (im Sinne der Arbeit) avisiert. Andererseits aber lässt sich leicht zeigen, dass sich asemantische Umstellungen auch innerhalb des rechten Mittelfeldes vollziehen können (wie z.B. in: Gestern hat der Mann wohl das Geld den KINdern gegeben). Die o.a. Kayne-konforme Analyse nimmt an, dass die vP auch rechts einer Modalpartikel zweimal vorliegen kann (in ihrer Basisposition und in der SpecTP-Position). Unter dieser Annahme stünden ausreichend viele Kopien von Argumenten auch rechts der Modalpartikel zur Verfügung, um auch asemantische Umstellungen im rechten Mittelfeld ableiten zu können. Aus dieser Annahme ergeben sich viele neue Möglichkeiten, Fragestellungen und Probleme, die aber im Folgenden nicht diskutiert werden können. Die alternativen Analysen bieten in jedem Fall die Möglichkeit zu vielen interessanten Folgeuntersuchungen.
8.6 Kompatibilität zu zukünftigen theoretischen Entwicklungen: vP-TP-Bewegung ohne SpecT? Mit der Abkehr von X-bar-Strukturen müssen, im derzeit diskutierten theoretischen Rahmen, auch die Bestandteile von Phrasenstrukturen genauestens geprüft werden: Inwieweit sind die Phrasenstrukturpositionen in der bare phrase structure überhaupt noch legitimiert? Ein fester Bestandteil von X-bar-Strukturen, der in der aktuellen bare phrase structure besonders stark im Verdacht steht, theoretisch problematisch zu sein, ist die Spezifikatorposition: In einem dynamischen, Merge-basierten Modell besteht a priori kein Grund mehr dafür, dass die Position, die durch die letzte Verkettung innerhalb einer phrasalen Struktur geschieht, irgendwelche besonderen Eigenschaften haben sollte. Die Annahme, dass Kongruenzrelationen etc. in SpecHead-Relationen abzulaufen haben, ist daher theoretisch weitestgehend überholt. Darüber hinaus wird aber auch derzeit immer häufiger erwogen, Spezifikatorpositionen generell (und die EPP-Merkmale, die sie erzwingen) kritisch zu
152
Kompatibilität zu zukünftigen theoretischen Entwicklungen
beleuchten. Die zukünftige Entwicklung in diesem Bereich lässt sich – natürlich – nicht voraussehen. Dennoch soll in diesem Unterkapitel kurz erörtert werden, ob die vP-TP-Bewegung auch dann technisch umzusetzen ist, wenn die Position SpecT und das ihr unterstellte EPP-Merkmal nicht mehr angenommen werden. Wie sich zeigt, sind auch alternative Auslöser für eine vP-TP-Bewegung leicht zu finden. Wenn Bewegungen zukünftig nicht durch merkmalsgetriebene Spec-Bewegungen dargestellt werden sollen, so müssen sie auf der Basis von allgemeinen Strukturkonstellationen operieren: Um eine bestimmte Konfiguration von Elementen zu vermeiden, muss eine Bewegung an die Wurzel der syntaktischen Baumstruktur applizieren (wenngleich nun ohne auslösende Zielposition ohne Spezifikatorposition und ohne SpecHead-Merkmalsabgleich). Welche strukturelle Konfiguration könnte für die vP-Bewegung einschlägig sein? Wie nachfolgend (notwendigerweise skizzenhaft) gezeigt wird, ist der sogenannte Final-over-final Constraint (FOFC) eine mögliche Ursache für vP-Bewegungen. Mit der Annahme des FOFC (vgl. Biberauer 2010a, Biberauer et al 2010b, Biberauer & Sheehan 2010) wird im Rahmen der generativen Grammatik eine sprachübergreifend valide Beobachtung repräsentiert, die die möglichen Wortstellungsmuster in den Sprachen der Welt zu beschreiben hilft. Der FOFC besagt sinngemäß: Wenn im Rahmen einer Struktur ein finaler Kopf verkettet wird, so können unterhalb dieses Kopfes eingebettete Strukturen nicht kopfinitial sein. Ein finaler Kopf bettet einfach gesagt also nur noch kopffinale Phrasen unter sich ein (während für initial auftretende Köpfe keine vergleichbare Restriktion bezüglich ihrer Komplemente besteht). Beispiele für diese abstrakte (und überraschende!) Gesetzmäßigkeit sind empirisch tatsächlich zu finden: Postpositionen etwa betten typischerweise keine kopfinitialen DPen ein, und die kopffinale TP im Deutschen bettet vielleicht nicht zufällig eine ebenfalls kopffinale vP und eine kopffinale VP ein, während das Englisch uniform kopfinitial ist: 170: Englisch: Deutsch:
[CP ...Cinitial [TP .... Tinitial [...vinitial [VP Vinitial (Obj)]]]] [CP ...Cinitial [TP .... [[VP (Obj) Vfinal] vfinal] Tfinal]]
Offenbar nicht attestiert: [CP ...Cinitial [TP .... [[VP Vinitial (Obj)] vfinal] Tfinal]] Beobachtungen über Zusammenhänge dieser Art sind typologisch gut belegt (vgl. die oben zitierten Arbeiten zum FOFC) und gehen letztlich bis auf Greenbergs Wortstellungsuniversalien zurück (vgl. Greenberg 1963). Einschränkungen des FOFC bestehen bezüglich der strukturellen Erstreckung der Restriktion. Da diese jedoch hier nicht relevant sind, sei der Leser hierzu verwiesen auf die o.a. Literatur. Auffällig ist aber, dass gerade Partikeln sich ganz generell der Generalisie-
Kompatibilität zu zukünftigen theoretischen Entwicklungen
153
rung zu widersetzen scheinen: Sie verletzen in den Sprachen der Welt auffallend häufig den FOFC – und so auch im Deutschen, nach den hier gemachten Annahmen. Die TP ist, der vorgeschlagenen Analyse zufolge, kopffinal, aber die in ihr eingebettete PartP ist kopfinitial: 171. [TP ... [PartP Part [vP ...]] T] Nun ist es durch die copy theory of movement aber nicht in jedem Fall mehr möglich, darüber zu sprechen, wann ein Kopf tatsächlich ‚final‘ oder ‚initial‘ ist: Wenn sich ein Element X über ein anderes Element Y hinwegbewegt, so ist X durch diese Bewegung nämlich nicht – wie vielleicht zu erwarten, wenn man die Metapher der ‚Bewegung‘ zu wörtlich nimmt – nun auf der ‚anderen Seite‘ von Y. Vielmehr muss gelten, dass X nun zu einem syntaktischen Objekt geworden ist, dessen lineare Position (und strukturelle Konfiguration) vis-a-vis Y sich gar nicht mehr festlegen lässt: 172. [X [Y X]] Wie deutlich zu sehen, ist X hier sowohl ‚links von‘ oder ‚vor‘ Y, als auch ‚rechts von‘ oder ‚hinter‘ Y. Eine Kopie von X ist strukturell ‚höher‘ als Y, eine andere Kopie ist strukturell ‚niedriger‘. Durch Bewegungen werden syntaktische Objekte also zu diskontinuierlichen Objekten, die besondere lineare Eigenschaften haben, die sich nicht mehr ohne weiteres als Geht-voran (x, y) oder Folgt (y, x) beschreiben lassen. Die Folgen dieser Annahme (z.B. für die Berechnung der Linearisierung von bewegten Elementen auf PF) können hier nicht vollständig ausgeführt werden – zumal sie derzeit noch äußerst kontrovers diskutiert werden. Es ist in jedem Fall davon auszugehen, dass auch FOFC-Berechnungen sensitiv sind für Bewegungsoperationen (vgl. in diesem Sinne auch Biberauer & Sheehan 2010): Eine Partikel könnte nämlich dann keine FOFC-Verletzung auslösen, wenn ihr Komplement bewegt würde. Die entstehende Konfiguration wäre in diesem Fall: 173. [X ...[Partikel X]...] Damit ließe sich auch in einem System, welches keine Spezifikatorposition von T mit der Fähigkeit ausstattet, vP per EPP zu attrahieren, eine Bewegung der vP erzwingen: Da das Deutsche nämlich nun einmal über kopfinitiale Partikeln verfügt (wie oben gezeigt), die Partikelprojektion sich aber unterhalb der kopffinalen Projektion TP befindet, muss sich das Komplement der Partikel bewegen – und dieses Komplement ist, wie o.a., die vP! Damit ist unmittelbar ersichtlich,
154
Kompatibilität zu zukünftigen theoretischen Entwicklungen
warum sich die vP auch ohne ein EPP von T bewegen können sollte: T wird als kopffinales Element verkettet. Die Konfiguration mit einer kopfinitialen Partikel unterhalb von T ist nur dann FOFC-kompatibel, wenn die vP durch eine Bewegung zu einem diskontinuierlichen Element wird. Mit anderen Worten: Nur weil die Verkettung von Partikel und vP durch die Bewegung der vP gar nicht in das Linearisierungs-Schema des FOFC fallen, ist die Struktur (letztlich trivial) FOFCkompatibel. Sie erfüllt schlicht die Voraussetzungen für die Verletzung des FOFC nicht mehr, da die Partikelprojektion technisch weder kopfinitial noch kopffinal ist: 174. [TP vP [PartP Partikel vP] T] All diese Überlegungen sind notwendigerweise recht abstrakt und sehr hypothetisch: Wie genau sich die Theoriebildung an diesem Punkt in der Zukunft vollziehen wird, ist selbstverständlich zum derzeitigen Zeitpunkt unbekannt. Es ist dennoch absehbar, dass für eine große Vielzahl von bisher technisch möglichen Phrasenbewegungen ganz neue Erklärungen gefunden werden müssen: Die mithilfe dieser phrasalen Bewegungen repräsentierten Wortstellungsmuster bedürfen ja weiterhin einer Erklärung. Ich habe im letzten Abschnitt mit dem sich derzeitig erst teilweise abzusehenden Theoriestand dargelegt, dass auch im Rahmen denkbarer theoretischer Veränderungen eine Möglichkeit vorstellbar ist, vP-Bewegungen durchzuführen. Alles weitere muss die Zukunft zeigen. Abschließend aber gilt, dass die Bewegung der vP nicht zwingend durch eine besondere Eigenschaft von T oder durch eine besondere SpecHead-Relation ausgelöst werden muss: Andere technische Implementationen mit den gleichen empirischen Effekten sind in jedem Falle vorstellbar, wie gesehen etwa durch konfigurationelle Anforderungen wie den FOFC. Damit kann aber bereits jetzt gelten, dass die vorgeschlagene vP-TP-Bewegung nicht dadurch in Frage gestellt werden kann, dass sie auf der Basis der derzeit (noch) aktuellen Bewegungstheorie operiert: Die vorgeschlagene vP-TP-Bewegung ist technisch derzeit aktuell, und für zukünftige Entwicklungen – soweit man sie absehen kann – bereits jetzt gut gewappnet. Weitere einschlägige technische Restriktionen, die die Implementation von vPTP-Bewegungen betreffen, sind mir nicht bekannt. Abschließend können die genannten Einwände als theoretisch unproblematisch charakterisiert werden: Dort, wo die Analyse überhaupt fundierte Einwände zulässt, lässt sie sich ohne Aufwand an bestimmte theoretische Vorlieben und mögliche zukünftige Entwicklungen adaptieren. Einwände gegen die Analyse könnten daher – soweit ich sehe – letztlich nur empirisch motiviert werden. Dass die vorgeschlagene Analyse die Daten des Deutschen besser beschreibt als konkurrierende Analysen, wird im
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
155
letzten Teil der Arbeit, Teil III, ausgiebig demonstriert. Wie sich dort zeigt, sind die empirischen Vorhersagen der Analyse für Scrambling-Phänomene im Deutsche zutreffend. Ein letzter, empirisch begründbarer, aber letztlich a prioristischer Einwand soll jedoch noch in diesem Teil der Arbeit diskutiert werden: Wenn das Deutsche – völlig anders etwa als das Englische – eine Bewegung der gesamten vP vornimmt, wird das Deutsche dann nicht über die Maßen typologisch exotisiert? Lässt sich das Deutsche unter dieser Annahme vielleicht gar nicht mehr sinnvoll mit den anderen germanischen Sprachen vergleichen? Wie das folgende Unterkapitel 8.7. zeigt, sind typologische Probleme durch die Annahme einer vP-TP nicht zu erwarten.
8.7 Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert Man mag der vorliegenden Analyse vorwerfen, dass sie dem Deutschen innerhalb der germanischen Sprachen eine Sonderstellung zuschreibt: Das Deutsche bewegt eine vP nach SpecTP, während andere germanische Sprachen (z.B. das Englische) dies – zumindest in älteren Analysen – nicht tun. Wird demnach das Problem des Scrambling zwar einzelsprachlich gelöst, jedoch zu Ungunsten eines viel größeren Problems, welches die Analyse für den Bereich der sprachvergleichenden Untersuchungen aufwirft? Die folgenden Unterkapitel zeigen, dass dies nicht der Fall ist: Das Deutsche ist mitnichten die einzige Sprache, die eine flexible Besetzung der SpecTP-Position, oder die Bewegung ‚großer‘ phrasaler Bausteine für eine Analyse attraktiv erscheinen lässt. Die hier vorgeschlagene Analyse des Deutschen weist daher technische Ähnlichkeiten auf zu Analysen, die (zum Teil aus völlig verschiedenen Gründen) ähnliche theoretische Annahmen machen (8.7.1.). Zudem existieren auch empirische Übereinstimmungen mit anderen germanischen Sprachen, durch die die vorgeschlagene Analyse das Deutsche letztlich als einen nicht untypischen Vertreter der germanischen Sprachen ausweist (8.7.2.). Zuguterletzt wird mit der Annahme einer vP-TP-Bewegung auch dort dem sprachvergleichenden Anliegen Genüge getan, wo das Deutsche tatsächlich empirisch von anderen germanischen Sprachen abweicht: Es besteht die Möglichkeit, vermittels der Parametrisierung der vP-TP-Bewegung typologische Unterschiede theoretisch zu repräsentieren, die im Sprachvergleich erkannt worden sind (8.7.3.).
156
Kompatibilität zu zukünftigen theoretischen Entwicklungen
8.7.1 Ähnliche Analysen verwenden ähnliche Techniken Ein denkbarer Einwand gegen die vorgeschlagene Theorie könnte dahingehend argumentieren, dass das Deutsche die einzige Sprache wäre, die durch die vP-TPBewegung mit einer Art Ausnahmelizenz ausgestattet würde, Phrasen von der Größe einer vP zu bewegen. Analysen z.B. des Englischen zeigen vielfach keine entsprechenden Bewegungen ‚großer‘ Kategorien. Der Vorwurf könnte dann entsprechend lauten, dass die vorgeschlagene Analyse den Sprachvergleich erschwert: Warum sollten einige Sprachen eine unveränderliche Besetzung der SpecTP vorschreiben (Englisch), andere hingegen nicht (Deutsch)? Warum sollte das Deutsche – anders als seine nahen Verwandten – ‚große‘ Phrasen in die funktionale Kaskade hineinbewegen dürfen? Können die Implikationen dieser (zumal kernsyntaktischen!) Variation überhaupt theoretisch kontrolliert werden? Der Vorwurf erscheint mir in mehrfacher Hinsicht unbegründet, denn: – Das Deutsche zeigt in anderen Kontexten ohnehin, dass es in der Lage ist, Phrasen zu bewegen, die bedeutend größer sind als etwa nur einzelne Argumentphrasen: vPen bewegen sich (wie schon o.a.) zum einen ganz offensichtlich auch ins Vorfeld des deutschen Satzes (a). Zum anderen sind auch Objektssätze und andere CPen problemlos zu bewegen (b). Ein genereller Einwand gegen solche Bewegungen kann daher empirisch für das Deutsche keinen Erfolg haben: 175. a) [vP Ein Außenseiter das Rennen gewonnen] hat hier noch nie. b) [CP Dass Peter Gitarre spielt] stört Karen. –
Auch für dem Deutschen verwandte Sprachen muss gelten, dass die Bewegung ‚großer‘ phrasaler Satzbestandteile nicht als ausgeschlossen gelten kann: Bentzen (2009, in Vorbereitung) etwa argumentiert, dass über ähnliche Annahmen auch Fälle von object shift und Subjektsbewegungen in einigen norwegischen Dialekten erklärt werden können. Und sogar das Englische bewegt zumindest Phrasen von der Größe einer VP (vgl. z.B. Adger 2003): 176. John promised to [VP read the book] – and [[VP read the book] he did [VP read the book]]
–
Zudem muss gelten, dass die Besetzung der SpecTP-Position (mit Expletiva, Argument-DP, etc.) in bisher kaum erklärter Art und Weise Einfluss zu nehmen scheint auf die Möglichkeit, object shift in den skandinavischen Sprachen durchzuführen und dass auch das Niederländische Restriktionen von Scrambling-Vorgängen in Teilen daraus ableitet, ob ein Mittelfeldexpleti-
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
–
157
vum die SpecTP-Position besetzt (vgl. Richards 2007). Wenn dem Deutschen also in der vorliegenden Analyse unterstellt wird, dass die Möglichkeiten der SpecTP-Besetzung für die Möglichkeit von (einer bestimmten Art von) Scrambling einschlägig ist, wird das Deutsche typologisch nicht exotisiert. Im Gegenteil wird das Deutsche in eine enge Relation mit eng verwandten Sprachen gebracht. Die selbstverständlich bestehenden typologischen Unterschiede zwischen den Sprachen (vgl. z.B. Lenerz 2005) werden dabei nicht ignoriert – im Gegenteil wird durch die Konzentration auf die Eigenschaften der SpecTP-Position ein Kristallisationspunkt geschaffen, der möglicherweise die Gemeinsamkeiten der und die Unterschiede zwischen den germanischen Sprachen zu erklären helfen mag. Interessant ist zudem, dass innerhalb der skandinavischen Sprachen Unterschiede im Verhalten bezüglich des object shift daran festgemacht wurden, inwiefern sich das Verb nach T bewegt (vgl. Vikner 1994 für einen Überblick): Da sich im Isländischen (im Gegensatz zum Festlandsskandinavischen) das Verb sowohl in Haupt- wie in Nebensätzen (nach T) bewegen kann, kann object shift in beiden Kontexten stattfinden (Diesing & Jelinek 1993: 22, Vikner 2006: 395). Da im Festlandsskandinavischen die Bewegung des Verbs in Nebensätzen unterbleibt, ist auch object shift nicht möglich (ebd.). Das heißt also, dass eine Verbindung zwischen der (Un-) Möglichkeit des object shift und der (Un-) Möglichkeit der Verbbewegung nach T0 besteht. Da mit dieser Kopfbewegung nach T wiederum eine Eigenschaft der T-Projektion zur typologisch einschlägigen Unterscheidung avanciert, verdichtet sich der Konnex bezüglich der variablen Binnenwortstellung in den germanischen Sprachen. Auch historisch lassen sich diese Annahmen unter Umständen auf interessante Weise auswerten: Das Mittelenglische etwa wies noch eine Verbbewegung nach T auf – und konnte ähnlich den skandinavischen Sprachen bestimmte Formen von object shift durchführen (vgl. Wallenberg 2008). Die weitere Forschung muss erweisen, inwiefern sich diese Überlegungen weiter substantiieren lassen. Zum zweiten wird auch die Besetzung der SpecTP längst nicht mehr so rigide gehandhabt, wie dies in frühen Versionen der Government and BindingTheorie noch en vogue gewesen sein mag: Biberauer (2003) und Biberauer & Richards (2006) formulieren ja gerade eine ganze Typologie von möglichen Besetzungen der SpecTP-Position in den germanischen Sprachen! Dies geschieht nota bene nicht mit dem Ziel, die besonderen Eigenschaften der SpecTP zu verwässern: Diese Ansätze verfolgen im Gegenteil das Ziel, das EPP von T zu retten – mit anderen Worten: Sie versuchen, die Annahme zu erhalten, dass eine Spezifikatorposition von T überhaupt sprachübergreifend existiert! Diese Annahme mag in älteren Theorieständen noch ganz einfach per Stipulation aufrecht zu erhalten gewesen sein – sie hat aber empirisch
158
–
Kompatibilität zu zukünftigen theoretischen Entwicklungen
sehr viel Kritik auf sich gezogen, und konnte daher in ihrer rigiden Frühform nicht aufrecht erhalten werden. Empirisch weisen Biberauer (2003) und Biberauer & Richards (2006) zudem nach, dass ihre Typologie der SpecTP-Besetzung für die germanischen Sprachen insgesamt nicht nur theoretisch interessante, sondern vor allen Dingen auch empirisch korrekte Vorhersagen macht. Auch andere Autoren haben mit ähnlichen Annahmen versucht, den Wortstellungsphänomenen verwandter Sprachen gerecht zu werden. So zeigt Diesing z.B., dass das Jiddische eine flexible Besetzung der SpecTP-Position (ihrer SpecIP-Position) erlaubt: SpecTP kann im Jiddischen als Topikalisierungsposition genutzt werden – und steht damit nicht nur dem Subjekt offen (1990). Für das Isländische argumentiert Ott, dass die Besetzung der SpecTP variabel ist (2009). Auch für andere indoeuropäische Sprachen sind flexiblere Besetzungen der SpecTP-Position vorgeschlagen worden: Zubizaretta etwa argumentiert, dass das Spanische eine „generalized TP“ aufweisen muss, die nicht (wie im Englischen) uniform nominativische Subjekte anhebt (1998: 99ff.). Auch für typologisch weniger enge Verwandte sind vergleichbare Annahmen gemacht worden, wie sie die vorliegende Analyse für das Deutsche ansetzt – etwa durch Carstens (2002) für das Ijọ und für das Japanische durch Miyagawa (2003). Für das Finnische schlagen Holmberg & Nikanne (2002) eine ähnliche Analyse vor. Aus einer LCA-kompatiblen Perspektive argumentiert Mahajan ebenfalls für die Möglichkeit einer vP-TP-Bewegung im Hindi (2003).
Es scheint mir daher kein Grund vorzuliegen, das Deutsche a priori von einer vergleichbaren Behandlung auszunehmen.
8.7.2 Blockhafte Syntax und PF-Einflüsse sind typische Eigenschaften germanischer Sprachen Analysen, die dem Deutsche verwandte Sprachen diskutieren, verwenden (wie im letzten Kapitel gesehen) oft auch der vP-TP-Bewegung ähnliche technische Implementationen. Nun könnte man einwenden, dass auch technisch einwandfreie Theorien dann fehl am Platze sind, wenn sie ein falsches (etwa irreleitendes oder einseitiges) Bild von der Empirie einer Sprache vermitteln oder aber einer Sprache unterstellen, dass sie letztlich ganz und gar anders operiere als z.B. eng verwandte Sprachen (vgl. z.B. Kayne 1994). Damit wird letztlich unterstellt, dass eine Analyse zwar synchron nicht widerlegt werden kann, dass sie aber, im Kontext historisch-vergleichender Untersuchungen, eine aufwändige Analyse sei. Sie ließe sich dann nicht recht in Einklang bringen mit der Vermutung, dass
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
159
eng verwandte Sprachen sich diachron nur in kleinen Schritten voneinander entfernen, sich in vielerlei Hinsicht andererseits aber oft noch immer ähneln. Im folgenden Unterkapitel soll gezeigt werden, dass die vorgeschlagene Analyse das Deutsche keineswegs zu einer Sprache macht, die es aus historisch-vergleichender Perspektive nicht sein sollte. Die empirischen Eigenschaften, die dem Deutschen unterstellt werden, binden das Deutsche im Gegensatz nahtlos in die germanischen Sprachen ein: Auch die anderen germanischen Sprachen zeigen (in Teilen) ähnliche empirische Eigenschaften. Es lässt sich damit insgesamt recht gut zeigen, dass die Analyse durch ihre technischen Annahmen kein historisch-vergleichendes Beschreibungsproblem generiert. Im Gegenteil kann gezeigt werden, dass die vorgeschlagene Analyse auch für andere germanische Sprachen recht attraktiv erscheint – auch wenn eine Übertragung auf diese anderen Sprachen im Kontext der vorliegenden Arbeit ausdrücklich nicht geleistet wird. Mit der Annahme einer vP-TP-Bewegung in der Syntax sowie der Distributed Deletion in der PF-Derivation werden letztlich zwei fundamentale Vorhersagen zum ‚Gesamterscheinungsbild‘ des Deutschen gemacht: – Durch die Annahme der vP-TP-Bewegung wird dem Deutschen eine gewisse ‚Blockhaftigkeit‘ unterstellt: Das deutsche Mittelfeld sollte geprägt sein von ‚parallelen‘ Bewegungen, in denen Argumente ihre relativen Reihenfolgen dann oft nicht ändern, wenn sie bestimmten syntaktischen Klassen angehören (hier: definite DPen) bzw. bestimmte, markierte IS-Eigenschaften (hier: kontrastives Topik) aufweisen. – Mit der ‚Blockhaftigkeit‘ einer Bewegung wird immer auch mit vorhergesagt, dass auch scheinbar ‚unbeteiligte‘ Elemente dislozieren: Elemente, die ganz offenbar selbst nicht Dreh- und Angelpunkt einer Disloka– tionsoperation sind (und z.T. gar nicht sein können) werden dennoch (mitgefangen) innerhalb der bewegten Phrase mitbewegt und enden dann (mitgehangen) scheinbar ohne Grund in einer höheren Position. – Wie nachfolgend gezeigt wird, sind ‚blockhafte‘ Bewegungen auch in anderen germanischen Sprachen weithin bekannt. Die Annahme einer vP-TP-Bewegung exotisiert also das Deutsche eindeutig nicht. Im Gegenteil wird sich die Generalisierung Putnams bestätigen: „West Germanic on the whole prefers the preservation of objects as they appear in the predicate (vP)“ (2007: 87). – Zum zweiten wird durch die Annahme von phonologischen Spellout-Lizenzen (im Rahmen der Distributed Deletion) ein Einfluss der Phonologie auf die Wortstellung einer Sprache prognostiziert – unabhängig von semantisch motivierten Bewegungen und über diese hinaus! Lassen sich demnach auch in verwandten Sprachen Wortstellungsvarianten finden, die ohne erkennbaren EoO applizieren, auf der anderen Seite aber leicht
160
Kompatibilität zu zukünftigen theoretischen Entwicklungen
phonologisch zu charakterisieren sind (z.B. durch ihre prosodischen Gemeinsamkeiten)? Tatsächlich sind solche Bewegungen in den germanischen Sprachen, wie nun gezeigt wird, sogar recht weit verbreitet. Die Annahme einer (in Teilen) PF-gesteuerten Bestimmung der Wortstellung exotisiert das Deutsche also eindeutig nicht – im Gegenteil scheinen die empirischen Daten darauf hinzudeuten, dass auch für andere germanische Sprachen PF-beeinflusste Analysen dringend benötigt werden.
8.7.2.1 Niederländisches Scrambling Auch das Niederländische weist eine bestimmte Form von Scrambling auf – und zwar in dem Sinne, dass Argumente offenbar nicht nur in einer vP-internen Position auftreten (a), sondern auch (b) bestimmten Adverbien vorangehen können (vgl. z.B. Neeleman & Reinhart 1998, de Hoop 2003 für einen Überblick über die verschiedenen Wortstellungsoptionen): 177. a) dat Jan niet de boeken koopt dass Jan nicht die Bücher kauft b) dat Jan de boeken niet koopt dass Jan die Bücher nicht kauft ‚dass Jan nicht die Bücher kauft‘
Subj Adv Obj Subj Obj Adv
Dieses Scrambling im Niederländischen ist aber, mehr noch als das Scrambling im Deutschen, von parallelen Bewegungsmustern geprägt: Tatsächlich dürfen DPen im Regelfall ihre Grundabfolge nicht durch Scrambling verändern: 178. *dat de boeken Jan niet koopt
*Obj Subj Adv
Ließe sich demnach auch hier eine ‚blockhafte‘ Bewegung – vielleicht als eine Option unter mehreren – denken? 179. a) = b) =
dat [Jan de boeken koopt] niet [Jan [de boeken koopt]] koopt dat Jan niet de boeken koopt dat [Jan de boeken koopt] niet [Jan [de boeken koopt]] koopt dat Jan de boeken niet koopt
Einschränkend muss gesagt werden, dass viele Sprecher distribuiert getilgte DPen und PPen im Niederländischen nicht akzeptieren (Joost Kremers, p.c.). Die PF-Abbildung der vP wäre daher u.U. wesentlich eingeschränkter als im Deutschen. Andererseits ist aber nicht gesagt, dass Distributed Deletion der vP oder
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
161
VP (also verbaler Projektionen im weiteren Sinne) in jeder Sprache genauso restringiert muss wie die Distributed Deletion von DPen oder PPen. Möglicherweise könnten Annahmen in dieser Richtung selbst dem Niederländischen zu bestimmten, restringierten Formen von Distributed Deletion verhelfen. Und auch dann, wenn man der vP nicht gestattet, distribuiert getilgt zu werden, könnte die PF (ähnlich wie im Vorschlag von Neeleman & Reinhart 1998) möglicherweise dennoch zwischen alternativen syntaktischen Derivationen auswählen, wenn bestimmte Annahmen zur Verbbewegung gelten. Auf die Basisprojektion (a) könnte in einem Fall eine (nicht-distribuiert getilgte) Verbbewegung (b) folgen und zuguterletzt (nicht-distribuiert getilgtes) remnant movement stattfinden (c): 180. a) [vP Jan [de boeken koopt] b) [vP Jan [de boeken koopt]] koopt c) [vP Jan [de boeken koopt]] niet [vP Jan [de boeken koopt]] koopt In anderen Derivationen könnte auch das Subjekt sich ähnlich dem Englischen bewegen: 181. a) Basisprojektion: [vP Jan [de boeken koopt]] b) V-Bewegung: [vP Jan [de boeken koopt]] koopt c) Subj-Bewegung: [TP Jan niet [vP Jan [de boeken koopt]]] koopt Eine Bewegung des Verbs ins linke Mittelfeld scheint im Niederländischen (anders als im Deutschen) offenbar nicht möglich (vgl. z.B. Haider 2006: 242). Angenommen also, das Verb würde sich, wie angezeigt, obligatorisch nach T (und d.h. aus der vP hinaus-) bewegen. Unter dieser (beileibe nicht exotischen) Annahme stünden damit im Niederländischen beide o.a. Derivationen parallel zur Verfügung. Die Analysen sind semantisch gleichwertig, weil die Bewegung des Objektes innerhalb der vP keine neuen Skopoi oder Bindungsoptionen für das Objekt erzeugen. Damit stünden der PF-Komponente zwei Wortfolgen zur Verfügung, die sich nun in verschiedenen prosodischen Kontexten verwenden ließen. Für die verschiedenen Wortstellungen im Niederländischen scheint generell zu gelten, dass semantische oder informationsstrukturelle Kriterien hierfür nicht immer direkt relevant zu sein scheinen: – Wie van Bergen & de Swart (2009) zeigen, wird Scrambling im Niederländischen nicht durch die Vorerwähntheit einer DP begünstigt, sondern durch die Frage, ob ein volles DP-Objekt oder ein pronominales Objekt im Satz vorliegt. Ginge es bei der Entscheidung, welches Objekt ins linke Mittelfeld bewegt
162
–
–
–
Kompatibilität zu zukünftigen theoretischen Entwicklungen
wird, nur um die diskursive Größe Vorerwähntheit, so wäre dieser Unterschied nicht gut erklärbar: Sowohl Pronomina wie auch volle DPen können diskursalt sein! Phonologisch aber ist der Unterschied sehr einfach zu fassen: So weist Erteschik-Shir darauf hin, dass ‚leichte‘ Pronomen häufig fast obligatorisch scramblen, selbst wenn ein EoO nicht in jedem Fall erkennbar ist (2007: 137ff.). Umgekehrt müssen topikale Elemente insgesamt nicht obligatorisch umgestellt werden: „topics need not scramble, although they may“ (ebd.). de Hoop bringt ebenfalls Beispiele dafür, dass vorerwähntes Material nicht zwangsweise umgestellt werden und urteilt: „Apparently, there is no strict one-to-one mapping between anaphoricity and scrambling in Dutch“ (2003: 206). Auf der anderen Seite gilt für das Niederländische, wie im Deutschen, dass Argumente dann nicht ins linke Mittelfeld gelangen, wenn sie Fokusexponenten sind, d.h. also wiederum prosodisch ausgezeichnet sind (vgl. z.B. van Bergen & de Swart 2010). Ebenfalls können im Niederländischen semantisch vorhergesagte Effekte von Bewegungen durch bestimmte Intonationsmuster beeinflusst werden: Wie im Deutschen können inverse Skopoi erzeugt werden, die die EoOs von Quantorenbewegungen zunichte machen. Unklar bleibt, wie semantische Effekte syntaktischer Operationen in der PF-(!)-Komponente beeinflusst werden können sollen – warum, mit anderen Worten, ist der Skopus, der der Oberflächenabfolge entspräche, unter der angezeigten Intonation in den folgenden Beispielen (aus Erteschik-Shir 2007: 140) nicht mehr verfügbar? 182. a) dat Jan drie KEER alle meisjes kuste dass Jan drei Mal alle Mädchen küsste dass Jan alle Mädchen dreimal küsste‘ (∀ > 3) b) dat Jan alle MEISJES drie keer kuste dass Jan alle Mädchen drei Mal küsste dass Jan drei Mal alle Mädchen küsste‘ (3 > ∀)
Eine mögliche Lösung für dieses architektonisch-theoretische Dilemma könnte darin bestehen, die o.a. Bewegung der vP auch für das Niederländische anzusetzen: Wenn die rise-Kontur, wie im Deutschen, einen hohen Spellout einer in vP enthaltenen Phrase legitimiert, wird der mismatch zwischen der linearen Abfolge der Elemente und der semantischen Konfiguration möglicherweise auf ähnliche Weise aufgehoben wie im Deutschen (vgl. u.).
Auch wenn eine vollgültige Analyse niederländischer Scrambling-Bewegungen damit hier natürlich nicht geleistet wird, so lässt sich doch sagen, dass die Vor-
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
163
hersagen, die die vorgeschlagene vP-TP-Bewegung und die Distributed Deletion für das Deutsche machen, das Deutsche dem Niederländischen nicht über Gebühr unähnlicher machen. Im Gegenteil scheint es mir sinnvoll, über eine Adaption der vP-TP-Bewegung für das Niederländische nachzudenken – zumal die Option der vP-TP-Bewegung für das Niederländische auch bereits von Biberauer (2003) und Biberauer & Richards (2006) diskutiert wird.
8.7.2.2 Object shift Object shift im Skandinavischen ist eine in der generativen Grammatik viel diskutierte Erscheinung und die folgenden Spekulationen können der reichhaltigen Literatur zu diesem Thema und den sehr komplexen empirischen Verhältnissen in den skandinavischen Sprachen kaum Genüge tun. Mit Blick auf die Fragestellung des Unterkapitels aber lässt sich durchaus schon bei oberflächlicher Betrachtung zeigen, dass ‚blockhafte‘ syntaktische Bewegungen und prosodische Restriktionen über das Ergebnis von Bewegungen auch den skandinavischen Sprachen nicht unbekannt sind: Als object shift wird eine Operation bezeichnet, die Wortstellungsvariationen erzeugt (und immer wieder auch mit dem Scrambling verglichen wurde, vgl. z.B. Lenerz 2005, Richards 2004, Chocano 2007 für Gemeinsamkeiten und Unterschiede zwischen den beiden Phänomenen). Ein gewichtiger Unterschied zum Scrambling liegt aber darin, dass die Bewegung des Objektes im object shift an die Bewegung des Verbs gekoppelt ist: Wenn sich das (Voll-) Verb eines Satzes bewegt lassen sich Objekte potentiell über andere Elemente (z.B. eine Negation) hinwegbewegen (vgl. a). Verbleibt das Vollverb aber in seiner Basisposition, so kann das Objekt sich nicht bewegen (vgl. b). Bewegt sich das Vollverb nicht, bleibt das Objekt (wie in c) in seiner Basisposition (alle Bsp. Vikner 1994: 499, Dänisch): 183. a) Hvorfor købte Peter den ikke? Warum kaufte Peter es nicht ‚Warum kaufte Peter es nicht?‘ b) *Hvorfor hat Peter den ikke købt? Warum hat Peter es nicht gekauft c) Hvorfor hat Peter ikke købt den? Warum hat Peter nicht gekauft es ‚Warum hat Peter es nicht gekauft?‘
(V > Pron ...)
(*Pron > ... V) (... V > Pron)
Diese Beobachtung (bekannt als Holmbergs Generalisierung) unterscheidet die Operation klar vom Scrambling, welches unabhängig von der Verbstellung applizieren kann. Dennoch scheint mir gerade in diesem Verhalten ein Indiz dafür zu
164
Kompatibilität zu zukünftigen theoretischen Entwicklungen
liegen, dass sich in den object shift-Sprachen eine ‚große‘ Kategorie bewegt, die das Objekt und das Verb (zumindest in einem frühen Derivationsschritt) gemeinsam bewegt: Ungrammatisch werden (wie angezeigt, nämlich just die Bewegungen, in denen das Verb und das Pronomen ihre Reihenfolge ändern. Eine Bewegung einer syntaktischen Struktur, die Verb und Pronomen gemeinsam erfasst (wodurch die Reihenfolge durch no tampering gewährleistet bliebe) wäre aber möglicherweise ein direkter Verwandter der für das Deutsche angenommenen vP-Bewegung. Vermittels einer solchen Annahme wären vielleicht auch einige andere Phänomene zu erklären, die man als ‚blockhafte Bewegungen‘ im o.a. Sinne bezeichnen kann: – Object shift kann zwar auch mehrere Objekte erfassen, die Objekte dürfen aber durch diese Operation nicht ihre Reihenfolge ändern (vgl. Vikner 2006: 400, Bobaljik 2002: 241). Dies ähnelt in gewisser Weise wieder der Tatsache, dass das Deutsche zumindest in unmarkierten Fällen oft die Basisabfolge im linken Mittelfeld repliziert. Folgerichtig urteilt Putnam, dass object shift zumindest der Art von Scrambling ähnelt, die er als Weak Scrambling bezeichnet, nämlich eine Bewegung „that must obligatorily follow the basegenerated order of arguments in the vP“ (2007: 50). Mit Blick auf diesen Untertypus von Scrambling – der in der vorliegenden Analyse durch die vPBewegung erklärt wird – erkennt Putnam: „Weak Scrambling is quite similar to Object Shift in Scandinavian in that the order of arguments in the vP must be maintained in the middle field“ (ebd.). – Für das Schwedische wird ein anderer Fall von ‚blockhaftem‘ Verhalten berichtet: Holmberg zeigt nämlich, dass beim object shift nämlich letztlich überhaupt kein VP-internes Material zurückgelassen werden kann – und zwar selbst solches Material nicht, welches völlig unverdächtig ist, an ‚topikalen‘ Bewegungen o.ä. zu partizipieren (2006). Nimmt man an, dass sich hier lediglich das Objekt (alleine) bewegt, bleibt dieser Zusammenhang verwunderlich: Warum sollte die Bewegung einer Phrase durch die NichtBewegung einer anderen Phrase restringiert sein? Genau diese Abhängigkeit besteht aber beim object shift. Die Verbpartikel ut z.B. kann im folgenden Beispiel nicht zurückgelassen werden: 184. *Dom kastade mej inte ut sie warfen mich nicht raus
(Schwedisch, Bsp. Holmberg 2006: 177)
Insgesamt erscheint mir ein Analyseansatz nicht aussichtslos, in dem eine größere Phrase (vielleicht die VP?) mitsamt allem enthaltenen Material umgestellt wird (und nicht-distribuiert ausbuchstabiert werden muss). Dieser Vorschlag hätte auch andere formale Eigenschaften als etwa die andernorts vorgeschlagene
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
165
Inkorporation des Objekts ins Verb (Diesing & Jelinek 1993: 35f., vgl. aber Vikner 1994 für eine Diskussion dieser Vorschläge): Die Bewegung einer größeren syntaktischen Kategorie hätte nämlich keine Probleme mit Exkorporationsbewegungen, die bei Inkorporationsanalysen immer dann angenommen werden müssen, wenn sich die gemeinsam bewegten Elemente (das Verb und das Objekt) in späteren Derivationsschritten doch noch trennen (vgl. Richards 2004, Chocano 2007). Auch die Frage nach der semantischen oder informationsstrukturellen Legitimation eines shift muss für die skandinavischen Sprachen kritisch gestellt werden: EoOs verschiedener Typen sind zwar für einige Fälle von object shift bekannt, andererseits scheinen (ähnlich wie im Deutschen) nicht alle Instanzen von object shift auf diese Weise ausgelöst zu werden: Pronomina lassen sich in allen skandinavischen Sprachen per object shift bewegen – aber wie bereits in der Diskussion der deutschen Pronomina gezeigt, kann die ‚topikale‘ Lesart der Pronomina nun mit Sicherheit nicht mit einer (ohnehin nur zirkulär zu definierenden) Bewegung erklärt werden: Pronomina sind auch hier bereits inhärent-lexikalisch ‚bekannt‘ – sie werden durch eine Bewegung nicht ‚bekannter‘ (vgl. ähnlich Abraham & Molnarfi 2001: 21)! Auch die Frage, ob object shift (wie unter einem merkmalsgetriebenen Ansatz vorhergesagt) obligatorisch ist, scheint nicht für alle skandinavischen Sprache einheitlich beantwortet werden zu können (vgl. Vikner 2006: 395, Bentzen 2009). Zudem ist durch Holmbergs Generalisierung eine weitere unangenehme Frage für Vertreter einer informationsstrukturell getriebenen SpecHead-Bewegung vorprogrammiert: Angenommen, das Verb bewegt sich in einem gegebenen Satz nicht. In diesem Fall kann sich auch das Pronomen nicht bewegen – aber ist es deshalb nun kein ‚bekanntes‘ Element mehr? Ist es, wenn es in seiner Basisposition verbleibt, ‚weniger topikal‘ zu interpretieren? Wie es scheint, ist object shift also vermutlich keine notwendige Bedingung dafür, dass Pronomina in den skandinavischen Sprachen als Gegeben interpretiert werden. Umgekehrt ist die Gegebenheit pronominaler Elemente aber auch keine hinreichende Bedingung für die Anwendung von object shift: Beim object shift im Festlandskandinavischen gilt, dass per Konjunktion verbundene Pronomina sich nicht bewegen lassen (Bsp. Chocano 2007: 198f.): 185. Hun så ikke meg og deg Sie sah nicht mich und dich ‚Sie sah mich und dich nicht.‘ 186. * Hun så [meg og deg] ikke Es ist auch hier nicht plausibel, dass die Pronomina in diesem Falle nicht Gegeben sein sollen! Vielmehr drängt sich der Eindruck auf, dass nicht semantische oder informationsstrukturelle Faktoren die Möglichkeit des object shift definieren,
166
Kompatibilität zu zukünftigen theoretischen Entwicklungen
sondern phonologische: ‚Leichte‘ Elemente (und dazu zählen die Pronomina) können bewegt werden, ‚schwere‘ Konstituenten (etwa per Konjunktion verbundene Pronomina) hingegen nicht. Nimmt man an, dass Pronomina aufgrund ihrer phonologischen Beschaffenheit nach der Bewegung an das Verb klitisieren müssen, ergibt sich zudem ein plausibler Auslöser für die Operation object shift insgesamt (vgl. Diesing & Jelinek 1993, Vikner 1994, Richards 2004, 2006). Phonologische ‚starke‘ (nämlich: betonte) Pronomen können, wie diese Analyse korrekt vorhersagt, nicht bewegt werden. Etabliert man nun in den skandinavischen Sprachen eine obligatorische Bewegung einer ‚großen‘ Kategorie (ähnlich der obligatorischen vP-Bewegung im Deutschen), so erhält man mehrere Kopien der enthaltenen Argumente. Die PF-Komponente könnte in diesem Fall diejenigen Kopien bewegter Pronomina auswählen, die für die (nur phonologisch zu definierenden, linearen) Klitisierungsoperationen die richtigen sind. Ein lookahead der Syntax zur phonologischen Komponente könnte auch hier (genau wie im Deutschen) auf diese Weise vermieden werden. Wie Bobaljik zeigt, sind auch die Positionen der umgestellten Objekte und des Verbs im wesentlichen morphophonologisch definierbar – womit sich das Problem des look-ahead ganz generell für das Phänomen object shift stellt (vgl. 2002: 222ff.) Die mikrotypologischen Unterschiede (etwa zwischen dem Festlandskandinavischen und dem Isländischen) ließen sich unter Umständen im Rahmen einer solchen Analyse ebenfalls als Eigenschaften der PF-Komponente darstellen: Wenn auch volle DPen im Isländischen optional und ohne EoO scramblen dürfen, so hat das Isländische vielleicht einfach nur flexiblere Tilgungsregeln als das Festlandskandinavische (womit die Tilgungen im Isländischen aber wiederum den Tilgungsoptionen des Deutschen näher kämen). Dieser typologische Zug würde die kernsyntaktischen Unterschiede zwischen den skandinavischen Sprachen zu minimieren helfen und wäre damit – wenn er sich denn tatsächlich als durchführbar erwiese – ein attraktiver Schritt im Rahmen der hier gewählten Architektur: Sprachspezifische Variation wird hier in der PF-Komponente verortet, die syntaktische Komponente kann dadurch vereinfacht werden. Natürlich gilt auch hier: Die zukünftige Forschung muss erweisen, ob sich diese losen Spekulationen als zielführend erweisen – eine dezidierte Analyse des object shift kann und soll der vorangegangene Abschnitt nicht ersetzen. Es lässt sich aber bereits jetzt zeigen, dass die Eigenschaften, die die vorgeschlagene Analyse dem Deutschen unterstellt, das Deutsche den skandinavischen Sprachen kaum unähnlicher macht. Damit muss abschließend gelten, dass die vP-TP-Bewegung das Deutsche nicht etwa exotisiert – sondern vielleicht sogar in neuartiger Weise anbindet an andere germanische Sprachen, die flexible Wortstellungsoptionen aufweisen. Auch der Einfluss prosodischer Faktoren auf Wortstellungsmuster ist in den ger-
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
167
manischen Sprachen nahezu durchgängig nachweisbar. Es ist fatal, dass insbesondere dieser letzte Punkt in generativen Analysen bisher kaum ernst genommen wurde. Mit der Annahme von flexiblen Linearisierungs-Operationen auf PF wird – wie leicht zu erkennen ist – keine Büchse der Pandora geöffnet. Vielmehr müssen prosodische Wortstellungsfaktoren in zukünftigen Analysen nach Möglichkeit sogar noch viel genauer untersucht werden. Diese Faktoren bedürfen – endlich! – einer theoretischen Repräsentation. Ob die hier vorgeschlagenen Mechanismen geeignet sind, auch für andere germanische Sprachen als das Deutsche eine valide Erklärung zu liefern, wird sich zeigen müssen. Die empirischen Gemeinsamkeiten des Deutschen und seiner engen Verwandten wurde damit diskutiert. Wie aber repräsentiert die vorgeschlagene Analyse Unterschiede zwischen dem Deutschen und anderen Sprachen, etwa zum Englischen?
8.7.3 Sind auch typologische Unterschiede mithilfe von vP-TP-Bewegungen erklärbar? Mit der vorgeschlagenen Analyse kann und soll nicht der Eindruck vermittelt werden, die germanischen Sprachen unterschieden sich strukturell nicht voneinander. Es sei noch einmal daran erinnert, dass die vP-TP-Bewegung grundlegend auch eine typologische Komponente enthält – und dies nicht nur in ihrer Grundlegung in Biberauer (2003): In den folgenden Unterkapiteln soll kurz dargelegt werden, dass die vorgeschlagene Analyse auch Elemente enthält, die eine sprachspezifische Parametrisierung erlauben: – Das Deutsche unterscheidet sich von anderen Sprachen, etwa dem Englischen, darin, dass es keine Superioritätsverletzungen bei mehrfachen WhFragen (aus simplexen Sätzen) aufweist, wie Unterkapitel 8.7.3.1. erläutert. – Das Englische weist, im Gegensatz zum Deutschen, auch generell keine dem deutschen Scrambling direkt vergleichbaren Wortstellungsvariationen auf. Wie Unterkapitel 8.7.3.2. zeigt, ist dies (unter der Annahme des FOFC) möglicherweise damit in Verbindung zu bringen, dass das Englische keine Partikeln aufweist, die die Bewegung einer ‚großen‘ Kategorie erzwingen.
8.7.3.1 Keine Superiorität im Deutschen: Hohe vP umgeht die PIC? Das Deutsche ist nicht nur in Bezug auf die möglichen Wortfolgen im Mittelfeld recht variabel: Es gilt auch, dass das Deutsche keine Superiorität in (simplexen) Fragesätzen kennt. Dies unterscheidet die Sprache klar von anderen Sprachen, etwa dem Englischen:
168
Kompatibilität zu zukünftigen theoretischen Entwicklungen
187. a) Dt.: Wer hat was gekauft? b) Dt.: Was hat wer gekauft?
Engl.: Who bought what? Engl.:*What did who buy?
Einige Autoren haben argumentiert, dass die ‚freie‘ Wortstellung des Deutschen sich nicht ohne Grund auf vielfach verschiedene Weise in verschiedenen Konstruktionsoptionen zeigt, sondern dass diese Optionen sich untereinander bedingen: So wurde vielfach angenommen, dass die Möglichkeiten, Argumente im Mittelfeld in ihrer Reihenfolge zu vertauschen die Bedingung (und Ursache) dafür ist, dass Superiorität im Deutschen gar nicht existieren kann (für eine Diskussion verschiedener Vorschläge vgl. Fanselow & Féry 2008, im aktuellen theoretischen Rahmen z.B. Grohmann 1997). Zum einen ist jederzeit eine Derivation denkbar, in der lediglich das Wh-Subjekt sukzessiv-zyklisch angehoben wird: 188. Basisabfolge: Bewegung des Subjektes: [TP SubjWh Wh-Bewegung: [CP SubjWh V [TP SubjWh Zum Beispiel: [CP Wer kauft [TP wer
[vP SubjWh [vP SubjWh [vP SubjWh [vP wer
[VP ObjWh]] [VP ObjWh]]] [VP ObjWh]]] [VP was]]]
In der aktuellen syntaktischen Theorie entscheidet wesentlich die sogenannte Phase Impenetrability Condition (PIC, vgl. Chomsky 1999, 2004) über die Durchführbarkeit einer Derivation. Es gilt, dass ein Phasenkopf (etwa v oder C) jedes Element attrahieren kann, welches nicht in der Domäne eines tieferen Phasenkopfes liegt: Wenn z.B. der Phasenkopf C in der Derivation verkettet wird, so wird die Komplementdomäne des strukturell tieferen Phasenkopfes v der Operation Spellout zugeführt. Damit ist der Inhalt der VP nicht mehr durch die syntaktische Derivation manipulierbar. Im gerade gegebenen Beispiel wäre also C z.B. nicht in der Lage, das Wh-Objekt was zu attrahieren. Damit das Objekt aber dennoch erfragt werden kann, muss es sich, den genannten Autoren nach, zunächst aus der Domäne des Phasenkopfes v herausbewegen: Aus dieser höheren Zwischenposition könnte es nach SpecCP bewegt werden, weil der Spellout von VP nun irrelevant für die Zugänglichkeit des Objektes ist. Durch Scrambling ist es dem Objekt aber natürlich möglich, die VP zu verlassen: 189. Basisabfolge: [vP Subjwh Scrambling des Obj: [ObjWh Subjektsbewegung: [TP Subjwh [ObjWh Dann: [CP ObjWh V [TP Subjwh [ObjWh Bsp.: [CP Was kauft [TP wer [was
[VP ObjWh]] [vP Subjwh [VP ObjWh]]] [vP Subjwh [VP ObjWh]]]]] [vP Subj wh [VP ObjWh]]]]]] [vP werwh [VPwasWh ...]]]]]]
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
169
Im Englischen scheint es nun so zu sein, dass Wh-Objekte in ihrer Bewegung nicht in der Lage sind, Wh-Subjekte zu überqueren. Damit kann aber eine kurze Bewegung des Wh-Objektes aus der vP heraus dann nicht erfolgen, wenn auch das Subjekt eine Wh-Phrase ist. In der Folge kann das Wh-Objekt nicht aus der Domäne des Phasenkopfes v herausbewegt werden wenn ein Wh-Subjekt vorliegt. Das Wh-Objekt wird in diesem Fall also – als Bestandteil der VP – syntaktisch unzugänglich. Die o.a. Autoren schlagen daher vor, die Scrambling-Option als Ursache dafür zu sehen, dass das Deutsche keine Superioritätsverletzungen zeigt, das Englische hingegen schon. Auf diese Weise wird der eine Aspekt ‚freier‘ Wortstellung (fehlende Superioritätseffekte) zurückgeführt auf einen anderen, unabhängig attestierten Aspekt (die Möglichkeit des Scrambling). Die genauen Mechanismen brauchen an dieser Stelle nicht diskutiert zu werden und es soll mit den nun folgenden Überlegungen auch keine vollständige Analyse von Superiorität in den Sprachen der Welt angestrebt werden. Interessant für die vorgeschlagene Analyse ist aber, dass das Englische – anders als das Deutsche – eben auch keine vP-TP-Bewegung aufweist (vgl. Biberauer 2003, Biberauer & Richards 2006). Durch die Bewegung der vP aber wird das soeben geschilderte Szenario entscheidend verändert: Wenn nämlich tatsächlich, wie hier angenommen, die gesamte vP in einer zweiten Kopie in der Spezifikatorposition von TP existiert, so ist der Spellout der tieferen VP-Kopie völlig irrelevant für Wh-Bewegungen. Angenommen, die tiefe VP-Kopie wird (dargestellt durch ) tatsächlich syntaktisch unzugänglich. In der vP-Kopie in SpecTP existiert dann dennoch eine weitere Kopie der vP (und damit auch aller mitbewegten Argumente): 190. [C‘ V[TP [vP SubjWh [VP ObjWh]] Part [vP SubjWh ]V]] Es ist leicht erkennbar, dass in dieser Konfiguration sowohl das Wh-Subjekt wie auch das Wh-Objekt in einer für C zugänglichen Kopie existieren: Das Subjekt ist sowohl in der hohen wie der tiefen vP-Kopie verfügbar. Und auch das Objekt mag in der tiefen VP bereits syntaktisch unzugänglich sein – es existiert jedoch auch eine Kopie des Objektes in der höheren vP-Kopie! Damit ist, wenn weitere Stipulationen unterbleiben, kein Grund erkennbar, warum ein C-Kopf, welcher Wh-Phrasen attrahiert, nicht auch nach Belieben ein Wh-Objekt attrahieren können sollte, welches sich in einer vP in der SpecTP-Position befindet. Ganz im Sinne der zitierten Autoren wäre also auch unter dieser Analyse die Möglichkeit des Deutschen, Scrambling durchzuführen, die Vorbedingung und Ursache dafür, dass Superiorität im Deutschen nicht existiert. Die hier vorgeschlagene Analyse geht in gewisser Weise sogar über die zitierten Autoren hinaus: Anders als in den bereits vorliegenden Analysen muss im Rahmen einer vP-TP-Analyse
170
Kompatibilität zu zukünftigen theoretischen Entwicklungen
nämlich nicht mehr gezeigt werden, dass oder wie z.B. ein Wh-Objekt zunächst überhaupt ins Mittelfeld gelangen kann. Auch VP-interne Adv-Phrasen (vgl. Frey & Pittner 1998) o.ä. müssen nicht zunächst in eine Mittelfeldposition scramblen, um nicht als Bestandteile der VP aus der Derivation entfernt zu werden. Vielmehr ist die Vorhersage der hier vorgeschlagenen Analyse die, dass alle vPinternen Argumente und Adjunkte (insofern sie überhaupt erfragbar sind, s.u.) auch erfragt werden können, unabhängig von ihrem informationsstrukturellen Status oder ihrer Fähigkeit, EoO-konforme Scrambling-Bewegungen zu vollziehen: 191. Wann hat wer was gekauft? Was hat wer wann gekauft? Wer hat was wann gekauft? ... Empirisch interessant an diesem hypothetischen Vorschlag ist, dass Elemente, denen eine strukturell besonders hohe Basisposition zugesprochen wird (vgl. Frey & Pittner 1998) oft gar nicht erfragt werden können. So sind Adverbiale, die die gesamte Proposition modifizieren, offenbar grundsätzlich nicht zu erfragen: – Wie kann das Satzadverbial vermutlich in Peter hat vermutlich geraucht erfragt werden? – Wie kann das Adverb leider in Peter hat leider das Auto kaputtgefahren erfragt werden? – Wieso sind Modalpartikeln generell nicht erfragbar – und zwar selbst dann nicht, wenn sie (zumindest vage) beschreibbare Sprechereinstellungen o.ä. ausdrücken? Theoretisch bietet sich durch die Annahme einer vP-TP-Bewegung aber die Chance, typologische Variation in möglichst restriktiver Form zu ermöglichen: Weil das Deutsche eine vP-TP-Bewegung hat, kann es ohne EoO scramblen – und gleichzeitig auch, aus demselben Grund, Superioritätsbeschränkungen auf die geschilderte Weise umgehen. Das Englische hat aufgrund der Tatsache, dass es nur nominativische DPen (nicht: vPen!) nach SpecTP anhebt, weder die Möglichkeit einer EoO-losen Scrambling-Bewegung noch die Möglichkeit, Superiorität (zumindest auf diese Weise) zu umgehen. Der Zusammenhang zwischen der einen Form ‚freier‘ Wortstellung und der anderen wird auf diese Weise theoretisch repräsentiert. Die vorliegende Arbeit zum Scrambling im Deutschen kann nun natürlich nicht das Auftreten von Superioritätsverletzungen in den Sprachen der Welt zu ihrem Gegenstand machen: Die weitere Forschung wird daher zeigen müssen,
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
171
inwiefern diese Mutmaßungen und potentiellen Verbindungen den komplexen empirischen Gegebenheiten standhalten. Anstatt also das Thema der vorliegenden Arbeit über Gebühr zu erweitern, soll im folgenden Unterkapitel gefragt werden, ob die typologischen Unterschiede zwischen germanischen Sprachen – genauer: die Unterschiede bezüglich der SpecTP-Besetzung – sich nicht selbst wiederum aus bereits gemachten Annahmen ableiten lassen: Könnte man Vermutungen darüber formulieren, warum das Englische keine vP-TP-Bewegung aufweist, das Deutsche hingegen schon?
8.7.3.2 Keine vP-TP-Bewegung im Englischen – fehlen die Partikeln? In den vorangegangenen Unterkapiteln wurde die Kaskade funktionaler Projektionen im Deutschen in einem relativ speziellen Licht gezeichnet: Durch die Möglichkeit, Eigenschaften der verbalen erweiterten Projektion stark ‚verteilt‘ auszubuchstabieren (nämlich in den Projektionen der Köpfe v, Part, T und C selbst) wird eine Struktur etabliert, die verschiedene strukturelle Zwischenebenen in den Gesamtaufbau des Satzes einzieht. Wie gesehen ergibt sich durch diese ‚Zersplitterung‘ der funktionalen Kaskade auch die Möglichkeit, ‚große‘ Projektionen (etwa die vP) zu bewegen, ohne mit dieser Operation Antilokalitätsrestriktionen zu verletzen. Damit ist es letztlich die Existenz (und spezifische Beschaffenheit) der lexikalischen Elemente Part, T und C, die es der Analyse erlauben, eine vP-Bewegung technisch unproblematisch zu implementieren. Im Rahmen der gewählten syntaktischen Theorie ist dieses Szenario überaus wünschenswert: Das Lexikon ist (in jeder mir bekannten Theorie) ein Hort der sprachlichen Variation: Nicht erst seit Saussure gilt der Konsens, dass lexikalische Elemente in den Sprachen der Welt recht frei variieren können: Sie mögen durch historische Konvention an kurzlebigen Fluktuationen oder gar chaotischen Veränderungen gehindert sein – letztlich aber sind LIs von Sprache zu Sprache (unter Umständen drastisch) verschieden. Im Rahmen der aktuellen syntaktischen Theorie wird diesem Umstand Genüge getan. Das Lexikon ist, genauer gesagt, sogar die einzige Komponente, die (kern-) syntaktische Abläufe parametrisieren kann: Während auch die PF-Komponente sprachspezifischen Eigenheiten unterliegen kann, hat diese Komponente (wie auch in der vorliegenden Analyse) Einfluss auf Wortstellungsmuster im weitesten Sinne, aber dennoch eben nicht auf die Kernsyntax selbst: Da die Syntax keinen look-ahead zur PF betreiben können soll, sind die Operationen der PF letztlich ohne Auswirkungen auf die syntakto-semantische Derivation. Vor diesem Hintergrund ist es sehr attraktiv, auch übereinzelsprachliche Unterschiede, etwa zwischen dem Deutschen und Englischen, auf die Existenz und Beschaffenheit lexikalischer Elemente zurückzuführen – ohne aber hierbei in das letztlich stipulative Muster älterer Vorschläge zum Scrambling zu
172
Kompatibilität zu zukünftigen theoretischen Entwicklungen
verfallen: Diese behaupten (in zirkulär anmutender Weise, vgl.o.), das Deutsche disloziere Topikphrasen (wahlweise: Antifokusphrasen, etc.), weil nun einmal eine Topikphrase (Antifokusphrase, etc.) im Mittelfeld existiere. Das Englische hingegen habe keine vergleichbare Bewegung, weil dem Englischen einfach der funktionale Kopf (Top0, AF0, etc.) fehle. Wie Cedric Boeckx (p.c.) bemerkt, wäre eine solche Form der ‚Erklärung‘ in anderen Kontexten kaum als zufriedenstellend zu bezeichnen: Tritt z.B. eines Morgens ein Elefant in mein Büro, so nehme ich an, dass sich im Büro etwas befindet, was den Elefanten attrahiert hat. Möchte meine Bürokollegin Amina wissen, worin die Attraktion für den Elefanten besteht verweise ich darauf, es handele sich präzise um das elefantenattrahierende Merkmal [Elefant]. In analoger Weise aber argumentieren kartografische Ansätze, Topiks würden von [Topik] attrahiert, Foki von [Fokus], usw.. In der vorliegenden Analyse wird die Stipulation von informationsstrukturellen funktionalen Köpfen hingegen vermieden und die Möglichkeit (und vielleicht auch Nötigkeit) der Bewegung der vP (also einer syntaktisch, nicht informationsstrukturell definierten Phrase!) in die SpecTP (einer unabhängig anzunehmenden Zielposition) wird durch formale Mittel erklärt. Mit dieser Art von Erklärung wird nicht nur die theoretische Zirkularität der älteren Vorschläge vermieden, es verschieben sich auch die Vorhersagen dazu, welche Sprachen überhaupt Scrambling (oder ähnliche Operationen) aufweisen können sollten: Wenn es die ‚Zersplitterung‘ der funktionalen Kaskade ist, die im Deutschen vP-TP-Bewegungen ermöglicht, welche anderen Sprachen weisen dann ähnliche generelle Satzstrukturen (oder auch: ähnliche Partikeln, etc.) auf? In einem zweiten Schritt: Kann auch diesen Sprachen ‚freie‘ Wortstellung attestiert werden? Es ist vor jeder Diskussion darauf hinzuweisen, dass die komplexen syntaktischen Vorgänge in den verschiedenen Sprachen der Welt letztlich jede grobschlächtige Form von Generalisierung jederzeit konterkarieren können (subtil andere Agree-, EM- und IM-Konstellationen bleiben ja generell denkbar). Dennoch erscheint die hier (wenngleich nur lose) gezogene Verbindung zumindest in einigen europäischen Sprachen in erster Annäherung tatsächlich zu bestehen: Für einige Sprachen ist die Existenz von Partikeln gut nachgewiesen – und diese Sprachen weisen vielleicht kein Scrambling auf, nicht desto trotz jedoch bestimmte andere Erscheinungsformen ‚freier‘ Wortstellung! Das Italienische etwa verfügt über Partikeln (vgl. z.B. Cardinaletti 2008) und ermöglicht die Umstellung verschiedener Kategorien in eine komplexe linke Satzperipherie (Rizzi 1997). Wenn Modalpartikeln nun, wie oben argumentiert, tatsächlich ‚verteilte Spellouts‘ von C-Merkmalen darstellen, erscheint ein Vergleich des Deutschen mit dem Italienischen (bei allen unbestreitbar bestehenden Unterschieden zwischen den Sprachen) nicht fehl am Platze: In seiner klassischen
Die Analyse im Sprachvergleich: Das Deutsche wird typologisch nicht exotisiert
173
Analyse des Komplementierersystems verweist Rizzi ja explizit auf die konkrete Funktion des C-Systems. Ähnlich wie im Deutschen Scrambling als Möglichkeit dargestellt wurde, einen propositionalen Gehalt in bestimmten Kontexten informationsstrukturell einzubinden, so betrachtet Rizzi „the complementizer system as the interface between a propositional content [...] and the superordinate structure (a higher clause, or possibly, the articulation of discourse [...])“ (1997: 283). Damit hat die linke Peripherie des Italienischen eine zumindest nicht völlig unähnliche Gesamtfunktion wie die Kaskade der funktionalen Projektionen im deutschen Mittelfeld. Vergleiche dieser Art wurden von Anhängern kartographischer Ansätze tatsächlich in ähnlicher Form angestellt (vgl. z.B. Grewendorf 2005). Vor dem Hintergrund der vorliegenden Arbeit aber ließe sich die Frage stellen, ob sich Analysen dieser Art nicht auch recht gut ersetzen ließen durch Analysen wie die hier vorgeschlagene: Partikeln sind Kennzeichen einer ‚zersplitterten‘ C-Kaskade und es sind die sich ergebenden vielschichtigen funktionalen Projektionen innerhalb dieser Kaskade, die verschiedene tiefere Bestandteile des Strukturbaums dislozieren. Im Rahmen der vorliegenden Arbeit (zum Deutschen) muss natürlich auch hier wieder einmal offen bleiben, inwieweit sich diese Vermutung tatsächlich in eine konkrete Analyse der empirischen Verhältnisse im Italienischen überführen lässt. Mit Blick auf den Zusammenhang zwischen der Existenz von Partikeln im Lexikon einer Sprache und Optionen freier Wortstellung kann aber gelten: Italienisch weist sowohl das eine wie auch das andere auf. Beides findet sich auch in den skandinavischen Sprachen: Wie oben gesehen weist z.B. das Dänische Partikeln auf – und bietet gleichzeitig die Möglichkeit des object shift. Das Deutsche hat, wie gesehen, ebenfalls Partikeln und bietet die Möglichkeit des Scrambling. Und auch das Niederländische verfügt über ähnliche Partikeln wie das Deutsche (vgl. z.B. de Vriendt et al 1991) und zeigt, wie gesehen, eine bestimmte (wenngleich nicht dem Deutschen direkt vergleichbare) Form von Scrambling. Damit ist der Zusammenhang zwischen der Existenz von Partikeln und der Existenz syntaktisch freier (wenngleich diskursiv aufgeladener) Wortstellungsoptionen für die germanischen Sprachen zumindest in Ansätzen belegt. Für das Englische gilt in umgekehrter Form, dass es keine dem Deutschen auch nur entfernt vergleichbaren Partikeln aufweist und auch keine Form von Scrambling oder object shift aufweist: Das Englische ist eine Sprache mit vergleichsweise rigider Wortstellung, was möglicherweise nun verstanden werden kann als Ausdruck der Tatsache, dass das Englische seine funktionale Kaskade nicht in gleicher Weise ‚zersplittert‘ hat. Abraham schlägt die Generalisierung vor, dass nur Sprachen mit einem diskurs-konfigurationellen Mittelfeld über Partikeln verfügen können (Abraham 1991a: 247, Abraham 1988). Diese Generalisierung erscheint für die germanischen Sprachen zunächst recht plausibel, wird aber durch die Existenz von Partikeln im
174
Kompatibilität zu zukünftigen theoretischen Entwicklungen
Italienischen über die germanischen Sprachen hinaus falsifiziert (vgl. z.B. Cardinaletti 2008): Das Italienische weist zwar diskurssensitive Wortstellungsvarianten auf, aber Umstellungen in dieser Sprache zielen nicht auf ein ‚Mittelfeld‘ im engeren Sinne des Wortes ab. Unter der hier vorgeschlagenen Analyse aber kann versucht werden, den zutreffenden Teil der Abraham‘schen Generalisierung – in genau umgekehrter Form – aufrecht zu erhalten: Genau dann, wenn Sprachen durch die Verwendung von Partikeln anzeigen, dass sie die Merkmale der verbalen funktionalen Kaskade in ‚zersplitterter‘ Form ausbuchstabieren, ist in diesen Sprachen auch eine Möglichkeit diskursiv angebundener Dislozierung möglich. Dieser Vorschlag bindet, so weit ich sehe, die ursprüngliche Kernaussage Rizzis, den zutreffenden Teil der Abraham‘schen Generalisierung und die hier vorgeschlagene Analyse aneinander: Es sind Be-standteile der verbalen funktionalen Kaskade (die edge von v, der Spezifikator von T, sowie intervenierende C-Partikeln), die die hier vorgeschlagene Analyse konstituieren. Damit ist die Existenz von IS-getriebenen Umstellungen in Sprachen, die besondere verbale funktionale Kaskaden haben, zumindest suggestiv. Die weitere typologische Forschung muss zeigen, inwieweit sich die hier nur vermuteten Zusammenhänge bewahrheiten. Drei Einschränkungen sind diesen Vermutungen sogleich hinzuzufügen: Zum einen ist die Existenz von Partikeln sicherlich nicht die einzige Möglichkeit, Bewegungsoperationen in einer Sprache zu bewirken. Wenn demnach eine Sprache keine Partikeln aufweist, so besagt die oben angestellte Vermutung nicht, dass diese Sprachen eine rigide Wortstellung haben müssen. Andere sprachliche Konstellationen, die ‚freie Wortstellung‘ auslösen, sind ja bereits längst bekannt (vgl. Baker 2001). Die Aussagen über das Englische sind demnach auch (nur) so zu verstehen, dass diese Sprache natürlich auch die anderen nicht-konfigurationellen Optionen nicht nutzt. Der Zusammenhang zwischen der Existenz von Partikeln und nicht-konfigurationellen Wortstellungsoptionen ist der einer potentiellen einseitigen Implikation: Wenn eine Sprache Partikeln hat, dann besteht zumindest potentiell die oben geschilderte Möglichkeit, dass diese Sprache ähnliche Wortstellungsphänomene aufweist wie etwa die hier skizzierten germanischen Sprachen. Als zweite Einschränkung muss darauf hingewiesen werden, dass die typologischen Vorhersagen sich nicht auf die EoO-konforme Bewegung von quantifizierten Elementen in die edge der vP bezieht: Für diese Bewegung ist nämlich letztlich nicht klar, warum z.B. das Englische diese Möglichkeit syntaktischer Bewegungen nicht nutzt. Das Problem wird jedoch zum einen bereits intensiv diskutiert (vgl. z.B. Chomsky 1999, Chocano 2007, sowie die aktuellen Arbeiten des hier direkt einschlägigen Projekt Rethinking Comparative Syntax der University of Cambridge), zum anderen wird es aber auch in keinster Weise durch die vorliegende Analyse erzeugt: Diese Form der Bewegung wird hier nicht zum ersten Mal
Allgemein-methodische Einwände
175
vorgeschlagen – und auch nicht ihre mögliche Bedeutung für das Scrambling im Deutschen (vgl. Frey 1993, Hinterhölzl 2004). Zum dritten sollen mit all den oben angestellten Vermutungen ausdrücklich keine umfassenden Analysen zu den genannten Phänomenen ersetzt werden: Die empirisch komplexen Verhältnisse in jedem einzelnen der genannten Phänomenbereiche zu erfassen kann nicht Sinn dieser kurzen Abrisse sein. Vielmehr soll gezeigt werden, dass diese Phänomene mit einer vP-TP-Analyse nicht a priori inkompatibel zu sein scheinen. Die Ausarbeitung der hier vorgestellten Gedanken zu ausformulierten vP-TP-basierten Analysen muss aber ganz klar der zukünftigen Forschung überlassen bleiben. Zusammenfassend kann aber nach meiner Einschätzung gelten, dass Einwände, die der Analyse sprachvergleichende Probleme unterstellen, nicht a priori zutreffend sind: Die Analyse fügt sich in bekannte sprachübergreifende Analysen in interessanter Weise ein. Können aber noch allgemeinere Einwände formuliert werden, die z.B. die methodischen Implikationen der Analyse betreffen?
8.8 Allgemein-methodische Einwände Wenn nun also weder theoretisch-technische noch empirische Einwände gegen eine Analyse von (manchen) Scrambling-Bewegungen als vP-TP-Bewegungen formuliert werden können, sprechen dann ganz allgemeine, methodologische Gründe gegen die vP-TP-Analyse? Nachdem gezeigt wurde, dass die Analyse technisch möglich und empirisch vielseitig ist, könnte ein letzter Vorwurf nun etwa gerade darin bestehen, dass die Analyse zu vielseitig ist: – Ist die Analyse vielleicht deshalb so leicht auf die Verhältnisse in anderen Sprachen übertragbar, weil sie zu unrestringiert vorgeht? Mit anderen Worten: Übergeneriert die Analyse Wortstellungsmuster, die so nicht nachweisbar sind? – Wie bereits im letzten Unterkapitel angezeigt, kann die vorliegende Arbeit nicht die Anwendbarkeit der Analyse auf sämtliche Sprachen garantieren (und schon gar nicht ohne die je nötigen, in Teilen vielleicht auch sprachspezifischen Parametrisierungen!). Es lässt sich aber zeigen, dass die Analyse für das Deutsche gar nicht in der Lage ist, ganz und gar untypische Wortstellungsmuster zu erzeugen – im Gegenteil werden nur vergleichsweise unmarkierte Wortstellungen durch vP-TP ermöglicht, wie Unterkapitel 8.8.1. zeigt. – Der entgegengesetzte Vorwurf könnte darin bestehen, dass die Analyse untergeneriert: Werden durch die Analyse in nennenswertem Umfang Wortstellungsmuster als grammatisch unmöglich ausgewiesen, obwohl sie empirisch nachweisbar sind?
176 –
Kompatibilität zu zukünftigen theoretischen Entwicklungen
Wie Unterkapitel 8.8.2. zeigt, scheint dies nicht in nennenswertem Umfang der Fall zu sein. Sollten sich bestimmte Lücken in den Vorhersagen ergeben, so zeigt das Unterkapitel, wie sie potentiell zu schließen wären.
8.8.1 Die Analyse übergeneriert nicht in offensichtlicher Form Nachfolgend werden sämtliche Wortstellungsmuster, die durch vP-TP-Bewegungen und PF-Löschung erzeugbar sind, kurz vorgestellt. Für jedes der Wortstellungsmuster lässt sich zeigen, dass sie unter ganz und gar unproblematischen Bedingungen auftritt. Die Gefahr einer Übergenerierung durch vP-TP-Bewegungen und nachfolgende PF-Tilgungen besteht demnach nachweislich nicht.
8.8.1.1 Einstellige Prädikate Bei der Behandlung von einstelligen Prädikaten ist keine Übergenerierung zu befürchten: Ein einzelnes (definites) Argument kann sowohl vor wie auch nach einer Partikel stehen: 192. a) [TP [vP Subj V] Part [vP Subj V] V] Bsp.: weil ja PETer schläft weil ja PETer ankommt b) [TP [vP Subj V] Part [vP Subj V] V] Bsp.: weil Peter ja SCHLÄFT weil Peter ja ANkommt
(unergativ) (unakkusativ) (unergativ) (unakkusativ)
Unmögliche Abfolgen, oder Abfolgen, die sich nicht schon allein aus der Fokusexponenz ableiten lassen, liegen nicht vor.
8.8.1.2 Zweistellige Prädikate Auch bei den zweistelligen Prädikaten ist letztlich nur eine überschaubare Menge von Permutationen auf der Basis von verteilten Tilgungen einer vP möglich: 193. a) [TP [vP Subj Obj V] Part [vP Subj Obj V] V] (Normalabfolge all-new) Bsp.: Heute hat wohl Peter die Katze gefüttert. b) [TP [vP Subj Obj V] Part [vP Subj Obj V] V] (z.B. fokussiertes Subjekt) Bsp.: Heute hat die Katze wohl PETer gefüttert.
Allgemein-methodische Einwände
177
c) [TP [vP Subj Obj V] Part[vP Subj Obj V] V] (z.B. enger Verbfokus) Bsp.: Heute hat Peter die Katze wohl geFÜTTert. d) [TP [vP Subj Obj V] Part [vP Subj Obj V] V] (Normalbetonung Objekt) Bsp.: Heute hat Peter wohl die KATze gefüttert. Unmögliche Abfolgen, oder Abfolgen, die sich nicht schon allein aus der Fokusexponenz ableiten lassen, liegen nicht vor. Für transitive Verben macht die Distributed Deletion der nach SpecTP bewegten vP demnach keine problematischen Vorhersagen.
8.8.1.3 Dreistellige Prädikate Für die verteilte Tilgung von drei Argumenten muss eine größere Anzahl von Abfolgen diskutiert werden. Glücklicherweise liegt mit Meinunger bereits eine Arbeit vor, die eine plausible Abstufung der Markiertheit verschiedener Wortfolgen vornimmt (2000: 61f.). Vergleicht man die Markiertheitsgrade, die Meinunger vorsieht, mit der Vorhersage der vorliegenden Analyse, so stellt man fest, dass sie fast völlig deckungsgleich sind: Die distribuierte Tilgung zweier vPs liefert fast exakt diejenigen Wortabfolgen, die Meinunger als besonders unmarkiert einstuft: 194. Distributed Deletion vs. Meinungers Markiertheitshierarchie Möglichkeit der distribuierten Tilgung
Markiertheit laut Meinunger (2000) (a = am unmarkiertesten bis x = am markiertesten)
[Subj iO dO] Adv [Subj iO dO]
Adv Subj iO dO = f
[Subj iO dO] Adv [Subj iO dO]
dO Adv Subj iO = q
[Subj iO dO] Adv [Subj iO dO]
iO Adv Subj dO = h
[Subj iO dO] Adv [Subj iO dO]
iO dO Adv Subj = d
[Subj iO dO] Adv [Subj iO dO]
Subj Adv iO dO = e
[Subj iO dO] Adv [Subj iO dO]
Subj iO Adv dO = c
[Subj iO dO] Adv [Subj iO dO]
Subj iO Adv dO = a
[Subj iO dO] Adv [Subj iO dO]
Subj iO dO Adv = b
178
Kompatibilität zu zukünftigen theoretischen Entwicklungen
Ordnet man die Tabelle nun umgekehrt nach Meinungers Markiertheitshierachie, so ergibt sich: 195. Meinungers Markiertheitshierarchie gegen Distribuierte Tilgungen Möglichkeit der distribuierten Tilgung
Markiertheit laut Meinunger (2000) (a = am unmarkiertesten bis x = am markiertesten)
[Subj iO dO] (Part) [Subj iO dO]
a
[Subj iO dO] (Part) [Subj iO dO]
b
[Subj iO dO] (Part) [Subj iO dO]
c
[Subj iO dO] (Part) [Subj iO dO]
d
[Subj iO dO] (Part) [Subj iO dO]
e
[Subj iO dO] (Part) [Subj iO dO]
f
[Subj iO dO] (Part) [Subj iO dO]
h
[Subj iO dO] (Part) [Subj iO dO]
q
Dieses Ergebnis ist nahezu perfekt: Die distribuierte Tilgung leitet fast exakt die unmarkiertesten Wortfolgen ab. Eine Abweichung von Meinungers Markiertheitshierarchie weist die Distributed Deletion zweier vPs aber auf: Die Abfolge dO > Part > Subj > iO wird ermöglicht, obwohl Meinunger sie auf Position Q seiner Hierarchie als recht markiert einstuft. Prüft man aber, wie eine solche verteilte Tilgung zustande kommen kann, so stellt man fest, dass die Fokussierung etwa des Subjektes (a) oder auch eine komplexe Fokussierung von Subjekt und indirektem Objekt (b) diese Abfolge unproblematisch ergeben: 196. a) Heute hat das Geld wohl PETerF dem Kassierer gegeben. b) Kontext: Was das Geld angeht: Wer hat es heute wem gegeben? Antwort: Heute hat das Geld wohl PeterF dem KaSSIERerF gegeben. Wie sich zeigt, ist also auch die markierte Abfolge ganz und gar keine unmögliche Abfolge – und sie ist allein mit den vorgeschlagenen Mitteln der Distributed Deletion-Analyse (der Bestimmung der Fokusexponenz) kontrolliert zu erzeugen. Damit muss insgesamt gelten, dass die verteilte Tilgung zweier vPen nicht insgesamt zu erkennbarer Übergenerierung führt: Die möglichen Tilgungsszenarien
Allgemein-methodische Einwände
179
haben sich samt und sonders als mögliche Wortfolgen erwiesen. Könnte es nun aber sein, dass die vorgeschlagene Analyse im Gegenteil Wortfolgen nicht generiert, die dennoch grammatisch sind?
8.8.2 Die Analyse untergeneriert nicht in nennenswerter Form – und ist erweiterbar Die Analyse ist bisher davon ausgegangen, dass eine einzige Partikel im Satz auftritt und Argumentphrasen links oder rechts von dieser Partikel erscheinen. Nun ist es aber (mit gewissen Restriktionen) auch möglich, mehrere Partikeln in ein und demselben Satz zu verwenden: 197. Heute hat Peter ja wohl gepennt. Wie mir scheint, sind Positionen, die zwischen den Partikeln auftreten, nicht in jedem Fall von Argumenten zu besetzen, wenn diese Argumente die einzigen Argumente im Satz sind: 198. ?Heute hat ja Peter wohl gepennt. ?Heute ist ja Peter wohl angekommen. Nichtsdestotrotz ist auch diese Position für Argumente nicht unzugänglich: Wenn ein einzelnes Argument zum Beispiel als kontrastives Topik fungiert und vor einer fokussierten Negation zu stehen hat, so erscheint mir die Abfolge als möglich: 199. Heute hat ja /PETer wohl NICHT gepennt. Heute ist ja /PETer wohl NICHT angekommen. Wenn mehrere Argumente im Satz auftreten, so erscheinen mir Positionen zwischen Partikeln recht generell gute Zielpositionen für Scrambling zu sein: 200. Heute hat Peter ja seiner Freundin wohl einen MOLCH gekauft. Es scheint, dass die Restriktionen der verteilten Tilgung sich recht gut aus den Fokusverhältnissen herleiten lassen: Wenn ein plausibler Fokusexponent unterhalb der tiefsten Partikel existiert, so sind auch Beispiele akzeptabel, die Positionen zwischen Partikeln avisieren: 201. Heute hat Peter seiner Freundin ja den Molch wohl endlich geKAUFT.
180
Kompatibilität zu zukünftigen theoretischen Entwicklungen
Die Beurteilung dieser Sätze ist nach meinem Empfinden etwas erschwert: Die große Anzahl von vollen Argument-DPen scheint mir einige der Sätze doch etwas zu überfrachten. Wie Uhmann zeigt, ist eine solche ‚Überfüllung‘ des Mittelfeldes mit Argumentphrasen im Deutschen eher selten (1993). Die hier diskutierten Optionen sind also möglicherweise allesamt eher marginaler Natur. Dennoch erscheinen Bewegungen zwischen Partikeln nicht grundsätzlich unmöglich. Zwei Vorgehensweisen sind für die vP-TP-Bewegung denkbar: – Möchte man diese Form EoO-loser Bewegungen als grammatisch einstufen, so muss die vP-Bewegung im Stile einer sukzessiv-zyklischen Bewegung auch Spezifikatorpositionen der Partikeln durchlaufen. Wie leicht zu zeigen ist, ist diese Möglichkeit technisch ohne weiteres gegeben: Vermittels eines EPP-Merkmals der Partikeln wäre eine (vielleicht nicht allzu interessante, aber mögliche) Repräsentation jederzeit durchführbar. Nimmt man zudem an, dass die Umgehung des FOFC ein möglicher syntaktischer Auslöser für die Bewegung der vP ist, so kann eine schon deutlich interessantere Vorhersage gemacht werden: Steigt die Anzahl der möglichen Wortstellungsvarianten eines Satzes mit der Anzahl der Partikeln, die im Satz auftreten? – Ist man hingegen der Meinung, dass Positionen zwischen Partikeln letztlich nicht hinreichend akzeptabel sind, so kann die Analyse unverändert beibehalten werden: Die vP bewegt sich in die SpecTP-Position, die sich oberhalb aller Partikeln befindet. Ich lasse die zwei Möglichkeiten an dieser Stelle gleichermaßen bestehen: Ein abschließendes Urteil darüber, wie gut ‚Scrambling zwischen Partikeln‘ ist, kann ich mir im Moment nicht bilden. Wie gesehen aber sind letztlich beide denkbaren Szenarien theoretisch leicht zu implementieren, sodass sich der Analyse an dieser Stelle in jedem Fall keinerlei Probleme in den Weg stellen werden. Zusammenfassend lässt sich feststellen, dass weder theoretische noch typologische oder allgemeine methodische Probleme die vorgeschlagene Analyse insgesamt als undurchführbar erscheinen lassen. Wie aber verhält sich ein modulares System wie das vorgeschlagene nun aber vis-a-vis der eingangs genannten empirischen Daten zum Scrambling? Wie in Teil III gezeigt wird, können die eingangs genannten Daten ganz unproblematisch erklärt werden – und zudem macht die Analyse eine ganze Reihe interessanter Vorhersagen, die langstehende Probleme der Scrambling-Forschung einer prinzipiellen Lösung zumindest ein wenig näher bringen.
III. Die Evidenz: Eigenschaften und empirische Vorhersagen der Analyse
9 Wozu eine weitere generative Analyse? Im letzten Teil der Arbeit soll gezeigt werden, dass der unterbreitete Vorschlag nicht nur ein technisches Problem der core syntax löst: Es geht, mit anderen Worten, der vorliegenden Arbeit nicht darum, die vielleicht etwas widerborstig erscheinende EoO-basierte Bewegungstheorie der aktuellen generativen Syntax zu retten. Vielmehr lässt sich zeigen, dass die Implementation von Scrambling vermittels zweier getrennter Operationen (nämlich EoO-konformen und EPPgetriebenen) bessere Vorhersagen zu den syntaktischen, phonologischen und semantischen Verhältnissen im Mittelfeld des deutschen Satzes erlaubt als die oben diskutierten älteren Analysen. Im folgenden sollen daher bestimmte Eigenschaften, die in der Diskussion immer wieder als zentral geführt wurden (und die auch in Teil I einführend beschrieben wurden) in je eigenen Kapiteln vorgestellt werden: – Kapitel 10 zeigt, dass die informationsstrukturellen Regularitäten des Mittelfelds des deutschen Satzes zwar aus der core syntax entfernt sind – aber deshalb mitnichten geleugnet werden sollen, oder nicht mehr erklärt werden können. – Die Kernsyntax wird dann in Kapitel 12 noch einmal summarisch vorgestellt. Wie sich zeigt ist die vorgeschlagene Aufgabenverteilung in der Gesamtarchitektur der Grammatik effizient: Die Syntax wird von Aufgaben entlastet, für die sie sich nicht eignet – und leistet besonders einfach diejenigen Aufgaben, die ihr tatsächlich zukommen. – Kapitel 11 zeigt, dass mit der vorgeschlagenen Architektur, die komplizierten satzsemantischen Verhältnisse, die das Scrambling verursacht, im Grunde recht einfach erklärt werden können: Zum einen sind EoO-getriebene Bewegungen der Grund dafür, dass Scrambling semantische Effekte haben kann. Zum anderen aber sind die Spellout-Vorgänge in der PF-Abbildung die Erklärung dafür, dass (und wie) die deutsche Wortstellung eben doch nicht insgesamt und generell semantisch transparent ist.
10 Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld Die in dieser Arbeit vorgestellte Analyse verzichtet vollständig darauf, syntaktische Operationen durch informationsstrukturelle Merkmale auszulösen. Dies mag – gerade vor dem Hintergrund der sehr weitreichenden Forschungsdiskussion in diesem Bereich – zunächst vielleicht sogar unverständlich erscheinen: Warum sollte das informationsstrukturelle Forschungsprogramm für das Deutsche aufgegeben werden? Wie oben gezeigt wurde, wird aber eine direkte Repräsentation der Informationsstruktur in der Syntax empirisch nicht nur nicht benötigt – sie erscheint in vielen Fällen einfach nicht der richtige Ansatz zu sein: – Die Positionierung von Topiks (bzw. von Elementen mit bestimmten topikalen Teileigenschaften) ist wesentlich freier, als diejenigen Autoren zugestehen, die dieser Klasse von Elementen eine fixe Position im Mittelfeld zuweisen möchten. – Die wenigen Fälle, in denen aus einer informationsstrukturellen Markierung eines Elementes indirekt (im Falle der kontrastiven Topiks) oder direkt (im Falle des Exponenten eines Informationsfokus) auf die syntaktische Position des Elementes geschlossen werden kann, lassen sich, wie gezeigt, auch phonologisch erklären. In diesem Sinne erscheint es methodisch angeraten, informationsstrukturelle Markierungen für die Beschreibung des Deutschen aus der Kernsyntax auszuklammern. Die syntaktische Theorie wird damit um Merkmale und Projektionen entlastet, die: – oft nicht einheitlich zu definieren waren (insbesondere: Topiks), – keinen eindeutigen Einfluss auf die Position des solchermaßen IS-markierten Elementes hatten (Topiks, Antifoki, kontrastive Topiks) und daher – zu einer mit Ausnahmen behafteten, teilweise idiosynkratisch gesteuerten core syntax geführt haben – entgegen den Annahmen und Zielen der derzeitigen syntaktischen Forschung. Es sei noch einmal explizit darauf hingewiesen, dass die vorliegende Analyse sich nicht anmaßt, Aussagen über das Deutsche hinaus aufzustellen. Für das Deutsche aber muss es meines Erachtens als erwiesen gelten, dass informationsstrukturelle Eigenschaften nicht in der core syntax figurieren: Keine einzige informationsstrukturell getriebene Bewegung in eine spezifische Zielposition konnte von den diskutierten Arbeiten letztlich überzeugend nachgewiesen werden.
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
185
Nun mag man einwenden, dass die Bewegung der vP selbst sehr wohl eine informationsstrukturell gesteuerte Ursache haben könnte: die vP besteht, in einem kohärenten Diskurs, u.U. zu großen Teilen aus diskursaltem Material: In den Lenerz‘schen Fragetests (vgl. 1977, 2001a, 2001b) etwa wird ja schon durch den testweise angenommenen Fragekontext die vP-Proposition meist zur diskursalten Information – abzüglich der Argumentstelle, die das erfragte (also f-markierte) Argument zu füllen hat. Ist die Bewegung der vP nach SpecTP demnach vielleicht die Bewegung einer Art von ‚verbalem familiarity-Topik‘? Ich glaube, dass auch diese IS-gesteuerte Annahme nicht richtig sein kann: Zunächst gilt sehr wohl, dass unter dieser Annahme die Bewegung der vP zumindest nicht als semantopragmatisch unplausibel dargestellt werden kann: Letztlich ist die Bewegung der vP nach SpecTP im genannten Szenario durchaus informationsstrukturell glaubhaft. Es ist allerdings darauf hinzuweisen, dass das vorgestellte Szenario nicht alle möglichen Fälle abdeckt: Auch in all-new-Sätzen muss nämlich die Spezifikatorposition der TP gefüllt werden. In diesen Sätzen aber ist auch die vP möglicherweise nicht diskursalt und sollte sich daher nicht nach SpecTP bewegen wenn diese Bewegung (ausschließlich) informationsstrukturell ausgelöst wird. Diese Option ist aber weder theoretisch wünschenswert, noch ist sie empirisch haltbar: – Die Generalisierung, dass die TP einen Spezifikator haben muss (das EPP von T, in seinen verschiedenen Formulierungen) wird hier nicht in jedem Fall umgesetzt. Damit entfernt sich die Analyse von wohletablierten Annahmen und wirkt daher syntaktisch exotisch. – Empirisch muss gelten, dass auch in diskursinitialen Kontexten das linke Mittelfeld nicht leer sein muss – und auch nicht nur solche Elemente enthält, die EoO-konform dorthin hätten bewegt werden können: 202. [Sprecher kommt zur Tür herein] Hast Du schon gehört? Dieses Jahr ist [der Papst] [Ostern] wohl nicht in ROM! 203. [Sprecher kommt zur Tür herein] Jatach. Kann ich [den Hippie, der sein Hollandrad an meinen neuen BMW gelehnt hat,] [einen ganz kleinen Moment] wohl mal sprechen? Unter der Annahme einer vP-TP-Bewegung sind auch Beispiele, in denen nur das Subjekt ins linke Mittelfeld bewegt wurde, für out-of-the-blue-Kontexte relevant: Auch dieses Argument wird in der vorliegenden Analyse ja nur als Teil der größeren Gesamt-vP nach SpecTP bewegt (wie gesehen letztlich deshalb, um die Erfüllung des EPP-Merkmals des T-Kopfes überhaupt einheitlich fassen zu können):
186
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
204. [Sprecher kommt zur Tür herein] a) Das glaubt [man] doch nicht! Inge! b) Heute hab [ich] wohl echt mal Glück gehabt. Man tut einer informationsstrukturell getriebenen Analyse auch dann keinen Gefallen, wenn man darauf hinweist, dass in den gerade gegebenen Beispielen auch Pronomina figurieren, denen eine ‚topikale‘ Referenz häufig zu eigen ist: Wie de Hoop für das Niederländische völlig richtig feststellt, argumentiert man damit nämlich im Kern für eine syntaktische Analyse der Umstellung von Pronomina. Mit Blick auf ein out-of-the-blue verwendetes Pronomen schreibt sie: „In [the given example, the pronoun] is introduced out of the blue. Yet, just like [other pronouns], it has to scramble. Obviously, then, the (almost) obligatory scrambling of pronouns is not only a consequence of their anaphoricity. The pronoun itself (its syntactic properties) forces scrambling rather than its discourse referentiality“ (2003: 205f.). Dieses Ergebnis ist eher für die Proponenten von Topikphrasen problematisch: Laut Erteschik-Shir gilt: „topics must be given“ (2007: 18). Wenn aber Pronomina ins linke Mittelfeld geraten können, ohne Gegeben zu sein, so ist das Merkmal [Topik] offenbar hier nicht der Auslöser der Bewegung, sondern eine inhärente Eigenschaft der Pronomina, die sie nicht informationsstrukturell inkompatibel macht mit out-of-the-blue-Kontexten. Wie sich zeigt, können also verschiedene Elemente auch in dieser Diskurskonstellation vor Modalpartikeln auftreten. Daher gilt, dass die Bewegung der vP nach TP zwar nicht in jedem Fall informationsstrukturell erwartet ist – sehr wohl aber durch das formale EPP-Merkmal in jedem Fall (unabhängig vom Diskurskontext) erzwungen werden kann. Nun soll dies nicht heißen, dass informationsstrukturelle Kategorien in der Beschreibung der Grammatik des Deutschen insgesamt nichts verloren hätten: Viele der Kategorien sind (selbst wenn sie sich als schwer definierbar erwiesen haben) als semanto-pragmatische Größen absolut nachempfindbar. Viele der oben diskutierten alternativen Analysen beschreiben hier durchaus korrekt, welche Präferenzen ein Sprecher in einer gegebenen Diskurssituation haben mag. Wie eingangs geschildert, ist jedoch die Präferenz eines konkreten Sprechers in einer konkreten Situation nicht das, was die generative Syntax Chomskys beschreiben möchte – vielmehr geht es um das Wissen eines idealisierten Sprechers darüber, welche grammatischen Ressourcen unabhängig von allen Verwendungskontexten in einer Sprache zur Verfügung stehen. In genau dieser Hinsicht machen die informationsstrukturell getriebenen Alternativanalysen eine schlechte Figur: Der Einfluss der Informationsstruktur auf die Syntax des Deutschen erscheint eingeschränkt, er zeigt sich bestenfalls indirekt und gebrochen, in jedem Falle aber als nachrangig gegenüber den genuin syntaktischen, satzsemantischen oder phono-
Die Position der Foki in der rechten vP-Kopie ist kein Zufall
187
logischen Kriterien. Mit dieser Einschätzung steht die Analyse nicht allein da. Büring etwa zieht eine scharfe Trennlinie zwischen syntaktischen Restriktionen und den Effekten der informationsstrukturellen Markierungen: Letztere scheinen oft nicht in der Lage zu sein, harte Ungrammatikalität zu erzeugen, wenn ihre Verwendungsrestriktionen missachtet werden (Büring 2006: 97). Auch Molnarfi argumentiert, dass die Schnittstellenmerkmale, die seiner Analyse zugrunde liegen, anders zu bewerten sind als kernsyntaktische Merkmale: „Other than core features [...], the (non)checking of peripheral features can only affect the contextual markedness, but not the basic computability of the derivation“ (2004: 365). Musan sagt selbst mit Bezug auf das Scrambling von Informationsfoki: „Es geht hier nicht darum, ob ein Satz vollkommen grammatisch oder ungrammatisch ist. Vielmehr geht es eher darum zu sagen, ob ein Satz ‚besser‘ oder ‚schlechter‘ ist als ein anderer“ (2002: 201). Letztlich geht die Unterscheidung zwischen Scramblingrestriktionen und anderweitigen syntaktischen Regeln sogar zurück bis zur ersten Erwähnung des Begriffes Scrambling bei Ross: „In short, it is clear that rules like [the scrambling transformation] are so different from other syntactic rules that have been studied in generative grammar that any attempt to make them superficially resemble other transformations is misguided and misleading. They are formally so different from previously encountered rules that the theory of language must be changed somehow so that Scrambling can be placed in a different component from other syntactic rules, thereby formally reflecting the differences I have been discussing“ (1967: 43, Hervorhebung im Original). Ich möchte daher nicht etwa vorschlagen, die Informationsstruktur aus der Beschreibung des Deutschens zu verbannen, sondern – was vermutlich kontrovers genug ist – sie abzugrenzen und auszunehmen von der core syntax und dem Lexikons des Deutschen. Ist dies ein Widerspruch in sich? Steht die vorgestellte Analyse einer Repräsentation der informationsstrukturellen Verhältnisse im Mittelfeld nicht im Wege, wenn sie keine informationsstrukturellen Merkmale und Projektionen in der Syntax zulässt? In den nun folgenden Unterkapiteln soll gezeigt werden, dass das Gegenteil der Fall ist.
10.1 Die Position der Foki in der rechten vP-Kopie ist kein Zufall Die Analyse nimmt an, dass die Berechnung der Distributed Deletion der vP eine Regel für Foki vorsieht: Informationsfoki sollen im Normalfall in der unteren Kopie der vP ausbuchstabiert werden (vgl. aber Unterkapitel 10.5. für ein abweichendes Szenario). Diese PF-Regel repräsentiert die Erkenntnis, dass Informationsfoki tendentiell nicht per Scrambling umgestellt werden sollen (Lenerz 1977,
188
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
2001a, 2001b). Aber kann die Analyse diesen Zusammenhang letztlich ohne Stipulation erklären? Zum einen mag die Plazierung des Fokusexponenten in dieser Position Gründe haben, die in der Natur der PF (oder vielleicht sogar der Phonetik) liegen: Es ist ja nicht nur das Deutsche, welches die Hauptbetonung eines Satzes weit an das Ende des Satzes verschiebt (vgl. z.B. Cinque 1993), eine sprachspezifische Stipulation liegt also nicht vor. Zum zweiten lässt sich auch satzsemantisch zumindest plausibler machen, warum die Spellout-Domäne eines [Fokus]-markierten Elements im Normalfall die tiefe Kopie der vP zu sein hat: Diese vP-Kopie entsteht – im Gegensatz zur hohen Kopie – durch external merge, da mit der Projektion der verbalen Argumente die Derivation ihren Anfang nimmt. External merge wird aber, wie eingangs erwähnt, von der semantischen Komponente der grammatischen Architektur als Hort der Argumentprojektion interpretiert. Mit anderen Worten: Die Markierung des [Fokus] in der tiefen vP-Kopie lässt sich nicht nur so lesen, dass hier z.B. eine DP (John, Mary,...) fokussiert wird. Vielmehr kann die Position der Verkettung der DP als betont beschrieben werden – und mit anderen Worten die Tatsache, dass hier ein Argument des Prädikats betont wird. Tatsächlich gilt ja nicht immer, dass das fokusmarkierte Element per se diskursneu zu sein hat, wie Krifka zeigt (2007: 29): 205. A: Who stole the cookies, John or Mary? B: JOHN stole the cookies. In diesem Beispiel kann der Fokusexponent, John, keinesfalls als diskursneu dargestellt werden – er ist durch die Frage ja wörtlich vorerwähnt! Krifka trifft daher die folgende, meines Erachtens absolut überzeugende Einschätzung: One might say that what is new in [this sentence] is not John, or the expression John, but the information that John satisfies the description x stole the cookie (ebd.).
Um diese Aussage etwas anders auszudrücken: im Satz B ist überhaupt kein Argument per se neu, noch ist das Prädikat neu. Sehr wohl neu ist aber das syntaktische Konstrukt, welches durch die Verkettung von Argument und Prädikat per external merge entsteht. Mit anderen Worten, es zeigt sich dass ein Argument „wiewohl nicht neu sui generis, neu im Satzzusammenhang“ (Büring 2006: 151) sein kann. Ich gehe daher davon aus, dass die tiefe vP-Domäne (als Hort der Argumentinterpretation) nicht zufällig für den Spellout eines Informationsfokus gewählt wird. Betont wird in vielen Fällen, dass eine Argumentphrase die Proposition wahr macht, wenn sie als Argument in einer offenen Stelle der Proposition
Die bevorzugte Position der kontrastiven Topiks ist kein Zufall
189
per external merge verkettet wird. Wird dieses semantische Szenario diachron generalisiert, ergibt sich eine nicht unplausible Begründung dafür, dass Foki im Regelfall in der tiefen vP-Kopie auszubuchstabieren sind. Im dem Ausmaß, wie Sprachen syntaktisch rechtsverzweigend sind, ergibt sich aus die Platzierung von Fokusexponenten damit aus Maßgaben der externen Verkettung von Argumenten innerhalb der vP. Auch prosodisch ist eine Positionierung des Fokusexponenten zum Satzende hin keine Stipulation der hier vorgeschlagenen Theorie: Im Gegenteil ist diese Positionierung für verschiedenste Sprachen von verschiedenen Autoren völlig unabhängig beschrieben worden (vgl., neben vielen anderen, Höhle 1982, Cinque 1993, Zubizarreta 1998, Büring 2001).
10.2 Die bevorzugte Position der kontrastiven Topiks ist kein Zufall Ähnlich wie die Position der Informationsfoki scheinen mir die Stellungspräferenzen von kontrastiven Topiks PF-bezogenen Regularitäten zu unterliegen: Wie bereits diskutiert versucht die PF, die korrekte Form (rise vor fall) und die Länge der intonatorischen Brücke durch einen geeigneten Spellout sicherzustellen. Es ist tatsächlich auffällig, dass diese Abfolge in Deklarativsätzen die einzig mögliche ist. Selbst in Entscheidungsfragen, die in einem intonatorischen Anstieg enden, kann keine Intonation ‚fall vor rise‘ erzielt werden – die Hutkontur ist in diesen Satztypen insgesamt nicht möglich (vgl. ähnlich schon Jacobs 1996). Zusätzlich aber kann man darauf hinweisen, dass die im letzten Abschnitt vorgestellte Idee von interpretativen ‚Domänen‘ im Satz hier keinen Widerspruch herbeiführt: Wenn die tiefe Kopie der vP eine Argument-Prädikatsdomäne ist, so sollte die obere Kopie der vP dies nicht sein – sie ist ja per internal merge deriviert! Die Betonung eines Elementes in dieser Domäne kann daher auf keinen Fall als Informationsfokus verstanden werden. Wird daher ein kontrastives Topik im linken Mittelfeld ausbuchstabiert, so mag dies primär phonologische Gründe haben (wie gesehen: z.B. die Länge der Hutkontur). Die Positionierung ist aber auch semantisch nachvollziehbar und führt damit zu einer (in Teilen) transparenten Abbildung semantischer Aspekte auf die Wortstellung. Die vorliegende Analyse erklärt auf diese Weise, wann und warum manche Elemente tatsächlich in bestimmten Diskurssituationen distributionell eingeschränkt sind: In ihrer Positionierbarkeit im Diskurs restringiert sind informationsstrukturell markierte Phrasen im Deutschen genau dann, wenn ihre informationsstrukturelle Markierung intonatorische Konsequenzen hat: Fokusexponenten und Kontrasttopiks werden intonatorisch markiert (per fall bzw. rise)
190
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
und unterliegen daher Restriktionen, die sich aus der intonatorischen Kontur des Satzes ergeben. Topiks und Antifoki (so es insbesondere letztere überhaupt im Deutschen gibt), tragen keine besondere intonatorische Markierung und können daher nach rein syntakto-semantischen Kriterien positioniert werden. Dabei erweist sich das Deutsche im typologischen Vergleich als völlig unauffällig, wenn es z.B. dem Merkmal [Fokus] eine klarere Rolle zuweist als dem Merkmal [Topik]: „Intonational focus marking, where it exists, is strictly required. Topic marking, by movement to the left periphery, is more often optional“ (Erteschik-Shir 2007: 85).
10.3 Diskursneue Elemente können auch im linken Mittelfeld auftreten Die Berechnung des Spellouts der vP sieht vor, dass Fokusexponenten nicht in der höheren vP-Kopie ausbuchstabiert werden können. Wird daher ein Satz dargeboten, der einen Fokusexponenten im linken Mittelfeld aufweist, so kann dieser Fokusexponent nicht innerhalb der hohen Kopie der vP stehen. Ein Fokusexponent dieser Art muss daher einzeln, id est EoO-konform, bewegt worden sein. Tatsächlich macht diese Annahme die richtige Vorhersage, wenn es um die bereits hinlänglich diskutierten Skopusfragen geht. Fokusexponenten im linken Mittelfeld rekonstruieren nämlich offenbar nicht, sondern weisen den Skopus auf, der ihrer Oberflächenposition entspricht: 206. A: Betrunkene Ärzte leisten nach meiner Erfahrung keine gute Arbeit am Patienten leistet. B: Das glaube ich auch. Ich kann aber die Tragweite nicht richtig einschätzen: Wem würde ein be/TRUNKener Arzt denn NICHT\ helfen können? A: Ein betrunkener Arzt würde ALL\en Patienten nicht helfen. Mir scheint, dass hier nur die Interpretation zulässig ist, die durch den Skopus des Allquantors über die Negation entsteht: Der betrunkene Arzt hilft keinem einzigen Patienten – obwohl die alternative Interpretation (der betrunkene Arzt hilft einigen, aber nicht allen Patienten) in der gegebenen Diskurssituation durchaus eine zufriedenstellende und kohärente Antwort darstellen würde – wie die Kohärenz des folgenden Vergleichsdiskurses zeigt:
Rekonstruktion der (vermeintlichen) Topikbewegung
191
207. B: Wem würde ein be/TRUNKener Arzt denn NICHT\ helfen können? A: Ein betrunkener Arzt hilft nicht ALL\en Patienten. Für die Fokusmarkierung im Mittelfeld des deutschen Satzes ergibt sich damit das erwünschte Ergebnis: Foki stehen üblicherweise im rechten Mittelfeld, können aber genau dann ins linke Mittelfeld gelangen, wenn sie EoO-konform dort hinbewegt werden.
10.4 Rekonstruktion der (vermeintlichen) Topikbewegung „Just because you feel it, doesn‘t mean it‘s there.“ (Radiohead: There, There) „Just because you feel it, doesn‘t mean it‘s syntax.“ (Struckmeier 2014)
Wie oben geschildert besteht in der linguistischen Erforschung des Phänomens Scrambling eine langstehende Tradition die versucht, Scrambling als syntaktische Bewegungen von informationsstrukturell ausgezeichneten Satzbestandteilen darzustellen (wie bereits o.a. sind dies z.B. Frey 2004, Meinunger 2000, Molnarfi 2002 usw.). Wie ebenfalls bereits geschildert lehnt die vorliegende Arbeit die Voraussagen dieser Analysen als zu hart ab: Topikale oder antifokale Elemente bewegen sich zwar gerne und häufig ins linke Mittelfeld, müssen dies jedoch nicht in jedem Fall tun. In den folgenden Unterkapiteln soll kurz gezeigt werden, dass aber die Tendenz ‚diskursalter‘ oder nicht-fokussierter Elemente, im linken Mittelfeld zu erscheinen, auf verschiedene Weisen auch in der hier vorgeschlagenen Analyse indirekt nachzeichnen lässt.
10.4.1 Phonologische Ressourcen der Berechnung der Distributed Deletion Die vorgeschlagene Analyse verzichtet darauf, ein informationsstrukturell definiertes syntaktisches Merkmal [Topik] anzunehmen. Ich halte es tatsächlich für falsch, diesen Begriff als Merkmal in die Syntax einzuführen. Nichtsdestotrotz stimme ich zu, dass A‘ im folgenden Beispiel um eine Nuance ‚flüssiger‘ wirken mag als A: 208. F: Wem hast Du das Buch gegeben? A: Ich habe dem StuDENTEN das Buch gegeben. A‘: Ich habe das Buch dem StuDENTen gegeben.
192
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
Wie lassen sich diese Effekte in der vorgeschlagenen Analyse replizieren – selbst wenn diese keine [Topik]-Merkmale, TopPs oder ähnliches vorsieht? Darüber hinaus ist zu fragen, wie eine Präferenz überhaupt repräsentiert werden kann – wenn die syntaktische Komponente letztlich für beide Sätze (A wie A‘) konvergierende Derivationen bereitstellt. Mit anderen Worten: Wenn keine kernsyntaktische Unterscheidung zwischen A und A‘ hinsichtlich ihrer Grammatikalität besteht, kann dann die PF-Komponente dann für die Präferenz von A‘ über A verantwortlich gemacht werden? Die Intonation eines Satzes spielt eine wichtige Rolle dafür, wo bestimmte Argumente (und insbesondere auch definite DPen) im Satz auftreten. Scrambling ist, verschiedenen Analysen nach, oft ganz oder in Teilen prosodisch motiviert (vgl. z.B., unter vielen anderen Autoren, Büring 2001, Molnarfi 2002). Die vorliegende Analyse repräsentiert diesen Fakt indirekt dadurch, dass in der Derivation eines Satzes zwangsläufig eine große Anzahl von Kopien der Argumente erzeugt werden. Durch die obligatorische Bewegung der vP nach SpecTP liegt nämlich mindestens jedes Argument mindestens zweimal vor: 209. [TP [vP Subj iO dO] (Partikeln) [vP Subj iO dO]] Treten zusätzliche (EoO-getriebene) Bewegungen auf, oder werden Argumente (oder auch die vP) nach SpecCP weiterbewegt, so steht für bestimmte Argumente sogar eine noch größere Anzahl von Kopien bereit. Diese Kopien sind aus Sicht der Syntax allesamt relevant, eine prinzipielle Unterscheidung (vergleichbar der Trennung von bewegten Elementen und von der Bewegung hinterlassenen Spuren) findet damit im Rahmen der aktuellen Theorie nicht mehr statt: Das bewegte Element befindet sich in jeder Position, in der eine Kopie des Elementes steht. Aus der Annahme, dass die Syntax also die Position bewegter Elemente im Grunde ‚unterspezifiziert‘, eröffnet sich andererseits die Möglichkeit, dass die PF-Komponente (nach ihren eigenen, z.B. prosodischen Gesetzmäßigkeiten) Auswahloptionen bezüglich der Positionierung dieser Argumente erhält: Da die PF-Komponente die auszubuchstabierende Kopie auswählt, sollte sie dies nach ihren eigenen Gesetzen und auf der Basis der für sie relevanten Eigenschaften tun. Wie aber kann die PF-Komponente aus einer Vielzahl von Kopien einerseits diejenigen auswählen, die die semantisch beobachtbaren Lesarten ausdrücken, zum anderen aber auch die Spellouts von ‚hohen‘ Argumentkopien durchführen, die rein prosodisch motiviert zu sein scheinen? Die folgenden Unterkapitel geben einen Überblick über die Zusammenhänge: – In Unterkapitel 10.4.1.1 wird gezeigt, dass die Abbildung der interpretativ relevanten Bewegungen (z.B. der EoO-lizensierten Scrambling-Bewegungen) letztlich durch gesamtgrammatische Prinzipien sichergestellt werden muss.
Rekonstruktion der (vermeintlichen) Topikbewegung
–
193
Die Abbildung der linearen Wortstellung auf semantische Lesarten ist zwar bei weitem nicht perfekt (oder gar eineindeutig, man denke nur an strukturell ambige lineare Sequenzen oder quantifier raising, Rekonstruktion, usw.), aber dennoch sollte sicher gestellt sein, dass die PF-Ausgabe einer Derivation zumindest die Zusammenhänge zwischen Form und Funktion abbildet, die eben doch nachzuweisen sind. In Unterkapitel 10.4.1.2 hingegen wird diskutiert, über welche genuin phonologischen Ressourcen die PF bezüglich der Distributed Deletion der vP in SpecTP verfügen mag: Welche Faktoren begünstigen einen ‚hohen‘ Spellout einer Argumentphrase? Welche Faktoren begünstigen einen ‚tiefen‘ Spellout – und warum?
10.4.1.1 EoO-Bewegungen in der phonologischen und interpretativen Komponente Beziehungen zwischen der interpretativen und der phonologischen Komponente sind immer darauf angewiesen, dass diese beiden Komponenten nicht zu stark divergieren. Das heißt, dass die zwei (prinzipiell ja modular getrennt operierenden) Komponenten Repräsentationen erzeugen müssen, die sich transparent aufeinander abbilden lassen. Zusammenhänge dieser Art bestehen, wie oben bereits mehrfach gezeigt, im Deutschen auch tatsächlich häufig: Die Tatsache, dass Freys Skopusprinzip (zumindest unter Verumfokussierung) tatsächlich greift, unterstreicht ja nichts anderes, als dass die syntaktischen Umstellungen, die zur Skopusambiguität durch Scrambling führen, phonologisch auch repräsentiert werden. Mit anderen Worten: Wird durch EoO-konformes Scrambling ein Element aus der vP herausbewegt (und erreicht so einen höheren Skopus für die semantische Komponente), so muss es auch phonologisch in seiner ‚hohen‘ strukturellen Position ausbuchstabiert werden (was sich in einer Änderung der linearen Abfolge in der phonologischen Komponente niederschlägt). Wäre dies nicht der Fall (könnten EoO-konform bewegte Phrasen auch in ihrer Basisposition ausbuchstabiert werden), so müsste auch die Basisabfolge skopusambig sein – was sie aber, wie gesehen, zumindest unter Verumintonation nicht ist. Das Deutsche unterscheidet sich hier nota bene auffallend etwa vom Englischen: Das Englische ist, wie May zeigt, in allen Konstruktionen skopusambig, in denen QPen in Konfigurationen auftreten, aus denen sie syntaktisch heraus bewegt werden könnten (1977, 1985). Damit scheint es keine universalgrammatischen Restriktionen zu geben, die für jede Sprache (oder sogar jede Konstruktion jeder Sprache) eine eineindeutige Abbildung der semantischen auf die phonologische Repräsentation erlaubt. Wie aber z.B. Frey 1993, Wurm-
194
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
brand (2008) oder Bobaljik & Wurmbrand (2012) zeigen, scheint das Deutsche eine Sprache zu sein, bei dem zumindest die Abbildung der Skopusverhältnisse auf die lineare Wortstellung in Teilen als transparent zu bezeichnen ist. Für das Deutsche (und ähnlich ‚skopustransparente‘ Sprachen) muss daher für PF-Derivationen gelten, dass z.B. der Satz ich glaube, DASS mindestens ein Professor fast jeden Studenten kennt im folgenden Beispiel aus Szenario (a) folgt, nicht aber aus Szenario (b): 210. a) [TP ...[Subj mindestens ein Professor] ... [Obj fast jeden Studenten] kennt] b) [TP ...[vP [fast jeden Studenten] [vP [mindestens ein Professor] [Obj fast jeden Studenten]]] kennt] Diese Problematik wird nota bene nicht durch die vorliegende Analyse (oder die Annahme einer vP-TP-Bewegung) erzeugt: Sie ist das Ergebnis der Annahme, dass durch die copy theory of movement von jedem bewegten Element prinzipiell mehrere Kopien existieren die identisch sind – und damit a priori auch alle gleichermaßen dafür geeignet sind, auf PF ausbuchstabiert zu werden. Die ältere Theorie ließ Bewegungen Spuren hinterlassen, die prinzipiell nicht für die PFAussprache relevant waren. Damit soll nun nicht gesagt werden, dass die neuere Theorie ‚weicher‘ sei, oder das Verhältnis der phonologischen und der semantischen Komponente verunklare: Es sei daran erinnert, dass auch zu GB-Zeiten ähnliche Diskrepanzen theoretisch vorgesehen waren: Durch die Möglichkeit der coverten Bewegung auf der einen Seite wird eine semantisch mit ‚hohem‘ Skopus interpretierte Phrase oberflächlich in-situ, also ‚tief‘, ausbuchstabiert. Durch die Operation der Rekonstruktion auf LF wird im Gegenzug eine phonologisch ‚hohe‘ Phrase (genauer: Eine Phrase, die in ihrer syntaktischen Zielposition ausbuchstabiert wird) dennoch semantisch ‚tief‘ (also z.B. mit engem Skopus) interpretiert. Mit anderen Worten haben beide Theoriestände Mittel und Wege, einen wichtigen empirischen Fakt zu erklären: Nicht alle Wortstellungsfakten in allen Sprachen folgen direkt aus semantischen Erklärungen und nicht alle semantischen Unterscheidungen werden direkt in overten Wortstellungsänderungen ausgedrückt. Der Zusammenhang zwischen syntaktischen Bewegungsoperationen und interpretativen Effekten ist damit in keiner der beiden Theorien eineindeutig (vgl. ähnlich auch Bobaljik 2002: 199):
Rekonstruktion der (vermeintlichen) Topikbewegung
195
211. Schnittstelleneffekte von Bewegungen im Government and Binding:
Interpretation als ‚bewegt‘
OberflächenPosition ‚hoch‘
OberflächenPosition ‚niedrig‘
Overte Bewegung (z.B. A-Bewegungen)
Coverte Bewegung (z.B. QR)
Interpretation der Basis- Rekonstruktion position (z.B. A‘-Bewegung)
keine Bewegung
212. Schnittstelleneffekte von Bewegungen in aktuellen Theorien: Hohe PF-Position
Tiefe PF-Position
Interpretation ausserhalb der Basis-position
PF-Spellout: hohe Kopie, Interpretation: hohe Kopie
PF-Spellout: niedrige Kopie, Interpretation: hohe Kopie
Interpretation in der Basisposition
PF-Spellout: hohe Kopie, Interpretation: niedrige Kopie
keine Bewegung (oder lower right corner effect, vgl. Bobaljik 2002)
Ausmaß und Grenzen dieser (aus funktionaler Sicht teilweise problematischen) Entkopplung von Wortstellung und semantischem Effekt sind im Moment noch ein schwieriges Problem der syntakto-semantischen Forschung. Für die Abbildung EoO-konformer syntaktischer Bewegungen muss daher auf die Arbeiten anderer Autoren verwiesen werden, die zumindest versuchen, das mögliche Ausmaß von Diskrepanzen zwischen linearer Abfolge und semantischer Interpretation zu beschreiben und zu erklären. Auf der einen Seite sind dies ältere Arbeiten (May 1977, 1985, Frey 1993), die versuchen, die interpretativen Effekte auf verschiedenen Ebenen der GB-Architektur (Tiefenstruktur, Oberflächenstruktur, LF) anzusiedeln. Auf der anderen Seite wird in aktuelleren Arbeiten versucht, gesamtgrammatische Abbildungsverhältnisse oder derivationelle Restriktionen über Bewegungsoperationen zu etablieren, die die Zusammenhänge zwischen phonologischer und semantischer Komponente ausdrücken (vgl. wiederum z.B. Wurmbrand 2008, Bobaljik & Wurmbrand 2012 sowie Literatur darin).
196
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
Die vorliegende Arbeit greift dem Ergebnis dieser Forschung nicht vor und liefert daher keine abschließende Erklärung für dieses Verhalten des Deutschen. Es gilt aber zu repräsentieren, dass das Skopusprinzip Freys (also die Aussage, dass EoO-konformes Scrambling direkt phonologisch abgebildet wird) im Großen und Ganzen für das Deutsche zutrifft. Elemente, die semantisch relevant (also: EoOkonform, einzeln) syntaktisch bewegt werden, müssen daher in einer Position ausbuchstabiert werden, die der semantischen Konstellation entspricht, die durch diese Umstellung erreicht wird. EoO-konforme Bewegungen implizieren also, dass der PF-Komponente eine Spellout-Anweisung dergestalt übermittelt wird, dass ein EoO-konform umgestelltes Element nicht in seiner Basiskopie ausbuchstabiert werden darf. Die weitere Forschung muss zeigen, inwieweit selbst von dieser (funktional wünschenswerten) Transparenz zwischen semantischer und phonologischer Komponente auch im Deutschen noch abgewichen werden muss. Für die nicht EoO-konformen Umstellungen von Argumenten innerhalb der vP zeichnet sich aber ein anderes Bild ab: Mit diesen Umstellungen werden ja, wie oben gezeigt, keine semantischen Effekte erreicht. Damit liegen keine EoOkonformen Bewegungen einzelner Argumentphrasen o.ä. vor – und damit wiederum keine (aus Bindung oder Skopus folgenden) Linearisierungsvorschriften, die die PF bei der Distributed Deletion der vP zu beachten hätte. Welche Kriterien lassen sich also für die Distributed Deletion der vP annehmen?
10.4.1.2 Phonologische Kriterien für die Distributed Deletion der vP In der aktuellen syntaktischen Forschung werden phonologische Faktoren für die Wortstellung des Deutschen oft ignoriert. Der Grund für Ansätze dieser Art ist vermutlich, dass die Maßgabe no look-ahead auf den ersten Blick genau diesen Typ Wortstellungsfaktor zu verbieten scheint: Wenn eine phonologische Größe direkt als Auslöser der Bewegung interpretiert wird, so wird eine Schnittstelleneigenschaften der PF dazu genutzt, eine Derivation zu beeinflussen, die (lokal) nicht über diese Informationen verfügen kann: Insofern z.B. prosodische Eigenschaften sich nur für komplexe syntaktische Objekte bestimmen lassen, können die Operationen, die diese Objekte bilden, nicht auf ihr eigenes Endergebnis ‚vorausschauen‘. Dies führt bei der Implementation von phonologisch motivierten Umstellungen zu den bereits genannten Problemen: Die oben geführte Diskussion zu den Vorschlägen Molnarfis hob ja gerade darauf ab, dass phonologische Eigenschaften nicht als Merkmale in der Syntax figurieren sollen. Nicht-Fokussiertheit als bewegungsauslösendes [Antifokus]-Merkmal zu kodieren widerspricht der Maßgabe des no look-ahead eklatant. In der vorliegenden Arbeit aber gibt es keine phonologischen Auslöser für syntaktische Bewegungen: EoO-konforme Bewegungen werden semantisch lizensiert,
Rekonstruktion der (vermeintlichen) Topikbewegung
197
und EPP-getriebene Bewegungen werden formal-syntaktisch lizensiert. Unter die letzte Kategorie fallen Wh-Bewegungen etc. – und eben auch die vP-Anhebung in die SpecTP-Position. Die vorliegende Analyse strebt also an, die beobachtbaren Einflüsse der Prosodie auf die Wortstellung des Deutschen gewissermaßen ‚subtraktiv‘ zu erklären: Die Syntax steuert (nach ihren eigenen Regeln) eine Auswahl syntaktischer Kopien durch Bewegungsoperationen bei. Sie betreibt keinen look-ahead und beeinflusst daher die phonologischen Eigenschaften der erzeugten Argumentkopien nur dann, wenn dadurch grammatikübergreifende Verbindungen zwischen der interpretativen und der phonologischen Komponente ausgedrückt werden müssen – bei EoO-konformen Bewegungen werden, wie im letzten Unterkapitel diskutiert, der PF-Komponente Linearisierungsanweisungen mitgegeben. Die PF-Anweisungen stellen nun aber keinen look-ahead nach PF dar – sie sind ja im Gegenteil das Ergebnis, nicht die Ursache einer EoOkonformen Bewegung. Für EoO-konforme Bewegungen folgt die PF-Komponente also den Anweisungen der Syntax – und nicht umgekehrt. Für Bewegungen ohne EoO aber gilt: Die PF-Komponente entscheidet nach ihren eigenen Kriterien, welche Kopien overt ausbuchstabiert werden. Für die nicht EoO-getriebenen Bewegungen heißt dies, dass auf der Schnittstelle ohne look-ahead phonologisch-prosodische Faktoren zusammengetragen werden können, die die ‚hohe‘ Ausbuchstabierung einer Phrase begünstigen.
10.4.1.2.1. Bessere Akzentdomänen als Faktor für Spellout-Entscheidungen Als besonders einschlägig für nicht-semantische Bewegungen haben sich (nicht nur) in der vorliegenden Arbeit immer wieder die definiten DPen erwiesen: – Werden definite DPen in verschiedenen Konstellationen angeordnet, so ergeben sich oft keine neuen Bindungskonfigurationen (R-Ausdrücke haben immer frei zu sein). – Zudem wird durch das Scrambling von definiten DPen oft auch kein skopaler Effekt erzielt (da DPen keine Skopoi im klassischen Sinne nehmen müssen). – Definite DPen erfahren zudem keine semantische Umdeutung (vergleichbar dem Generizitätseffekt bei der Umstellung indefiniter DPen). Für diese Art von bewegten Argumenten liegen damit besonders häufig keine Spellout-Restriktionen vor, die sich aus den interpretativen Eigenschaften der Strukturen ergeben. Definite DPen sind damit ein ideales Testfeld für die Frage nach der Arbeitsweise der PF-Komponente: Welche genuin phonologischen Faktoren können also für definite DPen geltend gemacht werden, sodass sich gerade diese Argumente frei umstellen zu können scheinen? Das folgende Beispiel illustriert das Phänomen (Bsp. Büring 2001: 90):
198
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
213. Who did you give the money to? a) Ich habe dem KaSSIERer das Geld gegeben. b) Ich habe das Geld dem KaSSIERer gegeben. Wie bereits gesagt, sind beide Antworten prinzipiell möglich. Antwort (b) scheint aber leicht präferiert zu sein – warum könnte dies so sein? Wie oben argumentiert scheinen ja weder kernsyntaktische noch diskurspragmatische Gründe vorzuliegen, die Antwort (a) etwa als ungrammatisch oder diskursinkohärent auswiesen. Könnte es demnach vielleicht sein, dass sowohl Antwort (a) wie Antwort (b) gleichermaßen grammatisch und diskurskohärent sind – das aber Antwort (b) im eigentlichen Sinne des Wortes besser klingt? In Untersuchungen zur prosodischen Gliederung von Sätzen werden verschiedene prosodische Kategorien ineinander eingebettet. Büring (2001) verwendet für das Deutsche das folgende System: – Lexikalische Köpfe bilden ein prosodisches Wort (PWd, ggf. zusammen mit leichterem Material, etwa funktionalen Elementen, vgl. Büring 2001: 78ff, ähnlich auch Büring 2007). – Prosodische Wörter gruppieren sich zu größeren Akzentdomänen (AD, vgl. Büring 2001:78, 2007, für das Deutsche ähnlich schon die Akzentdomänen in Uhmann 1991, vgl. auch Literatur darin für ältere Vorläufer dieses Vorschlags). – Die Akzentdomänen gruppieren sich wiederum zu größeren Intonationsphrasen (iP, vgl. Büring 2001: 78, Büring 2007). Wie schon in Selkirk (1984) betten die größeren prosodischen Kategorien die kleineren nicht-überlappend und nicht-rekursiv ein. Für die VP dem Kassierer das Geld gegeben etwa ergibt sich (unter Normalbetonung des direkten Objektes) nach Büring daher folgende prosodische Struktur (vgl. 2001:78): 214. ... x )iP ( x ) AD ( x )PWd dem KassIERer
( (
x )AD x )PWd das GELD
(x) PWd geGEBen
Die Großschreibung der Silben entspricht bei Büring der relativen Betonung dieser Silben: In der DP dem Kassierer etwa (die ein phonologisches Wort darstellt), fällt die Betonung, wie angezeigt, auf die zweite Silbe des nominalen lexikalischen Kopfes KassIERer. Ähnlich ergeben sich auch die relativen (PWd-) Betonungen für die direkte Objekts-DP sowie das Verb, das die beiden Argumente projiziert.
Rekonstruktion der (vermeintlichen) Topikbewegung
199
Auf der nächsthöheren prosodischen Ebene werden die Prominenzverteilungen innerhalb der zwei Akzentdomänen berechnet. Ein Prädikat (wie das Verb gegeben) teilt seine Akzentdomäne mit (mindestens) einem seiner Argumente (hier: dem direkten Objekt das Geld). Das Prädikat ist aber innerhalb der so entstehenden Akzentdomäne weniger prominent als das Argument (vgl. u.a. Uhmann 1991: 233, Zubizarretas Revised NSR, 1998: 49ff., Schwarzschilds HeadArg, 1999 : 173, sowie Bürings Argument-over-Predicate, 2001: 80). Damit fällt die Prominenz in der syntaktischen Verbindung von Verb und direktem Objekt dem letzterem zu. Auf der nächsten prosodischen Ebene, der Intonationsphrase, wird die am weitestens rechts stehende AD-Betonung (hier auf GELD) zur prominentesten Betonung (Bürings iP-Head-Right, 2001: 82, vgl. schon Uhmanns Endakzentstärkung, 1991: 179). Wie aber kann diese Bildung von prosodischen Domänen dabei helfen, die Wortstellung des Deutschen zu beschreiben? Wie leicht erkennbar ist, ist die Wortstellung insofern natürlich relevant für die Prosodie, als dass sie Vorgaben dazu macht, in welcher Reihenfolge das lexikalische Material im Satz vorliegt, über dem sich die intonatorischen Ebenen aufspannen. Mit anderen Worten: Je nachdem, welche Wortstellung vorliegt, werden die von Büring diskutierten prosodischen Prinzipien zu je unterschiedlichen Berechnungen der prosodischen Struktur angeleitet. Mit Blick auf das hier diskutierte Beispiel gilt daher: – In dem Fall, dass das direkte Objekt umgestellt wird, rückt das indirekte Objekt näher an den rechten Rand des Satzes: – Ich habe [das Geld] [dem KassIERer] gegeben. – Bleibt das direkte Objekt in seiner Basisposition, kann der Fokusexponent nicht ganz an den rechten Rand des Satzes rücken: – Ich habe [dem KassIERer] [das Geld] gegeben. Beide Wortstellungen sind nach Büring (wie auch nach meiner eigenen Einschätzung) grammatisch und diskurskohärent. Das Scrambling des direkten Objekts das Geld scheint also in diesem Sinne ‚optional‘ zu sein. Wirklich optional ist die Umstellung aber eigentlich nur hinsichtlich der Kriterien, die in älteren Analysen als ursächlich für Scrambling angesetzt wurden: Eine syntakto-semantische Begründung (etwa in Form eines Skopus- oder Bindungs-EoO, vgl. Hinterhölzl 2004) kann für das Scrambling nicht ursächlich sein, da sich durch das Scrambling, wie bereits gezeigt, gar keine neuen Skopoi oder Bindungsoptionen ergeben. Auch informationsstrukturell scheinen die Sätze äquivalent zu sein: Da beide Sätze diskurskohärent und grammatisch sind, können ‚topikale‘ Bewegungen (wie z.B. bei Meinunger 2000, Frey 2004) hier zumindest nicht zwingend nötig sein – und fallen damit in der Argumentation der vorliegenden Arbeit als Auslöser für die Umstellung aus. Interessanterweise aber würde (in diesem Fall) der Vor-
200
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
schlag Molnarfis (vgl. z.B. 2002) hier eine in Teilen bessere Vorhersage machen: Die prosodischen Eigenschaften der Strukturen nämlich sind nicht identisch: Das Scrambling des direkten Objektes scheint dadurch begünstigt zu werden, dass das unakzentuierte phonologische Material des direkten Objekts damit in gewisser Weise ‚aus dem Weg geschafft‘ wird, sodass der Fokusexponent, das indirekte Objekt, weiter an den rechten Rand des Satzes treten kann. Wie oben gesehen ist Molnarfis Vorschlag nun aber wesentlich zu hart formuliert: Das Scrambling des direkten Objektes kann ja eben nicht erzwungen werden – was aber für eine (obligatorische, EPP-getriebene) syntaktische Bewegung vorhergesagt würde. Es ist daher eine gute und richtige Annahme Molnarfis, die Umstellung phonologischprosodisch motivieren zu wollen. Falsch ist (aus Sicht der vorliegenden Arbeit) lediglich, diese Umstellung als syntaktische Operation zu implementieren. Wie bereits oben diskutiert ist es auch problematisch, für den Auslöser der syntaktischen Bewegung auf eine Definition ex negativo zurückzugreifen: [Antifokus] ist, aus meiner Sicht, keine informationsstrukturell erklärungsstarke Kategorie. Vielmehr sollte die Kategorie [Fokus] als Auslöser der Umstellung definiert werden, etwa im Sinne von Bürings FinalFocus: „Focus should be sentence final“ (Büring 2001: 73). In seinem OT-System definiert Büring FinalFocus als verletzbaren constraint (vgl. ja auch: should be sentence final) und macht FinalFocus zum Auslöser von Wortstellungsänderungen: „the only [...] constraint that can ever favor scrambling is [FinalFocus]: Scrambling may bring an F-marked NP closer to the end of the clause“ (2001: 74, Hervorhebung im Original). Wie oben gezeigt gibt es zwar auch syntakto-semantische Auslöser für (EoO-konformes) Scrambling, für die EoO-losen Fälle aber schließe ich mich Bürings Ansatz an, weil er AntifokusMerkmale überflüssig macht: Wie sich zeigt, kann die Fokusposition tatsächlich ohne look-ahead als Ursache der Umstellung nutzbar gemacht werden. Mit der vorliegenden Arbeit nämlich muss die prosodische Motivation (dort, wo sie nachweisbar ist) von Scrambling eben nicht syntaktisch repräsentiert werden, sondern kann als Kollaboration der Syntax und der PF-Komponente gelten: Die obligatorische Bewegung der vP nach SpecTP wird syntaktisch (durch das EPP von T) erzwungen. Ein look-ahead zur PF liegt nicht vor, weil das EPP von T keine PF-Eigenschaft darstellt und die syntaktische Operation damit rein formal-syntaktisch gesteuert ist. In der Berechnung der Distributed Deletion der vP in der PF-Derivation können nun aber phonologisch-prosodische Eigenschaften genutzt werden, um die Wortstellung korrekt abzuleiten: Da die PF-Komponente mit der Verarbeitung genau dieser Eigenschaften betraut ist, stellt sie den architektonisch attraktivsten Platz dar, auch die syntakto-semantisch optionalen Wortstellungsvarianten des Deutschen zu repräsentieren. Wie aber können die prosodischen Eigenschaften nun so formalisiert werden, dass die Berechnung der Distributed Deletion der vP-Kopien erfolgen kann?
Rekonstruktion der (vermeintlichen) Topikbewegung
201
Hier erweist sich die Formulierung der constraints bei Büring als ungeheuer hilfreich: Da die Intonationsphrase der Maßgabe iP-Head-Right unterliegt, ist nämlich das direkte Objekt, wenn es in-situ bleibt, prosodisch problematisch: Als nicht-fokussiertes Element kann das direkte Objekt nicht Träger der Hauptbetonung des Satzes sein. Fokusexponent muss vielmehr das fokussierte indirekte Objekt sein. Nun bildet die direkte Objekts-DP aber eigentlich, wie oben gesehen, eine eigene Akzentdomäne, die weiter zum rechten Rand des Satzes hin steht als die Akzentdomäne des indirekten Objekts. Da Büring im Rahmen seiner OT-Analyse verletzbare constraints definiert, kann er diesen Widerspruch zwischen einem finalen Fokusexponenten und einer ‚im Weg stehenden‘ Akzentdomäne aber umgehen: „The only way to have a non-final argument be most prominent is [...] to make it the head of the final [accent domain]. In other words, all subsequent [accent domain] boundaries are ‚deleted‘, or put more accurately: No more ADs are formed. This blatantly violates [the constraints on accent domain formation]“ (2001: 84, Hervorhebung im Original). Als Ergebnis dieser constraint-Verletzung wird deshalb eine Akzentdomäne erstellt, die „super-big“ ist (ebd.: 90): 215. ...x )iP (x )AD iOFokus dO V Büring zeigt nun aber, dass das Scrambling des direkten Objekts diese prosodisch suboptimale Akzentdomäne verhindern kann. Tritt das direkte Objekt linear vor das indirekte, so ergeben sich keine Probleme mit der Bildung der Akzentdomäne (vgl. ebd.). Das direkte Objekt kann seine eigene Akzentdomäne bilden, ohne dass diese die finale Fokuspositionierung behindert: 216. ...x (x) dO
(x iOFokus V
)iP )AD
Es zeigt sich also, dass es gute prosodische Gründe gibt, warum das Scrambling des direkten Objektes hier von vielen Sprechern präferiert wird: Zwar sind beide Strukturen syntaktisch wohlgeformt, mit dem Scrambling des direkten Objekts ergibt sich aber eine Möglichkeit, auch prosodisch eine „perfect AD“ (Büring 2001: 91) zu erstellen, die nicht möglich ist, wenn das direkte Objekt in-situ bleibt. Möchte man die Akzentdomänenbildung nun als Spellout-Kriterium für die Distributed Deletion einsetzen, so wären folgende Tilgungen denkbar:
202
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
217. Syntax: Ich habe... [TP
[vP das Geld dem Kassierer...] [vP das Geld dem Kassierer...] gegeben]
Distributed Deletion 1: [vP dem Kassierer das Geld...] [vP dem Kassierer das Geld...] = das Geld dem KaSSIERer Unter dieser Tilgung wäre demnach die ‚perfekte‘ Akzentdomänenbildung möglich: Das indirekte Objekt tritt möglichst nah an den rechten Satzrand heran, das linear vorangehende direkte Objekt bildet seine eigene Akzentdomäne. Das schlechtere Szenario ergibt sich unter der – prinzipiell ebenfalls möglichen – umgekehrten Tilgung: 218. Syntax: Ich habe... [TP [vP das Geld dem Kassierer...] [vP das Geld dem Kassierer...] gegeben] Distributed Deletion 2: [vP dem Kassierer das Geld...][vP dem Kassierer das Geld...] = dem KaSSIERer das Geld In dieser linearen Sequenz interferiert das direkte Objekt mit der Maßgabe des finalen Fokus: Dem Fokusexponenten folgt in diesem Szenario eine lange, prosodisch destrukturierte Sequenz die die Hauptbetonung vom Satzende trennt (vgl. Büring 2001:84). Die Abfolge wird daher als prosodisch dispräferiert vorhergesagt. Damit erweist sich die Kategorie [Fokus] als die für die vorliegende Analyse zentrale Eigenschaft: Die Distributed Deletion der vP versucht, den Fokusexponenten des Satzes nach Möglichkeit satzfinal auszubuchstabieren. Hieraus ergibt sich eine zentrale Motivation für die Möglichkeit oder Unmöglichkeit EoO-loser Scrambling-Vorgänge: – Die Unmöglichkeit, Fokusexponenten (EoO-los) zu scramblen folgt direkt aus FinalFocus: Die Aussprache des Fokusexponenten in der oberen vP-Kopie (in SpecTP) würde der Maßgabe des finalen Fokus widersprechen (wenn overtes Material interveniert, welches die Umstellung überhaupt sichtbar macht). Für den Fokusexponenten gilt daher: Er muss in der unteren vP-Kopie (d.h. genauer, der durch external merge erstellten vP) ausbuchstabiert werden. Nicht unähnliche Annahmen zur Rolle von [Fokus] finden sich auch bei Bobaljik (vgl. insbesondere 2002: 233). – Auch die Möglichkeit, nicht-fokussiertes Material EoO-los umzustellen, wird durch FinalFocus eröffnet: Tritt nicht-fokussiertes Material zwischen den Fokusexponenten und die rechte Satzgrenze, so wird das nicht-fokussierte
Rekonstruktion der (vermeintlichen) Topikbewegung
203
Material präferiert in der hohen vP-Kopie (d.h. genauer, in der in SpecTP per internal merge verketteten Kopie) ausbuchstabiert. Weitere informationsstrukturelle Kategorien (insbesondere [Antifokus] oder [Topik]) werden also nicht benötigt um die Verteilung von fokussiertem und nicht-fokussiertem Material zu beschreiben. Was die EoO-losen Fälle von Scrambling anbetrifft, stimme ich daher vollständig der Einschätzung Bürings zu: „scrambling [...] is focus driven“ (2001: 74, für eine ähnliche Annahme vgl. auch Molnarfi 2004: 347f., Zubizarreta 1998: 124ff.). Ergänzend möchte ich aber zweierlei anmerken: – Zum einen stellen die EoO-konformen Umstellungen eine zusätzliche Lizenz für das Scrambling von Argumenten (auch: fokussierten Argumenten!) dar, die Büring in seiner Arbeit nicht diskutiert. – Zum zweiten muss an dieser Stelle explizit wiederholt werden, dass die Kernsyntax das Merkmal [Fokus] nicht adressiert: Weder die (EPP-getriebene) Bewegung der vP, noch die (EoO-konforme) Bewegung von QPen und bindungsrelevanten Elementen werden durch [Fokus] ausgelöst oder restringiert. Die Syntax ist, mit anderen Worten, vollständig ‚blind‘ für die informationsstrukturelle Markierung. Erst die PF-Schnittstelle verarbeitet das Merkmal [Fokus] in der Berechnung der Distributed Deletion der vP-Kopien. Ich stimme auch hier Bürings Einschätzung zu: „Focus and word order do no interact directly. [...] Rather, focus interacts with prosodic phrasing, which in turn may interact with word order“ (2001: 69, vgl. ähnlich auch Fanselow 2006: 137). Diese Annahme wird durch die vorliegende ‚subtraktive‘ Analyse von Wortstellungsoptionen einer aktuellen generativen Architektur der Grammatik zugänglich gemacht – und zwar meines Wissens erstmalig ohne die Problematik des look-ahead: Das Merkmal [Fokus] löst keine kernsyntaktischen Bewegungen. Es restringiert aber die Spellout-Optionen, die die PF bezüglich der (aus unabhängigen Gründen) syntaktisch erzeugten Bewegungskopien hat. Damit ergibt sich auch zwangsläufig eine architektonisch meines Erachtens attraktive Trennung zwischen prosodischer Markiertheit und Ungrammatikalität (vgl. ähnlich auch Molnarfi 2002, 2004, Abraham & Molnarfi 2001): Die Derivation in der Kernsyntax gibt strukturelle Prinzipien vor, die von jeder Derivation zu respektieren sind. Die Verletzung dieser Prinzipien kann zu (kategorisch) hart inakzeptablen Strukturen führen. Die Diskursangemessenheit der Prosodie einer Struktur wird oft intuitiv anders bewertet: Prosodische Markierungen dieser Art treten in verschiedenen Diskurssituationen in verschieden starker Ausprägung auf und werden zudem von verschiedenen Sprechern oft auch unterschiedlich
204
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
bewertet. Die Berechnungsprinzipien der PF-Komponente scheinen daher nicht gleichermaßen unverletzbar zu sein wie die Prinzipien der Syntax. Zur Illustration dieses Unterschieds mag ein Vergleich Bürings dienen (2001: 97): 219. a) ??Ich habe das GELD dem Kassierer gegeben. b) *Ich habe das GELD gegeben dem Kassierer. Der Satz in (a) weist eine schlechte Positionierung des Fokusexponenten auf – genauer gesagt ist hier die Maßgabe Don‘t scramble focus verletzt: Der Fokusexponent (das direkte Objekt) wurde über ein nicht-fokussiertes Element hinweg umgestellt. Es resultiert daher eine recht stark wahrgenommene Markiertheit von (a). Dennoch ist Bürings Darstellung nachzuvollziehen, nach der (a) immer noch akzeptabler ist als (b). Ich schließe mich daher auch hier dem Urteil Bürings an: „Intuitively, [(b)] violates a hard and fast constraint about verb-argument ordering in German, namely that nominal arguments cannot be post-verbal“ (ebd.). Die Prinzipien hingegen, die in (a) verletzt werden, „seem ‚softer‘ than that“ (ebd.). Mit Blick auf das Scrambling nicht-fokussierter Objekte lässt sich vielleicht ähnlich sagen: Oft erscheint das Scrambling eines Objekts nicht zwingend nötig. Die Abfolgen, die nicht-fokussiertes Material vom rechten Rand des Satzes entfernen, sind in diesem Sinne nicht syntaktisch oder informationsstrukturell (d.h., kategorisch) erzwungen – hierzu sind die Strukturen ohne Scrambling schlicht nicht ‚inakzeptabel genug‘. Ähnliches zeigt auch eine empirische Studie von Fanselow: „The small size of the acceptability difference militates against the view that [the acceptability difference] is caused by the failure of carrying out an obligatory movement operation“ (2006: 154). Kernsyntaktisch erzwungen sind Strukturen mit satzfinalem Fokus also definitiv nicht. Wie eingangs vermutet wurde kann man über diese Abfolgen aber – im allerwörtlichsten Sinne! – sagen: Sie klingen besser: Sie sind, um es genauer zu formulieren, in der Lage nicht nur syntaktisch zu konvergieren, sondern entsprechen in ihrer Wortstellung zudem auch prosodischen Anforderungen in bestmöglicher Weise und werden daher vor alternativen Strukturen präferiert. Als letzte Anmerkung zu Wortstellungspräferenzen sei hier darauf verwiesen, dass nicht alle Sprecher des Deutschen sich wirklich einig darin zu sein scheinen, um wieviel die Strukturen mit satzfinalem Fokus tatsächlich ‚besser‘ sind: In Diskussionen mit Kollegen und Freunden stellte sich nämlich immer wieder heraus, dass einige deutsche Muttersprachler eine sehr starke Präferenz für satzfinale Fokusexponenz haben während andere Sprecher intuitiv nur eine schwache Präferenz dafür zu erkennen geben. Es ist nach meinem Empfinden ein plausibles Ergebnis, dass diese sich abzeichnenden Untergruppen von Sprechern durchaus ‚dieselbe Sprache‘ in dem Sinne sprechen, dass sie sowohl die Struktur
Rekonstruktion der (vermeintlichen) Topikbewegung
205
mit Scrambling als auch die Struktur ohne Scrambling problemlos interpretieren können: Die syntaktische Struktur ist also mitsamt ihrer semantischen Interpretation allen befragten Sprechern zugänglich. Unterschiede bestehen offensichtlich eher darin, welche prosodischen Unterscheidungen die Sprecher machen – was angesichts der verschiedenen dialektalen Färbungen (und vielleicht auch individuellen Präferenzen) verschiedener Sprecher des ‚Deutschen‘ nun aber auch nicht weiter verwundern kann. Nach meinem Empfinden wird daher mit einer getrennten, aber aufeinander bezogenen Repräsentanz von prosodischen, syntaktischen und semantischen Einflüssen auf die Wortstellung des Deutschen ein Bild entworfen, dessen Auflösung unübersehbar feiner ist, als es grobschlächtige syntaktische Analysen von Scrambling je zu zeichnen in der Lage wären. Die Abbildung der prosodischen Faktoren ist damit – aus meiner Sicht – ein Gewinn, insbesondere dergestalt, dass feinere empirische Unterscheidungen nun, auf vielschichtige Art und Weise, repräsentiert werden können, indem prosodischen Eigenschaften ein Platz in der Architektur der Grammatik eingeräumt wird, an dem sie (ohne look-ahead und ähnliche Komplikationen) Einfluss auf die Wortstellung nehmen können. Welche weiteren auf PF verfügbaren Eigenschaften (nicht-prosodischer Art) könnten einen Einfluss auf die Berechnung der Distributed Deletion nehmen?
10.4.1.2.2. Treten nominativische DPen präferiert im linken Mittelfeld auf? ‚Subjekte‘ sind sicherlich nicht in erster Linie informationsstrukturelle Kategorien. Wie schon Reis gezeigt hat, bezeichnet die Kategorie Subjekt letztlich Mischeigenschaften verschiedener morphologischer, syntaktischer und semantischer Kriterien (1982). Auch die Informationsstruktur spielt aber in die Vorstellung von ‚Subjekten‘ hinein: „[Ich gehe davon aus], dass in dem grammatischen Rahmen, in dem die Relevanz von ‚Subjekt‘ geprüft wird, mindestens folgende Beschreibungskonzepte direkt oder indirekt verfügbar sind: die pragmatischen Begriffe Thema – Rhema, Referenz – Prädikation; semantische Charakterisierungen ±agentiv, ±belebt, etc.“ (Reis 1982: 172). Auch der Begriff des Topiks wurde immer wieder mit dem Subjekt assoziiert: „Subjects are unmarked topics across languages“ (Erteschik-Shir 2007: 26 und Literatur dort). Es lässt sich auch die Einschätzung Diks nachvollziehen, dass Subjekte (im Rahmen seiner Functional Grammar) nur deshalb überhaupt als ausgewiesene Kategorie existieren, weil sie einen funktionalen Zweck haben: „It is a fact that states of affairs are normally presented from the ‚point of view‘ or ‚perspective‘ of one of the participating entities. [...] Subj assignment determines the perspective from which the state of affairs is described“ (1978: 71, wobei Subj die syntaktische Funktion Subjekt bezeichnet, vgl. ebd.: XI). Nicht unähnlich generalisiert Rambow (aus der
206
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
Perspektive der Centering Theory): „The [backward-looking center] is typically in the [Wackernagel position]“ (Ms.: 5) Da es sich mit dem ‚Subjekt‘ also offensichtlich um eine Kategorie handelt, die einigen der o.a. Topikdefinitionen (vor allen Dingen dem aboutness-Topik) zumindest intuitiv ähnelt, soll auch die Position des Subjektes hier behandelt werden. Die syntaktische Analyse der obligatorischen Bewegung in eine angebliche ‚Subjektsposition‘ oben hat gezeigt, dass es im Deutschen keineswegs ausgemacht ist, dass eine nominativische DP sich in jedem Fall in SpecTP findet: In vielen Sätzen bleibt das Subjekt in einer niedrigen Position oder es existiert gar kein nominativisches Argument. Dennoch gilt, dass nominativische Subjekte eine gewisse Tendenz dazu aufweisen, im linken Mittelfeld aufzutreten. Wie lässt sich diese Beobachtung in der vorliegenden Analyse replizieren? Zweierlei Lösungen erscheinen denkbar: Zum einen ließe sich diese Abfolgepräferenz direkt in die Berechnung der Distributed Deletion einbeziehen: Wenn tatsächlich nur DPen im Nominativ diese Tendenz aufwiesen, so ließe sich das Merkmal [Nominativ] als Grundlage für eine Spellout-Entscheidung in diesem Sinne verwenden. Zumindest grob vergleichbare Annahmen wurden zum einen bereits in theoretischen Ansätzen gemacht (vgl. z.B. Choi 1999, Müller 2000: 241f., Molnarfi 2004: 351). Das Nominativ-Merkmal einer DP ist zudem zweifelsohne auch für PF relevant und auf PF verfügbar, insofern als die PF über dieses Merkmal etwa die (z.B. attributivische) Kongruenzmorphologie innerhalb der Subjekts-DP berechnen muss (vgl. Struckmeier 2007). Nun ist die vorliegende Analyse keine OT-Analyse, wie sie etwa Müller (2000) vorschlägt, und nominativische DPen befinden sich, wie gesehen, nicht immer im linken Mittelfeld. Damit wäre eine kategorische Entscheidung, nominativische Subjekte immer in der höheren vP-Kopie in SpecTP auszubuchstabieren, viel zu hart. Ich bin mir zudem nicht sicher, ob eine Spellout-Lizenz, die nominativischen Subjekten immer erlaubt, ins linke Mittelfeld zu gelangen, nicht ebenfalls eine zu starke Generalisierung ist. Die direkte Kodierung einer ‚Nominativtendenz‘ schlage ich demnach hier nicht vor. Wenn jedoch starke Evidenz beigebracht würde, dass es tatsächlich der Nominativkasus der Subjekts-DP ist, der die Bewegung ins linke Mittelfeld herbeiführt oder begünstigt, wäre letztenendes auch gegen eine solche Implementation technisch nichts einzuwenden. Nun gelten allerdings Subjekte ja auch als besonders topik-affine Elemente: Der Sprecher hat über die Auswahl des Verbs oder auch über Variationen des Genus Verbi die Möglichkeit, das höchste Argument, die nominativ-markierte DP und das Worüber-Element zusammenfallen zu lassen. Wenn in einem längeren Diskursabschnitt das Topik (oder, nach Dik 1978, die Perspektive) nicht verändert wird, werden demzufolge häufig kontextuell Gegebene Elemente als Subjekte figurieren – die wiederum nur in bestimmten (Kontrast- oder Korrektur-)
Rekonstruktion der (vermeintlichen) Topikbewegung
207
Situationen fokussiert werden. In diesem Sinne könnte es also die diskursive Kohärenz sein, die das Subjekt zum quintessentiellen Nicht-Fokus macht – und damit, wie oben gesehen, die Ausbuchstabierung im linken Mittelfeld begünstigt. Darüber hinaus würde eine Erklärung über die Diskurskohärenz auch insofern Sinn ergeben, als bekannte Elemente durch definite DPen bezeichnet werden können und definite Elemente ohnehin die Tendenz haben, ins linke Mittelfeld zu gelangen – was in unserem System durch die entsprechende Spellout-Lizenz aber bereits ausgedrückt ist. Ich gehe daher – bis zum empirischen Beleg des Gegenteils – davon aus, dass diese Präferenzen ausreichend ist, um die präferierte (nicht: erzwungene) Position des Subjektes zu erklären: Alle Präferenzen weisen ja letztlich in die selbe Richtung. Dennoch lassen sich diese Präferenzen doch auch offensichtlich übergehen, wenn das Subjekt eben nicht ins linke Mittelfeld gelangt (vgl., wie schon o.a., z.B. Webelhuth 1984, Biberauer & Richards 2006). Eine direkte Repräsentanz (etwa die Spellout-Anforderung Nominativ vor Nicht-Nominativ o.ä.) halte ich daher für Subjekte für unnötig.
10.4.2 Distribution ‚topikaler‘ Elemente als Performanzphänomen Wie im letzten Unterkapitel gesehen, bestehen Präferenzen dahingehend, Material aus satzfinalen Positionen heraus umzustellen um prosodische Prinzipien besser zu erfüllen. Ich nehme jedoch an, dass es weitere Gründe für diese Präferenz gibt, die gar nicht in den Bereich der Kompetenzgrammatik fallen – selbst dann, wenn man eine weitere Lesart von ‚Grammatik‘ intendiert, die die PF-Komponente mit einschließt: Präferenzen dieser Art lassen sich nämlich auch recht weitgehend aus dem Verhalten eines Sprechers erklären. Gerade dieses Verhalten aber soll, wie eingangs dargelegt, in einer Kompetenzgrammatik nicht abgebildet werden. Dennoch muss zweierlei gelten: – Zum einen sind die introspektiven Urteile, die viele der zitierten Autoren (und auch die vorliegende Arbeit) nutzen, um die möglichen Sätze intuitiv zu bewerten, ein Vorgang der Performanz. Damit gilt, dass bestimmte Präferenzen für Sätze nicht unbedingt und in jedem Fall auf eine Unterscheidung in der Kompetenzgrammatik (noch viel weniger: der Kompetenzgrammatik der Kernsyntax!) zurückzuführen sind. Könnten performative Faktoren also genutzt werden, um bestimmte Präferenzen zu erklären, die in der Kompetenzgrammatik nur wenig elegant (oder gar nicht) repräsentiert werden können? – Zum zweiten machen auch Arbeiten, die empirische Untersuchungen darüber anstellen, unter welchen Bedingungen Sprecher Scrambling in spontanen
208
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
Diskursen nutzen, Aussagen über die Performanz dieser Sprecher – in der sich die Kompetenzgrammatik bestenfalls indirekt ausdrückt. Kann man daher Scrambling-Präferenzen also auch als Effekt performativer Eigenschaften darstellen? Die vorliegende Analyse geht davon aus, dass dies der Fall ist: Dadurch, dass die Analyse gerade nicht versucht, für einen gegebenen Kontext nur einen Satz als diskurskohärent auszuweisen (und alle anderen als diskursinkohärent oder sogar ungrammatisch darzustellen), eröffnet sie hier nicht nur die Möglichkeit, performative Faktoren in die Beschreibung einfließen zu lassen (was aus offensichtlichen Gründen ja ohnehin immer mitgedacht werden sollte): Wenn ein Sprecher vielmehr eine echte Wahl zwischen mehreren (semantisch äquivalenten und grammatisch möglichen) Satzformen hat, dann muss in vielen Fällen die Entscheidung über die tatsächliche Auswahl der einen oder der anderen Satzform durch Performanzfaktoren beeinflusst sein. Die folgenden zwei Unterkapitel stellen zwei mögliche Szenarien vor.
10.4.2.1 Sprecher bevorzugen die Strukturen, die die Informationsstruktur klarer markieren Es sei hier noch einmal das bereits diskutierte Beispiel wiederholt, welches eine EoO-lose Instanz von Scrambling darstellt: 220. Wem hast das Du das Geld gegeben? a) Ich das das Geld dem KaSSIERer gegeben. b) Ich habe dem KaSSIERer das Geld gegeben. In diesem Beispiel weist die Frage das indirekte Objekt als Fokus aus, das direkte Objekt das Buch ist hingegen Gegeben. Wie aber wird diese informationsstrukturelle Unterscheidung in (a) und (b) jeweils ausgedrückt? – Quantitativ: (a) ist mehrfach IS-markiert, (b) nur prosodisch. – Tatsächlich markiert Satz (a) die Gegebenheit des direkten Objekts in gewisser Weise zweimal: Zum einen durch die fehlende Fokusintonation von das Geld. Zum anderen aber auch durch die Dislokation von das Geld: Wäre das Geld fokussiert, so müsste es als Kontrastfokus interpretiert werden – was in der gegebenen Situation jedoch sinnlos ist, da das Buch in der Frage kontextuell (sogar verbatim) Gegeben ist, und kein Kontrast zur Frage ausgedrückt wird. Da das Geld kein Kontrastfokus sein kann, aber auch nicht EoO-konform bewegt wurde, wird im Umkehrschluss klar, dass das Geld überhaupt kein Fokus ist. Zudem muss die EoO-konforme Bewegung von Foki im nor-
Rekonstruktion der (vermeintlichen) Topikbewegung
– –
209
malen Sprachgebrauch vermutlich als relativ seltener Fall gewertet werden (wie im diskutierten Beispiel: Fokus auf einem quantifizierten Element, welches Skopus oberhalb einer Negation nehmen soll – oder ähnlich komplizierte Anforderungen). Damit werden Argumente ausserhalb ihrer Basispositionen auch fast immer Nicht-Foki sein, wie auch in (a). Dies entspricht wiederum der (schon benannten) Tatsache, dass das Buch in (a) unbetont bleibt. Demnach wird durch die Dislokation und den ausbleibenden fall doppelt markiert, dass das Geld nicht als Fokus interpretiert werden soll. (b) hingegen drückt die Gegebenheit von das Geld nur prosodisch aus: Obwohl das Geld in seiner Basisposition als Fokus betont werden müsste, trägt die DP nicht den fall. Daraus (genauer: nur daraus) folgt, dass diese DP nicht als diskursneu interpretiert werden soll. Qualitativ: (a) markiert die informationsstrukturellen Verhältnisse klarer: Bei der Dislokation des direkten Objektes handelt es sich in gewisser Weise um ein ‚digitales‘, d.h. nicht-graduelles Phänomen: Die DP wird in (a) ganz versetzt, in (b) hingegen gar nicht – tertium non datur. Die (De-) Akzentuierung des direkten Objektes hingegen wird durch ‚analoge‘ Faktoren implementiert, die allesamt in feinen graduellen Abstufungen erfolgen können: Auslenkungen der f0-Frequenz, Pausenlänge, Lautstärke etc. sind in verschiedenen Stärkegraden durch den Sprecher ausführbar. Die Ausführung dieser prosodischen Faktoren erfordert daher ein gewisses Maß an artikulatorischer Sorgfalt auf Seiten des Sprechers. Der Hörer muss zudem in der Lage sein, die prosodischen Unterscheidungen zweifelsfrei wahrzunehmen. Diese Hörerfähigkeit ist jedoch nicht unbedingt als Selbstverständlichkeit zu bewerten, da „Hörer vielfach anders perzipieren, als tatsächlich gesprochen wurde. So können nachweisbare Änderungen der Intonationsparameter von Hörern als unverändert perzipiert werden und umgekehrt“ (Mehlhorn 2001: 50). Hörer scheinen dabei die Lage der Hauptbetonung des Satzes noch recht gut zu erkennen (vgl. ebd.: 52). Schon die Wahrnehmung der rise-fall-Kontur aber ist nicht immer völlig zuverlässig. In ihrer Studie zur Wahrnehmung von Hutkonturen stellt Mehlhorn fest: „Die [Hutkontur] findet sich in der Perzeption häufiger als im akustischen Sprachsignal, oder anders formuliert: Es werden mehr Hutkonturen gehört als produziert“ (ebd.: 54). Wie Oppenrieder zeigt, werden auch mehrfache Fokussierungen ebenfalls nicht immer zuverlässig erkannt (vgl. 1989: 275). Zusammenfassend ergibt sich ein Bild, in dem Auslenkungen der Intonationskurve eben nicht in jeder Hinsicht – und in jedem Kontext – zuverlässig und kategorisch diskursiv ausgewertet werden können. Mit Blick auf die messbaren akustischen Eigenschaften urteilen etwa t‘ Hart et al: „Such data seldom speak for themselves: they are hard to interpret in what ultimately matters, viz. the contribution of intonation to the communi-
210
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
cation process. Indeed, physiological recordings to not tell us much about what pitch inflections the speaker actually intended to produce, nor do acoustic tracings foretell what information is relevant for the listener“ (1990: 6). Es lässt sich also zumindest recht glaubhaft spekulieren, dass Performanzprobleme bestimmter Art dazu führen, dass bestimmte Wortstellungen dispräferiert werden, andere hingegen präferiert: Vielleicht präferieren Sprecher ganz einfach für eine informationsstrukturelle Konstellation eine besonders gute und klare Markierung, die zudem leicht artikulierbar ist: Die Umstellung eines Elements wäre, insofern sie kategorisch ist, eine unmissverständliche Markierung dafür, dass das Element nicht als fokussiert betrachtet werden kann. Dies ist pragmatisch wünschenswert: Wählt ein Sprecher die unmissverständliche Struktur, handelt er kooperativ. Wählt ein Sprecher oder eine Sprecherin hingegen die (zumindest potentiell) eher missverständliche Struktur ohne Umstellung, so muss er oder sie durch eine besonders klare Intonation dafür Sorge tragen, nicht unwillentlich die Kooperationsmaxime zu verletzen: Die Maxime der Modalität (Be perspicuous!) fordert von einem Sprecher Klarheit und ganz explizit auch Eindeutigkeit – in ihrer Submaxime Avoid ambiguity (Grice 1975: 46). Da unter der vorliegenden Analyse eine Vielzahl von Strukturen als kerngrammatisch wohlgeformt und PF-kompatibel dargestellt werden, lässt sich die Frage nach dem Einfluss der Performanz noch viel umfassender stellen: Lassen sich generelle Performanzprinzipien erkennen, die Strukturen mit (oder ohne) Scrambling begünstigen (oder restringieren)?
10.4.2.2 Produktionspräferenzen als Ursache vermeintlich ‚topikaler‘ Umstellungen Wie die Forschung zur Performanz zeigt, existieren performative Prinzipien, die die Produktion oder Verarbeitung von Sätzen generell beeinflussen – also auch unabhängig von spezifischen Situationen und Kontexten. Die Performanz ist damit beileibe nicht nur eine Sammlung von Restriktionen, denen ein Sprecher in einer konkreten Situation unterliegen mag (wie Gedächtnisbeschränkungen, Unaufmerksamkeit, Ablenkungen etc.). Die Performanz soll vielmehr systematisch beschreiben, wie ein Sprecher vorgeht. Daher sind Performanzprinzipien dazu geeignet, eine Vielzahl von Eigenschaften von Sprachen auch unabhängig von den Anforderungen der Kompetenzgrammatiken dieser Sprachen zu erklären – viele grammatische Eigenschaften scheinen vielmehr aus wesentlich allgemeineren Eigenschaften der Sprachproduktion und -rezeption zu folgen. Gerade in der aktuellen syntaktischen Theoriebildung generativer Syntax gilt es wieder
Rekonstruktion der (vermeintlichen) Topikbewegung
211
als explizit formuliertes Ziel, auch Faktoren zur Erklärung sprachlicher Phänomene heranziehen, die ausserhalb des engen Systems der Kompetenzgrammatik liegen (aber als third factor Einfluss darauf nehmen, vgl. Chomsky 2005). Es ist bedauerlich, dass diesem biolinguistischen Ansinnen in Darstellungen der Kompetenzgrammatik oft realiter kein (oder kaum) Raum eingeräumt wird. Die vorliegende Analyse (die natürlich primär eine Analyse der Kompetenzgrammatik ist und bleibt) möchte die bloßen Lippenbekenntnisse biolinguistischer Prägung vermeiden: Sie strebt an, Eigenschaften von Scramblingstrukturen tatsächlich explizit aus dem Zuständigkeitsbereich der Kompetenzgrammatik auszulagern. Performanzprinzipien unterliegen allen gebildeten Strukturen (und ihre Auswirkungen können deshalb natürlich auch in Teilen von den aufeinander folgenden Generationen von Sprachlernern grammatikalisiert werden). Sie greifen demnach auch dort, wo die Kompetenzgrammatik einer Sprache keine Unterscheidungen zwischen sprachlichen Strukturen trifft. Im Deutschen etwa, so die vorliegende Analyse, weist die Kompetenzgrammatik in vielen Kontexten mehrere Satzformen als (unterschiedlos) grammatisch, semantisch gleichwertig und prosodisch wohlgeformt aus. Sprecher bevorzugen jedoch dennoch oft manche dieser Satzformen vor anderen, kompetenzgrammatisch ebenfalls verfügbaren. Wie sich zeigt, entsprechen diese Präferenzen oft den sprachlichen Strukturen ganz generell unterliegenden Performanzprinzipien. Die Erklärung dieser Eigenschaften muss also nicht im Rahmen der Kompetenzgrammatik erfolgen. Im Folgenden soll stattdessen auf bereits wohlbelegte Performanzprinzipien hingewiesen werden, die in der Lage sind, diese Eigenschaften systematisch und plausibel zu erklären. Eine der Anforderungen, die jede Performanztheorie erfüllen muss, ist eine Erklärung dafür, wie die Verarbeitung eines Satzes online abläuft, d.h.: Wie kann ein Sprecher die in einer Abfolge im Sprachstrom (zumindest in einer Lautsprache, vgl. aber Kremers 2009) dargebotenen Wörter zu einer syntaktischen Repräsentation zusammensetzen? Wie Hawkins (1990) überzeugend zeigt, besteht ein sehr transparenter Zusammenhang zwischen statistisch häufigen Wortstellungsmustern in Sprachen und Prinzipien, die die Abbildbarkeit linearer Wortkette auf hierarchische Konstituentenstrukturen bestimmen: „linear ordering seems to be determined by the rapidity with which the immediate constituents of syntactic groupings can be produced and recognized on-line“ (1990: 225). Eine schneller zu verarbeitende Wortstellung zeichnet sich dabei dadurch aus, dass Art und Umfang von Konstituenten möglichst schnell erkannt werden können: „The basic idea is that the parser prefers those orders of words that enable it to recognize all ICs of a mother node as rapidly as possible“ (1990: 230). Eine Wortfolge, die den möglichst schnellen Abschluss einer zu verarbeitenden Konstituente umsetzt, ist nun die, die kurze Konstituenten möglichst früh präsentiert. Es gilt die Anforde-
212
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
rung Early Immediate Constituents (ebd.: 233, vgl. für Variationen und Erweiterungen auch z.B. Hawkins 1998: 734, 2004: 107): 221. Early Immediate Constituents (EIC) The human parser prefers to maximize the left-to-right IC-towords ratios of the phrasal nodes that it constructs. Das Left-to-right IC-to-word Ratio wird wie folgt definiert (ebd.: 233f.): 222. The left-to-right IC-to-word ratio for a constituent recognition domain is measured by first counting the ICs in the domain from left to right (starting from 1) and then counting the words in the domain from left to right (again starting at from 1). For each word and its dominating IC, the IC total is divided by the word total at that point, and the result is expressed as a percentage [...]. The higher the percentage, the more loaded and informative is the constituency information at that point. An aggregate IC-to-word ratio for the whole constituent recognition domain is then calculated by averaging the percentages for all the words in the domain. The higher the aggregate, the more optimal is that order of words for processing. The ratio for a whole sentence can be defined as the average of the aggregate IC-to-word ratios for all constituent recognition domains in the sentence, that is, for all phrasal categories that the sentence dominates. Ein Beispiel aus dem Englischen zeigt, dass z.B. beim Heavy NP Shift eine EICgemäße Abfolgepräferenz umgesetzt wird (vgl. 1990: 233): 223. I [introduced [some friends that John had brought to the party] 1 2 3 4 5 6 7 8 9 10 [to Mary]] 11 Dieser (markierte) Satz weist eine (nach Maßgabe des EIC) problematische Wortfolge auf: Das Verb introduce leitet den Parser an, eine VP zu erstellen. Das letzte Argument von introduce, die PP to Mary, wird aber erst bei Wort 11 für den Parser erkennbar. Daher gilt: Um die drei Konstituenten der VP (V, NP und PP) im linearen Ablauf zu identifizieren wird eine Kette von 11 Wörter benötigt. Hawkins weist dies als left-to-right IC-to-words ratio 3/11 aus (= 27%). Tritt aber Heavy NP Shift auf, so verbessert sich die Situation dramatisch:
Rekonstruktion der (vermeintlichen) Topikbewegung
213
224. I VP[introduced PP[to Mary] NP [some friends ...]] 1 2 3 4 Das letzte vom Verb geforderte Argument (nun die NP some friends that John had brought to the party) wird bereits nach vier linear dargebotenen Wörtern am einleitenden some erkannt. Es ergibt sich ein wesentlich besserer left-to-right IC-towords ratio von 3/4 (= 75%). Wie Hawkins überzeugend argumentiert, sind einige Wortstellungsregularitäten in den Sprachen der Welt nichts anderes als (verschieden grammatikalisierte) Formen besonders guter left-to-right IC-to-words ratios. Darüber hinaus liefert Hawkins auch ein Argument dafür, dass Sprachen mit kopffinalen Verbphrasen andere Verarbeitungsabläufe involvieren als Sprache mit kopfinitialen: Wird im Deutschen etwa im Mittelfeld eines Verbletztsatzes eine DP erkannt, so ist a priori nicht klar, welcher größeren (Prädikats-) Konstituente diese DP zuzuordnen ist – das Verb folgt in SOV-Sprachen, ja sowohl dem Objekt wie auch dem Subjekt. DP-Konstituenten können daher in diesem Szenario zwar selbst (eben als DPen) erkannt werden, müssen aber zunächst in einem „buffer for unattached constituents“ verwahrt werden (1990:227). Solche als vorläufig anzusehenden Analysen der linearen Wortfolge führen zu einem erhöhten Verarbeitungsaufwand: „regular guessing is costly, requiring backtracking, major tree surgery, and so on“ (ebd.). Im Effekt besteht also im Deutschen zum einen ein Anreiz, Argumentphrasen aufsteigend nach ihrer Länge zu präsentieren (damit die Argumentphrasen selbst möglichst schnell erkannt werden können). Dies scheint empirisch korrekt: „There are many languages that pattern like German in requiring a VPdominated pronoun to precede a nonpronominal [sic] NP or PP, regardless of the case of the NP“ (Hawkins 1990: 245). Damit besteht nun also ein guter performativer Grund für die Bewegung der Pronomina und ihre bevorzugte Stellung in der Wackernagelposition. Zum anderen aber kann Primus (1994, 1995) zeigen, dass die Auswirkungen des EIC-Prinzips sogar noch wesentlich weiter reichen: Das Deutsche weist nämlich nicht nur für die Pronomina, sondern für alle Argumentypen eine EIC-konforme Grundabfolge auf! Es zeigt sich, dass „im Deutschen [...] kurze Konstituenten bevorzugt vor langen Konstituenten plaziert werden“ (Primus 1994: 40, für das Niederländische ähnlich auch van Bergen & de Swart 2010): Nicht neutral betonbare Pronomina gehen vollen DPen voran, weil sie strukturell simplex sind: [DP D] vor [DP D NP]. Volle DPen wiederum gehen vollen PPen voran: [DP D NP] vor [PP P[DP D NP]]. PPen wiederum gehen wiederum oft sententiellen CP-Argumenten voran (die bekanntlich häufig auch extraponiert realisiert werden, vgl. z.B. Büring & Hartmann 1997 für eine kernsyntaktische Analyse). Auch die Extraposition von CPen und PPen würde insofern einen EIC-
214
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
Vorteil bieten, als dass diese Phrasen (solange sie ‚unattached‘ sind, vgl.o.) den buffer belasten. Extraponieren die besonders ‚schweren‘ Phrasen hingegen, wird das Prädikat dem Parser schneller zugeführt und die Konstituenten, die zunächst unattached waren können in die Projektion des Prädikats eingefügt werden. Die EIC-Abfolgetendenzen im Deutschen variieren nun zwar, wenn sich bestimmte syntaktische Konfigurationen ändern (eben z.B.: Verbzweit versus Verbletzt etc.), bleiben aber tendentiell im Deutschen stets in verschieden starker Ausprägung nachweisbar (vgl. Primus 1994). Möglicherweise ergeben sich aus den Überlegungen sogar Effekte, die in der hier vorgeschlagenen Analyse durch die SpelloutLizenz [definit] erreicht werden (vgl. hierzu Primus 1994: 73). Im Überblick heißt dies nichts anderes, als dass die in der vorliegenden Analyse vorgeschlagenen (nur schwach restringierten) Operationen der Syntax keine Regellosigkeit der Wortstellung des Deutschen implizieren: Die Syntax kann bezüglich vieler Wortstellungsfaktoren unterspezifiziert sein, weil die PF-Komponente unter den möglichen linearen Sequenzen manche als prosodisch unmöglich ausfiltert. Unter den prosodisch möglichen Sätzen sind manche präferiert, andere eher dispräferiert. Die Menge der möglichen Sätze wird daher durch Kernsyntax und PF beschrieben, aber nicht in deterministischer Form: Viele syntaktische und prosodische Strukturen sind letztlich akzeptabel, gehören also zur Menge der möglichen Sätze, die die Kompetenzgrammatik zu umreißen hat. Wenn die Menge der möglichen Strukturen auch solche beinhaltet, die als Alternativen oder Varianten voneinander gelten können, so ist dies viel mehr anderes als ein weiterer Ausdruck für die Annahme von (in semantischer, syntaktischer und phonologischer Hinsicht) ‚optionalem‘ Scrambling. Selbst dann aber, wenn die Kompetenz des Sprechers eine Vielzahl von linearen Abfolgen und dazugehörigen Intonationsmustern als möglich ausweist, so kann der gleiche Sprecher nach Maßgabe performativer Faktoren dennoch bestimmte Wortfolgen als präferiert empfinden: Die Performanzprinzipien unterliegen ja allen sprachlichen Bildungen, drücken sich aber dort, wo die Kompetenzgrammatik keine Restriktionen über Wortstellungsmuster etc. ausdrückt, natürlich besonders direkt aus. Vergleicht man die empirischen Vorhersagen der Performanz- und der Kompetenztheorien zur deutschen Wortstellung, so stellen sich interessante Zusammenhänge heraus: Sagen informationsstrukturell getriebene Ansätze häufig voraus, dass diskursalte (/topikale/ thematische/...) Elemente häufig diskursneuen (/fokussierten/ rhematischen/...) Elementen vorangehen, so folgt dies laut Primus auch indirekt aus den Prinzipien der Hawkins‘schen Performanztheorie, denn: „Definite Referenz und alte Information implizieren ein gemeinsames Wissen von Sprecher und Hörer, so daß die Nennung eines definiten und/ oder vorerwähnten Referenten weniger wortreich ausfällt als die eines indefiniten und/oder nicht vorher erwähnten Referenten“ (Primus 1994: 72, vgl. ähnlich
Rekonstruktion der (vermeintlichen) Topikbewegung
215
auch Primus 1995: 886). Ganz ähnlich urteilt auch Hawkins: „Shorter constituents refer to more referentially given and definite entities, longer constituents to newer and more indefinite entities [...]. In other words, new entities require more words for referent identification than given and previously mentioned entities“ (1998: 756). Nach meinem Dafürhalten erübrigt sich spätestens mit dieser Erkenntnis die Verwendung informationsstruktureller Merkmale wie [Topik] oder [Antifokus] in der Syntax des Deutschen. Wie gesehen sind die Vorhersagen dieser Theorien wesentlich zu hart: Informationsstrukturelle Kategorien müssen sich oft nicht obligatorisch in eine bestimmte Position ins linke Mittelfeld bewegen – selbst dann, wenn die Tendenz zur Abfolge ‚diskursalt vor diskursneu‘ besteht. Das Deutsche verhält sich damit deutlich erkennbar anders als etwa topik-konfigurationelle Sprachen: „A difference between Rumanian and Finnish on the one hand, and German on the other hand, is the fact that in German, topics are not restricted or preferred in a specific structural position“ (Primus 1995: 883, für eine ähnliche Einschätzung zum Ungarischen vgl. z.B. auch Molnarfi 2004: 354). Die empirische Tendenz aber, die diese Kompetenztheorien zu erklären versuchen, lässt sich viel überzeugender als Performanzeffekt repräsentieren: Folgt der Sprecher der performativen Tendenz, simplexere Konstituenten vor komplexeren Konstituenten zu positionieren und sind Phrasen mit diskursalten Referenten tendentiell weniger komplex, so folgt die präferierte Abfolge ‚diskusalt vor diskursneu‘ aus dem performativen Faktor ‚simplex vor komplex‘. Ein obligatorisches Scrambling von Topiks oder Antifoki wird damit nota bene nicht vorhergesagt: Bestehen anderweitige (informationsstrukturelle/ syntaktische/ semantische...) Gründe, von der Performanztendenz abzuweichen, so ist dies möglich: „Aus Hawkins Modell folgt also nicht, dass daß in der Performanz keine Wortfolgen beobachtet werden können, die das [EIC-Prinzip] verletzen, es verlangt aber, daß nicht-optimale EIC-Folgen nicht häufiger als optimale vorkommen“ (Uhmann 1993: 318). Selbst dann also, wenn man Abfolgetendenzen wie ‚kurz vor lang‘ nicht in der Kompetenzgrammatik repräsentieren möchte (was nicht unmöglich wäre, etwa in einer Abbildung der syntaktischen Struktur auf die PF, in der das Behaghel‘sche Gesetz der wachsenden Glieder zum Spellout-Kriterium erhoben würde), bleiben die beobachteten Abfolgepräferenzen dennoch nicht unerklärt. Zusammenfassend gilt, dass die vielfach als problematisch angesehene Optionalität von Scrambling-Operationen dann aufhört, problematisch zu sein, wenn man einige Missverständnisse vermeidet, die die Aufgabe der Kompetenzgrammatik betreffen: – Zum ersten ging es keiner generativen Grammatik im Chomsky‘schen Paradigma (im Unterschied zu funktionalistischen Grammatiken) je darum, zu erklären, wie ein Sprecher eine intendierte Lesart ‚ausdrücken‘ kann. Es geht
216
–
–
–
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
und ging der aktuellen Syntax Chomskys und ihren Vorläufern stets nur (nur?) darum, die Menge der möglichen Sätze und ihrer Schnittstelleneffekte strukturell zu beschreiben (sowie um die Möglichkeit, diese unendlich große Menge im Spracherwerb intensional durch einen generativen Algorithmus erwerben zu können). Die Syntax weist keine optionalen Merkmalszuweisungen (etwa für [Topik]) auf: Eine Bewegung wird durch einen EoO lizensiert (der konfigurationell erreicht wird), oder aber durch das EPP-Merkmal von T (welches nicht optional sondern obligatorisch für T ist). Die Ausgabe der syntaktischen Komponente ist dennoch nicht gänzlich deterministisch, da die Syntax vielfach unterspezifiziert ist für die Belange der Phonologie: Sie bestimmt zwar in einigen Fällen (z.B. bei EoO-konformen Bewegungen) aber nicht in allen Fällen, welche linearen Sequenzen die PF erzeugt: Die Syntax überlässt etwa die Linearisierung des syntaktischen Strukturbaums, sowie semantisch irrelevante Spellout-Entscheidungen der PF-Komponente. Die PF-Komponente weist einige recht kategorische Regularitäten auf (Hutkonturen müssen einen rise vor einem fall haben), ist andererseits aber auch oft weniger strikt (Akzentdomänen können ‚besser‘ oder ‚schlechter‘ ausfallen, sie sind also nicht in jedem Fall kategorisch perfekt oder aber völlig inakzeptabel). Es ergeben sich damit die möglichen und die unmöglichen Wortstellungsmuster und innerhalb der möglichen Wortstellungen auch bereits prosodisch präferierte und dispräferierte Sequenzen. Da es sich hier um Anforderungen der PF-Komponente (nicht der Kernsyntax oder der Semantik) handelt, ist dies aber explizit nicht als syntaktische Optionalität zu werten. In der Menge der linearen Abfolgen lassen sich solche finden, die aus Performanzgründen bevorzugt sind und auch solche, die nach Maßgabe bestimmter Performanzprinzipien dispräferiert sind. Da diese Unterscheidungen gänzlich ausserhalb des Zuständigkeitsbereichs der Kompetenzgrammatik liegen, betreffen sie oft nicht die ‚Grammatikalität‘ der Äußerungen (lies: sind die Strukturen kategorisch möglich oder nicht), sondern ihre Gebrauchseigenschaften (lies: werden die Strukturen präferiert verwendet oder nicht).
Damit erreicht die vorliegende Analyse ein übergeordnetes Ziel der aktuellen syntaktischen Forschung: Die syntaktische Komponente soll (z.B. aus evolutionären Überlegungen heraus, vgl. Chomsky 2007) möglichst weitgehend ‚entrümpelt‘ werden. Das heißt genauer, dass Operationen und Eigenschaften, die in anderen Komponenten der Grammatik (den Schnittstellen) erklärt werden können, nach Möglichkeit nicht mehr syntaktisch repräsentiert werden. Mit Blick auf Operationen zur Strukturveränderung schlägt z.B. Bobaljik vor, dieser Ansatz involviere
Rekonstruktion der (vermeintlichen) Topikbewegung
217
„leaving the resolution of the pronunciation of [a movement chain] as a morphophonological, PF-interface matter (2002: 244). Die Maßgabe aber, die Syntax von bestimmten Teilaufgaben der Satzkonstitution in diesem Sinne zu entbinden, wird von vielen aktuellen syntaktischen Arbeiten nach meiner Einschätzung nur absolut unzureichend umgesetzt: Die Syntax wird nach wie vor (miss-) verstanden als ‚Universaltheorie des Satzes‘. Mit anderen Worten: Alle Eigenschaften, die im weiteren Sinne für Sätze gelten, sollen eine syntaktische Erklärung finden. Wenn sich also zeigt, dass die Wortstellung des Deutschen in Teilen ‚optional‘ zu variieren scheint, so werden sogleich optionale syntaktische Bewegungen stipuliert, die die Oberflächentendenzen direkt repräsentieren. Die Zirkularität vieler dieser Annahmen wurde oben bereits diskutiert. Nimmt man aber die übergeordneten Ziele der aktuellen Syntax ernst, so muss diese Überfrachtung der kernsyntaktischen Komponente möglichst weit zurückgedrängt werden. Wie in diesem Kapitel gezeigt wurde, argumentiert die vorliegende Analyse (obschon sie eine in Teilen syntaktische ist!) dafür, den Aufgabenbereich der Kernsyntax zu verkleinern: Optionale Merkmalszuweisungen, die ebenso optionale syntaktische Bewegungen auslösen werden als ‚Erklärung‘ von Scrambling vermieden. Wie bei der Vorstellung der theoretischen Annahmen der Arbeit in Kapitel 3.3 gezeigt, ist es eben nicht (mehr) die Aufgabe der Syntax, ‚fertige Sätze‘ zu generieren: Wenn im gewählten theoretischen Rahmen auch die Schnittstellen signifikante Aufgaben (anstatt mehr oder minder trivialer Abbildungsfunktionen) übernehmen sollen, dann darf die Kernsyntax die durch diese Aufgaben bestimmten Eigenschaften nicht deterministisch vorherbestimmen: Diese Aufgaben werden dann in anderen Komponenten der Kompetenzgrammatik (z.B. auf PF) repräsentiert oder folgen aus Faktoren, die letztlich gar nicht der Kompetenzgrammatik zuzurechnen sind. Eine Repräsentanz sowohl in der Syntax, wie auch auf den Schnittstellen (und darüber hinaus) hingegen wäre im höchsten Maße redundant. Scrambling ist, was die Kompetenzgrammatik anbetrifft, damit ein Konglomerat aus kategorisch lizensierten syntaktischen Operationen und verschiedenen PF-Anforderungen. Gemeinsam erklären diese Module, welche Strukturen syntakto-semantisch und prosodisch möglich sind und welche darüber hinaus prosodisch präferiert. Da aber auch Syntax und PF-Komponente zusammengenommen die Menge der kontextuell adäquaten Äußerungen in einer Situation nicht deterministisch vorhersagen, hat der Sprecher eine echte Wahl, welche Wortstellung oder welches Intonationsmuster er oder sie verwenden möchte (und zwar selbst dann, wenn er oder sie sich auf grammatische und prosodisch mögliche Strukturen beschränken möchte, was ja gar nicht unbedingt in jeder Situation selbstverständlich sein muss). Über die Präferenzen bezüglich der möglichen (und auch der unmöglichen) Strukturen muss aber eine Performanztheorie entscheiden. Diese klärt – anders als die Kompetenzgrammatik – die Frage „how the speaker or hearer
218
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
might proceed, in some practical or efficient way“ (Chomsky 1965: 9, vgl. die Einleitung dieser Arbeit). Nur auf diese Weise lässt sich letztlich erklären, warum die langstehenden Generalisierungen zum Scrambling typischerweise eben keine harten, kategorischen Aussagen erlauben: „If [scrambling movements] were obligatory, [...] the reason for scrambling would be first and foremost derive from the grammar, and certainly not from some communicative ordering principle. [...] We would be surprised if a substantial part of the linguistic tradition were so completely misguided“ (Bayer & Kornfilt 1994: 34). Mit Blick auf die (und in Abgrenzung von) älteren Vorschläge zur Analyse von Scrambling im Deutschen kann der Status der Informationstruktur nun explizit benannt werden: Informationsstrukturelle Eigenschaften nehmen keinerlei nachweisbaren Einfluss auf die syntaktische Derivation der für das Deutsche diskutierten Sätze. Die Informationsstruktur ist damit (es sei noch einmal betont: im engen, theoretischen Sinne einer generativen Kompetenzgrammatik!) kein Bestandteil eines syntaktischen Modells des Deutschen: Natürlich beeinflusst das Merkmal [Fokus], welches auch in der vorliegenden Analyse angenommen wird, die resultierende Wortstellung des Deutschen. Das Merkmal löst jedoch keinerlei syntaktische Operationen aus: Da [Fokus] ein interpretierbares Merkmal darstellt, muss keine Agree-Operation das Merkmal von der semantischen Schnittstelle fernhalten. Kein funktionaler Kopf Fokus0 einer funktionalen Projektion FokusP muss daher das Merkmal [Fokus] lizensieren. In gleicher Weise existiert keine KontrasttopikP, die Kontrasttopiks nach SpecKontrasttopikP attrahiert. Die offensichtliche Zirkularität solcher ‚Erklärungen‘ wird von der vorliegenden Analyse daher vermieden – wie das folgende Unterkapitel abschließend demonstriert.
10.5 Zusammenfassung: Zur Architektur von Syntax und Phonologie Die vorliegende Arbeit hat sich zum Ziel gesetzt, eine Architektur bereitzustellen, die syntaktische, semantische und phonologische Faktoren und ihren Einfluss auf die Wortstellung aufeinander abbilden kann. Da, wie oben gesehen, die semantischen Einflüsse auf die Wortstellung bereits von anderen Autoren hinlänglich repräsentiert wurden (durch EoO-konforme Instanzen von internal merge, sowie durch die semantische Funktion von external merge), soll in diesem Unterkapitel das Zusammenspiel insbesondere der syntaktischen mit den prosodischen Faktoren vorgestellt werden. Es zeigt sich, dass die in der vorliegenden Arbeit vorgeschlagene Analyse genau deshalb einen neuen Ansatz zur Erklärung von Scrambling bietet, weil sie die Last der Erklärung gerade nicht der syntakti-
Zusammenfassung: Zur Architektur von Syntax und Phonologie
219
schen Komponente allein aufbürdet: Die Ausgabe der kernsyntaktischen Komponente ist eine völlig abstrakte, hierarchische Konfiguration aus Kopien lexikalischer Elemente, die bestimmte (syntakto-semantisch bestimmte) Konstellationen repräsentiert. Es ist die PF-Komponente, die aus diesem syntakto-semantischen Strukturbaum die lineare Sequenz ableitet, die wir der ‚Aussprache eines Satzes‘ zuordnen können. Die hier vorgeschlagene Analyse gliedert sich hier nahtlos in die Forschungsdiskussion der letzten zwanzig Jahre ein: Aufgaben, die in älteren Theorievarianten der Syntax aufgetragen wurden, sollen nun auf den Schnittstellen der Architektur bearbeitet werden. Die Aufgabe der PF-Schnittstelle hat sich so z.B. erweitert um die Linearisierung des syntaktischen Strukturbaums: Die phonologische Komponente allein bearbeitet lineare Sequenzen – die semantische Komponente hingegen die hierarchischen Verhältnisse im Strukturbaum (Enthaltensein, Dominanz, vormals C-Kommando, etc.). Kernsyntaktische Restriktionen (wie das LCA, vgl. Kayne 1994) oder parametrisierte Optionen (wie z.B. der Kopfparameter, vgl. Chomsky 1981) werden dadurch aus dem Zuständigkeitsbereich der Kernsyntax herausgenommen. Desgleichen wird auch die Auswahl der Bewegungskopien, die phonologisch ausbuchstabiert werden, nun auf PF geleistet: Manchmal können Phrasen in hohen, manchmal in tiefen Kopien ausbuchstabiert werden – und manchmal sogar in mehreren Kopien zugleich, wie in der bereits vorgestellten Arbeit von Fanselow & Cavar (2002) gezeigt. Durch die vorliegende Analyse wird diese neue Arbeitsteilung nun auch auf die Analyse von Scrambling übertragen: Scrambling ist eine Kooperation der Kernsyntax und ihrer Schnittstellen. Architektonisch ergibt sich folgendes Gesamtbild: Die Kernsyntax erzeugt eine Ausgabe, die hinsichtlich der gerade genannten PF-Eigenschaften unterspezifiziert ist: Die Linearisierung des Strukturbaums und die Auswahl der Bewegungskopien ist eine PF-Aufgabe. Das heißt mit anderen Worten auch: Das von der Kernsyntax ausgegebene strukturelle Objekt ist a priori kompatibel mit einer Vielzahl von Wortstellungsmustern. Das folgende Unterkapitel diskutiert einige Beispiele.
10.5.1 Beispiele: Spellout-Szenarien einzelner syntaktischer Strukturen In den folgenden Beispielen wird jeweils eine syntaktische Struktur präsentiert, wie sie die in dieser Arbeit vorgeschlagenen Derivationsabläufe ergeben könnten. Es wird dann gezeigt, welche PF-Spellouts auf Basis jeder der syntaktischen Ausgaben jeweils möglich sind. Wie sich zeigt, sind die o.a. PF-Faktoren oft ausreichend, um Wortstellungsmuster und semantische Faktoren zu erklären.
220
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
225. Kernsyntax: ... [TP [vP DPFokus DPKontrastTop] [NegP [vP DPFokus DPKontrastTop]]] Ist prinzipiell kompatibel mit verschiedenen PF-Tilgungen wie z.B.: a) [TP [vP DPFokus DPKontrastTop] [PartP [vP DPFokus DPKontrastTop]]] = DPFokus DPKontrastTop Part b) [TP [vP DPFokus DPKontrastTop] [PartP [vP DPFokus DPKontrastTop]]] = DPKontrastTop Part DPFokus c) [TP [vP DPFokus DPKontrastTop] [PartP [vP DPFokus DPKontrastTop]]] = DPFokus Part DPKontrastTop d) [TP [vP DPFokus DPKontrastTop] [PartP [vP DPFokus DPKontrastTop]]] = Part DPFokus DPKontrastTop Für das Deutsche wird nun, wie oben diskutiert, nur eine Auswahl aus den angegebenen Möglichkeiten zugelassen – es ergibt sich die ‚subtraktive‘ Funktion der PF-Komponente: Zum einen gilt es, die Anforderungen der Semantik abzubilden – wodurch EoO-konforme Bewegungen auf PF repräsentiert werden. Die Basisposition EoO-konform bewegter Elemente muss daher aus der Distributed Deletion der vP ausgenommen werden. Zum zweiten bestehen nur für bestimmte Kategorien von Elementen (laut der vorliegenden Analyse: für definite DPen und für Kontrasttopiks) Spellout-Lizenzen für die obere vP-Kopie. Angenommen nun aber, im gegebenen Beispiel liegt (wie angezeigt) keine EoO-konforme Bewegung vor, und beide DP-Argumente sind definit. Welche Möglichkeiten der Distributed Deletion bestehen dann für dieses Beispiel im Deutschen? Die ‚hohe‘ Aussprache eines fokusierten Arguments etwa wird durch die Maßgabe Don‘t scramble focus! wie o.a. tendentiell nicht gestattet: Sie ist zumindest prosodisch enorm stark dispräferiert. Damit scheiden die Tilgungen in (a) und (c) im Normalfall als Ausgabe der PF-Komponente aus (obwohl die syntaktische Bewegung der fokussierten DP innerhalb der vP wohlgeformt ist). Die Auswahl zwischen den verbleibenden Optionen (b) und (d) kann ebenfalls rein phonologisch gesteuert werden: Da der kontrastive rise dem Fokusexponenten vorangehen muss, um die intonatorische Hutkontur bilden zu können, kann auch die Option (d) nun ausgeschlossen werden: Da hier die fokussierte Phrase dem kontrastiven Topik vorangeht, ist die korrekte lineare Abfolge von rise und fall nicht herzustellen. Möglichkeit (d) kann daher ebenfalls aus prosodischen (nicht: syntaktischen!) Gründen aus der Menge der möglichen Sätze
Zusammenfassung: Zur Architektur von Syntax und Phonologie
221
‚abgezogen‘ werden. Vergleicht man dieses abstrakte ‚subtraktive‘ Vorgehen nun mit den empirischen Gegebenheiten, so zeigt sich, dass die Analyse empirisch korrekte Vorhersagen machen kann: 226. Syntax: weil... [TP [vP JEDer seinen /BRUDer] ja [vP JEDer seinen /BRUDer]] mag] PF (a): weil... [TP [vP JEDer seinen /BRUDer] [ja [vP JEDer seinen /BRUDer]] mag] = *weil JEDer seinen /BRUDer ja mag *Hutkontur nicht erreicht *Verletzt Don‘t scramble focus! PF (b): weil
[TP [vP JEDer seinen /BRUDer] [ja [vP JEDer seinen /BRUDer]] mag] = weil seinen /BRUDer ja JEDer mag Syntaktisch und prosodisch zulässig
PF (c): weil
[TP [vP JEDer seinen /BRUDer] [ja [vP JEDer seinen /BRUDer]]mag] = weil JEDer ja nicht seinen /BRUDer mag *Hutkontur nicht erreicht *Verletzt Don‘t scramble focus!
PF (d): weil... [TP [vP JEDer seinen /BRUDer] [ja [vP PETer seinen /BRUDer]]mag] = weil ja nicht JEDer seinen /BRUDer mag *Hutkontur nicht erreicht Damit wird – aus den in a-d gegebenen Kandidaten – nur (b) als syntaktisch und prosodisch wohlgeformt vorhergesagt. Die prinzipiell vielseitige Ausgabe der Syntax wird durch die PF-Komponente daher (in diesem bestimmten Fall) auf eine einzige mögliche Abfolge von Fokus und Kontrasttopik reduziert. Ein attraktives Ergebnis ist auch, dass mit dieser Analyse die Bindung von seinen kein Problem darstellt: Innerhalb der bewegten vP kann seinen Bruder das Subjekt jeder nicht (unzulässig) binden. Vielmehr kommt diese Derivation ohne EoO-konforme Bewegungen im Mittelfeld aus: Das Subjekt kann das Objekt bereits in der Basisabfolge binden. Das Beispiel stellt also definitiv einen Fall von EoO-loser Umstellung dar. Ein anders gelagerter Fall liegt dann vor, wenn einzelne Argumente weder als Kontrasttopiks noch als Foki fungieren – etwa im Falle der bereits diskutierten
222
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
einfachen Fokussierung eines Objekts. Vernachlässigt man die Position des nach SpecCP bewegten Subjektes in der Darstellung, so ergibt sich: 227. Frage: Wem hast Du das Buch gegeben? Antwort: Ich weiß nicht mehr – ich glaube, ich habe [vP dem StudentenFokus das Buch gegeben] [wohl [vP dem StudentenFokus das Buch gegeben]] Für das (nicht kontrasttopikalisierte) infinite Verb gegeben liegt keine SpelloutLizenz für die vP-Kopie in SpecTP vor, es muss daher in der tiefen Kopie der vP ausbuchstabiert werden. Es ergeben sich folgende Tilgungsmöglichkeiten: 228. Ich habe... a) [vP dem StudentenFokus das Buch gegeben] wohl [vP dem StudentenFokus das Buch gegeben] = Ich habe wohl dem StuDENTen das Buch gegeben. Syntaktisch und prosodisch zulässig, finale AD ist ‚super-big‘ b) [vP dem StudentenFokus das Buch gegeben] wohl [vP dem StudentenFokus das Buch gegeben] = Ich habe das Buch wohl dem StuDENTen gegeben. Syntaktisch und prosodisch zulässig, minimale finale AD c) [vP dem StudentenFokus das Buch gegeben] wohl [vP dem StudentenFokus das Buch gegeben] ??Verletzt Don‘t scramble focus (Aber möglich als Kontrastfokus) d) [vP dem StudentenFokus das Buch gegeben] wohl [vP dem StudentenFokus das Buch gegeben] ??Verletzt Don‘t scramble focus! (Möglich als Kontrastfokus) Auch hier ergibt sich das gewünschte Bild: Sowohl die Basisabfolge, als auch die Abfolge mit EoO-los umgestelltem Objekt ist vor der Hand möglich. Die unterspezifizierte Ausgabe der Syntax wird in diesem Fall nicht auf eine einzige lineare Wortfolge reduziert. So ergibt sich die Möglichkeit der ‚optionalen Bewegung‘ – die jetzt aber als Unterspezifikation sowohl der Syntax wie auch der PF-Komponente interpretiert wird. Wie kommt die Präferenz für die Scrambling-Variante (b) zustande?
Zusammenfassung: Zur Architektur von Syntax und Phonologie
223
Die Sprecherintuition, dass (b) etwas ‚besser klingt‘ als (a) ist ebenfalls phonologisch begründbar: Wird nämlich das Objekt das Buch in seiner hohen Kopie ausbuchstabiert, ergibt sich dadurch eine ‚bessere‘ Akzentdomäne: Mit dem Fokus dem Studenten wird in (b), aber nicht in (a) das am weitesten rechtsstehende Element betont. Wiewohl (a) wie (b) also gleichermaßen möglich sind, ist (b) phonologisch präferiert. Um zu demonstrieren, dass die Syntax in der vorgeschlagenen Analyse wirklich keinerlei look-ahead betreibt, lässt sich auch das umgekehrte Szenario aufzeigen: Die Syntax kann, aus ihren eigenen Beweggründen heraus, syntaktische Umstellungen vollführen, die phonologischen Gesetzmäßigkeiten zuwider laufen. Die Syntax bewegt also auch nicht etwa dann nicht, wenn sie per look-ahead erkennt, dass sie damit den default-Fall der Betonungszuweisung aufhebt. So ist ein Szenario denkbar, in dem ein fokussiertes Element syntaktisch bewegt wird, und – entgegen dem phonologischen default – in seiner hohen Kopie ausbuchstabiert werden muss. Dies ist nämlich dann der Fall, wenn ein hoher semantischer Skopus für das fokussierte Element erreicht werden muss: Soll diese syntaktosemantische Konstellation auf PF transparent abgebildet werden, so muss Don‘t scramble focus! verletzt werden. Mit anderen Worten: die syntaktisch herbeigeführte Spellout-Anweisung, die aus einer EoO-konformen Bewegung resultiert, kann im Spellout-Prozess nicht ignoriert werden. Das folgende Beispiel illustriert dieses Szenario: 229. External merge erzeugt: Internal merge erzeugt: ZPFokus PF-Spellout dann: ZPFokus Linear resultiert: ZPFokus
Neg [XP YP ZPFokus] Neg [XP YP ZPFokus] Neg [vP YP ZPFokus] Neg YP
Das folgende Beispiel illustriert, dass Foki tatsächlich dann aus der vP bewegt werden können, wenn (nur) dadurch ein EoO erzielt wird: 230. (Kontext: Wenn die Ärzte erst merken, dass Patienten, die krank bleiben, viel lukrativer sind also solche, die gesund werden – wieviele Patienten würde die dann wohl NICHT mehr heilen?) Die würden doch [ALLeFokus Patienten] nichtNeg mehr heilen! (∀¬) = [alleF Patienten [nicht mehr [vP ... alle Patienten heilen]]] Soll also die Lesart erreicht werden, in der kein Patient geheilt wird (also ∀¬), so kann (und muss) die fokussierte Phrase overt über die Negation bewegt werden – obwohl sie Fokusexponent ist. Foki werden werden sowohl EoO-konform als auch vP-intern genauso bewegt wie Nicht-Foki. Ist ein Argument fokusmarkiert,
224
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
so bleibt das Argument dennoch verfügbar für Bewegungsoperationen – auch solche, die konträr applizieren zur Maßgabe Don‘t scramble focus! Für die PF-Komponente aber kann nun eine genauere Beschreibung des Spellout-Prozesses erfolgen: Es liegt hier keine generelle Abkehr von der Maßgabe, den tiefstmöglichen Fokus auszubuchstabieren – es zeigt sich allerdings, dass die Frage, was der tiefstmögliche Fokus ist, syntakto-semantische definiert wird: Soll die all-quantifizierte Phrase alle Patienten Skopus über die Negation nicht erlangen, so kann erst die Bewegungskopie von alle Patienten oberhalb der Negation für die Spellout-Auswahl zur Verfügung stehen (aber eben nicht die Basiskopie des Objekts unterhalb der Negation). Die PF-Komponente wählt mit anderen Worten Kopien zum Spellout aus der Menge von Kopien aus, die die Syntax der PF vorgibt. Für die EoO-losen Bewegungen heißt dies, dass die Syntax keine Vorgaben macht (da die Bewegung für die semantische Komponente nicht von Belang ist). Für die semantisch motivierten Bewegungen aber muss die Bewegung phonologisch respektiert werden. Auf diese Weise ergibt sich exakt das Bild, welches empirisch im Deutschen vorzuliegen scheint: Gerade die Elemente, die keinen semantischen EoO durch ihre Bewegung auslösen (häufig z.B.: die definiten DPen) bewegen sich am unrestringiertesten. Skopussensitives Material (wie die QP alle Patienten im gegebenen Beispiel) unterliegen im Deutschen in ihrer Distribution syntakto-semantischen Restriktionen. Das gesamtgrammatische System, bestehend aus der Kernsyntax und ihrer phonologischen und semantischen Schnittstelle, bestimmt in diesem Sinne die Menge der möglichen Sätze, der Lesarten dieser Sätze und ihrer möglichen prosodischen Realisationen. Das soll aber natürlich nicht heißen, das damit für jeden Kontext nun exakt ein Satz zur Verfügung stünde, der eine vom Sprecher intendierte Lesart ausdrückt: Oft sind mehrere, alternative Sätze möglich, die allesamt grammatisch zulässig und kontextuell adäquat sind. Die Auswahl zwischen diesen Alternativen kann, wie gesehen, aber durch performative Faktoren völlig systematisch beschrieben und erklärt werden. Da die vorliegende Arbeit aber eine Architektur der Kompetenzgrammatik liefern möchte, sollen die performativen Aspekte von Wortstellungsvarianten im Deutschen hier nicht weiter diskutiert werden. Im folgenden Unterkapitel soll vielmehr gezeigt werden, dass die syntaktische Alternative zu der hier vorgestellten Analyse – die informationsstrukturell ausgelösten Bewegungen – empirisch vergleichsweise problematisch sind: Anders als die vorliegende Analyse restringieren diese Analysen Scrambling-Vorgänge zu stark.
Zusammenfassung: Zur Architektur von Syntax und Phonologie
225
10.5.2 Ein letzter Vergleich: File card-Analysen restringieren Einige der bereits diskutierten Autoren (etwa Reinhart 1981, für das Deutsche Meinunger 2000) gehen davon aus, dass nur solche Elemente sich als Topiks eignen, die auch als file cards interpretiert werden können. Mit dieser Annahme verbindet sich die Vorhersage, dass bestimmte Klassen von Elementen nicht ins linke Mittelfeld gelangen können. Wie sich zeigt, sind diese Vorhersagen aber zu restriktiv. Mit der Annahme eines file card-Systems (wie durch das aboutness-Konzept z.B. bei Meinunger 2000 und Frey 2004) wird letztlich ausgesagt, dass Elemente im linken Mittelfeld sich als ‚Adresse‘ eignen müssen, an der eine neue Proposition verankert wird (vgl. Reinhart 1981). Damit können Sätze wie der folgende als informationsstrukturell ausgeschlossen präsentiert werden, weil sich wen nicht als file card eignet: 231. ??Gestern habe ich wen ja auf der Straße gesehen. Auch diese Voraussage stellt sich wiederum als zu hart heraus: Zwar gilt, dass eine EoO-konforme Bewegung in diesem Beispiel wohl nicht vorliegen kann. Auch eine hohe Spellout-Lizenz kann für das (nicht definite, nicht kontrasttopikalisierte) Element wen kaum erreicht werden. Dennoch treten Wh-Indefinita im linken Mittelfeld auf: 232. daß wer was nicht [VP ti gekauft hat]
(Bsp. Lechner 1998: 279)
Wenn man die Negation nicht hier (wie Lechner) als vP-extern einstuft, so muss das Objekt was über die Negation hinweg bewegt worden sein. Mir scheint hier sogar, dass die Wortfolge, in der das Wh-Indefinitobjekt nicht bewegt wird, wesentlich schwerer (oder gar nicht) interpretierbar ist: 233. ? [C dass [TP wer nicht [vP was gekauft] hat]] Möglicherweise wird hier also die Bewegung des Wh-Indefinitpronomens was sogar semantisch erzwungen! Dass es hier vielleicht tatsächlich um semantische (nicht: syntaktische) Restriktionen geht, scheint mir deshalb plausibel, weil syntaktisch gleichwertige, aber modalisierte Alternativen mir als wesentlich besser erscheinen: 234. ?Es ist ja nicht so,... ...[C als ob [TP wer nicht [vP was geKAUFT] hätte]]
226
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
Generell gilt auch, dass Wh-Indefinitpronomina sehr wohl EoO-konform (und d.h. ja: lizensiert durch die satzsemantische Komponente) bewegt werden können, z.B. um Skopus über ein quantifiziertes Subjekt zu erlangen: 235. wenn wen niemand geküsst hat (Bsp. 13c aus Fanselow, Ms.) Die Lesart (‚wenn unbestimmte Individuen existieren, die niemand geküsst hat‘) ist in offensichtlicher Weise verschieden von der Lesart der Basisabfolge (‚es gilt für kein Individuum, dass es jemanden geküsst hat‘): 236. wenn niemand wen geküsst hat Eine semantische Ursache legitimiert daher möglicherweise eine EoO-konforme Bewegung auch von Wh-Indefinitpronomina. Können Wh-Indefinitpronomina, da sie ja offensichtlich doch nicht stellungsfest sind, nun auch innerhalb der bewegten vP in SpecTP auftreten? Nötig wäre für diesen Fall, dass eine phonologische Konstellation gefunden werden, die die Umstellung der Wh-Indefinitpronomina begünstigt. Diese Konstellation lässt sich tatsächlich belegen, denn ganz generell kann festgestellt werden, dass WhIndefinita sehr wohl auch ohne semantischen Effekt ins linke Mittelfeld gelangen können – so lange sie nicht einzeln dort auftreten: 237. Da hat wer wem wohl was nicht gesagt. Dieses Beispiel ist für mich problemlos möglich. Meine Informanten konnten oft nicht einmal erkennen, welches potentielle Problem in diesem Satz vorliegen soll – er wird von den meisten als rundherum wohlgeformt eingestuft (aber nicht von allen, Dennis Ott, p.c.). Die Bewegung des direkten Objektes was mag nun noch mit der Position relativ zur Negation nicht als EoO-konform erklärt werden. Im Unterschied zu den Beispielen Lechners und Fanselows aber kann ich nicht erkennen, dass für die Wortstellung von Subjekt und indirektem Objekt (wer bzw. wem) links der Modalpartikel hier ein EoO vorläge, der eine syntaktische Bewegung der Wh-Indefinita lizensieren könnte. Stattdessen erscheint mir die hohe Aussprache dieser Wh-Indefinita, ähnlich wie bei den Personalpronomina, durch in gewisser Weise klitisch anmutende Stellungsmuster verursacht zu sein: Ein einzelnes Wh-Indefinitum ist im linken Mittelfeld vielleicht problematisch, mehrere Wh-Indefinitpronomina sind es als Gruppe hingegen nicht. Eine Analyse, die die Bewegung dieser Pronomina mit SpecHead-getriebenen Bewegungen erklären wollte, dürfte mit dieser ‚phonologischen Rudelbildung‘ ihre liebe Mühe haben.
Zusammenfassung: Zur Architektur von Syntax und Phonologie
227
Für die vP-TP-Analyse aber gilt, dass sie diese phonologisch-lineare Eigenschaft durch die Distributed Deletion auf PF nachzeichnen könnte. Durch die vP-interne Abfolge der wh-Indefinita würde hier sogar die lineare Abfolge der Elemente im linken Mittelfeld korrekt vorhersagt: Wenn sich sowohl das Subjekt wie das Objekt in diesen Beispielen innerhalb der vP in SpecTP befinden, sollten sie auch nur in dieser Reihenfolge ausbuchstabierbar sein. Zunächst einmal erscheinen mir die folgenden Beispiele möglich – und sie entsprechen alle der vP-internen Argumentabfolge: 238. a) Da hat [vP wer] wohl wem was nicht gesagt. b) Da hat [vP wer wem] wohl was nicht gesagt. c) Da hat [vP wer wem was] wohl nicht gesagt. Für veränderte Abfolgen links der Modalpartikel aber sehe ich zumindest starke Vorbehalte: 239. a) b) c) d) e)
??Da hat wer was wem wohl nicht gesagt *Da hat wem wer was wohl nicht gesagt. *Da hat wem was wer wohl nicht gesagt. *Da hat was wem wer wohl nicht gesagt. *Da hat was wer wem wohl nicht gesagt.
Auch für das o.a. Beispiel Lechners gilt nach meinem Dafürhalten, dass die Argumentabfolge nicht verändert werden darf: 240. daß wer was nicht [VP ti gekauft hat] (Bsp. Lechner 1998: 279) ??/*dass was wer nicht [VP ti gekauft hat]
vs.
Mit anderen Worten: die Tendenz zur ‚Blockhaftigkeit‘ der Bewegungen von Pronomina lässt sich auch für die Wh-Indefinitpronomina nachweisen – und durch die Annahme eines in Teilen phonologischen gesteuerten vP-Spellouts auch potentiell erklären. Zusammenfassend gilt: Wh-Indefinita können (wenngleich semantisch und phonologisch restringiert) sehr wohl ins linke Mittelfeld gelangen – und zwar sowohl EoO-konform, als auch als Bestandteile der vP in SpecTP. Die zukünftige Forschung könnte demnach probieren, klitikähnliche Stellungsmuster von ‚leichten‘ Elementen darauf hin zu untersuchen, ob sie als eine weitere Spellout-Lizenz im Rahmen der hier vorgeschlagenen Architektur fungieren können. Auch die sukzessiv-zyklische Bewegung von komplexen Wh-Ausdrücken zeigt, dass das linke Mittelfeld nicht nur ‚topikalen‘ Ausdrücken offensteht:
228
Abbildung der informationsstrukturellen Verhältnisse im Mittelfeld
241. Wasi hat Hans [ti für Leute] dummerweise angerufen? (Bsp. Fanselow 2006: 145) Fanselow ist zuzustimmen, wenn er urteilt: „Wh-phrases such as was für Leute [...] make bad topics“ (2006: 145). Damit gilt, dass Elemente, die sich nicht als Topiks eignen, sehr wohl unter bestimmten Bedingungen ins linke Mittelfeld gelangen können. Ein weiteres Problem ergibt sich für die Topikanalysen auch aus einem weiteren empirischen Feld, welches in der Forschung bisher nicht in ausreichendem Maße für die Untersuchung von Scrambling-Bewegungen nutzbar gemacht wurde: Die Analysen Freys (2004) und Meinungers (2000) gehen beide davon aus, dass über die topikalen Elemente Informationen angesammelt werden, die im Common Ground (CG) abgelegt werden können. Voraussetzung hierfür dürfte sein, dass die Strukturen, in denen Scrambling auftritt, geeignet sind, eine Proposition beizusteuern, auf deren Wahrheit sich der Sprecher verpflichtet: Nur in diesem Szenario kann und soll die Proposition von den Gesprächspartnern wohl zum Common Ground hinzugefügt werden. Damit aber sollten etwa restriktive Relativsätze und pränominale Attributskonstruktionen nicht zu den Strukturen gehören, innerhalb derer Scrambling auftritt: Diese Strukturen werden von einem Sprecher ja gar nicht dazu genutzt, eine Behauptung aufzustellen, deren zugrundeliegende Propostion dem CG hinzugefügt werden könnte! Sie dienen vielmehr der Spezifikation eines Referenten, den der Hörer identifizieren können soll. Alle Eigenschaften des Referenten sollen vom Hörer als präsupponiert angesehen werden – ihnen kann z.B. nicht widersprochen werden: 242. A: Der mir von Dir empfohlene Zahnarzt ist ein fieser Menschenschlachter. B: Das stimmt nicht! Der Widerspruch kann hier meiner Intuition nach auf keinen Fall so interpretiert werden, dass B behauptet, er habe den Zahnarzt nicht empfohlen. Nur der Einschätzung, der Zahnarzt sei schlecht, wird von B widersprochen. Selbst dann, wenn der B dem A gar keinen Zahnarzt empfohlen hätte, so müsste die Referenz der DP der von Dir empfohlene Zahnarzt schlicht scheitern, und der Widerspruch wäre auch in diesem Fall nicht zu erwarten (sondern wohl vielmehr die Gegenfrage: Welcher Zahnarzt?). Wenn sich also nun zeigen ließe, dass auch in pränominalen Attributsstrukturen Scrambling möglich ist, so wäre dies aus Sicht der Topikanalyse unerwartet. Genau dieses Phänomen aber lässt sich nachweisen (vgl. Struckmeier 2010a):
Zusammenfassung: Zur Architektur von Syntax und Phonologie
229
243. a) ein ja immer einer Frau helfender Mann b) ein einer Frau ja immer helfender Mann Die hier gezeigte Wortstellungsvariation kann nur schwerlich anders erklärt werden als als Scrambling-Bewegung: Eine rein phonologisch-stilistische Erklärung der verschieden Abfolgen könnte z.B. nicht erklären, warum mit diesen Varianten offenbar systematische semantische Effekte einhergehen – zumal diese Effekte eindeutig denen entsprechen, die Diesing auf der Satzebene beschrieben hat (1992). Wie die Analyse in Struckmeier (2010a) zeigt, sind auch Wackernagelartige Positionierungen pronominaler Argumente, konstruktionssfinale Foki etc. in diesen Strukturen nachzuweisen. Wie schon Struckmeier (2007) gezeigt hat, sind diese Attribute aber nun satzwertig: Sie weisen letztlich die gleiche Kaskade funktionaler Projektionen aufweisen, die auch aus etablierten Satztypen bekannt ist. Damit zeigt sich, dass CG-Erweiterungen durch Strukturen kein notwendiges Kriterium dafür sind, ob Scrambling in diesen Strukturen möglich ist. Vielmehr ist das Inventar funktionaler syntaktischer Kategorien für das Auftreten von Scrambling-Bewegungen relevant. Damit wirkt es so, als hätten insbesondere Topikanalysen über bestimmte Phänomenbereiche ganz generell wenig zu sagen: Für diese Strukturtypen ergibt die Annahme einer ‚adressierten‘ CG-Erweiterung aus meiner Sicht kaum Sinn, und potentielle Scrambling-Vorgänge in diesen Strukturen bleiben daher unerklärt. Aus der hier vorgeschlagenen Analyse hingegen folgt Scrambling auch in anderen Konstruktionen direkt: Wenn auch in attributiven Partizipialstrukturen, Relativsätzen usw. vP- und TP-Projektionen (sowie ggf. Partikeln) auftreten, so sollten sie auch in diesen Strukturen Scrambling in gleicher Weise auslösen können. Wie Struckmeier (2007, 2010a) zeigt, liegen genau diese formalen Strukturen auch in den Attributen des Deutschen vor. Im folgenden Kapitel soll nun gezeigt werden, dass die hier vorgeschlagene alternative Architektur der Kompetenzgrammatik empirisch die richtigen Vorhersagen macht: Die am Anfang dieser Arbeit genannten Eigenschaften von Scrambling können, so wird gezeigt, durch die gemachten Annahmen nämlich allesamt recht gut erklärt werden.
11 Zur Erklärung der syntaktischen Verhältnisse im Mittelfeld Nachfolgend sollen die syntaktischen Eigenschaften von Scrambling, die eingangs aufgelistet wurden, in je eigenen Unterkapiteln thematisiert werden. Wie sich zeigt, sagt die vorgeschlagene Analyse jede dieser Eigenschaften korrekt voraus.
11.1 Zur Stellung des Subjekts im linken Mittelfeld Es ist vergleichsweise schwer, (nicht-pronominale) Elemente im linken Mittelfeld über das Subjekt hinweg anzuheben. Dies wird in der Theorie indirekt vorhergesagt: – Das Subjekt ist in der vP das am weitesten links stehende Element. – Die vP befindet sich in SpecTP, der am weitesten links stehenden Position des Mittelfeldes. – Daraus folgt, dass das Subjekt (im Regelfall) das am weitesten links stehende Element des Mittelfeldes sein muss. – Wird das Subjekt hingegen in der ‚tiefen‘ Kopie der vP (z.B als [Fokus] ausgesprochen, können anderen Elemente leicht zu seiner Linken auftreten. – Treten besonders komplexe EoO-konforme Umstellungen auf, kann das Subjekt, wie gesehen, aber auch (wenngleich vielleicht eher marginal) vom linken Rand des Mittelfeldes abrücken. Fraglich ist allerdings, warum Pronomina in der Lage sind, die letzte Anforderung scheinbar leichter zu umgehen.
11.2 Zur Stellung der Pronomina: Klitisierung als phonologischer EoO? Pronomina können als einzige Elemente relativ problemlos über Subjekte im linken Mittelfeld hinweg bewegt werden. Was zeichnet diese Elemente aus? In der Literatur werden Pronomina immer wieder wegen ihrer Referenzeigenschaften als besondere Kategorie behandelt. Diese Referenzeigenschaften erscheinen nun allerdings nicht geeignet, als Auslöser EoO-getriebener Bewegungen zu fungieren: Die Referenzeigenschaften von Pronomina sind ja (wie bereits o.a.) in keiner Weise davon abhängig, wo das Pronomen syntaktisch steht. Wenn es sich bei
Weitere Eigenschaften
231
diesem Referenzverhalten also eher um eine lexikalisch-inhärente Eigenart von Pronomina handelt, welcher andere Auslöser könnte Pronomina dann antreiben, sich zwischen die vP in SpecTP und den C-Kopf zu bewegen? Richards schlägt vor, Pronomina nicht nur in syntakto-semantischer Hinsicht als besondere Argumentphrasen einzustufen. Er weist vielmehr auf die besonderen phonologischen Eigenschaften der Pronomina in den skandinavischen Sprachen hin: Diese Pronomina sind phonologisch ‚leicht‘ und klitisieren daher auf PF (2006: 170ff.). Pronomina werden aufgrund ihrer phonologischen ‚Leichtigkeit‘ auch im Deutschen gelegentlich in die Nähe der Klitika gerückt (z.B. von Frey 2004: 12). Zu fragen ist daher: Erlauben Pronomina möglicherweise aufgrund klitischer Prozesse eine Form der Bewegung, die vollen DPen nicht offensteht? Wenn Pronomina in eine Klitisierungsposition verbracht werden müssen, so wäre diese Position für alle anderen DP-Formen uninteressant, da diese aufgrund ihrer phonologischen Eigenschaften nicht klitisieren können. Für die Pronomina hingegen wäre folgende Struktur denkbar: 244. weil [TP [vP (e)s [vP Peter es ihm]] halt [vP es [vP Peter>>es>> ihm ]] gab = weil‘s Peter ihm halt gab Mit der Bewegung in die edge der vP ist in diesem Fall vermutlich kein semantischer Effekt verbunden. Durch die Möglichkeit, Pronomina an C klitisieren zu lassen, stünde aber andererseits vielleicht ein phonologischer Grund für die Bewegung zu Verfügung. Das (zugegebenermaßen tentative) Gesamtbild wäre in diesem Falle: – Pronomina können (wie jede andere Phrase) in die edge von vP attrahiert werden. – Durch die Bewegung der vP gelangen die Pronomina in eine zu C adjazente Position. – Durch die Klitisierung an C könnte die Bewegung der Pronomina phonologisch gerechtfertigt werden. – Damit ähnelt diese Operation (die nur Pronomina betrifft) auf abstrakte Weise dem skandinavischen object shift (vgl. wiederum Vikner 1994, Richards 2004, 2006).
11.3 Weitere Eigenschaften Einige Eigenschaften im Mittelfeld des deutschen Satzes wurden bereits in der Diskussion der Analyse erörtert und sollen hier nur kurz zusammengefasst werden:
232 –
–
–
Zur Erklärung der syntaktischen Verhältnisse im Mittelfeld
Definite DPen können im linken Mittelfeld auftreten: Dazu stehen ihnen EoOkonforme Bewegungen, sowie die Spellout-Lizenzen im Rahmen der Distributed Deletion zur Verfügung. Indefinite DPen können nur dann syntaktisch scramblen, wenn durch die Bewegung ein EoO erreicht werden kann: Ein hoher vP-interner Spellout ist im Regelfall nicht vorgesehen. Auch Elementen, die ohne EoO nicht scramblen sollten, steht aber die Möglichkeit offen, durch die vP-TP-Bewegung ins linke Mittelfeld zu gelangen, wenn die Elemente geeignet sind, als kontrastive Topiks zu fungieren. Kontrastive Topiks können durch die entprechende Spellout-Lizenz in der hohen Kopie der vP auftreten.
Auch die restlichen Eigenschaften können erklärt werden: – Scrambling ist satzgebunden, weil sowohl v wie auch Part und T integrale Bestandteile des Satzes sind. Scrambling ist demnach nicht unbounded (wie etwa Wh-Bewegungen). Im deutschen Mittelfeld können – entgegen der Erwartungen des topologischen Feldermodells – auch infinite Verben auftreten. In der vorliegenden Analyse folgt dies ohne weitere Annahmen, wenn die Verben als kontrastive Topiks ausgeführt werden: 245. a) Öffentliches Lob bekommen wir nicht, weil... [vP der Chef selbst das Produkt /VORstellenV] ja wieder [vP der Chef SELBST das Produkt vorstellen] wird. = Öffentliches Lob bekommen wir nicht, weil das Produkt vorstellen ja wieder der Chef selbst wird. b) Eine neue Kamera nützt manchen Nutzern nichts, weil... [vP jeder die neuen features /NUTzen] ja nicht [vP JEDer die neuen features nutzen] kann. = Eine neue Kamera nützt manchen Nutzern nichts, weil die neuen features nutzen ja nicht jeder kann. Intonatorisch nicht wohlgeformt hingegen ist das folgende Beispiel: 246. *... weil der Chef SELBST das Produkt /VORstellen wird. Auch Partizipien können prinzipiell auf ähnliche Weise ins linke Mittelfeld gelangen:
Weitere Eigenschaften
233
247. weil den Chef zu/RECHtgewiesen ja noch NIE einer hat Finite Verben hingegen müssen die vP verlassen, und können daher nicht in der hohen vP-Kopie ausbuchstabiert werden: 248. weil [der Chef das Produkt vorstellt] ja [der Chef das Produkt vorstellt] vorstellt = weil das Pro/DUKT ja der CHEF vorstellt. Durch die Kopfbewegung von Vfin daher ausgeschlossen also: 249. *weil das Produkt /VORstellt ja der Chef SELBST. Auch Adjektive können (contra Fanselow 2001: 406 und Chocano 2007: 64) nach meiner Einschätzung in gleicher Weise als kontrastive Topiks ins linke Mittelfeld gelangen: 250. Maria und Anna wollen Fotomodelle werden. Aber Anna hat keine Chance – weil klapper/DÜRR ja nur MaRIa ist. Die vorgeschlagene Analyse kann daher meines Erachtens alle für das deutsche Mittelfeld einschlägigen Generalisierungen erklären.
12 Zur Erklärung der semantischen Verhältnisse im Mittelfeld des deutschen Satzes Dezidierte (also zirkulär anmutende) informationsstrukturelle Projektionen sind in der vorgeschlagenen Analyse nicht notwendig und ich halte es daher für sinnvoll, auf diese stipulativen Mittel zu verzichten. Alle vorgeschlagenen Bewegungsoperationen geschehen, wie gesehen, syntaktisch zunächst einmal aus rein formalen Gründen. Ist die Analyse damit eine anti-semantische Analyse? Lassen sich die durch die Bewegungen erzeugten strukturellen Konfigurationen möglicherweise nicht schlüssig semantisch auswerten, um die Bindungs-, Skopus-, und IS-Eigenschaften des deutschen Satzes erklären zu können? Nachfolgend kann natürlich keine detaillierte semantische Analyse aller Wortstellungsmuster des Deutschen präsentiert werden. Es kann aber recht anschaulich gezeigt werden, dass eine semantische Interpretation der hier vorgeschlagenen Strukturoptionen problemlos vorstellbar ist.
12.1 Generizitäteffekte und ihr Verhältnis zu anderen Lesarten Generizitätseffekte entstehen oft dann, wenn eine indefinite DP ins linke Mittelfeld bewegt wird: Die existentielle Lesart der DP tritt zurück, nur eine generische (oder unter Betonung: eine spezifische) Interpretation kann für die umgestellte DP erreicht werden (Diesing 1992). Dieses Phänomen ist empirisch kaum strittig, wurde aber syntakto-semantisch meines Wissens nie wirklich zufriedenstellend erklärt. In jedem Falle wurden die Effekte (soweit ich weiß) nie an eine GenerizitätsP samt zugehörigem SpecGenerizitätsP gekoppelt – die Stipulativität dieses Ansatzes wäre allzu offensichtlich. Ein besser gangbarer Weg scheint darin zu liegen, dass die per Scrambling bewegten Phrasen zwischen bestimmten interpretativ relevanten Domänen umgestellt werden (vgl. Lenerz 2001a, 2001b). Solche Domänen sind nun aber durch SpecHead-Ansätze nicht definierbar – sehr wohl aber unter modernen syntaktischen Annahmen: Es gilt sogar, dass unter der Annahme von Agree-Relationen z.B. alle Kongruenzphänomene innerhalb der Domäne eines merkmalslizensierenden Kopfes gesteuert werden. Könnte eine ähnliche Lösung für die Verfügbarkeit generischer Lesarten formuliert werden? In der vorliegenden Analyse kann dieses Verhalten nicht vollständig geklärt werden, aber zumindest existiert eine interessante Zweiteilung des Satzes, die strukturell genau das nachzeichnet, was semantisch und informationsstrukturell immer wieder vorzufinden ist: Unterscheidungen wie Backgrounddomäne Fokusdomäne, nicht-existentiell - existentiell und ähnliche Zweiteilungen werden
Skopusoptionen und Bindung
235
unter der Annahme einer Modalpartikelprojektion im Mittelfeld des deutschen Satzes nun zumindest durch zwei strukturelle Teile der funktionalen Kaskade syntaktisch gespiegelt: 251. [CP ... CPH [TP [vP]... [PartP ...PartPH [vP] ...]] Die Domäne der Partikel erstreckt sich über die tiefe vP-Kopie (in der sowohl existentielle wie generische Lesarten möglich sind). Die hohe vP-Kopie ist hingegen nicht in der Domäne der Partikel enthalten (sondern nur in der Domäne des C-Kopfes). Die semantische Forschung müsste nun klären, wie die klaren Fälle und die Ausnahmen von Diesings Generalisierung zu beschreiben sind. Darüber hinaus fehlt eine semantische Charakterisierung der Modalpartikel fast völlig (vgl. z.B. Zimmermann 2004). Wenn beides vorläge (aber auch erst dann) könnte sich zeigen, inwieweit die Domäne von Modalpartikeln (die untere vP) eine auch satzsemantisch relevante strukturelle Domäne ist. Die vorliegende Arbeit (zum Einfluss von Syntax und Prosodie auf die Wortstellung des Deutschen) muss hier auf die weitere semantische Forschung bauen und liefert selbst keine semantische Analyse der Modalpartikeln. Zugegeben sei aber: Strukturell aber halte ich die o.a. Zweiteilung des deutschen Satzes für einigermaßen suggestiv.
12.2 Skopusoptionen und Bindung Laut Frey gilt, dass durch Scrambling-Bewegungen Skopuseffekte erzielt werden: „Die Beispiele [...] zeigen, daß man eine Skopusambiguität findet, wenn von der Normalabfolge der Argumente eines gegebenen Verbs abgewichen wird. [...] Dies bedeutet also, daß durch ‚Bewegung‘ die Skopusoptionen einer Phrase erweitert werden können“ (1993: 185). Frey generalisiert die beobachteten Skopusoptionen mithilfe seines Skopusprinzips dergestalt, dass eine quantifizierte Phrase dann Skopus über ein anderes skopussensitives Element nehmen kann, wenn gilt: – Die quantifizierte Phrase c-kommandiert das andere skopussensitive Element oder – die quantifizierte Phrase c-kommandiert eine Spur des anderen skopussensitiven Elements (vgl. Frey 1993: 206). Nun wurden in der vorgeschlagenen Analyse EoO-konforme Bewegungen generell erlaubt, z.B. wenn dem bewegten Element durch die Umstellung ein neuer Skopus zukommt. Durch die copy theory of movement wird auch die dadurch erzielte Skopusambiguität augenfällig: Eine Phrase YP kann Skopus über die
236
Zur Erklärung der semantischen Verhältnisse im Mittelfeld des deutschen Satzes
tiefe Kopie der bewegten Phrase Phrase XP haben (a), gleichzeitig kann eine hohe Kopie von XP jedoch auch über YP Skopus nehmen (b): 252.
[XP ...] ... [ZP [YP ...] [[XP ...] Z]] a) Skopus 1: YP > XP b) Skopus 2: XP > YP
Wenn durch Scrambling-Bewegungen neue Bindungsoptionen ermöglicht werden, so wäre auch hier die Bewegung durch ihren EoO lizensiert. Damit muss gelten: Skopus- und bindungsgetriebene Bewegungen sind völlig problemlos semantisch auswertbar – die vorgeschlagene Analyse weicht an dieser Stelle ja auch kaum von älteren Analysen ab.
12.3 Fehlende Skopoi und unmögliche Bindung Die Bewegung der vP nach SpecTP erfordert, wie gesehen, keine besonderen IS-Konstellationen: Die Bewegung ist formal, obligatorisch und EPP-getrieben. Wie aber lässt sich dies mit der (just im letzten Unterkapitel diskutierten) Generalisierung vereinbaren, dass Scrambling sehr wohl semantische Konsequenzen hat? Ein Blick in die Literatur zeigt, dass Scrambling sogar sehr häufig auch mit dem Ausbleiben zu erwartender semantischer Effekte in Verbindung gebracht wurde: – Anti-crossover-Effekte sind für die Bindungsverhältnisse im deutschen Mittelfeld aufgezeigt worden (Webelhuth 1984: 211f.). Die hier vorgeschlagene Analyse sagt korrekt voraus, dass vP-intern bewegtes Material keine Bindungsrelation zu weiter rechts stehendem Material aufbauen muss. Wenn also die Möglichkeit gegeben ist, eine Phrase in der hohen Kopie der vP in SpecTP auszubuchstabieren, so können Bindungseffekte (z.B. bei Kontrasttopiks) durchaus fehlen: 253. weil... seinei /SCHUHe PETeri vergessen hatte = weil... [vP PeterF seine SchuheKT V] [vP PeterF seine SchuheKT V] vergessen hatte –
Auch invertierte Skopoi sind für das Deutsche nachgewiesen worden (Krifka 1998, Jacobs 1997) – insbesondere wiederum für kontrastive Topiks. Die vorgeschlagene Analyse sagt korrekt voraus, dass die Skopoi durch vP-TP syntaktisch gar nicht erst verändert werden – und daher auch nicht durch die Intonation ‚zurückinvertiert‘ werden müssen:
Fehlende Skopoi und unmögliche Bindung
237
254. weil ein /EINzelner Arzt /ALLen Patienten ja NICHT\ wird helfen können. (¬∀,*∀¬) = ... [TP [vP ein /EINzelner Arzt /ALLen Patienten] ja [NICHT [vP ein einzelner Arzt allen Patienten]]...] In dieser Lesart können die EoO-los bewegten definiten DPen keine neuen Skopoi durch die Umstellung ins linke Mittelfeld erreichen. Die vorgeschlagene Analyse kann daher auch die Fälle semantisch charakterisieren, für die bisher unklar war, warum die Bewegungen ohne semantischen Effekt applizieren. Darüber hinaus wird diese ‚Asemantizität‘ der Bewegung nicht durch dubiose A- oder A‘-Eigenschaften ad hoc stipulierter Zielpositionen erreicht, sondern durch eine strukturelle Konfiguration, die ganz unstrittig erklärt, warum Elemente in ihrer strukturell vermeintlich ‚hohen‘ Position keine Skopoi oder Bindungseffekte hervorrufen: Die Elemente befinden sich innerhalb einer größeren Konstituente und nur diese wurde bewegt. Aus dieser bewegten Konstituente heraus aber können die mitbewegten Elemente nicht binden oder Skopus nehmen: Sie sind zu tief eingebettet um strukturell dazu in der Lage zu sein. Damit behalten die Elemente, die innerhalb der bewegten größeren Konstituente auftreten, ihre Basisskopoi bzw. die Bindungseigenschaften ihrer Basispositionen – die sie, in gewissem Sinne, ja auch nie verlassen haben. Damit liefert die Analyse auch eine Erklärung für die Fälle, die Fanselow als Problem für das Frey‘sche Skopusprinzip anbringt. Behalten nämlich per Scrambling ins linke Mittelfeld umgestellte Objekte ihre Basisreihenfolge, so resultiert nicht unbedingt die von Frey vorhergesagte Skopusambiguität, sondern vordringlich der Skopus der Basisabfolge (Bsp. Fanselow 2001:416): 255. dass fast jedem Kind mindestens ein Buch nur Hans vorlas (∀∃)
Unter der hier vorgeschlagenen Analyse entspricht dieser Skopus exakt derjenigen strukturellen Konfiguration, die die Objekte vP-intern aufweisen wenn sie die vP nicht verlassen: 256. dass [vP nur HansF fast jedem Kind mindestens ein Buch vorlas] [vP nur HansF fast jedem Kind mindestens ein Buch vorlas] vorlas Wie sich zeigt, ist gerade die Abwesenheit semantischer Effekte der vP-Bewegung ihr größter semantischer Trumpf – nämlich immer dann, wenn die erwarteten Skopus- oder Bindungseffekte von Scrambling-Bewegungen tatsächlich empirisch nachweisbar ausbleiben.
13 Schlusswort und Ausblick Ich hoffe gezeigt zu haben, dass die vorgeschlagene Analyse zwei langstehende Probleme der Beschreibung der deutschen Wortstellung auf neue Art und Weise zu lösen verspricht. Zum einen wurde der Einfluss informationsstruktureller Faktoren auf die Wortstellung des Deutschen hinterfragt. Empirisch sind die Arbeiten Lenerz‘ und Höhles natürlich zutreffend: Die vormals als frei beschriebene Wortstellung im Mittelfeld des Deutschen unterliegt, wie diese Arbeiten zeigen, beschreibbaren Restriktionen – ein wichtiges Ergebnis. Durch den Erfolg dieser Arbeiten sind informationsstrukturelle Faktoren daher auch früh in den Mittelpunkt generativer Beschreibungen des Deutschen gelangt. Allerdings wurde mit den Generalisierungen Lenerz‘, Höhles, Diesings usw. tatsächlich ja niemals behauptet, das Deutsche habe eine so rigide Wortstellung wie etwa das Englische. Dennoch wurde dieser Eindruck in der generativen Syntax der letzten dreißig Jahre mehr und mehr erweckt: Fixe Positionen wurden für bestimmte informationsstrukturelle Kategorien angesetzt, um zu versuchen, das Phänomen Scrambling zu erklären. Dieser Ansatz aber schießt über das Ziel, die möglichen Wortfolgen zu bestimmen, weit hinaus: Meiner Intuition (und der meiner Informanden) nach zählen auch in informationsstrukturell präzise kontrollierten Kontexten oft immer noch mehrere Sätze (mit in Grenzen verschiedenen Wortstellungen und in Grenzen verschiedenen Intonationsmustern) als diskursiv kohärente Folgesätze. Die Verengung der syntaktischen Beschreibung auf IS-Kategorien darf also den Blick nicht verstellen auf einen übergeordneten und empirisch unbestreitbaren Fakt: Die deutsche Wortstellung im Mittelfeld ist, wenn nicht alles täuscht, freier als die von Sprachen, die gar kein Scrambling (/kein object shift/ keine Split-CP/...) aufweisen. Einem deterministischen Modell der Wortstellung des Deutschen muss deshalb hier eine Absage erteilt werden: Die Wortstellung des Deutschen mag nicht völlig frei sein – völlig rigide ist sie aber ebenfalls nicht. Zum zweiten wurde, aufgrund der frühen Verengung des Blicks auf IS-Kategorien, eine zweite Gruppe von Faktoren, die die Wortstellung des Deutschen beeinflussen, recht fahrlässig ignoriert – und z.T. auch absichtlich und explizit marginalisiert: Prosodische Eigenschaften sollten in der generativen Kernsyntax keine Rolle spielen – aber sie sind oft wichtige Faktoren für die Wortstellung! Wie gesehen sind etwa intonatorische rises auf bestimmten Elementen oft dazu geeignet, diesen Elementen eine flexiblere Distribution zu ermöglichen, als den gleichen Elementen ohne den rise zukäme. Für die Repräsentation dieser Faktoren in der generativen Syntax stellt sich aber ein ganz grundsätzliches Problem: Phonologische Faktoren sollen, der Maßgabe des look-ahead nach, aus architektonischen Gründen ja eben keinen Einfluss auf Operationen der Syntax nehmen! Die
Schlusswort und Ausblick
239
vorliegende Arbeit schlägt daher eine prinzipielle Möglichkeit vor, phonologische Faktoren in die Gesamtbeschreibung im Rahmen einer generativen Architektur einfließen zu lassen: Wenn sich zeigen lässt, dass die Syntax, aus ihren eigenen, genuin syntaktischen Mechanismen heraus, eine Vielzahl von Kopien bewegter Elemente erzeugt, und wenn darüber hinaus gilt, dass die Auswahl der overt ausbuchstabierten Kopien phonologisch gesteuert werden kann, dann können die phonologischen Einflüsse auf die Wortstellung einer Sprache gewissermaßen ‚subtraktiv‘ erklärt werden: Die PF-Komponente wählt aus dem Angebot syntaktisch möglicher Wortstellungsmuster dasjenige aus, welches auch phonologischen Maßgaben möglichst gut entspricht. Damit sind phonologische Einflüsse auf die Wortstellung erklärbar, ohne dass die Syntax selbst in vorauseilendem Gehorsam handelt. Es ist diese Architektur einer subtraktiven Kompetenzgrammatik, die hier als zentrales Ergebnis vorgelegt werden soll: Ich sehe keinen anderen Weg, prosodisch beeinflusste Wortstellungsmuster ohne look-ahead zu erklären. Nötig ist aber in einem ersten Schritt, eine Bewegung zu definieren, die zwar auf der einen Seite die Vielzahl benötigter Kopien erzeugt, auf der anderen Seite damit aber nicht die Skopustransparenz des Deutschen (zumindest in der Basisabfolge) unerklärlich zu machen. Die Bewegung einer ‚großen‘ Phrase ist, wie gesehen, ein probates Mittel. Ausserdem muss die Bewegung der ‚großen‘ Phrase eine obligatorische Bewegung sein, um nicht selbst wiederum an semantische Effekte geknüpft werden zu müssen. Dass die vP-Bewegung durch das EPP von T erzwungen werden kann, ist dabei ein besonders begrüßenswerter Umstand: Die Bewegung nach SpecTP ist schon immer eine semantisch folgenlose Bewegung gewesen. Durch die Bewegung einer vP im Deutschen wird diese Asemantizität, wie gesehen, rein strukturell (und ohne A/A‘-Stipulation) ausdrückbar. Die obligatorische Bewegung, die aus dem EPP von T resultiert, und die tiefe strukturelle Einbettung der (andernorts potentiell skopus- und bindungsrelevanten) Argumente in der bewegten vP ist damit eine aus meiner Sicht besonders gelungene Kombination. Die semantische Seite der Syntax ist aber nun ebenfalls transparent repräsentiert in diesem Modell: Semantische Effekte können (über das Konzept der EoOs) direkt Einfluss darauf nehmen kann, was die Syntax als Ausgabe derivieren kann und was die PF an Spellout-Anforderungen umsetzen muss. Die weitere Forschung muss erweisen, ob eine solche ‚subtraktive Kooperation‘ der Syntax und der Phonologie den Eigenschaften freier Wortstellungsphänomene auch über die hier beschriebenen Punkte hinaus gerecht wird. Möglicherweise werden sich weitere Komplikationen als nötig erweisen, Änderungen und Erweiterungen sind aus meiner Sicht auch problemlos vorstellbar. Eine Alternative zur hier vorgeschlagenen Architektur sehe ich für die aktuelle generative
240
Schlusswort und Ausblick
core syntax und ihrer Schnittstellen aber nicht: Soll die subtraktive Architektur der Gesamtgrammatik durch neue Annahmen verändert werden, so stellt sich aus meiner Sicht wiederum die Frage der Repräsentation prosodischer Einflüsse auf die Wortstellung. Auf diese Messlatte für zukünftige grammatische Architekturen soll daher an dieser Stelle explizit bestanden werden. Was die Stellung der Informationsstruktur im kernsyntaktischen System des Deutschen angeht, so kann der engen Vorgabe fixer Positionen für Foki, Topiks o.ä im Rahmen der vorgeschlagenen Architektur eine konkurrierende Sichtweise entgegen gestellt werden: Die vorliegende Arbeit hat zu zeigen versucht, dass auch eine relativ indirekte Repräsentanz informationsstruktureller Kategorien zu empirisch korrekten Vorhersagen führen kann: Informationsstrukturelle Eigenschaften sind einschlägig für die Wortstellung des Deutschen genau dann wenn sie prosodische Konsequenzen haben: Fokusexponenten werden möglichst weit rechts ausbuchstabiert, um den intonatorischen fall möglichst spät im Satz umzusetzen. Kontrastive Topiks werden genau dann obligatorisch nach links bewegt, wenn sich nur dadurch eine intonatorische Hutkontur erreichen lässt. Kontrastive Topiks werden dann präferiert nach links umgestellt, wenn einer (auch ohne die Umstellung möglichen) Hutkontur dadurch eine ‚bessere‘ (ausreichend lange) Plateauphase zukommt. Darüber hinaus aber können kontrastive Topiks in allen Feldern des topologischen Feldermodells durchaus auftreten. Informationsstrukturelle Markierungen, die keine intonatorischen Effekte zeitigen (Topiks, Antifoki) nehmen keinen nachweisbaren Einfluss auf die Wortstellung – es sei denn, auch sie sind (indirekt) phonologisch ausgewiesen: Besonders ‚leichte‘ (oft: diskursalte) Phrasen können besonders ‚schweren‘ Elementen (deren Referenten erst wortreich in den Diskurs eingeführt werden müssen) vorangehen. Nicht-fokussierte Argumente können im phonologischen Spellout dann bevorzugt ‚links‘ ausbuchstabiert werden, wenn der Fokus dadurch weiter nach ‚rechts‘ gelangen kann. Die informationsstrukturellen Eigenschaften spielen demnach nur an den Schnittstellen der Syntax, nicht aber in der core syntax selbst, eine Rolle. Es ist natürlich richtig, das ältere kartografische Modell ist auf den ersten Blick einfach und transparent: Kategorien eines bestimmten Typs (etwa ‚das Topik‘) nehmen bestimmte Positionen ein (die ‚SpecTopikP-Position‘), sodass eine überaus einfache Abbildung der Wortstellung auf die Bedeutung und diskursive Einbindung eines Satzes möglich wird. Leider erscheint eine solch einfache und transparente Abbildung einer einzelnen Klasse von Faktoren für das Deutsche aber als offensichtlich zirkulär: Die Frage, warum sich topikale (oder antifokale/ nicht-fokussierte/...) Elemente ins linke Mittelfeld bewegen, wird schlicht dadurch beantwortet, dass hier eine Position für topikale Elemente existiere. Es
Schlusswort und Ausblick
241
ist klar ersichtlich, dass hiermit mit der lediglich stipulierten Annahme von informationsstrukturellen Positionen keine Erklärungen geliefert werden, sondern bestenfalls technische Repräsentationen der empirischen Fakten. Nötig wären für die Annahme fester grammatikalisierter Positionen von informationsstrukturell markierten Elementen unabhängige Begründungen, warum die Positionen im linken Mittelfeld zu liegen haben. Betrachtet man aber die Vielzahl von Optionen, die in den Sprachen der Welt zur Markierung informationsstruktureller Verhältnisse verwendet wird, so wird ersichtlich, warum es unabhängige Begründungen für die Stipulation von TopP-Positionen etc. nicht nur nicht gibt – sondern vielmehr, warum es sie vielleicht gar nicht geben kann. Da eine theoretische Legitimation für Informationsstrukturpositionen fehlt, müssen entsprechende Analysen ihre Legitimation nun also aus ihren empirischen Vorhersagen ziehen. Daher ist der empirische Befund, den die vorliegende Arbeit für die Abfolgen im Mittelfeld vorstellt, für kartografische Annahmen zur angeblich informationsstrukturell gesteuerten Gliederung dieses Mittelfeldes in zweifacher Hinsicht verheerend: Kartografische Annahmen liefern nicht nur ganz prinzipiell keine echte Erklärung von Scrambling-Phänomenen – sie sind darüber hinaus auch empirisch in weiten Teilen ungedeckt: Viele verschiedene Faktoren bestimmen die Wortstellung im Deutschen – und zwar vorrangig syntaktische, semantische und prosodische. Informationsstrukturelle Abfolgezwänge aber existieren für das Mittelfeld des deutschen Satzes keine. Es war vielleicht schon immer a priori unklug, die Möglichkeit ausser Acht zu lassen, dass die deutsche Wortstellung gerade nicht auf den ersten Blick erkennbar transparent und theoretisch einfach zu beschreiben ist: Es kann ja absolut nicht als undenkbar hingestellt werden, dass die Wortstellung einer Sprache von mehr als nur einem einzigen Faktor bestimmt werden könnte! Die in dieser Arbeit vorgeschlagene Analyse ist komplex: Monokausale Erklärungsmuster (wenn Topik, dann Bewegung ins linke Mittelfeld) vermeidet sie nicht nur, sie charakterisiert sie darüber hinaus mit voller Absicht als insgesamt und prinzipiell viel zu simplistisch. Darüber hinaus muss gelten: Alle zu einem Satz verfügbaren Informationen (informationsstruktureller, prosodischer, syntaktischer und semantischer Art) mehr oder minder verbatim (als Merkmale) in der Syntax zu replizieren verschleiert die Unterschiede zwischen den sprachlichen Subsystemen. Ältere Ansätze lassen dabei auch die syntaktische Komponente Eigenschaften repräsentieren, für deren Behandlung sie sich aus meiner Sicht gar nicht eignet (wie z.B. prosodische). Die vorgeschlagene Analyse lehnt eine solche Vermischung von Repräsentationsebenen und sprachlichen Teilsystemen ab. Vielmehr schlägt sie vor, syntakto-semantische, informationsstrukturelle und prosodische Muster modular aufeinander abzubilden. In diesem Vorgang können verschiedene Wortstellungs-
242
Schlusswort und Ausblick
faktoren architektonisch so in Modulen zueinander in Beziehung gesetzt werden, dass im Zusammenspiel der einzelnen Bereiche eine emergente Kompetenzgrammatik entsteht, die eine empirisch vielschichtige Charakterisierung der Menge der möglichen Sätze erlaubt. Wie gesehen ist die Informationsstruktur dabei insofern systematisch (wenngleich nur indirekt) repräsentiert, als dass sie prosodische (lies: PF-) Eigenschaften des Satzes (mit-) beeinflusst. Wie ein Sprecher dieses Wissen über die möglichen Sätze dazu verwendet, in einer konkreten Situation einen bestimmten Satz zu bilden und zu verwenden, ist nicht Gegenstand einer Theorie der Kompetenz des Sprechers. Performative Faktoren gehören nun zwar per definitionem nicht zur Beschreibung einer generativen core syntax im Chomsky‘schen Paradigma. Sie gehören aber zweifelsohne zum Gesamtbild einer Beschreibung der Wortstellung einer Sprache – d.h. insbesondere über den notwendig engen Blickwinkel einer Kompetenzgrammatik hinaus. Wenn performative Eigenschaften in der Lage sind, bestimmte Eigenschaften des Deutschen korrekt zu charakterisieren, so ist aber fraglich, in welchem Umfang diese Eigenschaften auch durch Prinzipien und Regeln der Kerngrammatik repräsentiert sein müssen: Eine Grammatikalisierung in der Kernsyntax ist zwar prinzipiell denkbar – aber empirisch interessant wird sie im Grunde nur dann, wenn damit Aussagen getroffen werden können, die nicht bereits auch aus einer ‚schlankeren‘ Kompetenzgrammatik und performativen Prinzipien folgen. Newmeyer trifft (mit Blick auf typologische, nicht einzelsprachliche Präferenzen) folgendes Urteil: „UG tells us what a possible language is, but not what a probable language is“ (1998: 164, Hervorhebungen im Original, vgl. ähnlich auch Newmeyer 2005). Es ist klar, dass eine Kompetenzgrammatik einer Einzelsprache in paralleler Weise nur definiert, was ein möglicher, nicht aber, was ein wahrscheinlich gebrauchter Satz ist. Die Kompetenzgrammatik ist aber nun auch selbst schon ebenfalls nicht simplistisch zu beschreiben: Die core syntax ist in Teilen lexikalisch, in Teilen syntaktisch und in Teilen semantisch gesteuert. Die Architektur der aktuellen generativen Theorie sieht damit eine vielschichtige Steuerung der Syntax unbedingt vor. Die Abbildung (der Spellout) der Ausgabe einer Derivation auf die phonologische Komponente ist in Teilen lexikalisch, in Teilen syntaktisch und in Teilen genuin phonologisch gesteuert. Die Interpretation einer syntaktischen Struktur in der semantischen Komponente ist in Teilen lexikalisch, in anderen Teilen syntaktisch, in wieder anderen Teilen formal semantisch zu erklären – und darüber hinaus spielen die Wissenssysteme, die Teile des außersprachlichen kognitiven Systems sind, mit hoher Wahrscheinlichkeit die Rolle eines third factors für viele interpretative Zusammenhänge. Das sich abzeichnende Gesamtbild der Wortstellung im Deutschen ist damit nicht mehr einfach und es ist nicht mehr auf den ersten Blick transparent: Es ist vielschichtig und komplex. Eine linguisti-
Schlusswort und Ausblick
243
sche Beschreibung aber, die das Sprachsystem einfacher darstellt als das System ist, ist keine mögliche Beschreibung. Komplexe Beschreibungen in der Linguistik sollten niemanden überraschen: Sie sind die einzig möglichen Beschreibungen des komplexen Systems Sprache.
14 Literatur Abney, Steven P. 1987: The English Noun Phrase in its Sentential Aspects. Dissertation, MIT. Cambridge, MA. Abraham, Werner (Hrsg.) 1982: Satzglieder im Deutschen: Vorschläge zu ihrer syntaktischen, semantischen und pragmatischen Fundierung. Tübingen: Gunter Narr. Abraham, Werner 1988: „Vorbemerkungen zur Modalpartikelsyntax im Deutschen“. In: Linguistische Berichte 118, S. 443-465. Abraham, Werner 1991a: „Discourse particles in German: How does their illocutionary force come about?“ In: Abraham (Hrsg.) 1991b, S. 203-252. Abraham, Werner (Hrsg.) 1991b: Discourse Particles: Descriptive and theoretical investigations on the logical, syntactic and pragmatic properties of discourse particles in German. Amsterdam, Philadelphia: John Benjamins. Abraham, Werner & László Molnárfi 2001: „German clause structure under discourse functional weight: Focus and antifocus“. In: Abraham & Zwart (Hrsg.), S. 1-43. Abraham, Werner & C. Jan-Wouter Zwart (Hrsg.) 2001: Issues in Formal German(ic) Typology. Amsterdam, Philadelphia: John Benjamins. Adger, David 2003: Core Syntax: A Minimalist Approach. Oxford: Oxford University Press. Altmann, Hans 1987: „Zur Problematik der Konstitution von Satzmodi als Formtypen“. In: Jörg Meibauer (Hrsg.): Satzmodus zwischen Grammatik und Pragmatik. Tübingen: Max Niemeyer, S. 22-56. Aoun, Joseph & Yen-hui Audrey Li 2003: Essays on the Representational and Derivational Nature of Grammar: The Diversity of Wh-Constructions. Cambridge/ MA: MIT Press. Baker, Mark C. 1988: Incorporation. A Theory of Grammatical Function Changing. Chicago: University of Chicago Press. Baker, Mark C. 2001: „The Natures of Non-Configurationality“. In: Mark Baltin & Chris Collins (Hrsg.): The handbook of contemporary syntactic theory. Malden/ MA: Blackwell, S. 407-438 Bastert, Ulrike 1985: Modalpartikel und Lexikografie: Eine exemplarische Studie zur Darstellbarkeit von DOCH im einsprachigen Wörterbuch. Tübingen: Max Niemeyer. Baumann, Stefan & Martine Grice 2006: „The Intonation of Accessibility“. In: Journal of Pragmatics 38 (10), S. 1636-1657. Bayer, Josef (in Vorbereitung): From Modal Particle to Interrogative Marker: A Study of German denn. Ms., Universität Konstanz. Bayer, Josef 2008: „Wie erreicht denn die linke Satzperipherie?“ Vortrag, GGS-Konferenz am ZAS (Berlin), 2.-4. Mai 2008. Bayer, Josef & Jaklin Kornfilt 1994: „Against Scrambling as an Instanz of Move-α“. In: Corver & Van Riemsdijk (Hrsg.) 1994, S. 17-60. Bayer, Josef & Hans-Georg Obenauer 2008: „Discourse Particles, Clause Structure, and Question Types“. Vortrag beim Particles Workshop an der University of Cambridge (England), 30.-31. Oktober 2008. Bentzen, Kristine 2009: „Subject positions and their interaction with verb movement“. In: Studia Linguistica 63.3, S. 1-31. Bentzen, Kristine (in Vorbereitung): „V-to-T as vP-to-SpecTP“. Ms., Universität Tromsø. Biberauer, M. Theresa 2003: „Reconsidering the EPP and Spec-TP in Germanic“. In: Cambridge Occasional Papers in Linguistics 1, S. 100-120.
Literatur
245
Biberauer, M. Theresa & Marc Richards 2006: „True optionality: when the grammar doesn‘t mind“. In: Cedric Boeckx (Hrsg.) 2006, S. 35-67. Biberauer, M. Theresa & Michelle Sheehan 2010: „Disharmony, Antisymmetry, and the Finalover-Final Constraint“. Download unter http://research.ncl.ac.uk/linearization/papers.php. Erscheint in Myriam Uribe-Etxebarria & Vidal Valmala (Hrsg.): Ways of Structure Building. Biberauer, M. Theresa, Anders Holmberg & Ian Roberts 2010a: „A syntactic universal and its consequences“. Download unter http://research.ncl.ac.uk/linearization/papers.php. Erscheint in Linguistic Inquiry. Biberauer, M. Theresa, Glenda Newton & Michelle Sheehan 2010b: „Impossible changes and impossible borrowings: the Final-over-Final Constraint“. Download unter http:// research.ncl.ac.uk/linearization/people.php. Erscheint in: Anne Breitbarth, Christopher Lucas, Sheila Watts and David Willis: Continuity and Change in Grammars. Amsterdam, Philadelphia: John Benjamins, S.35-60. Bobaljik, Jonathan 2002: „A-chains at the PF-interface: Copies and ‚covert‘ movement“. In: Natural Language and Linguistic Theory 20.2, S. 197-267. Bobaljik, Jonathan & Susi Wurmbrand 2012: „Word Order and Scope: Transparent Interfaces and the 3/4 Signature“. In: Linguistic Inquiry 43, S. 371-421. Boeckx, Cedric (Hrsg.) 2006: Minimalist essays. Amsterdam, Philadelphia: John Benjamins. Boeckx, Cedric & Kleanthes K. Grohmann 2007: „Putting Phases in Perspective“. In: Syntax 10.2, S. 204-222. Borsley, Robert D. 1997: „Relative Clauses and the Theory of Phrase Structure“. In: Linguistic Inquiry 28 (4), S. 629–647. Borsley, Robert D. 2001: „More on the raising analysis of relative clauses“. Ms., University of Essex, Download unter [http://privatewww.essex.ac.uk/~rborsley/relatives.pdf]. Bošković, Željko & Daiko Takahashi 1998: „Scrambling and Last Resort“. In: Linguistic Inquiry 29 (3), S. 347-366. Breitbarth, Anne & Henk van Riemsdijk (Hrsg.) 2004: Triggers. Berlin: Mouton de Gruyter. Brinkmann, H. 1971. Die deutsche Sprache: Gestalt und Leistung. Düsseldorf: Schwann. Büring, Daniel 1997: The meaning of topic and focus: the 59th Street bridge accent. London: Routledge. Büring, Daniel 2001: „Let‘s phrase it! Focus, Word Order, and Prosodic Phrasing in German Double Object Constructions“. In: Gereon Müller & Wolfgang Sternefeld (Hrsg.) 2001, S. 68-105. Büring, Daniel 2006: „Intonation und Informationsstruktur“. In: Hardarik Blühdorn, Eva Breindl and Ulrich H. Waßner (Hrsg.): Text –- Verstehen: Grammatik und darüber hinaus. Berlin, New York: Walter de Gruyter, S. 144-163. Büring, Daniel 2007: „Intonation, Semantics, and Information Structure“. In: Gillian Ramchand & Charles Reiss (Hrsg.): The Oxford Handbook of Linguistic Interfaces. Oxford: Oxford University Press, S. 445-473. Büring, Daniel & Katharina Hartmann 1997: „Doing the Right Thing“. In: The Linguistic Review 14, No. 1, S. 1–42. Burckhardt, Armin 1994: „Abtönungspartikel im Deutschen: Bedeutung und Genese“. In: Zeitschrift für germanistische Linguistik 22, S. 129-151. Cardinaletti, Anna 2007: „Für eine syntaktische Analyse von Modal-partikeln“. In: Thüne & Ortu 2007 (Hrsg.), S. 89-101. Cardinaletti, Anna 2008: „On the syntactic status of (German and Italian) modal particles“. Vortrag beim Particles Workshop an der University of Cambridge (England), 30.-31. Oktober 2008.
246
Literatur
Carlson, Greg 1977: „Amount Relatives“. In: Language 58, S. 520-542. Carstens, Vicki 2002: „Antisymmetry and word order in serial verb constructions“. In Language 78.1, S. 3-50. Chocano, Gema 2007: Narrow Syntax and Phonological Form. (=Linguistik Aktuell 109). Amsterdam/ PA: John Benjamins. Choi, Hye-Won 1999: Optimizing Structure in Context: Scrambling and Information Structure. Stanford: CSLI Publications. Chomsky, Noam 1965: Aspects of the Theory of Syntax. Cambridge/ MA: MIT Press. Chomsky, Noam 1981: Lectures on Government and Binding. Dordrecht: Foris. Chomsky, Noam 1986: Barriers. Cambridge/ MA: MIT Press. Chomsky, Noam 1995: The Minimalist Program. Cambridge/ MA: MIT Press. Chomsky, Noam 1999: „Derivation by Phase“. In: MIT Occasional Papers in Linguistics 18, S. 1-42. Chomsky, Noam 2000: „Minimalist inquiries: the framework“. In: Roger Martin, David Michaels & Juan Uriagereka (Hrsg.): Step by Step: Essays on Minimalist Syntax in Honor of Howard Lasnik. Cambridge/ MA: MIT Press, S. 89-155. Chomsky, Noam 2004: Beyond Explanatory Adequacy. In: Adriana Belletti (Hrsg.): The Cartography of Syntactic Structure, Volume 3. Oxford: Oxford University Press, S. 104-131. Chomsky, Noam 2005: „Three Factors in Language Design“. In Linguistic Inquiry 36 (1), S. 1-22. Chomsky, Noam 2007: „Approaching UG from Below“. In: Uli Sauerland & Hans-Martin Gärtner (Hrsg.): Interfaces + Recursion = Language? Berlin: de Gruyter, S. 1-29. Chomsky, Noam 2008: „On Phases „. In: Robert Freidin, Carlos P. Otero & Maria Luisa Zubizarreta (Hrsg.): Foundational issues in linguistic theory: essays in honor of Jean-Roger Vergnaud. Cambridge/ MA: MIT Press, S. 133-166. Chomsky, Noam and Howard Lasnik 1993: „The theory of principles and parameters“. In Joachim Jacobs, Arnim von Stechow & Wolfgang Sternefeld (Hrsg.): Syntax: An International Handbook of Contemporary Research, Vol. 1. Berlin: Mouton de Gruyter, S. 506-569. Cinque, Guglielmo 1993: «A null theory of phrase and compound stress». In: Linguistic Inquiry 24 (2), S. 239-298. Cinque, Guglielmo 1999: Adverbs and Functional Heads: A Cross-Linguistic Perspective. Oxford: Oxford University Press. Coniglio, Marco 2006: „German Modal Particles in the Functional Structure of IP“. University of Venice Working Papers in Linguistics 16, S. 57-95. Coniglio, Marco 2007: „German Modal Particles in Root and Embedded Clauses“. In: University of Venice Working Papers in Linguistics 17, S. 109-141. Corver, Norbert & Henk van Riemsdijk (Hrsg.) 1994: Studies on Scrambling: Movement and Non-Movement Approaches to Free Word Order-Phenomena. Berlin: Mouton de Gruyter. de Hoop, Helen 2003: „Scrambling in Dutch: Optionality and Optimality“. In: Karimi (Hrsg.) 2003, S. 201-216. de Vriendt, Sera, Willy Vandeweghe & Piet Van de Craen 1991: „Combinatorial aspects of modal particles in Dutch“. In: Multilingual 10-1/2, S. 43-59. Dewald, Anika 2007: „Antitopikale Strukturen im Deutschen“. Vortrag im Arbeitskreis des Instituts für Allgemeine Sprachwissenschaft, 26. Juni 2007. Dewald, Anika, Ms.: Antitopikale Strukturen im Deutschen. Magisterarbeit, Universität zu Köln 2007. Dewald , Anika 2012: Versetzungsstrukturen im Deutschen : Zu ihrer Syntax, Prosodie und Diskursfunktion. Doktorarbeit, Universität zu Köln. Verfügbar unter http://kups.
ub.uni-koeln.de/5469/
Literatur
247
Diesing, Molly 1990: „Verb movement and the Subject Position in Yiddish“. In: Natural Language and Linguistic Theory 8, S. 41-79. Diesing, Molly 1992: Indefinites. Linguistic Inquiry Monographs 20, MIT, Cambridge/ MA: MIT Press. Diesing, Molly & Eloise Jelinek 1993: The Syntax and Semantics of Object Shift. (= Working Papers in Scandinavian Syntax 51). Lund. Dik, Simon C. JAHR 1978: Functional Grammar. Amsterdam, New York, Oxford: North-Holland Publishing Company. Drach, Erich 1937: Grundgedanken der deutschen Satzlehre. Frankfurt: Diesterweg. Erben, Johannes 1964. Abriß der deutschen Grammatik. Berlin: Akademie Verlag. Erteschik-Shir, Nomi 2007: Information Structure: The Syntax-Discourse Interface. Oxford: Oxford University Press.
Everaert, Martin & Henk van Riemsdijk (Hrsg.): The Blackwell Companion to Syntax, Volume III. Malden/ MA: Blackwell. Fanselow, Gisbert 1991: Minimale Syntax: Untersuchungen zur Sprachfähigkeit. Groningen: Rijksuniversiteit Groningen. Fanselow, Gisbert 2001: „Features, Θ-Roles, and Free Constituent Order“. In: Linguistic Inquiry 32 (3), S. 405-437.
Fanselow, Gisbert 2003: „Free Constituent Order: A Minimalist Interface Account“. In: Werner Abraham & László Molnarfi (Hrsg.): Optionality in Syntax and Discourse Structure – Aspects of Word Order Variation in (West) Germanic and other Languages. Sonderausgabe Folia Linguistica XXXVII/1-2, S. 191-231. Fanselow, Gisbert Ms.: Scrambling as Formal Movement. Ms., Universität Potsdam, Download unter http://www.uni-leipzig.de/~asw/ggs/Handouts/Fanselow.pdf Fanselow, Gisbert 2006: On Pure Syntax (Uncontaminated by Information Structure). In: Patrick Brandt & Eric Fuß (Hrsg.): Form, Structure, and Grammar: A Festschrift to Günther Grewendorf on Occasion of His 60th Birthday. Berlin: Akademie Verlag, S. 137-157. Fanselow, Gisbert & Sascha Felix 1987: Sprachtheorie 2. Tübingen, Basel: A. Francke. Fanselow, Gisbert & Damir Çavar 2002: „Distributed Deletion“. In: Artemis Alexiadou (Hrsg.): Theoretical Approaches to Universals. Amsterdam/ PA: John Benjamins, S. 65-107. Fanselow, Gisbert & Caroline Féry 2008: „Missing Superiority Effects: Long Movement in German (and other languages)“. In: Jacek Witkos & Gisbert Fanselow (Hrsg.): Elements of Slavic and Germanic Grammars: A Comparative View. Frankfurt: Lang, S. 67-87. Féry, Caroline 1993: German Intonational Patterns. Tübingen: Niemeyer. Féry, Caroline 2008: “Information Structural Notions and the Fallacy of Invariant Correlates”. In: Caroline Féry, Gisbert Fanselow and Manfred Krifka (Hrsg.): The notions of information structure. ISIS | Working Papers of the SFB 632 (6), S. 161 -184. Frey, Werner 1993: Syntaktische Bedingungen für die semantische Interpretation. Berlin: Akademieverlag. Frey, Werner 2000: „Über die syntaktische Position der Satztopiks im Deutschen“. In: ZAS Papers in Linguistics 20, S. 137-172. Frey, Werner 2004: „A Medial Topic Position for German“. In: Linguistische Berichte 198, S. 153-190. Frey, Werner & Karen Pittner 1998: „Zur Positionierung der Adverbiale im deutschen Mittelfeld“. Linguistische Berichte 176, S. 489-534. Foley, William A. & Robert D. VanValin 1984: Functional Syntax and Universal Grammar. Cambridge/ UK: Cambridge University Press.
248
Literatur
Fox, Danny & David Pesetsky 2005: „Cyclic Linearization and its Interaction with other Aspects of the Grammar“. In: Theoretical Linguistics 31, S. 235-262. Franck, Dorothea 1980: Grammatik und Konversation. Frankfurt: Scriptor. Gallmann, Peter 1996: „Die Steuerung der Flexion in der DP“. In: Linguistische Berichte 164, S. 283–314. Graefen, Gabriele 2000: „Ein Beitrag zur Partikelanalyse - Beispiel: doch. In: Linguistik Online 6. Download unter:http://www.linguistik-online.com/2_00/graefen.html Greenberg, Joseph 1963: „Some universals of grammar with particular reference to the order of meaningful elements“. In: Joseph Greenberg (Hrsg.): Universals of grammar. Cambridge/ MA: MIT Press, S. 73-113. Grewendorf, Günther 2005: „The discourse configurationality of scrambling.“ In: Sabel & Saito (Hrsg.), S. 75-135. Grewendorf, Günther & Joachim Sabel 1994: „Long scrambling and incorporation“. In: Linguistic Inquiry 25 (2), S. 263-308. Grice, Herbert P. 1975: „Logic and Conversation“. In: Peter Cole and Jerry L. Morgan (Hrsg.): Syntax and Semantics, Vol. 3. New York, San Francisco, London: Academic Press, S. 41-58. Grice, Martine & Stefan Baumann 2002: „Deutsche Intonation und GToBI“. In: Linguistische Berichte 191, S. 267-298. Grohmann, Kleanthes K. 1997: „German Superiority“. In: Groninger Arbeiten zur Germanistischen Linguistik 40, S. 97–107. Grohmann, Kleanthes K. 2003: Prolific Domains: On the Anti-locality of Movement Dependencies. Amsterdam, Philadelphia: John Benjamins. Grohmann, Kleanthes K. 2011: „Anti-Locality: Too-Close Relations in Grammar“. In: Cedric Boeckx (Hrsg.): The Oxford Handbook of Linguistic Minimalism. Oxford: Oxford University Press, S. 260-290. Gunlogson, Christine 2003: True to Form: Rising and Falling Declaratives as Questions in English. New York: Routledge. Haider, Hubert 1990: „Topicalization and other puzzles of German syntax“. In: Günther Grewendorf & Wolfgang Sternefeld (Hrsg.): Scrambling and barriers. Amsterdam, Philadelphia: John Benjamins, S. 93-112. Haider, Hubert 1993: Deutsche Syntax Generativ. Tübingen: Narr. Haider, Hubert & Inger Rosengren 1998: „Scrambling“. In: Sprache & Pragmatik 49, S. 1-104. Haider, Hubert 2006: „Mittelfeld Phenomena (Scrambling in German)“. In: Everaert & van Riemsdijk (Hrsg.), S. 204-274. Hawkins, John A. 1990: „A parsing theory of word order universals“. In: Linguistic Inquiry 21 (2), S. 223-261. Hawkins, John A. 1998: „Some issues in a performance theory of word order“. In: Anna Siewierska (Hrsg.): Constituent Order in the Languages of Europe. Berlin, New York: Mouton de Gruyter, S. 729-780. Helbig, Gerhard & Werner Kötz 1985: Die Partikeln. Leipzig: Verlag Enzyklopädie. Helbig, Gerhard 1988: Lexikon deutscher Partikeln. Leipzig: Verlag Enzyklopädie. Hentschel, Elke 1986: Funktion und Geschichte deutscher Partikeln: Ja, doch, halt und eben. Tübingen: Max Niemeyer. Hinterhölzl, Roland 2004: „Scrambling, Optionality and Non-Lexical Triggers“. In: Breitbarth & van Riemsdijk (Hrsg.), S.173-203. Höhle, Tilman 1982: „Explikation für ‚normale Betonung‘ und ‚normale Wortstellung‘„. In: Werner Abraham (Hrsg.) 1982, S. 75-153.
Literatur
249
Höhle, Tilman 1992: „Über Verum-Fokus im Deutschen“. In: Joachim Jacobs (Hrsg.): Informationsstruktur und Grammatik. Opladen: Westdeutscher Verlag, S. 112-141. Holmberg, Anders 2006: „Remarks on Holmberg‘s Generalization“. In: Robert Freidin & Howard Lasnik (Hrsg.) 2006: Syntax: Critical Concepts in Linguistics. Vol. II. London, New York: Routledge, S.176-217. Holmberg, Anders & Nikanne, Urpo 2002: Expletives, subjects, and topics in Finnish. In Peter Svenonius (Hrsg.): Subjects, expletives, and the EPP. Oxford: Oxford University Press, S. 71-106. Hornstein, Norbert, Jairo Nuñes & Kleanthes K. Grohmann 2005: Understanding Minimalism. Cambridge/ UK: Cambridge University Press. Ikoma, Miki & Angelika Werner 2007: „Prosodie der Modalpartikel schon: Wahrnehmung verschiedener Interpretationen“. In: Thüne & Ortu (Hrsg.), S. 129-139. Jacobs, Joachim 1991: „On the semantics of modal particles“. In: Abraham (Hrsg.) 1991b, S.141-162. Jacobs, Joachim 1996: „Bemerkungen zur I-Topikalisierung“. In: Sprache & Pragmatik 41, S. 1-48. Jacobs, Joachim 1997: „I-Topikalisierung“. In: Linguistische Berichte 168: S. 91- 133. Jacobs, Joachim 2001: „The dimensions of topic-comment“. In: Linguistics 39, S. 641-681. Karimi, Simin 2003 (Hrsg.): Word Order and Scrambling. Malden, MA: Blackwell. Kayne, Richard S. 1994: The Antisymmetry of Syntax. Cambridge/ MA: MIT Press. Koopman, Hilda & Dominique Sportiche 1991: „The position of subjects“. In: Lingua 85, S. 211-258. Kremers, Joost 2009: „Rethinking Linearization“. Vortrag pGGS-Konferenz, Leipzig, 21.5.2009. Krifka, Manfred 1998: „Scope inversion under the Rise-Fall Contour in German“. In: Linguistic Inquiry 29 (1), S. 75-112. Krifka, Manfred 2007: „Basic Notions of Information Structure“. In: Caroline Féry, Gisbert Fanselow & Manfred Krifka (Hrsg.): Interdisciplinary Studies on Information Structure 6, Potsdam: Universitätsverlag, S. 13–55. Lechner, Winfried 1998: „Two Kinds of Reconstruction“. In: Studia Linguistica 52, S.276-310. Lenerz, Jürgen 1977: Zur Abfolge nominaler Satzglieder im Deutschen. Tübingen: Gunter Narr. Lenerz, Jürgen 1992: „Zur Syntax der Pronomina im Deutschen“. In: Inger Rosengren (Hrsg.): Sprache und Pragmatik. Arbeitsberichte des Forschungsprogramms Sprache und Pragmatik, Lund, S. 1-54. Lenerz, Jürgen 1993: „Zur Syntax und Semantik deutscher Personal-pronomina“. In: Marga Reis (Hrsg.): Wortstellung und Informationstruktur. Tübingen: Max Niemeyer, S. 117-153. Lenerz, Jürgen 2001a: „Scrambling and reference in German“. In: Werner Abraham & Jan Wouter Zwart (Hrsg.), S. 179-192. Lenerz, Jürgen 2001b: „Word Order Variation: Competition or Co-Operation?“ In: Müller & Sternefeld (Hrsg.) 2001, S. 249-281. Lenerz, Jürgen 2005: „Why Object Shift still is not Scrambling“. In: Danuta Stanulewicz, Roman Klisz, Wilfried Kürschner & Cäsilia Klaus (Hrsg.): De lingua et litteris: Festschrift Andreae Sroka. Danzig:Wydawnictwo Uniwersytetu Gdanskiego, S. 179-186. Lindner, Katrin 1991: ‚Wir sind ja doch alte Bekannte‘: The use of German ja and doch as modal particles“. In: Abraham 1991b, 163-201. López, Luis 2009: „Ranking the Linear Correspondence Axiom”. In: Linguistic Inquiry 40(2), S. 239-278. Mahajan, Anoop 2003: „Word Order and (Remnant) VP Movement.“ In: Karimi (Hrsg.) 2003, S. 217-237.
250
Literatur
May, Robert 1977. The Grammar of Quantification. PhD thesis, MIT. May, Robert 1985. Logical Form. Cambridge/ MA: MIT Press. Mehlhorn, Grit 2001: Produktion und Perzeption von Hutkonturen im Deutschen. In: Linguistische Arbeitsberichte 77, Universität Leipzig, S. 31-57. Meibauer, Jörg 1994: Modaler Kontrast und konzeptuelle Verschiebung: Studien zur Syntax und Semantik deutscher Modalpartikeln. Tübingen: Max Niemeyer. Meinunger, André 2000: Syntactic Aspects of Topic and Comment. Amsterdam/ PA: John Benjamins. Miyagawa, Shigeru 2003: „A-Movement Scrambling and Options“. In: Karimi (Hrsg.) 2003, S. 177-200. Molnár, Valéria & Inger Rosengren 1996: „Zu Jacobs‘ Explikation der I-Topikalisierung“. In: Sprache & Pragmatik 41, S. 49-88. Molnárfi, László 2002: „Focus and antifocus in modern Afrikaans and West Germanic“. In: Linguistics 40, S. 1107-1160. Molnárfi, László 2004: „On Scrambling as defocusing in German and West Germanic“. In: Breitbarth & van Riemsdijk (Hrsg.), S. 231-386. Müller, Gereon 1999: “Optimality, markedness, and word order in German”. In: Linguistics 37, S. 777-818. Müller, Gereon 2000: Elemente einer optimalitätstheoretischen Syntax. Tübingen: Stauffenburg. Müller, Gereon 2001: „Order Preservation, Parallel Movement, and the Emergence of the Unmarked“. In: Géraldine Legendre et al. (Hrsg.): Optimality-Theoretic Syntax. Cambridge/ MA: MIT Press, S. 279-313. Müller, Gereon 2004: „Verb-Second as vP-First“. In: Journal of Comparative Germanic Linguistics 7: S. 139-274. Müller, Gereon & Wolfgang Sternefeld 1993: „Improper Movement and Unambiguous Binding“. In: Linguistic Inquiry 24 (3), S. 461-507. Müller, Gereon & Wolfgang Sternefeld 1994: „Scrambling as A‘-Movement“. In: Norbert Corver & Henk van Riemsdijk 1994, S. 331-385. Müller, Gereon & Wolfgang Sternefeld (Hrsg.) 2001: Competition in Syntax. Berlin/ New York: Mouton deGruyter. Müller, Sonja 2011: (Un)informativität und Grammatik. Extraktion aus Nebensätzen im Deutschen. Tübingen: Stauffenburg. Musan, Renate 2002: „Informationsstrukturelle Dimensionen im Deutschen“. In: Zeitschrift für Germanistische Linguistik 30, S. 198-221. Neeleman, Ad & Tanya Reinhart 1998: „Scrambling and the PF Interface“. In: Miriam Butt & Wilhelm Geuder (Hrsg.): The Projection of Arguments: Lexical and Compositional Factors. Stanford: CSLI Publications, S.309-353. Newmeyer, Frederick J. 1998: „The Irrelevance of Typology for Grammatical Theory“. In: Syntaxis 1, S. 161-197. Newmeyer, Frederick J. 2005: Possible and probable languages: a generative perspective on linguistic typology. Oxford: Oxford University Press. Oppenrieder, Wilhelm 1989: „Fokus, Fokusprojektion und ihre intonatorische Kennzeichnung“. In: Hans Altmann, Anton Batliner & Wilhelm Oppenrieder (Hrsg.): Zur Intonation von Modus und Fokus im Deutschen. Tübingen: Max Niemeyer, S. 267-280. Ott, Dennis 2009: „Stylistic Fronting as Remnant Movement“. In: Working Papers in Scandinavian Syntax 83, S. 141–178.
Literatur
251
Pasch, Renate, Ursula Brauße, Eva Breindl & Ulrich Hermann Waßner (Hrsg.) 2003: Handbuch deutscher Konnektoren: Linguistische Grundlagen der Beschreib-ung und syntaktische Merkmale der deutschen Satzverknüpfer (Konjunktionen, Satzadverbien und Partikeln). Berlin: Walter de Gruyter. Peters, Jörg 2005: „Intonation“. In: Duden, Band 4: Die Grammatik, 7. Auflage. Mannheim: Duden Verlag, S.95-128. Primus, Beatrice 1994: „Grammatik und Performanz: Faktoren der Wortstellungsvariation im Mittelfeld“. In: Sprache & Pragmatik 32, S. 39-86. Primus, Beatrice 1995: „Word Order and Information Structure: A Performance-based Account of Topic Positions and Focus Positions“. In: Joachim Jacobs (Hrsg.): Syntax: Ein internationales Handbuch zeitgenössischer Forschung (2. Halbband). Berlin, New York: Walter de Gruyter, S. 880-896. Putnam, Michael T. 2007: Scrambling and the Survive Principle. Amsterdam/ PA: John Benjamins. Radford, Andrew 1997: Syntax: A Minimalist Introduction. Cambridge/ UK: Cambridge University Press. Rambow, Owen, Ms.: Pragmatic Aspects of Scrambling and Topicalization in German: A Centering Approach. Unveröffentlichtes Manuskript, University of Pennsylvania, Download unter http://www.cs.columbia.edu/~rambow/papers/german-centering.ps Reiners, Ludwig 1949: Stilkunst: Ein Lehrbuch deutscher Prosa. München: Biederstein Verlag. Reinhart, Tanya 1981: „Pragmatics and Linguistics: An Analysis of Sentence Topics“. In: Philosophica 27, S. 53-93. Reis, Marga 1982: „Zum Subjektbegriff im Deutschen“. In: Werner Abraham (Hrsg.) 1982, S. 171-211. Richards, Marc D. 2004: Object Shift and Scrambling in North and West Germanic: A Case Study in Symmetrical Syntax. Ph.D. thesis, University of Cambridge. Richards, Marc D. 2006: „Weak pronouns, object shift and multiple spell-out“. In: Cedric Boeckx (Hrsg.), S. 160-181. Richards, Marc D. 2007: „Object Shift, Phases, and Transitive Expletive Constructions in Germanic“. In: Pierre Pica (Hrsg.): Linguistic Variation Yearbook 6. Amsterdam, New York: John Benjamins, S.139-159. Richards, Marc D. 2011: „On the transfer of defective phases“. Vortrag am 26.1.2011 im Linguistischen Arbeitskreis des Instituts für deutsche Sprache und Literatur, Universität zu Köln. Rizzi, Luigi 1990: Relativized Minimality. Cambridge/ MA: MIT Press. Rizzi, Luigi 1997: „The Fine Structure of the Left Periphery“. In: Liliane Haegeman (Hrsg.): Elements of Grammar: Handbook in Generative Syntax. Dordrecht: Kluwer, S. 281-337. Rochemont, Michael (1986): Focus in Generative Grammar. Amsterdam/PA: John Benjamins. Rosengren, Inger 1994: „Scrambling – was ist das?“. In: Brigitte Haftka (Hrsg.): Was determiniert Wortstellungsvariation? Opladen: Westdeutscher Verlag, S. 175-196. Ross, John Robert 1967: Constraints in Variables in Syntax. Ph.D. dissertation, MIT. Reproduced by The Linguistics Club of Indiana University. Sabel, Joachim 2005: „String-vacuous scrambling and the Effect on Output Condition“. In: Sabel & Saito (Hrsg.) 2005, S. 281-333. Sabel, Joachim & Mamoru Saito (Hrsg.) 2005: The Free Word Order Phenomenon: Its Syntactic Sources and Diversity. Berlin, New York: Mouton de Gruyter. Sauerland, Uli 2003: „Unpronounced heads in relative clauses“. In: Kerstin Schwabe and Susanne Winkler (Hrsg.): The Interfaces: Deriving and Interpreting Omitted Structures. Amsterdam, Philadelphia: John Benjamins, S. 205–226.
252
Literatur
Schwarzschild, Roger 1999: „GIVENness, AvoidF and Other Constraints on the Placement of Accent“. In: Natural Language Semantics 7, S.141-177. Selkirk, Elisabeth 1984: Phonology and Syntax: The Relation between Sound and Structure. Cambridge/ MA: MIT Press. Sportiche, Dominique 1988: „A theory of Floating Quantifiers and its Corrolaries for Constituent Structure“. In: Linguistic Inquiry 19 (3), S. 425-449. Stommel, Hildegard 2011: Verum-Fokus im Deutschen. Marburg: Tectum Verlag. Strecker, Bruno 2006: „Ich mein ja nur: Exemplarische Untersuchungen zu Syntax und Semantik von Partikeln im Deutschen“. In: Eva Breindl, Lutz Gunkel & Bruno Strecker (Hrsg.): Grammatische Untersuchungen: Analysen und Reflexionen. Tübingen: Gunter Narr, S. 431-448. Struckmeier, Volker 2009: „A system of referential types for attributive structures and other phases“. In: Linguistic Analysis 35, S. 299-329. Struckmeier, Volker 2007: Attribute im Deutschen: Zu ihren Eigenschaften und ihrer Position im grammatischen System. Berlin: Akademie Verlag. Struckmeier, Volker 2008: „On the Distribution of Sentence-typed Particles in German: Particles and their C-like properties“. Vortrag beim Particles Workshop an der University of Cambridge (England), 30.-31. Oktober 2008. Struckmeier, Volker 2010a: „Attributive Constructions, Scrambling in the AP and Referential Types“. In: Lingua 120, S. 673-692. Struckmeier, Volker 2010b: „Effects on Outcome in German Scrambling Movements“, Vortrag, Harvard University, Cambridge/ MA, am 25.10.2010. Struckmeier, Volker 2010c: „Rebellensyntax ohne LF zu fragen: Skandale der deutschen Wortstellung“.Vortrag im LAK, Institut für Deutsche Sprache und Literatur 1, Universität zu Köln, am 15.12.2010. Struckmeier, Volker 2011a: „Integrating syntactic, semantic, and phonological factors for free word order phenomena“. Vortrag, Comparative Germanic Syntax Workshop 26, 2011, Amsterdam, Niederlande. Struckmeier, Volker 2011b: „Zur Architektur der Syntax: Was steuert Scrambling?“ Vortrag am ZAS, Berlin, am 9.6.2011. Struckmeier, Volker 2011c: „Prosodie, Pragmatik, Performanz - die andere Seite von Scrambling“. Vortrag im LAK, Institut für deutsche Sprache und Literatur I, Universität zu Köln, am 2.11.2011. Struckmeier, Volker (im Erscheinen): „Ja doch wohl C? Modal Particles in German as C-related elements“. Erscheint in Linguistic Analysis. Struckmeier, Volker 2012: „A morphologically guided matching approach to German(ic) relative constructions“. In: Peter Ackema; Rhona Alcorn; Caroline Heycock; Dany Jaspers; Jeroen Van Craenenbroeck; Guido Vanden Wyngaerd (Hrsg.): Comparative Germanic Syntax: The state of the art. Amsterdam, Philadelphia: John Benjamins. Sudhoff, Stefan, Anita Steube & Katharina Hogrefe Ms.: Syntaktische Positionen bewegungsbeschränkter I-Topiks im Deutschen. Ms., Universität Leipzig. Download unter http://www. uni-leipzig.de/~intonat/reports/sudSteuHofLAB81.pdf t‘Hart, Johan, René Collier & Antonie Cohen 1990: A perceptual study of intonation: An experimental-phonetic approach to speech melody. Cambridge/ UK, New York: Cambridge University Press. Thurmair, Maria 1989: Modalpartikeln und ihre Kombinationen. Tübingen: Max Niemeyer. Thüne, Eva-Maria & Franca Ortu (Hrsg.) 2007: Gesprochene Sprache - Partikeln. Frankfurt: Peter Lang.
Literatur
253
Uhmann, Susanne 1991: Fokusphonologie. Tübingen: Max Niemeyer. Uhmann, Susanne 1993: “Das Mittelfeld im Gespräch“. In: Marga Reis (Hrsg.): Wortstellung und Informationsstruktur“. Tübingen: Max Niemeyer, S. 313-354. Vallduvi, Enric 1993: The Informational Component. PhD thesis, University of Pennsylvania. van Bergen, Geertje and Peter de Swart 2009: ‚Definiteness and Scrambling in Dutch: Where theory meets practice‘. In: Alisa Schardl, Martin Walkow and Muhammad Abdurrahman (Hrsg.): Proceedings of NELS 38. Amherst/ MA: GLSA Publications, S. 89-100. van Bergen, Geertje & Peter de Swart 2010: „Scrambling in spoken Dutch: Definiteness versus weight as determinants of word order variation“. In: Corpus Linguistics and Linguistic Theory 6(2), S. 267-295. Van Valin, Robert D. 2001: „Functional Linguistics“. In: Mark Aronoff & Janie Rees-Miller: The Handbook of Linguistics. Oxford: Blackwell, S. 319-336. Vater, Heinz 1996: Einführung in die Sprachwissenschaft. (2., verbesserte Auflage). München: Wilhelm Fink Verlag. von der Gabelentz, Georg 1891: Die Sprachwissenschaft und ihre Aufgaben: Methoden und bisherige Ergebnisse. Leipzig: Kein Verlag. Vikner, Sten 1994: „Scandinavian Object Shift and West Germanic Scrambling“. In: Corver & van Riemsdijk (Hrsg.), S. 487-517. Vikner, Sten 2006: „Object Shift“. In: Everaert & van Riemsdijk (Hrsg.), S. 392- 436. Wallenberg, Joel C. 2008: „English Weak Pronouns and Object Shift“. In: Charles B. Chang & Hannah J Haynie (Hrsg.): Proceedings of the 26th West Coast Conference on Formal Linguistics. Somerville/ MA: Cascadilla Proceedings Peoject, S. 489-497. Wasow, Thomas, Ms.: Gradient Data and Gradient Grammars. Manuskript, Stanford University. Webelhuth, Gert 1984: „German is configurational“. In: The Linguistic Review 4, S. 203-246. Wegener, Heide 1998: „Zur Grammatikalisierung von Modalpartikeln“. In: Irmhild Barz & Günter Öhlschläger (Hrsg.): Zwischen Grammatik und Lexikon. Tübingen: Max Niemeyer, S. 37-55. Wexler, Kenneth & Peter Culicover 1980: Formal Principles of Language Acquisition. Cambridge/ MA: MIT Press. Weydt, Harald 1969: Zur Grammatikalisierung von Modalpartikeln. Bad Homburg: Gehlen. Weydt, Harald (Hrsg.) 1977: Aspekte der Modalpartikeln: Studien zur deutschen Abtönung. Tübingen: Max Niemeyer. Weydt, Harald & Elke Henschel 1983: „Kleines Abtönungswörterbuch“. In: Haraldt Weydt (Hrsg.): Partikeln und Interaktion. Tübingen: Max Niemeyer, S. 3-24. Wunderlich, Dieter 1988: „Der Ton macht die Melodie – Zur Phonologie der Intonation des Deutschen“. In: Hans Altmann (Hrsg.) 1988: Intonationsforschungen. Tübingen: Max Niemeyer, S. 1-40. Wurmbrand Susi 2008: „Word Order and Scope in German“. In: Groninger Arbeiten zur Germanistischen Linguistik 46, S. 89-110. Zimmermann, Malte 2004: „Zum Wohl: Diskurspartikeln als Satztypmodifikatoren“. In: Linguistische Berichte 199, S. 253-286. Zubizaretta, Maria Luisa 1998: Prosody, Focus, and Word Order. Cambridge/MA: MIT Press.
15 Register A/A‘ 32–39, 239 aboutness 67, 69, 70–72, 206, 225 AD 198 f., 201, 222 Adverbial 14, 19, 22, 24, 78, 123, 143, 145 f., 170 AF 66, 254 Agree 35, 48, 50, 52, 61, 86, 116, 126, 172, 218, 234 Akzentdomäne 197 ff., 201 f., 216, 223 all-new 70, 176, 185 Anti-crossover 236 Antifokus 59–66, 73, 112, 117, 196, 200, 203, 215 Anti-Locality 126 Antilokalität 127 Basisabfolge 21–25, 41–45, 72, 84 f., 87 f., 99, 102, 105 f,, 119 f., 164, 168, 193, 221 f., 226, 237, 239 Bewegungen 11, 16, 30–39, 41, 44 f., 48, 53 f., 60 f., 67, 72, 74, 79, 82–89, 91–95, 98 f., 106 f., 116, 120 f., 123, 125 f., 144, 146, 152 ff., 156, 159 f., 162 ff., 167, 169 f., 172, 174 ff., 180, 183, 191–197, 199, 203, 216 f., 220 f., 224, 226–230, 232, 234–237 Bewegungsoperationen 15 f., 30 f., 33 f., 36, 39, 42 f., 76, 83, 95, 153, 174, 194 f., 197, 224, 234 Bindung 41, 88 f., 102 f., 196, 221, 235 f. Brückenakzent 55 Centering 68, 205 CG 228 f. C-Kaskade 129, 134, 173 comment 73 f., 117 Common Ground 228 copy theory 153, 194, 235 core syntax 27, 29, 72, 148, 183 f., 187, 240, 242 covert 60, 94 crash 49 crossover 38, 236 Dänisch 144, 163 definit 83, 98, 118, 214, 220
Deletion 94–98, 100, 105, 108, 113, 115, 118 f., 121, 150, 159 ff., 163, 177 f., 187, 191, 193, 196, 200–203, 205 f., 220, 227, 232 Deutschen 11 f., 14–17, 19, 21, 23, 32 f., 37, 39 f., 44 f., 49 f., 54–57, 60 f., 63 ff., 67 ff., 72 ff., 78 f., 81 f., 86, 89 f., 91, 94, 96, 102, 104, 106 ff., 112, 118–123, 125, 127–130, 133 f., 137, 141–145, 147–157, 159–162, 165–173, 175, 180, 184, 186 f., 189 f., 193, 195 ff., 199 f., 204 ff., 211, 213 ff., 217 f., 220, 224, 229, 231, 234 f., 238–242 Diskursneu 57, 112 Distributed Deletion 94, 96 ff., 100, 105, 108, 113, 115, 118 f., 121, 150, 159 ff., 163, 177 f., 187, 191, 193, 196, 200–203, 205 f., 220, 227, 232 D-Linking 81 Early Immediate Constituents 118, 212 EF 48, 82 f., 85–88, 91, 122 effect on outcome 48, 83 EIC 212–215 EM 47 f., 91, 93, 99, 172 Englisch 152, 156 EoO 48, 83 f., 86 f., 91 f., 96, 98 f., 101 ff., 105 ff., 115 ff., 123, 144, 159, 162, 166, 170, 174, 180, 183, 185, 190–193, 195 ff., 199 f., 202 f., 208, 216, 218, 220–227, 230, 232, 235 ff. EoO-konform 86, 91 f., 98 f., 101, 103, 105 f., 115 f., 185, 190 f., 193, 196, 208, 220, 223, 226 f. EPP 48, 51 f., 61, 82 f., 86, 88–91, 96, 107, 119, 122, 148, 151,–154, 157, 180, 183, 185 f., 196, 200, 203, 216, 236, 239 existentiell 79, 234 Extended Projection Principle 34 extension condition 93 external merge 43, 47–52, 147, 188 f., 202, 218 fall 55 f., 58, 101, 114, 189, 209, 216, 220, 240 familiarity 63, 67, 72, 185 Festlandsskandinavisch 157 file card 77, 146, 225 FinalFocus 200, 202 Final-over-final Constraint 152
Register f-markiert 58, 111 FOFC 152 ff., 167, 180 Fokus 15, 23, 57–61, 64, 66, 70 f., 96 ff., 103, 108 ff., 113, 116, 119, 145, 172, 188, 190, 200, 202 ff., 207 ff., 218, 221, 223 f., 230, 240 Fokusexponent 21 ff., 41, 56–59, 63 f., 66, 70 f., 101, 108, 111 ff., 162, 179, 188 ff., 199–202, 204, 220, 223, 240 Fokusflucht 61 Fokusprojektion 21, 59 Frame 77, 143 Freezing 121 f. Gegeben 40, 57 f., 70, 145 f., 165, 186, 208 Gegebenheit 14, 57 ff., 71, 108, 112, 165, 171, 208 f., 221 generisch 79 germanisch 160 Gesamtarchitektur 11, 15, 183 Government and Binding 30 f., 42, 46, 63, 86, 89, 94 f., 99, 157, 194 Hauptbetonung 21, 56, 58, 70, 97, 108 f., 111 ff., 131, 188, 201 f., 209 Head Movement Constraint 125 HMC 125 Hutkontur 55, 113 ff., 189, 209, 216, 220 f., 240 IM 47 f., 63, 69, 71, 78, 80, 91, 99, 172 inclusiveness 50 indefinit 118 Informationsfokus 131, 142, 184, 188 f. Informationsstruktur 16, 46, 55, 75, 81, 184, 186 f., 205, 208, 218, 240, 242 in-situ 23, 70 f., 110, 114, 194, 201 internal merge 36, 43, 48, 52 f., 72, 81–85, 87 f., 116, 122, 125, 189, 202, 218 Intonationsphrase 113, 198 ff. IS- 21, 41, 74, 107, 159, 174, 184 f., 208, 234, 236, 238 Isländisch 157 Italienisch 172 f, Japanisch 15 kartografisch 142, 146 Kernsyntax 11, 49, 98, 116, 171, 183 f., 203, 207, 214, 216 f., 219, 224, 238, 242
255
Klitisierung 30, 231 Kompetenz 29, 30, 214, 242 Kompetenzgrammatik 12, 75, 103, 117, 207 f., 210 f., 214–218, 224, 229, 239, 242 kontrastiv 59, 114 Kontrasttopik 101, 110, 221 Kooperationsmaxime 210 Kopie 45, 36, 53 f., 91–94, 97, 99 ff., 105–108, 112 f,, 117, 119, 122, 125, 151, 153, 166, 169, 187–190, 192, 194 f., 197, 200, 202 f., 206, 219 f., 222 ff., 230, 232 f., 235 f., 239 LCA 147,–151, 158, 219 LF 36, 41, 60, 84, 86, 94, 99, 109, 194 f. linear 16, 107, 118, 120, 124, 147, 149, 201 f., 211, 213 linear correspondence axiom 147 link 73, 81 look-ahead 56, 63, 107 ff., 112, 121, 166, 171, 196 f., 200, 203, 205, 223, 238 f. Markiertheit 42, 177 f., 203 f. Maxime der Modalität 210 merge 36, 43, 47–53, 61, 72, 81–85, 87 f., 116, 122, 125 f., 147, 188 f., 202, 218, 223 merger 126 mismatch 94, 162 Mittelfeld 11, 19 f., 23 ff., 45, 62, 64,–69, 71 f., 74 ff., 78–84, 90 f., 93, 100–103, 106 f., 109–112, 114–117, 119 ff., 124 f., 135, 137, 146, 151, 159, 161 f., 164, 167 f., 170, 172 ff., 183–187, 189 ff., 205 ff., 213, 215, 221, 225–228, 230–238, 240 f. Modalpartikel 19, 64, 92, 110 ff., 132 f., 137, 139 ff., 144 f., 151, 226 f., 235 Nachfeld 62, 149 Negation 101, 103, 106, 115, 163, 179, 190, 209, 223–226 Niederländisch 160 Normalabfolge 23, 119, 176, 235 norwegisch 156 no tampering 120, 164 NSR 199 Oberflächenstruktur 195 object shift 31 ff., 38, 156 f., 163–166, 173, 231, 238 optional 48, 82, 86, 166, 190, 199, 216 f.
256
Register
OT 85, 200 f., 206 out-of-the-blue 70, 185 f. overt 53, 60, 69, 99, 108, 122 f., 127, 129, 197, 223, 239 parasitic gap 33, 37 Partikel 19, 102, 125, 127–141, 144–147, 150, 152 ff., 167, 171–174, 176, 179, 180, 192, 229, 235 performance 29, 30 Performanz 30, 98, 207 f., 210, 214 f. PF 16, 31, 39–42, 47, 50, 52 ff., 63, 66, 93–99, 105, 107 ff., 112 f., 115 ff., 121, 148, 150, 153, 158–162, 166 f., 171, 176, 183, 187 ff., 192–197, 200, 203, 205 ff., 210, 214–217, 219–224, 227, 231, 239, 242 Phase 122, 168 phase impenetrability condition 35, 126, 168 PIC 167 f. Plateau 114 Präferenz 72, 74, 102, 105, 111, 115, 118, 121, 186, 192, 204 f., 207 f., 211, 217, 222, 242 Prosodie 55 f., 58, 66, 72, 197, 199, 203, 235 prosodisches Wort 198 PWd 198 quantifier raising 94, 193 Rechtversetzung 150 Rekonstruktion 36, 99, 191, 193 ff. remnant movement 92, 161 Rhema 57, 60, 205 rise 55, 103, 114, 124, 162, 189, 209, 216, 220, 238 Russisch 15 Satztyp 132, 137–140, 147, 189, 229 Schnittstelle 36, 41, 47, 50, 52 ff., 63, 66, 88, 97 f., 116, 124, 197, 203, 218 f., 224 Schwedisch 164 Scope Transparency 99 Scrambling 11 f., 14 f., 17, 19, 22, 24 f., 29–34, 37–42, 45 f., 54 ff., 60 f., 63–69, 72–79, 81–89, 91, 96–99, 112, 114 f., 117, 119 f., 149 ff., 155 ff., 160–164, 167–173, 175, 179 f., 183, 187, 191 ff., 196 f., 199–205, 207 f., 210, 214 f., 217 ff., 222, 224, 228 ff., 232, 234, 235–238, 241 Semantik 16, 47, 82, 133 ff., 146, 216, 220 skandinavisch 157
Skopus 33, 36, 42, 45, 47, 88 f., 102, 105, 115 f., 144, 162, 190, 193 f., 196, 199, 209, 223 f., 226, 234–237 skopusambig 22, 193 Skopusambiguität 87, 99, 101, 143, 193, 235, 237 Skopusprinzip 45, 99, 193, 196, 237 Sonde 51 Sondenmerkmal 50, 91 SpecHead 34, 61, 96, 151 f., 154, 165, 226, 234 Spellout 60, 63, 94 ff., 106, 108 f., 113–118, 150, 159, 162, 168 f., 183, 188 f., 193, 195 ff., 201, 203, 206 f., 214 ff., 219 f., 222–225, 227, 232, 239 f., 242 split movements 16, 94, 96 Spur 53, 235 Subextraktion 95, 121–124 Superiorität 167–170 Syntax 11 f., 15 f., 19, 29, 32, 34 f., 40 f., 52, 54, 56, 60 f., 63, 72, 76, 89, 94, 97, 101, 106–109, 115 ff., 124, 158 f., 166, 171, 174, 183 f., 186 f., 191 f., 196 f., 200–204, 210, 214–219, 221–224, 235, 238–242 Telizität 80 Tiefenstruktur 195 Tilgung 94, 96 f., 166, 176–179, 201 f., 220 Topik 15, 23, 57, 59 ff., 67, 70, 72 ff., 77 f., 96 ff., 116 f., 159, 172, 179, 185 f., 189–192, 203, 206, 215 f., 220, 240, 241 Topikalität 68 f., 74, 78 trigger 81 f. Ungarisch 215 unmarkiert 21, 44, 46, 119, 177 f. Verumfokus 22, 45, 66 Vorerwähntheit 58, 161 f. Vorfeld 19 f., 23, 62, 81, 92, 112, 122, 124, 131, 133, 156 Wackernagelposition 24, 88, 213 Weak Scrambling 164 Wh-Indefinita 69, 225 ff. Wortstellung 12, 14 ff., 21, 39, 42, 56, 60 f., 72, 74 f., 78, 81, 99, 104, 106 ff., 112, 117, 121, 126, 143, 159 ff., 168 ff., 172–175, 183, 189, 193–197, 199 f., 204 f., 210 f., 214, 216 ff., 226, 235, 238–242