196 113 69MB
German Pages 272 Year 1980
Linguistische Arbeiten
87
Herausgegeben von Herbert E. Brekle, Hans Jürgen Heringer, Christian Rohrer, Heinz Vater und Otmar Werner
Elke Ronneberger-Sibold
SprachVerwendung— Sprachsystem Ökonomie und Wandel
Max Niemeyer Verlag Tübingen 1980
CIP-Kurztitelaufnahme der Deutschen Bibliothek Ronnebeiger-Sibold, Elke: Sprachverwendung, Sprachsystem : Ökonomie u. Wandel / Elke Ronneberger-Sibold. - Tübingen : Niemeyer, 1980. (Linguistische Arbeiten; 87) ISBN 3-484-10379-5
ISBN 3-484-10379-5
ISSN 0344-6727
Max Niemeyer Verlag Tübingen 1980 Alle Rechte vorbehalten. Ohne ausdrückliche Genehmigung des Verlages ist es auch nicht gestattet, dieses Buch oder Teile daraus auf photomechanischem Wege zu vervielfältigen. Printed in Germany. Druck: fotokop Wilhelm weihert KG, Darmstadt.
INHALT
IMJALTSvERZEICHNIS
V
VORWORT ABKÜRZUNGSVERZEICHNIS EINLEITUNG
1
Erstes Kapitel PERPQRMANZ UND DIE ERKLÄRUNG DES SPRACHWANDELS - WISSENSCHAFTSGESaUCHrLICHER ÜBERBLICK, KRITIK, PROBLEMSTELLUNG
4
1.
Die traditionelle Linie
4
2.
Der Strukturalismus bei Trubetzkoy
6
3.
Die Synthese mit der traditionellen Linie - Martinet
8
4.
Das generative Sprachwandel-Modell: Der Anspruch auf explanatorische Adäquatheit einer formalen Theorie
9
5. 5.1. 5.1.1. 5.1.2.
Zur psychischen Realität generativer Postulate Plausibilität Ein Beispiel: Die Regelumstellung Plausibilität versus Simplizität. Die Diskussion um "crazy rules" 5.2. Kompetenz, Performanz und psychische Realität 5.2.1. Der Begriff der 'Kcnmunikativen Kompetenz' 5.2.2. Sprechen, Hören und die 'neutrale Kompetenz' 5.3. Sprache - ein abstrakter Gegenstand 5.4. Antimentalismus im generativen Sprachwandel-Modell bei King 6. 6.1. 6.2. 6.3.
Die Rückkehr zur Performanz Die Rolle der Sprachökonomie für den Sprachwandel Die Rolle des Spracherwerbs Finalismus/Funktionalismus versus Kausalisnus/ftxonalismus in der neueren Literatur
12 12 14 16 19 20 21 29 31 32 33 35 37
VI
Seite 7. 7.1. 7.2. 7.3. 7.4.
Einige offengebliebene Fragen und ihre Antworten Woher kamen die Innovationen? Die Rolle der Performanzbedingungen Beziehungen zwischen (scheinbar) isolierten Sprachveränderungen Der idealisierte 'native speaker'
39 39 39 42 43
8.
Überblick über die folgenden Kapitel
44
Zweites Kapitel ZUM WANDEL DER AUSDRÜCKSVERFAHREN FÜR GRAMMATISCHE KATEGORIEN
1. 1.1.
1.2.2. 1.2.3. 1.2.4. 1.2.5.
Zur Typologie 'Typologie der morphosyntaktischen Ausdrucksverfahren1 1 versus 'Typologie der Sprachen Definition der morphosyntaktischen Ausdrucksverfahren Definition der linguistischen Einheit 'Wort' - Analytische und synthetische Verfahren Das isolierende Verfahren Das agglutinierende Verfahren Das flektierende Verfahren Das kombinierende Verfahren
2. 2.1. 2.1.1. 2.1.2. 2.1.3. 2.1.4. 2.1.5. 2.2. 2.2.1. 2.2.2. 2.3. 2.3.1. 2.3.2. 2.3.3.
Wandel der morphosyntaktischen Verfahren Die Kategorien des Verbs Tempus, Aspekt Modus Verbalgenus Person/Numerus Zusammenfassung Die Kategorien des Nomens Kasus Numerus, Genus, Definitheit Zusammenfassung Wandel von den synthetischen zu den analytischen Verfahren Wandel von den analytischen zu den synthetischen Verfahren Übersicht. Die nicht eingetretenen Veränderungen
1.2. 1.2.1.
45
45 45 47 47 48 52 54 56 64 65 65 72 75 77 79 80 8O 88 99 99 99 1OO
VII Seite
Drittes Kapitel ERKLÄRUNGEN FÜR TYPOLOGISCHEN WANDEL IN DER LITERATUR
103
0.
Vorbemerkungen
103
1. 1.1. 1.2.
Die 'Konpensationstheorie1 Chronologische Unstimmigkeiten Wechsel des Ausdrucksverfahrens ohne MDtivation durch Ambiguitäten ^Cglichkeiten der Kompensation innerhalb des synthetischen Verfahrens
104 105
A. Schleicher Die zyklische Evolutionstheorie
1O7 1O7
1.3. 2. 2.1.
2.2. Kritik 2.2.1. Unvereinbarkeit mit dem Wandel analytisch —> synthetisch in historischer Zeit 2.2.2. Die deterministischen Postulate Schleichers
106 106
108 108 109
3. 3.1. 3.2.
0. Jespersen Sprachwandel als Fortschritt Unvereinbarkeit der Theorie mit Entstehung von Flexion aus isolierten Elementen
110 110
4. 4.1. 4.2.
113 113
4.4.
Die stilistisch-semantischen Erklärungen Die subjektive Ausdruckskraft der neuen analytischen Formen Erklärung der Entstehung, aber nicht der Granmatikalisierung analytischer Formen Zusammenhang von Grammatikal i sierung und Agglutination in analytischen Konstruktionen Erklärung für den Zeitpunkt der Veränderungen
115 116
5. 5.1. 5.2. 5.2.1. 5.2.2. 5.3. 5.4. 5.4.1. 5.4.2. 5.4.3.
H. Frei Freis Satzanalyse: sujet - verbe - predicat Folgen der Umstellung 0-V-S zu S-V-O Subjektproncmen Präpositionen anstelle von Kasusendungen Sprachwandel als Folge von Performanzbedürfnissen bei Frei Kritik Grund für die Veränderung der Konstituentenstellung? Chronologische Unstiitinigkeiten Der logische Status der Präposition
117 117 117 118 118 119 119 120 120 121
4.3.
111
114
VIII
Seite 6. 6.1. 6.2.
Th. Venneroann Das "principle of natural serialization" SXV —>SVX als Reaktion auf Verlust einer eindeutigen S-OMarphologie 6.3. Kritik 6.3.1. Zwei alte Plagen 6.3.2. Verschiedene Grade der Operator-Operand-Beziehung 6.3.3. Die nicht erfaßten Kategorien 6.4. Zusammenfassung. Zur Vorhersagbarkeit von Sprachveränderungen
7.
Zusammenfassung der Folgerungen für eine Theorie des Sprachwandels
122 122 123 124 124 125 129 131
132
Viertes Kapitel ÜBERBLICK ÜBER DIE VOR- UND NACHTEILE DER VERSCHIEDENEN MORPHOSYNTAKTISCHEN VERFAHREN RET DER PERFQRMANZ
1. 1.1. 1.1.1. 1.1.2. 1.1.3. 1.1.4. 1.2. 1.2.1. 1.2.2. 1.2.3. 1.2.4. 1.2.5. 1.2.6. 1.3. 1.4. 1.4.1. 1.4.2.
Sprechen Die Performanzebenen des Sprechers Unterschied zwischen Artikulation und Planung Die semantische Planung Die morphosyntaktische Planung Die phonologische Planung Das flektierende Verfahren Vorteile bei der Artikulation Großes Morphinventar als Folge von Morpherobündelung und Allcmorphik Nachteil des großen Inventars - Belastung des Gedächtnisses Belastung der itorphosyntaktischen Planung durch großes Morphinventar "Suppletivwesen durch Lautwandel": Produktion und Reduktion von Allonorphik als Ökonomie des Sprechers Behandlung von Allonorphik beim Spracherwerb: Die Rolle der Erfahrungsgrößen aus der Performanz Das agglutinierende Verfahren Das explizit isolierende Verfahren Nachteil bei der Artikulation, Vorteil bei der phonologischen Planung Topikalisierung durch Wortstellung
134
134 134 134 135 135 136 137 137 138 140 140 143 150 152 153 153 154
IX
Seite 1.5. Das implizit isolierende Verfahren 1.5.1. Vorteile für Planung und Artikulation: Logik, kleines Inventar, Kürze 1.5.2. Nachteil bei der Töplkalisierung 1.6. Das kombinierende Verfahren 1.6.1. überwiegen der Nachteile bei der Performanz 1.6.2. Vorteil: Leichte Neuschöpfung 2. 2.1. 2.2. 2.3. 2.3.1. 2.3.2. 2.4. 2.4.1. 2.4.2. 2.4.3. 2.4.4. 2.5.
Hören Die Perfonnanzebenen des Hörers Rekodierung als Hauptaufgabe des Hörers Das implizit isolierende Verfahren Vorteil der festen Konstituentenfolge: leichte Rekodierbarkeit, Nachteil: umständliche Topikalisierung Feste Konstituentenfolge als vorteilhaftestes Verfahren für den Hörer zum Ausdruck relationaler Morpheme Die Verfahren zum Ausdruck der nicht-relationalen Morpheme Das explizit isolierende Verfahren Das kombinierende Verfahren Das agglutinierende Verfahren Das flektierende Verfahren Wie nachteilig ist Ambiguität?
158 158 160 162 162 163 166 166 167 168 168 169 171 171 171 172 172 173
Fünftes Kapitel SPRftCHÖKONOMIE UND SPRACHWANDEL
1. 1.0. 1.1. 1.2. 1.3. 1.4. 1.5.
Überblick über die Zusammenhänge zwischen den Performanzbedürfnissen Definition der Relationen 1:1-Zuordnung, kurze Morphketten, kleines Inventar und Eindeutigkeit der Morphe Eindeutigkeit der Morphe, Eindeutigkeit der größeren Konstituenten, feste Konstituentenfolge, kurze Morphemketten, kurze Morphketten Kleines Morphinventar, kurze Morphe, kleines Phoneminventar, kleines Merkmalinventar, niedrige Phonemkomplexität Eindeutigkeit der Phone, leicht artikulierbare Phonemfolgen, kurze Morphe, kleines Phoneminventar, Eindeutigkeit der Morphe, 1:1-Zuordnung 1:1-Zuordnung zwischen Morphemen und Morphen, wenig Rekodierung, leicht artikulierbare Phonemfolgen
177
177 177 18O 183 186 192 198
Seite 1.6. 1.7. 2. 2.1. 2.2. 2.3. 2.4. 2.4.1. 2.4.2. 2.4.3. 2.4.4. 2.4.5. 2.4.6. 2.5.
Feste Kcnstituentenfolge, Implizit isolierendes Verfahren, kurze Morphemketten, kurze Morphketten Gesamtdarstellung der Zusammenhänge. Die Sonderstellung des Bedürfnisses nach Eindeutigkeit Analogie, Systemdeterminismus und die Vorhersagbarkeit von Sprachwandel Performanzbedürfnisse als Spezialfälle des Bedürfnisses nach analogem Handeln Analogie als 'Metabedürfnis1 Das Bedürfnis nach Analogie als Quelle der Regelmäßigkeit von Sprachwandel und Sprachsystemen und Grundlage systemdeterministischer Theorien Grenzen der Erklärungs- und Vorhersagekraft von Analogie Entgegengesetzte Bedürfnisse Die Anfangsneuerung Wann wird eine Neuerung zum Vorbild für Analogie? Alinlichkeitsbedingungen für analoge Veränderungen Auswahl zwischen gleichwertigen Vorbildern Ähnlichkeitsbedingungen für die Formen, die von Analogie erfaßt werden Drei Stufen der Vorhersagbarkeit von Sprachveränderungen
3. 3.1. 3.2. 3.2.1. 3.2.2.
Konklusion: Sprachökonomie als Ursache von Sprachwandel Es gibt kein absolutes Optimum Drei Wege der relativen Optimierung Die partikulare Optimierung Die optimale Realisierung eines bestimmten Belastungsverhältnisses in Abhängigkeit von relativen Häufigkeiten 3.2.3. Optimierung des Belastungsverhältnisses in Abhängigkeit von der außersprachlichen historischen Situation. Der Einfluß von Sprachmischung 3.3. Definition der Sprachökonomie. Einige Mißverständnisse 3.4. Sprachökonomie als umfassendes Erklärungsprinzip für Sprachwandel
200 204 2O7 207 208 209 211 211 211 212 213 218 219 224 227 227 228 229 229 231 236 243
LITERATUR
246
ABSTRACT
257
XI
VORWORT
Die vorliegende Arbeit stellt eine geringfügig veränderte Fassung meiner Dissertation dar, die von 1974 bis 1977 in Tübingen und München entstand und im Wintersemester 1977/78 vom Fachbereich Neuphilologie der Universität Tübingen angenommen wurde. Die seit 1977 erschienene einschlägige Literatur konnte ich bei der Überarbeitung nur in engster Auswahl berücksichtigen. Die Anregung zu dieser Dissertation sowie viele der darin enthaltenen Gedankengänge stammen von Herrn Professor 0. Werner aus Freiburg, dem ich an dieser Stelle herzlich für seine ausführliche Betreuung der Arbeit danken möchte. Soweit seine Überlegungen zur Sprachökonomie bereits in seinen Werken veröffentlicht sind, habe ich die entsprechenden Stellen zitiert. Da er jedoch selbst gleichzeitig mit mir über diesen Problemkreis weitergearbeitet hat, sind wir gelegentlich unabhängig voneinander zu den gleichen Ergebnissen gekommen. Daher werden sich teilweise Überschneidungen zwischen einigen seiner künftigen Veröffentlichungen und der vorliegenden Arbeit ergeben, wie sie sich bei der Ähnlichkeit der Arbeitsgebiete nicht vermeiden lassen. Danken möchte ich ferner Herrn Professor W. Herrlitz aus Köln für seinen Rat bei der Planung der Arbeit, Herrn Christoph Koch aus München für seine kritische Sichtung und Korrektur der Beispiele aus dem Pussischen und den vielen Mitgliedern der Seminare für deutsche und romanische Philologie und allgemeine Sprachwissenschaft in Tübingen und München, von deren Lehre und persönlicher Diskussion ich profitiert habe. Frau M. R. Mead aus Nürnberg danke ich für die schnelle, präzise und mit großem persönlichem Einsatz geleistete Reinschrift. Die Studienstiftung des deutschen Volkes gewährte mir für die Zeit der Arbeit eine großzügige finanzielle Förderung. Auch ihr möchte ich an dieser Stelle danken.
ΧΕΙ
Mein Mann hat durch sein inner waches Interesse, manche wissenschaftstheoretische Diskussion, daneben auch sehr konkrete Hilfe beim Korrekturlesen, vor allem aber durch seine nie erm dende Geduld und Aufmunterung sehr viel zum Entstehen und Vollenden dieser Arbeit beigetragen. Ihm sei sie deshalb in herzlicher Dankbarkeit zugeeignet.
Elke Ronneberger-Sibold
XIII ABKÜRZUNGSVERZEICHNIS
Abi. Adj. afrz. ahd. Akk. aksl. Akt. Art. Attr. Dat. def. dir.
Ablativ Adjektiv altfranzösisch althochdeutsch Akkusativ altkirchenslawisch Aktiv Artikel Attribut Dativ definit direkt
dt.
deutsch
engl. Fern. frz. Fut. Gen. germ. got. idg. Imperf. Ind. indir. Inf. Inst. it. Käs. Konj. lat.
englisch Feminin französisch Futur Genitiv germanisch gotisch indogermanisch Imperfekt(iv) Indikativ indirekt Infinitiv Instrumental italienisch Kasus Konjunktiv lateinisch
XIV
Lok. Mask. mhd. Mod. Neutr. nfrz. nhd. Non.
Lokativ Maskulin mittelhochdeutsch Modus Neutrum neufranzösisch neuhochdeutsch Noninativ
NP
Ncminalphrase
Num. Obj. Part. Pass. Perf. Pers. Pl. Präp. Präs. Prät. Pron. rcm. russ. Sg. sp. sth. stl. Subj.
Numerus Objekt Partizip Passiv Perfekt(iv) Person Plural Präposition Präsens Präteritum Pronomen romanisch russisch Singular spanisch stimmhaft stimmlos Subjekt
Temp.
Tempus
UL
ttnlaut Verb
V
EINLEITUNG
Gegen die Erklärung des Sprachwandels durch Sprachökoncmie werden häufig zwei Einwände vorgebracht: Die einen lehnen sie ab, weil sie nicht erlaubt, Sprachveränderungen vorherzusagen und folglich gar keine Erklärung darstelle, die anderen gestehen ihr zwar Erklärungskraft zu, da sie dabei aber nur einige allzu offensichtliche Fälle sprachökononischer Veränderung im Auge haben, halten sie die Erklärung von Sprachwandel durch Sprachökoncmie insgesamt für trivial. Beiden Einwänden versuche ich in dieser Arbeit zu begegnen. Dem ersten Einwand, eine Erklärung müsse Voraussagen erlauben, wäre entgegenzuhalten, daß er auf einem naturwissenschaftlich-deterministischen Verständnis von 'Erklärung' beruht, das den Humanwissenschaften nicht angemessen ist. Wie eine Theorie, die eine deterministische Erklärung des Sprachwandels anstrebt, in die Irre gehen kann, versuche ich im ersten Kapitel am Beispiel des generativen Sprachwandelmodells zu zeigen. Diese Erklärung erreicht ihre Vorhersagekraft nur durch explizites Ausschalten all der am Sprachwandel beteiligten Faktoren, die sich nicht in einem deterministischen Modell erfassen lassen, nämlich aller Faktoren des Sprachgebrauchs. Damit ist aber gerade die eigentlich treibende Kraft des Sprachwandels ausgeschlossen, denn die Sprachbenutzer ändern ihre Sprache ja, um sie möglichst wirksam gebrauchen, d.h. die gewünschte Wirkung auf den Hörer durch Sprache möglichst leicht erreichen zu können. Im generativen Sprachwandelmodell dagegen erscheint Sprachwandel als Optimierung eines von allem Gebrauch losgelösten Sprachsystems nach bestürmten Einfachheitskriterien der Beschreibung, für die eine völlig unerwiesene psychische Real itat in Form angeborener Universalien postuliert wird. Auf diese Weise läßt sich zwar ziemlich gut vorhersagen, welche Veränderungen eintreten werden, aber nicht erklären, wozu diese Veränderungen dienen, welche Vorteile sie für den Sprachgebrauch bringen. D.h. die finale Fragestellung ist zugunsten einer kausalen aufgegeben worden, die zudem auf äußerst ungesicherten und oft auch sehr unplausiblen Prämissen beruht.
So ist es nicht verwunderlich, daß es viele Veränderungen gibt, die durch das generative Sprachwandel-Modell nicht erklärbar sind oder sogar seinen Vorhersagen zuwiderlaufen. Nehmen wir nun die finale Fragestellung wirklich ernst, so begegnen wir damit automatisch dem zweiten Einwand, die Erklärung durch Sprachökonomie sei trivial. Freilich muß sie so erscheinen, wenn man nur an solche Fälle denkt wie die Ersetzung von Omnibus durch das kürzere Bus. Aber solche Kürzungen machen nur einen kleinen Teil aller möglichen sprachökoncmischen Veränderungen aus. Der Sprecher will ja z.B. nicht nur kurze, sondern auch leicht artikulierbare Äußerungen hervorbringen. Ferner muß er seine Äußerungen nicht nur artikulieren, sondern auch planen; innerhalb der Planung aber gibt es wieder verschiedene, einander widerstrebende Bedürfnisse. Schließlich muß er ein Inventar von Einheiten erwerben und aufrechterhalten, das natürlich möglichst klein sein soll. Dieses Interesse deckt sich mit einigen Bedürfnissen der Planung und Artikulation, anderen widerstrebt es. Der Hörer schließlich hat das Bedürfnis nach möglichst eindeutigen sprachlichen Einheiten, aber auch bei ihm widersprechen dem oft die Bedürfnisse nach einem kleinen Inventar oder nach Kürze der zu dekodierenden Äußerungen. Das ganze 'Kräftefeld1 aus diesen und noch einigen weiteren Bedürfnissen, ihrem Zusammenwirken und Ihren Widersprüchen muß man berücksichtigen, um zu entscheiden, wie ökonomisch eine bestimmte Ausdrucksweise ist, d.h. wieviel physisch-psychischen Gesamtaufwand sie von Sprecher und Hörer zur Verwirklichung ihres Kcnntunikationsziels erfordert. Es läßt sich leicht einsehen, daß viele unter diesem Gesichtspunkt gleichwertige Ausdrucksweisen für den gleichen Inhalt möglich sind, wenn man sie unabhängig von der historischen Situation betrachtet. Darunter sind auch solche, die recht unökonomisch wirken, wenn, wie es leider oft geschieht, Ökonomie einfach mit Kürze gleichgesetzt wird. Dies zeige ich im zweiten Kapitel anhand von vier Typen morphosyntaktischer Ausdrucksverfahren für grammatische Kategorien in einigen indogermanischen Sprachen. Bei allen Typen halten sich die Vor- und Nachteile für den Sprachgebrauch ungefähr die Waage, obwohl die Gesamtbelastung unterschiedlich auf die verschiedenen Bedürfnisse der Sprachbenutzer verteilt ist.
Das dritte Kapitel gibt dann einen (auch graphisch dargestellten) Überblick über die im zweiten Kapitel herausgearbeiteten und einige weitere Performanzbedürfnisse und ihre gegenseitigen Abhängigkeiten. ökonomisch handeln heißt nun für die Sprachbenutzer, eine solche Ausdrucksweise zu wählen, bzw. zu schaffen, die unter den gegebenen sprachinternen und -externen Umständen möglichst wenig Gesamtaufwand zur Verwirklichung ihrer Katiminikationsabsicht rfordert. Die Einbeziehung auch der äußeren historischen Fakten ist für eine vollständige Erklärung notwendig, auch wenn diese dadurch schwieriger wird, weil durch die ständig sich wandelnden Ansprüche der Außenwelt an die Sprachbenutzer die Sprachentwicklung immer wieder neue Anstöße enthält. Verschiedene Ausdrucksweisen, die, absolut betrachtet, gleich viel Gesamtaufwand erfordern, können nämlich durchaus verschieden zu bewerten sein, wenn man sie in einem bestiitinten historischen Kontext sieht. Zwei äußere Faktoren, die besonders spürbaren Einfluß auf die Sprachentwicklung nehmen, sind Sprachmischung und Veränderung der relativen Häufigkeiten, mit denen über bestürmte Dinge und Sachverhalte der Welt gesprochen wird. Bei der engen Verflechtung aller Performanzbedürfnisse untereinander ist es klar, daß solche Veränderungen infolge äußerer Einflüsse oft weitreichende Folgen in der Sprachgeschichte haben. Schließlich wird in geringerem Umfang die Sprachgeschichte auch 'in Bewegung gehalten1 durch Veränderungen, die, insgesamt betrachtet, gerade nicht ökonomisch sind, weil sie ein Performanzbedürfnis zu stark auf Kosten der entgegengesetzten Bedürfnisse bevorzugen. Auf solche Veränderungen wird, wenn der Gegendruck zu stark wird, eine Reaktion erfolgen, die leicht in umgekehrter Richtung wieder 'über ihr Ziel hinausschießen' kann, und so fort. So gesehen leistet Sprachökononie also durchaus keinen 'trivialen' Beitrag zur Erklärung des Sprachwandels, sondern erweist sich als ein sehr weitreichendes Prinzip, dessen Auswirkungen oft nicht leicht als solche zu erkennen, aber eben darum häufiger vorhanden sind, als man oft angenommen hat. Wir können auf dieses Prinzip nicht verzichten, wenn wir tatsächlich erklären wollen, warum unsere natürlichen Sprachen so geworden sind, wie sie sind.
Erstes Kapitel PERFORMANZ UND DIE ERKLÄRUNG DES SPRACHWANDELS - WISSENSCHAFTSGESCHICHTLICHER ÜBERBLICK, KRITIK, PROBLEMSTELLUNG
"Die eigentliche Ursache für die Veränderung des Usus ist nichts anderes als die gewöhnliche Sprechtätigkeit." (Paul 188O; 1968: 32)
Zu der Zeit, als Paul diesen Satz schrieb, hätte man mit einer Arbeit, die die Bedeutung der Performanz, der "Sprechtätigkeit", für die Erklärung des Sprachwandels unterstreicht, offene Türen eingerannt bzw. einen Beitrag zur Bestätigung der 'herrschenden Lehre* geliefert. Diese Situation änderte sich mit dem Aufkommen des frühen Strukturalismus und erst recht der generativen Sprachwandeltheorie. Erst in jünster Zeit mehren sich wieder die Stimmen, die auf die Bedeutung der Performanz für den Sprachwandel zurückkommen (s. dazu S. 37 ff. über Anderson; Jones 1974 und Dahlstedt 1975). Wenn wir nun diese Entwicklung kurz nachvollziehen wollen, müssen wir uns natürlich auf die allerwichtigsten Tendenzen und deren Vertreter beschränken und vieles stark vereinfacht darstellen. Trotzdem hoffen wir, daß klar wird, warum es heute sinnvoll und gewissermaßen notwendig ist, auf alte Positionen zurückzukommen, und inwiefern die inzwischen geleistete Forschung unsere Ausgangsbasis verbessert hat, indem sie eine genauere, umfassendere und explizitere Darstellung der Zusammenhänge erlaubt. 1. Die traditionelle Linie Pauls Zitat mag hier stellvertretend für eine Forschungslinie in der historischen Linguistik stehen, die wir 'die traditionelle' nennen wollen und die von den Begründern der Sprachwissenschaft im 19. Jahrhundert über Paul, Jespersen, Bally, Meillet, Jakobson, Martinet, Coseriu, Andersen, um nur einige hervorstechende Namen zu nennen, bis in die unmittelbare Gegenwart reicht. So sehr sich die genannten Gelehrten und ihre Schulen auch unterscheiden mögen, so ist ihnen allen doch gemeinsam, daß sie den Ursprung des Sprachwandels in der Performanz sehen, geleitet von der Grundidee, die wir auch bereits bei Paul lesen:
"Die größere oder geringere Zweckmäßigkeit der entstandenen Gebilde ist bestimmend für Erhaltung oder Untergang derselben." (Paul 1880; 1968: 32)
"Zweckmäßigkeit" bedeutet zweierlei: Erstens müssen die sprachlichen Aasdrucksmittel dem Sprecher erlauben, seine Ausdrucksabsicht so zu verwirklichen, daß der Hörer sie versteht (und entsprechend reagiert), d.h. die beabsichtigte Wirkung auf den Hörer auszuüben. Zweitens sollen Sprecher und Hörer bei der Kommunikation möglichst wenig psychische und physische Kraft aufwenden müssen. Gewöhnlich wird dabei nur auf die Trägheit des Sprechers hingewiesen, da die Haltung des Hörers als ganz passiv angesehen wird; unseres Erachtens muß aber auch eine Trägheit des Hörers berücksichtigt werden, da Hören ebenso wie Sprechen eine Tätigkeit ist, die durch die jeweils verwendeten sprachlichen Mittel mehr oder weniger bequem gestaltet werden kann. Wir werden auf diesen Punkt ausführlicher im Kapitel über sprachliche Ökonomie (S. 206) zurückkommen.
Die beiden genannten Aspekte der Zweckmäßigkeit sprachlicher Ausdrucksmittel sind in fast allen Werken der traditionellen Linie implizit oder explizit enthalten, jedoch unterschiedlich gewichtet: Die einen, z.B. Bally, Msillet, Coseriu, sehen den Ursprung des Sprachwandels mehr im Ausdrucksbedürfnis, die ändern mehr in der Trägheit des Sprechers, z.B. Jespersen und vor allem Zipf, dessen z.T. wertvolle theoretische Vorüberlegungen leider mit seinen oft unakzeptablen Erklärungen linguistischer Einzelphänomene zu sehr in Vergessenheit und Verruf geraten sind. Im Gleichgewicht erscheinen die beiden Aspekte schließlich in der Formulierung Martinets: "Die sprachliche Entwicklung läßt sich ansehen als gelenkt durch die ständige Antinomie zwischen den Kommunikationsbedürfnissen des Menschen und seiner Tendenz, seine geistige und körperliche Tätigkeit auf ein Minimum zu beschränken, ... In jedem Stadium der Entwicklung kommt es zu einem Gleichgewicht zwischen den Mitteilungsbedürfnissen, ( . . . ) , und der menschlichen Trägheit." (Martinet I960; 19G3: 1 G 4 )
Ob und inwieweit es sich hier tatsächlich um zwei 'gleich gewichtige" Tendenzen handelt, oder ob sie nicht in Wirklichkeit einen unterschiedlichen Status haben, wollen wir ebenfalls im Kapitel über sprachliche Ökonomie (S. 240 f f . ) zu klären versuchen. Die Rolle des Spracherwerbs für den Sprachwandel, die im generativen · Sprachwandel-MDdell so hervorgehoben wird, wird in der traditionellen Linie zwar gewöhnlich anerkannt und erwähnt (King (1969: 78) z.B. beruft sich hier sogar ausdrücklich auf Paul), jedoch wird kein qualitativer Unterschied gemacht zwischen Neuerungen im Kindes- und im Envachsenenalter.
2. Der Strukturalismus bei Trubetzkoy Ein ganz neuer Erklärungstyp entsteht Ende der zwanziger Jahre im Prager Strukturalismus: "Oft geben die phonologischen Strukturgesetze Aufschluß über die Ursachen gewisser Lautveränderungen: viele Lautveränderungen sind nämlich durch das Bedürfnis (Hervorhebung d.A.) nach Errichtung eines lebensfähigen (d.h. den Strukturgesetzen entsprechenden) Lautsystems hervorgerufen, ( . . . ) Die Lautgeschichte bekommt Sinn, wird zu einer zweckmäßigen (Hervorhebung d.A.) Umgliederung eines Systems benützt." (Trubetzkoy 1929: 64 f.)
Es fällt auf, daß Trubetzkoy hier zwei der Schlüsselwörter verwendet, die auch in der traditionellen Linie eine große Rolle spielen: 'Bedürfnis1 und 'Zweckmäßigkeit'. Was sich geändert hat, ist jedoch der Gegenstand, auf den sie sich beziehen, dasjenige, wonach ein Bedürfnis besteht, bzw. wozu sich Veränderungen vollziehen. Was in der traditionellen Linie die ungestörte und möglichst wenig Kraftaufwand erfordernde Kotmunikation war, ist hier ein "lebensfähiges (d.h. den Strukturgesetzen entsprechendes) Lautsystem" (Hervorhebung d.A.). Nicht genannt wird jedoch der Träger des Bedürfnisses nach "lebensfähigen Systemen". Wer möchte denn ein solches System haben? Wenn es die Sprachbenutzer selbst sein sollen, so würde das bedeuten, daß ihr Sprachsystem und die allgemeinen Strukturgesetze, nach denen es aufgebaut ist, für sie psychische Realität haben, überspitzt ausgedrückt: Wir müßten unser Vokaldreieck im Kopf haben und dauernd ängstlich darauf bedacht sein, daß es seine dreieckige Form auch behält. Eine andere mögliche Antwort auf die Frage nach dem Träger des Bedürfnisses nach lebensfähigen Systemen wäre: 'die Sprache selbst'. Das würde aber die Loslösung eines selbständigen Wesens 'Sprache' vom Menschen bedeuten, der sie spricht, versteht und nicht zuletzt lernend immer wieder neu schafft. Wir spüren hier die Nähe der romantischen Vorstellung von Sprachen als natürlichen Organismen, die in der aus dem organischen Bereich gegriffenen Metapher "lebensfähig" zum Ausdruck kommt. So bemerkt auch Coseriu (1958; 1974: 198): "Im Grunde ist sie (die Vorstellung, daß die Sprache die 'Ursachen 1 des Wandels in sich selber trüge) trotz der erneuerten Terminologie nur eine neue Darstellungsweise der alten Auffassung der Sprachen als natürlicher Organismen."
Vor beiden Vorstellungen, der der psychischen Realität linguistischer Systeme und der der autonomen Sprache, schreckt Trubetzkoy natürlich zurück: Die kritische Frage nach dem Träger des Bedürfnisses nach "Errich-
tung eines lebensfähigen Systems" und damit nach dem Urheber der Sprachveränderungen bleibt offen. Was Trubetzkoy an dieser Stelle nicht erkannt oder zumindest nicht klar gesagt hat, ist, daß die von ihm aufgestellten Sprachsysteme Formen der Sprachbeschreibung durch den Linguisten sind«, Wenn man eine solche Sprachbeschreibung geschickt anfängt, was die Strukturalisten ganz zweifellos getan haben, so wird sie oft geradezu verblüffende innere Regelmäßigkeiten aufweisen. Vergleicht man mehrere solche Beschreibungen von Einzelsprachen, so werden diese Regelmäßigkeiten des Aufbaus sich zu vielleicht noch erstaunlicheren allgemeinen Strukturgesetzen zusammenfassen lassen. Es ist, wissenschaftlich betrachtet, nicht verwunderlich, daß die frühen Strukturalisten diese Entdeckung für beides, Beschreibung und Erklärung zugleich, hielten und damit eigentlich auf die alte Frage: 'Warum verändern sich Sprachen?1 die (von uns etwas böswillig formulierte) Antwort gaben: 'Damit die Linguisten sie mit den von ihnen gefundenen Strukturgesetzen besser beschreiben können.' Das Fehlen einer echten Erklärung in der strukturalistischen Sprachwandel-Theorie Trubetzkoys und seiner Anhänger ist natürlich nicht unbemerkt geblieben. So schreibt Jespersen (1941: 84): "Still it must be confessed that my point of view is different from that of the phonologists (der Prager Schule, Anm.d.A.). They are interested exclusively in the phonematic systems and their shiftings; they speak of teleology in bringing about a harmonic vowel or consonant system arranged in their triangles and squares and correlations, but do not really discuss the question whether such changes constitute an advantage for the speaking communities."
Eine ausführliche Kritik und Würdigung des strukturalistischen Ansatzes enthält Coseriu (1958; 1974). In dieser gründlichen Aufarbeitung des ganzen Problems der Ursächlichkeit von Sprachwandel ist einer der Leitgedanken gerade die subjektive Finalität, der Zweck, zu dem die Sprachbenutzer ihr Instrument 'Sprache' ändern. Unter diesem Gesichtspunkt muß ein objektives 'Ziel1 der Sprachveränderungen, von dem nicht klar ist, ob und inwiefern es auch einen subjektiven Zweck für die Sprachbenutzer darstellt, natürlich als Ursache des Sprachwandels verworfen werden: "Nach allem bisher Gesagten muß die Teleologie als Tendenz der Sprache auf einen objektiven äußeren Zweck hin verstanden, abgelehnt und sauber von der echten Finalität unterschieden werden, ( . . . ) , tak 2) tage > tage 3) tak > täk
51 ff.) gibt folgende Erklärung: Chronologisch folgten auf{Auslautverhärtung) (Dehnung vor stimmhaften Konsonanten) erklärungsbedürftige Veränderung
Die Stimmhaftigkeit des Folgekonsonanten als Bedingung für die Vokaldehnung ist nicht allgemein anerkannt. In der traditionellen historischen Linguistik heißt dieselbe Erscheinung 'Dehnung in offener Silbe 1 . Unter dieser Bedingung wäre eine Erklärung durch Regelumstellung überhaupt nicht mehr möglich. Da es uns hier jedoch nicht um die Korrektheit des Einzelbeispiels, sondern um die Plausibilität des ganzen Verfahrens geht, akzeptieren wir probeweise Kings Interpretation.
Interessant ist das Stadium etwa um 1400, das nebeneinander [tak] mit Kurzvokal und [tage] mit Langvokal hatte. Nach King enthielt die Grammatik der damals lebenden Sprecher die zugrundeliegende Form [tag] und je eine Regel für Auslautverhärtung und Vokaldehnung in dieser Reihenfolge, so daß folgende Derivation entstand: Zugrundeliegende Form: tag tages Auslautverhärtung tak " Dehnung vor stimrihaf ten Konsonanten " täges Phonetische Oberfläche tak täges Diese Anordnung der Regeln ist jedoch nicht optimal (sondern markiert oder "bleeding" nach Kiparsky (1968)), da die Auslautverhärtung den Geltungsbereich für die Vokaldehnung einengt. Beide Regeln betreffen nur je eine Form. Dreht man jedoch die Reihenfolge um, so gilt die Vokaldehnung für beide Formen: Die optimale ("feeding") Anordnung mit dem größtmöglichen Geltungsbereich für beide Regeln ist erreicht und damit auch die neuhochdeutschen Formen: zugrundeliegende Form: tag tages Dehnung tag täges Auslautverhärtung täk " Phonetische Oberfläche täk täges
15
Als Voraussetzung für diese Erklärung sind folgende Annahmen über die psychische Realität von graninatischen Strukturen und den sie determinierenden Uhiversalien des Spracherverbs notwendig: Erstens: die Existenz einer zugrundeliegenden Form /tag/, die auch schon um 1400 nie an der Oberfläche erscheint, und die bis heute alle Kinder beim Spracherverb durch einen komplizierten Abstraktionsprozeß aus dem sprachlichen Material, das ihnen angeboten wird, erschließen müssen. Zweitens: die Existenz von Regeln, die aus der zugrundeliegenden Form und den Flexiven die flektierten Oberflächenformen eines Paradigmas erzeugen. Drittens: eine feste Anordnung dieser Regeln. Viertens: ein Bewertungskriterium für die Wahl der optimalen zugrundeliegenden Form sowie optimale Art und Anordnung der Regeln. Dieses sorgt dafür, daß z.B. auch heute noch jedes Kind, das Deutsch lernt, /tag/ und nicht etwa /tag/ als zugrundeliegende Form erwirbt, da durch die Einführung der Vokallänge durch eine generelle Regel ein Merkmal in der zugrundeliegenden Form eingespart werden kann; und es hat dafür gesorgt, daß um 1400 die Kinder die Regeln für Auslautverhärtung und Vokaldehnung umstellten, um, bei Berücksichtigung aller möglichen abzuleitenden flektierten Oberflächenformen des Paradigmas, die größtmögliche Generalität jeder einzelnen Regel zu gewährleisten. Vergleichen wir die Regelumordnung und ihre Voraussetzungen nun mit folgender Erklärung derselben Sprachveränderung: Voraussetzungen sind lediglich das allgemeine Bedürfnis, für ein und denselben Inhalt immer ein und denselben Ausdruck zu gebrauchen, das eine Auswirkung des noch allgemeineren Bedürfnisses bzw. der Fähigkeit ist, in vergleichbaren Situationen vergleichbar zu handeln, zweifellos eine der Grundvoraussetzungen für alles Lernen. Angewendet auf unser Beispiel heißt das, daß der Stamm eines Wortes, der ja in allen Flexionsformen dasselbe bedeutet, auch immer gleich ausgesprochen werden soll, also z.B. ohne Altemanzen in der Vokalquantität, d.h. überall mit Langvokal. Theoretisch hätte auch eine erneute Kürzung in den flektierten Formen erfolgen können, aber das hätte dem gleichen Bedürfnis auf lautlichem Gebiet widersprochen, das verlangt, vor stimmhaften Konsonanten alle Vokale lang zu sprechen. Durch dieses Bedürfnis waren in der vorhergehenden Generation die betreffenden Vokale ja erst gelängt worden.
Es ist klar, daß wir soeben die traditionelle Erklärung durch analogischen Ausgleich (z.B. Paul 198 f f . ) angeführt haben, die nach wie vor eine
16
ernsthafte und unserer Meinung nach sehr viel plausiblere Konkurrenz zum generativen Sprachwandel-Modell darstellt. 5.1.2. Plausibilität versus Simplizität. Die Diskussion um "crazy rules" Die Implausibilität vieler Annahmen des generativen Sprachwandel-Modells blieb nicht lange verborgen. Schon ein kurzer Überblick über die Beiträge zur UCLA-Konferenz von 1969 über "Linguistic Change and Generative Theory", die in Stockwell·; Macaulay (1972) veröffentlicht sind, zeigt, daß alle Autoren, wenn auch in verschiedenem Maße und unter verschiedenen Gesichtspunkten, mit diesem Problem kämpfen. Insbesondere die Beiträge zur generativen Phonologie, die den weitaus größten Anteil stellen, haben "a common theme running through them - the need to remedy the excessive formalism in 'classical generative phonology' as exemplified in Chapters 1 - 8 of The Sound Pattern of English by Noam Chomsky and Morris Halle",
wie die Herausgeber in ihrer Einleitung hervorheben (Stockwell; Macaulay 1972: VII). Als typisches Beispiel für die damalige Situation kann der Beitrag von Bach; Harms "How do languages get crazy rules?" gelten. Die Autoren zeigen, daß die wiederholte Anwendung derselben Regelvereinfachung (z.B. Generalisierung durch Ersetzung von ' + ' oder '-' durch -Variable als Merkmalsspezifikation) zu höchst unplausiblen, eben "crazy" synchronen Regeln führt, die auf sehr abstrakten zugrundeliegenden Strukturen operieren (ähnlich wie /tag/ im vorhergehenden Beispiel). Sie schließen jedoch aus dieser Tatsache noch nicht, daß die den Regelvereinfachungen zugrundeliegenden Annahmen, insbesondere das Einfachheitskriterium, nicht psychisch real sein könnten, sondern kommen zu dem Schluß, daß plausibel nur der Beginn einer Serie von Regelvereinfachungen zu sein braucht. Danach aber "rule simplification goes its way, blind to plausibility constraints." (Bach; Harms 1972: 12) Hier drängen sich jedoch sofort zwei Fragen auf: Erstens: Wann soll man den Beginn einer Serie von Regelvereinfachungen annehmen, an dem die neuen Regeln noch plausibel sein müssen? Jeder Sprachzustand, den wir betrachten, ist ja bereits das Resultat vorhergehender Veränderungen, steht also innerhalb der großen Serie von Veränderungen, die die Geschichte der betreffenden Sprache ausmacht. Ist es nicht ein willkürlicher Akt, die Oberflächenformen eines Zustandes X als die zugrundeliegenden für einen langen Zeitraum nachfolgender Veränderungen zu betrachten?
17
Zweitens: Wie soll man sich erklären, daß die Sprecher, die schließlich die Sprachveränderungen durchführen, unterschiedliche Plausibilitätsbeschränkungen einhalten mißten, je nachdem, ob sie sich gerade am Anfang oder in der Mitte einer Serie von Vereinfachungen befinden, was wohl kaum zu ihrem sprachlichen Wissen gehören dürfte? Ist es nicht vielmehr so, daß die Sprachbenutzer zu jedem Zeitpunkt nur solche Veränderungen vornehmen, die in der jeweiligen (inner- und außersprachlichen)
Situation ihre Performanzbedürfnisse möglichst gut be-
friedigen? Solche Veränderungen müßten dann, isoliert betrachtet, dem Linguisten im Nachhinein plausibel erscheinen. Der Eindruck der Implausibilität entsteht nur dann, wenn der Linguist versucht, das Ergebnis aus der Überlagerung mehrerer Veränderungen mit einer Ableitung zu erfassen. Nehmen wir an, eine Sprache hat eine zugrundeliegende Form A mit der identischen Oberflächenform A 1 . Die plausible Veränderung 1 bewirkt nun, daß aus A' B wird. Veränderung 2 verwandelt B in C und wäre nur dann plausibel, wenn man B als neue zugrundeliegende Form betrachtet, deren identische Oberflächenform B' in C verwandelt worden ist.
Das Ergebnis von Verän-
derung 2 wäre aber implausibel, wenn man als zugrundeliegende Form inmer noch A betrachtet und die Veränderungen 1 und 2 als zwei, synchrone Regeln zur Erzeugung der Oberflächenform C. Wie soll sich der historische Linguist nun entscheiden? Soll er von der Grundannahme ausgehen, daß Sprachbenutzer plausibel handeln? - Dann käme nur die Beschreibung mit dem Wechsel der zugrundeliegenden Formen als 'psychisch real1 in Frage. Oder soll er von der Grundannahme ausgehen, daß ein bestimmtes Grarmatikmodell psychisch real ist und dafür den Sprachbenutzern implausibles Handeln unterstellen? - Dann wäre die Beschreibung die richtige, die die diachronen Veränderungen mit in die synchrone Ableitung aufnimmt. Wir meinen, daß die erste Lösung der Wirklichkeit näherkommt. Bach; Harms (1972: 12) bezeichnen sie allerdings als "Trivialisierung": "If we allow ourselves to construct an ad hoc sequence of plausible rules with appropriate changes in underlying forms just to avoid apparently unnatural rules, we will completely trivialize any hypothesis about plausibility constraints in phonology." (Bach; Harms 1972: 12)
Man muß sich hier jedoch fragen, was es bedeutet, eine Lösung 'trivial' zu finden, wenn man das Funktionieren seines eigenen Geistes erkennen will (was die Autoren explizit anstreben). Spricht bei einer solchen Fragestel-
18
lung nicht die Tatsache, daß itan eine Formulierung für trivial oder selbstverständlich hält, gerade dafür, daß sie mit unserer Intuition über die Strukturen unseres eigenen Wissens bzw. über unsere eigenen Tätigkeiten übereinstimmt? Hätten wir wirklich die postulierten abstrakten zugrundeliegenden Formen und die "crazy rules" im Kopf, so würde uns ihre Formulierung vermutlich trivial und die Alternativlösung als 'raffiniert1 oder 'überformalisiert1 erscheinen. So greifen 1973 auf dem Kongreß über "The nordic languages and modern linguistics" (Dahlstedt 1975) gleich zwei Autoren das Problem 'Restrukturierung versus sehr abstrakte zugrundeliegende Formen mit komplizierten Ableitungsregeln1 auf: E. Haugen und 0. Werner, letzterer mit explizitem Bezug auf Bach; Harms' "crazy rules". Beide kommen zu dem Schluß, daß höchstens solche Ableitungsregelxi als psychisch real angesehen werden können, die 'lebende', d.h. synchron automatische Alternanzen bewirken wie z.B. die Auslautverhärtung in /tag/ zu [täk]. Geht aber die Alternanz verloren, sei es, weil die Analogie eine Veränderung auf das ganze Paradigma ausgedehnt hat wie z.B. die Dehnung in allen Flexionsformen von Tag, sei es, weil durch weitere Veränderungen der die Alternanz determinierende Faktor verschwand und die ursprünglich alternierenden Formen sich lautlich und semantisch sehr weit voneinander entfernt haben (wie in geben - Gift) , so besteht keine synchrone Ableitungsregel mehr. Versucht der Linguist in solchen Fällen, die eine Form als zugrundeliegend, die andere als abgeleitet zu betrachten, oder gar beide auf eine gar nicht mehr an der Oberfläche realisierte gemeinsame Form zurückzuführen, so entstehen sehr aufwendige und manchmal eben 'verrückte' Regelapparate. Beide Autoren, Werner und Haugen, plädieren dafür, in solchen Fällen, in denen keine offensichtlichen synchronen Alternanzen mehr vorhanden sind, zugunsten der Plausibilität zu entscheiden und lieber verschiedene zugrundeliegende Formen anzunehmen. Selbst bei Annahme dieses grundsätzlichen Kriteriums der synchronen Alternanzen können sich die Geister noch scheiden an der Frage, was als synchrone Alternanz zu werten ist: Muß sie automatisch phonologisch determiniert sein wie z.B. die Auslautverhärtung im Deutschen (/tage/ - /täk/) oder darf die ehemals phonologische Determinierung zu einer grammatischen geworden sein (z.B. der Pluralumlaut im Deutschen)? In dieser Frage unterscheiden sich die Auffassungen von Haugen und Werner: Für Haugen 'zählen1
19
nur automatisch phonologisch determinierte Alternanzen, für Werner hingegen auch grammatische, die aufgrund von Regelmerkmalen wie etwa [+Umlaut] im Lexikon zustande kommen. 5.2. Kompetenz, Performanz und psychische Realität Nachdem wir an einem Beispiel gezeigt haben, wie Plausibilitätsbetrachtungen zur Ablehnung von Hypothesen über die psychische Realität generativer Universalien des Spracherwerbs und damit generativer Grammatiken führen können, wollen wir nun einige mehr theoretische Überlegungen zu gewissen Grundpostulaten der generativen Theorie anführen, die in dieselbe Richtung weisen. Als Grundlage seines Bemühens um "die Aufdeckung einer mentalen Realität, die dem aktuellen Verhalten zugrundeliegt" (Chomsky 1965; 1969: 14) übernimmt Chomsky von de Saussure die Unterscheidung zwischen 'langue' und 'parole', Sprache als System und Sprache als Sprechen, die er umbenennt in 'Kompetenz1 und 'Performanz1, um auch im Ausdruck gerade den mentalen Charakter der Kompetenz zu betonen. Innerhalb der Theorie kcmmt dies zum Ausdruck durch das Primat der 'dynamischen', kombinatorischen Syntax vor dem 'statischen' Inventar der Morphologie und Phonologie bei de Saussure, da gerade die Beherrschung der Kombinatorik einer Sprache ihre Benutzer 'kompetent' macht, kreativ Sätze dieser Sprache zu bilden (was bei Chomsky gleichbedeutend ist mit 'eine Sprache verwenden'). "Die Unterscheidung, die ich hier vermerke, ist verwandt der Saussureschen Trennung in langue - parole; es ist jedoch notwendig, von Saussures Begriff der langue als lediglich einem systematischen Inventar von Einheiten abzugehen und zurückzugehen auf das Humboldtsche Verständnis der zugrundeliegenden Kompetenz als einem System generativer ("erzeugender") Prozesse." (Chomsky 1965; 1969: 14 f . )
Mit der Kompetenz in Form einer psychisch realen generativen Grammatik meint Chomsky, alle spezifisch sprachlichen Fähigkeiten der Sprachbenutzer erfaßt zu haben. Es müssen nur noch einige von der eigentlichen Kompetenz verschiedene performatorische Fähigkeiten hinzukommen, damit die Sprachbenutzer ihr 'Instrument', die Kompetenz, richtig verwenden können. Ein Performanzmodell im Sinne Chomskys enthält also getrennt voneinander eine generative Grammatik und eine Art 'Gebrauchsanweisung' für Sprecher und Hörer. (S. z.B. das Performanzmodell von Chomsky; Miller 1963)
20
Mit dieser Auffassung überninmt und verschärft Chonsky ein Problem, das schon Paul beschäftigt hat: Kann man, wenn man wirklich an der psychischen Realität interessiert ist, eine Trennung von Wissen und Können, von der Kenntnis eines Sprachsystems und der Fähigkeit zu seiner Verwendung, akzeptieren? Die Frage ist unter verschiedenen Gesichtspunkten verneint worden. 5.2.1. Der Begriff der 'Kommunikativen Kompetenz1 Ein ursprünglich sprachphilosophisches Argument stammt aus der Sprechakttheorie, die sich wohl u.a. gerade deshalb heute unter vielen Linguisten einer so großen Beliebtheit erfreut, weil sie auf die Funktion der Sprache als Kommunikationsmittel zurückkommt. So kann sie in vielen Punkten eine bessere Antwort als die generative Theorie auf die Frage geben, was denn tatsächlich ein Sprecher wissen muß, um dieses Wissen erfolgreich anwenden zu können. Sprechen ist in dieser Sicht nicht nur das Äußern von grammatisch richtigen Sätzen, zu dem die Kompetenz im Sinne Chomskys die Grundlage liefert, sondern das Äußern von Sätzen (und von Texten) in einer bestimmten Kommunikationssituation und zu einem bestintrtten kommunikativen Zweck: Sprechen ist Aussagen-Machen, Bitten, Befehlen, Fragen, Grüßen usw., und ein Kind lernt Sprechen (man beachte die Bezeichnung dieses Vorgangs als Sprechen-Lernen und nicht etwa als Sprache-Lernen), indem es lernt, in der an die jeweilige Kommunikationssituation angepaßten Weise Aussagen zu machen, zu bitten usw. Damit stimmt die alltägliche und in der Spracherwerbsforschung häufig festgehaltene Beobachtung überein, daß Kinder die Intonationsmuster, die mit verschiedenen Sprechakten wie 'Aussage' oder 'Frage' verbunden sind, beherrschen und anwenden, bevor sie Wörter und Sätze bilden. Eine Zusammenfassung mehrerer Arbeiten zu dem Thema s. in Leuninger; Miller; Müller (1972: 135 f f . )
Die gesamte Fähigkeit, solche Sprechakte zu vollziehen, liegt jeder aktuellen Performanz zugrunde, verdient also als ganze den Namen 'Kompetenz'. "Chomsky has a mistaken conception of the distinction between performance and competence, because he fails to see that competence is ultimately the competence to perform, and that for this reason a study of the linguistic aspects of the ability to perform speech acts is a study of linguistic competence." (Searle 1972: 24)
Die Kompetenz im Sinne Chomskys ist natürlich in dieser kommunikativen Kompetenz irgendwie enthalten:
21
"I should take competence as the most general term for the capabilities of a person. ( . . . ) Competence is dependent on both (tacit) knowledge and (ability for) use." (Hymes 1972: 282) Mit "knowledge" meint Hymes hier nicht nur grammatisches, sondern allgemein kommunikatives Wissen, von dem das rein grammatische lediglich einen Teil darstellt.
Ein beliebtes Beispiel für den Zusammenhang zwischen kommunikativer Kompetenz und dem grammatischen Wissen ist der Zusammenhang zwischen der Fähigkeit, zu laufen oder Fahrrad zu fahren und den Gesetzen der Statik. (z.B. Cowan 1970: 21) Ein Physiker, der einen Menschen gehen sieht, könnte meinen, daß dieser perfekt alle Gesetze der Statik kennt, da er sich konsequent so verhält, daß er nicht umfällt. Was dieser Mensch beherrscht, sind jedoch nur die Verhaltensweisen, die von den Pegeln der Statik diktiert werden. Damit beherrscht er natürlich in gewisser Weise auch indirekt die Regeln der Statik, aber sie sind in ihm in einer Weise repräsentiert, in der man sie in kein Physikbuch schreiben könnte, nämlich impliziert in Verhaltensregeln . Dieses Beispiel ist zweifellos etwas überspitzt; als seine prinzipielle Aussage können wir jedoch die von der Sprechakttheorie geforderte Untrennbarkeit von Wissen einerseits und der Fähigkeit zu seiner Verwendung andererseits, wenn es um psychisch reale zugrundeliegende Kenntnisse und Fähigkeiten geht, festhalten. 5.2.2. Sprechen, Hören und die 'neutrale Kompetenz' 5.2.2.1. Zur Asymmetrie von Sprechen und Hören Man braucht jedoch nicht einmal die plausiblen Postulate der Sprechakttheorie zu akzeptieren, um zu bezweifeln, daß die Kenntnis der grammatischen Regeln einer Sprache in der psychischen Realität unabhängig von der Fähigkeit zu ihrer Verwendung existieren kann. Denn selbst, wenn man als sprachliche Fähigkeit nur diejenige versteht, korrekte Sätze zu äußern und zu verstehen, unabhängig von ihrer Angemessenheit in der jeweiligen koriTüunikativen Situation, so bleibt noch die fundamentale Annahme der generativen Theorie bestehen und nachzuprüfen, daß die Kompetenz, die diesen beiden Fähigkeiten zugrundeliegt, nach Inhalt und Form dieselbe für Sprecher und Hörer ist,
da alle Unterschiede zwischen den beiden Fähigkeiten in die
Performanz verwiesen werden.
22 "Um ein hartnäckiges Mißverständnis auszuschalten, lohnt es die Mühe zu wiederholen, daß eine generative Grammatik kein Sprechermodell und kein Hörermodell ist. Sie versucht auf möglichst neutrale Weise (Hervorhebung d.A.) die Sprachkenntnis zu charakterisieren, die für den aktuellen Sprachgebrauch durch einen Sprecher-Hörer die Basis liefert." (Chomsky 1965; 1969: 20)
Ist die Existenz einer solchen neutralen Grammatik in unserem Kopf wahrscheinlich bzw. überhaupt möglich, oder ist die psychisch reale 'Grammatik' nicht vielmehr asymmetrisch? Zwei wichtige Argumente für die Richtigkeit der zweiten Annahme finden wir bei Jakobson (1962; 1971: 277 f f . ) : "Für den Hörer spielt der Wahrscheinlichkeitsfaktor eine gewaltige Rolle ... Eine unbewußt statistische Einstellung ist dem Wahrnehmenden eigen, und die Homonymie ist für ihn ein wesentlicher Vorgang ... Für den Sprecher als solchen gibt es keine Homonyme, und wenn er z.B. das englische /sAn/ sagt, weiß er Bescheid, ob er den Sohn oder die Sonne meint, während der Hörer eine andere Wahrscheinlichkeitsmethode gebrauchen muß, um diese Frage zu lösen."
Greifen wir zunächst das Stichwort "Homonymie" auf. Wir möchten den Begriff hier für unsere Zwecke etwas erweitern und künftig von Uneindeutigkeit sprechen. Unter diesem Oberbegriff fassen wir hier viererlei zusammen: (1) Echte lexikalische und grammatische Ambiguität: Derselbe Ausdruck kann für verschiedene Inhalte stehen, z.B. die Endung /-an/ dm Deutschen (s.u.). (2) Den notwendigen Mangel an Präzision der linguistischen Einheiten, z.B. eines Lexems wie gehen. (Iah gehe zum Kaufmann, - Ich gehe nach Amerika. - Geht das Kind schon zur Schule? - Er geht nicht, sondern er rennt. usw.) (3) Uneindeutigkeiten, die nicht ins System, wohl aber in die Aussprachenorm gehören. Das sind normale, den Sprachbenutzern nicht bewußte Assimilationserscheinungen zwischen Phonen, die oft so weit gehen, daß Phoneme nicht ohne Berücksichtigung ihres lautlichen Kontexts zu identifizieren sind. Ein [p] aus der Silbe /pi/ z.B. wurde als /k/ gehört, als man es künstlich vor ein isoliert gesprochenes [a] schaltete. (Fodor; Bever; Garrett 1974: 295) (4) Uneindeutigkeiten, die nicht in die Aussprachenorm gehören, aber bei der Performanz doch immer wieder entstehen durch undeutliches Sprechen, Lärm usw. Alle diese Fälle von Uneindeutigkeit haben für das Verhältnis von Sprecher und Hörer dasselbe zur Folge: Der Hörer kann nicht einfach denselben
23
Regelapparat benutzen wie der Sprecher, nicht einmal in 'umgekehrter Richtung' . Seine Regeln müssen sich in Form und Anordnung von denen des Sprechers unterscheiden. Der Sprecher kann tatsächlich vcm Inhalt über Syntax und Morphologie zur Lautkette gehen, aber der Hörer kann nicht einfach dieselben Regeln 'rückwärts' anwenden: erst die Lautkette in Phoneme zerlegen, die Phonemkette in Morphe usw. Zwar muß er dies alles leisten, aber wegen der üneindeutigkeit braucht er dazu ständig und gewissermaßen 'durcheinander' Informationen aus allen Ebenen der Produktion. Bei der Identifikation der einzelnen Phoneme ist es sogar fraglich, ob sie vom Hörer normalerweise überhaupt durchgeführt wird. Angesichts der oben geschilderten Üneindeutigkeit der Phone haben einige Psycholinguisten erwogen, ob nicht generell sogar die Silbe die kleinste perzeptuel le Einheit ist. (S. z.B. Savin; Sever 197O und die Diskussion in Fodor; Bever; Garrett 1974: 293 f f . ) Inwieweit diese Hypothese z u t r i f f t , wollen wir hier dahingestellt sein lassen. Jedenfalls lehrt uns die tägliche Erfahrung, daß wir normalerweise sogar nicht einmal Silben, sondern erst ganze Morphe erkennen, denn es fällt uns schwer, einen ungewöhnlichen Eigennamen zu verstehen, da wir ihn nicht als ganzen, sondern wirklich Phonem für Phonem oder Silbe für Silbe erkennen müssen.
Ein besonders einleuchtendes Beispiel für die Unmöglichkeit, eine Sprecherstrategie einfach 'umzukehren1, liefert die morphologische Dekodierung. Betrachten wir die Endung [-an]. Sie kann entweder Verbal- oder Nominalendung sein. Um sie richtig interpretieren zu können, muß der Hörer also wissen, zu welcher Wortart der zugehörige Stamm gehört. Dieses ist aber eine lexikalische Information, die der Hörer eigentlich, wollte er tatsächlich die Produktionsschritte des Sprechers 'rückwärts' nachvollziehen, auf dieser Stufe noch gar nicht einsetzen dürfte, da der Sprecher Wortarten ja vor den ihnen entsprechenden morphologischen Kategorien und erst recht vor den tatsächlichen Endungen auswählt. In vielen Fällen wird es genügen, wenn der Hörer in der Grammatik eine Stufe 'höher' steigt, nämlich ins Lexikon. Hieß der Stamm z.B. [u:r-], so sagt ein Blick ins Lexikon, daß es sich um ein schwaches fern. Substantiv handelt, die Endung kann also 'rückwirkend' eindeutig als [+P1] interpretiert werden. Hieß der Stamm aber z.B. [wag-], so müssen noch 'höhere1 Ebenen, Syntax und/oder Semantik, befragt werden, ob es sich um das Verb wagen oder eins der beiden Substantive Waage (im Pl.) oder Wagen (im Sg. oder Pl.) handelt. (Im letzten Fall wäre [-an] sogar gar keine Endung, sondern würde mit zum Stamm gehören.) Die Frage nach Sg. oder Pl. kann wieder mit einem Rückgriff auf die Morphologie (benachbarte Artikel, Adjektiv- oder Verbendung) geklärt werden.
24
Stehen diese jedoch auch im Plural, so kann letztlich nur die Satz- bzw. Textsemantik entscheiden, ob [-an] zum Stanm von Vagen gehört oder Pluralzeichen an Waage
ist.
Wo der Sprecher mehrere Regeln hat, die untereinander nicht verbunden zu sein brauchen, etwa {'Inf.'} —> /-an/, {'1. Pers. Pl. 1 } —> /-an/, {'3. Pers. Pl.'} —> /-an/ usw., braucht der Hörer eine Regel, die ihm alle möglichen Bedeutungen von /-an/ angibt und für jede eine 'Strategie', nach der er nachprüfen kann, ob sie zutrifft. Also etwa: {'Inf.'}
/ _—-—/-en/ \ ^——_
(nach Verbalstaimi. Es muß aber mindestens eine flektierte Verbform im Satz vorkonnen)
{'1. Pers. Pl.'}
(Subj.: wir)
{'3. Pers. Pl. 1 }
(Subj.: Noninalphrase dm Pl.)
{'Pl.'}
(nach schwachem Subst.)
usw. Dieses Beispiel ist insofern etwas 'gestellt1, als in Wirklichkeit die 'globale' Information aus sprachlichem und situativem Kontext zuallererst verwendet wird. In den meisten Fällen wird durch sie sowieso die Dekodierung der einzelnen morphologischen Endungen radikal vereinfacht. Nur wenn die Bedeutung von /-an/ nicht schon von vorneherein klar ist, beginnt der geschilderte Dekodiervorgang, der dann eventuell wieder in die Frage nach der Kontextinformation mündet. Durch solche 'Kreisläufe' weichen die Strategien des Hörers natürlich noch mehr von denen des Sprechers ab. Als weiteren Unterschied zwischen Sprecher und Hörer, der aus der Uneindeutigkeit folgt, erwähnt Jakobson, daß nur der Hörer Wahrscheinlichkeitswerte abzuschätzen braucht. Er wird bei einer eindeutigen Einheit ja nicht wahllos irgendeine der möglichen Lesarten 'testen1, sondern diejenige, die aufgrund des Kontextes und/oder ihrer relativen Häufigkeit am wahrscheinlichsten ist. Diese Fähigkeit, Wahrscheinlichkeitswerte für linguistische Einheiten im gegebenen Kontext festzustellen, nutzt er auch aus, um Hypothesen über mögliche Fortsetzungen zu machen, die er dann nur noch mit der tatsächlich folgenden Äußerung zu vergleichen braucht. Jeder kennt das Phänonen, Haft er als Hörer an einem bestimmten Punkt der Äußerung
25
ganz genau 'weiß', wie sie weitergehen wird, bzw. erstaunt ist, wenn die erwartete Fortsetzung nicht folgt. Dieses Verhalten des Hörers benutzen Halle; Stevens (1964) in ihrem sog. "analysis-by-synthesis-Modell", um so den Unterschied zwischen 'Sprecherkompetenz' und 'Hörerkompetenz 1 zu umgehen. Der Grundgedanke ist, daß der Hörer ja beim 'inneren 1 Produzieren möglicher Fortsetzungen dieselbe Kompetenz einsetzt, die er auch als Sprecher braucht. Offen bleibt jedoch die Frage, woher der Hörer weiß, welche Hypothesen denn überhaupt in Frage kommen, denn er kann ja nicht aufs Geratewohl Hypothesen bilden. Ein Teil der Äußerung muß also bereits wenigstens bis zu einem gewissen Grade dekodiert sein, ehe die Hypothesenbildung einsetzen kann. Diese Aufgabe löst in dem analysis-by-synthesis-Modell ein "preanalyzer', dessen Funktionsweise jedoch nicht sehr klar ist; mit anderen Worten: Das Problem der Asymmetrie zwischen Sprechen und Hören ist in den preanalyzer verlegt, aber nicht gelöst worden. (Eine ausführliche Kritik am analysis-by-synthesis-Modell enthält Fodor; Sever; Garrett 1974: 307 ff. für die Phonologie und 316 ff. für die Syntax.)
Es sollte aus dem bisher Gesagten klar geworden sein, daß dem Sprachteilnehmer als dem Hörer das sprachliche Wissen in einer anderen Form zur Verfügung stehen muß als in seiner Rolle als Sprecher. Wir stellten fest, daß sich ihre 'Kompetenzen1 in der Form der benötigten Regeln, in der Klassifikation der linguistischen Einheiten, in der Rolle der Wahrscheinlichkeitswerte und in der Reihenfolge, in der die Grammatikkomponenten angewendet werden, unterscheiden: Der Weg vom Inhalt zum Ausdruck unterscheidet sich von dem Weg vom Ausdruck zum Inhalt. Natürlich besteht zwischen beiden ein Zusammenhang, eine Art 'Rückkoppelung1 . So hört der Sprecher natürlich sich selbst und kontrolliert ständig, ob seine Äußerung wirklich so klingt, wie er sie geplant hat. Diese Selbstkontrolle kann auch so weit gehen, daß er sich bewußt in den Hörer versetzt und üneindeutigkeiten vermeidet. Dies ist aber bereits eine bewußte und keine naiv eingenommene Haltung, die etwa durch Rückfragen des Hörers motiviert sein kann oder durch besondere Erziehung oder durch die Kommunikationssituation, etwa bei schriftlichem Ausdruck oder am Telefon. Im letzten Fall muß sich der Sprecher ja bewußt in die Rolle des abwesenden Hörers versetzen, um alles das zu verbalisieren, was der Hörer normalerweise der Gesprächssituation entnehmen würde. Schließlich kann jeder Sprachbenutzer eine einmal erworbene 'Hörerkompetenz1 in eine 'Sprecherkompetenz' umwandeln. Das ist nicht verwunderlich, denn ditmerhin handelt es sich um dasselbe Sprachsystem. Aber gerade die Tatsache, daß Kinder oder Ausländer durchaus nicht automatisch alles
26
sagen können, was sie verstehen, zeigt, daß sie ihr sprachliches Wissen erst in eine neue Form bringen müssen, ehe sie es auch als Sprecher benützen können. Der Weg vom 'passiven' zum 'aktiven 1 Spracherwerb ist der normale, aber in einzelnen Sonderfällen kann er auch umgekehrt verlaufen. Wenn z . B . im Schulunterricht einseitig immer nur der schriftliche und mündliche Ausdruck in einer Fremdsprache geübt worden ist, werden die Schüler zunächst Schwierigkeiten haben, gesprochene Texte zu verstehen.
Eine weitere Unterstützung der Hypothese, daß die von Hörer benötigten sprachlichen Fähigkeiten verschieden sind von denen des Sprechers, kommt aus der Neurolinguistik: Die beiden 'Kompetenzen' können durch Hirnverletzungen getrennt voneinander geschädigt werden, weil sie in verschiedenen Teilen des Gehirns realisiert sind. Es gibt Patienten, die zwar sprechen, aber nicht verstehen können, und solche, die zwar gut verstehen, aber größte Schwierigkeiten haben, sich auszudrücken. (S. dazu Lenneberg 1967 oder für einen kurzen, informativen Überblick Geschwind 1973) 5.2.2.2. Gibt es die 'dritte Komponente1? Viele Leser werden schon seit langem einwenden wollen, daß diese Unterschiede zwar offensichtlich und wohlbekannt sind, daß sie die eigentliche Kompetenz aber nicht betreffen, da sie in die Performanzstrategien von Sprecher und Hörer gehören, die von der Kompetenz als einer dritten, neutralen Komponente beim Spracherwerb abgeleitet werden. Zu diesem Schluß kamen jedenfalls mehrere Psycholinguisten zu einem Zeitpunkt, als sich herausgestellt hatte, HaR das Kompetenzmodell Chomskys sich in keiner Weise direkt in ein Performanzmodell integrieren ließ, wie Chomsky und die von ihm beeinflußten Psycholinguisten zunächst angenommen hatten. Der kritische Punkt in dieser Hinsicht war die Rolle der Transformationen im Produktions- und Perzeptionsprozeß. Hatte man anfänglich angenommen, daß Sätze, deren Ableitung viele Transformationen enthält, schwerer zu verstehen, behalten oder reproduzieren sein müßten als solche mit wenigen Transformationen, da der Weg von Tiefen- zu Oberflächenstruktur und umgekehrt länger wäre, stellte sich doch bald heraus, daß diese Hypothese sich nicht halten ließ. (Eine ausführliche Darstellung und Kritik dieser "derivational theory of complexity" enthält Fodor; Bever; Garrett 1974: 320 f f . )
Eine gewisse psychische Rsalität konnte nur nachgewiesen werden für die strukturellen Beschreibungen, die Chomskys Kompetenzmodell liefert (die aber gerade nicht zu den Besonderheiten einer speziell generativen Gramma-
27
tUc gehören, wie auch Derwing (1973: 286) bemerkt) sowie für Produktionsund Perzeptionsstrategien, die nicht vereinbar sind mit den Operationen, die eine generative Granmatik enthält. An diesem Punkt drängte sich natürlich die Frage auf, die Fodor (1971: 135) stellt: "Why suppose that what a child learns when he learns his language is a grammar if, as we have seen, the grammar does not provide a model of what the child becomes when he becomes a speaker/hearer? Is it not, rather, plausible to assume that the child, upon exposure to his language, develops not a grammar but a sentence producer/recognizer; that is, a device related to a grammar only in that it manipulates the structural descriptions that grammars enumerate?"
Diese Frage zu bejahen, würde jedoch bedeuten, die psychische Realität generativer Grammatiken und damit jener Universalien des Spracherwerbs zu leugnen, die dafür sorgen, daß Kinder speziell generative Grammatiken erwerben. Diese Universalien aber gehören, wie wir gesehen haben, zu den wichtigsten Bestandteilen der gesamten generativen Theorie und vor allem des generativen Sprachwandel-Modells. Um diesen Schritt nicht vollziehen zu müssen, kommt Fodor zu dem, wie er selbst hervorhebt (1971: 134), hochgradig spekulativen Schluß "that the child must be construed as having not merely an innate ability to select a correct grammar of a given natural language, ( . . . ) , but also that he must have available procedures for constructing a recognizer/producer for sentences in a language given an appropriate grammar of that language." (Fodor 1971: 137)
Diese "appropriate grantnar" ist dabei natürlich "by hypothesis (...) a grammar in normal transformational form." (Fodor 1971: 137) Hier stellen sich jedoch zwei Fragen: Erstens: Ist eine solche dritte Komponente 'Kompetenz' neben Produktionsund Perzeptionsstrategie überhaupt notwendig und wenn ja, wozu? Zweitens: Ist der Erwerb einer solchen Komponente vor den Performanzstrategien möglich? Auf die erste Frage geben Bever; Langendoen (1972) in ihrem für uns ansonsten wegweisenden Aufsatz folgende, etwas überraschende Antwort: Die Kompetenz dient dazu, mögliche Sätze nach Akzeptabilität und strukturellen Bezügen zu beurteilen und steht somit als "predictive grammar" neben den Strategien für Produktion und Perzeption:
28 "A person knows how to carry out three kinds of activities with his language: He can produce sentences, he can understand sentences, and he can make judgements about potential sentences. (...) the history of a language and therefore its synchronic state as well, are the products of a dynamic interaction between the rules required for the prediction of new sentences, and the behavioral mechanisms used to understand sentences." (Sever; Langendoen 1972: 33 f . )
Nun kann man sich jedoch leicht vorstellen, wie ein Sprecher/Hörer mögliche Sätze einer Sprache beurteilen kann, auch ohne dafür eine eigene generative Grammatik 'im Kopf1 zu haben, nämlich einfach mit Hilfe seiner Perzeptions- und Produktionsstrategien, indem er sich fragt: '(Wann) würde ich diesen Satz sagen?1 oder 'Würde ich diesen Satz verstehen?" (bei der Frage nach Graititiatikalität und Akzeptabilität) bzw. 'Wie würde ich diesen Satz verstehen?', 'Welchen Satz könnte ich statt dessen sagen?1 usw. (bei der Frage nach Mehrdeutigkeit oder Synonymie von Sätzen). In der Tat sagt uns die Intuition, daß wir genauso verfahren, wenn wir Sätze der eigenen Muttersprache beurteilen. Mit einem klaren Nein beantwortete Vandamme die von ihm selbst gestellte Frage. "Is a competence which overarches production and recognition necessary?" (Vandamme 1972: 70) und entwirft zum Beweis ein Performanzmodell (Vandamme 1972: 72) mit zwei Systemen für Produktion und Perzeption, die untereinander durch ein Rückkoppelungssystem verbunden sind, so daß gewährleistet ist, daß der Sprecher seine eigenen Äußerungen hört und versteht und daß der Hörer auch von seiner Sprecherkcmpetenz während der Dekodierung Gebrauch machen kann. (s. S. 25 f . ) . Die Anwendung dieses Modells auf das Holländische (und teilweise auf das Englische und Deutsche) führt zu dem für uns inzwischen fast selbstverständlichen Ergebnis, daß "the most striking result of these descriptions is the appearance of widely divergent characteristics in both systems." (Vandamme 1972: 9)
Die zweite Frage: 'Ist der Erwerb einer neutralen Kompetenz vor der Konstruktion von Performanzstrategien überhaupt möglich?1 ist durch die simple Überlegung zu verneinen, daß es doch wohl unmöglich ist, den Äußerungen einer Sprache die Gramnatik (verstanden als die Zuordnungsregeln zwischen Ausdruck und Inhalt) dieser Sprache zu entnehmen, ehe man in der Lage ist, wenigstens einige dieser Äußerungen zu verstehen. Der Erwerb einer eigenen Komponente 'Kompetenz' müßte also auf mindestens einer der beiden Performanzstrategien, nämlich der des Hörers, basieren und nicht umgekehrt. (Dies erklärt auch ganz zwanglos, warum Kinder eher verstehen als
29
sprechen können. Würden sie wirklich zunächst die Grammatik erwerben, so wäre nicht einzusehen, warum sie von dieser Grammatik aus nicht gleichzeitig Strategien für Sprechen und Hören konstruieren sollten, zumal von einer generativen Grammatik aus, die sowieso mehr einer Sprecher- als einer Hörerstrategie ähnelt.) So aber ist der neutralen Kompetenz in Form einer generativen Gramriatik gewissermaßen die 'Existenzberechtigung' entzogen, die ihr durch die Behauptung verliehen wurde, nur von einer generativen Grammatik aus könne ein Kind Performanzstrategien entwickeln. (Eine ausführliche Kritik der generativen Grammatik als Theorie des Spracherwerbs enthält z.B. Derwing 1973). Alle diese Argumente laufen darauf hinaus, daß tatsächlich nur eine Produktions- und eine Perzeptionsstrategie erworben werden und daß auch nur diese beiden beim erwachsenen Sprecher psychische Realität haben. Daher ist es auch nicht verwunderlich, wenn auch solche Psycholinguisten, die ursprünglich angetreten waren, um die generative Kompetenz zu 'finden', inzwischen rückblickend sagen: "Die ( . . . ) Forschungen haben mehr Erkenntnisse über die Performanz als über die Transformationsgrammatik gebracht, und vielleicht ist dies das vielversprechendste Gebiet psycholinguistischer Forschungen." (Slobin 1971; 1974: 45)
Offenbar gilt das Beispiel vom Gehen und Radfahren, das wir im Zusammenhang mit der Sprechakttheorie anführten (S. 21) , auch für den eingeschränkten Bereich sprachlichen Handelns, den das Produzieren und Verstehen von Sätzen darstellt. Das Kind lernt die Regeln seiner Sprache impliziert in den beiden Fähigkeiten, Sätze zu sprechen und zu verstehen. Diese machen selbst nur wieder einen Teil der Fähigkeit aus, sich in verschiedenen Kommunikationssituationen angemessen zu verhalten. (In einer wichtigen Beziehung, auf die wir noch ausführlicher zu sprechen kommen werden, trifft dieses Beispiel jedoch nicht zu.) 5.3. Sprache - ein abstrakter Gegenstand Was bedeutet das für das Sprachsystem, so wie der Linguist es in einer Grammatik beschreibt? Es ist, ebenso wie die Regeln der Statik, ein abstrakter Gegenstand. Der Linguist abstrahiert das Sprachsystem aus dem Sprechen der Mitglieder einer Sprachgemeinschaft und aus seinen eigenen Fähigkeiten, eine Sprache zu sprechen und zu verstehen. Ebenso abstrahiert
30
der Physiker die Gesetze der Statik aus dem Verhalten seiner Versuchsobjekte und seiner eigenen Fähigkeit, diese Gesetze z.B. beim aufrechten Gehen auszunutzen. Um einem häufigen Mißverständnis vorzubeugen, müssen wir hier darauf hinweisen, daß 'abstrakt' nicht gleichzusetzen ist mit 'nicht existent', "imaginär 1 , wie es oft im täglichen Sprachgebrauch geschieht. Abstraktion ist eine geistige und zur wissenschaftlichen Erkenntnis unbedingt notwendige Tätigkeit, durch die Gegenstände, die in der Realität nur zusammen existieren, im Geiste getrennt werden. Wenn man z.B. sagt 'das Alter 1 , so hat man damit die Eigenschaft, alt zu sein, von alten Menschen, Tieren, Gegenständen im Geiste 'abgezogen' (abstrahiert). Man betrachtet jetzt eben nicht mehr die ganzen alten Objekte, sondern nur ihre Eigenschaft, alt zu sein. Das bedeutet nicht etwa, daß es diese Eigenschaft in der Realität nicht gäbe. Es gibt sie nicht so isoliert, wie man sie im Geiste betrachtet. Es wäre nur unsinnig, in der Realität nach dem isolierten, selbständigen Gegenstand 'Alter' suchen zu wollen: "Die Abstraktionen sind nicht gefährlich, wenn sie als solche erkannt werden, sie sind es nur, wenn man sie mit den konkreten Fakten identifiziert." (Coseriu 1958; 1974: 45) Dies aber ist genau der Fehler, den die generative Theorie begeht. Was Chomsky als 'Kompetenz' eines englischen Sprechers beschreibt, ist nichts anderes als eine bestimmte Beschreibung des englischen Sprachsystems, also eines aus der eigentlichen Kompetenz, nämlich der Fähigkeit, englisch zu sprechen und zu verstehen, abstrahierten Gegenstandes.
Um auf das Problem des Sprachwandels zurückzukommen: Es kann nicht das Ziel der Sprachbenutzer, weder der Kinder noch der Erwachsenen, sein, ein Sprachsystem nach den Kriterien einer Sprachbeschreibung zu optimieren, weil eine solche Sprachbeschreibung für sie keine psychische Realität hat. Das Kriterium, nach dem die Gemeinschaft der Sprachbenutzer ihre Sprache verändert, ist vielmehr der kleinstmögliche Aufwand, der zum Erreichen der Kommunikationsabsicht durch Sprechen, Hören und Lernen dieser Sprache in einer gegebenen historischen Situation notwendig ist. (S. dazu die ausführlichen Erläuterungen S. 236 ff.) Die Größe dieses Aufwandes hängt entscheidend von dem Verhältnis ab, in dem die verschiedenen Performanzbedürfnisse belastet werden. Unter diesen Bedürfnissen sind auch einige, insbesondere diejenigen nach analogem Handeln und kleinen Inventaren, die ein Sprachsystem so verändern, daß es leichter zu beschreiben wird. Diese leichtere Beschrelbbarkeit des Systems ist zwar ein Effekt, aber noch lange nicht der Zweck von solchen Veränderungen wie z.B. Formenausgleich. Der Zweck, die eigentliche 'Ursache', ist in diesem Fall vielmehr die Befriedigung des Bedürfnisses nach analogem Handeln.
31
5.4. Antimentalismus im generativen Sprachwandel-Modell bei King Wir hatten gesehen, daß die.Erklärungskraft der generativen Sprachwandeltheorie entscheidend von der psychischen Realität der generativen Grammatiken abhing; wir haben aber auch viele Argumente angeführt, die gegen die Annahme dieser psychischen Realität sprechen. Also bietet das generative Sprachwandel-Modell bestenfalls eine Beschreibung, nicht aber eine Erklärung der Sprachveränderungen. Die Fragwürdigkeit der psychischen Realität generativer Grammatiken drängte sich offenbar King (1969) ebenfalls auf in seiner ausführlichen Darstellung der generativen Sprachwandeltheorie. Denn während Kiparsky die psychische Realität der generativen Universalien des Spracherwerbs und damit generativer Grammatiken annahm und damit den Sprachwandel in seinem Sinne erklären konnte (nämlich als Grarrniatiksöiriplifizierung, die das Kind ja gewissermaßen vornehmen muß, da seine angeborenen Universalien es dazu zwingen, die einfachstmögliche generative Grammatik zu konstruieren), übernimmt zwar King den gesamten äußeren Aufbau des Modells von Kiparsky (Einteilung der Veränderungen in Innovationen durch Erwachsene und Simplifizierung durch Kinder, Klassifikation der Simplifizierung in Regelverlust, -umordnung usw.), entzieht ihm aber mehr und mehr seine Begründung, indem er die Erklärungsadäquatheit der gesamten generativen Theorie in Frage stellt. So entsteht ein in gewisser Weise hybrides Werk, das einerseits das ganze generative Instrumentarium zur Erklärung des Sprachwandels enthält, andererseits aber die wiederholte Beteuerung, dies alles sei als Beschreibung, nicht als Erklärung zu verstehen, zunächst nur mit Bezug auf die Kompetenz des Erwachsenen und seine Innovationen (z.B. King 1969: 14, 66, 8O), dann aber in dem Kapitel über die "Ursachen des Sprachwandels" (in einer konsequenten generativen Sprachwandeltheorie müßte ein solches Kapitel eigentlich überflüssig sein, denn dort ist die Simplifizierung ja gerade die Ursache) mit Bezug auf das ganze Modell: Die Simplifizierung erscheint hier nicht mehr als die Ursache, sondern als eine Art unbegründete 'Begleiterscheinung1 der Sprachentwicklung: "Our concern has been to describe change, to determine what it is rather than why it takes place. (...) It was observed (...) that some changes, notably rule loss and rule reordering, are variants of simplification and that grammar simplification frequently accompanies
32 diachronic development. But we do not thereby explain, why loss and reordering occur." (King 1969: 188 f . )
Wir sind also wieder in der Situation von Trubetzkoy angekommen: Die generative Beschreibung von Sprache und Sprachwandel weist ebenso wie die strukturalistische erstaunliche Regelmäßigkeiten ("Strukturgesetze") auf, aber da man ihre psychische Realität nicht als gegeben betrachten kann, stellt sie eigentlich keine mentalistische Erklärung dar. Anttilas ursprünglich so widersinnig erscheinende Behauptung, die generative Sprachwandeltheorie sei antimentalistisch, trifft an dieser Stelle zu: Der Bogen von Mentalismus über exzessiven Formalismus zum Antimentalismus ist zum zweiten Mal durchlaufen. So gibt King in dem Kapitel über Ursachen des Sprachwandels auch keine Antwort auf die Frage nach dem Warum. Es werden lediglich mehrere Erklärungsversuche besprochen und entweder abgelehnt (so die quantitativen Ansätze von Zipf und Martinet) oder als Varianten der Simplifizierung erkannt, so Martinet, Moulton (der phonologische Raum) und Sapir ( ' d r i f t ' ) . Dabei ist es bezeichnend für die Zweigleisigkeit der Argumentation zwischen Erklärung und Beschreibung, daß King einerseits die Erklärung, die hinter der Theorie vom phonologisehen Raum liegt, abblockt, indem er die Theorie auf Simplifizierung als Beschreibung zurückführt, während er beim ' d r i f t 1 , den er als eine unerklärte parallele Entwicklungstendenz in mehreren Sprachen versteht, gerade doch wieder eine Erklärung durch Simplifizierung versucht.
6. Die Rückkehr zur Performanz Das bedeutet jedoch nicht, daß wix die Frage nach den Ursachen des Sprachwandels endgültig aufgeben sollten. Vielmehr ist wieder die Frage am Platze, die wir entsprechend schon für den Strukturalismus formulierten: Warum lassen Sprachen und Sprachwandel sich so beschreiben, wie das generative Modell es tut? Warum lassen sich z.B. formale Universalien aufstellen, die die Form generativer Gratmiatiken bestimmen? Die Antwort auf diese Frage führt uns, wie seinerzeit Martinet, auf den Sprachbenutzer zurück, der seine Sprache in konkreten Kcumunikationssituationen sprechen und verstehen muß. Sprache existiert ja nur in diesen beiden Fähigkeiten, also muß auch dort der Ursprung ihres Wandels gesucht werden.
33
6.1. Die Rolle der Sprachökoronie für den Sprachwandel Wir hatten den psychisch realen Status der Pegeln einer Sprache mit dem der Regeln der Statik verglichen: Beide, so sagten wir, existieren implizit in Verhaltensregeln. Es besteht jedoch ein großer Unterschied zwischen den Gesetzen der Statik und den Regeln einer Sprache, der direkt zur Erklärung des Sprachwandels führt: Im Gegensatz zu Naturgesetzen lassen sich sprachliche Fakten verändern, da sie vom Menschen für seine kcttntunikativen Zwecke geschaffen sind, während die Naturgesetze auch unabhängig von ihm existieren und er sie lediglich für seine Zwecke einsetzen kann. Könnte irgendein Radfahrer eine Möglichkeit finden, mit seinem Rad vor der roten Ampel zu stehen, ohne den Lenker zu bewegen oder sich abzustützen, würde er sie höchstwahrscheinlich immer realisieren - und hätte damit indirekt die Gesetze der Statik verändert. Was dem Radfahrer unmöglich ist, kann der Sprecher einer Sprache erreichen. Die Grenzen, in denen er seih sprachliches Verhalten verändem kann, sind nicht durch feststehende Naturgesetze gesteckt, sondern lediglich durch die Verständlichkeit seiner Äußerungen für den Hörer und durch die Bereitschaft der anderen Mitglieder der Sprachgemeinschaft, seine Neuerungen zu akzeptieren. Denn dies ist ein zweiter Unterschied zwischen Naturgesetzen und Sprachregeln, der eigentlich aus dem ersten hervorgeht: Sprachliche Regeln haben einen sozialen Charakter, sie sind durch Übereinkunft entstanden und können nur durch Übereinkunft verändert werden, das bedeutet: durch Übernahme von Neuerungen, wie Coseriu (1958; 1974) wiederholt betont. Ein einziger Radfahrer könnte (wenn das möglich wäre) die Gesetze der Statik verändern, aber nicht ein einziger Deutscher die Regeln des Deutschen, sofern er mit seiner Neuerung allein bleibt. Damit sie zu einer Sprachveränderung wird, muß sie auch den anderen Mitgliedern der Sprachgemeinschaft unter den gegebenen Unständen besonders günstig erscheinen. Veränderungen der sprachlichen Fakten sind ja nie für alle Beteiligten in jeder Beziehung von Vorteil. Nicht alle Sprachveränderungen, die vorteilhaft für den Sprecher sind, erleichtern auch die Aufgabe des Hörers, oft im Gegenteil, und nicht alles, was für den Sprecher die Artikulation einer Äußerung erleichtert, ist auch vorteilhaft für ihre Planung. Der gesamte Kotinunikationsvorgang kann gesehen werden als das Zusantnenspiel verschiedener psychischer und physischer Tätigkeiten mit verschiedenen, teilweise übereinstimmenden, teilweise einander widerstrebenden Anforderungen
34
an die Sprachstruktur. Wir werden im Kapitel über Sprachökonomie versuchen, ein detaillierteres Bild dieses Netzes von gegenseitigen Abhängigkeiten zu geben. Unter den vielen Möglichkeiten, die psychische und physische Belastung der Performanz und des Spracherwerbs auf diese verschiedenen Bedürfnisse zu verteilen, verlangen nun in Abhängigkeit von der jeweiligen inner- und außersprachlichen Situation einige weniger Gesamtaufwand als andere. Natürlich werden die Sprachbenutzer irnner danach streben, ihre Sprache so zu verändern, daß sie eines der jeweils günstigsten Belastungsverhältnisse zuläßt. Für den historischen Linguisten bedeutet das, daß er sich zur Erklärung einer gegebenen Sprachveränderung zwei Fragen stellen muß: Erstens: Welches Performanzbedürfnis ist durch die Veränderung auf Kosten welches anderen begünstigt worden? Diese Frage läßt sich allgemein, d.h. unabhängig von der historischen Situation, beantworten. (S. dazu unsere systematische Darstellung der Abhängigkeiten zwischen den Performanzbedürfnissen S. 205.) Zweitens: Warum war in der gegebenen historischen Situation diese Veränderung in der relativen Belastung der Performanzbedürfnisse besonders günstig? Diese Frage läßt sich nur mit Bezug auf die inner- und außersprachliche historische Situation, also nicht allgemein, beantworten. Viele Linguisten schrecken vor der Einbeziehung der außersprachlichen historischen Fakten in die Erklärung des Sprachwandels zurück, da sie natürlich viele Probleme aufwirft: Die Zusammenhänge lassen sich meistens nicht zwingend nachweisen. Wir stimmen jedoch in dieser Frage mit der Ansicht Coserius überein, daß im Prinzip die Erklärung der einzelnen, historischen Sprachveränderung "von der Kenntnis der (systematischen und außersystematischen) historischen Bedingungen der jeweiligen Sprache und des besonderen Zeitpunktes, in dem sie betrachtet wird, abhängt." (Coseriu 1958; 1974: 12O) Dies muß unserer Meinung nach allein schon deshalb so sein, weil es ohne Berücksichtigung der historischen Situation so viele gleich günstige Möglichkeiten der Belastungsverteilung auf die Performanzbedürfnisse gäbe, daß man nicht erklären könnte, warum die eine zugunsten der anderen aufgegeben worden ist. Schließlich gibt es auch Sprachsysteme, die, absolut betrachtet, sogar eine eher ungünstige Belastungsverteilung bewirken, aber gut verständlich werden, sobald man die historische Situation berücksichtigt. Diese kann entweder die ungünstige Verteilung rechtfertigen oder eine 'freie' Entwicklung der Sprache verhindert haben, so z.B. bei bewußter 'Sprachpolitik'. (Zur Wirkungsweise der 'äußeren Faktoren' s.S. 231 f f . ) Schließlich sind die äußeren Faktoren unerläßlich zur Beantwortung der Frage, wie Sprachwandel vor sich geht, d.h. wie Neuerungen sich
35
verbreiten. Dies geschieht nämlich über stilistische Varianten, die zunächst die Sprechweise bestimmter sozialer, regionaler, beruflicher, gleichaltriger usw. Gruppen, bzw. des einzelnen Sprechers je nach Kommunikationssituation, charakterisieren. (S. z.B. Labov 1972 und Werner 1970}
6.2. Die Rolle des Spracherwerbs Die Itolle des Spracherwerbs für den Sprachwandel soll dabei nicht geleugnet werden; es erscheint uns jedoch fragwürdig, ob sich seine Bedürfnisse tatsächlich qualitativ von denen der 'normalen' Performanz erwachsener Sprecher-Hörer unterscheiden, wie im generativen Sprachwandel-Modell angencmnen wird, wo das Bedürfnis nach und die Fähigkeit zu der Optimierung der Grammatik den Kindern vorbehalten bleibt. Vielmehr werden unsere Beispiele zeigen, daß die besonderen Bedürfnisse des Spracherwerbs, unter denen zweifellos dasjenige nach Systematizität, "Einfachheit" im weitesten Sinne des 'Lernstoffes1 hervorsticht, durchaus mit solchen erwachsener Sprecher-Hörer übereinstimmen und deren Auswirkungen auf die Sprachstruktur verstärken. Dies ist auch nicht weiter verwunderlich, wenn wir uns daran erinnern, daß Spracherwerb ja gerade Sprechen-und-Hören-Lemen ist und nicht der Erwerb einer von aller Performanz losgelösten Grammatik, wie der Linguist sie schreibt. Auch läßt sich so erklären, warum überhaupt manche kindliche Neuerungen von den Erwachsenen und anderen Kindern geduldet oder sogar übernommen werden, denn akzeptiert wird auf die Dauer von einer Sprachgemeinschaft wohl nur, was sich für alle beim täglichen Sprechen und Hören in irgendeiner Beziehung vorteilhaft auswirkt, ohne in einer anderen zu viele Nachteile einzubringen. So besteht z.B. die vielbesprochene Simplifizierung in allen ihren Varianten (Regelgeneralisierung, -umordnung, -Verlust) eigentlich in einer Reduktion der Allomorphe eines Morphems, so daß für ein und denselben Inhalt möglichst auch nur ein und derselbe Ausdruck übrigbleibt. Wir hatten schon oben (S. 15) dafür argumentiert, daß diese Veränderung dem allgemeinen Bedürfnis nach analogem Handeln entspringt, und wir werden im vierten Kapitel sehen, in welcher Weise dieses Bedürfnis auch in der Performanz erwachsener Sprecher vorhanden ist. Hier liegt auch die Antwort auf eine Frage nach einem 'Universale 1 der generativen Sprachwandeltheorie: Warum kann man viele Sprachveränderungen als Regelveränderungen einer generativen Grammatik beschreiben, die bewirken, daß weniger Symbole für die Ableitung der Oberflächen-
36 form eines Wortes benötigt werden? - Weil dies eine Notation ist, die es ermöglicht, die Abnahme an Allomorphen in einer Sprache darzustellen, und weil es einem Bedürfnis der Sprecher und Hörer und Lernenden entspricht, möglichst wenig unregelmäßige Formen zu benutzen und zu lernen. Nicht aber, weil Kinder Ableitungen mit möglichst wenigen Symbolen konstruieren wollen bzw. aus genetischen Gründen geradezu müssen.
Was die Bedürfnisse betrifft, so beruht die besondere Rolle des Spracherverbs für den Sprachwandel also nicht auf einem qualitativen, sondern auf einem graduellen Unterschied zwischen erwachsenen Sprechern und Kindern, sowie auf der größeren Leichtigkeit, mit der Kinder ihre Bedürfnisse z.B. nach Systematizität des Lernstoffes befriedigen, indem sie Analogien bilden und tatsächlich kämmte statt kam sagen (obwohl sie die richtige Form ursprünglich schon beherrscht hatten), während einem Erwachsenen normalerweise sein normatives Wissen diesen Fehler verbietet. Einen besonders starken Einfluß auf den Sprachwandel übt der Zweitspracherwerb durch Erwachsene aus. Während Kinder dank ihrer besonderen Lernfähigkeit i.a. doch ungefähr dasselbe Sprachsystem erwerben wie ihre Eltern, gelingt dies erwachsenen Sprechern beim Zweitspracherwerb selten oder nie. Das liegt einerseits sicher daran, daß die Lernfähigkeit des Erwachsenen allgemein nachläßt, andererseits wohl auch daran, daß ein prinzipieller Unterschied in der Art des Lemens zwischen Kindern und Erwachsenen besteht. Ein Erwachsener kann eine Sprache nicht mehr so naiv lernen wie ein Kind das Sprechen in einer Sprache, weil ihm sozusagen inner der Vergleich mit seiner Muttersprache "im Weg steht'. Daher vollziehen sich die Veränderungen, die von den Bedürfnissen des Erstspracherwerbs hervorgerufen bzw. unterstützt werden, nur sehr langsam, oft werden sie sogar von entgegengesetzten Bedürfnissen überwogen. Die Veränderungen infolge von Zweitspracherwerb hingegen haben einen viel größeren Umfang und setzen sich schnell und zunächst auf Kosten aller anderen Bedürfnisse durch. (S. auch S. 231 ff. zu den Auswirkungen von Sprachmischung auf den Sprachwandel.) So wird auch erklärlich, daß in kleinen homogenen Sprachgemeinschaften ohne "Störungen" durch Sprachmischung die Grammatik im Laufe der Zeit eher komplizierter als einfacher wird. (S. auch S. 234) Das generative Sprachwandel-Modell kann diese Erscheinung eigentlich nicht erklären, da sie ja solche äußeren Fakten wie Sprachmischung prinzipiell nicht heranzieht. Warum sollten aber die Kinder in kleinen homogenen Sprachgemeinschaften ihre generative Grammatik weniger vereinfachen als in großen heterogenen Sprachgemeinschaften, wenn sie doch alle dieselben angeborenen Bewertungskriterien für die Einfachheit von Grammatiken mitbringen?
37
Ein weiterer wichtiger Unterschied zwischen Sprachwandel durch Erstspracherwerb und Sprachbenutzung einerseits und Sprachwandel durch Sprachmischung andererseits ist auch die Ausbreitungsmöglichkeit der Neuerungen. Kinder, die ihre Muttersprache lernen, wachsen ja in eine Gemeinschaft von Sprachbenutzern hinein, die die Sprache beherrschen und höchstens solche Neuerungen übernehmen bzw. 'durchgehen lassen1, die ihnen für ihre eigene Sprachbenutzung irgendwie günstig erscheinen. Alle anderen Neuerungen werden sie als 'Fehler' solange korrigieren, bis auch die Kinder sie nicht mehr benutzen. Die Sprache kann sich auf diese Weise ja gar nicht besonders schnell wandeln. Bei Sprachmischung könnt es dagegen häufig vor, daß Kinder von ihren Eltern eine Sprache lernen, die diese ihrerseits als Erwachsene gelernt haben. Da die Eltern diese Zweitsprache selbst höchstwahrscheinlich nicht 'perfekt', sondern mit den für Zweitspracherwerb charakteristischen Systemvereinfachungen gelernt haben, verbreiten diese Neuerungen sich natürlich schnell durch Übernahme in die nächste Generation. 6.3. Finalismus/Funktionalismus versus Kausalismus/Formalismus in der neueren Literatur Indem wir die Erklärung des Sprachwandels in der Befriedigung von Bedürfnissen der Sprachbenutzer suchen, schlagen wir uns zur Gruppe der 'Finalisten1 bzw. 'Funktionalisten', deren Frage lautet 'Wozu ändern Sprachbenutzer ihre Sprache?1 im Gegensatz zu den 'Kausalisten' bzw. 'Formalisten1 , die fragen 'Warum, d.h. gezwungen durch welche Gesetze der Sprachentwicklung oder durch welche angeborenen Universalien, ändern SprecherHörer bzw. Lernende ihre Sprache?' Inwieweit die finale Fragestellung der Wissenschaft vom Menschen besser angemessen ist als die (im Grunde naturwissenschaftliche) kausale, erörtert Coseriu (1958; 1974: 2O2 ff. und passim).
Daß inzwischen in der historischen Linguistik eine Rückkehr von der formal-kausalen zur funktional-finalen Erklärung bzw. von der bloßen Beschreibung, bei der King (1969) schließlich angelangt war (s.o. S. 31 f . ) , zur eigentlichen Erklärung stattgefunden hat, zeigt bereits ein kurzer Blick in die Akten von zwei Kongressen über historische Linguistik von 1973: Anderson; Jones (1974) und Dahlstedt (1975). Aus nahezu allen Beiträgen geht eine Tendenz zur Abwendung von rein formalen Erklärungen hervor, besonders
38
bemerkenswert aber ist die verhältnismäßig große Zahl von Arbeiten, die ganz explizit die Auseinandersetzung zwischen formalen und funktionalen Erklärungen zum Thema haben, teils mit dem Schwergewicht auf der Kritik am Formalismus, teils auf einer Wiederbelebung des Funktionalismus. Die schärfste Kritik enthalten die beiden bereits zitierten Beiträge von Anttila (1974 und 1975a), wobei 'Was there a generative historical linguistics?1 (1975) besonders interessant für die Beurteilung der veränderten Lage ist, da er als wissenschaftsgeschichtlicher Beitrag gerade die erwähnte Tendenzwende selbst zum Thema hat. Um eine Abgrenzung der beiden Erklärungstypen und ihre Anwendung auf den Begriff der 'Einfachheit' geht es Koefoed (1974) und um den Begriff der 'Erklärung' in der historischen Linguistik selbst Jeffers (1974), der (übrigens auch darin eine starke neue Tendenz repräsentierend) auf den Erklärungswert der Analogie zurückkönnt. Explizit funktionalistisch ausgerichtet sind Baron (1974) und Vachek (1974), und in seiner wichtigen 'Typologie des Sprachwandels1 stellt Anderson (1974) mit starker Berufung auf Jakobson neben der Klasse von systembedingten "evolutiven" Neuerungen eine eigene Klasse von "adaptiven Neuerungen" auf, die aus den kommunikativen Bedürfnissen der Sprecher entstehen. Am bezeichnendsten für die 'Tendenzwende' sind jedoch sicherlich die Beiträge von King (1975) und Kiparsky (1974), zweien der wichtigsten Vertreter der generativen Sprachwandeltheorie, selbst. Beide entfernen sich erstaunlich weit vom generativen Msdell, und zwar vor allem von seiner Monokausalität in Richtung auf die Einbeziehung einer Vielfalt von (insbesondere performanzbedingten) Ursachen. "It would seem that both in the social sciences and in fields like biology it is normal to find an interplay of seperate factors which may in particular cases conflict with each other, in others reinforce each other, and still others be independent of each other. In our case, these factors are the acquisition, perception, and production of language. The structure and development of language is guided by the requirements of 'learnability', 'perceptibility 1 and 'productibility', each of these factors being complex and operating at several levels of structure." (Kiparsky 1974: 263 f . )
Damit greift Kiparsky die Hauptaussage von Bever; Langendoen (1972) auf, nämlich daß "linguistic evolution is a joint function of the various systems for the use of language." Zwar ist dieser Gedanke nicht neu (im Grunde ist er z.B. ganz im Sinne von Paul), aber es war das Verdienst von Bever;
39
Langendoen, ihn auch innerhalb der generativen Schule wieder 'populär' gemacht zu haben. 7. Einige offengebliebene Fragen und ihre Antworten Wir hatten die generative Erklärung des Sprachwandels abgelehnt, weil sie ausschließlich auf der generativen Vorstellung von der Kompetenz beruht, die wir nicht teilen können. In diesem Kcmpetenzbegriff ist weder Platz für die spezifischen Fälligkeiten, eine Sprache zu sprechen und zu verstehen (die doch in Wirklichkeit die Kompetenz ausmachen), noch für die Anpassung dieser Tätigkeiten an die jeweilige historische Situation. Stattdessen ist die Kompetenz einfach gleichgesetzt mit einer generativen Grammatik - also einer bestimmten Beschreibung eines abstrakten Gegenstandes, deren psychische Realität wir aus den verschiedenen genannten Gründen nicht annehmen können. Wir wollen nun kurz eine Reihe weiterer Argumente erörtern, die gegen das generative Sprachwandel-Modell angeführt werden können oder angeführt worden sind, und zeigen, wie die darin aufgeworfenen Fragen aus unserer Sicht zu beantworten wären. 7.1. Woher kommen die Innovationen? Auf die Unfähigkeit des generativen Modells, die Innovationen der Erwachsenen zu begründen, haben wir schon hingewiesen (S. 11). In unserem Verständnis sind Innovationen natürlich Auswirkungen von Performanzbedürfnissen, die im generativen Sprachwandel-Modell einfach nicht berücksichtigt werden. Assimilationen z.B., das 'Standardbeispiel' für Innovationen, entstehen durch das Bedürfnis nach leicht artikulierbaren Phonemfolgen. 7.2. Die Rolle der Performanzbedingungen Die Gleichsetzung von 'Kompetenz1 mit 'generativer Grammatik1 statt mit den Fähigkeiten, eine Sprache zu sprechen und zu verstehen, hat im generativen Sprachwandel-Modell dazu geführt, daß alle Bedingungen, denen die Performanz unterliegt, ohne Unterschied als zufällig und irrelevant für die Erkenntnis des Wesentlichen, nämlich der Kompetenz und ihres Wandels, abgetan werden. Dies kommt in der berühmt gewordenen Formulierung Chomskys zum Ausdruck:
40
"Der Gegenstand einer Linguistischen Theorie ist in erster Linie ein idealer Sprecher-Hörer, der ( . . . ) bei der Anwendung seiner Sprachkenntnis in der aktuellen Rede von solchen grammatisch irrelevanten Bedingungen wie - begrenztes Gedächtnis - Zerstreutheit und Verwirrung - Verschiebung in der Aufmerksamkeit und im Interesse - Fehler (zufällige oder typische) nicht affiziert wird." (Chomsky 1965; 1969: 13)
Was hier in einem Atemzug genannt wird, sind jedoch Performanzbedingungen ganz unterschiedlichen Ranges: Die einen, die man 'die prinzipiellen1 nennen könnte, sind immer bei allen Sprechern vorhanden. Es handelt sich um die natürlichen durchschnittlichen Grenzen der psychischen und physischen Fähigkeiten, die zur Performanz benötigt werden. Hierher gehören die Begrenztheit des Gedächtnisses, des akustischen Unterscheidungsvermögens, der Artikulationsgeschwindigkeit usw. Der andere Typ von Bedingungen - man könnte von 'zufälligen' sprechen - verdient eher den Namen 'Störungen '. Dies sind solche zufälligen und vorübergehenden Beschränkungen der Performanz einzelner Sprecher, wie sie durch Zerstreutheit, Trunkenheit, Lärm usw. entstehen. De facto machen natürlich auch Generativisten diesen Unterschied, sobald sie nämlich selbst Performanzmodelle entwerfen. So handelt Miller; Chomsky (1963) fast ausschließlich von der Begrenzung des Gedächtnisses und nicht etwa von der Trunkenheit der Sprecher-Hörer. In der Tat muß jedes Performanzmodell idealisieren insofern, als es nur die prinzipiellen Beschränkungen erfaßt. Eine Beschreibung, die tatsächlich alle Performanzbedingungen erfaßt, könnte streng genommen jeweils nur für die eine beschriebene Äußerung gelten, ihr würde die verallgemeinernde Kraft des Modells fehlen.
Die Gleichsetzung von beiden Typen von Bedingungen als 'irrelevant' verstellt den Weg zu einer Erklärung des Sprachwandels deshalb, weil in Wirklichkeit nur die zufälligen keinen (oder nur einen sehr unspezifischen oder im Einzelfall schwer feststellbaren) Einfluß auf die Sprachveränderungen haben, während die prinzipiellen von großer Bedeutung sind. So wäre es in der Tat lächerlich, anzunehmen, daß eine Sprache sich wandelt, weil einzelne ihrer Benutzer gelegentlich betrunken sind und dann die Phoneme nicht mehr unterscheiden können. Wenn jedoch aus irgendeinem Grunde das Phonemsystem einer Sprache so beschaffen ist, daß die Hörer ständig gezwungen sind, überdurchschnittlich weit an die Grenze ihres Differenzierungsvennögens für akustische Signale zu gehen (z.B. weil es zuviele hintere
41
Vokale enthält), so ist dieser Zustand durchaus ein 'Nährboden' für einen potentiellen phonologischen Wandel. (Für Beispiele s. Martinet 1955) Auch die zufälligen Beschränkungen (die echten 'Störungen') der Perforroanz sind nicht ganz ohne Einfluß auf die Sprachstruktur und ihre Möglichkeiten, sich zu ändern, da sie in ihrer Gesamtheit verantwortlich sind für den 'Sicherheitsabstand' zu den von den prinzipiellen Bedingungen gesetzten Grenzen, den die Sprachbenutzer normalerweise einhalten, um auch bei gestörter Kommunikation noch verstanden zu werden. In der Sprachstruktur erscheint dieser 'Sicherheitsabstand1 als Redundanz. So sind nicht alle theoretisch möglichen produzierbaren Kombinationen von distiktiven Merkmalen tatsächlich im System als Phonem enthalten; nicht alle theoretisch produzierbaren Phonemkombinationen innerhalb einer Silbe sind von den phonotaktischen Regeln zugelassen; nicht alle von den phonotaktischen Regeln erlaubten Sequenzen bilden tatsächlich ein Morph usw., von den Regeln, die sogar doppelten Ausdruck desselben Inhalts (z.B. Subjektpronomen und Personalendung am Verb) vorschreiben, ganz zu schweigen.
Während normalerweise die 'Störungen' keine einzelne Sprachveränderung erklären, da nur ihre Gesamtheit die allgemeine Tatsache zur Folge hat, daß Sprachen redundant sind und auch unter Veränderung redundant bleiben, ist es jedoch nicht ausgeschlossen, in einzelnen Fällen sogar eine Beziehung zwischen einem bestimmten Typ von Störungen und einer bestimmten Sprachveränderung aufzustellen, nämlich immer dann, wenn aus äußeren Gründen in einer Sprachgemeinschaft zu einem bestimmten Zeitpunkt dieser besondere Störungstyp besonders häufig auftritt. Ein kleines Beispiel ist etwa das Deutsch, das im Fernmeldewesen gesprochen wird mit Ausdrücken wie zwo (statt zwei) , fünnef (statt fünf), Juno, Julei, (statt Juni, Juli) und dem Buchstabieralphabet, die alle nur geschaffen bzw. künstlich in den Kode aufgenommen wurden, um trotz der akustischen Störungen die Verständlichkeit zu gewährleisten. Freilich lassen sich bei natürlich gewachsenen Sprachen solche Einflüsse bestiitmter Störungstypen nicht so klar nachweisen, aber iitinerhin sind solche Erklärungsversuche nicht prinzipiell zurückzuweisen. Coseriu (1958; 1974: 62) unterscheidet ebenfalls zwischen verschiedenen Typen von Performanzbeschränkungen, allerdings nur mit Bezug auf die Artikulation des Sprechers: "Unter diesen letzteren [den psycho-physischen Bestimmungen der lautlichen Realisierung] treten manche nur gelegentlich auf (z.B. die einfache Müdigkeit oder die Erregung des Sprechers), andere sind dauernd
42 in einem Sprecher und andere wieder dauernd in allen Sprechern da." Wir möchten hinzufügen: Manche sind zu einem bestimmten Zeitpunkt in einer bestimmten Sprachgemeinschaft besonders häufig da, und im übrigen auch die Bedingungen einbeziehen, denen andere Ebenen der Performanz, insbesondere Satzplanung und Hören, unterliegen.
7.3. Beziehungen zwischen (scheinbar) isolierten Sprachveränderungen Verschiedentlich wurde bemerkt, daß das generative Sprachwandel-Modell keine Möglichkeit bietet, Beziehungen zwischen scheinbar isolierten Sprachveränderungen auszudrücken, deren gemeinsame Betrachtung aber gerade erst zu einer Erklärung herausfordert bzw. führt. So geht es Lakoff (1972) darum, daß viele scheinbar isolierte Veränderungen in mehreren indogermanischen Sprachen offenbar das gleiche 'Ziel1 haben. Sie führten alle von einem vorwiegend flektierenden zu einem mehr isolierenden Ausdrucksverfahren. Darüber hinaus haben anscheinend mehrere indogermanische Sprachgruppen unabhängig voneinander dieses selbe 'Ziel1 verfolgt. Ein solches Zusammentreffen mehrer einzelsprachlicher 'Ziele' ist in der traditionellen Literatur zu diesem Thema oft als 'Konvergenz' bezeichnet worden. (So z.B. von Meillet 1918) Wir werden uns diesem Sprachgebrauch anschließen. Bever; Langendoen (1972) zeigen am Beispiel der Abhängigkeitsbeziehung zwischen Verfall der NGminalflexion und gewissen Restriktionen bei der Bildung von Nebensätzen, daß bestimmte Abhängigkeiten zwischen Sprachveränderungen im generativen Msdell nicht adäquat dargestellt werden können, obwohl gerade sie den Schlüssel zur Erklärung liefern, da die eine Veränderung als eine Reaktion auf die andere interpretiert werden kann. Auf eine ganze Reihe solcher Abhängigkeitsverhältnisse, die aus der traditionellen Literatur ja bereits bekannt sind, weist Werner (1973) hin. In allen diesen Fällen kann die Beziehung zwischen den Veränderungen durch die Abhängigkeit der Performanzbedürfnisse voneinander erklärt werden. So werden wir im fünften Kapitel zeigen, wie Veränderungen in einem Teil des Systems Veränderungen in einem anderen Teil nach sich ziehen, sei es, weil sie zu einer übermäßigen Belastung eines Performanzbedürfnisses auf Kosten eines anderen geführt haben, sei es, weil durch das Bedürfnis nach Analogie das Ergebnis einer Veränderung im System verbreitet wird. So lassen sich sprachliche 'Ziele' meist auf das Bedürfnis nach analogem Handeln zurückführen. Die fraglichen Konvergenzen schließlich entstehen
43
dadurch, daß die Sprecher ähnlicher Sprachen in ähnlichen historischen Situationen eben auch ähnlich reagiert haben. 7.4. Der idealisierte 'native speaker1 Die Rückkehr zu der Auffassung von Sprache als einem aus den kommunikativen Kompetenzen von Sprecher-Hörern einer Sprachgemeinschaft abstrahierten Gegenstand umgeht auch das Problem des 'idealen native speaker1, dessentwegen die generative Theorie im Sinne Chomskys und in der Folge natürlich auch das generative Sprachwandel-Modell wiederholt angegriffen wurden. Die generative Theorie postuliert die psychische Realität von Gramnatiken, verlegt diese Realität aber in einen völlig idealisierten, d.h. nicht konkret existierenden Gegenstand, nämlich "den idealen SprecherHörer in einer völlig homogenen Sprachgemeinschaft", so daß die angeblich empirische Hypothese nicht nachprüfbar bzw. falsifizierbar und damit keine empirische Hypothese mehr ist, wie Derwing und, mit Bezug auf Kangiesser, Andresen bemerken. Da das generative Sprachwandel-Modell aber gerade auf der Richtigkeit dieser Hypothese fußt, ist es mit ihr gegenstandslos. Wir haben dieses Argument nicht in den Hauptteil unserer Kritik an der Hypothese der psychischen Realität generativer Grammatiken aufgenommen, da es zwar überzeugend zeigt, daß diese Annahme als empirische Hypothese (und damit im Selbstverständnis der generativen Theorie) unhaltbar ist, wir jedoch bezweifeln, daß das Vorgehen der empirischen Naturwissenschaften in den Humanwissenschaften überhaupt angebracht ist. Mit anderen Worten: Eine Hypothese, die naturwissenschaftlich-empirisch gegenstandslos ist, muß nicht allein deswegen schon in den Humanwissenschaften sinnlos sein.
44
8. Überblick über die folgenden Kapitel Wir wollen nun im folgenden einige Performanzbedürfnisse und ihre gegenseitigen Abhängigkeiten vorstellen. Dazu benutzen wir als Beispielkomplex den Wandel der Ausdrucksverfahren für grammatische Kategorien in der Geschichte des Deutschen mit Parallelbeispielen aus dem Englischen, einigen romanischen Sprachen und dem Russischen. Wir werden im zweiten und dritten Kapitel vier Typen von morphosyntaktischen Ausdrucksverfahren und einen kurzen Überblick über die Realisierung dieser Typen in der Geschichte unserer Beispielsprachen geben. Im vierten Kapitel werden wir zeigen, wie sich die Vor- und Nachteile jedes Verfahrens für die Performanz von Sprecher und Hörer und für den Spracherwerb annähernd die Waage halten. Im fünften Kapitel erarbeiten wir zunächst ein Mxlell der wichtigsten Performanzbedürfnisse und ihrer gegenseitigen Abhängigkeiten. Darin erscheinen außer denjenigen, die wir im vierten Kapitel kennenlernen, noch weitere, die sich am Beispiel der morphosyntaktischen Ausdrucksverfahren nicht so gut demonstrieren lassen, da sie in den Bereich der Phonologie gehören. Den Abschluß bilden Überlegungen zu der Frage, wie die Sprachbenutzer die Beziehungen zwischen den Performanzbedürfnissen ausnutzen können, um ökonomisch zu handeln, d.h. eine in Abhängigkeit von der jeweiligen historischen Situation optimale Verteilung der Gesamtbelastung auf die verschiedenen Bedürfnisse zu finden.
45
Zweites Kapitel ZUM WANDEL DER AUSDRUCKSVERFAHREN FÜR GRAMMATISCHE KATEGORIEN
1. Zur Typologie 1.1. 'Typologie der rnorphosyntaktischen Ausdrucksverfahren1 versus 'Typologie der Sprachen1 "Les langues qui sont parlees aujourd-hui et qui ont ete parlees jadis chez les differens peuples de notre globe, se divisent en trois classes: les langues sans aucune structure grammaticale, les langues qui eraploient des affixes, et les langues ä inflexions." (A.W.v. Schlegel 1818; 1971: 14)
Mit dieser Dreiteilung, die auf eine ältere Zweiteilung bei Smith (1759) und K.W.F.v.Schlegel (18O8) zurückgeht, legte A.W.v.Schlegel den Grundstein zu einer morphologischen Sprachtypologie, die, mit verschiedenen Veränderungen und Erweiterungen versehen, noch heute als Diskussionsgrundlage dient. Ihm selbst war dabei vielleicht nicht ganz bewußt, daß in seiner Aussage eigentlich zwei Typologien, verstanden als Klassifikationsschemata, enthalten sind: Erstens eine Klassifikation von Wörtern nach ihrer morphologischen Struktur, die eben flektierend, affixierend oder überhaupt nicht vorhanden sein kann. Die Einschränkung des Blickwinkels auf das Wort als grammatische Einheit führt zu der für uns heute überraschenden Aussage, es gebe Sprachen "ohne grammatische Struktur". Es war das Verdienst W.V.Humboldts, von einer Klassifikation von Wörtern überzugehen zu einer Klassifikation möglicher sprachlicher Ausdrücke nach dem Kriterium der morphosyntaktischen Verfahren, nach denen sie gebildet werden. In diesem Sinne ist die Repräsentation jeweils einer als ungegliedert angesehenen Inhaltseinheit durch ein in sich ungegliedertes Wort oder sogar nur durch eine feste Stellungsregel für andere Wörter im Satz ebenso ein Verfahren zum Ausdruck von Inhalten wie Affigierung (bei Humboldt Agglutination) und Flexion, die sich innerhalb des Wortes abspielen. Er nannte dieses Verfahren das isolierende, und als solches ist es in die Geschichte der Sprachwissenschaft bis heute eingegangen.
46
Die zweite Klassifikation, die A.W.v.Schlegel und viele seiner Nachfolger vornahmen, ist eine Klassifikation der Sprachen nach dem Kriterium der aus der ersten Klassifikation erhaltenen Klassen. Wenn wir in dieser Arbeit auf W.v.Humboldts Typologie zurückgreifen, so müssen vor betonen, daß wir sie wie er lediglich als grobes Klassifikationsschema für morphosyntaktische Ausdrucksverfahren für grammatische Kategorien verwenden, nicht etwa zur Klassifikation ganzer Sprachen. Wir fragen also z.B.: 'Nach welchem Verfahren ist der Numerus in dt. Brüder ausgedrückt?1 und nicht etwa: 'Ist das Deutsche eine flektierende Sprache?' Die zweite Fragestellung ist natürlich viel anspruchsvoller als die unsere und wirft erhebliche und vieldiskutierte Probleme auf, insbesondere, wenn man ein Klassifikationsschema von universeller Gültigkeit anstrebt. S. dazu den in seiner Art imponierenden Versuch einer Universalklassifikation von Sapir (1921; 1961: 133), den historischen Überblick über die Klassifikationsversuche von F. Schlegel bis A. Martinet bei Hörne (1966) und die theoretische Erörterung von Greenberg (1974).
An granrnatischen Kategorien werden wir den Kernbereich der traditionellen "Formenlehre" untersuchen, also Kasus/ Genus, Numerus, Person, Tempus, Modus, Verbalgenus, Aspekt (sofern er nicht durch Wortbildung ausgedrückt wird). Im Zentrum wird für uns das Deutsche und seine Vorgeschichte stehen, zum Vergleich werden wir jedoch auch das Englische als zweite germanische Sprache, das Französische, Spanische und Italienische als romanische Sprachen und das Russische als Beispiel einer slawischen Sprache heranziehen. Wir brauchen also keine Verfahren zu berücksichtigen, die in diesen Sprachen nicht angewendet werden, wie z.B. das sog. "inkorporierende", das zuerst W.v.Humboldt bei gewissen Indianersprachen beschrieben hat. Aber selbst bei dieser Beschränkung werden wir feststellen, daß die 'klassische Dreiteilung1 zwar ein brauchbarer Ausgangspunkt ist, aber doch nicht ausreicht, um allein den grammatischen Formenbestand des Deutschen zu erfassen. Wir müssen noch mindestens ein viertes Verfahren hinzunehmen, ^ag sogar sehr häufig vertreten ist. Aus dem Thema der ganzen Arbeit geht schon hervor, daß die Aufstellung einer Typologie der morphosyntaktischen Ausdrucksverfahren nicht selbst unser Ziel ist. Wir benötigen sie nur als Terminologie, um bestimmte Sprachveränderungen zu beschreiben, die gerade in der Ersetzung eines Ver-
47
fahrens durch ein anderes bestehen. Für solche Veränderungen wollen wir eine allgemeine Erklärung (in dem im ersten Kapitel erläuterten Sinne) versuchen, indem vor systematisch die Vor- und Nachteile der verschiedenen Ausdrucksverfahren und deren gegenseitige Abhängigkeiten für Sprecher und Hörer aufzeigen. Bevor wir uns jedoch an die so umrissene Aufgabe machen, sollten wir angesichts der verschiedenen Definitionen, die die morphosyntaktischen Verfahren seit dem Beginn ihrer Typologisierung erfahren haben, festlegen, welche Abgrenzungen wir für unsere Zwecke annehmen wollen. 1.2. Definition der morphosyntaktischen Ausdrucksverfahren 1.2.1. Definition der linguistischen Einheit 'Wort1 - Analytische und synthetische Verfahren Die Definition der 'klassischen1 morphologischen Typen beruhen alle auf einem Vorverständnis der linguistischen Einheit 'Wort', das wir für unsere Zwecke folgendermaßen definieren: Ein Wort ist eine Folge von Morphen, die zwei Bedingungen erfüllt: Die ttorphe dürfen sich erstens nicht ohne Bedeutungsveränderung permutieren und zweitens nicht durch den Einschub anderer Morphe (außer einem begrenzten Inventar von sogenannten Infixen) trennen lassen. So besteht z.B. der Ausdruck die Verwandtschaft aus zwei Wörtern, weil man zwischen die und Verwandtschaft Adjektive oder ganze Partizipialkonstruktionen einschieben kann, z.B. die große/ auf ihr Recht pochende Verwandtschaft. Verwandtschaft allein dagegen ist ein Wort, weil es beide Bedingungen erfüllt: Man kann die Morphe nicht permutieren, also nicht etwa wandtverschaft o.a. bilden, und es lassen sich keine anderen Morphe einschieben, also nicht etwa ver-groß-wandtschaft o.a.
Außer durch diese beiden Kriterien kann das Wort noch durch phonologische Merkmale gekennzeichnet sein wie Wartakzent, Vokalharmonie, Pausen usw. Orthographisch schließlich wird das Wort gewöhnlich, beruhend auf der Intuition der Schreiber, durch Abstände gekennzeichnet. Alle diese Eigenschaften sind jedoch sekundär und nicht so zuverlässig wie die genannten distributionellen Kriterien. (Eine detaillierte Diskussion s. z.B. in Lyons 1968; 1971: 2O2 f f . ) Eine erste grobe Klassifikation der verschiedenen Verfahren läßt sich nun nach dem Kriterium durchführen, ob zum Ausdruck der gramnatischen Kate-
48
gorien eigene Wörter verwendet werden oder nicht. Die Verfahren mit eigenen (sog. grammatischen) Wörtern nennen wir die analytischen, diejenigen ohne ' grammatische Wörter1 die synthetischen. In -loh habe gesungen und frz. donner ä quelqu'un wären also 'Prät.1 bzw. 'Dat.1 analytisch ausgedrückt, in -ich sang bzw. lat. dare al-icui synthetisch. Die Ausdrücke "analytisch 1 und 'synthetisch 1 benutzt bereits A . W . v . Schlegel (1818; 1971: 16) in unserem Sinne. Daß er die analytischen Sprachen jedoch wiederum als Untergruppe der flektierenden bezeichnet, ist darauf zurückzuführen, daß er ganze Sprachen klassifizieren wollte und dabei auf den Widerspruch stieß, daß die germanischen und romanischen Sprachen, die er ja als ganze zum flektierenden Sprachtyp rechnet, doch analytische Verfahren benutzen. Unsere Beschränkung auf eine Typologie der Ausdrucksverfahren umgeht diese Schwierigkeit.
Beide Verfahren lassen sich jedoch weiter untergliedern: das synthetische in das flektierende und das agglutinierende, das analytische in das isolierende und, wie wir sehen werden, das kombinierende. Betrachten wir zunächst die 'klassischen1 Verfahren: Isolation, Agglutination und Flexion. 1.2.2. Das isolierende Verfahren Beim isolierenden Verfahren ist jedes Wort ein eigenes Morph und entspricht genau einem Morphem. Damit ist ausgeschlossen, daß ein Wort mehrere Morpheme gleichzeitig vertritt. So kann man z.B. den engl. bestimmten Artikel the als eine nach dem isolierenden Verfahren gebildete Form betrachten, weil er nur das eine Morphem {'def.'} vertritt. Eine entsprechende dt. Form wie der dagegen ist nicht nach dem isolierenden Verfahren gebildet, weil sie außer {'def.'} noch {'Mask.'}, {'Sg.'}, {'Nom.'} oder ein anderes Morphembündel aus der Flexion des bestimmten Artikels vertritt. Graphisch ließe sich das Verhältnis von Morphemen zu Wörtern etwa so darstellen:
Morpheme
Morphe = Wörter Figur I
49 Unberührt davon ist natürlich die Möglichkeit, daß ein Morph das eine oder das andere Morphem vertreten kann, also Homonymie der Morphe. So kann z.B. das engl. Morph will entweder für das grammatische Morphem { ' F u t . ' } oder für das lexikalische Morphem {'WILL'} stehen. (Die Abgrenzung solcher isolierender Konstruktionen mit mehrdeutigen Elementen von kombinierenden Konstruktionen wird uns im folgenden noch beschäftigen.)
Soweit die relationalen syntaktischen Kategorien, wie z.B. 'Subj. 1 , 'dir. Obj.', 'Attr.' usw., betroffen sind, lassen sich zwei Untertypen des isolierenden Verfahrens unterscheiden, die wir hier als explizit bzw. implizit isolierend bezeichnen wollen. Beim explizit isolierenden Verfahren werden die relationalen Kategorien durch eigene Worter ausgedrückt, beim implizit isolierenden, in den sogenannten Wörtfolgesprachen, durch die Reihenfolge der eigentlich bedeutungstragenden Wörter im Satz. Graphisch: explizit isolierend:
A
c
B
c1
A1
Morpheme
Wörter
Figur II Das relationale Morphem B ist durch ein eigenes Wort B' ausgedrückt, implizit isolierend: A
A'
|
C
Reihenfolge A 1 , C1
C1
1
B
= nicht relational
(_ Figur III
Morpheme
Wörter
J = relational
50
Das relationale Morphem B ist durch die Reihenfolge der Wörter A' und C ausgedrückt, die ihrerseits die nicht-relationalen Morpheme A und B vertreten. Dieser Unterschied wird unseres Wissens in der Literatur wenig deutlich gemacht. Dies ist vermutlich darauf zurückzuführen, daß das Chinesische, von jeher als Prototyp einer isolierenden Sprache betrachtet, eine fast reine Wortfolgesprache darstellt und daher der isolierende Typ mit der Wortfolgesprache identifiziert wurde. Der Unterschied zwischen dem explizit und dem implizit isolierenden Verfahren hat jedoch wichtige Konsequenzen für die Performanz von Sprecher und Hörer, auf die wir noch zurückkommen werden. 1
Der Unterschied wird deutlich am Ausdruck für die verschiedenen Objekte in mehreren romanischen Sprachen und dem Englischen. Hier wird die Konstituentenfolge bekanntlich zum Ausdruck der Funktion einer Nctninalphrase als Subjekt bzw. direktes Objekt benutzt, während die Funktion als indirektes und präpositionales Objekt durch Präpositionen ausgedrückt wird, z.B. (1) (V)
engl.: Paul introduces Peter to Mary. frz.: Paul presente Pierre a Marie.
( l 1 1 ) it.: Paolo presenta Pietro a Maria. 'Paul stellt Peter Maria vor1.
Jedoch gibt es auch die Fälle, daß das direkte Objekt durch eine Präposition bzw. umgekehrt auch das indirekte durch Wortstellung gekennzeichnet werden, so z.B.: (2) sp.: Carlos ve a Martin. 'Karl sieht Martin1. (3) engl.: Bill lends Tom his book. 'Bill leiht Tom sein Buch1. Der Gebrauch von Präpositionen zum Ausdruck von Objektbeziehungen wird in der traditionellen Literatur zwar gewöhnlich erwähnt, jedoch nur als analytisches Verfahren als Alternative zum synthetischen (Ausdruck der Relation durch Kasusendungen). Uns kommt es hier darauf an, zu zeigen, daß Präpositionen auch eine Alternative zu einem anderen analytischen Verfahren, nämlich der festen Konstituentenfolge, darstellen.
Das implizit isolierende Verfahren wird oft als 'feste Wortfolge' bezeichnet. Dieser Ausdruck ist jedoch eigentlich irreführend, denn bei diesem Verfahren ist ja gerade nicht die Folge der Wörter fest, sondern die Folge der Konstituenten in einer bestimmten syntaktischen Funktion. Im Gegenteil: Soll die Funktion der Wörter im Satz allein durch ihre Stellung relativ zueinander ausgedrückt werden, so müssen sie vertauschbar sein.
51
So ist z.B. im frz. Satz die Reihenfolge von Subjekt und Objekt festgelegt, nicht aber die Reihenfolge der Nominalphrasen, die entweder als Subjekt oder Objekt fungieren können wie z.B. 1e fits und le pere. Gerade weil diese vertauscht werden können, ist es ja möglich, ihre Funktion als Subjekt oder als Objekt im Satz nur durch ihre Reihenfolge auszudrücken: Subjekt
Objekt
Le fils voit le pere.
'Der Sohn sieht den Vater.1
Le pere voit le fils.
'Der Vater sieht den Sohn.'
Wir wollen daher statt von 'fester Wortfolge1 von 'fester Konstituentenfolge1 sprechen und dabei 'Konstituenten in einer bestimmten grammatischen Funktion1 verstehen, also etwa 'Subjekt' oder Objekt', nicht aber einfach 'Nominalphrase'. Als 'implizit isolierendes Verfahren' bezeichnen wir nur die feste Konstituentenfolge mit freier Wortfolge, also die Fälle, in denen die Funktion der Wörter im Satz allein durch ihre Reihenfolge ausgedrückt wird. Davon zu trennen ist die feste Konstituentenfolge mit gleichzeitiger fester Wortfolge. In diesem Fall zeigt die Reihenfolge der Wörter im Satz nicht allein ihre syntaktische Funktion an, sondern sie ist nur ein redundanter Zusatz zu anderen Mitteln (Flexivik, Wortartzugehörigkeit, eigene Funktionswörter). So sind z.B. im Deutschen das Substantiv einerseits und alle Wörter, die als einfaches Attribut eines Substantivs dienen können (Adjektiv, Pronomen, Partizip, Artikel, Zahlwörter) andererseits,unterschieden durch Flexion und/oder Markierung der unterschiedlichen Wortartzugehörigkeit. (Ein Sprecher des Deutschen weiß, daß der, die, das keine Substantive, Baum, Tür, Haus keine Artikel oder Adjektive sein können.) Hinzu kommt die redundante Festlegung der Konstituentenfolge, die gleichzeitig eine Festlegung der Wortfolge sein muß, da die Wörter ja bereits nach ihrer Funktion markiert sind. 'Das einfache Attribut steht vor seinem Beziehungswort' bedeutet gleichzeitig: 'das steht vor Haus, grüner steht vor Baum usw., nie umgekehrt'. Die feste Konstituentenfolge wird erst dann relevant, wenn Wortartzugehörigkeit und Flexivik nicht mehr den Unterschied zwischen Substantiv und z.B. attributivem Adjektiv anzeigen. In diesem Augenblick ist die Wortfolge auch wieder frei. So kann man z.B. die Wörter gläubigen und vertriebenen vertauschen und erhält die beiden verschiedenen Äußerungen:
52
Attribut Bezugswort die gläubigen Vertriebenen die vertriebenen Gläubigen. Schließlich gibt es noch die Möglichkeit, daß sowohl Wort- als auch Konstituentenfolge frei sind. In diesem Fall muß natürlich die Funktion der Wörter im Satz ebenfalls anderweitig ausgedrückt werden. Die Konstituentenfolge wird dann meistens zum Ausdruck des Satztyps (Aussage-, Fragesatz usw.) und/oder zur Topikalisierung ausgenutzt. (S. die Beispiele S. 154 f f . ) 1.2.3. Das agglutinierende Verfahren Die Agglutination ist gewissermaßen eine 'Isolierung innerhalb des Wortes'. Erste Bedingung ist auch hier die 1:1-Beziehung zwischen Morphemen und Morphen in der Äußerung, jedoch nicht zwischen Morphen und Wörtern. Vielmehr sind mehrere Morphe zu einem Wort zusammengefaßt. Graphisch:
Morpheme
Morphe Wort Figur IV Da die Agglutination schon von A.W.v.Schlegel als eine Art Zwischending zwischen Isolierung und Flexion konzipiert war, beruhend auf der Intuition, daß agglutinierte Elemente einerseits größere Selbständigkeit genießen als durch Flexion verbundene, andererseits jedoch geringere als isolierte Wörter, bietet hier die Definition die größten Schwierigkeiten, vor allem bei der Abgrenzung zur Flexion. Zwei Möglichkeiten bieten sich an: Erste Möglichkeit: Einziges Kriterium ist die eindeutige Segmentierbarkeit der Wörter in Stattm und einzelne Affixe. Nach dieser Definition wäre z.B. dt. Band-e (des Blutes) nach dem agglutinierenden Verfahren gebildet, (die Pluralendung läßt sich eindeutig abtrennen) aber Bänd-e und Bänd-er nach dem flektierenden, da der Unlaut kein Segment darstellt und erst Um-
53
laut und Endung zusammen das (diskontinuierliche) Pluralmorph bilden. Kann man aber deshalb sagen, daß /- / in Band-e im Bewußtsein der Sprachbenutzer größere Selbständigkeit besitzt als /- / und /-er/ in Bänd-e und Bänd-erl Offenbar hängt es in allen Fällen von Stammorphem ab, welches Allcmorph für das Morphem i'Pl.'} eintritt, ein Abhängigkeitsverhältnis, das zwar noch nicht so eng ist wie bei einer Bündelung von mehreren Morphemen wie in der Flexion, jedoch eng genug, daß man nicht mehr von selbständigen Affixen sprechen kann. Aus diesen Grunde führte Sapir (1921; 1961: 124) als zweites Kriterium zur Abgrenzung des agglutinierenden Verfahrens die Abwesenheit von "undurchsichtigen", nicht phonologisch determinierten Allomorphen ein. Für unsere Zwecke ist es am günstigsten, Sapirs Kriterien zu übernehmen (hierin in Übereinstimmung mit Lyons (1969; 1971: 191 f f . ) , da an den Sprachbenutzer, auf den es uns ja ankommt, eine Vielzahl von Allomorphen ganz ähnliche Anforderungen stellt wie das flektierende Verfahren. Wir werden deshalb alle Fälle von nicht phonologisch determinierter Allomorphik innerhalb des Vfortes zusammen mit der Flexion behandeln und nur dann vom agglutinierenden Verfahren sprechen, wenn beide Kriterien, eindeutige Segmentierbarkeit und Abwesenheit von nicht phonologisch determinierten Allomorphen, erfüllt sind. Das bedeutet natürlich nicht, daß agglutinierte Morphe nicht homonym sein dürften. Hier gilt dasselbe wie beim isolierenden Verfahren (s.S. 49). Wir können nun einige Beispiele für das agglutinierende Verfahren anführen: Sp. [-s] [-es], als die beiden phonologisch bedingten Allomorphe des Pluralmorphems. Sie sind eindeutig abtrennbar und vertreten nur das eine Morphem {'Pl.'}. z.B. lo-s libro-s lo-s lapic-es
"die Bücher1 'die Bleistifte'.
Fjitsprechendes gilt für engl. [-s] ~ [ - z l ~ [ - i z l , die (wenn man von einigen Ausnahmen wie z.B. oxen 'Ochsen1 absieht) die einzigen, ebenfalls rein phonologisch bedingten Allomorphe für das Morphem f ' P l . M sind: z.B. [buk-s] u
'Bücher'
[ro d-z] 'Straßen' [b5ks-iz] 'Schachteln'.
54
Ferner könnten genannt werden: Im Deutschen die Endungen des Infinitivs und Partizips Präsens (les-en, les-end) und im Englischen die Verbalendung /-i ij / (read-ing). Für weitere Beispiele müssen wir bereits in die Wortbildung gehen. So werden verhältnismäßig rein nach dem agglutinierenden Verfahren in unseren rotu Beispielsprachen und im Englischen die Adverbien gebildet: engl. cleaety, frz. alaire-ment < klassisch lat. olara mente 'auf klare Weise'. Allomorphe zur Endung existieren nicht, lediglich einige nicht phonologisch bedingte Stammallomorphe, z.B. fr. commode 'bequem', aber coimod^ment und in allen rom. Sprachen einige Suppletivformen für das ganze Adverb, z.B. frz. bon - bien 'gut', mauvais - mal 'schlecht'.
Von einigen Suppletivformen abgesehen funktioniert im Englischen auch die Steigerung der einsilbigen und bestimmter zweisilbiger Adjektive agglutinierend: bold-er, bold-est; easi-er3 eas-i-est. (Das Deutsche hat zusätzlich Flexion durch Unlaut: alt-er). Im Russischen wird die Reflexivpartikel /-sja/ (mit phonologisch bedingter Variante /-s1/ nach Vokal außer bei den aktiven Partizipien) agglutiniert: my t' 'waschen', my t'-s ja 'sich waschen', moju-s' 'ich wasche mich1. Es ließen sich vielleicht noch einige weitere Fälle finden; insgesamt zeigt sich jedoch, daß in unseren Beispielsprachen reine Agglutination ebenso selten ist wie reine Isolierung. Eine Begründung werden wir später versuchen. 1.2.4. Das flektierende Verfahren Beim flektierenden Verfahren steht ein Morph in der Äußerung gleichzeitig für mehrere Morpheme, graphisch
Morpheme
Morph Figur V
55
Sehr oft betrifft dieses Verhältnis nur die Endung, die aber als ganze von Stamm trennbar ist. In diesem Fall sprechen wir von 'Flexion innerhalb der Endung1. Ein gutes Beispiel für Flexion innerhalb der Endung stellen die dt. Endungen der pronominalen Flexion dar. In abtrennbaren MDrphen z.B. /-am/ in jen-emj sohön-em sind verschmolzen: Numerus, Genus und Kasus. {'SCHÖN'}
{'Sg.'} {'Mask.'} {'Dat.'} oder {'Neutr.'}
/sein -em/ Das Verhältnis 'mehrere Morpheme: ein Morph1 kann jedoch auch den Stamm einbeziehen. Dann sind zwei Fälle zu unterscheiden. Entweder lassen sich die flektierten Formen durch eine allgemeine Regel voneinander ableiten wie Väter von Vater, oder eine solche Ableitung ist nicht möglich, wie etwa bei ich bin und ich war. Den ersten Fall bezeichnen wir als Stammflexion, den zweiten als Suppletion (unabhängig davon, ob sie durch die Kombination etymologisch verschiedener Wurzeln oder durch Lautwandel entstanden ist). Bei der Stammflexion ist es möglich, die Ableitungsregel als eine Art 'Pseudcniorph1 oder 'Regelmerkmal1 (in einer sog. 'item-and-process-Grammatik' bzw. in einer transformationellen Grammatik) zu verstehen, etwa {'VATER'}
{'PL'}
|
l
/fatsr/
/UL/
Bei der Suppletion ist diese Möglichkeit ausgeschlossen. Die verschiedenen Formen müssen verschiedene "Einträge1 im Morphinventar darstellen, graphisch:
56
{'SEIN'}
{'LPers.'}
i'Sg. 1 }
{'Akt. 1 !
{'Präs.'}
('Akt.')
i'Prät. 1 }
/bin/ {'SEIN')
{"LPers.')
i'Sg. 1 }
/var/ Die Grenze zwischen Stammflexion und Suppletion ist im Einzelfall oft schwierig zu ziehen. Auch gehen sie diachron gesehen oft ineinander über. So läßt sich z.B. darüber streiten, ob das Präteritum eines nhd. starken Verbs wie schieben durch Stammflexion (etwa mit dem Regelmerkmal 'Ablaut') gebildet wird, oder durch Suppletion. (S. dazu auch den Abschnitt 'Suppletivwesen durch Lautwandel' S. 143 f f . )
Flexion ist in den indogermanischen Sprachen so häufig und wohlvertraut, daß eine vollständige Beispielsaitmlung ins Uferlose führen müßte. Bemerkenswert ist allenfalls, daß die verschiedenen Sprachen das Verfahren auf unterschiedlichen Gebieten anwenden. So werden nach einer Beobachtung von Ooseriu (1970: 100) in den romanischen Sprachen die nicht-relationellen Kategorien (Numerus, Genus und die Verbalkategorien) eher durch Flexion, die relationellen (Kasus, Steigerung) eher durch Isolation ausgedrückt. Das Russische dagegen hat weitaus mehr Kasusdeklination als Konjugation nach nicht-relationellen Kategorien. So flektieren die Verben z.B. nach Person nur noch im Präsens, aber die Nomina haben ein reich mit Allonorphen ausgebautes System von sechs Kasus. Erscheinungen von dieser Art machen es ja gerade so schwer, die morphologischen Verfahren als Klassifikationsschema zu verwenden, in das sich Sprachen als Ganze einordnen lassen sollen. 1.2.5. Das kombinierende Verfahren 1.2.5.1. Grammatische Idiomatik Bisher haben wir die verschiedenen Verfahren nur von der Seite des Sprechers her betrachtet. Soll unsere Charakterisierung jedoch eine brauchbare Grundlage für eine Erklärung des Sprachwandels darstellen, so müssen wir ihre Rolle für beide Möglichkeiten der Sprachbenutzung, also auch für den Hörer, berücksichtigen. Damit bringen wir, wie schon in Kapitel I gezeigt, die Ambiguität sprachlicher Einheiten ins Spiel.
57
Betrachten wir z.B. das deutsche Passiv. Es wird gebildet aus den Flexionsformen von werden, z.B. wird, und dem Partizip Perfekt eines Vollverbs, z.B. geliebt. Kann man aber sagen, daß für Sprecher oder Hörer wird allein die Bedeutung 'Pass.' trägt? Für den Hörer gewiß nicht, denn dasselbe Morph wird kann völlig andere Funktionen haben in er wird lieben oder er wird Lehrer. Wenn wir nun annehmen, daß wenigstens für den Sprecher allein die Formen von werd- das Morphem {'Pass.'} vertreten, so müssen wir uns fragen, welche Funktion dann die Kennzeichnung von lieben als Partizip Perfekt hat. Die Antwort müßte lauten: Lediglich distinktive, um für den Hörer das Passiv vom Futur zu unterscheiden. Betrachten wir nun aber den Satz Er ist geachtet. Hier wird ebenfalls ein Passiv ausgedrückt, geändert hat sich nur die Aktionsart: im ersten Fall wird eher eine Handlung, im zweiten Fall eher ein Zustand bezeichnet. Also steht offenbar doch das Partizip Perfekt für 'Pass.1 und sein bzw. werden unterscheiden nur die Aktionsarten? Dem widerspricht aber, daß in Er hat geliebt das Partizip Perfekt absolut kein Passiv ausdrückt und in Er ist gesprungen das ist keinen Zustand. Bei diesen komplizierten Verhältnissen bleibt uns nur noch eine vernünftige Formulierung übrig: 'werd- und Part. Perf.' bilden für Sprecher und Hörer gleichermaßen zusammen den Ausdruck für {'Pass.'}. Graphisch: {'3. Pers. Sg. Präs. Ind.1}
{'Pass.'}
{'WERD-'l
{'LIEB-'} Sprecher
{'Part.
Äußerung
(er)
\_
{'WEED-'}
{'3. Pers. Sg. Präs. Ind.1}
{'Part. Perf. 1 }
{'Pass.'}
Hörer
s
{'LIEB-'}
58
Dieses Verhältnis aber entspricht gerade der Definition der Idiomatik, die imner dann vorliegt, wenn die Kombination mehrerer Zeichen als ganze eine andere Bedeutung oder Funktion hat als aus den Bedeutungen oder Funktionen der einzelnen Zeichen und den üblichen Stellungsregeln hervorgeht. Informationstheoretisch gesprochen: Aus der Kombination zweier bereits im Kode vorhandener Zeichen ist ein neues gebildet worden, wie es uns aus der Graphemik ( für /s/), der Syntagmatik (ins Gras beißen für sterben) und der Lexik (Milchstraße) bekannt ist. Wir bemerkten schon (S. 5O), daß für den Hörer dieses Verfahren dem explizit isolierenden mit uneindeutigen Elementen sehr ähnlich ist: In beiden Fällen empfängt er ein Wort, das er nicht ohne Kontext vollständig dekodieren kann. Der Unterschied liegt beim Sprecher. Beim isolierenden Verfahren besteht für ihn eine 1:1 -Zuordnung zwischen einem Morphem und einem Wort, z.B. einer Präposition. Daß dieses Wort uneindeutig sein kann, interessiert ihn nicht; nur der Hörer muß den Kontext einbeziehen, um es zu disambiguieren. Es besteht also Asymmetrie zwischen Sprecher und Hörer. Bei der grammatischen Idiomatik, die wir künftig als das kombinierende Verfahren bezeichnen wollen, ist das Verhältnis von Sprecher und Hörer symmetrisch: Der Sprecher kodiert ein Morphem in zwei Morphe, aus denen der Hörer wieder ein Morphem dekodiert, ohne dabei auf den weiteren Kontext angewiesen zu sein. 1.2.5.2. Beispiele zur Abgrenzung zwischen isolierendem und kombinierendem Verfahren Nicht alle zusammengesetzten Verbalformen sind grammatische Idiome. Jeder einzelne Fall verlangt eine sorgfältige Analyse, ob es sich wirklich um das kombinierende Verfahren handelt oder nicht vielmehr um das isolierende (eventuell mit uneindeutigen Elementen). Dies gilt insbesondere für die mit dem Infinitiv zusammengesetzten Formen, da dieser als in den germanischen und romanischen Sprachen allenfalls für das Verbalgenus markierte Form nichts weiter 'bedeutet1 als den M Verbstamm ausgedrückten Inhalt selbst mit einem aktiven oder passiven Bezug zum Subjekt. Genau dies aber soll er ja auch z.B. im 'zusammengesetzten Futur1 bedeuten; an seiner Grundfunktion ändert sich also durch die Kombination mit dem Hilfsverb nichts. So kann man das englische Futur durchaus als isolierende Form bezeichnen.
59 {'3. Pers. Sg.' }
I/
he
{'3. Pers. Sg.'}
{'Put.'}
{'LOVE'}
will
love
{'Fat.'}
{'LOVE'}
{'Akt.'}
'Er wird lieben' {'Akt.'}
Sprecher
Äußerung Hörer
übrigens besitzt das moderne Englisch in will nicht nur ein isoliertes, sondern auch ein weitgehend unflektiertes (durch die Ersetzung von shall durch will auch in der 1. Pers.) und eindeutiges Futurmorph, da die alte Bedeutung 'wollen1 meistens durch Vollverben wie want, wish, intend, mean ausgedrückt wird. Unbetontes will in der Bedeutung 'wollen 1 steht vor allem noch in der 2. Person in Fragen im Sinne einer Aufforderung oder Bitte vom Typ 'Mill you pass me the sugar?' S. dazu und zu den weiteren Bedeutungen von will in der Schriftsprache: 'Gewohnheit', 'Neigung 1 und 'Vermutung', Lamprecht (197O: 172 f f . ) und Zandvoort (1957; 1967: 73 f f . ) .
Letzteres gilt nicht für das deutsche Futur. Zwar kann man, vom Sprecher aus betrachtet, ein Nbrph werd- für ("Fut.') annehmen, dem wie engl. will das Verb im Infinitiv folgt, und damit er wird lieben in eine Beihe stellen mit er will lieben er kann lieben
er soll lieben er muß lieben
usw. Für den Hörer hingegen ist werd- im Gegensatz zu den genannten modalen Hilfsverben mehrdeutig. Erst der Infinitiv disambiguiert für ihn werd- zum Marph für {'Fut.'}. Bei dieser Interpretation ergibt sich also die für alle echt ambigen isolierenden Konstruktionen charakteristische Asymmetrie zwischen Sprecher und Hörer. Eine andere mögliche Interpretation des deutschen Futurs, die durch die parallele Konstruktion des Passivs angeregt wird, bestände darin, analog zu werd- + Part. Perf. = "Pass.' ein zweites Idiom: werd- + Inf. = 'Fut.' anzusetzen. Welche der beiden Interpretationen der psychischen Realität eher entspricht, können wir hier nicht entscheiden. Es kommt alles darauf an, ob die deutschen Sprecher und Hörer werd- eher den isolierten modalen oder
60
den im Perfekt und Passiv kombinierend verwendeten eigentlichen gramtnatischen Hilfsverben zuordnen. Wie kompliziert der Zusammenhang zwischen kombinierendem und isolierendem Verfahren sein kann, zeigt die Entstehung der mit würd- umschriebenen Form des deutschen Konjunktivs Präteritum. Das Hilfsverb allein betrachtet ist ein von wurd- durch Flexion abgeleiteter Konjunktiv Präteritum. Semantisch handelt es sich jedoch nicht um einen Konjunktiv der Vorzeitigkeit, sondern der Gleichzeitigkeit. Dieses Verhältnis gilt bekanntlich für alle deutschen Vollverben: ich läse ist zwar morphologisch abgeleitet von -iah las (Präteritum), bezeichnet aber eine irreale Handlung, die als gleichzeitig oder zukünftig entweder in bezug auf die Sprechzeit oder die im zugehörigen Hauptsatz genannte Handlung angesehen wird: Iah läse jetzt (dann) gern einen Roman. EP sagte, er läse gerade einen Roman.
Auch in Hilfsverbkonstruktionen ist dieses Ableitungsverhältnis lebendig: Iah hätte gelesen ist morphologisch abgeleitet von iah hatte gelesen (vorzeitig gegenüber dem einfachen Präteritum), bezeichnet aber dieselbe Zeitstufe (einfaches Präteritum in der Umgangssprache) wie ich habe gelesen. Nicht gültig ist diese Regel jedoch im Fall des mit würd- umschriebenen Konjunktivs. Ich würde lesen bezeichnet weder dieselbe Zeitstufe wie ich J|f werde lesen, noch existiert die morphologische Basis ich wurde lesen. Ein echtes Ableitungsverhältnis bestand nur, solange die inchoative Konstruktion 'werd- + Part. Präs.' existierte, also: Er wird Hebend (Präs.) Er wurde liebend (Prät.) Er würde liebend (Konj. Prät.) Belege für alle drei Verwendungen: Präsens: Suie mich der Aünec nu varnde siht, er wird mich gerne sehende. (Tristan 3954, nach Behaghel 1928: 383) 'Jetzt, wo der König sieht, daß ich weggehe, fängt er an, mich gern zu sehen.' Präteritum: daz ich ir nach jehende wart. (Iwein, nach Behaghel 1928: 383) "daß ich begann, ihr zuzustimmen. 1 Konjunktiv Präteritum: daz (...) erne wurde da zestunt wol varende unde gesunt. Wörtlich: 'daß (...) er nicht augenblicklich sich wohl befindend und gesund würde. 1 (Iwein 3429 f.)
Bereits im Mittelhochdeutschen finden sich jedoch Beispiele für Grammatikalisierung der Konstruktion 'werd- bzw. würd- + Part. Perf.' zu Idiomen für Futur bzw. Konjunktiv ohne inchoativen Charakter. Eindeutig als
61
Futur muß man z.B. betrachten: an dem Jungesten tage so wirt der almehtige got dem tiuwel uf hebende, swaz er im getan hat. "Am Jüngsten Tag wird der allmächtige Gott dem Teufel zur Last legen, was er ihm angetan hat." (nach Behaghel 1928: 261) Damit tritt Morphemspaltung ein. Repräsentierten werd-, wurd- und wiirdnoch in den alten, inchoativen Formen immer dasselbe Morphem {'WEED'}, so werden jetzt die Präsensformen zum Zeichen für {'Fut.'}, die Konjunktivformen zum Zeichen für {'Konj.'}. Entsprechend ist die Kennzeichnung des Hauptverbs als Partizip Präsens nicht mehr notwendig. Das Partizip wird durch den Infinitiv als die unmarkierte Form zur Bezeichnung der Handlung selbst ersetzt. Die heutigen Formen er wird lieben und er würde lieben sind entstanden. Wir können es hier dahingestellt sein lassen, ob, wie Behaghel· meint, werd-+ Partizip Perfekt die einzige Quelle für die heutige Futurform ist, oder ob daneben von Anfang an auch die Infinitivkonstruktion existierte, die modale Bedeutung hatte und sich in geeignetem Zusammenhang auch auf Zukünftiges beziehen konnte, wie Saltveit (1962) an umfangreichem Material darlegt. Seiner Meinung nach haben, nach einer Zeit des schwankenden Gebrauchs von Infinitiv- und Partizipialkonstruktion in derselben Funktion bzw. nach deren lautlichem Zusammenfall in maßgeblichen Dialekten, erst die normativen Grammatiker werd- + Partizip Perfekt zugunsten von werd- + Infinitiv aus der Hochsprache verdrängt. In vielen Mundarten seien jedoch auch heute noch beide Formen in der ursprünglichen Verteilung der Funktionen vorhanden. (Saltveit 1962: 253)
Für das 'Zwischenglied' wurde liebend war bei der neuen Aufteilung kein Platz mehr vorhanden. Eine eigene Form für das Futur des Präteritums, desm sen Funktion iah wurde lieben hätte übernehmen können, war und ist in den germanischen Sprachen nicht vorhanden. (S. dazu auch Saltveit 1962: 251) z.B. die romanischen Sprachen haben eine solche Form (die allerdings dadurch uneindeutig geworden ist, daß sie auch die Funktion des Konditionals mit übernommen hat): vulgärlat. Präs. Dielt quod cantare habet. 'Er sagt, er werde singen". Prät. Dixit quod cantare habebat. 'Er sagte, er werde singen, frz. II dit qu'il chantera. II disait qu'il chanterait.
Soweit betrachtet nimmt die Entwicklung sich aus wie die unmittelbare Entstehung des isolierenden Verfahrens aus einer nicht grammatikalisierten periphrastischen Konstruktion. Ganz so einfach liegen die Verhältnisse jedoch nicht, und zwar wegen der idiomatischen Konstruktion des Passivs. Im Falle des Futurs hatten wir schon gesehen, wie ihre bloße Existenz als mög-
62
liches Vorbild zu einer Unsicherheit in der Beurteilung der Futurformen führen kann (S. 59). Im Fall von würd- ist die Verbindung mit dem Passiv jedoch noch viel enger. Parallel zur durch Flexion abgeleiteten Form er würde liebend gab und gibt es nämlich noch er würde geliebt: durch Flexion vom Indikativ er wurde geliebt abgeleiteter Konjunktiv Präteritum Passiv. Würde in er würde geliebt gehört natürlich ebenso zum Idiom für {'Pass.'} wie wird im Indikativ er wird geliebt. Also wäre würd- im Passiv Teil einer kombinierenden, im Aktiv Teil einer isolierenden Konstruktion, bzw. der Konjunktiv wird nur im Aktiv isolierend, im Passiv aber durch Flexion des Hilfsverbs ausgedrückt? Diese Inkonsequenz wird in neuester Zeit abgebaut durch die Möglichkeit, auch im Passiv die Formen von würd- zu isolieren, indem werden selbst umschrieben wird: er würde geliebt werden. Mit dieser Konstruktion hat sich endgültig das isolierende Verfahren zum Ausdruck des Konjunktivs der Gleichzeitigkeit durchgesetzt. Es gibt noch einen dritten Typ von Konstruktionen, den man leicht mit dem kombinierenden Verfahren verwechseln könnte. Das sind solche Fälle von Kongruenz, in denen dasselbe Morphem mehrmals ausgedrückt wird, aber die entsprechenden Morphe, jedes für sich genommen, ambig sind und sich erst gegenseitig disambiguieren. Betrachten wir z.B. die dt. Form sie singen. Sowohl das Personalpronomen ist ambig ({'3. Pers. Sg. Fern.1} oder {'3. Pers. Pl.'}) als auch die Verbalendung ({'1. oder 3. Pers. Pl.'}). Zusammen aber ergeben sie eindeutig {'3. Pers. Pl.1}. Graphisch können wir den Zusammenhang folgendermaßen verdeutlichen: Relation Subj. - Verb 'Subj.' 'Pron.'
{'3. Pl.· }
{'SING' l
{'3. Pl.' }
Äußerung
zigan/
'Pron.1 i'3. Sg. oder Pl.' }
{'SING1 }
Sprecher
{'1. cd. 3. Pl.'} Hörer
1
'Pron. 'Subj.'
{'3. Pl.' }
{'SING' }
Relation Subj. - Verb
{'3. Pl. 1 }
63
Die doppelte Nennung, deren eigentliche Funktion es ist, durch Gleichheit der Morpheme die Relation zwischen Subjekt und Verb auszudrücken (s. auch S. 158 f . ) , dient hier auch zum eindeutigen Ausdruck der Morpheme selbst. Hier könnte nun der falsche Eindruck entstehen, es handle sich um das kombinierende Verfahren, da der Hörer aus beidem, Personalpronomen und Verbalendung zusammen erst Person und Numerus entnehmen kann. Dies ist jedoch nicht der Fall: Erstens ist die Symmetrie zwischen Sprecher und Hörer nicht gewahrt (wie schon bei den isolierenden Konstruktionen mit ambigen Elementen) . Zweitens dienen die beiden Elemente einer kombinierenden Konstruktion zusammen lediglich zum Ausdruck einer grammatischen Kategorie, während kongruierende Elemente darüber hinaus zum Ausdruck einer Relation zwischen zwei anderen Elementen dienen, mit denen sie (meistens durch Flexion) verbunden sind. Für den Hörer drücken /hob-/ + /g ...t/ zusammen lediglich {'Prät.'} aus, aber /zi/ + /-an/ nicht nur {'3. Pers. Pl. 1 }, sondern darüber hinaus noch: "Dieses Pronomen ist Subjekt zu jenem Verb.1 Ein weiteres bedenkenswertes Argument gegen die Parallelisierung von periphrastischen Formen (die unseren kombinierenden und explizit isolierenden entsprechen) und Kongruenz finden wir bei Matthews (1974: 157 f. und 171 f . ) · Zwar wählt er als Beispiel nicht sich gegenseitig disambiguierende Endungen, aber sinngemäß gilt sein Argument auch für diesen Fall. Er geht von der uns sehr plausibel erscheinenden Grundannahme aus, daß das Wort eine wesentliche Einheit in der Intuition der Sprecher und Hörer ist, und daß folglich unter mehreren theoretisch möglichen Analysen derjenigen der Vorzug gebührt, die am meisten Rücksicht auf die Einheit 'Wort' nimmt. Nun könnte man nach Matthews z.B. lat. me um aevum 'mein Alter 1 für Sprecher wie für Hörer analysieren als meu + aevu + Akkusativ Singular, wobei {'Akk. S g . ' } durch das diskontinuierliche Morph -m ... -m ausgedrückt würde, ebenso wie ja z.B. der Ausdruck für das Perfekt Passiv eine Präsens-Aktiv-Form von esse 'sein', z.B. sum 'ich bin 1 und ein Partizip Perfekt, z.B. amatus geliebt' umfasse. Das Partizip wäre in einem zweiten Schritt der morphologischen Analyse in Stamm und Endung zu zerlegen. Die Zuordnung 'eine Inhaltseinheit - zwei Ausdruckseinheiten' ist nach Matthews im Fall des Perfekt Passiv gerechtfertigt und unumgänglich, weil sum und amatus ja tatsächlich zwei Wörter sind, im Fall von meum aevum jedoch nicht, da hier die Wortgrenzainicht berücksichtigt werden. Der Linguist stelle gewissermaßen künstlich eine Verbindung zwischen -m und -m als Teilen eines diskontinuierlichen Morphs her, die enger wäre als die Verbindung zwischen den Morphen innerhalb eines Wortes, also zwischen aevu- und -m bzw. zwischen meu- und -m. Wir teilen das Unbehagen, das Matthews gegenüber der Interpretation der Kongruenz als einer Art von kombinierendem Verfahren empfindet und sehen dafür noch einen anderen Grund als die Verletzung der Wortgrenzen, nämlich das Abweichen von der l:l-Zuordnung zwischen Ausdruck und Inhalt. Wie wir noch ausführlich erörtern werden (s.S. 14O f f . ) ,
64 stellt diese eines der wichtigsten Performanzbedürfnisse dar. Freilich gibt es auch gute Gründe, diesem Bedürfnis zu widersprechen (etwa beim flektierenden und kombinierenden Verfahren); die Frage ist eben nur, ob die Ambiguität der kongruierenden Elemente bereits einen ausreichenden Grund für den Sprecher darstellt, gewissermaßen ohne zwingende Notwendigkeit die Strategie des Hörers spiegelbildlich zu kopieren und die l:1-Zuordnung zwischen Inhalt und Ausdruck zu verlassen. Letztlich ist das eine Frage der Intuition bzw. eventuell der Psycholinguistik, die in den größeren Fragenkomplex gehört, inwieweit Ambiguitäten auch das Verhalten des Sprechers beeinflussen.
So gibt es drei verschiedene Konstruktionen, bei denen der Hörer mehrere Elanente zusammen berücksichtigen muß, um eines oder alle richtig zu interpretieren: (1) Das kombinierende Verfahren (Syittnetrie zwischen Sprecher und Hörer) : Der Sprecher drückt ein Morphem, z.B. {'Prät.'} durch zwei Morphe, /hab-/ und /ge...t/ aus. Der Hörer setzt aus den beiden Morphen das ursprüngliche Morphem wieder zusammen. (2) Das isolierende Verfahren mit ambigen Elementen (Asymmetrie zwischen Sprecher und Hörer): Der Sprecher drückt zwei verschiedene Morpheme, z.B. {'SING'} und {'Fut.'} mit zwei getrennten Morphen aus: /verd-/ und /zijsn/ (zum Infinitiv s.S. 58 f . ) . Der Hörer kann nur beiden Morphen zusammen die zwei verschiedenen Morpheme entnehmen. (3) Kongruenz mit ambigen Elementen (Asymmetrie zwischen Sprecher und Hörer): Der Sprecher drückt zweimal dasselbe Morphem in getrennten Morphen aus. Der Hörer kann nur beiden Morphen zusammen zweimal dasselbe Morphem entnehmen und zusätzlich eine gewisse Relation zwischen den Stämmen, zu denen die Morphe gehören. 2. Wandel der morphosyntaktischen Verfahren Bei den Beispielen, die den Unterschied zwischen dem kombinierenden und dem isolierenden Verfahren deutlich machen sollen, sind wir bereits auf das Phänomen gestoßen, das eine Typologie der morphosyntaktischen Verfahren für den Sprachhistoriker eigentlich interessant macht, nämlich ihren Wandel. Die Beobachtung, daß ein Verfahren zum Ausdruck einer grammatischen Kategorie im Laufe der Sprachgeschichte ein anderes ersetzen kann, ist so alt wie die Typologie dieser Verfahren selbst. Wohlbekannt ist auch die
65
summarische Feststellung, daß die modernen indogermanischen Sprachen im ganzen stärker analytisch verfahren als die alten. Diese Feststellung ist sicherlich richtig; jedoch wird eine etwas detailliertere Untersuchung der Neuerungen in dieser Richtung noch manche Regelmäßigkeiten zutage bringen, die vielleicht nicht zufällig sind und eine Erklärung der Phänomene fördern könnten. Schließlich sind auch nicht alle modernen kombinierenden oder isolierenden Konstruktionen als Ersatz für alte flektierende entstanden, sondern vielfach hat es auch ganz neue Kategorien gegeben, die von Anfang an kombinierend, isolierend oder zunächst kombinierend und dann isolierend ausgedrückt wurden. 2.1. Die Kategorien des Verbs 2.1.1. Tempus, Aspekt Ein besonders interessantes Beispiel für das Zusammenspiel zwischen dem Ersatz alter Verfahren durch neue und der Schaffung neuer Kategorien mit Hilfe neuer Verfahren ist die Flexion der Verben nach Tempus und Aspekt, wie folgende Tabelle zeigt:
66 Die Tempora des Indikativs latein Fut. II.
portavero
Fut. I
portabo
Präs.
porto
Französisch j'aurai porte
je porte
Perf. Präs.
j 'ai porte
Prät.
portavi
Plusquamperf.
portaveram
portabam
Gotisch
Fut. I
balra
Perf. Präs. Prät.
je portais
j'eus porte
j'avaie porte
Deutsch
Fut. II
Präs.
je portai
bar
Plusquamperf.
Englisch
ich werde getragen haben I shall have carried A ich werde tragen I shall carry
I shall be carrying
ich trage
I carry
I am carrying
ich habe getragen
I have carried
I have been carrying
icn trug
I carried
I wae carrying
ich hatte getragen
I had carried
I had been carrying
Neurussisch
Altkirchenslawisch Fut. II
I shall have been carrying
nes1"b body
Fut. I
(ja) eneeu
Präs.
(ja) bitdu neeti (ja) neeu
neeo
Perf. Präs. neeVb jeemb Prat.
ne8"b
neeeaohTi
Plusquamperf.
neetb bech"b
(ja) snes
Vertikale Ordnung: Zeitstufen Horizontale Ordnung: Aspekte/Aktionsarten: Lat.: Perfekt
Imperfekt
Frz.: passe simple
imparfait
Engl.: simple form
continuous form
Aksl.: Aorist
a^jerfekt
Neuruss.: perf. Aspekt iitperf. Aspekt —^>
: kann ersetzen
(...)
: fakultativ
(ja) nee
67
2.1.1.1. Französisch Die meisten wirklichen Ersatzformen für ehemalige flektierende Formen hat das Französische. Kombinierend sind: das 2. Futur, gebildet aus dem Futur von avoir + Partizip Perfekt, das Perfekten Präsens (passe compose), gebildet aus dem Präsens von avoir + Partizip Perfekt, das im Gegenwartsfranzösischen in gesprochener Sprache das alte flektierende Perfekt (passe simple) verdrängt hat, beide Plusquamperfekte: das plusqueparfait (gebildet aus dem Imperfekt von avoir + Partizip Perfekt) und das passe anterieur, das gegenüber dem plusqueparfait eine Aspektnuance ausdrückt (Vollendung der Handlung). Isolierend ist das moderne umgangssprachliche Futur, gebildet aus dem Präsens von aller 'gehen1 + Infinitiv, mit dem bereits zum zweiten Mal eine flektierende Form durch eine isolierende ersetzt wird, nämlich das flektierende je porterai^ tu porteras ..., das seinerseits aus isolierendem vulgärlat. portare habeo, Ersatz für klassischlat. portabo, entstanden war. Das Tempussystem unserer anderen ran. Beispielsprachen unterscheidet sich im Prinzip den morphosyntaktischen Verfahren nach nicht stark von dem des Französischen. Ganz allgemein darf man wohl sagen, daß die übrigen ran. Sprachen im Bereich der Tempusmorphologie konservativer sind als das Französische. Vor allem die formale Ersetzung des historischen Perfekts durch das Perfektum Präsens ist unseres Wissens nirgends soweit vorgeschritten wie im Französischen. Das heißt, das Spanische und das Italienische bewahren noch besser das sechsstufige Tempussystem, wie es für das geschriebene Französische und das Englische unserer Tabelle zu entnehmen ist. 2.1.1.2. Deutsch
Das Deutsche hat im Temporalbereich die neuen Verfahren zunächst nur genutzt, um neue Tempuskategorien zu schaffen. Kombinierend werden gebildet: das Perfektum Präsens, in der deutschen Granniatik kurz 'Perfekt' genannt, und das Plusquamperfekt.
68
Dieses ist sehr früh in den Bereich des Präteritums vorgedrungen (bereits im 12. Jahrhundert nach Lockwood 1968: 122). In oberdeutschen Dialekten gibt es heute (bis auf die Ausnahme ich war) überhaupt nur noch das analytische Präteritum. Hier kann man also von der Ersetzung einer flektierenden Form durch eine kombinierende sprechen. üti Gegensatz zum Französischen wird in der modernen dt. "Hochsprache" jedoch auch umgekehrt aus stilistischen Gründen das Präteritum anstelle des Perfekts gebraucht. Ganz grob gesprochen, gehört das Präteritum eher der Schriftsprache und dem gehobenen Stil, das Perfekt eher der gesprochenen Umgangssprache an. Die Zeitbedeutung ist jedoch für beide dieselbe. (Wir haben diese Austauschbarkeit der Formen in dem Schaubild S. 66 durch die Pfeile in beiden Richtungen angedeutet.) Lockwood (1968: 123) kann daher schreiben: "Since it is possible to interchange a spoken perfect and a written preterite, it follows that these tenses must have exactly the same meaning. It follows further that it may be misleading to equate automatically, e.g. ich habe geprüft with have checked1 and ich prüfte with 'I checked', because the different tenses in English express different shades of meaning. But neither of the German tenses has the power to express more than simply past time as such."
Nicht alle Autoren erklären so rigoros wie Lockwood den Tempusunterschied zwischen Perfekt und Präteritum für tot. So möchte z.B. Saltveit (1970) den Unterschied der Zeitstufen aufrechterhalten sehen. Annähernd synonym sind für ihn nur die Perfekt- und Präteritum-Formen der durativen Verben zum Ausdruck der von der Gegenwart abgelösten Vergangenheit (damals) , z.B. Die Uhr ging und Die Uhr ist gegangen. Bei perfektiven Verben dagegen bestehe ein Tempusunterschied, z.B. zwischen Der Zug ging (ab) (damals) und Der Zug ist (ab)gegangen (jetzt). (Saltveit 1970: 152) Daß jedoch auch das Perfekt perfektiver Verben eindeutig die Vergangenheit längst zurückliegender Ereignisse ausdrücken kann, zeigt das Beispiel der Duden-Grammatik: Kolumbus hat Amerika entdeckt. (Grebe 1966: 98) Auch den Satz Der Zug ist abgegangen könnten wir uns gut in der Erzählung längst vergangener Ereignisse vorstellen, vor allem in gesprochener Sprache. Umgekehrt können sowohl das Präteritum als auch das Perfekt durativer Verben durchaus auch auf Vorgänge angewendet werden, die in die Gegenwart hineinreichen. Als Beispiel führt die Duden-Grammatik an: Sie sahen soeben ... (als Fernsehanzeige nach einem Film), das aus stilistischen Gründen ("gehobe-
69
ner" Stil, Vermeidung der Satzklammer) dem nach der alten Zeitstufenregel korrekteren Sie haben soeben ... gesehen vorgezogen wird. Grebe (1966: 101) bemerkt dazu: "Da das Präteritum durch seine Kürze von größerer Prägnanz als das Perfekt ist, wird es häufig auch dort gesetzt, wo das Perfekt stehen müßte. Bei manchem Sprecher oder Schreiber kann auch die Vorstellung mitschwingen, daß der Gebrauch der Präteritums vornehmer sei als der Gebrauch des Perfekts ... Schließlich kann auch der Rhythmus bei der Wahl des Präteritums an Stelle des Perfekts eine Rolle spielen."
Genau die hier genannten Kriterien (Stilebene, Länge bzw. Kürze der Formen und Satzrhythmus) sind unseres Erachtens heute bereits die eigentlich maßgebenden für die Entscheidung zwischen Perfekt und Präteritum. Über die Zwischenstellung des Futurs zwischen isolierendem und kombinierendem Verfahren hatten wir schon gesprochen (S. 59). Entsprechendes gilt für das Futur II, bei dem ein kombinierend gebildeter Infinitiv Perfekt z.B. geliebt haben in die, je nach Interpretation, kombinierende oder isolierende Futur form mit werd- geschachtelt
ist.
2.1.1.3. Englisch Am intensivsten hat zweifellos das Englische die neuen Möglichkeiten genutzt. Isolierend wird nur das Futur I gebildet. Aber das kombinierende Verfahren hat das Englische nicht nur genutzt, um die alte zweistufige Tempusskala des Germanischen zu einer sechsstufigen wie das Französische und Lateinische zu ergänzen, sondern auch, um sich in Gestalt der sogenannten wi^-Formen einen neuen Aspekt zu schaffen, der als echte neue grammatische Kategorie auf allen Zeitstufen regelmäßig gebildet werden kann, im Gegensatz zum Lateinischen und Französischen, die Vergleichbares nur im Präteritum (Perfekt versus Imperfekt) haben. Wir wollen damit nicht behaupten, daß der Unterschied zwischen 'passe simple' und 'imparfait 1 bzw. zwischen lat. Perfekt und Imperfekt genau demjenigen zwischen dem englischen einfachen 'past 1 und der Verlaufsform entspräche. So steht z.B. zum Ausdruck einer wiederholten Handlung im Englischen normalerweise das einfache ' p a s t ' , im Französischen dagegen das imparfait, obwohl sich sonst eher ing-Form und imparfait entsprechen. Trotzdem können wir von einem vergleichbaren Unterschied sprechen, da er in beiden Fällen in der Betrachtungsweise (eben dem Aspekt) dor Handlung durch den Sprecher besteht.
70
2.1.1.4. Russisch Sehr viel komplizierter ist das Verhältnis der Aspekte zueinander im Russischen. Einerseits wird die Unterscheidung zwischen perfektiven und inperfektiven Verben mit Mitteln der Wortbildung vollzogen, die, insbesondere bei der Präfigierung, oft von der lexikalischen Bedeutung des Verbs abhängen, z.B. imperf. delat* 'tun1 - perf. s-delat3 (s-, 'bis zu Ende'). Andererseits hat heute der Aspekt das Tempussystem weitgehend überlagert und gehört somit doch in den Bereich der Grammatik. Dies wird am deutlichsten dadurch, daß das formale Präsens der perfektiven Verben Futurbedeutung hat, so daß man ein echtes Präsens mit Präsensbedeutung nur von imperfektiven Verben bilden kann. Bemerkenswert ist für uns jedoch vor allan die Entwicklung der Temporalkategorien. Denn bereits im Altkirchenslawischen sind kombinierende (oder zumindest potentiell kombinierende, je nach Grammatikalisierungsgrad) Konstruktionen entwickelt, so daß (bis auf das Futur I) der gleiche Bestand an Tempuskategorien vorhanden ist wie im modernen Englischen. Zu den alten Kategorien (Präsens, Aorist, Imperfekt) waren hinzugekommen: Das Futur II (das Futur I entstand, wie im Englischen, erst sehr spät), das Perfektum Präsens und das Plusquamperfekt. Bildungselemente waren, ganz ähnlich wie in unseren anderen Beispielsprachen, ein Partizip (das sogenannte 1-Partizip, z.B. nestb vom Stamm nes-'tragen1, ein Partizip Aktiv) und verschiedene Formen der Kopula. Allerdings wurden im Russischen nie verschiedene Hilfsverben (etwa wie 'haben', 'sein1, 'werden) verwendet. Das mag damit zusammenhängen, daß die Unterscheidung zwischen Aktiv und Passiv allein von verschiedenen Partizipien und der Reflexivpartikel getragen wurde (und wird) und entsprechend weniger Unterschiede bei den Hilfsverben gemacht zu werden brauchten. Aber im Gegensatz zum Französischen, Englischen und Deutschen gab das Russische sämtliche Möglichkeiten zu kombinierenden Konstruktionen wieder auf. Die übriggebliebenen Ersatzformen sind das isolierende Futur der imperfektiven Verben, gebildet aus den Futurformen von by t1 'sein' (budu ...) + Infinitiv, und cfos nach Genus flektierende Präteritum. Hier ging sogar die Entwicklung vom kombinierenden Verfahren wieder zurück zum flektierenden. Bereits im Altkirchenslawischen war ein Idiom aus den Präsensformen von byti 'sein 1 und dem 1-Partizip entstanden, also aksl. jesmf» nesTb 'ich (mask.) habe getragen 1 . Danach aber schwan-
71 den die Formen von byti, und übrig blieb das Partizip, dessen Endung /-!/ bis heute (mit seinen 0-Allomorphen in bestimmten Fällen) nach dem Schwund von Aorist und Imperfekt das einzige Morph für {'Prät.'} geblieben ist. Hinzu kommen Flexionsendungen, die die Kongruenz mit dem Subjekt in Genus/Numerus (also nicht in Person) herstellen: ja dal 'ich gab1 (mask.) ty dal "du gabst1 (mask.) ja dal-a 'ich gab1 (fern.) ty dal-a 'du gabst1 (fern.) my dal-i 'wir gaben1 (neutralisiertes Genus) vy dal-i 'ihr gabt' (neutralisiertes Genus)
Das alte nach Person flektierende Präsens blieb erhalten, das zweite Futur und das Plusquamperfekt sind ersatzlos verschwunden. Dies hängt zweifellos mit dem Vordringen des Aspekts ins Tempussystem und mit dem Schwund Her Kopula im Präsens zusammen, aber damit ist noch nicht alles erklärt. Wir können im folgenden vielleicht einen kleinen Beitrag zur Erklärung dieses Phänomens leisten (s.S. 217 f.) 2.1.1.5. Gesamtüberblick - Gemeinsamkeiten Bei einem Gesamtüberblick über die Tabelle fällt auf, daß jede der betrachteten Sprachen zu irgendeinem Zeitpunkt, sei es durch die Ersetzung alter Formen, sei es durch die Schaffung neuer Kategorien, ein sechsstufiges Tempussystem ausgebildet hatte, in dem lediglich das Präsens und das Präteritum durch mindestens eine durch Flexion erzeugte Form besetzt war, alle übrigen Tempora aber nach dem kombinierenden oder isolierenden Verfahren gebildet wurden. (Eine kleine Einschränkung gilt nur für das Russische, da das zusammengesetzte Futur der Imperfektiven Verben erst eingeführt wurde, als andere Kategorien schon wieder im Schwinden begriffen waren.) Diese Systeme haben in den verschiedenen Sprachen unterschiedliche Schicksale gehabt: Das Englische hat es beibehalten, das Französische schafft es sich gerade erneut durch das isolierende Futur (je vais porter 'ich werde tragen1), das Rassische hat das System auf drei Stufen reduziert, das Deutsche war nie besonders 'futurfreundlich1. So behauptet z.B. Saltveit (1962: 254) sogar von dem Futur der gegenwärtigen dt. Hochsprache noch: "Der Grundcharakter der Fügung ist modal, und werden kann somit zu den Modalverben gezählt werden."
Bei all dem blieben aber immer noch mindestens je ein durch Flexion gebildetes Präsens und Präteritum bestehen, die offenbar so etwas wie eine 'Minimalausstattung' darstellen, mit der z.B. das Urgermanische ausgekommen zu sein scheint. Erst in jüngster Zeit wird im Deutschen diese merk-
72
würdige (und vielleicht zufällige) Regelmäßigkeit durchbrochen, indem das zusammengesetzte Perfektum Präsens die einzige Flexionsform des Präteritums ersetzt. Kann man in dieser Übereinstimmung eine Art 'drift', eine 'Konvergenz' auf ein bestimmtes Ziel hin sehen? (Die Übereinstimmungen auf gegenseitige Entlehnung zurückzuführen, dürfte nahezu unmöglich sein. Eher wäre an einen direkten Einfluß des Lateinischen bzw. Griechischen zu denken, etwa für die Entstehung des zweiten und eventuell ersten Futurs. Jedoch kann das Perfektum Präsens als Kategorie nicht aus dem Lateinischen entlehnt sein und erst recht nicht die Beschränkung der flektierten Formen auf Präsens und Präteritutn.) Wir können im Rahmen dieser Arbeit die Frage nur aufwerfen, jedoch nicht lösen, da wir nicht eigentlich die Existenz der Kategorien erklären wollen, sondern die Verfahren zum Ausdruck der als vorgegeben betrachteten Kategorien. 2.1.2. Modus Ersetzungen haben stattgefunden im Bereich von Konjunktiv und Konditional. (Der Imperativ wird nach wie vor durch Flexion gebildet.) 2.1.2.1. Die germanischen und ronanischen Sprachen. Die neuen Konditionale Allgemein läßt sich sagen, daß in den romanischen Sprachen, im Deutschen und rudimentär im Englischen der eigentliche Konjunktiv durch Flexion gebildet wird, im Präsens und Präteritum am Hauptverb (Typ: er singe, er- sänge) , in den neuen zusammengesetzten Zeiten am Hilfsverb (Typ: er 'habe gesungen, er hatte gesungen, nur im Deutschen auch er werde singen, er werde gesungen haben). Diese Formen sind in bezug auf den Modus nicht kombinierend, da der Konjunktiv für Sprecher und Hörer allein in der Flexion des Hilfsverbs liegt, während das Tempus erst durch die Zusammensetzung mit dem Partizip bzw. Infinitiv zustandekommt. Diese alten flektierend gebildeten Konjunktivformen wurden (und werden noch) vielfach durch isolierend gebildete Konstruktionen ersetzt - sofern sie nicht überhaupt dem Indikativ gewichen sind. Besonders interessant ist diese Ersetzung beim Konjunktiv Präteritum, da sie den Umweg über eine ganz neue Kategorie, das Konditional, genommen hat.
73
Bis auf die des Deutschen sind die neuen Konditionale alle aus indikativischen Präteritalformen entstanden und haben erst durch ihre Verwendung im irrealen hypothetischen Satzgefüge die Funktion eines Konditionals angenomnven. Hier haben sie die Konjunktivformen aus vielen ihrer früheren Funktionen verdrängt. In den rom. Sprachen und dem Englischen ist der Ausgangspunkt für das Konditional das Futur des Präteriturns. So z.B. vulgärlat. si höherem, (Konj. Prät.) dare habebam (Fut. des Imperf.) statt klassischlat. si höherem, darem (Konj. Prät.) 'Wenn ich hätte, würde ich geben.1 (nach Gamillscheg 1913; 1970: 50) Später ist durch Agglutination der Formen von höhere erneut ein durch Flexion gebildetes Konditional entstanden, frz. je ohanterais, sp. oantaria, it. canter ei (Letzteres ist mit dem Perfekt von höhere gebildet.) 'ich würde singen'. Genau wie beim Futur liegt hier also ein 'Zyklus': flektierend - isolierend - flektierend vor, allerdings mit der zusätzlichen Komplikation, daß beim Konditional die Entstehung einer neuen grammatischen Kategorie, eben des Konditionals selbst, beteiligt war, während beim Futur der Zyklus sich nur innerhalb der einen Kategorie 'Futur1 abspielte. Im Englischen sind would und should (die als Imperfektformen von will und shall dem vulgärlat. habebam ... entsprechen) nicht agglutiniert worden. Im Gegenteil: Da die Alternanz zwischen should und would im modernen Englischen praktisch zugunsten von would aufgehoben ist, das weder formal noch semantisch in einem regelmäßigen Ableitungsverhältnis zu will steht, könnte man sagen, daß das moderne engl. Konditional isolierend gebildet wird. Die Entstehung des dt. isolierenden Konjunktivs aus der inchoativen periphrastischen Konstruktion twürd- + Part. Präs.' haben wir schon besprochen (S. 60 f f . ) . Die Ersetzung der alten flektierend gebildeten Konjunktivformen durch die neuen Konditionalformen ist in unseren Beispielsprachen überall als Tendenz vorhanden, jedoch verschieden weit fortgeschritten. Am konservativsten sind in dieser Beziehung die rom. Sprachen, in denen das Konditional ja zwar i.a. regelmäßiger, aber nicht nach einem prinzipiell anderen Verfahren gebildet wird als der Konjunktiv. Am weitesten fortgeschritten ist das Englische. Hier existieren synthetische Konjunktivformen nur noch vom Verb to be.
74
Das Deutsche njutmt eine Zwischenstellung ein: Hier hängt die Verwendung der alten Konjunktivfarmen van Lexem und außerdem der Stilebene bzw. Textsorte ab. Bausch (1975: 13) könnt bei seiner Auswertung statistischen Materials zur dt. Sprache der Gegenwart zu folgenden Schlüssen: "a) Die vollverben spielen eine äußerst periphere rolle. b) Der konjunktiv I von vollverben wird vorwiegend in der spräche der massenmedien gebraucht, ist aber auch dort sehr selten. c) Der gebrauch des konjunktiv II von vollverben ist weitgehend reduziert auf die verben kommen, geben und grehen. d) Produktiv dagegen ist die synthetische konjunktiv II-bildung bei den verben haben, sein und werden, sowohl in ihrer funktion als vollverben (kopula) als auch in ihrer funktion als auxiliarverben."
Die Schriftsprache ist natürlich insgesamt etwas konservativer, aber dieselbe Tendenz wie in der gesprochenen Sprache ist unverkennbar. Die Untersuchung von Jäger (1971) ergibt, daß "das würde + Infinitiv-Gefüge etwas mehr als ein Viertel aller Konjunktiv-II-Formen stellt, daß knapp zwei Drittel aller Formen mit den übrigen Hilfs- und Modalverben und nur etwa 1/12 der eindeutigen Formen mit Vollverben gebildet werden." (Jäger 1979: 251)
Aus dieser Gesamtsituation schließt Bausch (1975: 14) mit Recht, "daß das deutsche konjunktivsystem sich in der weise stabilisieren könnte, wie es z.B. im Englischen bereits der fall ist." 2.1.2.2. Russisch. Die Konjunktivpartikel als ideale isolierte Form Im Russischen kann man kaum von einer Ersetzung irgendwelcher flektierender Konjunktivformen durch ein isolierendes Konditional sprechen, da bereits Hag Altkirchenslawische einen Konjunktiv durch Flexion nur von dem einen Verb 'sein1 bildete. Mit Hilfe dieser Konjunktivformen bim ... und des 1-Partizips wurden analytische Konjunktivformen für alle anderen Verben gebildet. (Leskien 1962: 137) Bereits im Altkirchenslawischen wurde dieses Paradigma jedoch von zugehörigen Aaristparadigma beeinflußt. Nach dem Schwund des Aorists aus der Sprache blieb die Form der 3. Fers. Sg. by erhalten als isolierte Konjunktivpartikel, die nicht einmal mehr an das Vorhandensein eines flektierten Verbs gebunden ist, sondern sogar in unpersönlichen Sätzen mit dem Infinitiv oder anderen Wörtarten (Substantiv, Adjektiv) stehen "und dem Satz dadurch einen optativischen, konditionalen oder potentialen Cha-
75
rakter verleihen kann: Vot teper' by zasnut'! 'ach, wenn man jetzt einschliefe11, poskorej by! 'wenn es nur schneller gingel'" (V. Kiparsky 1967: 236} An die ursprüngliche zusammengesetzte Verbalform erinnert nur die Regel, daß in persönlichen Sätzen das Verb inner im Präteritum (dem ehemaligen 1-Partizip) stehen muß, auch wenn es sich um einen Irrealis im Präsens handelt, z.B. eeli by on zasnul 'Wenn er einschliefe1. Die 1-Form ist jedoch hier eine redundante Kontextbeschränkung und nicht etwa Bestandteil einer kombinierenden Konstruktion. Das zeigen zweifelsfrei die obengenannten Beispiele, in denen by auch ohne 1-Form als selbständiges und eindeutiges Morph zum Ausdruck von {'Konj.'} verwendet wird. Zusammenfassend läßt sich sagen, daß eine starke Tendenz besteht, Nicht-Wirklichkeit als grammatische Kategorie durch das isolierende Verfahren auszudrücken. Ansatzpunkt für die neuen Formen ist das Konditional, das die nicht erfüllte Bedingung ausdrückt. Bemerkenswert ist im Vergleich zum Tempus die Bevorzugung des isolierenden Verfahrens gegenüber dem kombinierenden. 2.1.3. Verbalgenus 2.1.3.1. Die germanischen und romanischen Sprachen Das häufigste moderne Verfahren ist in den germ, und rom. Sprachen zweifellos das kombinierende, das zur Bildung eines Passivs aus einem Hilfsverb (dt. 'werden1, engl., rom. 'sein', it. fakultativ 'kommen') + Partizip Perfekt dient. Ohne weiteres als Ersatzformen kann man dabei nur die romanischen bezeichnen, da sie dieselbe grammatische Kategorie 'Passiv1 ausdrücken wie ihre durch Flexion gebildeten lateinischen Vorgänger. In den germ. Sprachen dagegen tritt mit dem Entstehen der neuen Passivformen gleichzeitig eine Verengung der grammatischen Kategorie 'Medium1 ein, das noch im Gotischen In Resten erhalten ist und dessen allgemeinere Funktion der "Intransivierung" (Sommer 1939; 1971: 48) die des Passivs mit eingeschlossen hatte.
76
2.1.3.2. Russisch Ähnlich wie beim Tempus drückt das Russische auch das Passiv nicht durch das kombinierende Verfahren aus, sondern durch ein Partizip, das selbst nach dem flektierenden Verfahren gebildet wird und nach Genus/ Numerus flektiert, nämlich die Kurzform des Partizips Präterium Passiv (prinesen 'gebracht'). Im unterschied zum germ, und rcm. Partizip Perfekt steht dieses Partizip im Russischen eindeutig im Passiv, da es parallel auch ein Partizip Präteritum Aktiv gibt. Da außerdem die Kurzform eindeutig die prädikative Verwendung markiert (gegenüber der attributiven Langform prinesermyj), besteht weder für den Sprecher noch für den Hörer ein Grund, diese Form zum Ausdruck des Passivs noch mit einem Hilfsverb zu kombinieren. Dieses tritt nur im Präteritum und Futur hinzu, um das Tempus anzuzeigen: Prät.: Pamjatnik by l otkryt direkterem muzeja. 'Das Denkmal wurde vom Direktor des Museums enthüllt1 bzw. in geeignetem Kontext '... war ... enthüllt worden1. Fut.: Poruaen-ie budet vypolneno. 'Der Auftrag wird ausgeführt werden.' (Tauscher; Kirschbaum 1968: 332) Das einfache Partizip Präteritum Passiv der perfektiven Verben ohne zusätzliches Hilfsverb drückt natürlich ein Zustandspassiv aus, das durch die Vollendung der im Verb ausgedrückten Handlung herbeigeführt worden ist: Vrag pobezden 'Der Feind ist besiegt'. (Tauscher; Kirschbaum 1968: 332) Das Partizip Präsens Passiv, das von imperfektiven Verben gebildet wird und ein Handlungspassiv ausdrücken könnte, ist, insbesondere in prädikativer Verwendung, ungebräuchlich. Das kombinierende Verfahren, mit dessen Hilfe in den germ. Sprachen Zustands- und Handlungspassiv unterschieden werden, ist, wie schon beim Tempus, im Russischen auch hier nicht eingesetzt worden. Das Deutsche wechselt zu diesem Zweck das Hilfsverb der kombinierenden Konstruktion: Das Rätsel ist gelöst. (Zustand, perfektiv) Das Rätsel wird gelöst. (Handlung, imperfektiv) Das Englische schachtelt für das Handlungspassiv die beiden kombinierenden Konstruktionen für Passiv und Verlaufsform ineinander: The riddle is solved. (perfektiv) The riddle is being solved, (imperfektiv).
77
2.1.4. Person/Numerus Die beiden Kategorien werden schon im Indogermanischen weitgehend zusammen in jeweils einer Endung für jede mögliche Kombination ausgedrückt. Einen gewissen Ansatz zur agglutinierenden Bildung zeigt nur die 3. Person mit den Endungen -t (i) (3. Sg.) und -n-t(i) (3. P L ) , z.B. in lat. porta-t 'er (sie, es) trägt 1 und porta-n-t 'sie tragen'. Allerdings kann man -n- nicht wirklich als agglutiniertes Morph für das Pluralmorphem in der Verbalflexion betrachten, da es in den Endungen der 1. und 2. Person Plural (z.B. porta-mus, porta-tis) nicht enthalten ist. Erweitert man also das Paradigma von der 3. Person auf die 1. und 2., so führt die Analyse eben doch wieder zu Flexionsendungen, in denen Person und Numerus verschmolzen sind.
Auch die isolierten Subjektpronomen, die in mehreren modernen Sprachen obligatorisch zu den Endungen hinzutreten oder sie ersetzen, haben dieses Verhältnis unangetastet gelassen. 2.1.4.1. Zur Trennbarkeit von Person und Numerus Es könnte vielleicht befremden, daß bei der allgemeinen Tendenz zur Isolierung der Ausdrücke für graititatische Kategorien, die wir bisher in den modernen Sprachen festgestellt haben, so wenig Ansätze vorhanden sind, auch Person und Numerus voneinander zu isolieren. Zumindest würde man eine etwas regelmäßigere Flexionsbeziehung zwischen den Formen des Singulars und den entsprechenden des Plurals erwarten als die Suppletion ganzer Wörter wie -Iah - wir, du - ihr. Wirkliche Ableitung des Plurals von Singular durch Agglutination bzw. Flexion hat nur das Personalpronomen der 3. Person im Französischen, Spanischen und Rassischen: Frz.: -il (Mask. Sg.), Us (Mask. PI.), eile (Fern. Sg.), elles (Fern. PL). (Hörbar wird der Unterschied heute allerdings nur vor vokalisch anlautendem Folgewort bei Bindung.) Sp.: 'el (Mask. Sg.), ellos (Mask. PL), ella (Fern. Sg.), ellas (Fern. PL). RUSS.: on (Mask.), ona (Fern.), ono (Neutr.) - oni (PL) Im Deutschen besteht immerhin eine gewisse formale Beziehung zwischen Singular und Plural in der 3. Person, da, wie in der ganzen pronominalen Flexion, der Plural gleich dem Singular Fanininum ist: sie. Im modernen Englischen besteht dagegen nicht einmal diese formale Beziehung zwischen Singular he, she, it und Plural they.
78
Diese Verhältnisse auf der Ausdrucksseite entsprechen durchaus denen auf der Inhaltsseite. In der Tat liegt ein echtes Mehrzahlverhältnis nur in der 3. Person vor: Er», sie, es bezeichnen jeweils nur eine Person oder einen Gegenstand, die vom Sprecher und Angesprochenen verschieden sind, eie mehrere. Wir hingegen bezeichnet nicht Inner mehrere Sprecher (es sei denn, sie sprechen im Chor), -ÜTT nicht iimver mehrere Angesprochene. Gemeint ist jeweils nur eine Grucpe von mehreren Personen, die den Sprecher bzw. den Angesprochenen enthält, die aber nicht alle an der Sprechsituation teilnehmen müssen. (S. dazu die Analyse von Perez-Alonso (1977), der sogar zu dem Schluß könnt, daß die 1. und 2. Person eigentlich plurallose Kategorien sind.) Insofern ist bei der 1. und 2. Person die Aufspaltung in Singular und Plural und die Identifizierung dieser Opposition mit derjenigen der 3. Person eine nicht ganz zwingende Entscheidung der Grammatiker; wir werden hier jedoch die einmal eingebürgerte Terminologie beibehalten. 2.1.4.2. Zum Ausdruck durch Flexion und/oder Isolation In den germanischen Sprachen, im Französischen und Russischen hat sich zxxn Ausdruck von Person/Numerus zusammen das isolierende Verfahren durchgesetzt, aber nicht anstelle von, sondern zunächst zusätzlich zum flektierenden Ausdruck durch Verbalendungen, so daß, zumindest in der ersten Phase, Person/Numerus zweimal ausgedrückt wurden, einmal isolierend als Subjektprononen, einmal durch Flexion als Verbalendung. Diese Redundanz kennte auf den ersten Blick befremdend wirken, bei genauerer Betrachtung erweist sie sich jedoch als gar nicht so verwunderlich und außergewöhnlich. Freilich würde es für die Information, welcher Person das Verb zugeordnet ist, genügen, wenn diese nur einmal ausgedrückt würde, entweder im Subjektproncmen oder am Verb. Die Leistung der neuen Subjektpronomen erschöpft sich jedoch nicht in der redundanten Nennung von Person und Numerus. Vielmehr dienen sie einem Bedürfnis nach Analogie des Satzbaues, auf das wir noch näher eingehen werden. Erstens wird durch sie das Subjekt immer isoliert vom Verb ausgedrückt, nicht nur in Sätzen mit nicht-pronominalem Subjekt, und zweitens wird durch Kongruenz mit dem Verb in Person/Numerus die Relation zwischen Subjekt und Verb auf die gleiche Weise wie beim nicht-pronominalen Subjekt ausgedrückt. (Hier kongruiert nur der Numerus, was beim Personalpronomen
79
ja wegen der erwähnten Verschmelzung von Person und Numerus nicht möglich ist.) Freilich ist Kongruenz eine verhältnismäßig aufwendige Methode, Relationen auszudrücken, zumal, wenn sie wie im Fall der Subjektproncmen nicht der einzige Ausdruck ist, denn diese Pronomina sind als Subjekt im allgemeinen zusätzlich durch Kasus und/oder Wortstellung markiert. Daher haben einige Sprachen die Verbalendungen aufgegeben. Als Gegenpole in dieser Beziehung können das Englische und das Russische gelten: Im Präsens hat das Englische überhaupt nur noch eine einzige Endung, die der 3. Person Singular /-s/, in den anderen Person/Numerus-Kombinationen haben die Personalpronomina die Verbalendungen völlig ersetzt. Das Russische dagegen hat sechs wohlunterschiedene Personalendungen am Verb und zusätzlich sechs nicht ganz obligatorische, aber doch meistens gebrauchte Personalpronomina. 2.1.5. Zusammenfassung Der Überblick über die Kategorien des Verbs hat noch einmal verdeutlicht, welche Bedeutung den analytischen Verfahren, insbesondere aber dem kombinierenden in den germ, und ran. Sprachen zukommt, sei es zum Ersatz alter flektierender Formen, sei es zur Schaffung neuer Kategorien. Allein schon wegen dieser außerordentlichen Häufigkeit müssen wir den kombinierenden Verfahren im folgenden eine eigene, selbständige Rolle und Beurteilung einräumen. Im Vergleich mit den germ, und rom. Sprachen muß es uns auffallen, daß im Russischen das kombinierende Verfahren geradezu fehlt: Das Verbalsystem beruht auf dem flektierenden und dem isolierenden Verfahren. Es drängt sich das Gefühl auf, daß hinter den Veränderungen doch so etwas wie ein einheitliches Prinzip als übergeordnetes "Ziel" gestanden haben könnte, das in seiner schwächsten und negativen Formulierung besagt, daß das kombinierende Verfahren ausgeschlossen werden sollte. "Ziele" sprachlicher Entwicklung (linguistic targets), die ganze Sprachsysteme oder doch zumindest Teilsysteme erfassen, und zu deren Verwirklichung mehrere Veränderungen scheinbar unabhängig voneinander zusammenwirken, sind in letzter Zeit wieder explizit zum Gegenstand der Forschung geworden, besonders Im Bereich der Phänologie und Syntax. (So z.B. Kaiman 1974 über die Zweitstellung des Verbs im Deutschen.)
80
Implizit stellen natürlich auch "lebensfähige Vokalsysteme" und "optimale generative Grammatiken" solche Ziele dar. (S. Kap. I) Ob bestinmte morphologische Verfahren solche Ziele darstellen können und wenn ja, warum, auf diese Frage werden wir im folgenden vielleicht teilweise eine Antwort geben können. (S.S. 215 f f . ) 2.2. Die Kategorien des Nomens 2.2.1. Kasus Wir könnten den Wandel auf dem Gebiet des Kasus sehr schnell mit der altbekannten Bemerkung erfassen, daß in den modernen Sprachen Präpositionen und feste Konstituentenfolge die Kasusflexive ersetzt haben. Dieses Urteil ist zwar richtig, aber noch recht pauschal. Frz.: Obeir a qqn. 'jemandem gehorchen' ersetzt nämlich lat. oboedire alioui nicht in demselben Sinne wie frz. venir par bateau "zu Schiff kommen' lat. nave venire, und dies ist wieder ein anderer Vorgang als die Ersetzung von dt. sich jemandes erinnern durch sich an jemanden erinnern. Die Unterschiede ergeben sich aus der Entwicklung der grammatischen Kategorie 'Kasus' selbst. Wir betrachten zunächst die Verbalkasus, also alle außer dem adnominalen Genitiv. 2.2.1.1. Tiefenkasus als Klassen von semantischen Relationen Wir gehen aus von der Interpretation des finiten Verbs (bzw. des Adjektivs, Partizips, deverbalen Substantivs) als eines ein- oder mehrstelligen Prädikats, dessen Argumente Nominalphrasen sind. Dabei gehört zur Semantik eines jeden Verbs die Information, in welchen Relationen eine oder mehrere Argumente zu ihm stehen müssen bzw. können. So ist z.B. lieben ein zweistelliges Prädikat: Das eine Argument ist eine Person, die liebt, das andere eine Person oder Sache, die geliebt wird. Diese Relationen kann man klassifizieren und so zu einer eventuell begrenzten und universellen Anzahl von sogenannten Tiefenkasus wie z.B. Agentiv, Benefaktiv, Lokativ usw. kommen. Tiefenkasus könnte man also als 'Klassen von semantischen Relationen1 bezeichnen.
81 2.2.1.2. Lexikalischer versus granmatischer Ausdruck für Tiefenkasus Die Sprachen unterscheiden sich nun darin, wie sie diese Relationen ausdrücken. Prinzipiell gibt es zwei Möglichkeiten: Lexikalischen und grammatischen Ausdruck. Lexikalische Ausdrücke für Relationen zwischen Nominalphrasen und Verben sind in unseren Sprachen Präpositionen, wie z.B. in Der Baum steht in_ dem Garten. Die Zuordnung verläuft also in diesem Falle: semantische Relation lexikalisches Morphem. Die Präposition benennt also die entsprechende Relation individuell (bzw. so individuell, wie Lexeme, die keine Eigennamen sind, eben benennen können). Beim grammatischen Ausdruck verläuft die Zuordnung über eine grammatische Kategorie. Der einfachste Fall ist der, daß einer Klasse semantischer Relationen, z.B. Lokativ, genau eine syntaktische Kategorie, z.B. 'Ortsergänzung1 entspricht (die in diesem Fall nicht etwa ein lexikalisch markierter Einzelfall einer syntaktischen Kategorie 'adverbiale Ergänzung' sein darf, wie im Deutschen). Die syntaktische Kategorie wird ihrerseits wieder durch ein bestimmtes morphosyntaktisches Ausdrucksverfahren, z.B. eine Oberflächenkasusendung, ausgedrückt. In diesem Falle geht also ein direkter, von Verb unabhängiger Weg von Kasusmorph zu der zugrundeliegenden semantischen Relation. 2.2.1.3. Die 'konkreten Kasus1: Ersetzung durch lexikalischen Ansdruck in den germ, und ran. Sprachen, partielle Erhaltung im Russischen Da die auf diese Weise ausgedrückten Relationen im umgangssprachlichen Sinne verhältnismäßig 'konkret' sind, hat man die entsprechenden syntaktischen Kategorien oft die 'konkreten Kasus' genannt (Lyons 1968; 1971: 299), oder auch "Kasus der Anschauung" (Jakobsohn 1923: 2O7) Wir werden die einmal eingeführte Bezeichnung 'konkret1 beibehalten, obwohl sie den Sachverhalt nicht genau trifft, denn Relationen sind nie Konkreta. Insofern sind die 'abstrakten Kasus', auf die wir gleich eingehen werden, nicht abstrakter als die 'konkreten'. Der Unterschied liegt vielmehr in der Zuordnung zwischen semantischer Relation und syntaktischer Kategorie.
82
Für das Indogermanische niitmt man bekanntlich drei konkrete Kasus an: Lokativ, Ablativ und Instrumental. Sie sind in unseren germ, und rom. Beispielsprachen als grammatische Kategorien verschwunden. Die zugrundeliegenden semantischen Relationen werden lexikalisch durch Präpositionen ausgedrückt. So ist z.B. die ehemalige grammatische Kategorie des lat. Instnmentals im Französischen aufgelöst in eine Fülle von einzelnen Präpositionen, die in Abhängigkeit von der jeweiligen Tätigkeit und dem verwendeten Mittel die einzelne Relation viel individueller bezeichnen als die grammatische Kategorie, so. z.B.: montrer au doigt (Körperteil) 'mit dem Finger zeigen1 p§aher a la ligne (typisiertes Werkzeug) 'angeln1 (wörtlich: 'mit der Angel fischen1) je peohe ccoec ma plus longue ligne (individuell gehandhabtes Werkzeug) 'ich fische mit meiner längsten Angel* par avion (Transportmittel) 'mit Luftpost'. Das Russische dagegen besitzt noch einen Instrumental als grammatische Kategorie: go-oorit' gramkvm golosam 'mit lauter Stimme sprechen' pisaf karandasom 'mit Bleistift schreiben'. Ähnlich wie der lat. Ablativ steht die russische grammatische Kategorie Instrumental nicht mehr nur für den Tiefenkasus 'Inst.', sondern kann je nach Verb noch eine Mange andere Relationen ausdrücken, und ist damit auf dem besten Wege, zu einem 'abstrakten1 Kasus zu werden. Der russ. Präpositiv entspricht dem ehemaligen Lokativ, steht heute jedoch nur noch mit Präpositionen. Damit ist der Ausdruck der lokalen Relationen auch hier primär auf lexikalische Mittel übergegangen. Der Kasus selbst hat höchstens noch distinktive Funktion nach einigen lokalen Präpositionen, die die Richtung auf einen Ort hin oder die Lage an einem Ort ausdrücken können: Im ersten Fall steht der Akkusativ, im zweiten der Präpositiv (wie im Deutschen Akkusativ und Dativ), z.B. v univerzitet (Akkusativ) 'in die Universität* v univerzitete (Präpositiv) 'in der Universität1 Damit verwischt sich im Russischen allmählich der Unterschied, den Jakobsohn (1923) in bezug auf die Aufrechterhaltung der grammatischen Kategorie Kasus zwischen den Centum- und den Satemsprachen festgestellt hat:
83
Die Centumsprachen haben die konkreten Verbalkasus aufgegeben, die Satemsprachen haben sie bewahrt. Beibehalten wurde dagegen im Deutschen, Englischen und Russischen die Kategorie des 'konkreten 1 adnominalen Genitivs, der ein Zugehörigkeitsverhältnis zwischen der Nominalphrase im Genitiv und ihrem Bezugswort ausdrückt: das Haus meines Vaters, engl. my father's house, russ. dorn otca. Im Englischen und Deutschen greifen jedoch isolierende Ersatzkonstruktionen immer mehr um sich: das Haus von meinem Vater, meinem Vater sein Haus, engl. bei Nicht-Lebewesen schon obligatorisch, z.B. the top of the mountain 'die Spitze des Berges'. In den rom. Sprachen hat die Konstruktion mit den Präpositionen frz. de (sp. de, it. di) die flektierend gebildeten lat. Genitivformen ganz abgelöst, z . B . f r z . la maison de mon pere 'das Haus meines Vaters". Inwieweit die neuen isolierenden Konstruktionen noch als Ausdrücke für eine grammatische Kategorie 'Genitiv' anzusehen sind, ist eine schwierige Frage, die wir hier ausklammern.
2.2.1.4. Die 'abstrakten Kasus' Als 'abstrakte Kasus" werden traditionell Nominativ, Akkusativ, (objektiver) Genitiv und Dativ bezeichnet. Sie stehen für die grammatischen Kategorien 'Subjekt1, 'direktes Objekt' und zwei verschiedene indirekte Objekte, eben das Genitivobjekt und das Dativobjekt. Bei ihnen ist es unmöglich, eine 1:1-Beziehung zwischen einer Klasse von semantischen Relationen und der grammatischen Kategorie herzustellen. Bekanntlich kann dieselbe granmatische Kategorie, z.B. Subjekt, je nach Verb die verschiedensten Tiefenkasus repräsentieren und, umgekehrt, derselbe Tiefenkasus durch verschiedene grammatische Kategorien ausgedrückt werden, z.B. Tiefenkasus grammatische Kategorie ich schreibe. ich erinnere mich. Ich begegne ihn. Ich treffe ihn.
Agentiv Experiencer Objektiv
Subjekt indirektes Objekt direktes Objekt
(Die [verkürzten] Beispiele sind entnommen einer vollständigeren A u f stellung der verschiedenen Zuordnungsmöglichkeiten für das Deutsche in Weigand 1978: 65 f f . )
Die abstrakten grammatischen Kasuskategorien bezeichnen also nicht direkt eine Klasse von semantischen Relationen, sondern sie identifizieren diejenige Nominalphrase, die in einer vom Verb determinierten Relation zum Verb steht. Zur Lexikoninformation eines Verbs gehört also nicht nur, welche Argumente es zu sich niitmt, sondern auch, durch welche syntaktischen
84
Kategorien diese Argumente zu identifizieren sind. So enthält z.B. das Lexem lieben die Information, daß eine liebende und eine geliebte Person bzw. Sache vorhanden sein müssen und daß, falls an der Oberfläche lieben nicht als Passiv markiert wird, die liebende als Subjekt, die geliebte als direktes Objekt erscheinen wird. In diesem Sinne schreibt Werner (1975c: 53): "Übrigens würde ich auch die Kasus (des heutigen Deutschen), ähnlich wie das Genus, vor allem als ein solches indizierendes Mittel zur Identifizierung (von Argumentpositionen) interpretieren."
Wir sind auf den Unterschied zwischen abstrakten und konkreten Kasus so ausführlich eingegangen, weil nur die abstrakten in unseren modernen Beispielsprachen als grammatische Kategorien erhalten und damit für unsere Untersuchung der Ausdrucksverfahren für granmatische Kategorien relevant sind (mit den für das Russische gemachten Einschränkungen). 2.2.1.5. Die erhaltenen alten syntaktischen Kategorien in den Einzelsprachen Wir müssen dabei zunächst für jede Sprache entscheiden, welche grammatischen Kategorien sie erhalten hat. Am einfachsten lassen sich natürlich die Kategorien feststellen, die an der Oberfläche durch Kasusflexive ausgedrückt werden: Das Deutsche und das Russische haben vier solche an der Oberfläche durch Flexionsendungen unterschiedene 'abstrakte1 syntaktische Kategorien: Subjekt, direktes Objekt, indirektes Objekt im Dativ, indirektes Objekt im Genitiv (wobei das letzte im Deutschen eigentlich nur noch lebendig ist in sich der Stimme enthalten] , Die entsprechenden Oberflächenkasus sind Nominativ, Akkusativ, Dativ und Genitiv. Das Französische (und andere ran. Sprachen) haben dagegen nur noch drei durch Oberflächenkasus unterschiedene Kategorien beim Personalpronomen der 3. Person: Subjekt, markiert durch Nom. il(s)} elle(s), direktes Objekt, markiert durch Akk. le, la, les, indirektes Objekt, markiert durch Dat. lui, leur. Das Englische hat im entsprechenden Personalpronomen nur zwei verschiedene Oberflächenkasus he und him, die wenigstens im Personalpronomen durch Flexion identifiziert werden. In den anderen nominalen Vfortarten werden bekanntlich Subjekt und direktes Objekt durch ihre Stellung vor bzw. hinter dem flektierten Verb, also durch das implizit isolierende Verfahren, ausgedrückt. (S. die Bei-
85
spiele S. 50 f. auch für die Besonderheit beim direkten Objekt im Spanischen) Im Deutschen und Französischen zeigt bereits die Flexion, daß außerdem auch noch die Kategorie des indirekten Objekts existiert. Im Französischen wird sie bei den nicht nach Kasus flektierenden nominalen Wortarten (also allen außer den Personalpronomina) durch eine Präposition vor der Nominalphrase ausgedrückt. Dem Dativ lui, entspricht dabei die Präposition ä:obeir a qqn. 'jemandem gehorchen1, lui obeir 'ihm gehorchen'. Das Entscheidende ist hier, daß die Präposition keine eigene lexikalische Bedeutung hat (wie diejenigen, die die 'konkreten Kasus' ersetzt haben), sondern lediglich die syntaktische Kategorie 'indir. Obj.' markiert. Der Unterschied zeigt sich deutlich daran, daß bei lexikalischem Gebrauch von die Präpositionalphrase sich nicht als Ganze proncminalisieren läßt: penser a qqn. 'an jemanden denken1 aber nicht lui penser. Im Englischen weist die Möglichkeit, bestimmte Präpositionalphrasen mit to durch einfache Nominalphrasen in anderer Stellung zu ersetzen, diese als indirektes Objekt aus. Man vergleiche dazu He gives the book to John - He gives John the book. - He gives him the book.
mit: He mentions the book to John. him the book.
He mentions John the book. -
He mentions
In den germ, und rom. Sprachen existieren also heute noch drei der 'abstrakten1 syntaktischen Kategorien, die früher und teilweise noch heute durch Oberflächenkasusendungen gekennzeichnet waren bzw. sind: Subjekt, direktes Objekt, indirektes Objekt. Zum Ausdruck dieser Kategorien ist das flektierende Verfahren teilweise durch das explizit bzw. implizit isolierende Verfahren ersetzt worden. 2.2.1.6. Das Präpositionalobjekt als neue syntaktische Kategorie Das bedeutet jedoch nicht, daß die 'abstrakten' Ergänzungen zu allen Verben in ihrer jeweiligen Kategorie geblieben wären. Es gibt nämlich viele Fälle, in denen, wie beim indirekten Objekt im Englischen und Französischen, die NP zwar durch eine Präposition ohne eigene Bedeutung angeschlossen wird, ohne daß die ganze Präpositionalphrase jedoch als indi-
86
rektes Objekt gelten könnte, da sie sich weder als ganze durch ein flektiertes Perscnalproncmen ersetzen läßt noch (im Englischen) ohne Präposition gebraucht werden könnte. Im Französischen sind dies vor allem mit de eingeleitete Präpositionalphrasen, z.B. nach user 'gebrauchen, anwenden1 se souvenir 'sich erinnern1 (z.B. user d'un remede 'eine Arznei anwenden1, ee souvenir des beaux temps 'sich an die schönen Zeiten erinnern"). Aber auch andere Präpositionen sind in dieser Verwendung möglich: sur 'über' nach converser "sich unterhalten1 und eventuell auch das genannte a nach penser, wo die ursprünglich räumliche Bedeutung von a 'zu, nach' nur noch in sehr übertragenem Sinne mitspielt. Im Englischen gehören hierher z.B. To dispose of something 'über etwas verfügen', to depend on something 'von etwas abhängen1, 'sich auf etwas verlassen1, to abound in something 'an etwas Überfluß haben'. Deutsche Beispiele haben schon die Übersetzungen zu Genüge gebracht: In sich erinnern an, sich unterhalten über, sich verlassen auf werden die Präpositionen automatisch von Verb gefordert und leisten wie die Kasusendungen bei den abstrakten Kategorien nicht mehr, als das Argument zu identifizieren, dessen Beziehung zum Prädikat schon im Prädikat selbst implizit enthalten ist. Die DUDEN-Granmatik nennt diese Konstruktionen 'Präpositionalobjekte' (Grebe 1966: 477 ff.), und wir wollen bei dieser Bezeichnung bleiben, obwohl sie nicht in allen anderen einzelsprachlichen Gramnatiken in genau diesem Sinne eingeführt ist. Während die modernen indirekten Objekte noch im wesentlichen dieselbe grantnatische Kategorie darstellen wie die alten Dativobjekte, kann man die modernen Präpositionalobjekte nicht unbedingt identifizieren mit den ehemaligen Genitivobjekten. Zwar verlangen viele Verben, die früher mit dem Genitiv standen, heute ein Präpositionalobjekt (z.B. sich an eine Sache erinnern statt sich einer Sache erinnern), aber die ehemaligen Genitivobjekte sind beileibe nicht die einzige Quelle der modernen Präpositionalobjekte. Diese können auch die ehemaligen 'konkreten Kasus' ersetzen (z.B. lat. abundare aliqua re (Inst.) frz. abonder en qch. 'an etwas Überfluß haben'.) Vor allem aber wurden viele Verben selbst durch andere Verben, meist Neuschöpfungen, ersetzt, die von vorneherein ein Präpositionalobjekt regierten, z.B. lat. meminisse durch subvenire, daraus frz. se souvenir de qch. 'sich erinnern an1.
87
Noch im Lateinischen kamen Präpositionen fast nur als lexikalische Einheiten in adverbialen Bestimmungen vor: die Fälle, in denen sie zur Bildung von 'abstrakten1 Präpositionalobjekten dienen, erwähnt die Schulgraimiatik noch als Sonderfälle, z.B. pertinere ad aliquid 'sich auf etwas beziehen1. Die normale Kennzeichnung für abstrakte Kategorien waren eben Kasusendungen. In der Granmatik der modernen rom. Sprachen hingegen ist die Kategorie des Präpositionalobjekts als einer der Normalfälle zu werten. Wir betrachten daher das Präpositionalobjekt als eine neue granmatische Kategorie, die mehrere alte Kategorien ersetzt hat. Bei Verben, die früher einen durch Flexion gebildeten Oberflächenkasus verlangten und heute ein Präpositionalobjekt, hat nach dieser Interpretation nicht nur das morphosyntaktische Verfahren zum Ausdruck derselben grammatischen Kategorie gewechselt, sondern die Kategorie selbst hat sich geändert. Es ist bemerkenswert, daß trotz dieser komplizierten Wandlungsprozesse gegenwärtig in unseren germ, und rom. Beispielsprachen wieder je vier abstrakte syntaktische Kategorien entstanden sind. (Rechnet man den im Verschwinden begriffenen objektiven Genitiv im Deutschen hinzu, sind es im Deutschen [noch] fünf.) Liegt auch hier irgendetwas Wesentliches, ein "Ziel" sprachlicher Entwicklung versteckt? 2.2.1.7. Zusammenfassung: Das Vordringen des isolierenden Verfahrens Das wichtigste moderne Ausdrucksverfahren in den germ, und rom. Sprachen ist das isolierende. Dies hat zwei Gründe: Erstens die Ersetzung des flektierenden Verfahrens durch das implizit oder explizit isolierende zum Ausdruck der erhaltenen alten granroatischen Kategorien, und zweitens die Schaffung der neuen Kategorie 'Präpositionalobjekt', das von vorneherein nach dem isolierenden Verfahren ausgedrückt wurde. Selbst im Deutschen, das eigentlich noch Flexion in allen nominalen Wortarten hat, sind Nominativ und Akkusativ in vielen Fällen, z.B. in allen Feminina und Neutra und im Plural, homonym, so daß auch hier bereits die Wortstellung zum eigentlichen Ausdrucksmittel geworden ist. Das Rassische ist, wie erwähnt, viel konservativer. Es hat nicht nur die vier alten 'abstrakten Kasus' als grammatische Kategorien bewahrt, sondern ist auch beim flektierenden Ausdruck für sie geblieben. Hinzu kommen noch die beiden (ehemals) konkreten Kasus, Instrumental und Prä-
88
positiv. Die zunehmende Herausbildung eines Präpositionalobjekts (z.B. prinjat'sja za + Akkusativ 'etwas beginnen1 und viele weitere Beispiele 4 in Tauscher; Kirschbaum 1968: 445 f f . ) , der lexikalische Ausdruck des ehemaligen Lokativs durch Präpositionen und der Übergang des Instrumentals zum "abstrakten Kasus1 scheinen jedoch auch im Russischen in dieselbe Richtung zu weisen, in die die germ, und ran. Sprachen gegangen sind. 2.2.2. Numerus, Genus, Definitheit Die Ausdrücke für diese drei Kategorien sind in ihrer Geschichte so eng miteinander verknüpft, daß wir sie am besten zusammen behandeln. 2.2.2.1. Verbindung von Genus und Numerus mit Kasus in den alten Sprachen und im Russischen Im Lateinischen, Urgermanischen und Altkirchenslawischen gab es bekanntlich die Definitheit noch nicht als obligatorische grammatische Kategorie, und die beiden anderen Kategorien wurden zusartmen mit dem Kasus in Portmanteaumorphen für zwei (Kasus/Numerus) beim Substantiv bzw. drei (Kasus/Numerus/Genus) beim Adjektiv und Pronomen ausgedrückt. Dieser Zustand ist unverändert im Russischen bis heute beibehalten. 2.2.2.2. Exkurs: Zum Verhältnis zwischen grammatischem und natürlichem Geschlecht Wir sollten, um Mißverständnissevorzubeugen, hier vielleicht begründen, warum wir von einer Genusflexion nur beim Pronomen und Adjektiv reden, nicht aber beim Substantiv, da in dieser Frage in der Forschung offenbar keine einhellige Meinung besteht. Das Genus als grammatische Kategorie ist zwar als inhärentes Merkmal mit jedem Substantiv verbunden und wird mit diesem gelernt, aber es wird nicht am Substantiv selbst durch Flexion ausgedrückt. Ware dies der Fall, so müßte derselbe Substantivstamm seine Form in Abhängigkeit vom Genus ändern. Das gilt nur für Pronomen und Adjektive, nicht aber für das Substantiv. Dem scheinen alle Fälle zu widersprechen, in denen vom selben Stamm ein männliches und ein weibliches Substantiv gebildet werden können, z.B.
89
lat. viator - viatrix 'Sieger - Siegerin1. Hier wechselt jedoch nicht primär das grammatische, sondern das natürliche .Geschlecht und damit das Wortbildungssuffix. Dieser Wechsel ist in den meisten Fällen von einem Wechsel des grammatischen Geschlechts begleitet, aber es gehört ja gerade zur Definition des speziell grammatischen Geschlechts, daß es nicht mit dem natürlichen identisch ist. Dieses wird am deutlichsten dadurch, daß auch Dinge ohne natürliches Geschlecht ein granmatisches haben, und daß das gramnatische Geschlecht dem natürlichen widersprechen kann, z.B. in das Mädchen. Viator und viatrix sind also als zwei getrennte Lexeme zu betrachten, zwischen denen ein Ableitungsverhältnis durch Wortbildung besteht. (S. auch die ausführliche Darstellung in Matthews 1974.) Das bedeutet natürlich nicht, daß man einem Substantiv sein Genus in keinem Fall 'ansehen1 kann. Bestimmte Wortbildungselemente und Flexionsklassen (z.B. lat., sp. , it. a-Klasse (fern.), Suffixe von nomina agentis, z.B. lat. -tor, -trix, dt. -in, oder auch dt. -heit, -keit, frz. -age (in mehrsilbigen Wörtern) ) kommen (bis auf sehr wenige Ausnahmen wie z.B. lat. agriaola "Bauer" (mask.)) nur an Substantiven mit bestimmten Genera vor, aber sie dienen deshalb nicht dem Ausdruck des Genus im selben Sinne wie die Genusflexive der Adjektive und Pronomina. Solche Regularitäten entstehen dadurch, daß ein bestimmtes Wortbildungselement mit einem bestimmten Genus verbunden sein muß, solange es produktiv ist, denn bei jedem neugebildeten Wort muß ja von Anfang an klar sein, welches Genus es hat. Erst wenn ein Wortbildungselement nicht mehr produktiv ist, können einzelne Wörter ffo