230 77 15MB
German Pages 255 [256] Year 1971
Konzepte der Sprach- und Literaturwissenschaft 10
Ronald W. Langacker
Sprache und ihre Struktur
Übersetzt von Gerd Fritz
Max Niemeyer Verlag Tübingen 1971
Die amerikanische Originalausgabe erschien 1968 unter dem Titel „Language and Its Structure. Some Fundamental Linguistic Concepts".
Redaktion: Lothar Rotsch
ISBN 3-484-22009-0 © für die amerikanische Ausgabe: Harcourt Brace Jovanovich, Inc. 1967, 1968 © für die deutsche Ausgabe: Max Niemeyer Verlag Tübingen 1971 Alle Rechte vorbehalten. Printed in Germany Herstellung: Papierhaus Mack Grafischer Betrieb Schönaich Einband von Heinr. Koch Tübingen
Inhaltsverzeichnis
Vorwort des Übersetzers
VII
Vorwort I
XI
GRUNDKONZEPTE
1
1. Statt einer Einleitung
3
Warum es wichtig ist, die Sprache zu verstehen Linguistik
3 5
2. Ein erster Blick auf die Sprache
7
Spracherwerb Der Ursprung der Sprache und die Gattung Mensch Laut und Bedeutung Sprachliche Teilsysteme Grammatikalität Sprache und Denken
7 10 14 19 23 27
3. Sprachliche Vielfalt
34
Sprachen und Dialekte Vereinheitlichende Kräfte
34 43
II DIE SPRACHSTRUKTUR
47
4. Der Aufbau der Grammatik
49
Einfache lexikalische Einheiten Komplexe lexikalische Einheiten Phonologische, semantische und syntaktische Repräsentation Die Bedeutung und ihre Realisierung Sprachliche und psychische Beschränkungen
49 56 62 65 75
5. Syntaktische Systeme
80
Oberflächenstrukturen Komplexe Sätze Die Beziehung zwischen Begriffsstruktur und Oberflächenstruktur
80 86 97
V
Syntaktische Regeln Syntaktische Skizze eines Satzes 6. Phonologische Systeme Artikulatorische Phonetik Distinktive Unterschiede Phonologische Regeln Morphologie
104 119 127 127 138 143 155
III SPRACHVERWANDTSCHAFT
161
7. Sprachwandel
163
Entlehnung Innerer Wandel Sprachwandel und Spracherwerb Nochmals: Dialekte
163 169 178 184
8. Genetische Sprachverwandtschaft
189
Stammbäume Die komparative Methode Interpretation des Lautwandels Die indoeuropäische Sprachfamilie
189 197 210 215
9. Die Universalität des Sprachbaus
219
Zum Wesen des Spracherwerbs Sprachliche Universalien Schluß Auswahlbibliographie Sachregister
VI
219 227 233 236 239
Vorwort des Übersetzers
In der amerikanischen Linguistik gibt es eine besondere Tradition von Einführungen in die Probleme und Erkenntnisse der wissenschaftlichen Sprachbetrachtung. Die Autoren dieser Werke halten wissenschaftliche Genauigkeit und Lesbarkeit der Texte nicht für unvereinbare Gegensätze. Sapirs „Language" (1921), Bloomfields „Language" (1933) und Hocketts „Course in Modern Linguistics" (1958) sind Klassiker dieser Art von Einführungen, die sich zwar zunächst an den Studenten der Linguistik wenden, aber gleichzeitig auch dem „general reader", also dem allgemein gebildeten und interessierten Leser, verständlich sind. In diese Tradition reiht sich auch das vorliegende Buch von Langacker ein. Mit charakteristischem Understatement stellt Langacker sein Buch nicht als Einfuhrung in die Linguistik vor, sondern als Anleitung zum besseren Verständis der Sprache. Gleichsam beiläufig wird der Leser mit dem neusten Stand der Linguistik vertraut gemacht. An breit ausgeführten Beispielen, die in einem der mündlichen Diktion nahestehenden Stil vorgetragen werden, kann man Schritt für Schritt die Lösung der gestellten Probleme mitvollziehen. Langacker kommt zwar nicht wie Sapir „ohne ein einziges diakritisches Zeichen" aus, verwendet jedoch formale Darstellungsweisen vorwiegend aus didaktischen Gründen. Seiner wissenschaftlichen Herkunft nach ist Langacker Generativist. Nach der spektakulären Entwicklung der generativen Grammatik war es an der Zeit, den etwa von Hockett behandelten Bereich — also auch Dialektgeographie und Diachronie — einmal in neuer Perspektive zu sehen, nachdem sich andere generative Darstellungen aus naheliegenden Gründen vorwiegend auf Fragen der Syntax beschränkt hatten. Langacker teilt mit Chomsky das besondere Interesse am Spracherwerb (Position des Rationalismus: angeborene Prinzipien) und an den sprachlichen Universalien. In einer grundsätzlichen Frage unterscheidet er sich jedoch von Chomsky: mit Lakoff und Ross („Is Deep Structure Necessary?", 1968) bezweifelt Langacker die Notwendigkeit einer Ebene der syntaktischen Tiefenstruktur, wie sie in Chomskys Modell von 1965 angenommen wird. VII
Stattdessen faßt er die Semantik als generativ auf. Er geht aus von einer Begriffsstruktur („conceptual structure"), die in einem sehr komplexen Prozeß von Regelanwendungen und Einfügungen von lexikalischen Einheiten in eine Oberflächenstruktur überführt wird. Das Entscheidende ist dabei das Ineinandergreifen von syntaktischen und semantischen Regeln, das schon Weinreich (1966) im Gegensatz zu Katz/Fodor (1963) postuliert hatte. In dem Abschnitt über „syntaktische Systeme" (11,5) stellt Langacker diesen Prozeß einleuchtend dar. Dies ist ihm umso eher möglich, als er es sich in einem einfuhrenden Werk leisten kann, auf rigorosen Formalismus im Detail zu verzichten. Verständlicherweise können in einer derartigen Darstellung Probleme der Forschung nur am Rande thematisiert werden. Das Verhältnis von Syntax und Semantik stellt Langacker von der Position der generativen Semantik aus dar, wobei er nur im Vorwort andeutet, daß diese Frage gegenwärtig noch sehr umstritten ist. Auch die Stellung und Darstellungsform der lexikalischen Einheiten ist keineswegs geklärt, wie Langacker selbst anmerkt (vgl. etwa Arbeiten von Katz, Weinreich und McCawley). Sein Morphembegriff ist ambivalent: er verwendet ihn einerseits im traditionellen, taxonomischen Sinn, andrerseits als Bezeichnung für den Lexikoneintrag, wofür Chomsky den Terminus „Formativ" vorgeschlagen hat. Problematisch bleibt schließlich die Definition der Begriffsstruktur und damit unmittelbar verbunden der Begriff der Bedeutung. Wie muß man die Zusammenhänge zwischen Objektwelt, kognitiver Perzeption, konzeptualisierter Struktur und (schon sprachlich zu denkender) Begriffsstruktur verstehen? Implizit geht Langacker von der Hypothese aus, daß semantische Strukturen letzten Endes mit den Strukturen der menschlichen Kognition identisch sind. Das wird deutlich, wenn er „conceptual Situation" und „conceptual structure" faktisch gleichsetzt (vgl. S. 247 der Originalausgabe). Eine gemeinsame Aufgabe von Psychologen und Linguisten sieht Langacker darin, diese Hypothese zu erhärten. Der einheitliche Ansatz des Buches führt gerade auch auf den Gebieten der Dialektgeographie und der diachronen Sprachbetrachtung zu interessanten Beobachtungen. Abschnitte wie „Sprachwandel und Spracherwerb" (111,7) und „Interpretation des Lautwandels" (111,8) lassen den heutzutage o f t etwas verstaubt wirkenden Gegenstand der historischen Sprachwissenschaft in neuem Licht erscheinen. Es erwies sich als nötig, die deutsche Ausgabe hier und da an den Wissensstand und die Informationserwartung des deutschsprachigen Lesers zu adaptieren. So wurde der Text — im Einvernehmen mit dem Autor — geringfügig gekürzt, im ersten Teil vor allem um die Abschnitte „A VIII
Thumbnail History of Language Study" (S. 7 - 1 1 des Originals) und „Writing" (S. 58—66 des Originals) im Dritten Teil um die Abschnitte über die außer-indoeuropäischen Sprachfamilien (S. 227—232 des Originals) mit Inhalten, die ohnehin anderenorts leicht zugänglich sind. Bei anderen, kleineren Raffungen wurde stets Bedacht darauf genommen, daß keine wesentliche Aussage verlorenging. Da es sich um eine Einführung handelt, erschien es ferner wünschenswert, auch die Beispiele soweit wie möglich aufs Deutsche umzustellen. Dies geschah stets dort, wo es ohne textverändernde Eingriffe möglich war. Wenn jedoch mit Beispielen ein Phänomen erläutert werden soll, das im Deutschen keine Entsprechung hat (z. B. bestimmte NullmorphemBildungen, phonologisch determinierte Plural-Allomorphe, bestimmte Probleme des Lehnworts), wurden die Beispiele der Originalsprache belassen. In der knappen Auswahlbibliographie wurden für diejenigen Titel, die auch in deutscher Übersetzung vorliegen, die bibliographischen Daten der deutschen Ausgabe ergänzt. Weiter wurden einige Titel von einführenden Werken hinzugefügt, die dem deutschen Leser leicht zugänglich sind. Diese sind durch Sternchen gekennzeichnet. Dem Autor habe ich Dank zu sagen für die Bereitwilligkeit, die Übersetzung vor dem Druck durchzusehen. Für geduldige Mitarbeit bei der Herstellung des Übersetzungsmanuskriptes danke ich Fräulein Traudl Kurrle.
Tübingen, im Mai 1971
Gerd Fritz
IX
Vorwort
Sprache und ihre Struktur ist gedacht als eine knappe, lesbare und moderne Einführung in das Wesen und die Struktur der Sprache, wie heutige Linguisten sie betrachten. Es ist in erster Linie eine Einführung in die Sprache und nicht in die linguistische Wissenschaft. Deshalb versucht das Buch auch nicht, die verschiedenen Ansichten von konkurrierenden Schulen der Linguistik kritisch zu durchleuchten und einander gegenüberzustellen oder deren Arsenale von Spezialbegriffen und Notationen einzuführen; es will vielmehr so klar und einfach als möglich grundlegende Erkenntnisse über die Sprache darstellen. Teil I dient als Einleitung. Kapitel 1 führt aus, inwiefern die Sprache ein untersuchenswerter Gegenstand ist. Kapitel 2 berührt einige verschiedene Aspekte und bereitet die ausführlichere Behandlung der Sprachstruktur vor, die in Teil II gegeben wird. Kapitel 3 behandelt die Dialektgeographie und den Fragenkreis Sprache und Gesellschaft. Teil II bietet eine synchronische (nicht-historische) Untersuchung der Sprachstruktur. In Kapitel 4 werden die lexikalischen Einheiten besprochen sowie die Art und Weise, wie die Komponenten einer Sprache aufgebaut sind, um Bedeutungen und Lautfolgen einander zuzuordnen. Die Kapitel 5 und 6 sind der Syntax und der Phonologie gewidmet. Teil III betrifft die Beziehung zwischen Sprachsystemen. In Kapitel 7 werden die historischen Beziehungen zwischen früheren und späteren Stufen einer einzelnen Sprache behandelt, Kapital 8 befaßt sich mit Verwandtschaftsbeziehungen zwischen verschiedenen Sprachen, während Kapitel 9 den Aspekt untersucht, unter dem alle Sprachen als verwandt angesprochen werden können, nämlich ihre erstaunlich weitgehende strukturelle Ähnlichkeit. Manche Linguisten wird meine Behandlung der lexikalischen Einheiten nicht befriedigen; es geht mir sogar selber so. Es wird immer deutlicher, daß die ganze Frage der lexikalischen Einheiten neu durchdacht werden muß, vor allem ihr Verhältnis zu den syntaktischen Regeln. Einstweilen sind aber Begriffe wie das Morphem nützlich, wenn man sie nicht XI
strapaziert. Wenige Leute, die sich mit generativer Grammatik beschäftigen, werden sich darüber wundern, daß ich die Begriffe der Tiefenstruktur und der interpretativen Semantik aufgegeben habe, wenn auch manche mir in meinem Verfahren nicht zustimmen werden. In jedem Fall wäre es unangebracht, den Kampf um die Tiefenstruktur in einem Buch wie diesem zu führen. Viele Leute haben auf die eine oder andere Art einen Beitrag zu diesem Buch geleistet. Vor allem möchte ich John Ross, Leonard Newmark und Julian Boyd für ihre Anregungen danken, sowie meiner Frau Peggy, die in Vielem geholfen hat.
XII
I
Grundkonzepte
1. Statt einer Einleitung
Warum es wichtig ist, die Sprache zu verstehen Sprache ist überall. Sie durchdringt unsere Gedanken, vermittelt unsere Beziehungen zu anderen und schleicht sich sogar in unsere Träume ein. Die ungeheure Masse menschlicher Kenntnisse wird in sprachlicher Form aufbewahrt und übermittelt. Die Sprache ist so allgegenwärtig, daß sie uns selbstverständlich ist, aber ohne sie wäre die menschliche Gesellschaft, wie wir sie kennen, unmöglich. Trotz ihrer Bedeutung für das menschliche Leben kennt man die Sprache nur ungenügend. Auch unter gebildeten Leuten gibt es tau sende von falschen Vorstellungen über die Sprache, und nicht einmal Linguisten von Beruf können den Anspruch erheben, sie völlig zu verstehen. Es wäre ein absoluter Irrtum, anzunehmen, daß das Wesen der Sprache offen zu Tage liege und daß wir alles über eine Sprache wissen, weil wir sie sprechen. Aber unsere Erkenntnis über dieses bemerkenswerte und rein menschliche Kommunikationsmittel wächst Schritt für Schritt. Der Zweck dieses Buches ist es, einen wichtigen Teil dessen, was wir von der Sprache wissen, für diejenigen zusammenzufassen, die wenig oder keine Vorbildung in Linguistik besitzen. Es gibt eine Reihe von Gründen, warum es sich lohnt, sich ein angemessenes Verständnis der Sprache zu erwerben. Erstens spielt bei vielen aktuellen Problemen die Sprache eine wesentliche Rolle. Bis zu welchem Grad sind Sprachunterschiede Verständnisbarrieren? Ist eine Universalsprache praktikabel oder wünschenswert? Ist eine Rechtschreibreform notwendig? Wie soll den Kindern das Lesen beigebracht werden? Sollten sich Wörterbuchautoren dem allgemeinen Gebrauch beugen? Lohnt sich für die Regierung einer vielsprachigen Nation (wie etwa Indiens) der Versuch, allen Sprechern eine Sprache als offizielle Nationalsprache aufzuzwingen? Und wenn, welche? In welcher Altersstufe sollten in unseren Schulen Fremdsprachen gelehrt werden? In welchem Maß werden Sprecher aus Minoritäten oder aus der Unterschicht durch ihre Sprache 3
in ihrem sozialen und wirtschaftlichen Fortkommen gehindert? Wir können hier keine Antworten auf diese außerordentlich schwierigen Fragen bereitstellen, aber wer eine gültige Antwort auf diese Fragen sucht, sollte sich nicht ohne ein Mindestmaß an Verständnis der Sprache auf den Weg machen. Zweitens sind Erkenntnisse über die Sprache von ungeheurer geistiger Bedeutung und sind direkt oder indirekt relevant für andere Disziplinen. Es spielt eine große Rolle für unser Menschenbild, zu wissen, ob die Sprache etwas Angelerntes oder etwas weitgehend Angeborenes ist. Anders gesagt: Die Sprache könnte einer der Testfälle sein, an denen sich der alte Streit zwischen Rationalisten und Empiristen entscheiden ließe. Die Rationalisten behaupten, daß die Menschen schon mit angeborenen Ideen zur Welt kommen und daß ein großer Teil der psychischen Organisation schon im Organismus angelegt ist. Dagegen behaupten die Empiristen, daß der Mensch psychologisch gesprochen als tabula rasa zur Welt kommt und daß die psychische Organisation fast völlig durch die Erfahrung bestimmt ist und nicht vererbt wird. Sowohl Rationalisten als auch Empiristen haben sich der Sprache zugewandt, um darin Beweise für ihre jeweiligen Ansichten über diese wichtige Frage zu finden. Dieses Gebiet werden wir in Kapitel 9 ausführlicher behandeln. Auch die Philosophen interessieren sich für die Sprache, und zwar als Instrument der philosophischen Analyse. Eignen sich natürliche Sprachen als Mittel philosophischer Untersuchung und Theorie? Kann man philosophische Irrtümer auf den falschen Gebrauch der Sprache zurückführen? Welche Beziehung besteht zwischen Sprache und Logik? Die Sprache ist auch für die Psychologie in verschiedener Hinsicht relevant. Man kann sogar die Untersuchung der Sprache als ein Teilgebiet der Psychologie ansehen, da die Sprache ja weitgehend ein geistiges Phänomen ist. Jede adäquate Theorie der menschlichen Psyche muß Aussagen über den Denkvorgang machen; dabei ist die Sprache von entscheidender Bedeutung, weil ein großer Teil unserer Gedanken sprachliche Form annimmt. Viele, wenn nicht die meisten unserer Begriffe werden in irgendeiner Form sprachlich bezeichnet. Deshalb ist die Beziehung zwischen Sprache und Begriffsbildung für den Psychologen von großem Interesse. Die Sprache ist auch ein wichtiger Prüfstein für Theorien über den psychischen Aufbau des Menschen. Sprachen sind hochgradig strukturiert, und wir sind in der Lage, ihre Strukturen recht detailliert zu identifizieren und zu beschreiben. Deshalb muß jede Theorie über den psychischen Aufbau den Strukturen Rechnung tragen, die wir als charakteristisch für menschliche Sprachen erkannt haben.
4
Auch die anderen Sozialwissenschaften können aus der Kenntnis der Sprache und ihrer Beschreibungsmethoden Nutzen ziehen. Da die Struktur der Sprache klarer zu Tage tritt als andere Strukturen, mit denen sich der Sozialwissenschaftler beschäftigt, dürfte die Untersuchung der Sprache für ihn lehrreich sein. Drittens ist eine Einführung in das Wesen der Sprache für denjenigen von Bedeutung, der sich für die mögliche praktische Anwendung der Ergebnisse linguistischer Forschung interessiert. Grundeinsichten über die Sprache sind zweifellos für jeden wertvoll, der eine Sprache lernt oder lehrt (selbst die Muttersprache des Lernenden oder Lehrenden). Eine genaue maschinelle Übersetzung, wenn sie überhaupt erreicht werden kann, läßt sich kaum programmieren, wenn der Programmierer nicht ein recht eingehendes Verständnis der Sprache besitzt. Anthropologen müssen die Sprache eines Volkes kennen, um seine Kultur mit Erfolg erforschen zu können. Missionsarbeit in unzivilisierten Gegenden setzt einige praktische und theoretische Kenntnisse über Sprache voraus. Die Sprache der Eingeborenen muß schnell und gut gelernt werden, und man benötigt ein beträchtliches Wissen über die Sprache, um ein passendes Schriftsystem für die Eingeborenensprache zu entwerfen und zu lehren. Schließlich ist ein klares und kritisches Verständnis der Sprache schon deshalb wertvoll, weil nur der als gebildet gelten kann, der eine klare Vorstellung von dem Instrument hat, mit dem ihm der größte Teil semer Ausbildung übermittelt wird. Da die Sprache praktisch alle menschlichen Verhältnisse durchdringt und für viele von entscheidender Bedeutung ist, kann man das Verständnis der Sprache kaum als nebensächlich auffassen. Eine andere Rechtfertigung benötigt eine Einführung in die Sprache eigentlich nicht. Wer sich selbst kennen und verstehen will, muß bis zu einem gewissen Grad die Eigenart des Sprachsystems kennen, das eine so wichtige Rolle in seinem geistigen und sozialen Leben spielt.
Linguistik Die Linguistik ist die Wissenschaft von der menschlichen Sprache. Ein Linguist, der sich für eine bestimmte Sprache interessiert, versucht, sie in ihre Teile zu zerlegen, genau wie ein Mechaniker, der vielleicht aus reiner Neugierde einen ihm noch unbekannten Motor auseinandernimmt. Ein Mechaniker, der einen Motor auseinandergenommen hat, wird ihn wahrscheinlich wieder zusammenbauen; da ein Linguist die Sprache nur
5
im übertragenen Sinne „auseinandernimmt", ist seine nächste Aufgabe nicht das Zusammenbauen, sondern die Beschreibung. Eine linguistische Beschreibung einer Sprache bezeichnet man als die G r a m m a t i k dieser Sprache. Eine Grammatik ist demnach eine Menge von Aussagen, die angeben, wie eine Sprache funktioniert. Dazu gehört z. B. eine Beschreibung der Prinzipien, nach denen Wörter zu grammatischen Sätzen zusammengefügt werden. Die linguistische Beschreibung von Sprachen wird oftmals ohne die Absicht praktischer Anwendung in Angriff genommen. Die d e s k r i p tive L i n g u i s t i k ist insofern der theoretischen Naturwissenschaft verwandt. Ein Physiker wird o f t einen Aspekt der Außenwelt untersuchen, der ihn interessiert, ohne daß er dabei die geringste Absicht hat, die Ergebnisse seiner Forschungen praktisch anzuwenden; er untersucht das Phänomen, weil es ihn fasziniert, weil er das Wissen der Menschen erweitern möchte. Entsprechend interessieren sich die Linguisten für einen bestimmten Aspekt der psychischen Welt, nämlich für das geistige Phänomen, das wir Sprache nennen. Der Wunsch, über dieses Phänomen mehr zu wissen, ist Rechtfertigung genug für seine Erforschung. Die deskriptive Linguistik beschäftigt sich mit der Sprache zu einem bestimmten historischen Zeitpunkt. Die h i s t o r i s c h e L i n g u i s t i k ist die Wissenschaft von der Geschichte der Sprache. Sprachgeschichtler untersuchen die Veränderungen, denen eine Sprache im Verlauf der Zeit unterliegt (alle lebendigen Sprachen sind davon, o f t kaum spürbar, betroffen); dabei versuchen sie, frühere Sprachstufen zu erschließen, für die es keine schriftliche Überlieferung gibt, und die Veränderungen zu bestimmen, die im Lauf der Geschichte eingetreten sind. Andere Zweige der Linguistik sind: die a n t h r o p o l o g i s c h e L i n g u i s t i k , die Erforschung der Sprache als ein Teil der Erforschung einer bestimmten Kultur; P s y c h o l i n g u i s t i k , die Wissenschaft vom sprachlichen Verhalten und den ihm zugrundeliegenden psychischen Mechanismen; S o z i o l i n g u i s t i k , die Wissenschaft von der Wirkungsweise der Sprache innerhalb der Gesellschaft; P h o n e t i k , die Analyse von Sprachlauten im Hinblick auf ihre Artikulation, ihre akustischen Eigenschaften und ihre Aufnahme; schließlich die a n g e w a n d t e L i n g u i s t i k , der Versuch, die Erkenntnisse der linguistischen Forschung praktisch anzuwenden, vor allem im Bereich des Sprachunterrichts.
6
2. Ein erster Blick auf die Sprache
Spracherwerb Kinder zeigen eine erstaunliche Fähigkeit, jede beliebige Sprache, die in ihrer Umgebung dauernd gesprochen wird, so weit zu lernen, daß sie sie fließend beherrschen. Jedes normale Kind, das nicht gerade völlig vom Umgang mit Sprache isoliert aufgezogen wird, spricht bald eine oder mehrere Sprachen als Muttersprache. Das Kind bedarf zum Erlernen seiner Muttersprache keines besonderen Unterrichts. Manche Eltern verbringen viele Stunden damit, jedes erkennbare Bißchen sprachlicher Aktivität ihres Kindes mit einem Lächeln oder einer anderen Belohnung zu „verstärken", oder mit Hilfe der Baby-Sprache die Kluft zwischen ihrer ausgewachsenen Sprachfähigkeit und der wachsenden des Kindes zu überbrücken. Aber es gibt keine besonderen Gründe, zu glauben, daß dies irgend einen Einfluß d a r a u f h a t , daß das Kind letzten Endes mit Erfolg die Sprache seiner Eltern als Muttersprache lernt. Kinder können eine Sprache genau so gut „nebenbei" erlernen, wenn sie mit Kindern spielen, die diese Sprache eben sprechen, als wenn vernarrte Eltern sich konzentriert darum bemühen. Sie brauchen offensichtlich nicht mehr als die Gelegenheit, der betreffenden Sprache genügend „ausgesetzt" zu sein. Diese Fähigkeit, Sprache zu erwerben, ist aus verschiedenen Gründen bemerkenswert. Erstens, weil sie bei allen Menschen gleichermaßen ausgebildet ist. Es gibt schlechterdings keine Fälle, wo normale Kinder eine Muttersprache nicht erwerben, wofern man ihnen nur die Gelegenheit dazu gibt. Es ist zum Vergleich ganz und gar nicht ungewöhnlich, daß ein Kind Rechnen, Lesen, Schwimmen oder Turnen nicht lernt, selbst wenn es darin ausgiebig unterrichtet wird. Spracherwerb ist also gattungseinheitlich. Er ist weiterhin gattungsspezifisch. Jeder normale Mensch lernt eine menschliche Sprache, aber keine anderen Tiere, nicht einmal die intelligentesten Primaten, haben die Fähigkeit gezeigt, auch nur den geringsten Fortschritt in dieser Richtung zu machen, obgleich manche Tiere es ler7
nen können, Probleme zu lösen, Werkzeug zu benutzen usw. Der Spracherwerb scheint also grundsätzlich verschieden zu sein vom Erwerb der anderen genannten Fähigkeiten. Der Vorgang ist weiterhin bemerkenswert wegen seiner relativen Geschwindigkeit und Vollkommenheit. Wenn wir einmal versuchen, eine Sprache in ihre Elemente zu zerlegen, um zu sehen wie sie funktioniert, so finden wir, daß sie außerordentlich komplex ist und höchst abstrakte Aufbauprinzipien umfaßt. Und doch ist jedes Kind in der Lage, in seinen ersten Lebensjahren zumindest ein derartiges System zu bewältigen. Weiterhin ist das Sprachsystem, das das Kind bewältigt, in jeder praktischen Hinsicht mit dem identisch, das die Leute in seiner Umgebung verwenden. Im Vergleich zur Größe der vollbrachten Leistung überhaupt wiegen die Unterschiede wirklich gering. Wenn ein Kind in seiner Umgebung regelmäßig zwei Sprachen hört, wird es höchstwahrscheinlich beide lernen; es wird darüberhinaus weitgehend in der Lage sein, die beiden Sprachsysteme auseinanderzuhalten, was an sich schon eine beachtliche Leistung ist. Man hat oft bemerkt, daß Erwachsene nicht in der Lage sind, eine Sprache auf die spontane, natürliche Art zu lernen wie Kinder es tun. Für den Erwachsenen bedeutet das Erlernen einer Fremdsprache gewöhnlich eine große Anstrengung und führt selten zur perfekten Beherrschung der neuen Sprache. Ein amerikanisches Kind von 6 Jahren, das mit seinen Eltern nach Japan umzieht, wird nach kürzester Zeit Japanisch lernen; dagegen ist es möglich, daß seine Eltern das Kind als Dolmetscher brauchen. Möglicherweise hat man die Unterschiede zwischen dem Sprachenlernen beim Kind und beim Erwachsenen übertrieben, aber der Beginn der Pubertät scheint doch eine Grenzlinie zu sein für die Fähigkeit, ein neues Sprachsystem zu beherrschen. So wird zum Beispiel ein Erwachsener kaum eine Fremdsprache so lernen, daß er sie ohne den geringsten Akzent spricht. Die Beobachtung, daß jedes normale Kind eine oder mehrere Sprachen lernt, wenn es nicht isoliert vom Gebrauch der Sprache aufgezogen wird, fuhrt zu einigen interessanten Fragen. Worin besteht in diesem Zusammenhang die Normalität? Was geschieht, wenn ein Kind in seinen ersten Jahren nicht mit Sprache konfrontiert wird? Im Hinblick auf den Spracherwerb kann man Normalität ziemlich weit fassen. Tatsächlich ist es möglich, Sprache zu erlernen, auch wenn schwere körperliche oder psychisch bedingte Mängel vorhanden sind. Weder die Unfähigkeit zu hören noch die Unfähigkeit, Laute zu bilden, muß ein Kind notwendigerweise daran hindern, ein sprachliches System zu erlernen. Bei tauben Kindern ist natürlich ein besonderer Unterricht nötig, da
8
Taube ja die Sprache offensichtlich nicht durch Hören lernen können. Trotzdem können taube Kinder mit Hilfe von optischen Hilfsmitteln eine Sprache sehr gut begreifen. Sogar bei Taubheit und Blindheit zusammen ist es möglich, eine Sprache zu lernen, wie das Beispiel von Helen Keller zeigt. Wie zu erwarten ist, haben taube Kinder vor allem im Bereich der Artikulation besondere Schwierigkeiten. Aber die Sprache ist wie ein Eisberg: die äußere Erscheinungsform ist nur ein kleiner Teil des Ganzen. Die Fähigkeit, außer dieses einen Teils das ganze System zu erlernen, ist in der Tat eine beachtliche Leistung. Darüberhinaus können auch taube Kinder beträchtliche Fortschritte im normalen Sprechen machen, vor allem dann, wenn die Taubheit erst einige Zeit nach der Geburt einsetzt. Kinder, die ihre Sprechorgane nicht zur Artikulation von Sprachlauten verwenden können, lernen trotzdem ohne besondere Schwierigkeit eine Sprache. Sie verstehen sie vollständig und können die schriftliche Form der Kommunikation ebenso gut erlernen wie andere auch. Der Spracherwerb hängt nicht entscheidend von der Verbalisierung ab. Der Erwerb der Muttersprache wird viel weniger von geistiger Retardierung beeinflußt als der Erwerb anderer geistiger Fähigkeiten. Ein Kind, das geistig so weit zurückgeblieben ist, daß es nicht Rechnen lernen kann, kann doch Sprechen lernen. Nur in den schlimmsten Fällen, bei völligem Schwachsinn, fehlt die Sprache überhaupt. Darin liegt ein weiterer Hinweis, daß der Spracherwerb sich in entscheidender Weise von dem Erwerb anderer geistiger Fähigkeiten unterscheidet. Kinder können in der Sprache sehr erfinderisch sein. Das zeigen etwa Geheimsprachen, die die Kinder dazu verwenden, um von den Erwachsenen nicht verstanden zu werden. Aber ein Kind kann eine Sprache nicht aus dem Nichts erfinden. Es sind einige Fälle bekannt, wo Kinder völlig isoliert von menschlicher Gesellschaft in der Wildnis aufgewachsen sind, zum Teil von Wölfen mit aufgezogen. Unter solchen Umständen entwikkelt sich die Sprache offensichtlich nicht, selbst wenn zwei Kinder zusammen sind. Der Umgang mit Sprache ist also eine minimale Voraussetzung für den Spracherwerb. Wie wir in Kapitel 1 bemerkten, ist es die Aufgabe der Linguistik, zu einem Verständnis der Sprache zu gelangen. Unter diesem Aspekt ist es von besonderer Bedeutung, die Fähigkeit zum Spracherwerb zu verstehen, die wir aus mehreren Gründen bemerkenswert gefunden haben. Eine angemessene Erklärung des Spracherwerbs ist noch völlig außerhalb unserer Reichweite, aber dieses Ziel bietet einen großen Anreiz zur Erforschung der Sprachstrukturen. Mit anderen Worten: einer der Gründe, warum Linguistik sich lohnt, liegt darin, daß von ihr letzten Endes ein ge9
wisser Aufschluß über diesen höchst bemerkenswerten Aspekt der psychischen Entwicklung des Kindes erwartet werden kann.
Der Ursprung der Sprache und die Gattung Mensch Im vorigen Abschnitt haben wir festgestellt, daß Spracherwerb gattungseinheitlich und gattungsspezifisch ist. Alle Menschen lernen eine Sprache, während keine anderen Lebewesen, nicht einmal die intelligentesten, etwas Vergleichbares erreichen. Diese Bemerkungen müssen noch etwas näher ausgeführt werden, da es in dieser Frage häufig Mißverständnisse gibt. Man hat manchmal angenommen, daß Unterschiede der Rasse für sprachliche Unterschiede verantwortlich seien; aber für dieses Argument gibt es keinerlei Beweismaterial. Spracherwerb ist gattungseinheitlich: jedes Kind ist in der Lage, jede beliebige Sprache als Muttersprache zu lernen. Welche Sprache ein Kind lernt, hängt einzig und allein von seinen Vorbildern ab, von denen es die Sprache lernt. Als Beispiel sei die amerikanische Negerbevölkerung genannt. Sie kamen ursprünglich aus Afrika und sprechen jetzt Englisch als ihre Muttersprache. Also sprechen sowohl Neger als auch Weiße Englisch, und umgekehrt sprechen die Neger sowohl Englisch als auch afrikanische Sprachen, die mit dem Englischen in keiner Weise verwandt sind. Diese Feststellung dürfte genügen, um zu zeigen, daß Sprache und Rasse voneinander völlig unabhängig sind. Das beweisen auch die Kinder von Einwanderern nach Amerika, die als perfekte Sprecher des amerikanischen Englisch heranwachsen. Genausowenig wie zwischen Sprache und Rasse, besteht ein innerer Zusammenhang zwischen Sprache und Kultur. Zu der athabaskischen Gruppe amerikanischer Indianersprachen gehören Sprecher von mehreren deutlich unterschiedenen Kulturen. Umgekehrt gehören zu der Pueblo-Kultur von Rio Grande zwei Sprachen aus völlig verschiedenen Sprachfamilien, Keresisch und Tanoisch. Solche Beispiele zeigen, daß sich Sprache und Kultur nicht gegenseitig vorherbestimmen. Trotzdem hängen sie miteinander zusammen. Das sieht man am deutlichsten an mündlicher oder schriftlicher Literatur; Regeln des literarischen Stils, der Metrik und dergleichen, die auf der Grundlage einer Sprache entwickelt worden sind, finden nicht immer ihr entsprechendes Gegenstück in der anderen. Wörter, die spezifische Begriffe einer bestimmten Kultur bedeuten, werden sich nur schwer übersetzen lassen. Wenn eine neue Sprache angenommen wird, so folgt dem oft die allmähliche Annahme einer neuen Kultur. Zwischen Sprache und Kultur besteht also 10
in der Praxis eine enge Beziehung, aber grundsätzlich sind sie voneinander unabhängig. Man hat manchmal behauptet, daß primitive Völker auch primitive Sprachen sprechen. In Wirklichkeit gibt es jedoch keinerlei Zusammenhang zwischen der Höhe der kulturellen Entwicklung und der Komplexität der Sprachstruktur. Die Sprachen primitiver Völker können genauso komplex und reich an Ausdruckskraft sein wie irgendeine europäische Sprache. Was immer in einer Sprache ausgedrückt werden kann, läßt sich auch in jeder anderen ausdrücken, wenn auch vielleicht etwas umständlicher. Behauptungen wie die, „primitive" Sprachen hätten einen kleinen Wortschatz und keine Grammatik, ihre meisten Wörter seien lautmalend und sie könnten keine abstrakten Gedanken ausdrücken, sind einfach falsch. Die Eskimos haben Wörter für verschiedene Formen von Schnee, aber keinen allgemeinen, abstrakteren Begriff (wie unser Schnee), das die verschiedenen Formen umfaßt. Daraus folgt nicht, daß sie nicht abstrakt denken können oder daß ihre Sprache arm ist; es bedeutet nur, daß für sie Schnee wichtiger ist als für uns, so daß ihre sprachliche Kategorisierung dieses Erfahrungsbereichs detaillierter ist als bei uns. Genausowenig wie primitive Sprachen gibt es „entartete" Sprachen. Sprachen ändern sich, aber sie verfallen nicht. Es gibt keine vernünftige Grundlage für die Klage, daß die Sprache X zu einem Zeitpunkt weit in der Vergangenheit ein reines und vollkommenes Werkzeug zum Ausdruck unserer Gedanken gewesen sei, inzwischen aber durch einen dauernden Verfallsprozeß dekadent geworden sei. Das ist rein puristischer Unsinn. Das heutige Deutsch und das Deutsch von vor tausend Jahren sind sehr verschieden; das Deutsch von vor tausend Jahren war jedoch ebenso verschieden von einer noch früheren Vorstufe. Zu jedem Zeitpunkt ist eine Sprache ihrem Zweck völlig angemessen. Sie ist das Ergebnis einer Entwicklung und wird sich, wenn sie weiterhin gesprochen wird, weiter entwickeln. Die Vorstellung von einer „reinen" Sprache ist eine Illusion. Jahrhundertelang hat die Frage, wie die Sprache bei den Menschen entstanden ist, die Gelehrten fasziniert, aber es gibt keinerlei gesicherte Auskunft über den Ursprung der Sprache. Soweit wir irgendwelche Sprachen historisch zurückverfolgen können, gleichen sie im Prinzip den gegen wältigen Sprachen. Die Sprachen von vor zwei- oder dreitausend Jahren erscheinen in keiner Weise einfacher oder primitiver als die heutigen Sprachen; sie sind auch ihrem Wesen nach nicht verschieden. Es muß eine Zeit in der Geschichte der Menschheit gegeben haben, in der die Sprache noch nicht voll entwickelt war und in der die Menschen eine primitive Vorstufe der komplexen Sprachsysteme von heute verwendeten. Allen 11
Anzeichen nach liegt diese Zeit so weit in der Vergangenheit, daß wir keine Hoffnung haben, eine Überlieferung dieser Vorstufen zu finden. Im Hinblick auf den Ursprung der menschlichen Sprache werden wir möglicherweise immer auf Vermutungen angewiesen sein. Verschiedene Theorien über den Ursprung der Sprache sind vorgebracht worden, aber keine kann wirklich ernst genommen werden. Wir erfahren auch nichts über den Ursprung der Sprache, wenn wir die verschiedenen Kommunikationsformen der Tiere untersuchen. Es gibt tierische Kommunikation mit Hilfe eines festgelegten Systems von Signalen, aber damit hört die Gemeinsamkeit zwischen tierischer Kommunikation und der menschlichen Sprache auch schon auf. Die Kommunikationssysteme der Tiere beruhen grundsätzlich auf einem von zwei elementaren Aufbauprinzipien. Nach dem einen Prinzip bewegen sich die verschiedenen Signale in einer oder in wenigen Dimensionen. So können etwa die Bienen einander mit großer Genauigkeit den Ort einer Futterquelle angeben, indem sie im Bienenkorb einen Tanz vollführen. Die Entfernung der Quelle vom Bienenstock wird angezeigt durch die Zahl der Drehungen der tanzenden Biene; je größer die Entfernung, desto geringer die Zahl der Drehungen. Die Richtung der Quelle wird, unter Berücksichtigung der Sonnenstellung, durch den Winkel des geraden Teils des Tanzes angezeigt. Die Bienen können demnach eine unbegrenzte Zahl von Nachrichten übermitteln. Sie ist jedoch nur in einem trivialen Sinne unbegrenzt, weil jede Nachricht eine Variante des einzigen Nachrichtentyps ist: „In der Entfernung X findet sich in Richtung Y Nektar". Die menschliche Sprache zeigt ähnliche Aspekte, die jedoch von nebensächlicher Bedeutung sind. Je nach dem Grad des Schmerzes, bewegt sich die sprachliche Reaktion in einem Kontinuum von einem sanften „Au" bis hin zum Schmerzensschrei. Menschliche Sprachen sind in einem viel interessanteren Sinne unbegrenzt. Wenn man versucht, alle Sätze des Deutschen oder einer anderen Sprache aufzuschreiben, so wird man bald die Hoffnungslosigkeit des Unternehmens erkennen. Man könnte unendlich viel schreiben, ohne die Menge der wohlgeformten Sätze zu erschöpfen, von denen jeder seine besondere Bedeutung hat. In dieser Hinsicht unterscheidet sich die menschliche Sprache von den tierischen Kommunikationssystemen, die den zweiten Typ von Aufbauprinzip zeigen, der eine kleine, begrenzte Anzahl von unterschiedenen Zeichen voraussetzt. Den höheren Primaten, etwa den Gibbons oder Schimpansen, wird oft ein derartiges System zugesprochen. Eine Art von Schrei bezeichnet drohende Gefahr, eine andere Hunger usw. bis zu etwa einem Dutzend verschiedener Signale. Bei diesem Sche12
ma gibt es eine genaue zahlenmäßige Beschränkung der möglichen Nachrichten, was für die menschlichen Sprachen nicht zutrifft. Die menschliche Sprache ist also wesentlich verschieden von beiden Arten tierischer Kommunikation. Ein menschlicher Sprecher verfugt über eine unbegrenzte Menge von unterschiedenen Signalen; tierische Kommunikationssysteme besitzen entweder eine begrenzte Menge unterschiedener Signale oder ein Kontinuum von nicht unterschiedenen Signalen in wenigen Dimensionen. Dieser ganz entscheidende Unterschied zwischen menschlicher Sprache und tierischer Kommunikation wiegt allein schwerer als ihre Ähnlichkeiten. Es lassen sich jedoch noch eine ganze Anzahl von anderen wichtigen Unterschieden feststellen. Der auffallendste Unterschied liegt in der großen strukturellen Komplexität der Signale einer menschlichen Sprache. Der Bienentanz oder der Schrei eines Schimpansen besitzt praktisch keinerlei innere Struktur, abgesehen von dem Vorgang der körperlichen Realisierung des Signals selbst. Jeder Satz einer menschlichen Sprache ist zumindest auf zwei Ebenen strukturiert. Er besteht erstens aus einer linearen Kette von Worten, von denen jedes eine mehr oder weniger klare Einzelbedeutung hat und aus einer Lautfolge, die aus einem kleinen Lautinventar stammt, das in der Sprache systematisch verwendet wird. Zweitens besitzt jeder Satz eine komplexe grammatische Struktur. (Grammatische Strukturen werden wir in Kapitel 5 behandeln.) Für keine dieser Strukturebenen gibt es ein Pendant in den Kommunikationssystemen der Tiere. Ein weiterer Unterschied ist der, daß das Lernen für die menschliche Sprache eine viel größere Rolle spielt als für die tierische Kommunikation. Die menschlichen Sprachen haben vieles gemeinsam, unterscheiden sich jedoch in vielen Einzelpunkten voneinander. Wenn jemand Englisch lernt, so muß er alle jene Einzelheiten lernen, die das Englische vom Burmesischen und jeder möglichen anderen menschlichen Sprache unterscheiden. Gleichgültig, wieviel von der menschlichen Sprache angeboren ist, so bleibt doch der Lernaufwand beträchtlich. Es ist schon eine beachtliche Aufgabe, die Zahl von Wörtern zu lernen, die sich in einem kleinen englischen Wörterbuch findet. Der Mitteilungstanz der Bienen muß dagegen praktisch im ganzen angeboren sein, und es gibt keinen Hinweis darauf, daß dies bei anderen tierischen Kommunikationssystemen anders ist. Schließlich bleibt noch zu erwähnen, daß tierische Kommunikationssysteme geschlossen sind, während menschliche Sprachen o f f e n sind. Wann immer Bienen eine Mitteilung machen, kann es sich nur um Varianten derselben Nachricht handeln — die Entfernung des Nektars und die Richtung. Menschenaffen können nicht ohne weiteres etwas 13
mitteilen, wofür sie kein besonderes Signal haben, und selbst in diesen Fällen sind die Möglichkeiten noch sehr beschränkt. Dagegen können die Menschen sich über alles unterhalten, was sie beobachten oder sich vorstellen können. Darüberhinaus können sie über jeden beliebigen Gegenstand nahezu unbegrenzt viel sagen. Diese größere Beweglichkeit beruht zum großen Teil auf der komplexen grammatischen Struktur der menschlichen Sprachen. Zudem werden dem Wortschatz einer Sprache dauernd neue Einheiten hinzugefügt. Wörter und feste Wendungen werden unablässig neu geprägt oder von anderen Sprachen entlehnt, um den wechselnden kommunikativen Bedürfnissen der Sprecher zu genügen. Vergleichbares gibt es in der tierischen Kommunikation nicht. Aus diesen Beobachtungen läßt sich folgern, daß es keinen Grund gibt, eine entscheidende Beziehung zwischen der menschlichen Sprache und tierischen Kommunikationssystemen anzunehmen. Sie sind ähnlich nur insofern, als sie die Übermittlung von Information nach festgelegten Prinzipien ermöglichen; und diese Ähnlichkeit ist verschwindend gering im Vergleich zu den Unterschieden.
Laut und Bedeutung Wenn man den Unterschied zwischen menschlicher und tierischer Kommunikation in einem Wort zusammenfassen wollte, würde sich dafür das Wort Neuheit anbieten. Wann immer eine Biene mitteilt, wo Nektar zu finden ist, wiederholt sie eine Grundnachricht, die schon unzänlige Male bei Bienen übermittelt worden ist. Wenn ein Tier seine Artgenossen durch einen Ruf vor drohender Gefahr warnt, erfindet es keinen neuen Ruf, sondern verwendet den, der von diesen Tieren schon oft verwendet worden ist. Neuheit gibt es da nicht, vielmehr nur eine Wiederholung von vergangenen kommunikativen Ereignissen. Dies trifft auf die menschliche Sprache zweifellos nicht zu. Ein hervorstechendes Merkmal der Sprachverwendung ist ihre Kreativität, die Unabhängigkeit von früherer sprachlicher Aktivität des Sprechers. Fast jeder Satz, der auftritt, ist neu und ist noch nie zuvor aufgetaucht. (Sollten Sie daran zweifeln, so suchen Sie einmal in einem anderen Buch einen Satz, der eine genaue Wiederholung eines Satzes auf dieser Seite ist!) Ausnahmen sind natürlich gängige Wendungen und kurze Sätze wie Kommt herein! oder Das Essen ist fertig sowie eindeutige Zitate; trotzdem behält die Aussage ihre Gültigkeit. Ein Mensch besitzt die Fähigkeit, eine unbegrenz14
te Zahl von völlig neuen Sätzen hervorzubringen und zu verstehen. Wenn ein Satz eine genaue Wiederholung eines früheren ist, so ist die Wahrscheinlichkeit groß, daß er beim zweiten Mal neu geprägt worden und die Wiederholung reiner Zufall ist. Das Sprechen besteht nicht darin, papageienhaft Sätze nachzuplappern, die man gehört und auswendig gelernt hat. Unsere Fähigkeit, neue Sätze hervorzubringen und zu verstehen, läßt sich nicht mit einem Hinweis auf die menschliche Fähigkeit des Analogiedenkens erklären. Manche Leute haben behauptet, daß neue Sätze in Analogie zu früher gehörten gebildet werden. Nehmen wir zum Beispiel an, jemand hat folgende Sätze gehört und behalten: Peter hilft beim Abwaschen, Peter hilft beim Aufräumen und Barbara hilft beim Abwaschen. Mit Hilfe der Analogie kann er den über die Proportion erschließbaren Satz Barbara hilft beim Aufräumen hervorbringen. Dieser Satz ist in seiner bisherigen Erfahrung noch nie vorgekommen, aber in Analogie zu den drei anderen kann er ihn trotz seiner Neuheit hervorbringen oder verstehen. Diese Behauptung ist scliechterdings falsch, denn wir laufen nicht herum und sammeln Sätze im Gedächtnis, die dann später zum Bilden oder Verstehen eines Satzes verwendet werden. Wir durchforschen auch nicht unsere persönlichen Spracharchive, um dann einen Proportionsschluß durchzuführen, wenn wir etwas sagen wollen. Wir bilden und verstehen Sätze ganz spontan. Ebenso unzureichend für die Erklärung des kreativen Charakters unserer sprachlichen Aktivität ist die Ansicht, daß die Sprache eine Menge von sprachlichen Gewohnheiten sei. Wir wollen nicht im einzelnen nachzuweisen versuchen, warum diese Ansicht unhaltbar ist; sie ist so tief eingebettet in der Tradition der behavioristischen Psychologie, daß eine eingehende Darlegung der hiermit verbundenen Vorstellungen den Rahmen dieses Buches sprengen würde. Wir müssen uns hier damit begnügen, festzustellen, daß keine Version des Stimulus-Response-Modells der psychischen Organisation auch nur im Ansatz eine Erklärung liefert für die komplexe Struktur der menschlichen Sprache (die in Teil II besprochen wird) und daß die Mechanismen der Beeinflussung (conditioning) und Bestärkung (reinforcement) prinzipiell ungeeignet sind, den Spracherwerb zu erklären. Im Alter von fünf oder sechs Jahren beherrscht ein Kind die Grundzüge seiner Muttersprache. Es hat die Fähigkeit erworben, spontan und ohne Mühe eine unbegrenzte Zahl von Sätzen zu bilden und zu verstehen, die ihm von seiner Erfahrung her völlig neu sind. Wenn wir die Sprache und den Spracherwerb verstehen wollen (soweit es heute möglich ist), müssen wir zuerst eine Vorstellung von der Art der Fähigkeit 15
haben, die sich jemand erwirbt, der Sprechen lernt. Wir wollen uns deshalb, unter Berücksichtigung des Problems der sprachlichen Kreativität, die Frage stellen: Was ist eigentlich Sprache? Ganz allgemein gesagt, läßt sich Sprache als ein Mittel der Kommunikation verstehen. Wenn A eine Vorstellung hat, die er B übermitteln will, so macht er gewisse Bewegungen mit seinen Artikulationsorganen (Lippen, Zunge, Stimmbänder). Diese Bewegungen erzeugen Schallwellen, die sich durch die Luft zu B hinbewegen. B hört die Laute, und unter günstigen Umständen versteht B. Diese Beschreibung gilt grundsätzlich, selbst wenn eine Sprache bisweilen ohne kommunikative Absicht verwendet wird. Wenn A sich die Zehe anstößt und schrecklich zu fluchen anfängt, so enthält seine Verbalisierung wahrscheinlich keinerlei Kommunikationsabsicht. Jeder Versuch, durch das Medium der Sprache zu kommunizieren, ist natürlich der Gefahr ausgesetzt, teilweise oder ganz zu scheitern. Vielleicht will A dem B eine Vorstellung mitteilen und es mißlingt ihm. B spricht möglicherweise nicht die Sprache von A. Vielleicht kann B die Äußerung nicht genau hören und verwechselt ein Wort mit dem anderen. Vielleicht verspricht sich A und sagt genau das Gegenteil von dem, was er sagen will. Meistens sind jedoch unsere Kommunikationsversuche einigermaßen erfolgreich. Gewöhnlich entspricht die Vorstellung, die B aufnimmt, der von A intendierten. Obgleich es viele Fehlerquellen gibt und die Kommunikation nie vollkommen ist, verwenden wir unsere Sprache im allgemeinen doch mit soviel Erfolg, daß wir uns ihrer ohne große Zweifel an ihrer Wirksamkeit weiterhin bedienen. Wenn A eine Nachricht an B übermitteln will, dann ist das dazu erzeugte Signal eine Lautfolge. B kann die Vorstellung von A nicht unmittelbar erkennen; er kann nur die Laute wahrnehmen, die A von sich gibt. Aus ihnen leitet er irgendwie ab, was A wohl denkt. A und B verwenden für die Kommunikation eine Sprache, aber die Sprache selbst ist weder die übertragene Lautfolge noch der dadurch vertretene Gedanke. Die Sprache ist das Mittel, das es ermöglicht, die beiden einander zuzuordnen. Sie ist eine Menge von Prinzipien, die es A erlauben, seine Vorstellung in ein wahrnehmbares Signal zu übersetzen, und die B in die Lage setzen, die Vorstellung aus dem Signal zu rekonstruieren. Die Sprache ist ein Mittel, das zwischen Lauten und Bedeutungen Beziehungen herstellt, indem sie Bedeutungen Signalen zuordnet und es den Menschen so ermöglicht, über wahrnehmbare Lautfolgen Vorstellungen auszutauschen. 16
Nehmen wir ein konkretes Beispiel. A schaut aus dem Fenster und sieht etwas Seltsames. Um B zu informieren, was sich abspielt, äußert A den Satz Die Katze jagt den Hund auf den Baum. B nimmt die Nachricht auf; er versteht den Satz, und besitzt nun die wesentliche Information über den Vorgang, von dem A berichtet. A hat die deutsche Sprache verwendet, um diese Information in eine Lautfolge umzusetzen, und B hat die deutsche Sprache verwendet, um dieselbe oder doch eine ähnliche Information aus der Lautfolge abzuleiten. Die deutsche Sprache ist ein Mittel, das, unter anderem, eine Beziehung herstellt zwischen der Lautfolge Die Katze jagt den Hund auf den Baum und einer Bedeutung. Teil II dieses Buches wird sich ausführlich mit der inneren Struktur der Sprache beschäftigen. Im Augenblick wollen wir uns auf einige vorläufige, aber wichtige Bemerkungen über diese Struktur beschränken. Es ist völlig einsichtig, daß der Satz Die Katze jagt den Hund auf den Baum nur deshalb eine Bedeutung hat, weil die einzelnen Wörter des Satzes Bedeutungen haben. Die Bedeutung eines Satzes wird zu einem Teil von den Bedeutungen der Wörter bestimmt, aus denen er aufgebaut ist. Es stimmt natürlich nicht, daß die Bedeutung eines Satzes einfach die Summe der darin enthaltenen Wörter ist. Nehmen wir eine leicht veränderte Version dieses Satzes: Mieze jagt Bello auf den Baum. Dieser Satz hat genau die gleichen Wörter wie Bello jagt Mieze auf den Baum, und doch ist die Bedeutung verschieden. Die Beziehung zwischen der Bedeutung eines Satzes und den Bedeutungen seiner Teile ist also abstrakter als eine rein additive Beziehung. Dies wird im Kapitel 4 näher untersucht werden. Die Beziehung zwischen einem Wort und seiner Bedeutung ist im allgemeinen völlig willkürlich; es ist eine Frage der Konvention. Es gibt keinen inneren Grund, warum gefrorenes Wasser mit dem Wort Eis bezeichnet wird und nicht mit irgendeinem anderen Wort. Daß das Wort Eis von den Sprechern des Deutschen verwendet wird, ist ein reiner Zufall der Sprachgeschichte. In anderen Sprachen werden andere Lautketten verwendet, um diesen Aggregatzustand des Wassers zu bezeichnen. Darüberhinaus wäre es gar nicht verwunderlich, zu erfahren, daß in einer anderen Sprache ein ähnlich ausgesprochenes Wort etwas völlig Anderes bezeichnet. Das Wort und der Begriff sind in keiner geheimnisvollen Weise füreinander bestimmt. Eine Sprache würde ebensogut funktionieren, wenn die Zuordnungen von Wort und Begriff ganz anders geregelt wären. Es ist also ein allgemeingültiges Prinzip, daß die Beziehung zwischen einem Wort und seiner Bedeutung willkürlich ist. Ein Wort „bedeutet" einen Begriff, aber es gibt keine inhärente Beziehung zwischen den beiden. 17
Allerdings gibt es eine Reihe von Ausnahmen von diesem allgemeinen Prinzip. Ihre Bedeutung ist nicht ohne weiteres genau einzuschätzen, aber sie ist zweifellos nicht sehr groß. Das Prinzip muß nur eingeschränkt werden; es bedarf keiner grundsätzlichen Änderung. Viele Wörter sind offensichtlich lautmalend (onomatopoetisch). Bei diesen Wörtern besteht natürlich eine besondere Beziehung zwischen Bedeutung und Aussprache. So ähneln etwa die deutschen Wörter muh und wau-wau bis zu einem gewissen Grade den Lauten, die Kühe und Hunde von sich geben. Das ist kein Zufall. Diese Wörter wurden sicher in der Absicht der Nachahmung geprägt, so auch bei Wörtern wie tick-tack, bums oder bim-bam. Es ist aber interessant, daß sogar diese nachahmenden Wörter weitgehend der Konvention unterliegen. Ein klassisches Beispiel ist das Krähen des Hahns, das im Deutschen als kikeriki erscheint, im Französischen als coquerico und im Englischen als cock-a-doodle-doo. Ein Sprecher muß also die für seine Sprache durch Konvention gültige Form der Nachahmung erst lernen. Eine zweite Einschränkung des Prinzips, die oft angeführt wird, ist noch schwerer zu beurteilen. Es handelt sich dabei um die sogenannte Lautsymbolik. So erscheint etwa die Lautfolge [kn] im Deutschen häufig im Anlaut von Wörtern, deren Bedeutung Assoziationen wie „hart", „ d u m p f , „schlagend" oder „unangenehm" trägt: knacken, knarren, knurren, knattern, knuffen, knallen, Knoten, Knüppel, Knolle, Knorpel, knorrig, Knauf, Knebel, Knute. Dagegen tragen Wörter, die mit w- [v] beginnen, häufig Bedeutungen, die ein Element der Leichtigkeit, der schwankenden Bewegung oder Unruhe haben: wehen, Wind, Wolken, Wellen, Wogen, wallen, wanken, weben, wedeln, wimmeln, winken, wirbeln. Man könnte also folgern, daß [kn] im Deutschen eine gewisse dumpfe Schwere „symbolisiert", dagegen [v] eine gewisse bewegte Leichtigkeit. Man sollte aber diese Art der Lautsymbolik nicht überschätzen. Man kann sie zwar nicht als reine Phantasiegeburt abtun, sie spielt aber keine entscheidende Rolle. Das zeigen schon Beispiele, die bedeutungsmäßig völlig aus der lautsymbolischen Reihe tanzen: Knabe für [kn], Wand oder Wolf für [v]. Das Prinzip der Willkürlichkeit wird von dieser Einschränkung nur unwesentlich berührt. Eine gewisse Ausnahme stellen auch die Baby-Wörter dar. In sehr vielen Sprachen sind sich die Wörter für Vater (Papa) und Mutter (Mama) außerordentlich ähnlich. Etwa: deutsch Papa, spanisch papä, russisch 18
papa, suaheli baba, türkisch baba, ungarisch apa. Diese Ähnlichkeit ist aber weiter nicht überraschend, denn diese Laute werden mit als erste erworben, und die Eltern sind die ersten Dinge, die das Kind zu benennen Anlaß hat. Weiterhin trägt dazu sicher der Eifer der Eltern bei, in den Äußerungen des Kindes eine Beziehung auf sie zu sehen. Zusammenfassend läßt sich die Sprache als Kommunikationsinstrument verstehen. Sie dient dazu, Beziehungen zwischen Lautformen und Bedeutungen herzustellen, so daß Nachrichten durch den Austausch von wahrnehmbaren akustischen Signalen übermittelt werden können. Die Bedeutung eines Satzes ist bestimmt durch die Bedeutungen der Wörter, aus denen er konstruiert ist, und die Basis für die Beziehungen zwischen Laut und Bedeutung, die eine Sprache aufstellt, wird erkennbar in den Beziehungen zwischen den Einzelwörtern und ihren Bedeutungen. Die Verknüpfung eines Wortes mit seiner Bedeutung ist weitgehend willkürlich bzw. durch Konvention geregelt, wobei dieses Prinzip gewissen kleineren Einschränkungen unterliegt.
Sprachliche Teilsysteme Als Sprecher einer Sprache sind wir in der Lage, Wörter aneinanderzureihen, um neue Sätze zu bilden, die unsere Gedanken ausdrücken. Wenn wir eine Sprache lernen, so müssen wir zunächst eine bestimmte Menge von Wörtern lernen, von denen jedes eine Bedeutung und eine Lautform einander zuordnet. Darüberhinaus müssen wir eine Menge von Prinzipien lernen, die angeben, wie einzelne Wörter zu Sätzen zusammengefugt werden können. Zum Zwecke der Untersuchung können wir also drei Aspekte der Sprachstruktur isolieren; bei der Beschreibung einer Sprache müssen wir uns befassen mit den Bedeutungen der Wörter, mit den Lautfolgen, die diesen Bedeutungen zugeordnet sind, und mit der Art und Weise, wie Wörter sich zu Sätzen kombinieren lassen. Entsprechend können wir sagen, daß die Sprache ein s e m a n t i s c h e s S y s t e m , ein p h o n o l o g i sches S y s t e m und ein s y n t a k t i s c h e s S y s t e m umfaßt. Wenn wir vom semantischen System einer Sprache reden, so beziehen wir uns damit nicht nur auf die Tatsache, daß die Wörter der Sprache Bedeutungen haben, sondern auch darauf, wie sie den Bereich unserer Begriffserfahrung aufteilen. Im Deutschen etwa unterscheiden wir sprachlich zwischen den mit grün und blau bezeichneten Farben. Diese Unterscheidung beruht auf keiner psychologischen Notwendigkeit; in vielen Sprachen deckt ein Ausdruck den ganzen Teil des Farbspektrums, der 19
blau und giün umfaßt. In der Hopi-Sprache (einer amerikanischen Indianersprache) gibt es verschiedene Wörter für offenes Wasser und Wasser in einem Behälter. Im Deutschen gibt es keine entsprechende lexikalische Unterscheidung, wir verwenden für beides Wasser. Keine zwei Sprachen sind völlig identisch in der Art, wie Erfahrung kategorisiert wird. Obgleich die Wahl einer Lautfolge zur Bezeichnung eines gegebenen Begriffs im wesentlichen willkürlich ist, muß die gewählte Sequenz sich in bes immten Grenzen bewegen, die die Struktur der Sprache setzt. Eine Sprache ist durch ein phonologisches System charakterisiert, und jedes einheimische Wort der Sprache wird durch eine Lautfolge repräsentiert, die den Einschränkungen dieses Systems entspricht. Hören Sie einmal jemandem zu, der Englisch spricht, und vergleichen Sie das mit jemandem, der etwa Französisch spricht. Die Wirkung ist für das Ohr ganz verschieden; Englisch und Französisch „klingen" einfach nicht gleich. Sie haben verschiedene phonologische Systeme, verschiedene Mengen von Prinzipien, die die Aussprache regeln. Im Kapitel 6 werden wir ausführlich auf phonologische Systeme eingehen, so daß wir uns hier mit einigen allgemeinen Bemerkungen begnügen können. Zumindest drei wesentliche Seiten der phonologischen Struktur lassen sich unterscheiden: Inventare von Lauttypen, Einflüsse von Nachbarlauten aufeinander und erlaubte Lautfolgen. Die Tatsache, daß Sprachen sich grundsätzlich in diesen drei Bereichen voneinander unterscheiden, erklärt teilweise ihre verschiedene Wirkung für das Ohr. Eine Sprache ist gekennzeichnet durch ein Inventar von Lauttypen, und jedes einheimische Wort der Sprache ist aus einer Folge von Lauten aufgebaut, die aus diesem Inventar stammen. Schon im Inventar unterscheiden sich die verschiedenen Sprachen. So gibt es im Englischen die Laute [c j] (die Anfangslaute von char und jar), während das Französische keinen von beiden kennt; ÜB Deutschen gibt es den Laut [x] (den Schlußlaut von Bach), den weder das Englische noch das Französische kennt, usw. Darüberhinaus sind Laute, die man für zwei Sprachen als „gleich" annehmen möchte, nicht notwendigerweise in allen phonetischen Einzelheiten identisch. Sowohl im Deutschen wie im Französischen gibt es einen Laut [t], aber die beiden Laute sind in ihren phonetischen Eigenschaften deutlich unterschieden, zumindest für den geschulten Hörer. Laute, die einander in einer Äußerung benachbart sind, neigen dazu, sich gegenseitig zu beeinflussen, wobei die Art dieses Vorgangs von Sprache zu Sprache etwas verschieden ist. Je nach lautlicher Umgebung kann ein Laut in verschiedenen Varianten erscheinen. So wird etwa das [k] in 20
Kasten weiter hinten am Gaumen gebildet als dasjenige in Kiste. Dieser lautliche Wechsel ist nicht auf diese Wörter beschränkt, sondern charakteristisch für die lautliche Umgebung [a] bzw. [i], also auch in Katze und Kitsch. Das phonologische System einer Sprache schränkt die Kombinationsmöglichkeiten von Lauten innerhalb eines Wortes ein. So können wir feststellen, daß im Deutschen bestimmte Lautfolgen mögliche deutsche Formen sind, andere nicht. Baun ist kein deutsches Wort, könnte aber eines sein. Ein deutsches Wort kann mit [b] beginnen wie Bau und mit [-aun] aufhören wie Zaun. Es verhält sich also Baun zu Baum wie Zaun zu Zaum. Daß es Baun im Deutschen nicht gibt, beruht nicht auf einer Beschränkung, die das phonologische System des Deutschen den Möglichkeiten der Lautkombination auferlegt, sondern ist ein reiner Zufall der Sprachgeschichte. Andererseits kann das Wort Tlaum kein deutsches Wort sein, weil das deutsche Lautsystem die Lautfolge [tl] im Anlaut nicht zuläßt. Kein deutsches Wort besteht nur aus Konsonanten oder aus vierzehn aneinandergereihten Vokalen. Diese Beschränkungen gelten für alle deutschen Wörter. Sie grenzen einen Bereich phonologischer Möglichkeiten ein, in dem sich jedes Wort bewegen muß, das ein Wort der deutschen Sprache sein soll. Stuhn ist ein mögliches deutsches Wort, das es zufällig nicht gibt\Bnuhn ist als deutsche Form unmöglich. Genauso wie es Beschränkungen für die Kombination von Lauten zu Wörtern gibt, gibt es auch Beschränkungen für die Kombination von Wörtern zu Sätzen. Nicht jede Folge von deutschen Wörtern ergibt einen grammatischen deutschen Satz. Die Folge Helga pflückte gestern eine Blume ist ein grammatischer Satz; nicht aber Schnee sind weiß und Baum Katze Hund die der den aufjagt. Ein Teil des Vorganges des Spracherwerbs besteht darin, daß jemand eine bestimmte Menge von Prinzipien lernt, die es ihm ermöglichen, Wörter so aneinanderzureihen, daß annehmbare Sätze entstehen und unannehmbare vermieden werden. Aus diesen Prinzipien besteht das s y n t a k t i s c h e S y s t e m oder die S y n t a x einer Sprache. Stellen Sie sich die Menge aller deutschen Wörter vor. Diese Menge enthält viele Elemente, tausende sogar, aber sie ist zweifellos begrenzt. Eine erschöpfende Wortliste könnte zusammengestellt werden in Form eines vollständigen Wörterbuches. Natürlich werden dauernd neue Wörter dem deutschen Lexikon hinzugefügt, während andere in Vergessenheit geraten; auch werden die Kompilatoren von Wörterbüchern das eine oder andere übersehen. Trotzdem trifft die Aussage zu: Wenn man eine Liste aller Wörter einer Sprache aufstellen würde oder eine Liste aller 21
Wörter, die einem Sprecher vertraut sind, so könnte die Liste prinzipiell endlich und erschöpfend sein. Ganz anders verhält es sich mit den Sätzen. Es ist grundsätzlich unmöglich, sämtliche Sätze einer Sprache aufzuzählen. Eine einfache Beobachtung kann das beweisen: Es gibt keinen Satz, von dem man sagen könnte: „Aha, dies ist der längste Satz der Sprache X". Zu jedem deutschen Satz läßt sich ohne weiteres ein längerer finden, gleichgültig wie lang das Original ist. Wenn S ein Aussagesatz der deutschen Sprache ist, dann ist Ich weiß, daß S auch ein deutscher Satz. Wenn also Whisky ist teuer ein grammatischer Satz ist, dann ist es auch Ich weiß, daß Whisky teuer ist. Was für diesen Satz gilt, gilt auch für Ich weiß, daß ich weiß, daß Whisky teuer ist. Und daraus folgt, daß auch Ich weiß, daß ich weiß, daß ich weiß, daß Whisky teuer ist ein grammatischer Satz ist. Offensichtlich könnten wir ad infinitum so fortfahren und einen wohlgeformten Satz beliebiger Länge konstruieren. Das Beispiel ist trivial, nicht aber die Frage, um die es hier geht. Die Menge der wohlgeformten Sätze des Deutschen ist unbegrenzt und dasselbe gilt für alle Sprachen. Es gibt weder eine größte Zahl von Sätzen* noch einen längsten Satz einer Sprache. Es ist prinzipiell unmöglich, alle Sätze einer Sprache aufzuzählen, genauso wie es unmöglich ist, alle natürlichen Zahlen aufzuzählen. Wenn jemand eine Sprache lernt, so erwirbt er eine Fähigkeit, unbeschränkt viele Sätze zu bilden. Er kann diese Sätze nicht als eine Liste auswendiglernen; vielmehr muß er eine beschränkte Menge von Prinzipien lernen, nach denen Wörter zu Sätzen kombiniert werden können. Diese Prinzipien sind von solcher Art, daß sie die Konstruktion eines jeden beliebigen Satzes aus einer unbegrenzten Menge von möglichen Sätzen erlauben. Zum besseren Verständnis geben wir ein analoges Beispiel: Wenn jemand Multiplizieren lernt, muß er eine begrenzte Menge von Prinzipien lernen, die auf eine unbegrenzte Menge von Zahlenpaaren anwendbar sind und die für jedes Paar das richtige Produkt ergeben. Hat er diese Prinzipien gelernt, so kann er beliebige zwei Zahlen multiplizieren, auch wenn er sie vorher noch nie gesehen hat. Indem er über eine begrenzte Menge von Prinzipien oder Anweisungen für die Multiplikation verfügt, beherrscht er unbegrenzt viele Mengen von Zahlen x-y-z, für die x mal y gleich z ist. Er „weiß" gewissermaßen, daß 13 479 mal 231 641 gleich 3 122 289 039 ist; er hat sich wahrscheinlich nie darüber Gedanken gemacht, aber es gehört zu seiner Kompetenz (Fähigkeit), es herauszufinden oder zu überprüfen, wenn er dazu einen Anlaß hat. Seine Kompetenz ist begrenzt (notwendigerweise, denn der menschliche Organismus ist begrenzt), aber sie erstreckt sich auf eine unbegrenzte Zahl von Fällen. 22
In eben diesem Sinn beherrscht der kompetente Sprecher einer Sprache eine unbegrenzte Menge von grammatischen Sätzen. Er hat eine begrenzte Menge von Prinzipien gelernt, die angeben, wie Wörter zu Sätzen kombiniert werden können, und diese Prinzipien erstrecken sich auf eine unbegrenzte Menge von grammatischen Sätzen der Sprache. Die meisten dieser Sätze werden in seiner sprachlichen Erfahrung nie vorkommen, aber sie gehören zu dem Bereich syntaktischer Möglichkeiten, die die von ihm beherrschten strukturellen Prinzipien angeben. Damit, daß er sie beherrscht, hat er letzten Endes die Unterscheidung gelernt zwischen Wortfolgen, die grammatische Sätze ausmachen und solchen, für die das nicht zutrifft. Wenn er die deutsche Sprache beherrscht, so kann er unterscheiden zwischen grammatischen Folgen wie Schnee ist weiß und Die Katze jagt den Hund auf den Baum und ungrammatischen wie Schnee sind weiß und Baum Katze Hund die der den auf jagt. Die Prinzipien der Satzkonstruktion, die er internalisiert hat, erzeugen alle Wortfolgen des ersten Typs und geben keine des zweiten an. Syntaktische Systeme werden wir ausfuhrlich in Kapitel 5 behandeln.
Grammatikalität Einige Bemerkungen zum Begriff „grammatischer Satz" scheinen angebracht, da dieser Begriff eine wichtige Rolle in unserer Erörterung gespielt hat. Der linguistische Gebrauch der Unterscheidung grammatischungrammatisch hat viel Unwillen erregt, meistens auf Grund eines einfachen Mißverständnisses. Wir wollen deshalb gleich von Anfang an klarmachen, worum es dabei geht. Es ist die Aufgabe der Linguisten, Sprachen zu beschreiben, es ist aber weder ihre Aufgabe noch ihr Vorrecht, Vorschriften zu machen. Linguisten wollen darstellen, wie Sprachen aussehen, sie haben aber kein Recht zu sagen, wie Sprachen aussehen sollten, oder vorzuschreiben, wie die Leute reden sollten. Manchmal hört man den Vorwurf, daß die Linguisten diese Regel verletzen und Vorschriften machen, wenn sie zwischen grammatischen Sätzen und ungrammatischen unterscheiden. Das trifft aber nicht zu. Was der Linguist behauptet, wenn er zwischen wohlgeformten und falsch geformten Sätzen unterscheidet, ist, daß der Sprecher, dessen Sprache beschrieben wird, in eben dieser Weise unterscheidet. Der Linguist beschreibt unmittelbar, was er vorfindet; er zwingt niemandem eine unzutreffende Dichotomie auf. Jeder geübte Sprecher des Deutschen kann erkennen, daß der Satz 23
Helga pflückte gestern eine Blume wohlgeformt ist, was für Blume eine pflückte gestern Helga nicht zutrifft. Er erkennt, daß Paul und Petra küßten sich der Struktur nach korrekt ist, im Gegensatz zu Paul küßten und sich Petra. Wahrscheinlich wird er nie einen Anlaß haben, sich über diese Unterschiede Gedanken zu machen, aber er würde sie zweifellos bemerken, wenn er darauf hingewiesen würde. Es gibt unendlich viele Sätze, die ohne jeden Zweifel als wohlgeformte Sätze des Deutschen gelten können. Ebenso gibt es unendlich viele Sätze, die zweifellos aus der Klasse der wohlgeformten deutschen Sätze ausgeschlossen werden müssen. Mehr behaupten die Linguisten auch nicht. Es mag Fälle geben, die nicht so eindeutig sind, bei denen ein bestimmter Sprecher Schwierigkeiten hat, sich zu entscheiden. Das steht außer Frage, aber es ist auch kein entscheidender Einwand. Die syntaktischen Prinzipien einer Sprache können sehr wohl an den Rändern unscharf sein. Das rechtfertigt aber keinen Zweifel an der Existenz einer bestimmten Menge von Prinzipien der Satzkonstruktion, die sich jemand erwirbt, der eine Sprache lernt, Prinzipien, die von bestimmten Wortfolgen in einer Sprache manche als grammatisch angeben und manche aus dieser Gruppe ausschließen. Würde man wegen einiger Grenzfälle die Unterscheidung überhaupt aufgeben, so würde unser Bild von der Sprache weit mehr verzerrt als durch die idealisierende Annahme, daß die Unterscheidung für jeden Satz getroffen werden kann. Manchmal hört man die Frage: „Warum wird dem Satz eine so entscheidende Rolle zugewiesen? Oftmals verwenden die Leute gar keine ganzen Sätze; in vielen Situationen wäre ein ganzer Satz auch fehl am Platz. Mehr als ein Wort oder eine kurze Wendung wird oft gar nicht erwartet." Das ist richtig, aber das hat auch noch niemand geleugnet, schon gar nicht die Linguisten, die zwischen grammatischen und ungrammatischen Sätzen unterscheiden. Im Gespräch kommen häufig Ausrufe und Satzbruchstücke vor: um Gotteswillen!, verdammt!, zum Teufel!, kaum, wirklich?, mag sein, richtig. Sie gehören zur Sprache genau wie die vollständigen Sätze und müßten entsprechend in jeder vollständigen Sprachbeschreibung erscheinen; niemand will sie beiseite lassen. Es gibt aber eine Reihe von guten Gründen, die vollständigen Sätze in den Vordergrund zu rücken und die kürzeren Wendungen vergleichsweise wenig zu betonen. Ausrufe wie um Gotteswillen! und zum Teufel! gibt es in allen Sprachen; jeder Sprecher hat ein Inventar davon, auf das er bei Bedarf zurückgreift. Dieses Inventar ist, im Gegensatz zum Inventar der Sätze einer Sprache, begrenzt und kann erschöpfend aufgezählt werden. Diese Ausrufe werden immer wieder verwendet und sind keineswegs Neuschöpfun24
gen. Mehr läßt sich unter dem Aspekt der Sprachstruktur darüber nicht aussagen; eine vollständige Liste der gängigen Ausrufe niederzuschreiben, wäre eine reine Frage der Geduld. Satzbruchstücke sind genau das, was der Name sagt. Sie können als elliptische Versionen vollständiger Sätze aufgefaßt werden, obwohl es nicht immer klar ist, welchen bestimmten Satz ein Bruchstück abgekürzt wiedergibt. So kann hinter wirklich? stehen: Ist das wirklich wahr?, Kann er das wirklich? oder irgendein anderer Satz, der der Situation entspricht. Daraus wird deutlich, warum die vollständigen Sätze so betont werden: Satzbruchstücke lassen sich von ganzen Sätzen her erklären, aber nicht umgekehrt. Wenn wir ganze Sätze beschreiben, haben wir schon einiges für die Beschreibung von Satzbruchstücken mitgeleistet, während die Untersuchung von Satzbruchstücken wenig oder nichts für die Beschreibung von ganzen Sätzen und der damit verbundenen sprachlichen Kreativität hergibt. (Nebenbei bemerkt: Satzbruchstücke müssen nicht notwendigerweise ungrammatisch sein. Sie können genau wie ganze Sätze grammatisch oder ungrammatisch sein. Mag sein ist ein grammatisches Bruchstück, sein mag nicht.) Beim Sprechen machen die Leute häufig Fehler; sie wählen eine falsche Wortstellung, manövrieren sich syntaktisch so in eine Ecke, daß es kein grammatisches Entrinnen mehr gibt, vernachlässigen die Übereinstimmung von Verb und Subjekt und begehen alle möglichen anderen syntaktischen Sünden. Haben wir trotzdem recht mit unserer Behauptung, daß die Leute den Unterschied zwischen wohlgeformten und falsch geformten Sätzen erkennen? Die Antwort ist: ja. Wenn wir sagen, daß jemand eine Menge von Prinzipien zur Satzkonstruktion beherrscht, schließt das keineswegs aus, daß er bei der Anwendung der Prinzipien Fehler macht. Jemand, der multiplizieren kann, wird auch nicht mit Sicherheit jedesmal das richtige Ergebnis herausbekommen. Wie bei der Lösung anderer Aufgaben, kann auch beim Sprechvorgang eine kompetente Person noch Fehler machen. Fehler werden gemacht, wenn jemand zu müde ist, um sich zu konzentrieren, wenn er von irgendetwas abgelenkt wird, wenn er mitten im Satz etwas anderes sagen will oder wenn er einen Satz konstruiert, der so lang ist, daß er am Ende den Anfang vergessen hat. Die Beherrschung der unbegrenzten Klasse der Sätze einer Sprache ist noch keine Garantie dafür, daß der Sprecher seine Sprachkompetenz auch immer fehlerlos anwendet, sei es beim Sprechen oder beim Hören. Dieser Gedanke ist sehr wichtig. Man muß unbedingt unterscheiden zwischen der Struktur einer Sprache und der Art und Weise, wie diese 25
Struktur gebraucht wird. Im Hinblick auf den Sprecher unterscheiden wir zwischen seiner S p r a c h k o m p e t e n z (Sprachvermögen) und Sprachp e r f o r m a n z (Sprachverwendung). Eine Sprache ist eine Menge von Prinzipien, die zwischen Lautfolgen und Bedeutungen Korrelationen herstellen. Diese Prinzipien ermöglichen Kommunikation in Form sprachlichen Verhaltens, aber sie können nicht mit diesem Verhalten gleichgesetzt werden. Dieselbe Unterscheidung gilt zwischen einer Symphonie und ihrer Aufführung. Auch bei der schlechtesten Auffuhrung bleibt die Symphonie selbst davon unberührt. Sie ist ein abstraktes musikalisches System, die dem Spiel der Musiker zugrundeliegt, aber mit dem Spiel nicht gleichgesetzt werden kann. Ebenso liegt das sprachliche System der verbalen Tätigkeit der Sprecher zugrunde. Eine Sprache ist eine abstrakte Menge von psychologischen Prinzipien, die jemandes Kompetenz als Spracher ausmacht. Diese Prinzipien machen ihm eine unbegrenzte Klasse von Sätzen zugänglich, auf die er in konkreten Situationen zurückgreifen kann. Sie sind ein entscheidendes Element der sprachlichen Kreativität. Dieses abstrakte Sprachsystem versuchen die Linguisten zu beschreiben. Erst in zweiter Linie interessieren sie sich für das sprachliche Verhalten, das ja nur eine mittelbare Äußerung der psychologischen Prinzipien ist, die die menschliche Sprache so einmalig machen. Die Struktur der Sprache wird von Fehlern der Sprecher ebensowenig berührt wie die Symphonie von einer schlechten Aufführung. Im Zusammenhang damit steht ein anderer Aspekt, der erläutert werden muß, weil er so oft mißverstanden wird. Wenn Linguisten die Struktur einer Sprache beschreiben, so beschreiben sie damit keineswegs das, was die Leute tun, wenn sie Sätze konstruieren oder verstehen. Die Grammatik einer Sprache ist nicht ein Rezept, dem man folgen kann, wenn man die kommunikativen Notwendigkeiten in einer Situation einschätzt, entscheidet, was gesagt werden soll, einen bestimmten Satz auswählt und dann in Tätigkeit umsetzt. Sie ist auch kein Rezept für den Hörer, wenn er einer Äußerung zuhört und herausfindet, was gerade gesprochen wird. Sie ist eine Beschreibung der Prinzipien, die angeben, welche Wortfolgen wohlgeformte Sätze der Sprache sind, eine Beschreibung der inneren Struktur des sprachlichen Systems. Wie diese Struktur in sprachliches Verhalten umgesetzt wird, ist eine völlig andere Frage. In dieser Hinsicht ist die grammatische Beschreibung einer Sprache wie die geschriebene Partitur einer Symphonie. Die Noten der Partitur geben nicht Schritt für Schritt die genauen Bewegungen des Dirigenten an; sie zeigen auch nicht, welche Fingerbewegung der Geiger machen muß, 26
um die richtigen Töne auf seinem Instrument zu erzeugen. Vielmehr symbolisieren sie die innere Struktur des musikalischen Werks. Welche Körperbewegungen die Ausführenden machen müssen, um das Werk in wahrnehmbare Form zu bringen, ist völlig außerhalb des Bereichs der Partitur. Die Grammatik einer Sprache ist eine symbolische Darstellung des abstrakten Sprachsystems, genauso wie die Partitur das abstrakte musikalische System sichtbar darstellt. Der Linguist versucht, das abstrakte Sprachsystem zu charakterisieren, aus dem die Sprecher schöpfen, wenn sie sprechen oder verstehen, aber er versucht nicht, das sprachliche Verhalten Schritt für Schritt zu erklären. Mit anderen Worten: er versucht vorwiegend, die Sprachkompetenz zu beschreiben und nicht die Performanz. Nicht, daß die Sprachperformanz ohne Interesse wäre. Ganz im Gegenteil würde der Linguist gerne erfahren, was die Leute Schritt für Schritt tun, wenn sie sprechen oder zuhören. Der Grund, warum er sich hauptsächlich um die Kompetenz kümmert, ist ganz einfach der, daß eine Beschreibung der Sprachkompetenz logischerweise einer Beschreibung der Sprachperformanz vorausgehen muß. Die Prinzipien, die die wohlgeformten Sätze einer Sprache angeben, machen einen entscheidenden Teil des psychologischen Apparats aus, der das Sprechen und Verstehen regelt; wir bedienen uns ihrer, wenn wir Sätze bilden oder verstehen. Deshalb setzt jede angemessene Erklärung der Sprachperformanz eine angemessene Erklärung des abstrakten Sprachsystems voraus, während das Umgekehrte nicht gilt. Wir müssen wissen, was eine Sprache ist, bevor wir verstehen können, wie Sprecher und Hörer sie praktisch verwenden.
Sprache und Denken Die Tatsache, daß Sprache dazu verwendet werden kann, unsere Gedanken auszudrücken, gibt Anlaß zu einigen interessanten Fragen. In welchem Verhältnis stehen Sprache und Denken zueinander? Können wir ohne Sprache denken? Wird unser Denken geformt von der Struktur unserer Sprache? Dies sind sehr schwierige Fragen, Fragen, deren Antwort wir nicht zu geben wagen können, bevor wir nicht die psychologische Struktur des Menschen viel besser kennen, als heute. Widersprüchliche Ansichten sind darüber geäußert worden. Bei den folgenden Bemerkungen kann deshalb nicht garantiert werden, daß sich alle Linguisten oder Psychologen damit einverstanden erklären werden. 27
Wenn wir Denken als bewußte Geistestätigkeit definieren, so läßt sich zunächst feststellen, daß sich Denken (oder doch gewisse Formen des Denkens) völlig unabhängig von der Sprache abspielen kann. Das einfachste Beispiel liefert die Musik. Wir haben alle schon einmal erlebt, daß wir in das Hören eines Musikstücks vertieft waren oder uns in Gedanken eine bekannte Melodie vergegenwärtigt haben. Hier spielt die Sprache keinerlei Rolle. Das Komponieren von Musik hängt in keiner Weise von der Sprache ab, zumindest was den eigentlichen schöpferischen Vorgang angeht, und dasselbe dürfte wohl für andere Formen kreativen oder problemlösenden Verhaltens gelten. Der Bildhauer wird bei der Arbeit in keiner entscheidenden Weise von der Sprache gelenkt. Er kann natürlich einen großen Teil seiner Ausbildung über die Sprache vermittelt bekommen, über seine Schöpfungen reden und sich sogar in Selbstgesprächen unterhalten, während er mit Hammer und Meißel vor sich hin arbeitet. Aber diese Form der Verbalisierung hat keine instrumentale Funktion im kreativen Vorgang. Über lange Zeitstrecken hinweg wird er so mit der Vergegenwärtigung von Formen und Techniken beschäftigt sein, daß Wörter völlig aus seinem Denken verschwinden. Ähnliches gilt für jemanden, der ein Puzzle-Spiel löst. Wenn man merkt, daß zwei für sich allein fertiggestellte Teile zusammengehören, so ist das keineswegs eine sprachliche Leistung, auch wenn man hinterher sagt: „Aha, das gehört hierher!" Es ist deshalb schwer verständlich, warum manche Leute behauptet haben, daß Denken ohne Sprache unmöglich sei. Vielleicht haben sie den Begriff „Denken" so eng gefaßt, daß es etwas wie „logisches Denken" bedeutet. Wenn der Begriff zu eng gefaßt wird, wird diese Behauptung zur Tautologie; es ist nicht sehr informativ, zu erfahren, daß Denken auf sprachlicher Basis nicht ohne Sprache auskommen kann. Ein weiteres Argument für das Vorhandensein von Gedanken ohne Sprache ist die allgemein bekannte Erfahrung, daß man eine Vorstellung ausdrücken möchte, für die man keinen befriedigenden sprachlichen Ausdruck findet. Wenn es kein Denken ohne Sprache gäbe, könnte dieses Problem nie auftauchen. Trotzdem hat ein Großteil unseres Denkens zweifellos mit Sprache zu tun, zum Teil in entscheidender Weise. Man muß jedoch die Frage nach dem Grad des Einflusses der Sprache auf das Denken mit äußerster Vorsicht behandeln. Man macht es sich zu einfach, wenn man sich über die Tyrannei der Sprache beklagt und behauptet, ein Mensch oder eine Gruppe sei von der verwendeten Sprache geprägt. Zweifellos sind schon Menschen durch das blinde Vertrauen auf Wörter irregeführt worden, aber wir können solche Fälle erkennen, und damit ist der Fall geklärt; 28
wenn Sprache so tyrannisch wäre, wären wir nicht imstande zu erkennen, daß sie uns manchmal irreleiten kann, wenn wir nicht vorsichtig sind. Weiterhin müssen wir die Möglichkeit offenhalten, daß vieles, was als sprachbedingtes Denken gilt, überhaupt nicht von der Sprache geformt ist; vielleicht ist hier eine viel allgemeinere menschliche kognitive Fähigkeit am Werk, für die die Sprache nur ein Medium ist, genau wie die Musik ein Medium für die kreativen Kräfte des Komponisten ist. Die Gelehrten sind sich weitgehend darin einig, daß Wörter bestimmte Denkformen sehr erleichtern, indem sie als Marken oder Symbole dienen, die leicht gehandhabt werden können. Wir wissen ziemlich genau, was Rechnen ist; wir können addieren, subtrahieren, multiplizieren und dividieren. Wir kennen auch das Wort Rechnen, das als Etikett für diesen Begriffskomplex dient. Wenn wir über Rechnen nachdenken (welche Stellung es im Gesamtbereich der Mathematik hat, wie es in den Schulen unterrichtet wird, ob unsere Kinder damit zurechtkommen, ob wir es gerne tun, wie schwierig es ist), können wir das Wort Rechnen als Symbol in unseren Denkvorgängen verwenden. Es ist viel einfacher, das Wort Rechnen in unseren Gedanken zu handhaben, als mit dem gesamten Begriffskomplex zu operieren, den das Wort symbolisiert. Der Gebrauch von sprachlichen Symbolen vereinfacht also das Denken in vielen Fällen. Man könnte sogar behaupten, daß manche Formen des Denkens ohne diese handlichen Marken unmöglich wären. Sprachliche Etikette haben eine besondere Bedeutung im Bereich abstrakter Vorstellungen. Gerechtigkeit, Demokratie, Freiheit, Kommunismus und Erziehung sind gebräuchliche Termini, und doch wäre es sehr schwierig, ihre Bedeutung genau zu fixieren. Gerechtigkeit ruft kein konkretes Bild hervor wie etwa Tisch. Normalerweise werden wir darüber Einigkeit erzielen, ob etwas ein Tisch ist oder nicht, aber wann wissen wir genau, was Gerechtigkeit ist? Wann wird etwas zu Recht als obszön bezeichnet? Hat das Wort Freiheit irgendeine greifbare Bedeutung? Wir haben natürlich eine vage Vorstellung von der Bedeutung dieser Termini, aber ihre genaue Bedeutung entzieht sich der Festlegung und ist von Person zu Person verschieden. Diese Begriffe würde es wahrscheinlich gar nicht geben, wenn keine Wörter dafür vorhanden wären, die die Funktion haben, eine Anzahl von vagen, einigermaßen unzusammenhängenden Vorstellungen zu sammeln und zusammenzuhalten. Weil solche Wörter abstrakt sind, stehen sie in einem ziemlich losen Verhältnis zur Realität. In gewisser Weise sind sie fast leer. Wenn man nicht vorsichtig ist, können sie zu emotional geladenen Etiketten werden, die nur dazu dienen jemanden oder etwas als gut oder schlecht abzustempeln. Es ist unglück29
licherweise sehr leicht, jemanden einen Kommunisten zu nennen oder etwas im Namen der Freiheit zu tun, und man wird sehr leicht vom leeren Gebrauch von Wörtern verführt. Was ist nun die Beziehung zwischen unseren Denkvorgängen und der Struktur unserer Sprache? Ist die Sprache ein tyrannischer Herr, der unser Denken unerbittlich in bestimmte ausgefahrene Denkbahnen zwingt und alle anderen Möglichkeiten abschirmt? Ist unser Weltbild wesentlich durch unsere Sprache vorgeformt, wie manche Leute behauptet haben? Diese Fragen kann man sowohl im Hinblick auf Wörter als auch auf grammatische Strukturen stellen. Wir haben gesehen, daß ein Wort nützlich sein kann, wenn man den von ihm bezeichneten Begriff bilden, behalten oder damit operieren will. Wir haben ebenfalls gesehen, daß keine zwei Sprachen den Begriffsraum genau in der gleichen Weise aufteilen und die Teile Wörtern als Bedeutungen zuordnen; Sie erinnern sich, daß die deutsche Sprache zwischen grün und blau unterscheidet, während andere Sprachen nur ein Wort gebrauchen, um diesen ganzen Bereich des Spektrums zu bezeichnen, und daß die Eskimos eine Anzahl von Wörtern gebrauchen, um verschiedene Arten von Schnee zu bezeichnen, während das Deutsche nur das Wort Schnee kennt. Solche Unterschiede finden sich im gesamten Wortschatz, gleichgültig, welche zwei Sprachen man vergleicht. Unsere Frage ist also, in welchem Ausmaß diese Unterschiede in der sprachlichen Kategorisierung der Erfahrung für entsprechende Unterschiede im Denken verantwortlich sind. Es besteht kaum Zweifel darüber, daß Unterschiede im Wortschatz einen gewissen Einfluß auf das Denken haben, zumindest in dem Sinne, daß es leichter ist, über Dinge nachzudenken, für die wir ein Wort haben. Wir sind gewohnt, die einen Farben mit der Bezeichnung rot zu versehen und die anderen mit blau. Wenn wir einen typisch roten oder blauen Gegenstand sehen, können wir sofort seine Farbe angeben; die Begriffe rot und blau sind für uns schon vorgefertigt vorhanden, denn wir haben unser ganzes Leben hindurch Erfahrung gesammelt, welche Dinge man rot und welche man blau nennt. Es wird uns auch keine Schwierigkeit bereiten, uns die Farbe eines roten oder eines blauen Gegenstandes zu merken. Nehmen wir aber an, wir hätten einen Gegenstand in einem sehr dunklen Braunton vor uns, der schon ins Schwarze spielt. Für diese besondere Farbe gibt es im Deutschen keinen allgemein üblichen Terminus. Man wird zögern, sie als braun oder schwarz zu bezeichnen, weil sie nicht der Normalvorstellung von braun oder schwarz entspricht. Schließlich wird man es dann mit einer Wendung wie ziemlich dunkelbraun oder braun30
schwarz versuchen, aber eine solche Wendung wird sich wohl nicht so leicht anbieten wie rot oder blau. Wir sind nicht in der gleichen Weise daran gewöhnt, Nuancen von braun voneinander zu unterscheiden, wie wir rot und blau unterscheiden. Es wird schwieriger sein, sich an einen bestimmten Braunton zu erinnern (im Vergleich zu anderen Brauntönen) als sich die Farbe eines typisch roten Gegenstands zu merken. Hätte aber unsere Sprache ein besonderes Wort für diesen sehr dunklen Braunton und wären wir gewöhnt, Gegenstände dieser Farbe durch die Bezeichnung mit diesem Wort zu charakterisieren, so würden solche Schwierigkeiten nicht auftauchen. Unser Denken wird also von der sprachlichen Kategorisierung der Erfahrung insofern vorgeformt, als es leichter ist, mit Begriffen zu operieren, die mit einem einzelnen Wort kodiert werden, als mit solchen, für die kein einzelner Terminus verfügbar ist. Die Aufteilung des Begriffsraums durch die Sprache hat somit zumindest einen gewissen minimalen Einfluß auf das Denken. Aber es gibt absolut keinen Beweis dafür, daß dieser Einfluß in irgendeiner Weise tyrannisch oder auch nur stark wäre. Wir können ohne weiteres Begriffe bilden und mit ihnen umgehen, für die kein besonderes Wort vorhanden ist. Wir können nach Belieben Phantasiegebilde erfinden und, wenn wir wollen, ihnen auch Namen geben. Man könnte sich etwa ein Einhorn vorstellen, dem aus jeder Nüster eine Blume wächst. Es gibt für dieses Wesen kein Wort, und doch läßt es sich leicht in Gedanken fassen. Wir könnten uns einen Namen dafür einfallen lassen, aber das muß nicht sein. Wie verhält es sich nun mit den grammatischen Strukturen einer Sprache? Zwingen sie unser Denken in bestimmte vorgeformte Bahnen, so daß andere Möglichkeiten ausgeschlossen werden? Bestimmen sie unser Weltbild, wie manche Gelehrte behauptet haben? Nach außen hin zeigen Sprachen manchmal außerordentlich auffallende Unterschiede in der grammatischen Struktur. (Wir werden jedoch später sehen, daß bei genauerer Untersuchung die Sprachen einander grammatisch ziemlich ähnlich zu sein scheinen.) So wird zum Beispiel das, was wir im Deutschen durch Adjektive ausdrücken, in manchen anderen Sprachen mit dem Äquivalent unserer intransitiven Verben ausgedrückt. Wenn wir den Satz, der die Bedeutung hat ,Der Baum ist hoch', Wort für Wort übersetzen, so erhalten wir Der Baum hocht. Um auszudrücken, daß der Fluß tief ist, würde man sagen Der Fluß tieft. Viel häufiger ist es aber, daß sich Sprachen darin unterscheiden, was an grammatischen Kategorien obligatorisch in Sätzen vertreten sein muß. Eine solche Kategorie ist das Genus. Im Französischen ist z. B. jedes Substantiv als Maskulinum oder 31
Femininum klassifiziert, und im Singular erscheint der Artikel als le, wenn das betreffende Substantiv ein Maskulinum ist, aber als la, wenn das Substantiv ein Femininum ist. Während man im Englischen the cheese und the meat sagt, unterscheidet man im Französischen und sagt lefromage, aber la viande. Im Deutschen ist die Unterscheidung dreifach. Der Käse als Maskulinum, die Kartoffel als Femininum und das Fleisch als Neutrum. In anderen Sprachen gibt es sogar noch mehr Genus-Kategorien, die Übereinstimmung im Satz fordern. Das Genus ist natürlich nur ein Beispiel. Numerus, Kasus, Tempus und Aspekt sind andere Kategorien, die man in den bekannten europäischen Sprachen häufig findet. Und viele Sprachen kennen Kategorien, die einem deutschen Sprecher recht exotisch vorkommen. Es ist nicht ungewöhnlich, daß der Plural verschieden gekennzeichnet ist, je nachdem, ob die betreffenden Gegenstände nahe zusammenliegen oder verstreut sind. In der Navaho-Sprache sind bestimmte Verben des Gebrauchens wie .fallen lassen' oder .aufheben' ihrer Form nach davon abhängig, welche Gestalt der gebrauchte Gegenstand hat. So wird etwa die eine Form verwendet, wenn der Gegenstand rund oder unförmig ist, die andere, wenn er lang, dünn und starr ist. In den Sioux-Sprachen enthalten Sätze Elemente, die angeben, welchen Grad der Glaubwürdigkeit der Sprecher dem Gesagten zumißt. Niemand leugnet diese offensichtlichen grammatischen Unterschiede. Wenn zwei Sprachen ihrer Struktur nach verschieden genug sind, so wird einem Sprecher der zweiten Sprache eine wörtliche Ubersetzung aus der ersten, die Element für Element wiedergibt, grotesk vorkommen. Etwas ganz anderes ist es, zu behaupten, daß diese Unterschiede in der grammatischen Struktur signifikante Unterschiede in den Denkvorgängen der Sprecher zur Folge haben. Der Beweis für die Richtigkeit dieser Behauptung ist bis jetzt noch nicht erbracht worden. Es ist nicht gelungen, die großartigen Annahmen, daß das Weltbild eines Menschen durch seine Sprache determiniert sei, durch Fakten zu erhärten. Es gibt keinerlei Grund, zu glauben, daß die grammatische Struktur unserer Sprache unser Denken mit tyrannischem Griff wie in einem Schraubstock hält. Daß die Beweise für diese Vorstellung nicht erbracht worden sind, ist nicht überraschend. Die Behauptungen beruhen auf eigentlich recht oberflächlichen Aspekten der Sprachstruktur. Was bedeutet es schon, wenn die französischen Substantive in zwei Genus-Klassen aufgeteilt sind, während es im Englischen nur eine gibt? Aus dieser willkürlichen und eher uninteressanten grammatischen Tatsache ergeben sich keine gültigen psychologischen Folgerungen. Wenn man in seiner Muttersprache gelernt 32
hat, zu sagen Die Blume rötet, Der Baum hocht und Der Fluß tieft, so folgt daraus nicht, daß man in einer besonders erregenden geistigen Welt lebt, in der sich Farben als Tätigkeiten von Gegenständen zeigen, wo Bäume dauernd mit der Tätigkeit des Hoch-Seins beschäftigt sind und die Flüsse sich in die Tiefe strecken während sie horizontal dahinfließen. Diese Ausdrucksweisen wären das Gewohnte, sie kämen einem nicht poetisch vor, wie sie einem deutschen Sprecher vorkommen: man würde in derselben Welt leben wie jetzt auch.
33
3. Sprachliche Vielfalt
Sprachen und Dialekte Man nimmt an, daß heute in der Welt etwa drei- bis fünftausend Sprachen gesprochen werden. Eine genaue Zahl läßt sich aus mindestens zwei Gründen kaum angeben. Erstens fehlt uns die umfangreiche Information aus allen Teilen der Welt, ohne die eine genaue Schätzung unmöglich ist. Der zweite Grund betrifft den Begriff Sprache selbst. Obgleich wir intuitiv eine grobe Vorstellung davon haben, was Sprache bedeutet, sind doch die Fakten des Gebrauchs der Sprache so geartet, daß es oftmals sehr schwer ist, praktisch zu entscheiden, wann dieser Terminus richtig gebraucht wird. Auf den ersten Blick zeigt sich kein Problem. Englisch ist eine Sprache, dasselbe gilt für Französisch und Holländisch. Englisch ist die Sprache, die in den Vereinigten Staaten, England, Kanada und noch einigen anderen Ländern gesprochen wird; Holländisch ist die Sprache, die in den Niederlanden gesprochen wird. Aber ganz so einfach ist das doch nicht. Wenn wir Sprachgrenzen bestimmen wollen, stellen wir fest, daß sie in eine Karte nicht so einfach eingetragen werden können wie Staatsgrenzen, zumindest nicht ohne grobe Vereinfachung. Um uns die Probleme vorzuführen, wollen wir einen Fall annehmen, in dem sich Sprachgebiete genauso leicht auf einer Karte eintragen lassen wie Länder. So wäre Abb. 3.1 eine Sprachkarte eines bestimmten geographischen Gebiets. Eine derartige Karte impliziert zweierlei. Erstens impliziert sie, daß innerhalb eines jeden durch Grenzlinien abgetrennten Teilgebiets die Sprache einheitlich ist. So wird man sagen, daß alle Bewohner des mit „Sprache A " gekennzeichneten Gebietes dieselbe Sprache sprechen. Zweitens impliziert die Karte, daß die sprachlichen Unterschiede zwischen den jeweiligen Gebieten so deutlich sind, daß eine Grenzziehung berechtigt ist. So lassen sich nach Abb. 3.1 die Sprachen B und C leicht unterscheiden, so daß es realistisch ist, zwischen den beiden eine Grenzlinie zu ziehen. 34
Abb. 3.1
In Wirklichkeit trifft jedoch keine dieser zwei Vorbedingungen zu. Zunächst einmal zeigen Sprachgebiete im allgemeinen eine erstaunliche innere Vielfalt. Darüber hinaus gehen sie sehr oft langsam ineinander über, so daß jede Trennlinie auf einer Karte mehr oder weniger willkürlich gezogen werden muß. Sprachsituationen wie in Abb. 3.1 finden sich deshalb nie in der Wirklichkeit. Tatsächliche Gegebenheiten nähern sich dem mehr oder weniger an, aber nie genau. Betrachten wir zuerst die Tatsache, daß die Trennlinie willkürlich gezogen ist. In manchen Fällen läßt sich eine vernünftige Trennlinie ziehen, ohne daß dadurch den Tatsachen allzusehr Gewalt angetan wird. So läßt sich etwa die Grenze zwischen den Vereinigten Staaten und Mexiko recht gut als Demarkationslinie zwischen Englisch und Spanisch verwenden. Aber selbst hier müssen einige wichtije Einschränkungen hinzugefügt werden. Viele Leute, die nahe der Grenze auf der amerikanischen Seite wohnen, sprechen besser Spanisch als Englisch, und manche sprechen nur Spanisch. Andererseits sprechen viele Leute auf der mexikanischen Seite Englisch. Zwischen dem Gebiet, wo Englisch so vorherrscht, daß Spanisch praktisch keine Rolle mehr spielt, und demjenigen, wo das Gegenteil der Fall ist, gibt es einen recht breiten Bereich, wo beide Sprachen verwendet werden, wo englische Wörter sich in spanisch geführte Gespräche einschleichen usw. Demnach ist sogar hier jede scharfe Trennlinie eine unzulässige Vereinfachung.
35
In anderen Fällen sind die Schwierigkeiten beim Festlegen einer Trennlinie noch viel größer. Das läßt sich an der Grenzlinie, oder vielmehr dem Fehlen einer Grenzlinie, zwischen dem Französischen und dem Italienischen zeigen. Für gewöhnlich denken wir uns das Französische und das Italienische als zwei deutlich verschiedene Sprachen. In der Tat werden ein Franzose aus Paris und ein Italiener aus Neapel einander nicht verstehen. Trotzdem können wir nicht einfach auf einen Punkt auf der Landkarte zeigen und sagen: „Hier hört das Französische auf und beginnt das Italienische." Der Übergang von eindeutig französischsprachigen Gebieten zu eindeutig italienischsprachigen Gebieten vollzieht sich allmählich. Wenn wir zwischen Paris und Neapel von Ort zu Ort gehen würden, würden wir wohl selten, wenn überhaupt, das Gefühl haben, ein Sprachgebiet zu verlassen und ein anderes zu betreten, weil die sprachlichen Unterschiede von einem Ort zum andern relativ gering sind. Es wäre an keinem Punkt so recht sinnvoll, zu sagen: „Aha, gerade habe ich das französische Gebiet verlassen, jetzt bin ich auf italienischsprachigem Territorium". So gesehen wäre es vielleicht nicht einmal gerechtfertigt, von zwei getrennten Sprachen zu reden, da es sich j a eigentlich um ein Kontinuum handelt. Und doch würde niemand, der nur die Sprache von Paris und die von Neapel vergleicht, daran zweifeln, daß er zwei verschiedene Sprachen vor sich hat. Daraus folgt eindeutig, daß irgendwelche Linien wie in Abb. 3.1 bis zu einem gewissen Grad künstlich sein müssen, da es nie eine scharfe geographische Grenze zwischen Sprachen gibt. Der Übergang mag relativ abrupt sein, wie zwischen Englisch und Spanisch an der mexikanischen Grenze, oder er mag irgendwo zwischen diesen Extremen liegen. Diese Einschränkung bedeutet nicht, daß wir überhaupt nicht von verschiedenen Sprachen sprechen können, aber sie zeigt, daß eine derartige Einteilung immer mehr oder weniger von der Wirklichkeit abstrahiert. Die zweite Implikation der Abb. 3.1 ist, daß es innerhalb jedes durch Grenzlinien bezeichneten Teilgebiets eine sprachliche Einheitlichkeit gibt. Selbst in den Vereinigten Staaten, wo es vergleichsweise wenig sprachliche Vielfalt gibt, ist diese Implikation nicht gerechtfertigt. Die Sprache von Texas unterscheidet sich von der in den Neu-England-Staaten, und Leute aus dem Mittelwesten sprechen nicht so wie die aus dem Süden. Entsprechendes findet sich im deutschen Sprachraum: Bayern sprechen anders als Hannoveraner, Schwaben anders als Österreicher. Wir alle sind uns dieser oberflächlichen Unterschiede bis zu einem gewissen Grad bewußt und erlauben uns gelegentlich sogar einen Witz auf Kosten eines anderen Dialekts.
36
Die Unterschiede sind verschiedener Art. Am bekanntesten sind wohl diejenigen der Aussprache, die ja sogar von einem Sprecher einer Sprache zum andern vorhanden sind. In Norddeutschland spricht man in dem Wort Salat das anlautende s stimmhaft [z] und die beiden a hell, während man in Österreich das s stimmlos spricht [s] und die beiden a dunkel, fast wie ein o. An den weichen Konsonanten erkennt man den Sachsen, und die Franken rollen das r auf besondere Weise. Aber auch im Wortschatz und in der Syntax gibt es regionale Unterschiede. So wird statt vom Metzger vom Fleischer, Fleischhauer oder Schlächter gesprochen, statt Johannisbeere findet sich Träuble oder Ribisl. In Süddeutschland verwendet man als Durativform ich bin gesessen, in Norddeutschland ich habe gesessen. Etwas vergessen heißt es in Deutschland, auf etwas vergessen in Österreich. Dies ist nur eine kleine Auswahl aus einer Vielzahl von Einzelheiten, in denen sich Sprecher des Deutschen unterscheiden. Im strengen Sinn kann also in dem Gebiet, wo Deutsch gesprochen wird, von sprachlicher Einheitlichkeit nicht die Rede sein. Wir müssen demnach unsere Vorstellung vom Sprachraum weiter differenzieren, um die wirkliche Sprachvielfalt berücksichtigen zu können.
Dialekte Ein naheliegender Versuch, das Bild realistischer zu gestalten, wäre, ein Sprachgebiet in Dialektgebiete aufzuteilen. Innerhalb des geographischen Bereichs der Bundesrepublik könnte man z. B. einen rheinländischen, einen hessischen, einen schwäbischen, einen bayrischen Dialekt u. a. kennzeichnen. Dieses etwas realistischere Bild ist in Abb. 3.2 schematisch dargestellt: Die Sprache A ist hier in die Dialekte A j , A2 und A3 aufgeteilt, das gleiche gilt für die Sprachen B und C. Natürlich ist bei der Setzung von Dialektgrenzen dieselbe Vorsicht geboten wie bei den Sprachgrenzen. Selten oder nie können wir auf der Karte mit Sicherheit angeben, wo ein Dialekt aufhört und der andere anfängt. Die Unterscheidung von verschiedenen Dialekten innerhalb einer Sprache beruht darauf, daß das Sprachsystem der Sprecher des einen Dialekts sich in bestimmten Punkten von dem der Sprecher des anderen Dialekts unterscheidet. Nehmen wir ein hypothetisches Beispiel: Der Dialekt B1 in Abb. 3.2 sei ein besonderer Dialekt der Sprache B, weil er etwa folgende Differenzen zeigt: (1) die Sprecher von Bl verwenden im Anlaut stimmhaftes s [z], wo andere Sprecher von B stimmloses s [s] sprechen; 37
Abb. 3.2
(2) es wird helles a [a] gesprochen, wo andere Dialekte von B dunkles a [o] haben; (3) das Wort tawpa bezeichnet einen bestimmten Vogel, der von den Sprechern von B2 und B3 als kenso bezeichnet wird. In Wirklichkeit ist es aber nicht so einfach. Wenn man versucht, Dialektgrenzen auf Grund von unterschiedlichen Elementen in den Sprachsystemen festzulegen, so erhält man verschiedene Ergebnisse, je nachdem, welche Merkmale des Sprachsystems als Kriterien für die Grenzziehung herangezogen werden. Hätten wir uns nicht die obengenannten Beispiele ausgewählt, sondern andere Merkmale der Aussprache, des Wortschatzes und der Syntax genommen, die bei Sprechern von B verschieden sind, so hätte sich möglicherweise eine völlig andere Aufteilung von B ergeben. Dazuhin wären diese Grenzen ebenso gültig wie die zuerst festgestellten, da sie auf derselben Grundlage gewonnen worden wären. Für die geographische Grenzlinie eines sprachlichen Merkmals verwenden die Linguisten den Terminus Isoglosse. Auch in einem relativ einheitlichen Sprachgebiet lassen sich eine ganze Anzahl von Isoglossen finden. Es besteht keine zwangsläufige Beziehung zwischen verschiedenen Isoglossen; sie überkreuzen sich, gehen auseinander und bieten oft ein ziemlich verwirrendes Bild. 38
Abb. 3.3
Abb. 3.3 ist eine mögliche Sprachkarte, auf der drei Isoglossen eingezeichnet sind. Die betreffenden sprachlichen Merkmale stammen aus dem Wortschatz. Manche Sprecher nennen einen sperlingartigen Vogel, der in diesem Gebiet vorkommt, finu, andere nennen ihn tawen Die vertikal verlaufende Isoglosse bezeichnet grob die Teilgebiete, die durch die beiden lexikalischen Einheiten charakterisiert sind: Sprecher links der Linie gebrauchen im allgemeinen finu, während rechts der Linie tawen gebraucht wird Entsprechend zeigen die Isoglossen für stanu/lufa und für sen/iktaw den Ausdehnungsbereich des Gebrauchs dieser lexikalischen Einheiten. Die drei Isoglossen teilen das in Abb. 3.3 gezeigte Gebiet in sechs Teilgebiete auf, wobei sich jedes Teilgebiet klar von den anderen fünf unterscheiden läßt. In einem Teilgebiet verwendet man finu, stanu und sen, in einem anderen tawen, stanu und sen. Wo ist also jetzt die Dialektgrenze? Auf diese Frage gibt es keine befriedigende Antwort. Dialektgrenzen werden auf der Grundlage von verschiedenen sprachlichen Merkmalen bestimmt, aber die drei sprachlichen Merkmale in Abb. 3.3 widersprechen sich gegenseitig. Nimmt man die Unterscheidung stanu/lufa als Kriterium für die Trennlinie, so muß sie an einer anderen Stelle gezogen werden, 39
als wenn man sen/iktaw zugrundelegt; und bei finu/tawen ergibt sich wieder eine andere Grenzlinie. Würden wir in Abb. 3.3 noch mehr Isoglossen hinzufügen, so würde das Bild noch komplizierter. Ein Ausweg aus der verzwickten Lage wäre, in Abb. 3.3 die Darstellung von sechs Dialektgebieten zu sehen. Man könnte, mit anderen Worten, den Terminus Dialekt so definieren, daß der Unterschied in mindestens einem sprachlichen Merkmal als Dialektunterschied zwischen zwei Sprechern zu werten sei. Also spricht ein Sprecher aus dem Gebiet finu/lufa/sen einen anderen Dialekt als einer aus dem Gebiet tawen/lufa/ sen, da der eine finu gebraucht und der andere tawen. Das Problem dieser Definition liegt darin, daß es keine zwei Menschen mit genau identischem Sprachsystem gibt. Nimmt man zwei beliebige Sprecher einer Sprache, so werden sie sich in bestimmten Elementen der Syntax, der Phonologie oder des Wortschatzes unterscheiden, ob sie sich dessen normalerweise bewußt sind oder nicht. Wahrscheinlich stimmt die Behauptung, daß keine zwei Sprecher der englischen (oder deutschen) Sprache genau dieselbe Menge von Wörtern in ihrem Wortschatz besitzen. Der eine hat immer zufällig einige Wörter gelernt, die der andere nicht kennt. Ziehen wir also die logische Folgerung aus der Annahme, daß ein Merkmal ausreicht, um eine Dialektgrenze festzulegen, so müssen wir zu dem Ergebnis kommen, daß jeder Sprecher seinen eigenen Dialekt spricht, den er mit niemandem gemeinsam hat. Die so gefundene Definition von Dialekt ist zwar völlig einsichtig, aber doch sehr eng gefaßt. Wir können damit etwa nicht vom „schwäbischen Dialekt" sprechen, weil keine zwei Schwaben genau das gleiche Sprachsystem besitzen. Und es ist doch offensichtlich oft nützlich, von Dialekten im weiteren Sinne reden zu können. Deswegen wird im allgemeinen der Terminus Idiolekt verwendet, um den Dialekt eines einzelnen Sprechers zu bezeichnen, während der Terminus Dialekt so weit gefaßt wird, daß man von einem schwäbischen Dialekt sprechen kann. Es muß sich also ein anderes Prinzip finden lassen, das es erlaubt, ein Sprachgebiet in Dialektgebiete aufzuteilen. Ein derartiges Prinzip haben wir implizit schon bei der Erläuterung von Abb. 3.2 angewandt. Wir hatten die Abtrennung des Gebiets Bj als eines besonderen Dialektgebiets damit gerechtfertigt, daß die Sprecher von Bj nicht nur ein differenzierendes Merkmal gemeinsam haben, sondern eine ganze Anzahl von Merkmalen, die in den anderen Dialekten von B nicht vorkommen. Demnach stellt die Trennlinie zwischen B i und B2 ein ganzes Bündel von mehr oder weniger zusammenfallenden Isoglossen dar. Auf oder nahe der Trennlinie von Bj und B2 befinden sich die 40
Isoglossen für [z]/[s], [a]/[o], tawpa/kenso und noch mehrere andere. Die Sprecher von B j haben jeweils noch individuelle sprachliche Merkmale, aber sie bilden doch eine gemeinsame Gruppe, indem sie viele sprachliche Merkmale gemeinsam haben, die sie von anderen Sprechern derselben Sprache unterscheiden. Man erhält also recht vernünftige Ergebnisse, wenn man Dialektgrenzen auf der Basis von Isoglossenbündeln definiert und nicht auf der Basis von einzelnen Isoglossen. Trotzdem ist eine Karte wie Abb. 3.2 immer noch eine weitgehende Abstraktion von der Wirklichkeit, genauso wie Abb. 3.1. Es ist eine grobe Vereinfachung, wenn man Dialektgrenzen zieht, die ein Sprachgebiet in sich überhaupt nicht überschneidende Teilgebiete aufteilt. Betrachten wir die Abb. 3.4, wo jede der numerierten Linien eine Isoglosse darstellt. Die Isoglossen 7, 8, 9, 10 und 11 verlaufen einigermaßen als Bündel. Wir sind demnach in der Lage, eine stärkere
Abb. 3.4
Dialektgrenze zwischen den Gebieten links und rechts des Bündels anzusetzen. Gleichzeitig bilden aber auch die Isoglossen 3, 4, 5 und 6 ein Bündel, das sich ebenso für die Festlegung einer deutlichen Dialektunterschei41
dung eignet. Wenn wir auf Dialektbereichen bestehen, die sich nicht überschneiden, müssen wir eine willkürliche Entscheidung treffen, welches oder welche Isoglossenbündel wir als Kriterien heranziehen. Werden alle gleichzeitig als Kriterien definiert, so überschneiden sie sich vielfach und ergeben viele kleine Dialektgebiete. Auf jeden Fall ist das Bild immer ziemlich komplex, und die sprachlichen Fakten einer Region bieten sich meist nicht von selbst als natürliche Einteilungsprinzipien für die Dialektbereiche an. Welche Entscheidung wir auch treffen, sie wird einigermaßen willkürlich sein und einige Fakten außer acht lassen. Es gibt immer verirrte Isoglossen wie 1 und 2, die die Lage komplizieren. Dialekte sind also eher ein Ergebnis unserer Begriffsbildung und unseres Bedürfnisses nach Vereinfachung als ein natürliches sprachliches Phänomen. Die sprachliche Vielfalt beschränkt sich aber nicht nur auf den geographischen Aspekt; mindestens zwei andere Dimensionen müssen ebenso behandelt, werden. Die erste ist die Dimension der sozialen Gruppierungen und Klassen. In einem bestimmten geographischen Gebiet, vor allem in Städten, gibt es Unterschiede in der Sprache, die mit der Sozialstruktur zusammenhängen. Bürger der Mittel- und Oberschicht unterscheiden sich in ihrer Sprache normalerweise merklich von den Arbeitern der Unterschicht. In Universitätsstädten findet sich oft ein deutlicher Sprachunterschied zwischen den Akademikern, die häufig aus anderen Gegenden stammen, und den „eingeborenen" Stadtbewohnern. Leute, die miteinander arbeiten, die die gleiche Beschäftigung oder das gleiche Hobby haben, haben oft auch ein gemeinsames Spezialvokabular, das nicht allgemein bekannt ist. So haben etwa Polizisten einen besonderen Jargon, genau wie Tennisspieler oder Mitglieder der Unterwelt. Die andere Dimension sprachlicher Vielfalt liegt in den einzelnen Sprechern selbst. Der einzelne Sprecher besitzt ja nicht nur sein eigenes Sprachsystem, sondern auch verschiedene Sprachstile, die er in verschiedenen Situationen einsetzt. Zum Beispiel unterscheidet sich der Sprachstil eines Sprechers bei der Vorstellung zur Bewerbung um einen neuen Posten beträchtlich von dem, den er im Kreis seiner Freunde verwenden wird. Wir sind auf Stilunterschiede eingestellt, auch wenn sie uns nur selten zu Bewußtsein kommen. Beobachten Sie etwa den leicht komischen Effekt der Stilmischung: Es ist mir ein tiefes Bedürfnis, Sie in aller Bescheidenheit zu ersuchen, blitzartig von hier abzuhauen. So begegnen wir der sprachlichen Vielfalt selbst dann, wenn wir nur einen Sprecher betrachten und dazu noch außer acht lassen, daß das sprachliche System eines Menschen im Laufe seines Lebens ja auch Veränderungen unterliegt. Wir haben die sprachliche Vielfalt so sehr betont, daß wir sogar die 42
Gültigkeit der Begriffe Sprache und Dialekt selbst anzweifeln mußten. Streng genommen, gibt es keine zwei identischen Sprachsysteme, so daß die Beschreibung eines Sprachsystems immer die Beschreibung des Sprachsystems eines Individuums sein müßte. Und selbst hier gelten noch Einschränkungen. Aber wir dürfen daraus nicht schließen, daß die verschiedenen Spielarten der Sprachen, die wir mit den Namen Deutsch oder Japanisch zu bezeichnen gewohnt sind, in keiner Weise zusammengehalten werden. Die sprachliche Vielfalt erscheint natürlich dann außerordentlich bedeutend, wenn wir sie allein betrachten und nicht versuchen, auch die Merkmale aufzuspüren, die für alle oder doch die meisten Idiolekte einer Sprache übereinstimmen. Je genauer wir jedoch in die Struktur einer Sprache eindringen, desto weniger Gewicht behalten die IdiolektUnterschiede. Sprecher der deutschen Sprache haben sehr viel mehr gemeinsame als trennende sprachliche Merkmale. Zudem pflegen die Unterschiede von eher untergeordneter Bedeutung zu sein. Man muß einen Eindruck von der Vielfalt des Sprachgebrauchs haben, aber man darf es nicht so weit treiben, daß man vor lauter Unterschieden die Ähnlichkeiten nicht mehr sieht.
Vereinheitlichende Kräfte Sprachliche Vielfalt läßt sich darauf zurückführen, daß Sprache gelernt und gebraucht wird und daß Lernen und Gebrauch der Sprache kreative Vorgänge sind, in die ein außerordentlich komplexes System einbezogen wird. Jeder Sprechakt ist bis zu einem gewissen Grad kreativ. Eine Sprache ist ein Kommunikationsinstrument, aber die Sprache selbst kommuniziert nicht. Um eine Vorstellung auszudrücken, muß der Sprecher die Situation einschätzen und das ihm verfügbare Sprachsystem so zur Kodierung der Vorstellung in ein Signal einsetzen, daß der Hörer in der Lage ist, die der Äußerung zugrundeliegende Vorstellung wenigstens annähernd zu rekonstruieren. Dabei spielt natürlich der Kontext der Situation eine bedeutende Rolle. Man kann also die Ursache für die sprachliche Vielfalt darin sehen, daß das abstrakte Sprachsystem für kommunikative Zwecke auf konkrete Situationen angewandt wird. Wenn das vom Sprecher benötigte Wort nicht vorhanden ist, prägt er ein neues oder bedient sich einer metaphorischen Wendung. Jedermann wird mich verstehen, wenn ich im entsprechenden Situationskontext sage Ich entunkraute den Garten. In allen Sprachen gibt es metaphorische Wendungen wie die Katze im Sack kaufen, in der Klemme sitzen oder jemanden übers Ohr hauen. 43
Der Neigung zur sprachlichen Vielfalt wirken jedoch auch eine Reihe von Kräften entgegen. Da eine Sprache in erster Linie der Kommunikation dient, kann ein Sprecher nicht nach Belieben Neuerungen einführen; sein Sprachsystem muß dem seiner Umwelt soweit ähnlich bleiben, daß eine Verständigung möglich ist. Neben diesem vorwiegend negativen Faktor wirken auf den Sprecher noch eine Reihe von positiven Kräften ein, die auf Einheitlichkeit hinzielen. Man orientiert im allgemeinen seine eigene Sprache an der Sprache seiner Umgebung, aus welchen psychologischen Motiven auch immer das geschieht. Ein wichtiger Grund ist sicher der, daß man den Wunsch hat, sich in eine Gruppe zu integrieren, und deshalb auch sprachlich dazugehören will. Diese Tendenz zur sprachlichen Einheitlichkeit innerhalb einer Gruppe ist wohl weitgehend unbewußt und nicht ausnahmslos feststellbar. Das stärkste Motiv ist vielleicht das Prestige-Motiv. Wer jemanden bewundert, wird ihn unter anderem auch im sprachlichen Habitus nachahmen. So kann die Sprache von berühmten oder bewunderten Personen zum Modell werden, nach dem sich andere richten. Dasselbe kann auch für bestimmte Dialekte gelten. Wenn ein Dialekt in der Einschätzung der ganzen Sprachgemeinschaft besonderes Prestige hat, so kann er als vereinheitlichender Einfluß wirken. Ein gutes Beispiel dafür ist das Französisch von Paris. Ursprünglich war es ein Dialekt wie jeder andere auch. Als jedoch Paris zu einem Mittelpunkt der Gesellschaft, der Wirtschaft und der Politik wurde, wurde dem Pariser Dialekt ein besonderer Wert beigelegt und er wurde, aus rein äußerlichen Gründen, zur mustergültigen Form der französischen Sprache überhaupt. Ein Dialekt, der besonderes Prestige hat, wird oft als korrekter, angemessener oder reiner angesehen als die weniger hochgeschätzten Dialekte. Es sollte klar sein, daß diese Beurteilung einer objektiven und kritischen Untersuchung nicht standhält. Die Vorstellung, daß es korrekte und weniger korrekte Formen der Sprache gibt, wird weitgehend durch die pädagogische Praxis aufrechterhalten. Deutsche Schulkinder müssen Feinheiten im Gebrauch der Konjunktionen oder Präpositionen besonders lernen. Etwa den Unterschied im Gebrauch von als und wie oder von denn und dann; sie lernen auch, daß man sich wegen etwas und nicht über etwas schämt und dergleichen mehr. Solange eine „korrekte" Sprache eine Voraussetzung für sozialen und beruflichen Erfolg darstellt, sind diese pädagogischen Bemühungen zumindest praktisch gerechtfertigt. Es ist jedoch zweifelhaft, ob sich grammatische Feinheiten wie die Differenzierung im Gebrauch 44
von wie und als erhalten hätten (soweit sie sich überhaupt erhalten haben), wenn man die Sprecher sich selbst überlassen hätte. Trotz des Grammatikunterrichts wissen viele Sprecher des Deutschen nicht genau, wann wie und wann als zu setzen ist. So kommt es vor, daß ein Sprecher besonders „korrekt" sein will und deshalb sagt Er ist so groß als ich. Solche Fälle nennt man h y p e r k o r r e k t e Formen; sie treten dann auf, wenn die Sprachnorm besonders ernst genommen wird. Zu den stabilisierenden Kräften gehört weiterhin die Schrift. Die Schrift kann entscheidend dazu beitragen, daß sich ein Dialekt als Standardsprache durchsetzt oder es bleibt. Geschriebene Sprache besitzt grosses Ansehen, wie das Beispiel der Kultur- und Literatursprache von Paris beweist. In schriftlicher Form kann eine Sprache oder ein Dialekt besser als Modell dienen, weil Geschriebenes dauerhafter ist als Gesprochenes. Die Autoren von Wörterbüchern und Grammatiken beziehen sich mit Vorliebe auf schriftliche Quellen, und ihre Beschreibungen werden in der Praxis meist als Vorschriften für das richtige Sprechen und Schreiben verstanden. Dies wirkt ebenfalls auf die Vereinheitlichung der Sprache hin. Wir sehen also, daß eine Tendenz zur Einheitlichkeit der Sprache sich ganz natürlich aus der Dynamik der sozialen Interaktion ergeben kann; auch die Ausbreitung sprachlicher Merkmale beruht letzten Endes auf der Kommunikation und der Bereitschaft der Leute, ihre Sprachmuster nach dem Vorbild anderer zu ändern. Wo wenig oder keine Kommunikation stattfindet, kann es auch keine Bewegung auf sprachliche Einheit hin geben. Geographische Hindernisse wie Berge können deshalb sehr wirksam Dialektunterschiede erhalten. Die Isoglossen können einen Berg nur dann überwinden, wenn die Leute oder ihre Nachrichten einigermaßen regelmäßig hin und her gelangen. Dasselbe gilt für politische oder soziale Grenzen. Deshalb häufen sich Isoglossen dort zu Bündeln auf, wo Lücken im System der Kommunikationskanäle sind. Diese Tendenz wird sich an späterer Stelle in unserer Untersuchung sprachlicher Verwandtschaften als wichtiger Faktor erweisen.
45
II Die Sprachstruktur
4. Der Aufbau der Grammatik
Einfache lexikalische Einheiten Die Isolierbarkeit sprachlicher Einheiten Man kann eine Sprache verstehen als eine unendliche Menge von Sätzen, von denen jeder einer Lautfolge eine Bedeutung zuordnet. Ein Satz besteht aus einer Wortkette. Die Bedeutung eines Satzes hängt von den darin enthaltenen Wörtern ab, ebenso wie die Lautform eines Satzes von der Lautform seiner Wörter abhängt. Indem wir einen Satz so charakterisieren, gehen wir von der Annahme aus, daß sprachliche Einheiten grundsätzlich isolierbar sind, daß es möglich und richtig ist, einen Satz in wortartige Einheiten aufzuteilen, von denen jede wieder in eine lineare Kette von einzelnen Lautsegmenten aufgeteilt wird. Die Isolierbarkeit von sprachlichen Einheiten erscheint vielleicht selbstverständlich, aber eine akustische Untersuchung eines Sprachsignals würde von sich aus noch nicht zu diesem Schluß führen. Rein physikalisch gesprochen gibt es meistenteils keinen deutlichen Einschnitt zwischen Wörtern, die nebeneinander in einer Äußerung vorkommen oder zwischen den Lautsegmenten eines einzelnen Wortes. Ein Sprachsignal gleicht viel eher einem kontinuierlichen Strom als einer Perlenkette, wo keine Perle in die andere übergeht. Zwar können wir bei der Äußerung eines Satzes zwischen den Wörtern eine Pause machen oder selbst in der Mitte eines Wortes, aber meistens tun wir es nicht. Und doch fühlen wir intuitiv, daß ein Satz in Wörter aufgeteilt werden kann. Unser Schriftsystem spiegelt eine solche Annahme der Isolierbarkeit wider, denn wir lassen im allgemeinen Zwischenräume zwischen Wörtern und geben jeden Laut eines Wortes mit einem eigenen Zeichen wieder. Es gibt eigentlich keinen Zweifel daran, daß sprachliche Einheiten in der Tat grundsätzlich isolierbar sind, obgleich das Sprechsignal selbst dagegen spricht. Wie Sie sich erinnern, besteht eine Sprache nicht aus Schallwellen in der Luft; sie ist vielmehr die Kompetenz des Sprechers, 49
d. h. die Menge von Prinzipien, die der Sprecher beherrscht und mit deren Hilfe er über eine unendliche Menge von Sätzen verfügt. Auf der Grundlage dieser Kompetenz konstruiert ein Sprecher irgendwie Sätze und gibt ihnen eine Lautform; damit produziert er das physikalische Sprechsignal. Es gibt also keinen Widerspruch zwischen der Behauptung, daß linguistische Einheiten isolierbar sind, das Sprechsignal aber kontinuierlich ist. Die Behauptung der Isolierbarkeit gilt für die Einheiten der Sprachkompetenz, für die psychologische Repräsentation der Sprachstruktur, die dem sprachlichen Verhalten zugrundeliegt. Diese Einheiten wollen wir nun im folgenden untersuchen.
Wörter und Morpheme Bis jetzt haben wir den umgangssprachlichen Terminus Wort verwendet, um eine mittlere Struktureinheit zu bezeichnen, die kleiner ist als ein ganzer Satz, aber größer als ein einzelnes Lautsegment. Wörter scheinen eine gültige psychologische Einheit darzustellen; wir könnten vielleicht Antipathie falsch schreiben, aber wir würden wahrscheinlich nicht den Fehler machen vor thie eine Lücke zu lassen, um eine Wortgrenze anzudeuten: Antipa thie. Ferner gibt es bei der Äußerung eines Satzes Stellen, wo eine Pause natürlicher klingt als an anderen. Der Satz Friedrich hat eine Antipathie gegen Kommunisten könnte nach jedem orthographisch abgesetzten Wort natürlich unterbrochen werden, aber kaum nach Friedri. Wenn wir jedoch die Struktur einer Sprache untersuchen, bemerken wir alsbald das Vorhandensein von Einheiten der grammatischen Struktur, die kleiner als Wörter sind. Das Wort Kinder zum Beispiel läßt sich ganz natürlich in die Teile Kind und er auflösen. Kind kann allein als einzelnes Wort auftreten oder auch in den Wörtern kindlich, kindgemäß usw. Die Pluralendung er in Kinder kommt auch in anderen Substantiven wie Bilder, Eier, Rinder vor. Das Tele in Telefon findet man auch in Telegraph, Telepathie und Teleskop. Das Wort Undankbarkeit läßt sich auflösen in Undankbar und keit; undankbar läßt sich auflösen in un und dankbar, das seinerseits wieder aus Dank und bar besteht. Jede der vier Komponenten, un, Dank, bar und keit kommt in anderen Wörtern oder als unabhängiges Wort allein vor (wie in untreu, Dank, fruchtbar, Heiterkeit). Minimaleinheiten der grammatischen Struktur wie die vier Komponenten von Undankbarkeit nennt man Morpheme. Telefone besteht also aus drei Morphemen, während Telefon nur zwei enthält. Ein Mor50
phem hat normalerweise eine ziemlich klare und konstante Bedeutung, wann immer es verwendet wird, obgleich sich Ausnahmen von dieser Regel finden lassen. Un hat negative Bedeutung in untreu, undankbar, unbeschäftigt, unfähig, unfreundlich und in vielen anderen Wörtern. Er besitzt eine konstante Bedeutung in Maler, Lehrer, Kämpfer, Zuschauer, Ausbilder, Säufer und Sänger. Andererseits wäre es schwierig, irgendeine konstante Bedeutung für spekt in den folgenden Wörtern festzustellen: Prospekt, Aspekt, suspekt und Spektakel. Entsprechendes gilt für pro in progressiv, Protest, Professor, Prozeß und Produktion. Zu hat eigentlich keine Bedeutung in Sätzen wie Er hat nichts zu tun, obgleich es vorhanden sein muß, damit solche Sätze grammatisch sind. Ähnliches gilt für das Englische do in Why do they grow beards and demonstrate so often, desgleichen für es und daß in Es mißfällt mir, daß sich Herwig weigert, seinen Musterungsbescheid zu verbrennen. Morpheme zeigen zuweilen verschiedene phonetische Realisationen. Im Englischen etwa wird pro in profess (Ton auf der zweiten Silbe) anders ausgesprochen als in progress (Ton auf der ersten Silbe); vergleichen Sie im Deutschen vier und vierzehn. Das englische Pluralmorphem wird in Wörtern wie lamps, ropes, births, puffs, nuts, racks und fights als [s] ausgesprochen. In Wörtern wie ideas, bras, cards, pencils, dams, cans, bibs und pills wird es jedoch als [z] ausgesprochen; eine dritte Aussprache gibt es in churches, judges, juices, roses, flashes und rouges mit [ez]. In manchen Substantiven besitzt das Pluralmorphem überhaupt keine phonetische Form; denken Sie etwa an Ich suchte ein Zimmer und Ich fand keine Zimmer. Englische Beispiele für diese Erscheinung wären die Wörter sheep und fish. Im Englischen gibt es zusätzlich noch völlig einmalige Pluralformen wie oxen, chädren und brethren. Es ist nicht immer eindeutig, ob eine gegebene Lautfolge als ein Morphem angesehen werden sollte oder nicht. Sollte z. B. animal als zweimorphemig betrachtet werden, anim(a) und (a)l, oder nur einmorphemig? (Denken Sie an animate, nature/natural.) Sollte man woman in wo plus man aufteilen? In jedem Fall muß eine Lautfolge, die in manchen Wörtern ein Morphem darstellt, nicht notwendigerweise immer ein Morphem sein. Un ist zweifellos ein Morphem in undankbar und unfähig, aber es ist kein Morphem in unter oder Tunnel.
51
Morphemtypen Die Linguisten unterscheiden manchmal zwischen lexikalischen und grammatischen Morphemen, freien und gebundenen Morphemen, Wurzeln und A f f i x e n . Obgleich diese Unterscheidungen ziemlich oberflächlich sind, lohnt es sich doch, sie zu untersuchen, selbst wenn man daran nur zeigen kann, wie die Morpheme sich in ihrem Verhalten voneinander unterscheiden. Nehmen Sie die Kette Mann hack- Holz Axt. Diese Morphemkette ist kein grammatischer Satz des Deutschen, obgleich sie aus deutschen Morphemen besteht. Andrerseits kann man unschwer die allgemeine Bedeutung dieser ungrammatischen Kette verstehen. Ohne Schwierigkeit können wir uns einen Mann vorstellen, der eine Axt hält und damit Holz hackt. Dieser ungrammatische Satz hat eine gewisse Bedeutung. Er ist etwas vage, aber man kann die Begriffssituation, die der Satz wiedergibt, weitgehend rekonstruieren. Um den Satz Mann hack- Holz Axt in einen grammatischen Satz zu verwandeln, könnten wir folgende Morpheme hinzufügen: der, PRÄT (zur Angabe des Verbaltempus) mit, ein, -er (als Flexionsmorphem zur Angabe von Genus und Kasus); wir erhalten so Der Mann hackte Holz mit einer Axt. Der Satz ist nun wohlgeformt und um einiges präziser, aber die zusätzlichen Morpheme fügen relativ wenig semantischen Inhalt hinzu. Sie fassen die von dem Satz dargestellte Begriffssituation schärfer, aber die Bedeutung, die sie beitragen, scheint zweitrangig zu sein. Die entscheidenden Bedeutungskomponenten wurden von den Morphemen Mann, hack-, Holz und Axt geliefert. Lexikalische Morpheme sind Formen wie Mann, hack-, Holz und Axt; gramm atische Morpheme sind Formen wie der, mit, ein, -er, und das Präteritalmorphem (PRÄT). Lexikalische Morpheme sind Substantive, Verben, Adjektive und Adverbien. Sie besitzen eine mehr oder weniger unabhängige Bedeutung, so daß eine Folge von lexikalischen Morphemen in sich schon eine gewisse Bedeutung tragen kann. Axt ruft in uns eine ziemlich klare Vorstellung hervor, ebenso Man« hack- Holz Axt. Mit, ein oder der mit einer allein gibt uns nicht viel Information. Die Klassen der lexikalischen Morpheme enthalten Hunderte oder Tausende von Elementen. Es gibt z. B. im Deutschen Tausende von Substantiven, und es ist ein alltäglicher Vorgang, daß neue Substantive dem Wortschatz hinzugefügt werden. Grammatische Morpheme sind etwa Präpositionen, Artikel, Konjunktionen und Formen, die Numerus, Genus oder Tempus und dergleichen angeben. Solche Klassen enthalten verhältnismäßig we52
nige Elemente, und neue Elemente werden in einer Sprache ziemlich selten hinzugefugt. Die Unterscheidung zwischen lexikalischen und grammatischen Morphemen ist brauchbar und bis zu einem gewissen Grad auch korrekt, aber man sollte sie nicht zu weit treiben. Sie ist einigermaßen künstlich, denn in Wirklichkeit gibt es ein Kontinuum ohne scharfe Einschnitte, das sich von Morphemen mit semantischem Inhalt wie Holz bis zu solchen Morphemen erstreckt, die keinerlei semantischen Inhalt haben wie das es in Es mißfällt mir, daß Herwig sich weigert, seinen Musterungsbescheid zu verbrennen. Präpositionen werden zu den grammatischen Morphemen gerechnet, obgleich sie einen gewissen semantischen Inhalt besitzen. Der Satz Die Münzen sind auf dem Pult wird in seiner Bedeutung entscheidend verändert, wenn man auf durch unter, neben, über, bei, in ersetzt. Grammatische Morpheme wie das lieh in gröblich, das un in unfähig und das er in Läufer besitzen einen ganz bestimmten semantischen Inhalt. Und, oder und aber sind keineswegs synonym. Andrerseits besitzen nicht alle lexikalischen Morpheme eine unabhängige Bedeutung. Was ist z. B. die Bedeutung von stehen in verstehen? Die Unterschiede in der Anzahl sind auch nicht eindeutig. Die deutschen Präpositionen sind ziemlich zahlreich, zumindest wenn man sie mit den einmorphemigen Ortsadverbien wie hier und dort oder mit den einmorphemigen Zeitadverbien wie jetzt, dann und bald vergleicht. Freie Morpheme sind diejenigen, die isoliert als unabhängige Wörter stehen können; alle anderen heißt man gebundene Morpheme. Hund, schlank, grob, Beere und schön sind demnach Beispiele für freie Morpheme, während das Pluralmorphem e von Hunde, das heit von Schlankheit, das lieh von gröblich und das un von unschön gebundene Morpheme sind. Die meisten lexikalischen Morpheme sind frei und viele grammatische Morpheme sind gebunden, wie die obigen Beispiele zeigen, aber die beiden Unterscheidungen stimmen nicht überein; es gibt Ausnahmen in beiden Richtungen. Und, oder und aber sind grammatische Morpheme und doch unabhängige Wörter. Him und Brom würde man als lexikalische Morpheme betrachten, aber sie sind an Beere gebunden und treten nie allein auf. Eine Vielzahl von Wörtern werden durch die Hinzufügung von einem oder mehreren grammatischen Morphemen an ein lexikalisches Morphem gebildet. Wir haben gesehen, daß bar an Dank angefügt wird, um dankbar zu bilden, das weiter zu undankbar und Undankbarkeit erweitert werden kann. Dem lexikalischen Morphem grün können wir das grammatische Morphem lieh hinzufügen und erhalten das Wort grünlich. E wird zu Hund hinzugefügt, und man erhält Hunde. Das aztekische Wort nitetla53
zotla bedeutet ,ich liebe' oder ,ich liebe jemanden'. Tlazotla ist eine lexikalische Form, das Verbum ,lieben'. Ni und te sind grammatische Formen; ni bezeichnet das Subjekt des Verbs: ,ich'; te bezeichnet, daß das Objekt des Verbs menschlich aber nicht weiter spezifiziert ist. Das aztekische Wort tlamatini bedeutet,weiser Mann' oder .Wissender'. Das Verb mati bedeutet,wissen'. Die grammatischen Morpheme tla und ni werden hinzugefügt und bilden so tlamatini; tla ist ähnlich wie te: es bezeichnet, daß das Objekt des Verbs mati nicht spezifiziert ist und daß es nicht menschlich ist; ni wird am Ende des Verbs tlamati hinzugefügt und trägt die Bedeutung ,Agens' bei, genau wie das er in Sänger. Dabei ist zu bemerken, daß das ni in nitetlazotla und das ni in tlamatini nicht das gleiche Morphem sind, obgleich sie die gleiche phonologische Gestalt besitzen. Ebenso sind das er in Sänger und das er in stärker zwei verschiedene Morpheme; abgesehen von ihrer Aussprache haben sie völlig verschiedene Eigenschaften. Das lexikalische Morphem, das den Kern solcher Wörter bildet, nennt man die Wurzel, während die grammatischen Morpheme, die an eine Wurzel angefügt werden, um größere Einheiten zu bilden, Affixe genannt werden. Demnach ist Dank die Wurzel, an die die Affixe bar, un und keit angefügt werden, um die Form Undankbarkeit zu bilden. In grünlich ist grün die Wurzel und lieh das Affix. Die Affixe tla und ni umgeben die Wurzel mati in tlamatini. Affixe, die der Wurzel vorausgehen wie etwa tla, nennt man Präfix; lieh, das auf die Wurzel grün folgt, ist ein Suffix. In manchen Sprachen, z. B. im Arabischen, können Affixe auch in die Wurzel selbst eingefügt werden; solche Affixe, die man Infixe nennt, sind sehr viel seltener als Präfixe und Suffixe.
Flexion und Derivation Das Anfügen von Affixen an Wurzeln kann verschiedene Wirkungen haben. Fügt man an die Form Hund ein e und bildet damit Hunde, so ist die Wirkung eine genauere Angabe der Zahl der Tiere auf die sich Hund bezieht. Hund und Hunde sind beide Substantive; die Hinzufügung des Pluralmorphems verändert nicht die Zugehörigkeit des Wortes zu einer grammatischen Klasse (oder, in der älteren Terminologie: sie verändert nicht den Redeteil). Entsprechend ergibt die Suffigierung des Präteritalmorphems an das Verb hack- wieder ein Verb, nämlich hackte. Andrerseits wird das Adjektiv grün durch die Hinzufügung des Morphems en in die Klasse der Verben überführt: grünen. Tlamati ist eine Verbform mit der Bedeutung 54
,etwas wissen'; die Hinzufügung des Suffixes ni ergibt tlamatini ,weiser Mann, Wissender', also kein Verb, sondern ein Substantiv. Durch die Hinzufugung des entsprechenden Affixes kann man ein Verb aus einem Adjektiv ableiten oder ein Substantiv von einem Verb. Andere Affixe verbinden wieder andere grammatische Klassen. Entsprechend unterscheiden die Linguisten oft zwischen Flexions- und Derivationsaffixen. Hund und Hunde sind, ganz vorläufig ausgedrückt, verschiedene Formen der gleichen Einheit, desgleichen hack- und hackte oder lateinisch laudö ,ich lobe', laudas ,du lobst', laudat ,er lobt', laudämus ,wir loben', laudätis ,ihr lobt' und laudant ,sie loben'. Die Endungen, die an Hund, hackund laud- in den obigen Formen angefügt werden, sind Flexionsaffixe. Substantive wie Hund können den Numerus durch Flexion ausdrücken. Hackte enthält eine Flexionsendung, die das Präteritum bezeichnet. Lateinische Verben werden flektiert, um die Konkordanz in der Person (,ich' gegenüber ,du' gegenüber ,er') und im Numerus (Singular gegenüber Plural) mit dem Subjekt herzustellen. Das spanische Adjektiv hermosas ,schön' enthält zwei Flexionssuffixe; es steht mit dem von ihm näher bestimmten Substantiv nach Numerus und Genus in Konkordanz; a gibt an, daß das Substantiv feminin ist, und s, daß es Plural ist. Die Beziehung zwischen Dank und dankbar ist anderer Natur. Wenn bar an Dank angefügt wird, dient es nicht dazu, die Konkordanz mit einem anderen Element des Satzes zu bezeichnen oder die Wurzel im Hinblick auf Numerus, Tempus oder dergleichen näher zu bestimmen. Es gibt uns nicht einfach eine andere Version derselben Einheit; vielmehr leitet es davon eine Einheit ab, die von der ersteren deutlich unterschieden ist. Bar wird deshalb als ein Derivationsaffix bezeichnet. Das aztekische Suffix ni ist ein Derivationssuffix, das aus einem Verb ein Substantiv bildet wie in tlamatini. Die Wortbildung im Deutschen macht sehr stark von dem Mittel der Derivationsaffixe Gebrauch. Betrachten wir z. B. einige der Affixe, die Substantive aus Verben ableiten. Ung ist sehr produktiv, denken Sie an die Formen Fahndung, Röstung, Tilgung und Tötung und viele andere. Age bildet aus den entsprechenden Verben auf ieren die Formen Massage, Blamage und Sabotage. Das Agens-Suffix er ergibt Fahrer, Sänger, Schwimmer, Räuber und zahllose andere. Weitere Paare von Verbum und Substantiv, die diesen Typ von Affix illustrieren, wären promenieren/Promenade, existieren/Existenz und demonstrieren/Demonstration. Derivationsaffixe bewirken nicht immer den Wechsel der grammatischen Klasse. Das Präfix ent z. B. verbindet nehmen und entnehmen, wobei es sich beidemale um Verben handelt. Vergleichen Sie anmelden/ 55
wiederanmelden, schön/unschön, praktikabel/impraktikabel. Im Englischen wird eine Veränderung der grammatischen Klasse nicht immer durch ein sichtbares Element bezeichnet. Star und face sind zunächst einmal Substantive, aber sie können auch ohne Affix als Verben verwendet werden: The governor will star in a new movie; Some people can never face reality. In ähnlicher Weise können die Adjektive major und minor als Verben verwendet werden. To major in linguistics bedeutet .Linguistik als Hauptfach studieren' und To minor in physics bedeutet ,Physik im Nebenfach studieren'.
Komplexe lexikalische Einheiten Affixe Das Lexikon einer Sprache ist ihr Morpheminventar, in dem auch Information enthalten ist über die Möglichkeiten der Kombination von Morphemen zur Bildung komplexerer lexikalischer Einheiten wie etwa der Wörter. In manchen Fällen verläuft die Kombination von Morphemen zu komplexen lexikalischen Einheiten sehr regelmäßig. Das Präteritalmorphem kann jedem deutschen Verb hinzugefügt werden. Also gibt es hack/hackte, seh-fsah, bring-jbrachte, kann/kannte, bin/war, beiß-/biß usw. Wenn man das Verb ins Präteritum setzt, so geben sich von Verb zu Verb verschiedene phonetische Wirkungen. Im Englischen gibt es sogar einige Verben, bei denen die Hinzufügung des Präteritalmorphems überhaupt keine phonetische Auswirkung hat, etwa cut. Vergleichen Sie I cut meat every day und I cut meat yesterday. Im allgemeinen ist die Bildung von Wörtern durch die Hinzufügung von Flexionsmorphemen recht regelmäßig. Die Kombination von Wurzeln mit Derivationsaffixen ist im allgemeinen weniger regelmäßig. Man kann jemanden mißachten oder mißbrauchen, aber kaum mißloben. Jemand kann kindisch, weibisch oder närrisch sein, aber kaum feindisch, ordinariusisch oder ameisisch. Man kann einer Sache widerstehen, aber schwerlich widertreten. Jemand, der tanzt, ist ein Tänzer, jemand, der läuft, ist ein Läufer, aber jemand, der lebt, ist kein Leber. Im Gegensatz zu den Flexionsprozessen erstrecken sich die Derivationsprozesse vom Bereich der Regelmäßigkeit bis hin zu völliger Isoliertheit und Unregelmäßigkeit. Die Unterscheidung zwischen im wesentlichen regelmäßigen sprachlichen Phänomenen und im wesentlichen unregelmäßigen oder vereinzel56
ten Phänomenen ist ziemlich wichtig, wie wir bei unserer Untersuchung von phonologischen und syntaktischen Systemen sehen werden. Sie berührt unmittelbar die Frage nach dem Wesen der Sprache und des Spracherwerbs. Nehmen wir an, ein Freund berichtet Ihnen, daß er im Urwald von Neu-Guinea eine bisher unbekannte Pflanze entdeckt hat und daß er sich entschlossen hat, sie eine Dack zu nennen. Sie kennen jetzt ein neues Substantivmorphem, Dack. Im Gegensatz zum Deutschen, wo der Plural etwa Däcke oder Dacken heißen könnte, wüßte man im Englischen sofort, daß das korrekte Wort für die Mehrzahl von dack dacks wäre. Die Pluralbildung ist im Englischen nicht eine individuelle Eigenschaft von einzelnen Substantiven; sie wird vielmehr durch allgemeine und regelmäßige Prinzipien gelenkt, die man lernt, wenn man ein Sprecher des Englischen wird. Ein englisches Kind lernt nicht für jedes von Tausenden von Substantiven, daß etwa pencil einen Plural besitzt, apple einen Plural besitzt, box einen Plural besitzt usw. Vielmehr internalisiert es das allgemeine Strukturprinzip, daß jeder Gattungsname, der sich auf ein konkretes Einzelobjekt bezieht, einen Plural besitzt. (John, evaporation und butter sind Beispiele für Substantive, die normalerweise keinen Plural besitzen: John ist ein Eigenname, kein Gattungsname; evaporation ist kein konkreter Gegenstand; butter ist kein Einzelobjekt.) Auf Grund der Kenntnis dieses allgemeinen Prinzips weiß man, daß dack einen Plural besitzt. Dieses Prinzip erstreckt sich auf neue Fälle, auf neue lexikalische Einheiten, denen man noch nie begegnet ist. Was ein Sprecher lernen muß, ist einfach die Menge von Substantiven dieses Typs und das eine Prinzip, daß alle derartigen Substantive mit dem Pluralmorphem kombiniert werden können. Andrerseits ist die Hinzufügung des Derivationsaffixes un an Adjektive nicht völlig regelmäßig. Derselbe Prozeß der Wortbildung ist für die Formen unwahr, unglücklich und uneinsichtig usw. verantwortlich. Die Konstruktion dieser Wörter wird von einem ziemlich allgemeinen Prinzip gelenkt. Einzelne Adjektive fallen jedoch im Hinblick auf diesen Wortbildungsprozeß aus dem Rahmen. Es gibt kein offen erkennbares Prinzip, nach dem wir zwar unwahr, aber nicht unfalsch sagen; wir sagen unglücklich, aber nicht untraurig, uneinsichtig, aber nicht unschlau, unattraktiv, aber nicht unabstoßend oder unhäßlich. Es ist demnach beim Sprächerwerb nicht damit getan, das Inventar der Adjektive und das Ableitungsprinzip zu lernen, nach dem un an ein Adjektiv angefügt werden kann. Man muß dazuhin lernen, welche Adjektive diesem Prinzip der Ableitung unterworfen werden können und welche nicht. Was von allgemeinen 57
sprachlichen Prinzipien nicht vorausgesagt werden kann, muß für jede lexikalische Einheit einzeln gelernt werden.
Zusammensetzungen Das Hinzufügen von Affixen zu lexikalischen Morphemen ist eine der Möglichkeiten zur Bildung komplexer lexikalischer Einheiten aus einfachen. Es gibt noch verschiedene andere Möglichkeiten zur Bildung solcher Einheiten, die aber meistenteils weniger regelmäßig sind als die Affigierung. Die Affigierung besteht, wie wir gesehen haben, darin, daß man ein grammatisches Morphem an ein lexikalisches Morphem oder eine größere Einheit, die ein lexikalisches Morphem enthält, anfügt. Manche Wörter werden dagegen dadurch gebildet, daß man zwei oder mehr grammatische Morpheme kombiniert. Durch Kombination von zwei Präpositionen entsteht das Wort hinauf oder daneben. Das französische Wort des zeigt die Zusammenfügung von drei grammatischen Morphemen, falls man es als einzelnes Wort versteht: les besteht aus le oder la (dem bestimmten Artikel ,der' oder ,die') plus Pluralmorphem; de ,von' plus les wird realisiert als des. Des bedeutet also ,von den'. Häufiger sind wahrscheinlich die als Zusammensetzungen bekannten lexikalischen Einheiten. Eine Zusammensetzung ist eine lexikalische Einheit, die aus zwei oder mehr lexikalischen Morphemen besteht. Die Sprachen unterscheiden sich sehr in der Zahl der Zusammensetzungen, die sich in ihrem Lexikon findet; das Deutsche und Englische sind sehr reich an Zusammensetzungen. Einige Beispiele: Regenbogen, Bäckermütze, Rabenaas, Fliehkraftkupplung, Wasserspülung, Wasserturm, Hochspringer. Beachten Sie, daß in manchen Fällen zu einem der lexikalischen Morpheme noch ein grammatisches Morphem hinzutritt, wie in Wasserspülung. Im Deutschen und Englischen, nicht aber in allen anderen Sprachen, sind Zusammensetzungen durch ein besonderes Betonungsmuster gekennzeichnet: das erste lexikalische Morphem wird betonter ausgesprochen als das zweite. Auf Grund der Betonung kann man im Englischen die Folge Adjektiv - Substantiv red skin ,rote Haut' unterscheiden von der Zusammensetzung redskin ,Rothaut', in der red und nicht skin den Hauptton trägt. Vergleichen Sie im Deutschen die beiden Wörter Regen und Bogen mit Hauptton auf der jeweils ersten Silbe mit der Zusammensetzung Regenbogen, wo nur die erste Silbe des ersten Morphems Hauptton trägt. Für die englischen Zusammensetzungen ist weiterhin bemer58
kenswert, daß sie in ihrer Orthographie keineswegs einheitlich sind. Manche werden zusammengeschrieben, manche werden in zwei Wörtern geschrieben; vergleichen Sie sunbum .Sonnenbrand' und gas mask .Gasmaske'. Diese Tatsache muß uns nicht unbedingt überraschen, da die Zusammensetzungen doch eine gewisse Zwischenstellung einnehmen. Einerseits sind sie einzelne komplexe Einheiten, aber gleichzeitig unterscheiden sie sich von anderen Wörtern und ähneln Wortfolgen, da sie mehr als ein lexikalisches Morphem enthalten. Zusammensetzungen sind im Aztekischen außerordentlich häufig. Nehmen wir nur zwei Beispiele, tizanamacac und apannemini. Tizanamacac bedeutet,Kreideverkäufer'. Es besteht aus tiza .Kreide' plus namacac .Verkäufer', was seinerseits auf das Verb namaca .verkaufen' zurückgeht. Apannemini ist noch komplexer. Die zwei lexikalischen Morpheme sind a .Wasser' und nemi .leben'; pan ist ein grammatisches Morphem und bedeutet .auf; ni ist das Agens-Suffix, das wir schon von tlamatini , weiser Mann, Wissender' her kennen. Die ganze Zusammensetzung bedeutet also ,Wasser-auf-Leb-er' oder .einer, der auf (dem) Wasser lebt'. Obgleich sich eine Anzahl von Regelmäßigkeiten erkennen lassen, ist die Bildung von Zusammensetzungen doch eher individuell geprägt. Nehmen wir etwa die Zusammensetzungen, die aus Adjektiv plus Substantiv bestehen. Die folgenden erscheinen uns ganz regelmäßig: Wildbach, Grünfutter, Weißwein, Hochofen, Kleinkind. Sie alle lassen sich umschreiben durch einen Ausdruck der Form Substantiv, das Adjektiv ist. Folglich ist ein Wildbach ein Bach, der wild ist und ein Kleinkind ein Kind, das klein ist usw. Dieses Muster der Zusammensetzung kommt häufig vor; mit anderen Worten: man kann eine derartige Zusammensetzung bilden, wenn es einen entsprechenden Ausdruck der Form Substantiv, das Adjektiv ist gibt. Jemand, der die Sprache lernt, muß jedoch noch mehr als nur dieses Prinzip der Bildung von Zusammensetzungen lernen. Er muß darüberhinaus noch eine Vielzahl von unvorhersagbaren, willkürlichen Fakten über Zusammensetzungen dieser Art lernen. Es ist eine rein willkürliche Tatsache, daß Weißwein eine deutsche Zusammensetzung ist, nicht aber Sauerwein. Warum gibt es die Form Kleinkind, nicht aber Frohkind, Lautkind oder Naßkind? Außerdem bedeuten einige Zusammensetzungen, die oberflächlich nach diesem Muster gebaut zu sein scheinen, nicht das, was man auf Grund des Musters vorhersagen würde. So ist eine Rothaut nicht eine Haut, die rot ist, sondern ein Indianer. Ein Dickkopf ist nicht dasselbe wie ein dicker Kopf. Andere Beispiele für diese besondere Form sind Grünschnabel, Langbein, Plattfuß, Rotrock, Bleichge59
Sicht. Ähnliche Beobachtungen könnte man auch für Zusammensetzungen aus anderen Wortklassen als aus Adjektiv plus Substantiv machen. Idiomatische Wendungen (Idioms) Eine andere Art von komplexer lexikalischer Einheit ist die idiomatische Wendung oder das Idiom. Ein Idiom ist eine Wendung, deren Bedeutung nicht auf Grund der Bedeutung ihrer einzelnen Morpheme vorausgesagt werden kann. Wenn man unter falscher Flagge segelt, muß das nicht notwendig auf hoher See sein. Man kann jemanden links liegenlassen, auch wenn er rechts steht. Auch wenn man die Katze aus dem Sack läßt, wird selten eine Katze herauskommen. Sprachen sind voller idiomatischer Wendungen. Einige andere Beispiele im Deutschen sind im Eimer sein, Dreck am Stecken haben, das Kriegsbeil ausgraben und den Nagel auf den Kopf treffen. Schon der Definition nach geschieht die Bildung idiomatischer Wendungen eher idiosynkratisch als regelmäßig. Weil die idiomatischen Wendungen aus Morphemen konstruiert sind, die auch nicht-idiomatisch verwendet werden können, gibt es für die meisten von ihnen auch eine wörtliche Bedeutung. Wer den Nagel auf den Kopf trifft kann in der Tat gerade dabei sein, einen Nagel einzuschlagen. Den Nagel auf den Kopf treffen schillert also in seiner Bedeutung zwischen dieser wörtlichen Interpretation und der übertragenen Bedeutung .etwas vollkommen richtig tun oder verstehen'. Interessant ist, daß idiomatische Wendungen nicht nur semantisch von den entsprechenden, wörtlich genommenen Morphemketten verschieden sind; zu der semantischen Eigenart treten oft auch besondere syntaktische Eigenschaften hinzu. Ein Beispiel: Zu der wörtlich gemeinten Form Die Bürste war im Eimer gibt es die Aktionsform Die Bürste fiel in den Eimer; wird jene aber idiomatisch gebraucht, im Sinne von .unbrauchbar', läßt sich die entsprechende Form nicht bilden. Idiomatische Wendungen ähneln oft festen Metaphern wie Gras über eine Sache wachsen lassen oder der Kern des Problems. Es ist in der Tat oft sehr deutlich zu sehen, wie das Idiom aus der Metapher entstanden ist, und es gibt keinen Grund, eine scharfe Trennlinie zwischen den beiden zu ziehen. Aber nicht alle idiomatischen Wendungen gehen auf Metaphern zurück. Wenn jemanden sticht der Hafer ursprünglich eine Metapher war, so ist die metaphorische Bedeutung heute nicht mehr so recht einsichtig. Andere Idiome entstehen nicht aus Metaphern, sondern durch Ellipse. Das spanische No hay de que bedeutet wörtlich ,Es gibt 60
nichts, wofür'; als idiomatische Wendung jedoch entspricht es dem deutschen ,keine Ursache' oder dem englischen ,don'tmention it'. Der Ausdruck ist etwas rätselhaft, bis man merkt, daß er eine Kurzform für einen längeren Ausdruck ist, der etwa zu übersetzen wäre als ,Es gibt nichts, wofür Sie mir zu danken hätten'. Das französische//n'y apas de quoi ist genau parallel gebaut. Idiomatische Wendungen und feste Metaphern (ganz abgesehen von anderen komplexen lexikalischen Einheiten) sind ganz eindeutig auf dem Amboß des Sprachgebrauchs zurechtgehämmert. Wenn sie auf die betreffende Situation zutreffen, sind metaphorische Ausdrücke viel farbiger als einfache prosaische Wendungen. Erfolgreiche Metaphern werden aufgegriffen und wieder angewendet, so daß sie schließlich zu einem festen Bestandteil der Sprache werden. Wir verwenden täglich hunderte davon, ohne es zu merken. Die hohe Redundanz der meisten alltäglichen Kommunikationssituationen, verbunden mit der natürlichen Neigung zum verkürzten Ausdruck und zum Weg des geringsten Widerstandes, läßt die Tendenz zur Ellipse leicht verständlich werden, die solche Formen wie No hay de que hervorbringt. Dieselbe Tendenz ist vielleicht auch bei der Bildung von Zusammensetzungen zu beobachten; es ist viel einfacher zu sagen Fliehkraftkupplung als Kupplung, die nach dem Prinzip der Fliehkraft funktioniert. Wörter, die im Gebrauch immer zusammen auftreten, neigen manchmal dazu, eine gemeinsame lexikalische Einheit zu bilden. Hin und her ist eine derart alltägliche Wendung, daß es etwas seltsam klingt, sie in der Reihenfolge her und hin zu hören. Tag und Nacht ist ein weiteres Beispiel \ Nacht und Tag klingt einfach nicht richtig. Im Englischen gibt es etwa die Fälle bread and butter oder hdm and eggs. The stars and stripes (Bezeichnung für die amerikanische Flagge) bezieht sich auf etwas anderes, als nur eine Anhäufung von Sternen und Streifen; stripes and stars dagegen besitzt diese besondere Bedeutung nicht. Dasselbe gilt für Hammer und Sichel. Die Morpheme genau, so, viel werden so häufig zusammen gebraucht, daß sie praktisch schon als ein Wort verstanden werden können. Wir können entweder genau so viel schreiben oder genausoviel. Ähnlich ist nichtsdestoweniger entstanden. Wer Französisch kann, wird denselben Typ auch in cependant,indessen' oder parce que ,weil' erkennen.
61
Phonologische, semantische und syntaktische Repräsentation Wenn jemand ein Morphem lernt, so ist seine eigentliche Leistung die, drei Typen von Information zusammenzufügen: phonologische, semantische und syntaktische. Nehmen wir an, jemand lernt das englische Morphem cat. Dafür muß er ein bestimmtes Maß an phonologischer Information beherrschen, nämlich daß die Aussprache dieses Morphems cat [kaet] ist und nicht filk, liberty, dog, act, tack oder sonstwie. Genauer gesagt, muß er lernen, daß dieses Morphem phonologisch aus drei Lautsegmenten besteht (nicht aus zwei und auch nicht aus sieben); daß diese [k], [ae] und [t] sind (und nicht etwa [s], [ae] und [t] oder irgend eine andere Kombination) und daß sie in der Reihenfolge [k]-[a;]-[t] auftreten (und nicht als [ae]-[t]-[k], [t]-[ae]-[k] oder in einer anderen Folge). Wir können also feststellen, daß jemand als Teil des Vorgangs, ein Morphem zu erlernen, eine phonologische Repräsentation des betreffenden Morphems lernen muß. Die phonologische Repräsentation des Morphems cat umfaßt mindestens die eben vorgeführte Information. Wir haben festgestellt, daß manche Morpheme semantisch leer sind; so besitzt z. B. to in I want to go keine Bedeutung. Die meisten Morpheme besitzen jedoch eine Bedeutung, und diese Bedeutung muß beim Lernen eines Morphems mitgelernt werden. Wir können heute noch nicht genau sagen, wie die semantische Repräsentation eines Morphems auszusehen hat und welche Art von Information mit einem Morphem verbunden sein muß, damit es eine feste Bedeutung hat, die sich von allen anderen möglichen Bedeutungen abhebt. Bekannt ist jedoch, daß Morpheme semantische Repräsentationen irgendwelcher Art besitzen und daß die Zuordnung einer semantischen Repräsentation zu einer phonologischen Repräsentation in einem Morphem in den meisten Fällen völlig willkürlich oder durch Konvention geregelt ist. Das Englische würde um kein Haar schlechter funktionieren, wenn die semantische Repräsentation von cat mit einer anderen phonologischen Einheit verbunden wäre. Ein Morphem ist aber durch seine semantischen und phonologischen Eigenschaften noch nicht vollständig definiert. Ein Morphem besitzt auch noch syntaktische Eigenschaften, eine syntaktische Repräsentation, die bestimmt, wie sich das Morphem im Hinblick auf die grammatischen Vorgänge der Sprache verhält. Cat z. B. kann nur als Substantiv auftreten und nie etwa als Adjektiv. Deshalb ist der Satz That fat cat spat atflat black mats grammatisch, nicht aber It is very cat. Demzufolge 62
kann man Morpheme als Bündel von semantischen, phonologischen und syntaktischen Eigenschaften verstehen. Ganz so einfach ist die Sache jedoch nicht. Das englische Wort route besitzt z. B. zwei verschiedene Aussprachen, manchmal sogar innerhalb desselben Idiolekts; es kann so ausgesprochen werden, daß es entweder auf shout oder auf shoot reimt. Ball kann die Bedeutung .Tanzveranstaltung' haben oder aber ein Sportgerät bezeichnen. Das englische Square kann syntaktisch als Substantiv, Verb oder Adjektiv auftreten (Mark an X in the proper Square ,Feld, Quadrat'; It is useless to try to Square the circle; .einen Kreis zu quadrieren (,die Quadratur des Zirkels'); The table is Square .quadratisch'). Es ist eher eine Ausnahme, wenn ein gewöhnliches lexikalisches Morphem eine einzige phonologische Repräsentation, eine einzige semantische Repräsentation und eine einzige syntaktische Repräsentation besitzt; davon kann uns ein Blick auf jede beliebige Seite eines Wörterbuchs überzeugen. Bei der Beschreibung des Lexikons einer Sprache müssen wir diese verschiedenen Möglichkeiten in irgendeiner Form berücksichtigen. Nun erhebt sich natürlich die Frage, in welcher Weise solche Einheiten, die Varianten ein und desselben Morphems zu sein scheinen, miteinander zusammenhängen. In Fällen wie dem angeführten Beispiel route ist nicht viel zu sagen. Das Morphem route besitzt für manche Sprecher zwei verschiedene Vokale in seiner phonologischen Repräsentation; wann immer der Sprecher diese Form ausspricht, hat er die Wahl, welchen er verwenden will. Viel interessanter sind die Fälle, wo die gleiche phonologische Repräsentation mit verschiedenen semantischen oder syntaktischen Repräsentationen verknüpft ist. Wir können zunächst einmal feststellen, daß viele Formen mit identischer phonologischer Gestalt darüberhinaus nichts oder nur wenig gemeinsam haben. In diesem Fall sind wir berechtigt, die Formen als verschiedene Morpheme anzusprechen. Die beiden ni im Aztekischen sind ein gutes Beispiel dafür. Das eine gibt an, daß das Subjekt .ich' ist, das andere ist ein Agens-Suffix; gemeinsam ist ihnen nur die Lautform. Die beiden er-Suffixe des Deutschen (in schöner und Schwimmer) sind ein weiteres Beispiel. Auch Moor und Mohr, die beide gleich ausgesprochen werden, haben zweifellos keine besondere Verwandtschaft. Das Vorhandensein solcher Paare (oder Gruppen) von phonologisch identischen Morphemen in einer Sprache sind als reiner Zufall zu betrachten. In anderen Fällen sind jedoch die Ähnlichkeiten so beschaffen, daß sie mit verschieden großem Nachdruck eine besondere Form der Verwandtschaft zwischen den lautlich identischen Formen vermuten lassen. 63
Betrachten Sie z. B. die Wendungen scharfe Klinge, scharfer Verstand, scharfes Bild, scharfe Kalkulation. Genau genommen sind die vier Formen scharf semantisch verschieden; sie können jeweils als ,gut schneidend', .schnell begreifend',,nicht verwackelt' und ,knapp, risikoreich' umschrieben werden. Aber in einem weiteren Sinne zeigen die vier Versionen von scharf eine ganz bestimmte semantische Beziehung, die es rechtfertigt, sie als Varianten eines einzigen Morphems zu behandeln. Rein intuitiv könnte man annehmen, daß scharf im Sinne von ,gut schneiden' gewissermaßen die Grundbedeutung ist, während die anderen Versionen sekundär sind, insofern, als sie als metaphorische Schöpfungen von der Grundform abgeleitet sind. Ein Verstand ist scharf, weil er ohne Mühe schwierige Probleme durchschneiden kann; ein Bild ist scharf, wenn die Umrisse klar und unverwischt geschnitten sind; eine scharfe Kalkulation ist eine, bei der zwischen Gewinn und Verlust nur eines Messers Schneide steht. Beispiele für solche metaphorische Erweiterungen gibt es zu Tausenden. Vergleichen Sie klares Wasser, ein klarer Fall, eine klare Darstellung und ein klarer Himmel; oder Karl schlägt Otto, Die Uhr schlägt zwölf, sich etwas aus dem Kopf schlagen, die gegnerische Mannschaft schlagen, ein Leck schlagen. Selbst, wenn wir uns auf einfache lexikalische Einheiten beschränken, die nur aus einem Morphem bestehen, treffen wir die weitverbreitete Wirkung der Metaphorik an. Aber nicht immer läßt sich ein Verhältnis von Grundbedeutung und abgeleiteter Metaphorik in den beiden Bedeutungen eines Morphems ohne weiteres feststellen. Das fuhren in einen Blinden führen und in ein Leben führen sind bis zu einem gewissen Grad bedeutungsähnlich (gemeinsam ist das Element aktiver Tätigkeit), aber keines von beiden läßt sich als metaphorische Ausweitung des anderen verstehen. Am schwierigsten zu fassen sind alle jene Varianten eines scheinbar gleichen Morphems, die je nach ihrem syntaktischen Gebrauch auch semantisch variieren. Solche Fälle kommen gerade im Englischen häufig vor. Zweifellos besteht eine Beziehung zwischen dem Substantiv circle in He drew a circle in the sand und dem Verbum circle in The Indians circled the cabin (.kreisten die Hütte ein') oder zwischen dem Substantiv fire (1 will light a fire) und dem homonymen Verb (fire the pottery ,die Tonwaren brennen'). Man ist versucht, den semantischen Unterschied direkt auf den Unterschied im syntaktischen Gebrauch zurückzuführen: man würde also sagen, daß die beiden Formen von circle dieselbe semantische Repräsentation besitzen, und daß der Unterschied zwischen circle als einer geometrischen Figur und circle als einer Bewegung, die einer sol64
chen Figur entsprechend verläuft, einzig und allein auf dem Unterschied zwischen Substantiven und Verben beruht. Das mag der wirklichen Sachlage nahekommen, aber die vollkommene Erklärung ist es nicht. Es genügt schon, festzustellen, daß es keine konstante semantische Wirkung gibt, die mit der Funktion eines Morphems als Substantiv, Verb oder ein anderer Redeteil automatisch gekoppelt ist. Der semantische Unterschied zwischen circle als Substantiv und als Verb ist der der Bewegung. Welcher Unterschied auch immer zwischen fire als Substantiv und als Verb besteht, es ist nicht der der Bewegung gegenüber Nicht-Bewegung. Der semantische Unterschied zwischen dem Substantiv skin (My skin is soft) und dem Verb skin (I skinned my knee ,ich habe mein Knie aufgeschürft') ist wieder völlig anders. Squaring a circle (,einen Kreis quadrieren') und circling a circle (,in Kreisbewegung fahren, gehen' etc.) sind zwei völlig verschiedene Dinge.
Die Bedeutung und ihre Realisierung Bei unserem Versuch, die Sprachstruktur zu erfassen, haben wir uns bisher hauptsächlich damit befaßt, die Sprache zu sezieren, um herauszufinden, aus welchen Teilen sie besteht. Wir haben gesehen, daß sich Sätze in lexikalische Einheiten verschiedener Art aufteilen lassen, von denen manche wiederum in kleinere lexikalische Einheiten aufgeteilt werden können. Wir haben gesehen, daß ein Sprachsystem als Ganzes, zumindest zur Vereinfachung der Untersuchung, sich in seine Teilsysteme, das semantische, das syntaktische und das phonologische, auflösen läßt. Eine lexikalische Einheit läßt sich auf ihre semantische, ihre syntaktische und ihre phonologische Repräsentation hin analysieren, wobei jede Repräsentation einem der genannten Teilsysteme entspricht. Es ist nun an der Zeit, daß wir den Schwerpunkt vom Sezieren auf die Anatomie oder die Physiologie verlagern, damit wir einen gewissen Überblick bekommen, wie die Komponenten einer Sprache zu einem zusammenhängenden System aufgebaut sind und wie sie zusammenwirken. Fragen der Semantik müssen in dieser Darstellung eine besondere Rolle spielen. In den Kapiteln 5 und 6 werden wir näher auf die Besonderheiten des syntaktischen und des phonologischen Systems eingehen. Kommen wir zurück zu unserer ursprünglichen Vorstellung von der Sprache als einem Mittel, Bedeutungen und Lautfolgen einander zuzuordnen. Der Besitz eben dieses Mittels setzt den Sprecher in die Lage, seine Gedanken zum Zwecke der Kommunikation in Lautfolgen zu über65
setzen und die von anderen Sprechern geäußerten Lautsignale zu verstehen, d. h. zumindest annähernd die Gedanken zu rekonstruieren, die der Anlaß zur Abgabe dieser Signale waren. Dieses Mittel zur Zuordnung von Bedeutungen und Lautfolgen besteht aus einer Menge von Konventionen und Prinzipien. Indem man sich dieser Konventionen und Prinzipien auf eine komplizierte und noch lange nicht genügend erforschte Weise bedient, ist man fähig, Äußerungen zu produzieren und zu verstehen. Was uns hier in erster Linie interessiert, ist nicht der praktische Gebrauch dieser Konventionen und Prinzipien, sondern ihr Charakter an sich. Mit anderen Worten: es ist unsere Aufgabe, die Sprachkompetenz soweit als möglich zu verstehen; über die Sprachperformanz weiß man noch sehr wenig, und in jedem Fall würde das den Rahmen dieses Buches überschreiten. Die folgenden Abschnitte werden also nicht Schritt für Schritt umreißen, was ein Sprecher tut, wenn er eine Äußerung produziert oder aufnimmt, sondern vielmehr den Aufbau des Systems skizzieren, das seiner Performanz zugrunde liegt und das es ihm ermöglicht, sowohl als Sprecher als auch als Hörer zu fungieren. Nehmen Sie den Satz Die Katze kratzte den Hund. Er besitzt eine Bedeutung und eine Lautform. Das Problem ist nun, festzustellen, wie und durch welche Organisationsform diese Bedeutung und diese Lautform (und alle entsprechenden Paare) verbunden sind. Wenn wir die Lage in
BEDEUTUNG
LAUTFORM
Abb. 4.1
Form der Abb. 4.1 darstellen, so geht es darum, die durch den Pfeil bezeichnete Beziehung zu charakterisieren. Die Beziehung ist komplex, selbst in den einfachsten Sätzen, so daß wir sie in kleinen Untersuchungsschritten betrachten wollen.
66
Die Rolle der phonologischen Regeln Fangen wir bei der phonologischen Seite an. Die Katze kratzte den Hund besteht aus einer Morphemkette. Wenn v/'uPRÄT für das Präteritalmorphem einsetzen und ein Pluszeichen zwischen den einzelnen Morphemen anbringen, so läßt sich der Satz folgendermaßen darstellen: die+Katze+ kratz-+PRÄT+den+Hund. Jedes dieser Morpheme besitzt, wie wir gesehen haben, eine phonologische Repräsentation. Das Morphem Katze ist zum Beispiel teilweise dadurch charakterisiert, daß es aus vier Lautsegmenten in folgender Reihenfolge besteht: [k], [a], [ts], [e]. Die phonologischen Repräsentationen dieser Einzelmorpheme spezifizieren noch nicht vollständig die Aussprache des Satzes in allen phonetischen Einzelheiten. Sie erinnern sich: eine Sprache ist charakterisiert durch ein phonologisches System, durch allgemeine phonologische Prinzipien, die sich nicht auf einzelne Morpheme beziehen, sondern für alle Morpheme der Sprache gültig sind. Diese Prinzipien werden kombiniert und wirken zusammen mit den phonologischen Repräsentationen einzelner Morpheme, um die vollständige, detaillierte Aussprache eines Satzes zu bestimmen. Ein Lautsegment wird zum Beispiel verschieden ausgesprochen je nach seiner lautlichen Nachbarschaft in der Kette. Das deutsche [k] in Katze (vor [a]) ist nicht phonetisch identisch mit dem in Kiste (vor [i]). Außerdem wird es im Wortanlaut anders ausgesprochen (mit starkem Hauch) als im Inlaut, etwa in Takt, wo die Behauchung viel geringer ist. Derartige allgemeine phonologische Prinzipien wie diese werden kombiniert mit den besonderen phonologischen Eigenschaften einzelner Morpheme, um die genaue Aussprache eines Satzes zu bestimmen. Wenn wir bei unserem Beispiel bleiben Die Katze kratzte den Hund, so können wir die oben gezeigte Skizze verändern und erhalten Abb. 4.2. Das phonologische System der Sprache ist verantwortlich für die Bestimmung der vollständigen Aussprache dieses Satzes auf der Basis der phonologischen Repräsentationen der Einzelmorpheme. Die Prinzipien des phonologischen Systems schreiben vor, daß das anlautende [k] in Katze behaucht ausgesprochen wird und weiter hinten am Gaumen gebildet wird als dasjenige in Kiste. Diese Prinzipien heißt man phonologische Regeln. (Dabei ist Regel nur ein einfacherer Terminus für Prinzip und wird genau in diesem Sinne verwendet.) Die Eigenart der phonologischen Regeln und Repräsentationen wird in Kapitel 6 ausführlicher dargestellt.
67
BEDEUTUNG
die + Katze + kratz + PRÄT + den + Hund
Phonologische Regeln
LAUTFORM
Abb. 4.2
Begriffsstrukturen und Oberflächenstrukturen Haben wir einen Satz als eine Kette von Morphemen, so bestimmen die phonologischen Regeln der Sprache auf der Basis von phonologischen Einzelrepräsentationen die detaillierte phonetische Form des Satzes, d. h. seine Aussprache. Der nächste Punkt unserer Untersuchung ist die Beziehung zwischen einem Gedanken, den ein Sprecher ausdrücken möchte (oder den ein Hörer rekonstruiert) und der dazugehörigen Morphemkette. Wie sind Bedeutungen und Morphemketten miteinander verbunden? Dies ist, milde ausgedrückt, eine schwierige Frage. Letzten Endes ist dies die entscheidende Frage mit der heutzutage die Linguisten in ihrer Untersuchung des Aufbaus der Sprache konfrontiert sind. Eine Antwort auf diese Frage muß die Beziehung zwischen der S y n t a x (der Menge der Prinzipien oder Regeln, die die Menge der grammatischen Sätze und deren Strukturen angibt) und der S e m a n t i k (der Untersuchung der Bedeutung) erläutern. Die Schwierigkeit wird noch verschärft durch die enge Beziehung zwischen Semantik und menschlicher Psychologie überhaupt; um Bedeutung zu beschreiben oder auch nur zu sagen, was Bedeutung ist, müssen wir uns mit der Struktur des Denkens und der Wahrnehmung beschäftigen. Es gibt aber bis jetzt noch wenig konkrete Erkenntnis über die Prinzipien der psychischen Struktur. Ohne Schwierigkeiten können wir die Bewegungen unserer Sprechorgane beobachten, um festzustellen, wie Laute gebildet werden; aber es ist sehr viel schwieriger, die Denkvorgänge zu beobachten und zu beschreiben. Wir können 68
zwar mit einiger Sicherheit einiges über die Beziehung zwischen Bedeutung und Morphemketten sagen, aber unser Wissen darüber weist noch viele große und ernstzunehmende Lücken auf. Welches ist die Beziehung zwischen der Kette die+Katze+kratz-+ PRÄT+den+Hund und der Bedeutung dieses Satzes? Zunächst muß beachtet werden, daß beide Elemente stark strukturiert sind. Die+Katze+ kratz-+PRÄT+den+Hund ist kein durch Zufall zusammengekommener Haufen, sondern eine in besonderer Weise angeordnete Gruppe von Morphemen. Einmal sind diese Morpheme in einer spezifischen linearen Folge nacheinander angeordnet. Eine Veränderung dieser Reihenfolge ergibt entweder eine ungrammatische Kette oder einen anderen Satz. Darüberhinaus hängen bestimmte aufeinanderfolgende Morpheme irgendwie untereinander zusammen und bilden erkennbare Teilketten. Die+Katze scheint eine besondere Gruppierung zu bilden; diese Teilkette funktioniert in einer Weise als Einheit, die für PRÄ T+den nicht zutrifft. Entsprechend ist kratz-+PRÄT+den+Hund in einer gewissen Weise eine Einheit (mit den Teileinheiten kratz-+PRÄT und den+Hund), im Gegensatz zu Katze+kratz-+PRÄT+den. Wir beschäftigen uns also mit einer ziemlich abstrakten Struktur, in der die lineare Anordnung der Morpheme nur eine Facette ist. Diese Struktur wollen wir die Oberflächenstruktur des Satzes nennen. Es ist ebenfalls deutlich, daß auch die Bedeutung des Satzes Die Katze kratzte den Hund strukturiert ist, aber es ist schwieriger zu sagen in welcher Weise. Wie sieht die Bedeutung eines Satzes überhaupt aus? Das ist eine berechtigte Frage, die wir aber im Augenblick noch nicht befriedigend beantworten können. Als Organismen mit komplexem Zentralnervensystem besitzen wir riesige Speicher von Begriffswissen, einem Wissen, das hochgradig organisiert und integriert ist. Denken ist das Handhaben von Begriffen, die Aktivierung von Teilbereichen unseres gesamten konzeptuellen Apparats. Ein Satz ist bedeutungsvoll, wenn überhaupt, weil er in Beziehung steht zu Aspekten unserer psychischen Organisation, weil er in der Lage ist, die Vorstellung einer Situation hervorzurufen oder von einer solchen hervorgerufen zu werden. Wir verwenden Sätze, um über vorgestellte Situationen zu reden, die sich in verschiedener Weise ergeben. Wenn A für B eine unmittelbare Schilderung eines Kampfes zwischen einer Katze und einem Hund gibt, wird er vielleicht den Satz Die Katze kratzte den Hund verwenden, indem er etwas berichtet, das er erst Sekunden vorher beobachtet hat. In diesem Fall ergibt sich die Konzeptualisierung des A direkt aus der sinn69
liehen Wahrnehmung. Er denkt eine Katze und einen Hund, weil er einen Vorgang beobachtet, an dem sie beteiligt sind, und er denkt sie sich als Teilnehmer an dem Akt des Kratzens, weil er gerade eine derartige Aktivität gesehen hat. B denkt sich einen Akt des Kratzens, weil A ihm sagt Die Katze kratzte den Hund. Auf der Grundlage des gehörten Satzes konstruiert er eine Art Vorstellungsbild des Vorgangs. Wenn der Kommunikationsvorgang erfolgreich ist, so wird das Vorstellungsbild von B weitgehend mit dem übereinstimmen, das A zu seinem Bericht veranlaßt hat; in Einzelheiten werden sie sich letztlich zweifellos unterscheiden, aber nicht in den Grundzügen. Die Konzeptualisierung einer Situation kann Zustandekommen, ohne daß irgendeine sprachliche oder nicht-sprachliche Wahrnehmung vorausgeht. Jemand kann sich eine Situation aus der Erinnerung heraus vorstellen und dann den erinnerten Sachverhalt berichten. Oder er kann sich seines Vorstellungsspeichers so bedienen, daß er sich etwas vorstellt, das er überhaupt noch nie beobachtet hat; unsere geistigen Prozesse besitzen einen beträchtlichen Grad der Unabhängigkeit von sensorischer Kontrolle Wenn man weiß, was Katzen und Hunde sind, und wenn man weiß, was es bedeutet, wenn etwas etwas kratzt, so kann man sich vorstellen, wie eine Katze einen Hund kratzt, auch wenn man es noch nie im Leben gesehen oder berichtet bekommen hat. Indem wir bekannte Vorstellungselemente neu anordnen und strukturieren, können wir neue Vorstellungen erfinden, die uns noch nie bewußt geworden sind. So entstehen Einhörner (mit oder ohne Blumen in den Nüstern) und alle Produkte menschlicher Kreativität. Die Bedeutung eines Satzes ist also eine begrifflich geformte Situation (conceptual Situation) und damit strukturiert. Die Bedeutung von Die Katze kratzte den Hund ist nicht identisch mit dem Vorstellungsbild, das A letzten Dienstag hatte, als er diesen Satz zu B äußerte, und ebensowenig identisch mit dem Vorstellungsbild, das sich B konstruierte, als er den Satz hörte. Vielleicht dachte A an eine Siamkatze und einen Collie, als er den Satz bildete, und er interessierte sich dafür, daß die Siamkatze gerade die linke Vorderpfote zum Kratzen verwendete, aber diese Einzelheiten gehören eindeutig nicht zur Bedeutung des Satzes selbst; wenn B keine andere Information als den Satz selber hätte, könnte er diese Einzelheiten daraus nicht erschließen. Insofern der Satz Die Katze kratzte den Hund überhaupt eine genau faßbare Bedeutung hat, beruht das darauf, daß die betreffenden begrifflich geformten Situationen, die er hervorruft oder die ihn hervorrufen, gewisse grundlegende Eigenschaften gemeinsam haben. Wenn wir all das unbedeutende Beiwerk entfernen 70
könnten, das bei jedem Konzeptualisierungsvorgang hereinspielt, der einem Satz zugrunde liegt, so könnten wir das begrifflich geformte Bild, das übrigbleibt, einigermaßen zutreffend als die Bedeutung dieses Satzes bezeichnen. Begrifflich geformte Bilder sind hochgradig strukturiert. Die begriffliche Situation, die durch Die Katze kratzte den Hund repräsentiert wird, ist keineswegs nur eine zufällige Anordnung von Vorstellungselementen. Sie besteht aus Teilen, die in einer ganz bestimmten Weise angeordnet sind. Eine Komponente dieses komplexen Gedankens ist die Vorstellung einer Katze, eine andere die eines Hundes. Diese Komponenten sind kombiniert als Teilnehmer an dem Vorgang des Kratzens. Die Tätigkeit wird in der Vorzeitigkeit gesehen. Wären diese Komponenten anders kombiniert, ergäbe sich ein anderer Gedanke. So könnten z. B. dieselben Elemente, in anderer Kombination strukturiert, die begrifflich geformte Situation darstellen, die durch Der Hund kratzte die Katze oder In Gegenwart des Hundes kratzte sich die Katze repräsentiert wird. Entsprechend besteht unsere Begriffsvorstellung von einem Fahrrad nicht einfach aus der Assoziation der Begriffe Rad, Pedal, Lenkstange, Rahmen, Sattel usw., sondern vielmehr aus einer Anordnung dieser Elemente in einer zusammenhängenden, bekannten Struktur. Ohne diese Konfiguration erhalten wir nur einen Haufen unzusammenhängendes Zeug. Sowohl die Morphemkette, die einen Satz ausmacht, als auch die dem Satz zugrundeliegende begrifflich geformte Situation sind also strukturierte Elemente. Das erste haben wir die Oberflächenstruktur eines Satzes genannt. Für das zweite wollen wir den Terminus Begriffsstruktur verwenden. Das semantische und das syntaktische System einer Sprache umfassen die Prinzipien, die Begriffsstrukturen und Oberflächenstrukturen miteinander verbinden. Für jeden Satz einer Sprache spezifizieren diese Prinzipien das Verhältnis zwischen seiner Form als Morphemkette und seinem Begriffswert. Wir können nun unsere Skizze (Abb. 4.2) revidieren, in der wir das Zusammenwirken der Komponenten einer Sprache bei der Zuordnung von Bedeutungen und Lautformen in der Form von Sätzen dargestellt haben. Als Ergebnis erhalten wir Abb. 4.3, in der die Termini Bedeutung und L a u t f o r m durch deskriptivere ersetzt sind: wir können sagen, ein Satz repräsentiert eine Begriffsstruktur und besitzt eine phonetische Realisierung.
71
BEGRIFFSSTRUKTUR
PHONETISCHE REALISIERUNG
Abb. 4.3
Die Wahl von lexikalischen Einheiten und die syntaktischen Regeln In Kapitel 2 haben wir uns das semantische und das syntaktische System kurz angesehen. Wir stellten fest, daß lexikalische Einheiten Bedeutung tragen bzw. einen Begriffswert haben, und daß die Bedeutung eines Satzes letztlich von den Bedeutungen seiner lexikalischen Einheiten abhängt. Diesen Aspekt der Sprache nannten wir das semantische System. Das syntaktische System wurde charakterisiert als die Menge von Prinzipien oder Regeln, die angeben, welche Ketten aus der Zahl aller möglichen Ketten von lexikalischen Einheiten grammatische Sätze der Sprache sind. Die Syntax einer Sprache kann, mit anderen Worten, als ein Regelsystem zur Konstruktion der unendlichen Menge von grammatischen Ketten einer Sprache verstanden werden. Wir können nun genauer beschreiben, wie diese Systeme funktionieren, um Begriffsstrukturen und Oberflächenstrukturen zu verbinden. Man kann einen Satz dazu verwenden, über eine Vorstellung von einer Situation zu reden, weil die Morpheme, aus denen er aufgebaut ist, im einzelnen Begriffswert bzw. semantische Repräsentationen haben. Morpheme können also dazu dienen, Komponenten eines komplexen Gedankens oder Aspekte seiner Konfiguration zu bezeichnen. 72
Nehmen wir nochmals an, A berichtet B von einem Kampf zwischen einer Katze und einem Hund. A sieht wie die Katze den Hund kratzt, und einen Augenblick später beginnt er, dies B zu berichten. Als Ergebnis einer eben gemachten sinnlichen Wahrnehmung hat A eine ziemlich komplexe Situation begrifflich geformt. Er hat eine Vorstellung erzeugt, die einen Vorgang mit zwei Teilnehmern umfaßt, die wiederum bestimmte Eigenschaften besitzen. Um diese komplexe Vorstellung in sprachliche Form zu übersetzen, wählt er Morpheme zur Bezeichnung von Teilelementen. Der Begriffswert des Morphems Katze entspricht einer Komponente der begrifflich geformten Situation; derjenige von Hund einer anderen und derjenige von kratz- einer dritten. Darüberhinaus stellt sich A den Vorgang zu einem vor der Gegenwart liegenden Zeitpunkt vor. Er kann deshalb das Morphem PRÄT verwenden, um die zeitliche Einordnung des Ereignisses anzugeben. In der Annahme, daß die Aufmerksamkeit von B sich schon auf eine bestimmte Katze und einen bestimmten Hund gerichtet hat, wählt er den bestimmten Artikel die (und den) vor Katze (und Hund) (im Gegensatz zu irgendeine, eine oder eine Angabe darüber, um welche Katze und welchen Hund es sich handelt). Die Bestimmung von lexikalischen Einheiten für die Repräsentation von Teilen einer Begriffsstruktur ist natürlich nur eine Facette in der Beziehung zwischen der Begriffsstruktur eines Satzes und seiner Oberflächenstruktur, die wiederum phonologische Regeln mit einer phonetischen Realisierung verbinden. Begriffsstruktur und Oberflächenstruktur sind keineswegs identisch, und folglich muß es eine bestimmte Menge von Prinzipien geben, die sie einander zuordnen. Diese Prinzipien sind die syntaktischen Regeln der Sprache, ihr syntaktisches System. Einige Beispiele sollen zeigen, daß Begriffsstruktur und Oberflächenstruktur von Sätzen nicht identisch sind. In manchen Fällen erscheinen Komponenten der Begriffsstruktur überhaupt nicht in der entsprechenden Oberfläche. Imperativsätze sind ein gutes Beispiel. Komm her! zeigt erkennbar kein Substantiv, das die Person oder das Ding, das kommen soll, bezeichnet. Trotzdem enthält der Begriffswert des Satzes selbstverständlich etwas, das im Hinblick auf den Sprecher seinen Ort verändern soll. Umgekehrt gibt es Sätze, die in ihrer Oberflächenstruktur Elemente enthalten, die in der Begriffsstruktur nicht vorkommen. Das zu in Du brauchst nicht zu kommen ist ein Beispiel dafür; es besitzt keinerlei Bedeutung. Herwig hat die Scheibe zerbrochen und Die Scheibe ist von Herwig zerbrochen worden haben verschiedene Oberflächenstrukturen, aber offensichtlich dieselbe Bedeutung, dieselbe Begriffsstruktur. Das 73
Streicheln der Affen war unangenehm kann aus zwei grundsätzlich verschiedenen Begriffsstrukturen entstehen (streicheln die Affen oder werden sie gestreichelt? ), aber die Oberflächenstruktur ist bei beiden Deutungen gleich. Mithin können Oberflächen- und Begriffsstruktur von Sätzen nicht identisch sein. Damit sind wir bei dem Schema vom Aufbau der Sprache, wie es in Abb. 4.4 dargestellt ist. Um eine Sprache zu lernen, muß man eine Menge von lexikalischen Einheiten, eine Menge von syntaktischen Regeln und eine Menge von phonologischen Regeln lernen. Jede lexikalische Einheit besitzt eine semantische Repräsentation, eine phonologische Repräsentation und eine syntaktische Repräsentation. Eine Begriffsstruktur ist mit einer Oberflächenstruktur verbunden durch die Wahl der lexikalischen Einheiten, deren semantische Repräsentation sie zu geeigneten Bezeichnungsteilen der Begriffsstruktur macht, und durch syntaktische Regeln. Phonologische Regeln verbinden die Oberflächenstruktur eines Satzes mit seiner phonetischen Realisierung auf der Basis der phonologischen Repräsentationen seiner lexikalischen Einheiten.
BEGRIFFSSTRUKTUR
Auswahl von le xikal. Einheiten Syntaktisc:he Regeln
OBERFLÄCHEN STRUKTUR
Phonologische Regeln
PHONETISCHE R E A L I S I E R U N G Abb. 4.4
74
Sprachliche und psychische Beschränkungen Um diese Skizze des Aufbaus von Sprachsystemen vollständig zu machen, wollen wir nochmals zu der Feststellung zurückkehren, die Syntax einer Sprache sei eine Menge von Regeln, die eine unendliche Menge von grammatischen Sätzen angeben und dabei unterscheiden zwischen solchen Morphemketten, die wohlgeformte Sätze sind, und solchen, die es nicht sind. Die Sätze einer Sprache bilden eine unendliche Menge, weil es prinzipiell keine Begrenzung ihrer Länge gibt; ebensowenig wie eine höchste Zahl gibt es einen längsten Satz. Bei einem derartigen Bau der Sprachen können demnach Sätze von jedem beliebigen Grad der Komplexität konstruiert werden. Es gibt eine doppelte Quelle für diese Eigenart der menschlichen Sprache. Erstens kann der menschliche Verstand prinzipiell Gedanken jedes beliebigen Komplexitätsgrades konzipieren; und zweitens sind die syntaktischen Regeln einer Sprache in der Lage, Begriffsstrukturen unabhängig von ihrer Komplexität mit Oberflächenstrukturen zu verbinden. Dieses Merkmal der syntaktischen Regeln soll im nächsten Kapitel einigermaßen ausführlich dargelegt werden. Der erste Punkt sollte aber noch verdeutlicht werden, bevor wir weiter fortschreiten. Unsere psychischen Mechanismen sind so gebaut, daß grundsätzlich begrifflich geformte Situationen in unbegrenzter Komplexität auftreten können. Jemand kann sich eine Katze vorstellen, die einen Hund gekratzt hat. Er kann sich auch vorstellen, daß jemand glaubt, daß ein bestimmter Zustand vorhanden ist. Diese zwei Vorstellungen können nun wiederum als Komponenten eines komplexeren Gedankens dienen, des Gedankens, daß jemand glaubt, daß die Katze den Hund gekratzt hat. Dieser Gedanke kann nun wieder Teil einer noch komplexeren Konzeptualisierung werden, bei der die Person B h o f f t , daß A glaubt, daß die Katze den Hund gekratzt hat usw. Es ist leicht einzusehen, daß diese begrifflich geformten Situationen strukturiert sind, daß die Teilvorstellungen nicht nur zufällig aufgehäuft sind. Daß B h o f f t , daß A glaubt, daß die Katze den Hund gekratzt hat, ist keineswegs das gleiche wie daß A h o f f t , daß B glaubt, daß die Katze den Hund gekratzt hat oder daß die Katze glaubt, daß A h o f f t , daß der Hund B gekratzt hat. Es sollte also evident sein, daß es keine prinzipiell notwendige Schranke für die mögliche Komplexität von derartigen begrifflich geformten Situationen gibt. Wenn wir sagen, daß es keine prinzipiell notwendige Schranke gibt, so meinen wir damit nicht, daß die menschlichen konzeptuellen Kräfte unbeschränkt seien. Zweifellos sind sie in mancherlei Weise hochgradig be75
schränkt, obgleich niemand so recht weiß, welcher Art diese Beschränkungen sind. Versuchen Sie sich z. B. etwas vorzustellen, das gleichzeitig rund und viereckig ist: es geht nicht. Man kann sich etwas vorstellen, das gleichzeitig rund und rot ist, aber nicht rund und viereckig. Man kann sich höchstens eine runde Figur oder eine viereckige Figur vorstellen, oder man kann schnell zwischen einer runden und einer viereckigen hinund herwechseln, oder man kann sich eine viereckige Figur über eine runde gelegt vorstellen. Derartige Beschränkungen muß es noch viele geben. Darüberhinaus gibt es Grenzen der kognitiven Leistungsfähigkeit, ebenso wie es Grenzen der sprachlichen Leistung (Performanz) gibt. Wenn wir eine sehr komplizierte Situation begrifflich fassen wollen, kann es leicht vorkommen, daß wir verwirrt werden oder die Komponenten falsch zusammensetzen usw. Von einem bestimmten Grad der Komplexität an beginnen wir Fehler zu machen. Es gibt ganz bestimmte Grenzen für die Menge an Information, die wir im Gedächtnis speichern und mit denen wir zu einem gegebenen Zeitpunkt operieren können. Folglich gibt es Gedanken, die einfach zu kompliziert sind, um auf einmal bewältigt zu werden. Beim Schachspielen etwa kann man ohne weiteres den nächsten Zug vorausdenken, und auch zwei Züge im voraus kann man noch einigermaßen bewältigen. Versuchen wir aber, uns alle Möglichkeiten und deren Konsequenzen für drei, vier oder fünf Züge im voraus vorzustellen, verlieren wir leicht das Konzept und müssen nochmals Schritt für Schritt von vorne anfangen. Es gibt also Gedanken, die zu komplex zur Bewältigung sind, auch wenn sie mögliche Gedanken sind, genau wie es grammatische Sätze gibt, die zu komplex sind, als daß wir sie bilden könnten. Diese Beschränkung ist grundsätzlich anderer Art als die, die es uns verwehrt, uns viereckige Kreise vorzustellen. Die Möglichkeit zur Vorstellung von viereckigen Kreisen wird schlechterdings von den Prinzipien der psychischen Organisation des Menschen ausgeschaltet. Sie hat nichts zu tun mit Komplexität oder Gedächtnisbeschränkungen. Aber keine der Komponenten der komplexen Konzeptualisierung, die ein Vorausplanen von elf Zügen beim Schach erfordert, wird durch psychische Beschränkungen ausgeschaltet, genausowenig wie ihre Anordnung; es sind einfach zu viele, als daß wir sie gleichzeitig im Gedächtnis behalten könnten. Im Bewußtsein dieser Unterscheidung wollen wir zum Begriff der Grammatikalität zurückkehren. Manche Sätze werden wahrscheinlich nie vorkommen, weil es die eben besprochenen Performanzbeschränkungen gibt. Kein Satz von 3 Milliarden Wörtern Länge hat eine reelle Chance, jemals geäußert zu werden, obgleich ein derartiger Satz prinzipiell kon76
struiert werden könnte; einen so langen Satz könnten wir einfach nicht bewältigen. Schon Sätze von mäßiger Länge können so verschachtelt sein, daß wir nicht leicht mit ihnen umgehen können. Die Tatsache, daß Josefine angekommen ist, ist ägerlich wird keine Schwierigkeiten bereiten; Die Tatsache, daß die Tatsache, daß Josefine angekommen ist, ärgerlich ist, ist erstaunlich wird aufs erstemal schon weniger leicht verstanden;/)/^ Tatsache, daß die Tatsache, daß die Tatsache, daß Josefine angekommen ist, ägerlich ist, erstaunlich ist, ist unbezweifelbar ist für die meisten Leute zu verschachtelt, um unmittelbar verstanden zu werden, obgleich sie es schaffen werden, wenn sie es schriftlich vor sich haben und genügend Zeit haben. Alle drei Sätze sind in gleicher Weise grammatisch und bedeutungstragend. Man darf Ungrammatikalität nicht mit übermäßiger Komplexität verwechseln, die die Bewältigung des Satzes erschwert oder unmöglich macht. Dadurch, daß wir eine Sprache sprechen, sind wir im Besitz von unendlich vielen wohlgeformten Sätzen, die zu kompliziert für eine leichte Bewältigung sind; ebenso können wir prinzipiell zwei beliebige Zahlen multiplizieren, auch wenn es viele Multiplikationen gibt, die zu schwierig sind, als daß wir sie im Kopf vornehmen könnten. Das ist einer der Gründe, warum wir zwischen Kompetenz und Performanz unterscheiden. Abweichende oder ungrammatische Sätze sind solche, die irgendeine Beschränkung verletzen; ob sie für den praktischen Gebrauch zu kompliziert sind, spielt hier keine Rolle. Wir könnten zwischen Ungrammatikalität im engeren und im weiteren Sinne unterscheiden. Im engeren Sinne ist ein Satz dann ungrammatisch, wenn er eine syntaktische Regel der Sprache verletzt. So ist z. B. Die Jungen bin dumm ungrammatisch im engeren Sinne. Es ist ein syntaktisches Prinzip der deutschen Sprache, daß das Verb eines Satzes mit dem Subjekt nach Numerus und Person übereinstimmt. Das Subjekt von Die Jungen bin dumm ist dritte Person Plural, aber die Verbform bin ist eine Form, die nur zu einem Subjekt der ersten Person Singular gehört (ich). Ein weiteres syntaktisches Prinzip der deutschen (wie der englischen) Sprache ist, daß ein einfaches Adjektiv wie dumm dem von ihm näher bestimmten Substantiv vorausgehen muß und nicht umgekehrt. Die dummen Jungen ist also ein wohlgeformter Ausdruck, während die Jungen dummen ungrammatisch ist. Andere Sätze sind in einem gewissen Sinn abweichend, aber nicht wegen der Verletzung irgendeiner syntaktischen Regel. In diesem weiteren Sinne sind folgende Sätze ungrammatisch: Dieser Kreis ist quadratisch; Herwig ritt auf dem Duft im Zimmer umher; Ich hörte eine violette 77
Symphonie. Diese Sätze durchbrechen bestimmte psychische Beschränkungen, nicht syntaktische, d. h. die Begriffsstrukturen, die diesen Sätzen zugrunde liegen müßten, sind einfach keine möglichen Gedanken. Wir können kein Ding konzeptualisieren, das gleichzeitig rund und quadratisch ist (obgleich man auf verschiedene Art das Prinzip unterlaufen und es als doch möglich erscheinen lassen könnte, etwa indem man schnell zwischen den Vorstellungen eines Kreises und eines Quadrats hin und her schaltet). Die einzige Möglichkeit, uns vorzustellen, daß jemand auf einem Duft reitet, ist, einen Duft im Geiste in etwas Konkretes wie eine Rauchfahne zu verwandeln und anzunehmen, daß dies kompakt genug ist, einen Reiter zu tragen, wenn es wie ein Zauberteppich durch den Raum schwebt. Eine Symphonie kann nur dann violett sein, wenn man eine entsprechende geistige Verwandlung vornimmt. Wenn wir einen Duft oder eine Symphonie in etwas Konkretes verwendein, stellen wir uns natürlich schon nicht mehr einen Duft oder eine Symphonie vor; wir haben vielmehr mit Hilfe unserer Begriffsfähigkeit eine neue Art von Gegenstand erdacht. Der Backstein verging ist in derselben Weise abweichend. Keine begrifflich geformte Situation kommt als diesem Satz zugrunde liegende Begriffsstruktur in Frage, und in diesem Fall ist es sogar schwierig, eine metaphorische Art von Backstein zu erfinden, von dem man sagen könnte, er vergeht (wie die Zeit). Wenn wir uns anstrengen, so können wir diese Sätze interpretieren, aber nur in einem sekundären oder metaphorischen Sinne. Es ist notwendig, den Begriffswert einer lexikalischen Einheit zu modifizieren, um die Begriffsstruktur psychologisch möglich zu machen. Ungrammatisch werden wir einen Satz nur dann nennen, wenn er syntaktisch abweichend ist, d. h. eine syntaktische Regel verletzt. Bei Sätzen wie Ich hörte eine violette Symphonie wird es näher liegen, von semantischer Abweichung oder Verletzung einer psychischen Beschränkung zu reden. Es wird nicht in jedem Fall klar sein, ob ein Satz syntaktisch oder semantisch abweichend ist, schon deshalb, weil vieles, was syntaktische Regeln und psychische Vorgänge betrifft, noch unbekannt ist. Die Unterscheidung scheint jedoch sinnvoll zu sein. Manche Sätze sind natürlich gleichzeitig syntaktisch und semantisch abweichend, z. B. Ich hören gerade eine violette Symphonie. Andere entfernen sich so weit von den syntaktischen Mustern einer Sprache oder von möglichen Realisierungen von Begriffsstrukturen, daß man zögern würde, sie überhaupt Sätze zu nennen. Und aber obgleich Schokolade oder dreimal Weide Schlinge abstrakt quadratisch quadratisch auseinander Herwig ist nur in dem Sinne ein deutscher Satz, als es sich um eine Kette von deutschen 78
Wörtern handelt. Nur rein willkürlich könnte man irgendwelche besonderen syntaktischen oder psychischen Beschränkungen aussondern, die in dieser Kette als verletzt gelten müßten.
79
5. Syntaktische Systeme
Oberflächenstrukturen Syntaktische Regeln haben die Funktion, Begriffsstrukturen mit Oberflächenstrukturen zu verknüpfen. Wir wissen sehr wenig von den Begriffsstrukturen, weil wir über den kognitiven Apparat des Menschen generell wenig wissen. Im Vergleich dazu läßt sich das Wesen der Oberflächenstrukturen relativ leicht erfassen, und wir werden folglich unsere Untersuchung der syntaktischen Systeme damit beginnen. Die folgende Darstellung stützt sich im wesentlichen auf deutsches und englisches Beispielmaterial, aber ein großer Teil des Festgestellten trifft für alle Sprachen zu. Wie wir gesehen haben, kann man einen Satz in eine Folge von Morphemen aufteilen. Die Katze kratzte den Hund kann man wiedergeben als die+Katze+kratz-+PRÄT+den+Hund. Der alte Mann spielte das Duo mit Helen besteht aus der Morphemfolge der+alt+FLEX+Mann+spiel-+PRÄT +das+Duo+mit+Helen. (Dabei steht FLEX ganz vorläufig für das Flexionsmorphem -e, das im Deutschen für die Konkordanz zwischen Adjektiv und Artikel und Substantiv notwendig ist). Die Morpheme eines Satzes sind nicht zufällig angeordnet, sondern sind in einer ganz spezifischen Weise kombiniert, um eine Oberflächenstruktur zu bilden. Wir können drei Aspekte in der Konfiguration von Oberflächenstrukturen feststellen: ihre lineare Anordnung, ihre hierarchische Anordnung und die Typen von Einheiten, die sie enthalten.
Lineare und hierarchische Anordnung Die lineare Anordnung der Morpheme eines Satzes versteht sich von selbst. In der ersten der obengenannten Ketten folgt Katze auf die, kratz- auf Katze, PRÄT auf kratz- usw. Eine Veränderung der Reihenfolge führt zu einem ungrammatischen Satz: Katze die Hund den kratzte. Im Englischen, wo es keine formale Unterscheidung des Artikels nach 80
Genus und Kasus gibt, könnte durch Umstellung aus den gleichen Morphemen ein anderer Satz gebildet werden: the cat scratched the dog, aber the dog scratched the cat. Die Morpheme eines Satzes sind ferner hierarchisch angeordnet. Wir haben schon bemerkt, daß die Morpheme von Die Katze kratzte den Hund in größeren Einheiten zusammenhängen. Die und Katze bilden in gewissem Sinn eine Gruppe, während sich PiL^T und den durch keinerlei nähere Zusammengehörigkeit aus der Gesamtkette hervorheben. Eine Morphemkette, die eine derartige Einheit bildet, nennt man eine K o n s t i t u e n t e . Die+Katze ist also eine Konstituente von Die Katze kratzte den Hund, PRÄT+den nicht. Die ganze Kette Die+Katze+kratz-+PRÄT+den+Hund kann als Konstituente aufgefaßt werden, da sie eine besondere Form von Einheit bildet, einen Satz. Diese Kette kann in zwei kleinere Konstituenten aufgeteilt werden, Die+Katze und kratz-+PRÄT+den+Hund, wobei die letztere die Teilkonstituenten kratz-+PRÄT und den+Hund besitzt. Schließlich ist jedes einzelne Morphem eine Konstituente. Die hierarchische Anordnung der Morpheme eines Satzes läßt sich durch das Schema in Abb. 5.1
die
Katze
kratz-
PRÄT
den
Hund
Abb. 5.1
veranschaulichen. In dieser S t a m m b a u m s t r u k t u r werden Die+Katze, kratz-+PRÄT und den+Hund als Einheiten dargestellt, da die Teile jedes Paares an sich schneidenden Zweigen sitzen. Auf dieselbe Art erweist sich kratz-+PRÄT+den+Hund als Einheit, und der ganze Satz ist eine Einheit höherer Ordnung, die aus den Teilen Die+Katze und kratz-+ PRÄT+den+Hund besteht. PRÄT+den dagegen bildet keine Einheit; der Zweig von PRÄT und derjenige von den schneiden sich nicht. Entsprechend erweist sich Die+Katze+kratz- als keine Konstituente, da der Zweig von Die+Katze sich nicht mit dem von kratz- schneidet. 81
Die Mehrdeutigkeit bestimmter Sätze läßt sich im Hinblick auf ihre Stammbaumstruktur erklären. Nehmen Sie als Beispiel den Satz Werner oder Peter und Gerd werden kommen. Dieser Satz läßt sich in zweierlei Weise interpretieren. Er kann bedeuten, daß Gerd kommen wird, und daß dazuhin entweder Werner oder Peter kommt; oder er kann bedeuten, daß entweder Werner kommt oder Peter und Gerd kommen. Dieser Unterschied der Interpretation entspricht unmittelbar einem Unterschied in der Stammbaumstruktur. Die erste Interpretation entspricht der ersten Struktur in Abb. 5.2, während die zweite Interpretation der anderen
Abb. 5.2
Struktur entspricht. (In beiden Strukturen steht PRÄS für das Präsensmorphem, das angibt, daß das Hilfsverb in der Form werden realisiert wird.) Die Morphemfolge Werner+oder+Peter+und+Gerd+werd-+PRÄS+ kommen repräsentiert also zwei mögliche Oberflächenstrukturen. Diese beiden Oberflächenstrukturen unterscheiden sich nicht in ihrem Morphemen oder deren Anordnung, sondern in der Stammbaumstruktur. In der ersten Struktur von Abb. 5.2 ist Werner oder Peter eine Teilkonstituente von Werner oder Peter und Gerd. In der zweiten Struktur ist 82
Peter und Gerd eine Teilkonstituente. Wenn wir Rundklammern verwenden, um die Elemente einer Konstituente zusammenzufassen, können wir die beiden gegensätzlichen Strukturen folgendermaßen darstellen: (Werner oder Peter) und Gerd und Werner oder (Peter und Gerd). Diese verschiedenen Oberflächenstrukturen sind Realisierungen von verschiedenen Begriffsstrukturen. Ein anderes Beispiel für strukturelle Mehrdeutigkeit ist little girl's bike. Als (little girl's) bike bedeutet es das Fahrrad eines kleinen Mädchens; als little (girl's bike) bedeutet es ein kleines Mädchenfahrrad. Oder nehmen wir Der Polizist erschoß die Frau mit der Pistole, einen ebenfalls strukturell mehrdeutigen Satz. Der Polizist erschoß (die Frau mit der Pistole) bedeutet, daß die Frau bewaffnet war, während Der Polizist erschoß (die Frau) (mit der Pistole) eine andere Interpretation verlangt. Diese strukturelle Mehrdeutigkeit entspricht genau derjenigen bei gewissen geometrischen Figuren. Abb. 5.3 z. B. kann auf zweierlei Art gesehen werden, genau wie little girl's bike.
Abb. 5.3
Konstituententypen Indem wir die lineare Ordnung der Morpheme einer Oberflächenstruktur und ihre hierarchische Ordnung beschrieben haben, haben wir jedoch noch nicht alles gesagt, was an einer Oberflächenstruktur erfaßt werden kann. Gehen wir nochmals zurück zu den Abb. 5.1 und 5.2. Die Stamm83
baumdarstellungen geben an, daß bestimmte Morphemfolgen als Konstituenten zusammengehören und andere nicht, aber sie geben nicht an, welche Art von Konstituente eine gegebene Folge ist. Sie zeigen z. B. nicht, daß die Katze und der Hund Konstituenten gleicher Art sind, im Gegensatz etwa zu kratzte oder werden kommen. Es wird nicht angegeben, daß Werner oder Peter und Gerd, der alte Mann und den Hund ähnlich sind, daß werden kommen, spielte das Duo mit Helen und kratzte den Hund sich ähnlich, daß aber der alte Mann und kratzte den Hund verschiedenartige Konstituenten sind. Um diese Information zu geben, können wir einfach die Konstituenten beschriften, wobei wir Konstituenten gleichen Typs die gleiche Beschriftung geben. In Abb. 5.4 bestimmen die Beschriftungen die Konstituenten
Abb. 5.4
von Die Katze kratzte den Hund. Einige der Beschriftungen sind unmittelbar einleuchtend. S steht für Satz, N für Substantiv (englisch „noun" bedeutet .Substantiv'), V für Verbum und ART für Artikel. NP steht für Nominalphrase, eine Konstituente, deren Hauptelement ein Substantiv ist. Entsprechend ist VP eine Verbalphrase, eine Konstituente, deren Kern ein Verb bildet. Die Katze und den Hund erweisen sich als Konstituenten gleichen Typs: beide werden als Nominalphrasen beschriftet. Die Katze und kratzte erweisen sich dagegen als verschiedene Konstituententypen. Abb. 5.5 stellt die Oberflächenstruktur von Der alte Mann spielte das Duo mit Helen dar. ADJ steht für Adjektiv und P für Präposition. Als Präpositionalphrase (PP) bezeichnen wir eine Konstituente, die aus einer Präposition und einer Nominalphrase besteht. Helen ist natürlich ein Substantiv, wie die Beschriftung angibt, aber es ist gleichzeitig auch als Nominalphrase beschriftet. Da Helen eine Konstituente ist, deren Kern ein Sub84
stantiv ist, entspricht es der oben gegebenen Definition einer Nominalphrase.
ART
ADJ
N
der
alte
Mann
spiel-
PRAT
das
Duo
Abb. 5.5
Wir sehen also, daß ein einzelnes Substantiv ebenso gut als Nominalphrase auftreten kann wie komplexere Strukturen wie der alte Mann oder Werner und Peter und Gerd. Ebenso kann eine Verbalphrase aus einem einfachen Verb wie existiert bestehen, oder sie kann komplexer sein wie spielte das Duo mit Helen. Solch verschiedene Strukturen wie Helen, der alte Mann und Werner oder Peter und Gerd werden deshalb als Konstituententypen gleicher Art beschriftet, weil sie sich im Hinblick auf syntaktische Regeln gleich verhalten. Als Beispiel diene die Regel für die Bildung von Fragesätzen. In einer Frage geht das erste Verbalwort der Subjekt-Nominalphrase voraus. Die Frageform von Helen wird kommen ist also Wird Helen kommen?, wobei die Anordnung von Helen und wird umgekehrt wie im Nicht-Fragesatz ist. Entsprechend ist die Frageform von Der alte Mann wird kommen: Wird der alte Mann kommen? und von Werner oder Peter und Gerd werden kommen: Werden Werner oder Peter und Gerd kommen? In jedem dieser Fälle unterscheidet sich die Frage vom Nicht-Fragesatz nur in der relativen Anordnung von wird (bzw. werden) und der als Nominalphrase bezeichneten Morphemkette. Da Helen, der alte Mann und Werner oder Peter und Gerd im Hinblick auf die Bildung der Frageform und viele anderen syntaktischen Regeln sich gleichartig verhalten, ist es gerechtfertigt, sie als gleichartige Konstituenten zu behandeln. Es sollte nicht der Eindruck entstehen, als seien die Oberflächenstruk85
turen schon völlig erforscht oder als sei es in jedem Fall leicht, die genaue Stammbaumstruktur zu einer gegebenen Morphemkette anzugeben. Selbst auf dieser relativ offen zutage liegenden Ebene der Syntax muß noch vieles erarbeitet werden, und viele Einzelheiten sind noch sehr umstritten. Trotzdem sind einige Dinge ziemlich klar: Die Morpheme eines Satzes sind in einer bestimmten Struktur hierarchisch angeordnet, deren gröbere Umrisse mit einiger Sicherheit skizziert werden können; weiterhin müssen wir Konstituententypen durch Beschriftung oder ein vergleichbares Mittel bezeichnen.
Komplexe Sätze Die grammatischen Sätze einer Sprache bilden eine unendliche Menge, weil ihre Länge prinzipiell nicht beschränkt ist. Die menschlichen Konzeptualisierungskräfte sind so angelegt, daß, wiederum prinzipiell, Gedanken von jeder beliebigen Komplexität gebildet werden können. Darüberhinaus können die syntaktischen Regeln einer Sprache unendlich viele Begriffsstrukturen, unabhängig von deren Komplexität, mit Oberflächenstrukturen verbinden. Im folgenden Abschnitt wollen wir diejenigen Aspekte syntaktischer Systeme näher untersuchen, die es unserer Sprachkompetenz ermöglichen, eine unendliche Menge von Sätzen zu umfassen.
Komplexe
Begriffsstrukturen
Nehmen wir den Satz Helen sang und Alice spielte die Flöte. Dieser Satz hat zwei Hauptkonstituenten, Helen sang und Alice spielte die Flöte. Die beiden sind durch das Morphem und verbunden. Sofort erhebt sich die Frage, als welche Art von Konstituenten wir Helen sang und Alice spielte die Flöte auffassen sollen. Die einzig vernünftige Antwort scheint die zu sein, daß sie beide Sätze sind — genau wie die ganze Kette. Die Struktur von Helen sang und Alice spielte die Flöte ist in Abb. 5.6 dargestellt. Wir können daraus erkennen, daß manche Sätze in dem Sinne komplex sind, daß sie einfachere Sätze als Konstituenten enthalten. Genaugenommen ist das etwas zu sehr vereinfacht. Betrachten wir den Satz Herwig heiratete die Frau, die Peter haßte. Die Frau, die Peter haßte ist zweifellos eine Konstituente — genauer: eine Nominalphrase. Weiterhin ist die Peter haßte auch eine Konstituente, eine Komponente dieser 86
Abb. 5.6
Nominalphrase. Aber was für eine Konstituente ist die Peter haßte? In vielfacher Hinsicht ist es ein Satz. Es hat ein Subjekt (Peter) und ein Verb (haßte), und die meisten Grammatiker wären sich darin einig, daß das Wort die die Rolle des direkten Objekts zu haßte spielt. Wir können die Ähnlichkeit von die Peter haßte mit einem Satz nicht übersehen, andrerseits ist diese Morphemkette für sich genommen ungrammatisch. Inwiefern kann man also korrekterweise behaupten, daß manche Sätze einfachere Sätze als Komponenten enthalten? Um die Antwort darauf zu finden, müssen wir die Oberflächenstrukturen in Beziehung zum gesamten syntaktischen System sehen. Die syntaktischen Regeln einer Sprache dienen zusammen mit der Auswahl von lexikalischen Einheiten dazu, Begriffsstrukturen mit Oberflächenstrukturen zu verknüpfen. Wenn wir also die Struktur eines Satzes untersuchen, so können wir uns dabei nicht auf seine Oberflächenstruktur beschränken. Die Oberflächenstruktur kann nur in Beziehung mit der ihr zugrundeliegenden Begriffsstruktur und den die beiden verknüpfenden syntaktischen Regeln vollständig verstanden werden. Gehen wir zurück zu Helen sang und Alice spielte die Flöte. Die diesem Satz zugrundeliegende Begriffsstruktur ist komplex. Sie umfaßt die Vorstellung einer Tätigkeit Helens' in der Vergangenheit und die Vorstellung einer davon verschiedenen Tätigkeit Alices in der Vergangenheit. Anders gesagt, diese begrifflich geformte Situation hat zwei deutlich unterschiedene Komponenten. Jede Komponente kann allein als begrifflich 87
geformte Situation vorkommen; wir können uns z. B. vorstellen, daß Helen gesungen hat und dabei überhaupt nicht an Alice denken. Außerdem können beide Komponenten als Begriffsstrukturen dienen, die mit einer Oberflächenstruktur verknüpft werden können. Stellt man sich vor, daß Helen gesungen hat, und denkt dabei nicht an Alice, so könnte diese einfache Begriffsstruktur als die Oberflächenkette Helen sang realisiert werden; dazu müßte man nur die entsprechenden syntaktischen Regeln anwenden und die passenden Morpheme wählen. Aus der anderen Komponente der begrifflich geformten Situation könnte man die Oberflächenkette Alice spielte die Flöte erzeugen. Es besteht keine notwendige Verbindung zwischen den beiden Komponenten, aber es gibt auch keinen Grund, warum sie nicht als Teile eines komplexeren Gedankens nebeneinanderstehen könnten. Manche syntaktischen Regeln dienen dazu, einfache Begriffsstrukturen mit einfachen Sätzen zu verknüpfen. Im Deutschen verknüpfen solche Regeln die Vorstellung, daß Helen gesungen hat, mit Helen sang; sie verknüpfen die Vorstellung, daß Alice ein bestimmtes Instrument gespielt hat, mit Alice spielte die Flöte usw. (In diesem Zusammenhang ist Einfachheit ein relativer Begriff - Sätze wie Helen sang sind viel komplexer als sie oberflächlich erscheinen. Im Vergleich mit Sätzen, in denen sie als Komponenten enthalten sind, sind sie jedoch einfach.) Andere syntaktische Regeln werden ins Spiel gebracht, wenn eine Begriffsstruktur komplexer ist. So ist es etwa ein syntaktisches Prinzip des Deutschen, daß zwei oder mehr Begriffsstrukturen, von denen jede einem einfachen Satz zugrundeliegen kann, zu einer komplexen Satzstruktur verbunden werden können, indem man sie aneinanderreiht und mit dem Morphem und verbindet. Jemand, der sich Helens und Alices Tätigkeiten gleichzeitig vorstellt, kann, diesem syntaktischen Prinzip entsprechend, die komplexe Oberflächenstruktur von Abb. 5.6 konstruieren. Nehmen wir an, die vorgestellte Situation ist noch komplizierter, weil die Erinnerung hinzutritt, daß sich Georg als Tänzer hervorgetan hat. Dann ergibt dieses Prinzip, kombiniert mit denen, die einfache Sätze erzeugen, den noch komplexeren Satz Helen sang und Alice spielte die Flöte und Georg tanzte. Eine weitere syntaktische Regel des Deutschen (und entsprechend des Englischen), die die Auslassung von allen ««d-Morphemen einer Serie bis auf das letzte erlaubt, erklärt die Variante Helen sang, Alice spielte die Flöte und Georg tanzte. Wir können nun den Charakter von die Peter haßte in dem Satz Herwig heiratete die Frau, die Peter haßte besser beurteilen. Die Begriffsstruktur, die diesem Satz zugrundeliegt, ist ebenso komplex wie diejenige, 88
die Helen sang und Alice spielte die Flöte zugrundeliegt. Beide Komponenten dieser komplexen Begriffsstruktur können jeweils einem einfachen Satz zugrundeliegen. Die eine bildet die Grundlage von Herwig heiratete die Frau und die andere von Peter haßte die Frau. Nach den syntaktischen Regeln der deutschen Sprache wäre es ohne weiteres möglich, diese Begriffsstruktur als Herwig heiratete die Frau und Peter haßte die Frau zu realisieren. Oder, mit Anwendungen der Pronominalisierungsregeln: Herwig heiratete die Frau und Peter haßte sie. Beachten Sie, daß beide Sätze das gleiche bedeuten; sie beruhen auf der gleichen Begriffsstruktur. Welcher nun aus der Begriffsstruktur gebildet wird, hängt davon ab, welche Regeln bei der Überführung in die Oberflächenstruktur angewendet werden. Ein Satz ist demnach komplex, wenn er auf eine komplexe Begriffsstruktur zurückgeht; eine komplexe Begriffsstruktur erkennt man daran, daß sie Komponenten enthält, die selber Sätzen zugrundeliegen können. Nach diesem Kriterium ist Helen sang und Alice spielte die Flöte komplex, weil die beiden Hauptkomponenten der Begriffsstruktur jeweils allein Sätze ergeben können, und zwar: Helen sang und Alice spielte die Flöte. Herwig heiratete die Frau, die Peter haßte ist ebenfalls komplex. Eine Komponente der Begriffsstruktur liegt hier Herwig heiratete die Frau zugrunde, die andere Hauptkomponente entspricht dem Satz Peter haßte die Frau. Die letztere Komponente kann also entweder als Peter haßte die Frau oder als die Peter haßte realisiert werden. Peter haßte die Frau erscheint dann, wenn die Komponente isoliert als ganze Begriffsstruktur fungiert; die Peter haßte erscheint nur, wenn diese Komponente Teil einer größeren Begriffsstruktur ist, die einem komplexen Satz zugrundeliegt. Als Konstituente eines größeren Satzes wird die Struktur, die isoliert als Peter haßte die Frau erscheinen würde, durch bestimmte syntaktische Regeln verändert, so daß sich die Peter haßte ergibt. Die Oberflächenstruktur des längeren Satzes ist in Abb. 5.7 dargestellt. (Dabei ist zu beachten, daß die Frau allein eine Konstituente bildet, ebenso wie die größere Struktur die Frau, die Peter haßte.) Demnach nimmt die Oberflächenstruktur eines satzähnlichen Teils eines komplexen Satzes nicht notwendig die gleiche Form an wie in isolierter Stellung. Komplexe Sätze fordern oftmals Regeln, die in einfachen Sätzen nicht angewendet werden. Anders gesagt: eine einfache Begriffsstruktur kann in der Oberfläche verschieden realisiert werden, je nachdem, ob sie als Komponente einer komplexeren Begriffsstruktur fungiert oder nicht. 89
Abb. 5.7
Die syntaktischen Regeln selbst brauchen uns hier nicht vordringlich zu beschäftigen. Wichtig ist in diesem Abschnitt das Prinzip, daß die meisten Sätze, und besonders alle Sätze größerer Länge, im eben gezeigten Sinne komplex sind. Die Begriffsstrukturen, die ihnen zugrundeliegen, lassen sich in Teilstrukturen zerlegen, die jeweils selber als einfacher Satz realisiert werden können. In manchen Fällen ist der entsprechende Teil der Oberflächenstruktur identisch mit der Oberflächenstruktur des isolierten einfachen Satzes. Helen sang z. B. sieht isoliert genauso aus wie als Konstituente des komplexen Satzes Helen sang und Alice spielte die Flöte. In anderen Fällen trifft das nicht zu. Peter haßte die Frau und die Peter haßte sind sich in der Oberfläche nur teilweise ähnlich.
Koordination und Einbettung Vergleichen Sie einmal die Abb. 5.6 und 5.7. In beiden Strukturen lassen sich zwei einfachere satzähnliche Strukturen erkennen, aber die einfachen 90
Komponentensätze sind völlig verschieden kombiniert. In Abb. 5.6 sind Helen sang und Alice spielte die Flöte parallel zusammengefügt; kein Teil ist eine Konstituente des anderen. Dagegen fungiert in Abb. 5.7 ein einfacher Satz als Konstituente des anderen. Die beiden Teilstrukturen in Abb. 5.6 sind gleichrangig, während in 5.7 die Peter haßte der Konstituente Herwig heiratete die Frau untergeordnet ist. In traditioneller Terminologie formuliert stehen die Teilstrukturen von Abb. 5.6 im Verhältnis der K o o r d i n a t i o n , die von 5.7 im Verhältnis der Subordination. Man könnte auch sagen, Helen sang und Alice spielte die Flöte sind koordinierte Strukturen, während die Peter haßte in die Struktur Herwig heiratete die Frau eingebettet ist. Bis jetzt haben wir nur eine Art von Struktur untersucht, eine, in der die koordinierten Konstituenten Sätze waren und das Morphem und verwendet wurde, um sie zu verbinden. Andere Konstituenten können koordiniert werden, und es können andere Morpheme zur Verbindung der koordinierten Konstituenten verwendet werden. Der Satz Der Kreuzer und das alte Schlachtschiff werden für Zielübungen verwendet werden enthält koordinierte Nominalphrasen. Der Kreuzer ist selbst schon eine Nominalphrase ebenso wie das alte Schlachtschiff. Im genannten Satz sind sie durch und koordiniert und bilden eine komplexe Nominalphrase, die als Subjekt fungiert; diese Struktur ist in Abb. 5.8 dargestellt. Der Kreuzer und das alte Schlachtschiff erweist sich durch die Art und Weise, wie es sich im Hinblick auf syntaktische Regeln verhält, als Nominalphrase. So steht etwa die Frageform Werden der Kreuzer und das alte Schlachtschiff zu Zielübungen verwendet werden? im selben Verhältnis zu obigem Satz wie Wird dein Vater uns Geld geben? zu Dein Vater wird uns Geld geben. Der Kreuzer und das alte Schlachtschiff und die Nominalphrase Dein Vater verhalten sich im Hinblick auf die Bildung der Frageform gleich. Noch verschiedene andere Konstituenten können koordiniert werden. So enthält Die Scheune ist alt und schäbig koordinierte Adjektive. Die Kellnerin verschüttete die Suppe und ließ mein Steak auf den Boden fallen hat eine komplexe Verbalphrase, die durch die Koordination der einfachen Verbalphrasen verschüttete die Suppe und ließ mein Steak auf den Boden fallen entstanden ist. Ich reinigte und kochte den Fisch enthält koordinierte Verben. In Der alte Mann scheint müde, aber glücklich wird aber statt und verwendet, um die koordinierten Konstituenten zu verbinden. Oder (manchmal kombiniert mit entweder) ist ein weiteres häufiges Koordinationsmorphem des Deutschen: (Entweder) schicke ich euch einen Brief oder Helen wird angerufen. 91
NP NP
NP ART der
ART
N Kreuz
er
und
das
ADJ
N
alte Schlacht
schiff
Abb. 5.8
Ebenso gibt es eine Vielzahl von Möglichkeiten, wie eine Satzstruktur in eine andere eingebettet werden kann. Manchmal ist eine eingebettete Struktur in der Oberfläche identisch mit ihrer isoliert auftretenden Realisierung. Rudolf ist ein Schwindler entspricht genau den eingebetteten
Konstituenten in Ich glaube, Rudolf ist ein Schwindler. In anderen Fällen erscheint die eingebettete Struktur als eine verkürzte Version des dazugehörigen unabhängigen Satzes. So entspricht in Herwig heiratete die Frau,
die Peter haßte, die eingebettete Satzstruktur die Peter haßte dem SatzPeter haßte die Frau; das Relativpronomen die ist allein von jener Struktur übriggeblieben, die sonst als die Frau realisiert wird. Die dem englischen Satz I hurt myself zugrundeliegende Struktur wird reduziert, wenn sie nach
want als Konstituente in I don't want to hurt myself eingebettet wird. Das hurt zugrundeliegende Subjekt ist / (wie die reflexive Form myself zeigt), aber es tritt nicht in der Oberfläche in Erscheinung. Vergleichen
Sie I don 't want to hurt myself und / don 't want you to hurt yourseif, wo you, das Subjekt von hurt in der Oberfläche erscheint. Von der Struktur her ist die Zahl der Elemente, die in einer Koordination (zumindest mit und oder oder) zusammengefügt werden können,
unbegrenzt. An Helen sang und Alice spielte die Flöte können wir einen weiteren koordinierten Teil anfügen und erhalten dann Helen sang und
Alice spielte die Flöte und Georg tanzte. Wir können noch einmal einen anfügen und erhalten dann Helen sang und Alice spielte die Flöte und Georg tanzte und Herwigs Mutter ahmte Schmierenschauspieler nach. Offensichtlich gibt es keinen Punkt, an dem wir die Grenze setzen könnten mit der Feststellung, daß das Hinzufügen eines weiteren koordinierten Elements den Satz ungrammatisch machen würde. Wir haben damit die Situation, die durch Abb. 5.9 veranschaulicht wird, wo die Pünktchen
92
s S
und
S und
S
und
S . . . und S
Abb. 5.9
angeben, daß die Zahl der parallel angeschlossenen Sätze unendlich sein könnte. Jede hinzugefügte koordinierte Konstituente verlängert den Satz. Da beliebig viele Elemente koordiniert werden können, gibt es keinen längsten Satz, der durch diesen syntaktischen Mechanismus gebildet werden könnte. Jede Kette von koordinierten Elementen kann um ein weiteres Element vermehrt werden, so daß eine noch längere Kette entsteht. Deshalb reicht allein schon der Koordinierungsmechanismus aus, die grammatischen Sätze einer Sprache zu einer unendlichen Menge auszuweiten. Die verschiedenen Einbettungsverfahren dienen in ähnlicher Weise dazu, die Sätze einer Sprache zu einer unbegrenzten Menge zu projizieren. Nehmen wir die einfachen Sätze Ich glaube es und Rudolf ist ein Schwindler. Die dem zweiten Satz zugrundeliegende Struktur kann als Konstituente in den ersten eingebettet werden, und als Ergebnis wird realisiert: Ich glaube, Rudolf ist ein Schwindler. Diese komplexe Struktur ist wiederum zur Einbettung als Konstituente in eine andere Satzstruktur verfügbar, z. B. Heinrich weiß es. Daraus ergibt sich die Oberflächenstruktur Heinrich weiß, (daß) ich glaube, Rudolf ist ein Schwindler. Die Zahl der einfachen Satzstrukturen, die auf diese Weise nacheinander kombiniert werden können, ist von der Struktur her unbegrenzt. Wenn wir hier noch etwas weitermachen, erhalten wir ohne weiteres Das Mädchen glaubt, Heinrich weiß, ich glaube, Rudolf ist ein Schwindler. (Eine Alternative der Oberflächenrealisierung, die man im Deutschen wohl noch vorziehen würde, wäre der Anschluß mit daß.) Der nächste Schritt wäre Ich weiß, daß das Mädchen glaubt, daß Heinrich weiß, daß ich glaube, Rudolf ist ein Schwindler usw. Die Struktur dieser Sätze ist 93
Abb. 5.10
in Abb. 5.10 schematisch dargestellt. (Die Punkte bedeuten wieder, daß die Einbettung unendlich fortgesetzt werden könnte.) Betrachten wir als ein weiteres Beispiel den Satz Ich fand den Ritter, der die Jungfrau gerettet hatte, die von dem Drachen verfolgt worden war, der das Dorf verwüstet hatte, in dem die Hütte steht, in der ich den Trank gemischt hatte. Die diesem Satz zugrundeliegende Begriffsstruktur ist komplex; sie besteht aus den Teilstrukturen, die isoliert als die folgenden einfachen Sätze realisiert würden: Ich fand den Ritter; Der Ritter hatte die Jungfrau gerettet; Die Jungfrau war von dem Drachen verfolgt worden; Der Drache hatte das Dorf verwüstet; In dem Dorf steht eine Hütte; Ich hatte den Trank in der Hütte gemischt. Jede dieser einfachen Strukturen ist als Konstituente in die vorhergehende eingebettet, so daß der Satz eine der Abb. 5.10 entsprechende Struktur zeigt. Es wäre natürlich möglich, die Kette noch zu verlängern, indem man noch eine eingebettete Struktur hinzufügen würde. Man könnte etwa die Struktur hinzufügen, die sonst Der Trank hilft gegen Kahlheit zugrundeliegt, und damit die Nominalphrase den Trank expandieren zu den Trank, der gegen Kahlheit hilft. Die Strukturen in Abb. 5.9 und 5.10 sind ziemlich einförmig. Sie sollen nur zeigen, daß schon der Koordinierungsmechanismus allein oder 94
ein einfacher, wiederholbarer Einbettungsmechanismus ausreicht, die grammatischen Sätze einer Sprache auf eine unendliche Menge zu erweitern. Wenn man aber die verschiedenen Arten der Einbettung und Koordination kombiniert, so wird eine viel größere Vielfalt von Satzstrukturen verfugbar. Betrachten Sie folgenden Satz, in dem sowohl Einbettung als auch Koordination vorkommt: Der Mann, der glaubte, ich beabsichtigte,
Trinkgeld zu verlangen, und die Frau, die mit ihm war, weigerten sich, mich anzusehen. Das Gerippe der Oberflächenstruktur zeigt Abb. 5.11. Aus Gründen der Vereinfachung ist die innere Struktur der einzelnen Konstituenten nicht ausgefüllt; im Augenblick interessiert uns in erster Linie ihre Anordnung zueinander.
S NP
VP
AF der Mann
der glaubte S
die Frau
die mit
ihm
war
ich beabsichtigte S
Trinkgeld zu verlangen
Abb. 5.11
95
Sowohl Subjekt als auch Prädikat dieses Satzes sind komplex. Zwei Nominalphrasen sind durch und koordiniert und bilden die komplexe Nominalphrase, die als Subjekt fungiert: Der Mann, der glaubte, ich beabsichtigte, Trinkgeld zu verlangen und die Frau, die mit ihm war. Die erste enthält als Konstituente die eingebettete Struktur der glaubte, ich beabsichtigte, Trinkgeld zu verlangen, die isoliert als unabhängiger Satz realisiert werden würde: Der Mann glaubte, ich beabsichtigte, Trinkgeld zu verlangen. Diese Konstituente enthält nun ihrerseits eine eingebettete Satzstruktur, nämlich diejenige, die dem Satz Ich beabsichtigte, Trinkgeld zu verlangen zugrundeliegt, in die nun wiederum die Struktur von Ich verlange Trinkgeld eingebettet ist. Die andere Nominalphrase, die Frau, die mit ihm war ist ebenfalls komplex, da die Frau näher bestimmt wird durch den eingebetteten Nebensatz die mit ihm war; isoliert würde diese Struktur realisiert als der Satz Die Frau war mit ihm. (Eine Satzkonstituente, die in dieser Weise ein Substantiv näher bestimmt, bezeichnet man als Relativsatz. Die mit ihm war ist also ein Relativsatz, der die Frau näher bestimmt; der glaubte, ich beabsichtigte, ein Trinkgeld zu verlangen ist ein komplexer Relativsatz, AST Der Mann näher bestimmt.) Die Verbalphrase weigerten sich, mich anzusehen enthält als Konstituente die Satzstruktur mich anzusehen, in der das Subjekt an der Oberfläche nicht realisiert ist. Das ansehen zugrundeliegende Subjekt ist identisch mit dem Subjekt des ganzen Satzes. Abb. 5.12 zeigt die Oberflächenstruktur von Eine Frau, die ich dort traf, fing einen Fisch, der fiinf Pfund wog, und kochte ihn, und ich fing einen kleinen Barsch. Der Satz ist komplex und besteht aus folgenden koordinierten Satzstrukturen: Eine Frau, die ich dort traf, fing einen Fisch, der fünf Pfund wog und kochte ihn und Ich fing einen kleinen Barsch. Der erste der beiden Koordinationsteile ist komplex, während der zweite, Ich fing einen kleinen Barsch, einfach ist (aber nur in der Oberfläche, denn er geht auf dieselbe Struktur zurück, die Ich fing einen Barsch, der klein war zugrundeliegt). Das Subjekt des ersten Koordinationsteils, die Nominalphrase Eine Frau, die ich dort traf, enthält den Relativsatz die ich dort traf. Das Prädikat ist komplex, und zwar besteht es aus den koordinierten Verbalphrasen fing einen Fisch, der fiinf Pfund wog und kochte ihn. In der ersten ist das direkte Objekt von fing die Nominalphrase einen Fisch, der ßnf Pfund wog, die als Konstituente die eingebettete Satzstruktur der fünf Pfund wog enthält. Dies sollen nur einige repräsentative Beispiele sein. Es dürfte klar geworden sein, daß die syntaktischen Prinzipien einer Sprache es ermög96
s
NP
S
A
und
VP
und
S
VP
ART N eine Frau
die ich dort traf fing einen Fisch S kochte ihn
der fünf Pfund wog Abb. 5.12
liehen, eine unendliche Vielfalt von komplexen Strukturen aus einfacheren aufzubauen.
Die Beziehung zwischen Begriffsstruktur und Oberflächenstruktur
Derivationen Bis jetzt haben wir uns auf Oberflächenstrukturen konzentriert, aber die Oberflächenstruktur eines Satzes stellt ja nur eine Facette seines syntaktischen Aufbaus dar. Jede Oberflächenstruktur realisiert eine ihr zugrundeliegende Begriffsstruktur, aus der sie durch syntaktische Regeln und die Auswahl von lexikalischen Einheiten abgeleitet wird. Um eine umfassende Darstellung der Zusammensetzung eines Satzes zu geben, müßte man nicht nur seine Oberflächenstruktur beschreiben, sondern auch seine Begriffsstruktur und die schrittweise Ableitung oder D e r i v a t i o n der einen von der andern. Wir wissen noch nicht genug über den kognitiven Apparat des Menschen, um Begriffsstrukturen beschreiben zu können, 97
aber es ist klar, daß die Beziehung zwischen Begriffsstruktur und Oberflächenstruktur sehr indirekt und abstrakt ist. Die Überführung einer Begriffsstruktur in ihre Oberflächenrealisierung umfaßt neben dem Einsetzen von lexikalischen Einheiten für Begriffskomponenten die Anwendung einer langen Folge von syntaktischen Regeln. Die Derivation eines Satzes ist in Abb. 5.13 schematisch dargestellt. BEGRIFFSSTRUKTUR
MODIFIZIERTE STRUKTUR
MODIFIZIERTE STRUKTUR
MODIFIZIERTE STRUKTUR
MODIFIZIERTE STRUKTUR
MODIFIZIERTE STRUKTUR
MODIFIZIERTE STRUKTUR
OBERFLÄCHEN STRUKTUR Abb. 5.13
Jede Auswahl einer lexikalischen Einheit und jede Anwendung einer syntaktischen Regel modifiziert die abstrakte, zugrundeliegende Struktur in einer gewissen Weise, indem sie sie weniger abstrakt macht und zunehmend ihrer endgültigen Oberflächenform annähert. Der Unterschied 98
zwischen der Begriffsstruktur und der Oberflächenstruktur eines Satzes ist also das Gesamtergebnis einer Vielzahl von kleinen Modifikationen, die durch syntaktische Regeln und die Wahl lexikalischer Einheiten bewirkt werden.
Mehrdeutige Sätze Weil die Beziehung zwischen Begriffs- und Oberflächenstrukturen sehr indirekt ist, zeigen sich die Unterschiede zwischen zwei oder mehr Begriffsstrukturen nicht immer in der Oberflächenstruktur. Die Anwendung von syntaktischen Regeln und die Auswahl von lexikalischen Einheiten kann die zugrundeliegenden Unterschiede verwischen, so daß eine Anzahl von verschiedenen Begriffsstrukturen dieselbe Oberflächenrealisierung besitzen, wie die Abb. 5.14 veranschaulicht. Wenn ein Satz zwei verschiedene Begriffsstrukturen repräsentieren kann, so beurteilen wir ihn als mehrdeutig, d. h. er erlaubt verschiedene semantische Interpretationen.
BEGRIFFS STRUKTUR
BEGRIFFS STRUKTUR
BEGRIFFS STRUKTUR
STRUKTUR Abb. 5.14
Die streitsüchtigen Araber wollen einen neuen Krieg ist ein interessantes Beispiel dafür. Dieser Satz ist mehrdeutig, aber beide Interpretationen zeigen dieselbe Morphemkette und denselben Oberflächenstammbaum. Der Satz kann bedeuten, daß alle Araber streitsüchtig sind und einen neuen Krieg wollen; bei dieser Interpretation besteht eine Beziehung zu 99
Die Araber sind streitsüchtig und wollen einen neuen Krieg und zu Die Araber, die (bekanntlich) streitsüchtig sind, wollen einen neuen Krieg, die beide von derselben Begriffsstruktur abstammen. Andrerseits kann der Satz bedeuten, daß nur jene Araber, die streitsüchtig sind, wieder kämpfen wollen. Bei dieser Interpretation realisiert der Satz dieselbe Begriffsstruktur wie Diejenigen Araber, die streitsüchtig sind, wollen einen neuen Krieg. Nicht jeder mehrdeutige Satz zeigt bei verschiedenen Interpretationen genau die gleiche Oberflächenstruktur wie im eben gezeigten Beispiel. Nehmen Sie z. B. Ich stehe neben der Bank. Dieser Satz ist deshalb mehrdeutig, weil Bank zwei verschiedene Substantivmorpheme repräsentieren kann; die eine Bank bezeichnet eine Sitzgelegenheit, die andere ein Geldinstitut. Lautlich ist der Satz bei beiden Interpretationen identisch, da die beiden Substantive Bank gleich ausgesprochen werden. Die zwei Oberflächenstrukturen von Ich stehe neben der Bank sind jedoch ein wenig verschieden, da ja eine Oberflächenstruktur eine strukturierte Kette von Morphemen ist, und die beiden Substantive Bank zwei verschiedene Morpheme sind. Derartige Beispiele von lexikalischer Mehrdeutigkeit gibt es zu tausenden. Mehrdeutige Sätze können sich bei verschiedenen Interpretationen auch in der Stammbaumstruktur der Oberfläche unterscheiden, wie einige der aufgeführten Beispiele zeigen. So besteht etwa der Satz Werner oder Peter und Gerd werden kommen bei beiden Interpretationen aus derselben Morphemkette, aber die syntaktischen Regeln, die dafür verantwortlich sind, die beiden verschiedenen Begriffsstrukturen in dieselbe Morphemkette zu überführen, verwischen die entsprechenden Unterschiede in der Stammbaumstruktur nicht völlig. Die beiden Stammbaumstrukturen der Oberfläche hatten wir in Abb. 5.2 veranschaulicht. Hier folgen noch einige andere Beispiele von Mehrdeutigkeit, die vielleicht amüsant oder lehrreich sind: Der Mann erklärte den Streckenplan im Zug; Das Streicheln der Affen war unangenehm; Ich hasse fette Männer und Frauen; Es ist zu heiß zum Essen; Der Chauffeur wird den Wagen abstauben oder waschen und polieren; Robert hat mit seiner kleinen Schwester die Scheibe eingeschlagen; Ich gab John, was ich wollte.
Synonyme Sätze Syntaktische Regeln und die Auswahl lexikalischer Einheiten haben nicht immer den Effekt, Unterschiede der zugrundeliegenden Struktur zu neu100
tralisieren und eine relative Einheitlichkeit der Oberfläche zu bewirken. Auch das Umgekehrte kommt vor, so daß eine einzige Begriffsstruktur oft verschiedene Oberflächenrealisierungen hat, wie Abb. 5.15 zeigt. In solchen Fällen verdeckt die Verschiedenheit der Oberfläche, die durch syntaktische Regeln und die Auswahl von lexikalischen Einheiten herbeigeführt wird, die Einheitlichkeit der zugrundeliegenden Struktur.
BEGRIFFS STRUKTUR
STRUKTUR
STRUKTUR
STRUKTUR
Abb. 5.15
Der Unterschied der Oberfläche zwischen Mein Onkel schwitzt sehr und Mein Onkel transpiriert sehr ist entstanden durch die unterschiedliche Wahl von lexikalischen Einheiten, schwitzen und transpirieren, für die Repräsentation der gleichen Begriffskomponente. Die beiden sind gegeneinander austauschbar, da sie dieselbe syntaktische Funktion und denselben Begriffswert besitzen. Die beiden Sätze realisieren demnach dieselbe Begriffsstruktur, obgleich sie aus verschiedenen Morphemketten bestehen. Die Verschiedenheiten der Oberfläche, die sich aus Alternativen in der Wahl lexikalischer Einheiten ergeben, sind bisweilen noch umfangreicher. Betrachten wir ein englisches Beispiel, die Realisierung der Vorstellung etwas in zwei Teile teilen. Diesen Begriffswert hat das Wort (to) bisect, aber auch die Wendung (to) divide into two parts. Folglich besitzt die Begriffsstruktur, die The East Germans bisected Berlin with a wall zugrundeliegt, eine Realisierungsvariante, und zwar The East Germans divided Berlin into two parts with a wall. Keine einzelne lexikalische Einheit im zweiten Satz hat denselben Begriffswert wie bisect. Stattdessen 101
werden eine Anzahl von lexikalischen Einheiten syntaktisch kombiniert und bewirken so denselben semantischen Effekt. Die Sätze Herwig ist ein Junggeselle und Herwig ist ein Mann, der nicht geheiratet hat sind ein extremeres Beispiel für diese Erscheinung. Der Begriffswert von Mann, der nicht geheiratet hat, einem Substantiv Mann plus einer als Relativsatz eingebetteten Satzstruktur, wird im ersten Satz durch eine einzige lexikalische Einheit, Junggeselle, repräsentiert. Die Wirkung der Auswahlmöglichkeit zwischen verschiedenen lexikalischen Einheiten bei der Bestimmung der Oberflächenrealisierung einer Begriffsstruktur kann also ganz beträchtlich sein. Ebenso groß können die Unterschiede sein, die durch syntaktische Regeln bewirkt werden, wie wir später ausfuhrlicher sehen werden. Im Augenblick wollen wir uns auf ein Beispiel beschränken. Betrachten Sie die englischen Sätze A detective hunted down the killer, The policeman looked over the Situation und The robber tied up the manager of the bank. Jeder dieser Sätze enthält eine zweiteilige Verbalkonstituente, die aus einem Verb und einer präpositionsartigen Partikel besteht. Hunted down, looked over und tied up sind die Verbalkonstituenten, down, over und up ihre Partikeln. Jedem dieser drei Sätze kann ein entsprechender gegenübergestellt werden, der dieselbe Begriffsstruktur realisiert und dieselben lexikalischen Einheiten enthält. Die entsprechenden Sätze sind: A detective hunted the killer down, The policeman looked the Situation over und The robber tied the manager of the bank up. Die Unterschiede zwischen diesen Satzpaaren werden bewirkt durch eine syntaktische Regel, die wir die Partikelverschiebungsregel nennen wollen. Diese Regel trennt ein Verb und eine Partikel, indem sie die Partikel hinter die folgende Nominalphrase in der Funktion des direkten Objekts stellt. Wendet man diese Regel auf die Struktur an, die A detective hunted down the killer zugrundeliegt, so erzeugt sie die Struktur, die A detective hunted the killer down zugrundeliegt, indem sie die Partikel mit der Nominalphrase the killer vertauscht. Entsprechende Verschiebungen sind: (looked over) (the Situation) zu (looked) (the Situation) (over) und (tied up) (the manager of the bank) zu (tied) (the manager of the bank) (up). Die Ableitung der ersten zwei Sätze ist in Abb. 5.16 dargestellt. Dort können wir sehen, daß A detective hunted down the killer und A detective hunted the killer down auf dieselbe Begriffsstruktur zurückgehen und dieselbe Wahl von lexikalischen Einheiten voraussetzen. Alles in allem wird bei der Ableitung dieser beiden Sätze dieselbe Menge von syntaktischen Regeln angewendet. Der einzige Unterschied ist, daß in einem 102
von beiden die Partikelverschiebungsregel angewendet wird, im anderen nicht. Wie viele syntaktische Regeln ist sie fakultativ: sie kann angewendet werden, aber sie muß es nicht. Wird sie angewendet, dann ergibt sich der Satz A detective hunted the killer down. Wenn nicht, bleiben hunted und down nebeneinander in der Morphemkette, und es ergibt sich .4 detective hunted down the killer. BEGRIFFS STRUKTUR
t I
(a detective) (hunted down) (the killer)
OBERFLÄCHEN STRUKTUR
(a detective) (hunted) (the killer) (down) |
I
OBERFLÄCHEN STRUKTUR
Abb. 5.16
Dabei ist zu bemerken, daß keiner der beiden Sätze von dem anderen abgeleitet ist. Vielmehr sind beide Realisierungen derselben zugrundeliegenden Struktur, die in Abb. 5.16 als (a detective) (hunted down) (the killer) dargestellt ist. Diese zugrundeliegende Struktur ist nicht die gemeinsame Begriffsstruktur selbst, sondern eine Zwischenstruktur, die durch Einsetzen von lexikalischen Einheiten und durch die Anwendung von Regeln davon abgeleitet worden ist. Dasselbe gilt für alle unsere Beispiele für syntaktische Regeln. Oberflächenstrukturen sind das Ergebnis der Wirkung von syntaktischen Regeln; die Regeln sind nicht auf sie anwendbar, sondern leiten sie vielmehr von abstrakten zugrundeliegenden 103
Strukturen ab. Im Augenblick können wir aber noch für keinen Satz eine zugrundeliegende Struktur zwingend voraussetzen, die auch nur annähernd so abstrakt wäre, wie es die Begriffsstruktur sein muß.
Syntaktische Regeln In diesem und dem folgenden Abschnitt wollen wir das Wesen der syntaktischen Regeln an einer Reihe von konkreten Beispielen erläutern und dabei zeigen, wie sie bei der Ableitung eines komplexen Satzes zusammenwirken. Wir sollten uns jedoch darüber im klaren sein, daß unsere Kenntnis der syntaktischen Struktur bei weitem noch nicht vollkommen ist. Da die Linguisten bis zum heutigen Tag nicht in der Lage sind, Begriffsstrukturen zu beschreiben, sind ihre Möglichkeiten der Formulierung von syntaktischen Regeln zur Verknüpfung von Begriffsstrukturen und Oberflächenstrukturen sehr begrenzt. Die folgende Darstellung ist deshalb in vielem als ein Versuch zu verstehen. Unsere Beschreibung verschiedener syntaktischer Erscheinungen soll nur als Illustration dienen und wird schließlich noch präzisiert werden müssen.
Reduktionsregeln Nehmen wir den Satz Karl durfte kommen, und Peter durfte auch kommen. Der Satz ist komplex und realisiert eine Begriffsstruktur mit zwei Komponenten. Eine Komponente liegt Karl durfte kommen zugrunde, die andere Peter durfte kommen, wobei die beiden durch und und auch koordiniert sind. Diese komplexe Begriffsstruktur könnte noch auf mancherlei andere Art realisiert werden, etwa durch die Auswahl anderer lexikalischer Einheiten und die Anwendung anderer syntaktischer Regeln (z. B. Sowohl Karl als auch Peter erhielten die Erlaubnis, sich hierherzubegeben). Wir wollen uns hier jedoch nur mit zwei Alternativsätzen beschäftigen, die auf die gleiche lexikalische und syntaktische Grundlage zurückgehen. Die Ähnlichkeit der folgenden Sätze sticht sofort ins Auge: Karl durfte kommen, und Peter durfte auch kommen. Karl durfte kommen und Peter durfte auch. Karl durfte kommen und Peter auch. Sie stammen nicht nur von der gleichen Begriffsstruktur ab, sondern sind auch syntaktisch und lexikalisch sehr ähnlich. Jeder Satz unterschei104
det sich von dem folgenden darin, daß er im zweiten Koordinationsteil ein Verbalwort mehr enthält. So unterscheidet sich der erste Satz vom zweiten durch die Wiederholung von kommen im zweiten Teil; der dritte unterscheidet sich vom zweiten durch die Wiederholung von durfte im zweiten Teil. Die drei Sätze gehen auf eine gemeinsame zugrundeliegende Struktur zurück, in der die volle Verbfolge durfte kommen im zweiten Koordinationsteil repräsentiert ist. Also gibt der Satz Karl durfte kommen, und Peter durfte auch kommen diese gemeinsame zugrundeliegende Struktur am unmittelbarsten wieder, auch wenn er selbst von dieser Struktur schon relativ weit entfernt ist. Eine syntaktische Regel, die wir Verbtilgungsregel nennen wollen, wirkt auf die gemeinsame zugrundeliegende Struktur ein und bringt die verschiedenen Realisierungsformen hervor (siehe Abb. 5.17). Die Verbtilgungsregel kann fakultativ auf den zweiten Teil einer komplexen Satzstruktur angewendet werden, die eine Koordination mit auch enthält. Diese Regel hat (etwas vereinfacht) die Funktion, das jeweils letzte in einer Folge von Verbalwörtern zu tilgen, vorausgesetzt, daß dieselbe Folge von Verbalwörtern auch im ersten Koordinationsteil vorkommt. Die Verbfolge durfte kommen erscheint in beiden Koordinationsteilen der Struktur, die Karl durfte kommen, und Peter durfte auch kommen zugrundeliegt, folglich kann die Verb tilgung vorgenommen werden. Wird die Regel einmal angewendet, so wird durfte kommen auf durfte reduziert ; bei der zweiten Anwendung wird durfte auf Null reduziert. Alle drei Sätze gehen also auf die gleiche zugrundeliegende Struktur zurück; die Wahl einer der Varianten hängt nur davon ab, wie oft die Verbtilgung angewendet wird. Reduktionsregeln wie die Verbtilgung sind sehr häufig. Jede Sprache hat syntaktische Regeln, die unter bestimmten Bedingungen Konstituenten zu tilgen erlauben, wenn identische Konstituenten anderswo im Satz erscheinen. Wenn durfte kommen getilgt wird, und so der Satz entsteht Karl durfte kommen und Peter auch, so besteht keinerlei Zweifel, was über Peter ausgesagt wird. Ein Sprecher der deutschen Sprache wird den Satz sofort so interpretieren, daß Peter auch kommen durfte, obwohl keine Verbalphrase zusammen mit Peter erscheint. Weil ein genaues Duplikat der getilgten Folge im ersten Koordinationsteil vorkommt, kann die volle Bedeutung der Oberflächenkette und Peter auch durch die Untersuchung des restlichen Teils des Satzes mit Sicherheit festgestellt werden. Die Reduktion von doppelt auftretenden Elementen be105
BEGRIFFS STRUKTUR
. . durfte auch kommen
/
\
OBERFLÄCHEN STRUKTUR (Karl durfte kommen, und Peter durfte auch kommen.)
OBERFLÄCHEN STRUKTUR (Karl durfte kommen und Peter durfte auch.)
auch
OBERFLÄCHEN STRUKTUR (Karl durfte kommen und Peter auch.)
Abb. 5.17
seitigt so eine große Menge potentieller Wiederholung, ohne dabei semantischen Inhalt zu verlieren. Als ein Beispiel aus dem Englischen führen wir eine Reduktionsregel vor, die wir N o m i n a l p h r a s e n t i l g u n g nennen wollen, und die unter
106
bestimmten Bedingungen auf eingebettete Satzstrukturen anwendbar ist. Der Satz I want John to go (vgl. im Deutschen etwa: Ich höre Hans kommen) wird abgeleitet, indem man nach want die John goes zugrundeliegende Struktur einbettet. Da diese Struktur als eingebetteter Satzteil und nicht isoliert als unabhängiger Satz vorkommt, wird sie durch eine syntaktische Regel modifiziert, die to einfuhrt und das Präsensmorphem tilgt; die Regel wandelt John+go+PRÄSENS in John+to+go um. I want John to go ist in Abb. 5.18 dargestellt. / und John sind beide Nominalphrasen, wobei die erste als Subjekt von want fungiert, die zweite als Subjekt von go. In diesem Beispiel sind die beiden Nominalphrasen zufällig verschieden, aber das muß nicht immer so sein. In Abb. 5.19, einem Schema, das genau parallel zu 5.18 ist, sind die beiden Nominalphrasen identisch. Beachten sie jedoch, daß man nicht sagt John wants John to go — um diese Vorstellung zu übermitteln, sagt man John wants to go, so daß John nur einmal vorkommt. Ein syntaktisches Prinzip des Englischen bestimmt, daß das Subjekt eines eingebetteten Satzteils nach bestimmten Verben wie want weggelassen wird, wenn es mit dem Subjekt des Satzes, in den der Nebensatz eingebettet ist, identisch ist. Dieses Prinzip, die Regel für die Nominalphrasentilgung wird auf die Struktur von Abb. 5.19 angewendet und tilgt die zweite Nominalphrase John; als Oberflächenkette ergibt sich John wants to go.
Abb. 5.19
Weitere Beispiele sind The captain would like to leave the sinking ship und The prisoner arranged to escape. Der erste Satz geht zurück auf die zugrundeliegende Struktur The captain would like the captain to leave the sinking ship (parallel zu: The captain would like the crew to leave 107
the sinking ship). Die Nominalphrasentilgung leitet den Satz von seiner zugrundeliegenden Struktur ab, indem das zweite Vorkommen von the captain getilgt wird. The prisoner arranged to escape beruht auf der zugrundeliegenden Struktur The prisoner arranged for the prisoner to escape (parallel zu The prisoner arranged for me to escapé). Nachdem die Nominalphrasentilgung das zweite Vorkommen von the prisoner beseitigt hat, tilgt eine zweite Regel for.
Pro-Formen Reduktion bedeutet nicht in jedem Fall volle Tilgung, da häufig ein Element zurückbleibt, wenn eine wiederholte Konstituente gelöscht wird. Ein derartiges Element nennt man eine Pro-Form. Nehmen wir den Satz Hans fing den Bären, und Peter häutete den Bären, der in Abb. 5.20 dargestellt ist. Der Satz ist zwar grammatisch, aber doch zumindest ungeschickt und er wiederholt sich. Die ihm zugrundeliegende Begriffsstruktur erhält eine akzeptablere Realisierung in dem Satz Hans fing den Bären und Peter häutete ihn (vgl. Abb. 5.21). Die Struktur in Abb. 5.20 wird durch die sogenannte Pronominalisierungsregel auf diejenige in Abb. 5.21 reduziert. Wenn in einem Satz zwei identische Nominalphrasen vorkommen, dann reduziert die Pronominalisierungsregel eine davon (meistens die zweite) auf ein Pronomen. In Abb. 5.21 bleibt das Pronomen ihn als Restelement der umfangreicheren Nominalphrase den Bären übrig, dient also sozusagen als Platzhalter dafür. Personalpronomina wie er, sie, es und sie (Plural) sind wohl die bekanntesten Arten von Platzhaltern, aber es gibt noch viele andere. So können etwa dort und dann als Ersatz für Orts- bzw. Zeitadverbien eintreten, genau wie Pronomina für Nominalphrasen eintreten. Ein Beispiel: eine zugrundeliegende Struktur der Art Hans spielt donnerstags immer im Sandkasten, aber Grete spielt donnerstags nie im Sandkasten kann zwei Reduktionen erfahren. Das Ortsadverb im Sandkasten wird zu dort reduziert, das Zeitadverb donnerstags zu dann. Daraus ergibt sich: Hans spielt donnerstags immer im Sandkasten, aber Grete spielt dann nie dort. Unsere letzten Beispiele für Pro-Formen sind dies, das und was. Sie können für eingebettete Nebensätze eingesetzt werden und vermeiden damit ungeschickte Strukturen wie Das Baby schrie, und daß das Baby schrie, beunruhigte seine Mutter. Der eingebettete Satzteil daß das Baby schrie ist eine Wiederholung des ersten Koordinationsteils des Satzes (abgesehen von dem bedeutungsleeren Morphem daß). Wenn dies der Fall 108
NP N
NP
ART Hans
N
NP
ART
N
fang- P R Ä T den Bären und
N
Peter häut- PRÄT den Bären
Abb. 5.20
V
Hans
fang- P R Ä T den Bären und
NP
Peter häut- P R Ä T ihn
Abb. 5.21
ist, kann der ganze eingebettete Satzteil durch die Pro-Form dies ersetzt werden, und man erhält den Satz Das Baby schrie, und dies beunruhigte seine Mutter. Es kann auch das als Pro-Form gewählt werden, so daß Das Baby schrie, und das beunruhigte seine Mutter entsteht. Eine andere 109
Variante verwendet das Ersatzwort was; was tritt an die Stelle des eingebetteten Satzteils, wobei das und getilgt und das Verb des zweiten Koordinationsteils umgestellt wird: Das Baby schrie, was seine Mutter beunruhigte.
Satzverzierungen Durch die Reduktion von wiederholten Konstituenten werden manchmal große Teile von zugrundeliegenden Stammbaumstrukturen in der Oberfläche nicht sichtbar realisiert (obgleich ihr Begriffswert aufgrund des restlichen Satzes rekonstruiert werden kann). Umgekehrt führen manche syntaktischen Regeln Elemente in die Oberflächenstruktur ein, die semantisch leer sind oder eine Information wiederholen, die schon an einer anderen Stelle im Satz repräsentiert ist. Solche Elemente kann man als Satzverzierungen verstehen, als syntaktisch eingeführte Ausschmückungen ohne eigenen semantischen Inhalt. Gute Beispiele dafür sind das Morphem daß im Deutschen oder die Morpheme to und ing im Englischen, die in untergeordneten Sätzen erscheinen. In einem Satz wie Ich weiß, daß mein Vetter Geld braucht ist daß semantisch leer, was man schon daran sehen kann, daß der entsprechende Satz ohne daß, also: Ich weiß, mein Vetter braucht Geld genau dasselbe bedeutet. Die Strukturen, die solchen Paaren von synonymen Sätzen zugrundeliegen, werden durch eine Regel eingeführt, die wir Daß-Einfügung nennen wollen; die Daß-Einfügung leitet die zweite Struktur in Abb. 5.22 von der ersten ab, wobei im Deutschen, anders
S
S
ich weiß S
ich weiß S
mein Vetter braucht Geld
daß mein Vetter Geld braucht
Abb. 5.22
110
als in der parallelen Konstruktion im Englischen, noch eine Umstellungsregel hinzutritt, die die Nebensatzstellung bewirkt. Daß repräsentiert kein Element der dem Satz zugrundeliegenden Begriffsstruktur, sondern wird (in diesem Falle fakultativ) durch eine syntaktische Regel eingeführt. To und ing werden in ähnlicher Weise durch syntaktische Regeln eingeführt, nur mit dem Unterschied, daß sie das Präsens- oder Präteritalmorphem des untergeordneten Satzes, in den sie eingeführt werden, ersetzen. Kommen wir zurück zu einem schon einmal gezeigten Beispiel, IwantJohn to go (Abb. 5.18). Um diesen Satz zu bilden, bettet man die John goes zugrundeliegende Struktur nach want als Konstituente ein. Die Einfügungsregel für to ist auf diese untergeordnete Struktur anwendbar, weil sie als Konstituente eines komplexeren Satzes eingebettet ist und nicht isoliert auftritt. Auf die Struktur John+go+PRÄS angewendet ergibt die To-Einfügungsregel John+to+go. Die Derivation von John wants to go aus der zugrundeliegenden Struktur John+want+PRÄS+John +go+PRÄS umfaßt also die Einfügung von to und die Tilgung der Nominalphrase. Die Einfügung von to modifiziert den zugrundeliegenden Satz zu John+want+PRÄS+John+to+go, wovon durch Nominalphrasentilgung John+want+PRÄS+to+go abgeleitet wird; die Realisierung dieser Struktur ist John wants to go. Die Einfügung von ing ist komplizierter, da sie sowohl das Subjekt des eingebetteten Satzes als auch sein Tempusmorphem betrifft. Nehmen wir z. B. den Satz I regretted his leaving. Ing ist als Ersatz für das Tempusmorphem an das Verb leave angefügt worden, aber zusätzlich ist noch das Possessivmorphem dem Subjekt von leave, der Nominalphrase he, hinzugefügt worden. Ing-Einfügung wird angewendet auf die eingebettete Struktur he+leave+PRÄT und ergibt als Ableitung he+POSSESSIV+leave+ ing. He+POSSESSIV wird phonologisch realisiert als his, genau wie in Wendungen wie his book. Bei Satzteilen, die ing enthalten, kann zusätzlich noch die Nominalphrasentilgung angewendet werden; statt I regretted my leaving kann man sagen I regretted leaving. Daß-Einfügung, To-Einfügung und Ing-Einfügung führen semantisch leere Morpheme als Satzverzierungen in untergeordnete Sätze ein. Welche der Regeln in einem bestimmten Fall anwendbar ist, hängt ab von dem Verb der Struktur, in die der Nebensatz eingebettet ist. Das Verb want z. B. erlaubt die Anwendung der To-Einfügung auf einen nach dem Verb eingebetteten Satzteil; die beiden anderen Regeln (Ing-Einfügung und die der deutschen Daß-Einfügung entsprechende That-Einfügung) können nicht angewendet werden. I want to go ist deshalb grammatisch, 111
I want that Igo und I want going sind ungrammatisch. Das Verb advocate (befürworten) dagegen erlaubt That-Einfügung und Ing-Einfügung, aber nicht To-Einfügung; I advocated that she leave und I advocated her leaving sind grammatisch, I advocated her to leave ist ungrammatisch. Die Information darüber, welche der Regeln anwendbar sind, ist Teil der syntaktischen Repräsentation solcher Verben. Auch Konkordanzregeln führen Satzverzierungen ein. Eine der Konkordanzregeln des Deutschen betrifft die Übereinstimmung von Subjekt und Verb eines Satzes. Diese Regel gibt an, daß das erste Verbalwort einer einfachen Satzstruktur so gekennzeichnet sein muß, daß es nach Numerus und Person mit dem Subjekt übereinstimmt. Das erste Verbalwort von Ich bin müde ist bin. Dies ist das phonologische Ergebnis der Morphemfolge sein+PRÄS, wenn sie als 1. Person Singular gekennzeichnet ist, um mit dem Subjekt Ich übereinzustimmen. Dagegen wird sein*PRÄS als ist realisiert, wenn es mit einem Subjekt der 3. Person Singular übereinstimmen soll, wie in Rosemarie ist heute hier.
Permutationsregeln Syntaktische Regeln dienen nicht nur zur Einfügung und Tilgung von Konstituenten oder zur Kennzeichnung der Konkordanz, sondern sie können auch die Stammbaumstruktur ändern, indem sie die lineare Ordnung der Konstituenten umstellen. Eine derartige Regel, die die Anordnung der Konstituenten verändert, ist die oben angeführte Partikelverschiebungsregel. Sie wird angewendet auf eine Struktur, die etwa A detective hunted down the killer zugrundeliegt und permutiert down mit the killer; das Ergebnis ist A detective hunted the killer down. Beispiele für Permutationsregeln im Deutschen wären die Regeln, die Nebensatzstellung einfuhren. Eine Permutationsregel, die wir Negationsverschiebung nennen wollen, ist ein interessantes Beispiel, das eine subtile Form der Mehrdeutigkeit in negativen Sätzen bewirkt. Betrachten wir den Satz Ich glaubte nicht, Robert sei krank. Dieser Satz kann bedeuten, daß der Sprecher überzeugt war, Robert sei nicht krank. Andrerseits kann er bedeuten, daß keinerlei Überzeugung im Hinblick auf Roberts Kranksein vorhanden war; der Sprecher glaubte zwar nicht, daß Robert krank sei, er glaubte aber auch nicht notwendig das Gegenteil. Nach der ersten Interpretation ist nicht mit krank semantisch assoziiert: es war die Überzeugung vorhanden, Robert sei nicht krank. Nach der zweiten Interpretation 112
ist nicht mit glaubte assoziiert: es war keine Überzeugung vorhanden, Robert sei krank. Da der Satz mehrdeutig ist, besitzt Ich glaubte nicht, Robert sei krank zwei zugrundeliegende Strukturen. In der einen gehört nicht zu dem untergeordneten Satz, der krank enthält. In der anderen gehört nicht zu dem Hauptsatz, der glaubte enthält. Diese beiden Strukturen sind in Abb. 5.23 schematisch dargestellt. Da diese beiden zugrundeliegenden Strukturen als Ich glaubte nicht, Robert sei krank realisiert werden können, muß es eine syntaktische Regel geben, die nicht aus seiner Stellung im untergeordneten Satz entfernt und es im Hauptsatz unterbringt. Diese fakultative Regel, die wir Negationsverschiebung nennen, leitet die zweite Struktur in Abb. 5.23 aus der ersten ab. Wenn die Negationsverschiebung also angewendet wird, wird die erste Struktur von Abb. 5.23 als Ich glaubte nicht, Robert sei krank realisiert. Wird sie nicht angewendet und bleibt nicht im untergeordneten Satz, so ergibt sich Ich glaubte, Robert sei nicht krank, was semantisch äquivalent ist.
Robert sei nicht krank
Robert sei krank
Abb. 5.23
Ein weiteres Beispiel für eine Permutationsregel ist ein grammatisches Prinzip, das man im allgemeinen Hervorhebung nennt. Die Hervorhebungsregel bewirkt den entscheidenden Unterschied zwischen synonymen Satzpaaren wie den folgenden: Daß Roland grausam ist, ist klar / Es ist klar, daß Roland grausam ist; Daß ich mich nur für das Geld interessiere, ist wahr / Es ist wahr, daß ich mich nur für das Geld interessiere; Daß er noch nicht gekommen ist, beunruhigt mich /Es beunruhigt mich, daß er noch nicht gekommen ist. Jedes Paar von Sätzen ist von der gleichen zugrundeliegenden Struktur abgeleitet. Z. B. realisieren Daß Roland grausam ist, ist klar und Es ist klar, daß Roland grausam ist beide die zugrundeliegende Struktur in Abb. 5.24. Die Subjekts-Nominalphrase besteht 113
aus dem Morphem es und dem eingebetteten Nebensatz daß Roland grausam ist. Beachten Sie, daß diese Nominalphrase parallel zu anderen gebaut ist, wie etwa die Tatsache, daß Roland grausam ist oder die Vorstellung, daß Roland grausam ist, die ebenfalls einen eingebetteten Nebensatz mit daß enthalten. Da Daß Roland grausam ist, ist klar und Es ist klar, daß Roland grausam ist von derselben zugrundeliegenden Struktur abstammen, muß es eine syntaktische Regel geben, die die Oberflächenunterschiede einführt. Eine derartige Regel ist die Hervorhebungsregel, die den eingebetteten Nebensatz an das Ende des Satzes verschiebt und als Platzhalter in der Subjektsposition die semantisch leere Form es zurückläßt. Mit anderen Worten: die Hervorhebungsregel wird auf die Struktur in Abb. 5.24 angewendet und leitet davon die Struktur in Abb. 5.25 ab. Wird diese
S NP
VP
es daß Roland grausam ist
ist klar
Abb. 5.24
S
NP
VP
es
ist klar
S daß Roland grausam ist
Abb. 5.25
114
fakultative Regel angewendet, dann entstehen Oberflächenketten wie Es ist klar, daß Roland grausam ist, Es ist wahr, daß ich mich nur für das Geld interessiere und Es beunruhigt mich, daß er noch nicht gekommen ist. Wird dagegen die Regel nicht angewendet, dann tilgt eine andere Regel das es, und dieselben zugrundeliegenden Strukturen werden realisiert als Daß Roland grausam ist, ist klar, Daß ich mich nur für das Geld interessiere, ist wahr und Daß er noch nicht gekommen ist, beunruhigt mich
Relativsätze Weitere Beispiele für syntaktische Regeln wollen wir an der Derivation von Relativsätzen erläutern. Betrachten Sie den Satz Der Stein, mit dem ich die Scheibe zerschlug, war schwer. Er ist semantisch äquivalent mit zwei einfacheren Sätzen: Der Stein war schwer und Ich zerschlug die Scheibe mit dem Stein. Die dem komplexen Satz zugrundeliegende Struktur wird gebildet durch Einbettung der einen einfacheren Struktur in die andere, wie Abb. 5.26 zeigt. Von dieser zugrundeliegenden Struktur leiten drei Regeln, Nominalphrasenverschiebung, Relativisierung und Nebensatzpermutation die Oberflächenstruktur ab: Der Stein, mit dem ich die Scheibe zerschlug, war schwer. Diese Oberflächenstruktur ist in Abb. 5.27 dargestellt. Als isoliert auftretender, unabhängiger Satz würde die eingebettete Struktur als Ich zerschlug die Scheibe mit dem Stein realisiert. Da sie aber als Konstituente in einen komplexeren Satz eingebettet ist, ist ihre Oberflächenform mit dem ich die Scheibe zerschlug. Die eingebetteten Satzteile der Abb. 5.26 und 5.27 unterscheiden sich in drei Dingen: Erstens erscheint die Präpositionalphrase in 5.26 am Ende des Satzteils, während sie in 5.27 am Anfang steht. Zweitens erscheint die Pro-Form dem in 5.27 anstelle der Nominalphrase dem Stein. Drittens ist das Verb in 5.27 an die letzte Stelle getreten. Die erste Veränderung geht auf die Nominalphrasenverschiebungsregel zurück, die zweite auf die Relativisierungsregel und die dritte auf die Regel zur Nebensatzpermutation. Die eingebettete Satzstruktur enthält eine Nominalphrase dem Stein, welche unmittelbar der Nominalphrase entspricht, die durch diese Struktur näher bestimmt wird. Die Regel zur Nominalphrasenverschiebung plaziert diese Nominalphrase an den Anfang des eingebetteten Satzes. Wenn dieser Nominalphrase eine Präposition vorausgeht, so wird sie im Deutschen ebenfalls vorgezogen. (Im Englischen ist die entsprechende 115
VP V ART
N
ADJ
NP
der Stein ich zer- P R Ä T die Scheibe schlag-
mit dem Stein sein P R Ä T
schwer
Abb. 5.26
NP NP ART
N
PP P
NP
VP
NP
NP ART
der Stein
mit
V N
dem ich die Scheibe zerschlag- P R Ä T sein P R Ä T schwer
Abb. 5.27 116
Teilregel fakultativ.) Es ergibt sich nun die Zwischenstufe mit dem Stein zerschlug ich die Scheibe. Wir können nun die Struktur des ganzen Satzes darstellen, indem wir den eingebetteten Satz in Klammern setzen: Der Stein (mit dem Stein zerschlug ich die Scheibe) war schwer. Der Stein kommt zweimal vor (das zweite Mal in der von der Präposition geforderten Dativ-Form), und die Regel zur Relativisierung reduziert das zweite Vorkommen auf die Pro-Form dem. Nun rückt noch die Nebensatzpermutation das Verb an den Schluß des eingebetteten Satzes, und wir erhalten die in Abb. 5.27 gezeigte Struktur. Ein wenig anders liegt der Fall bei der Nominalphrase die Blumen, die auf dem Tisch sind. Die Struktur, die die Blumen sind auf dem Tisch zugrundeliegt, wird als Relativsatz nach Blumen eingebettet, um diese komplexe Struktur zu bilden. Da die wiederholte Nominalphrase schon am Anfang des untergeordneten Satzes steht, bewirkt die Nominalphrasenverschiebungsregel keine Veränderung; es entsteht dieselbe Struktur: Die Blumen (die Blumen sind auf dem Tisch). Die Relativisierung ersetzt die wiederholte Nominalphrase die Blumen durch die Pro-Form die, und die Nebensatzpermutation rückt das Verb an den Schluß. Die Blumen, die auf dem Tisch sind kann nun durch die Relativreduktionsregel weiter verkürzt werden. Diese Regel ist fakultativ und tilgt ein Relativpronomen und eine Form des Verbums sein, wenn eine Präposition oder ein Adjektiv folgt. (Im letzteren Fall muß im Deutschen immer die anschließend erklärte Adjektiv-Inversionsregel eintreten.) Da nach die die Präposition auf folgt, die Blumen, die auf dem Tisch sind, kann diese Struktur zu die Blumen auf dem Tisch verkürzt werden. Für die Relativreduktion bei einem nachfolgenden Adjektiv gelten im Englischen Prinzipien, die von der deutschen Syntax verschieden sind. Nehmen wir das Beispiel The woman who is ready to leave is my aunt. Die Relativreduktion ist anwendbar, weil who is dem Adjektiv ready vorausgeht, und es ergibt sich The woman ready to leave is my aunt. The woman ready to leave ist mit seiner komplexen Ergänzung ready to leave eine wohlgeformte englische Nominalphrase. Aber dieselben Regeln können auch ungrammatische Nominalphrasen ableiten, wie etwa the woman happy. Auf die Nominalphrase the woman who is happy angewendet, ergibt die Relativreduktion the woman happy, wobei who is getilgt wird; diese Regel ist anwendbar, weil who is einem Adjektiv (happy) vorausgeht. Nominalphrasen wie the woman happy sind ungrammatisch, weil sie einem obligatorischen syntaktischen Prinzip des Englischen zuwider117
ART
N ADJ
the woman
ART
the
woman
N
be
PRÄS
happy
NP ADJ
the woman
who
be
t T
PRÄS
happy
Relativreduktion NP
ADJ
NP ART
N
the woman
1 T
happy
Adjektiv Jnversion NP
ART I
ADJ I
N I
the
happy
woman
Abb. 5.28
laufen, das wir die Adjektiv-Inversionsregel nennen wollen. Diese Permutationsregel gibt an, daß eine einfache Adjektivergänzung (wie happy, aber nicht ready to leave) vor das Nomen treten muß, das sie näher bestimmt. Auf die Struktur the woman happy angewendet, permutiert die Adjektiv-Inversion woman und happy und produziert die grammatische Folge the happy woman. Die Ableitung dieser Nominalphrase ist in Abb. 5.28 aufgezeichnet. Die Abb. dient als Beispiel dafür, wie eine relativ einfache Oberflächenstruktur aus einer komplexeren zugrundeliegenden Struktur durch die Anwendung einer Reihe von syntaktischen Regeln abgeleitet wird. (Für das Deutsche gilt: Die Adjektiv-Inversion tritt auch bei komplexen Ergänzungen ein. Also nicht nur die glückliche Frau sondern auch die zur Abfahrt bereite Frau. Ausnahmen von der Adjektiv-Inversionsregel sind nur archaische Wendungen wie Röslein rot.)
Syntaktische Skizze eines Satzes Bei unserer Untersuchung der syntaktischen Regeln haben wir nie die gesamte Struktur eines einzelnen Satzes ausführlich untersucht. Bei den Beispielen gingen wir immer so weit, daß wir erkennen konnten, wie die Regeln funktionieren. Um die ungeheure syntaktische Komplexität selbst von solchen Sätzen zu zeigen, die an der Oberfläche einigermaßen einfach erscheinen, wollen wir nun mit einiger Ausführlichkeit die Struktur eines einzelnen Satzes untersuchen. Wir nehmen den Satz Ich glaube nicht, daß dieser feige Mann beabsichtigt, den Wagen zu fahren, in dem es nicht wahrscheinlich ist, daß er einen Unfall überleben würde. Es ist ein Satz von nur mäßiger Länge und Komplexität; man könnte ohne weiteres viel schwierigere erfinden. Trotzdem wird eine Analyse seiner syntaktischen Struktur, selbst wenn sie nicht vollständig ist und nur einen Versuch darstellt, eine lange und verzwickte Ableitung zutage bringen.
Die zugrundeliegende Struktur Abb. 5.29 zeigt in Skelettform die Oberflächenstruktur von Ich glaube nicht, daß dieser feige Mann beabsichtigt, den Wagen zu fahren, in dem es nicht wahrscheinlich ist, daß er einen Unfall überleben würde. Die komplexe Struktur daß dieser feige Mann beabsichtigt, den Wagen zu fahren, in dem es nicht wahrscheinlich ist, daß er einen Unfall überleben 119
s Ich glaube nicht
S
daß dieser feige M a n n beabsichtigt
S
in dem es nicht wahrscheinlich ist
S
daß er einen Unfall überleben würde
Abb. 5.29
würde ist als Konstituente nach dem negierten Hauptverb glaube nicht eingebettet, den Wagen zu fahren, in dem es nicht wahrscheinlich ist, daß er einen Unfall überleben würde ist wiederum eine komplexe Konstituente des eingebetteten Satzes, die ihrerseits die Satzkonstituente in dem es nicht wahrscheinlich ist, daß er einen Unfall überleben würde enthält, daß er einen Unfall überleben würde repräsentiert eine weitere Ebene der Satzeinbettung. Aus dem vorhergehenden Abschnitt wissen wir, daß eine Anzahl von Elementen dieser Oberflächenstruktur verkürzte Formen von zugrundeliegenden Strukturen sind, er z. B. geht auf dieselbe zugrundeliegende Struktur zurück wie dieser feige Mann; die Pronominalisierungsregel reduziert das zweite Vorkommen dieser Nominalphrase auf die Pro-Form er. Dieser feige Mann spiegelt ebenfalls eine komplexe zugrundeliegende Struktur wider, diejenige nämlich, die auch dieser Mann, der feige ist zugrundeliegt; diese wiederum ist entstanden durch Einbettung von dieser Mann ist feige als Relativsatz zur Ergänzung von dieser Mann. Die Ableitung von dieser feige Mann entspricht der von the happy woman in Abb. 5.28. Der Relativsatz in dem es nicht wahrscheinlich ist, daß er einen Unfall überleben würde, der den Wagen näher bestimmt, realisiert dieselbe zugrundeliegende Struktur wie Es ist nicht wahrscheinlich, daß 120
er einen Unfall in dem Wagen überleben würde; dem Wagen wird durch Relativisierung auf dem reduziert. Schließlich ist dieser feige Mann als das Subjekt von fahren zu verstehen, obgleich davon in der Oberflächenstruktur den Wagen zu fahren keine erkennbare Spur zurückbleibt. Auch in anderer Hinsicht unterscheidet sich die Oberflächenstruktur dieses Satzes von seinen abstrakteren Repräsentationen, zu und die beiden daß sind semantisch leer, da sie durch syntaktische Regeln eingeführt werden, und die Verben sind so gekennzeichnet, daß sie mit ihrem jeweiligen Subjekt in Konkordanz stehen (Konkordanz-Regel). Diese Verzierungen sind rein syntaktische Einheiten und gehören nicht zur Begriffsstruktur. Weiterhin kann auch/Ts ist nicht wahrscheinlich, daß er einen Unfall in dem Wagen überleben würde selbst noch auf eine abstraktere Struktur bezogen werden. Erstens ist diese Kette mehrdeutig. Einmal kann es bedeuten, daß er einen Unfall in dem Wagen höchstwahrscheinlich nicht überleben würde; bei dieser Interpretation gehört nicht semantisch zu überleben. Andrerseits kann es bedeuten, daß sein Überleben im Fall eines Unfalles vielleicht nicht wahrscheinlich ist (sein Tod ist aber auch nicht unbedingt wahrscheinlich — vielleicht bestehen gleiche Chancen); bei dieser Interpretation gehört nicht semantisch zu wahrscheinlich. Wir werden uns im weiteren auf die erste Interpretation beziehen, so daß wir von einer zugrundeliegenden Struktur ausgehen, in der nicht mit überleben assoziiert ist und nicht mit wahrscheinlich. Weiterhin ist zu bemerken, daß Es ist nicht wahrscheinlich, daß er einen Unfall in dem Wagen überleben würde und Daß er einen Unfall in dem Wagen überleben würde, ist nicht wahrscheinlich die gleiche zugrundeliegende Struktur realisieren. Wenn wir diese verschiedenen Beobachtungen zusammenstellen, können wir für den ganzen Satz eine außerordentlich abstrakte zugrundeliegende Struktur voraussetzen. Diese Struktur ist in Abb. 5.30 wiedergegeben; die einfachen Satzstrukturen sind dort — der Verweisbarkeit wegen — numeriert. Eine lange Serie von Regelanwendungen überführt diese abstrakte Struktur in die Oberflächenkette Ich glaube nicht, daß dieser feige Mann beabsichtigt, den Wagen zu fahren, in dem es nicht wahrscheinlich ist, daß er einen Unfall überleben würde. Es muß betont werden, daß die Struktur in Abb. 5.30 keineswegs die Begriffsstruktur dieses Satzes ist. Die Begriffsstruktur ist noch viel abstrakter, und wir sind heute noch nicht in der Lage auch nur annähernd zu bestimmen, wie sie aussehen müßte. Die Struktur in Abb. 5.30 selbst ist das Ergebnis der Auswahl von lexikalischen Einheiten und der Anwendung von einer unbestimmten Zahl von syntaktischen Regeln. 121
s Ich glaub- P R Ä S nicht dieser Mann
S
S
beabsichtig- PRÄS
S
dieser Mann sein PRÄS feige dieser Mann S fahr- P R Ä S den Wagen S
dieser Mann sein KHAS Teige es b sein HK A S wahrscheinlich
dieser Mann S werd- P R Ä T einen Unfall in dem Wagen nicht überleben
dieser Mann sein PRÄS feige
Abb. 5.30
Derivation der
Oberflächenstruktur
Daß-Einfügung, Zu-Einfügung (entspricht hier der im Beispiel vorgeführten To-Einfügung des Englischen) und Konkordanzregeln für Subjekt und Verb wirken auf diese zugrundeliegende Struktur ein und führen Satzverzierungen ein. Das Verb glaub- und das Adjektiv wahrscheinlich gehören beide zur Klasse der Formen, die die Einfügung von daß zur Einleitung eines eingebetteten Satzes erlauben. Da Struktur 2 als Konstituente in den Satz mit glaub- eingebettet wird, wirkt die Regel zur Daß-Einfügung und bildet die Struktur daß dieser Mann S beabsichtig- PRÄS. (Wegen des nachfolgenden, eingebetteten Satzes tritt hier die Nebensatzpermutation nicht ein.) In derselben Weise wird Struktur 7 so verändert, daß sich daß dieser Mann S einen Unfall in dem Wagen nicht überleben werd- PRÄT ergibt, weil es in den Satz mit wahrscheinlich eingebettet wird (und entsprechend auch die Nebensatzpermutation eintritt). Das Verb beabsichtig- fordert die Einfügung von zu, das an die Stelle des 122
Präsensmorphems des eingebetteten Satzes tritt und seinerseits eine zusätzliche Permutationsregel auslöst. Durch Zu-Einfügung wird also Struktur 4 in dieser Mann S den Wagen zu fahren verwandelt. Konkordanz zwischen Subjekt und Verb gilt für alle Strukturen und kennzeichnet die Verben zur Übereinstimmung mit dem Subjekt in Numerus und Person. In Satz 2 etwa wird beabsichtig-+PRÄS phonologisch als beabsichtigt realisiert, damit es mit dieser Mann (3. Pers. Sing.) übereinstimmt. Die Struktur in Abb. 5.30 enthält dreimal die Nominalphrase dieser Mann sein PRÄS feige, obgleich die drei Vorkommen in der Oberfläche jeweils verschieden realisiert sind. Das dritte Vorkommen, das zu den Sätzen 7 und 8 gehört, wird als das Personalpronomen er realisiert, da hier die Pronominalisierungsregel wirkt. Das zweite Vorkommen, in den Sätzen 4 und 5, wird durch Nominalphrasentilgung beseitigt und ist überhaupt nicht sichtbar realisiert; dieselbe Regel reduziert, wie Sie sich erinnern werden, John wants John to go zu der Oberflächenform John wants togo. Diese beiden Vorkommen von dieser Mann (dieser Mann sein PRÄS feige) können reduziert werden, weil sie eine in den Sätzen 2 und 3 vorkommende Nominalphrase wiederholen.
Ich glaub- P R Ä S nicht
S
dieser Mann sein P R Ä S feige
den Wagen S zu fahren
es S sein P R Ä S wahrscheinlich
Abb. 5.31
123
Das Ergebnis der Anwendung dieser Regeln ist die Struktur in Abb. 5.31. Diese Struktur ist von derjenigen in Abb. 5.30 abgeleitet durch die Anwendung der Daß-Einfügung (+Permutation), Zu-Einfiigung (+Permutation), Subjekt-Verb-Konkordanz, Pronominalisierung undj^ominalphrasentilgung. Um diese abgeleitete Struktur mit ihrer Oberflächen-Realisierung zu verbinden, muß man noch eine Anzahl von zusätzlichen Regeln einführen. Die Teilstruktur aus den Sätzen 6 und 7 kann auf zweierlei Art realisiert werden. Entweder wird durch die Hervorhebungsregel Satz 7 an das Ende von 6 gestellt, so daß eine Struktur entsteht, die isoliert erscheinen würde als ¿'s ist wahrscheinlich, daß er einen Unfall in dem Wagen nicht überleben würde. Oder aber Satz 7 bleibt, wo er ist. Dann muß es getilgt werden und wir erhalten Daß er einen Unfall in dem Wagen nicht überleben würde, ist wahrscheinlich. In der Ableitung dieses Satzes wird die Hervorhebung angewendet, so daß Satz 7 an das Ende der Struktur kommt, in die er eingebettet ist. Negationsverschiebung tritt ebenfalls ein; auf diese Weise wird nicht von seiner Stellung in Satz 7 nach Satz 6 befördert, wo es auch in der Oberflächenstruktur erscheint.
S Ich glaub- PRÄS nicht
S
daß dieser Mann S beabsichtig- PRÄS S dieser Mann sein PRÄS feige
den Wagen S zu fahren
es sein PRÄS nicht wahrscheinlich S
daß er einen Unfall in dem Wagen überleben werd- PRÄT
Abb. 5.32
124
Hervorhebung und Negationsverschiebung leiten aus der Struktur in Abb. 5.31 die in Abb. 5.32 ab. Die Strukturen 6 und 7 sind eine komplexe Satzkonstituente, die als Relativsatz nach der Nominalphrase den Wagen eingebettet wird. Die wiederholte Nominalphrase den Wagen (bzw. dem Wagen) wird durch die Nominalphrasenverschiebungsregel an den Anfang des Relativsatzes gebracht, wobei die Präposition in mitgeht. Aus den Wagen (es sein PRÄS nicht wahrscheinlich, daß er in dem Wagen einen Unfall überleben werd- PRÄT) leitet die Nominalphrasenverschiebungsregel den Wagen (in dem Wagen es sein PRÄS nicht wahrscheinlich, daß er einen Unfall überleben werd- PRÄT) ab. Auf diese Struktur wird die Relativisierung angewendet, die das zweite Vorkommen von der Wagen auf das Relativpronomen (in) dem reduziert. Wenn den Verben durch die phonologischen Regeln ihre entsprechenden Formen zugewiesen werden, wird dann die ganze komplexe Nominalphrase realisiert als der Wagen, in dem es nicht wahrscheinlich ist, daß er einen Unfall überleben würde. Die Nominalphrasenverschiebung und die Relativisierung werden auch auf dieser Mann (dieser Mann sein PRÄS feige) angewendet. Die erste Regel bringt keine sichtbare Wirkung hervor, da sich die wiederholte Nominalphrase dieser Mann schon am Anfang des eingebetteten Satzes befindet. Nun tritt die Relativisierung ein und reduziert dieser Mann auf die Pro-Form der, wobei gleichzeitig Nebensatzpermutation stattfindet; daraus ergibt sich dieser Mann (der feige sein PRÄS). Würden nun keine weiteren syntaktischen Regeln angewendet, so entstünde die Oberflächenrealisierung dieser Mann, der feige ist. Wendet man aber die Relativreduktion an, so werden das Relativpronomen der und die Verbform sein+PRÄS getilgt, und es bleibt nur noch das Adjektiv feige von Satz 3 in der Oberfläche übrig. Dieser Mann feige wird dann durch Adjektiv-Inversion zu dieser feige Mann verändert. Und das Ergebnis ist schließlich die Struktur in Abb. 5.29, die Oberflächenstruktur von Ich glaube nicht, daß dieser feige Mann beabsichtigt, den Wagen zu fahren, in dem es nicht wahrscheinlich ist, daß er einen Unfall überleben würde. Die Derivation dieses Satzes umfaßt also Daß-Einfügung, NebensatzPermutation, Zu-Einfügung, Subjekt-Verb-Konkordanz, Pronominalisierung, Nominalphrasentilgung, Hervorhebung, Negationsverschiebung, Nominalphrasenverschiebung, Relativisierung, Relativreduktion, AdjektivInversion und noch viele andere Regeln. Diese Teilskizze der Syntax eines einzigen Satzes gibt uns eine Vorstellung von der ungeheuren Abstraktheit und Komplexität syntaktischer Systeme. Ihre Abstraktheit und Komplexität ist so groß, daß noch keine menschliche Sprache - nicht 125
einmal ein einziger Satz einer menschlichen Sprache — je vollständig beschrieben worden ist, und das wird sich in den nächsten Jahrzehnten auch nicht ändern. Jeder Satz, wie einfach er auch in der Oberfläche erscheint, realisiert eine Begriffsstruktur, vermittelt durch eine höchst verwickelt strukturierte Menge von syntaktischen Prinzipien. Diese Prinzipien sind in keiner Weise dem Bewußtsein direkt zugänglich, obgleich sie eine wesentliche Facette unserer psychischen Organisation sind. Als kompetente Sprecher einer Sprache wissen wir vieles, dessen wir uns normalerweise nicht bewußt werden.
126
6. Phonologische Systeme
Artikulatorische Phonetik Die Sprachlaute können unter verschiedenen Aspekten untersucht werden. Man kann die physikalischen Eigenschaften der Sprachlaute, wie sie durch die Luft übertragen werden, erforschen, indem man die Menge der im akustischen Signal vorhandenen Energie und deren Verteilung auf das Frequenzspektrum mißt; man kann untersuchen, wie diese Meßwerte sich im Verlauf einer Äußerung ändern usw. Ein anderer Ansatz geht davon aus, wie wir Sprachlaute aufnehmen, wobei Fragen etwa der folgenden Art gestellt werden: Wie groß muß der physikalische Unterschied zwischen zwei Lauten sein, damit jemand sie auseinanderhalten kann? Auf welche akustischen Merkmale von Sprachlauten verläßt sich der Hörer am meisten bei der Lautaufnahme? Welche physikalischen Eigenschaften werden vom Hörer überhaupt vernachlässigt? Die dritte Art, Sprachlaute zu untersuchen, beruht darauf, daß man fragt, wie die Laute mit den Sprechorganen gebildet oder artikuliert werden. Dieser Ansatz ist der älteste — er geht mindestens auf die alten Inder zurück —, und er ist auch der üblichste. Auch wir gehen nach diesem Ansatz vor.
Die Sprechorgane Die menschlichen Stimmorgane haben alle auch noch elementarere Funktionen (wie Essen und Saugen), denen die artikulatorischen Funktionen übergelagert sind. Unsere Stimmorgane sind also nicht grundlegend verschieden von denen anderer Primaten. Die Tatsache, daß wir in einer hochgradig systematischen und koordinierten Weise Laute bilden, was die anderen Primaten nicht tun, muß deshalb der Besonderheit unseres Nervensystems und nicht etwa gröberen anatomischen Unterschieden zugeschrieben werden. Wenn Luft aus der Lunge gepreßt wird, geht sie durch die Luftröhre 127
und entweicht durch den Mund, die Nase oder beide. Die ausströmende Luft kann auf verschiedene Arten kanalisiert und damit zur Lautproduktion nutzbar gemacht werden. Der Weg, den der Luftstrom nimmt, ist in Abb. 6.1 skizziert. Dieser Weg ist eine Art Hindernisbahn, auf der Hindernisse aufgestellt oder entfernt werden können. Wenn wir normal ausatmen, lassen wir die Luft frei ausströmen. Sprachlaute werden gebildet, wenn verschiedene Hindernisse dem Luftstrom entgegenstehen. Das erste potentielle Hindernis für die ausströmende Luft sind die Stimmbänder, zwei elastische Bänder, die etwas unterhalb des oberen Endes der Luftröhre im Kehlkopf liegen. Diese Bänder können verschiedene Stellungen einnehmen. In entspannter Stellung stehen sie auseinander und lassen die Luft ungehindert ausströmen. Wenn sie straff angespannt sind, treten sie aneinander und schließen die Luftröhre ab, so daß keine Luft hindurchströmen kann. In einer dritten Stellung sind sie nahe
Abb. 6.1
128
zusammengetreten, aber nur so dicht, daß Luft hindurchgepreßt werden kann, was sie in schnelle Schwingungen versetzt. Diese Schwingungen der Stimmbänder, S t i m m g e b u n g genannt, ist die Quelle der Vokale, die gebildet werden, wenn sonst keine Hindernisse in den Weg der ausströmenden Luft treten. Wir wollen zuerst die Artikulation der Vokale und dann die der Konsonanten untersuchen.
Artikulation der Vokale Der Laut, der durch die Schwingungen der Stimmbänder erzeugt wird, wird in jedem Fall durch die Einstellung des restlichen Stimmtrakts verändert. Zum einen absorbieren die Gewebe des Stimmtrakts einen Teil des ursprünglichen Lautes. Wichtiger ist jedoch, daß eine Veränderung der Form des Stimmtrakts die Resonanzeigenschaften verändert. Sind die Lippen und die Zunge in einer bestimmten Stellung, so wird die Höhle, durch die die schwingende Luft strömt, die Lautkomponenten in bestimmten Frequenzen verstärken oder hervorheben. Sind Lippen und Zunge in einer anderen Stellung, wird sich die Energie in anderen Frequenzen konzentrieren. (Ähnlich verstärkt eine Orgelpfeife einen Ton in der Frequenzlage, die durch ihre Länge und anderer Charakteristika bestimmt ist.) Die entstehenden Unterschiede in der Verteilung der Energie über das Frequenzspektrum nehmen wir als Unterschiede in der Vokalqualität wahr. Die Vokale [i] und [a] zum Beispiel klingen deshalb verschieden, weil die Zunge bei ihrer Bildung in verschiedenen Lagen ist, so daß sich Energie in verschiedenen Frequenzen konzentriert. Nach den Stimmbändern sind die wichtigsten Organe für die Artikulation von Vokalen die Zunge, die Lippen und das Velum (der fleischige hintere Teil der Munddecke). Die Zunge kann verschiedene Lagen einnehmen und ist von entscheidender Bedeutung für die Bestimmung der Vokalqualität. Die Lippen können in verschiedenem Grad gerundet oder ungerundet sein. Das Velum kann geschlossen sein wie in Abb. 6.2, so daß die Nasenhöhle abgeschlossen wird und die Luft nur durch den Mund ausströmt; oder es kann nach unten bewegt werden, so daß Luft in die obere Kammer eintreten kann. Für den Augenblick wollen wir einmal von den Lippen und dem Velum absehen, wobei wir annehmen, daß letzteres geschlossen ist. Wir können uns damit auf die Auswirkung von Veränderungen der Zungenposition konzentrieren. Man pflegt die Zungenposition in zwei Dimensionen anzugeben: hoch/ tief und vorne/hinten. Die Zunge kann tief im Mund gehalten werden 129
Zahndamm Palatum Velum
y/olVf
Zunge
obere) Schneide (zähne
Abb. 6.2
oder an einer bestimmten Stelle nach oben gebracht werden, zur Munddecke, auch Palatum genannt, hin. Entsprechend wird ein Vokal als hoch oder tief bezeichnet. Der Laut [a:] wie in Tag ist ein tiefer Vokal [i:] und [u:] wie in Lied und Hut sind Hochzungenvokale. Die ungefähre Lage der Zunge bei der Artikulation dieser drei Vokale ist in Abb. 6.2 dargestellt. Anders als bei [a:] werden die Laute [i:] und [u:] artikuliert, indem die Zunge etwas angehoben wird und so den Stimmtrakt verengt, allerdings ohne daß es dabei zu einer nennenswerten Wirbelbildung im Luftstrom kommt, [i:] und [u:] haben also einen Zug gemeinsam, der sie von [a: ] unterscheidet. [i:] und [u:] sind natürlich nicht identisch. Sie unterscheiden sich in der Stelle der Verengung des Stimmtrakts. Bei [i:] wird die Verengung dadurch gebildet, daß der Vorderteil der Zunge zum Zahndamm, zu den Alveolen hin bewegt wird. Dagegen wird für das [u: ] der hintere Teil der Zunge gehoben und zum hinteren Teil des Palatums hin bewegt, [i: ] ist also ein Vorderzungenvokal, während [u:] ein Hinterzungenvokal ist. Die Bildungsweise vorne unterscheidet [i:] von [a:] und [u:], die in der Mitte bzw. hinten gebildet werden. [a:], [i:] und [u:] sind die Extreme der Vokalartikulation. Kein Vokal wird mit einer Zungenposition weiter vorne gebildet als [i: ] oder weiter 130
hinten als [u:], weiter oben als [i:] und [u:] oder weiter untern als [a:]. Zwischen diesen Extrempositionen gibt es natürlich noch viele Möglichkeiten der Vokalartikulation. Laute können sich der Höhe nach zwischen hohen und tiefen Vokalen bewegen, sie können auch in der Dimension vorne/hinten eine Mittellage einnehmen. Die Position der Zunge bei der Artikulation verschiedener Vokale ist in Abb. 6.3 angegeben. Der Ort eines Vokals im Hinblick auf die zwei Dimensionen vorne/hinten, hoch/ tief ist mit seinem phonetischen Symbol angegeben. Beide Dimensionen sind in jeweils drei Bereiche eingeteilt, Vorne/Mitte/Hinten und Hoch/ Mittel/Tief. Diese Einteilung findet man häufig, in Wirklichkeit aber sind die Übergänge natürlich fließend, so daß die Einteilung in Bereiche nur der Vereinfachung der Darstellung dient. (Zweierlei ist noch zu bemerken: Für die deutschen Vorderzungenvokale muß noch die Differenzierung nach der Lippenstellung gemacht werden: gerundet-ungerundet. Weiterhin sind kurze ([u]) und lange ([u:]) Vokale zu unterscheiden. Die langen Vokale werden jeweils mit etwas höherer Zungenstellung gebildet als die entsprechenden kurzen.) Für spätere Beispiele wird hier auch eine entsprechende Tabelle für das Englische gegeben; bei den englischen Beispielen wird die Lautschrift dieser Tabelle verwendet. Damit ist die Interpretation von Abb. 6.3 ziemlich klar. Man kann in einer Folge die Vokale [i:], [e:] und [ae:] bilden, indem man nach und nach die Zunge (und den Unterkiefer) senkt. Entsprechend kann [u: ]
VORNE ge1 rundet [ü:] Sud
ungern ndet [¡:]
ICH
i
\
\
Lied
[il
VORNE
HOCH
[ü] Hütte
mit
\
cooed [u]
\
could [u]
\
[e] bait
[=>] roses
\
MITTEL \
M \
TIEF
J
\ N bit
weg
HINTEN
MITTE
i] beat
bet (*]
\
/
code [o]
/
cawed [o| /
\ l bat \
[A] but
cod [a]
Abb. 6.3
131
/
Schritt für Schritt zum [o:] und schließlich zum [a: j verändert werden. Die Zungenhöhe ist jeweils für [i:], [ü:] und [u:], [e:], [ö:] und [o:], sowie für fae:] und [a:] etwa gleich. Zur Identifizierung eines Vokals geben wir seine Stellung in den beiden Dimensionen an. So ist [e] ein vorderer Mittelzungenvokal, [a] ein mittlerer Tiefzungenvokal und [a] ein mittlerer Mittelzungenvokal. Benötigen wir eine größere Präzision, so können wir die Dimensionen in kleinere Bänder aufteilen und so eine feinere Einstellung erreichen. Die Position der Zunge bestimmt die Grundqualität eines Vokals. Der genaue phonetische Charakter hängt jedoch von den Lippen und vom Velum ab. Diese addieren noch zwei weitere Dimensionen zu jeder einigermaßen adäquaten Vokalbeschreibung. Sprechen wir einmal [i:] und [u: ] aus. Im Hinblick auf die Form der Lippen sind sie völlig verschieden. Beim [i:] sind die Mundwinkel zurückgezogen wie beim Lächeln, beim [u:] dagegen sind sie gerundet und vorgestülpt. [u:] ist also ein g e r u n d e t e r Vokal, [i:] ein u n g e r u n d e t e r . Die hinteren Vokale in Abb. 6.3 sind alle gerundet, bei den Vorderzungenvokalen gibt es im Deutschen, anders als im Englischen, eine ungerundete und eine gerundete Reihe. Grundsätzlich sind die Eigenschaften gerundet/ungerundet von den Dimensionen Vorne/Hinten unabhängig. So könnte man z. B. auch einen Vokal wie [u:] aber ungerundet aussprechen. Solche Laute kommen im Deutschen nicht vor, wohl aber in anderen Sprachen. Alle bisher angeführten Vokale können auch mit tiefer gesetztem Velum ausgesprochen werden, so daß Luft durch die Nasenhöhle strömen kann. So gebildete Vokale nennt man N asalvokale, im Gegensatz zu den mit geschlossenem Velum gebildeten O r a l v o k a l e n . Nasalvokale sind sehr häufig, obwohl sie im Deutschen und Englischen zufällig nicht auftreten. Ein bekanntes Beispiel für eine Sprache mit Nasalvokalen ist das Französische. Im allgemeinen sind tiefe Vokale eher nasal als hohe, aber auch das ist nur eine Tendenz. Die Dimension nasal/oral ist von den anderen drei Dimensionen unabhängig. Man kann also einen Sprachlaut als ein Bündel von artikulatorischen Eigenschaften verstehen, [i: ] z. B. läßt sich als langer, ungerundeter, hoher, oraler Vorderzungenvokal beschreiben. Dabei gehen sechs Termini in die Beschreibung ein. Der Terminus V o k a l zeigt an, daß die Stimmbänder bei der Bildung des Lautes schwingen, und daß sonst keine größeren Hindernisse im Stimmtrakt sind. Die anderen fünf Termini ordnen diesen Laut nach der eben beschriebenen Vokalklassifikation ein; jeder Terminus dient der Einordnung entlang einer Dimension. Ein anderes Beispiel 132
wäre das französische Wort un, das phonetisch als gerundeter, mittlerer, nasaler Vorderzungenvokal realisiert wird. Phonetische Symbole wie [i:] können als brauchbare Notationen für ganze Bündel von artikulatorischen Eigenschaften gelten.
Artikulation
der
Konsonanten
Konsonanten kann man auf vielerlei Weise bilden, und die damit verbundenen Mechanismen sind manchmal recht kompliziert. Da dieses Buch keine Abhandlung über Phonetik ist, werden wir uns auf eine kleine Auswahl beschränken. Die wohl wichtigsten Konsonanten sind die V e r s c h l u ß l a u t e . Diese Laute werden gebildet, indem man den Luftstrom völlig abschließt, so daß sich hinter dem Verschluß ein Druck bildet, und man dann die Luft auf einen Stoß entweichen läßt, [p] etwa wird gebildet, indem die Lippen verschlossen werden, so daß der Luftstrom aufgehalten wird, und dann die Lippen plötzlich geöffnet werden, damit die eingeschlossene Luft entweichen kann. Dieser Laut kommt vor dem Vokal [a] in dem Wort Papa vor. Die Luft kann durch die Lippen, die Stimmbänder oder die Zunge zurückgehalten werden. Einen mit den beiden Lippen gebildeten Verschlußlaut nennt man bilabial. Einen durch die Stimmbänder gebildeten nennt man G l o t t i s v e r s c h l u ß . Mit der Zunge kann naturlich an verschiedenen Stellen der Mundhöhle ein Verschluß gebildet werden. Dabei bestimmt die Stelle, wo der Verschluß gebildet wird, den Teil der Zunge, der verschließt. Die Zungenspitze etwa kann leicht einen Verschluß an den oberen Zähnen bilden, aber kaum am Velum. Mit der Zunge artikulierte Verschlußlaute sind d e n t a l , alveolar, palatal odervelar, je nachdem, ob der Verschluß an den oberen Zähnen, an den Alveolen, am harten oder am weichen Gaumen gemacht wird, [p] ist also ein bilabialer Verschlußlaut, [t] wie in Tasse ein alveolarer Verschlußlaut und [k] wie in Kasse ein velarer Verschlußlaut. Ein Verschlußlaut, der durch einen Verschluß an einer bestimmten Stelle gebildet wird, kann viele verschiedene spezifische phonetische Formen annehmen. Wie bei den Vokalen gibt es eine Reihe von sekundären Dimensionen, in denen ein Verschlußkonsonant variieren kann. Wir wollen nur einige davon betrachten und auch die ziemlich kurz. Diese Veränderungen sind am wichtigsten für die Verschlußlaute, treten aber auch bei anderen Lauten auf. 133
Wenn die Stimmbänder bei der Artikulation eines Konsonanten zu schwingen aufhören, nennt man den Konsonanten s t i m m l o s . Schwingen sie weiter, so ist der Konsonant s t i m m h a f t , [p t k] sind im Deutschen stimmlose Verschlußlaute. Alle drei besitzen ein stimmhaftes Gegenstück: [b] wie in Buch, [d] wie in Dach und [g] wie in Gans sind stimmhafte Verschlußlaute (bilabial bzw. alveolar bzw. velar). Stimmlose Verschlußlaute werden im Deutschen (wie im Englischen) normalerweise so gebildet, daß ein Lufthauch ausgestoßen wird, wenn sich der Verschluß öffnet. Hält man die Hand vor den Mund, wenn man pa artikuliert, so kann man leicht den ausgestoßenen Lufthauch beim [p] spüren. Verschlußlaute können auch ohne Behauchung gebildet werden, was sogar ziemlich häufig ist, so etwa zumeist im Französischen und Spanischen. Verschlußlaute mit Hauch nennt man behaucht oder aspiriert, solche ohne Hauch unbehaucht oder u n a s p i r i e r t . Das [p] in Papa kann also genauer bestimmt werden als aspirierter bilabialer Verschlußlaut. Das französische [d] wie in dans ,in' ist ein unaspirierter stimmhafter dentaler Verschlußlaut. Einige andere Varianten von Verschlußlautartikulationen sollten wir erwähnen, die zwar in den europäischen Sprachen seltener vorkommen, aber in vielen anderen Sprachen der Welt verwendet werden. Ein Verschlußlaut, der mit zusätzlicher Lippenrundung gebildet wird, ist labialisiert. (Dies ist dasselbe Merkmal, das gerundete Vokale charakterisiert.) Im Englischen kommen labialisierte alveolare und velare Verschlußlaute in einigen speziellen Umgebungen vor. [t d k g] werden labialisiert, wenn sie dem bilabialen [w] (dem Anfangslaut von wig) vorausgehen; die Lippen antizipieren dabei die für die Bildung des [w] notwendige Stellung. Beispiele sind twig, Edward, liquid und iguana. Laute können auch durch eine Veränderung der Größe der Rachenhöhle oder P h a r y n x modifiziert werden. Indem man die Zungenwurzel nach hinten bewegt, kann man die Rachenhöhle stark verkleinern. Auf diese Weise gebildete Laute nennt man p h a r y n g a l i s i e r t . Das Arabische ist eine Sprache mit pharyngalisierten Konsonanten. G l o t t a l i s i e r t e Konsonanten werden gebildet durch die gleichzeitige Wirkung des Kehlkopfes und eines weiteren Artikulators. Der Kehlkopf kann bei geschlossenen Stimmbändern gehoben werden, so daß im oberen Stimmtrakt ein größerer Luftdruck entsteht. Die eingeschlossene Luft entweicht, wenn die Artikulation des Konsonanten ausgelöst wird. Viele amerikanische Indianersprachen besitzen glottalisierte Konsonanten. Bei der Bildung von Verschlußlauten bewirken Lippen, Zunge oder Stimmbänder einen Verschluß für den Luftstrom im Stimmtrakt, und 134
dieser Verschluß wird anschließend gelöst. Eine andere Art, Konsonanten zu artikulieren, beruht darauf, daß man den Luftstrom behindert, aber nicht völlig blockiert. Man erreicht dies, indem man einen Artikulator in die Nähe der zum Verschluß notwendigen Position bringt, aber noch eine kleine Öffnung läßt, durch die der Luftstrom hindurch kann. Die Verengung des Stimmtrakts bewirkt einen Wirbel, in dem durch die Engstellung entweichenden Luftstrom; diesen Wirbel nehmen wir als Zischen wahr. Auf solche Weise produzierte Laute bezeichnet man als Reibelaute oder F r i k a t i v e . Wie Verschlußlaute können Frikative durch die Stelle charakterisiert werden, an der die Verengung vorgenommen wird. Ein mit beiden Lippen gebildeter Frikativlaut wäre ein bilabialer Reibelaut, ein Laut, den es im Deutschen nicht gibt. Das deutsche [f] ist ein l a b i o d e n t a l e r Reibelaut, weil bei der Artikulation die oberen Zähne auf der Unterlippe ruhen. Das englische [©], der Anfangslaut von thing, ist ein dentaler Reibelaut; die Zunge stößt an die oberen Zähne an, schließt aber, wie beim [f], den Luftstrom nicht völlig ab. Das [s] in Biß ist alveolar, etwas weiter hinten wird am Palatum das [$] in schön gebildet. Im Englischen gibt es keinen velaren Reibelaut, wohl aber im Deutschen {ach) und Russischen, [h], der erste Laut in Hand, ist ein glottaler Reibelaut, obgleich nur wenig Reibung erzeugt wird, wenn die Luft durch die Stimmritzen strömt. Die obengenannten Reibelaute sind alle stimmlos. Parallel dazu gibt es im Englischen eine Serie von stimmhaften Reibelauten, die jeweils den stimmlosen entsprechen: [v d z 2 ] wie in vile, this, zero und azure. Das Deutsche kennt davon nur zwei, [v] in Wasser und [z] in sehen (norddeutsche Aussprache). Eine dritte Art der Konsonantenartikulation verbindet die Merkmale von Verschlußlauten und Reibelauten. Ein Verschluß wird gebildet und gelöst, wobei beim Lösen des Verschlusses ein Wirbel wie beim Reibelaut zustandekommt. Das Deutsche kennt zwei derartige Laute, die man A f f r i k a t e n nennt, [pf] in Pferd und [ts] in Zahl. In anderen Sprachen gibt es noch eine ganze Reihe anderer Affrikaten, so im Englischen [j[] und [6] wie sie in judge und church je zweimal vorkommen. Manche Konsonanten werden gebildet, indem man im Mund einen Verschluß bildet und gleichzeitig das Velum senkt, so daß Luft durch die Nasenhöhle strömen kann. Solche Konsonanten nennt man nasale Konsonanten. Nasale Konsonanten unterscheiden sich nach der Stelle, an der der Verschluß gemacht wird, [m] in mich ist ein bilabialer Nasal, [n] in noch ist ein alveolarer Nasal und [n] in sang ist ein velarer Nasal (trotz der Orthographie ng, die zwei Laute vermuten lassen könnte). Nasale 135
Konsonanten sind normalerweise stimmhaft, müssen es aber nicht sein. Wir kommen nun zu den Liquiden, den 1- und r-artigen Lauten. Die Vielfalt der in den Sprachen der Welt vorkommenden Liquiden können wir nur andeuten. Die verschiedenen 1-artigen Laute werden Laterale genannt. Sprechen Sie einmal ein [1] wie in lesen. Die Zunge bildet einen alveolaren Verschluß in der Mitte des Mundes. Gleichzeitig kann jedoch die Luft zu den Seiten hin entweichen, so daß der Luftstrom nie blockiert ist; daher der Terminus lateral. Der deutsche Lateral ist stimmhaft. Da durch den Verschluß in der Mitte kein Wirbel verursacht wird, und da der Luftstrom gleichmäßig ist, ähnelt dieser Laut den Vokalen in seiner akustischen Qualität. Dasselbe gilt von stimmhaften Nasalen und vor allem vom r-Laut. Der r-Laut kann im Deutschen auf zwei verschiedene Arten gebildet werden. Entweder als Zungen-r [r], bei dem die Zunge gegen die Alveolen schlägt oder als uvulares r [R], bei dem das Zäpfchen (Uvula) lautbildend wirkt. Unter den Zungen-r-Lauten gibt es etwa im Spanischen zwei Varianten; das eine wird durch einfachen Zungenschlag gebildet wie in pero ,aber', das andere durch schnelles mehrmaliges Schlagen „gerollt" wie in perro ,Hund'. Es bleiben jetzt noch die Gleitlaute oder Halbvokale zu behandeln. Im Deutschen gibt es das [j], im Englischen zusätzlich das [w] (Beispiele Ja und water). Ein Gleitlaut entsteht durch die schnelle Bewegung der Artikulationsorgane zu oder weg von einer Stellung, die sie für die Artikulation eines bestimmten Vokals einnehmen. Der Gleitlaut [w] ist in dieser Weise mit dem [u] verwandt, der Laut [j] mit [i]. Die Aussprache etwa von englisch wow beginnt mit der für die Artikulation von [u] notwendigen Stellung: gerundete Lippen und Zunge hinten und oben. Statt nun tatsächlich [u] zu bilden, gleiten die Stimmorgane in die Stellung für [a:]. Wenn das [a:] gebildet ist, gleiten Lippen und Zunge in ihre Ausgangsposition zurück, so daß das Wort mit einer dem [u] entsprechenden Mundposition aufhört. Die Bildung von [j] ist entsprechend. Normalerweise, wenn auch nicht immer, sind Gleitlaute mit Hochzungenvokalen verwandt, wobei [j] und [w] die häufigsten sind. Ein anderes Beispiel: Das Französische besitzt zusätzlich noch einen Gleitlaut, der in der hohen, vorderen, gerundeten Stellung beginnt wie in lui ,ihm'. Im Englischen werden die Vokale [e] und [o] normalerweise mit einem anschließenden Gleitlaut ausgesprochen, wie in bait,Köder' und boat. Weitere Kombinationen von Vokal + Gleitlaut findet man im Englischen in eye, boy und cow. 136
Suprasegmentale Merkmale Bisher haben wir nur Lautsegmente untersucht. Zum Abschluß sollten wir noch etwas über Länge, Betonung und T o n h ö h e sagen, phonologische Elemente, die man kaum als Segmente betrachten kann. Sie werden im allgemeinen suprasegmentale Merkmale genannt, weil man sie bei der phonetischen Schreibung meist über den Symbolen notiert, die Segmente bezeichnen. Für das Englische betrachtet man Länge im allgemeinen als suprasegmentales Merkmal, im Gegensatz zum Deutschen, wo sie, zumindest bei den Vokalen, segmental ist und die Opposition kurz - lang bedeutungsunterscheidend wirken kann (Saat - satt). Im allgemeinen sind die Vokale im Englischen vor stimmhaften Konsonanten länger als vor stimmlosen (bed und bet). In vielen Sprachen spielt die Länge von Vokalen (wie im Deutschen) oder Konsonanten eine wichtigere Rolle, indem sie dazu dient, Morpheme zu unterscheiden. Vokale können sich auch in ihrer relativen Betontheit unterscheiden. So haben die Wörter Regen und Bogen je einen Hauptton, im Gegensatz zu der Wortbildung Regenbogen, die nur einen Hauptton auf der ersten Silbe trägt. Im Englischen ist in red skin ,rote Haut' skin betont, während im Kompositum redskin ,Rothaut' red betont ist. Über das Wesen der Betonung sind sich die Linguisten noch nicht völlig im klaren. Alles, was wir sagen können, ist, daß betonte Vokale insofern von unbetonten verschieden sind, als sie länger und höher sind und größere Artikulationsstärke besitzen. Man kann den Ton der Stimme einfach dadurch erhöhen oder erniedrigen, daß man die Spannung der Stimmbänder erhöht oder erniedrigt. In vielen Sprachen werden Unterschiede der Tonhöhe systematisch dazu verwendet, Morpheme zu unterscheiden. Das klassische Beispiel für solche Sprachen ist das Chinesische. Ein Unterschied in der Tonalität kann sich auf einen Unterschied in der Tonhöhe beschränken. So kann z. B. die Identifikation eines Morphems davon abhängen, ob der betreffende Vokal einen hohen oder einen niedrigen Ton hat. Wenn eine Sprache eine Reihe von Tonhöhen unterscheidet und nicht nur zwei oder drei, spielt die Intonationskontur eine Rolle. Die Sprecher können z. B. einen hohen Ton, einen niederen Ton, einen fallenden Ton, einen steigenden Ton und einen erst steigenden und dann fallenden Ton unterscheiden. Die Höchstzahl von Tonalitäten, die in einer Sprache verwendet werden, um Morpheme zu unterscheiden, scheint bei fünf zu liegen. 137
Distinktive Unterschiede Menschliche Wesen können eine unbegrenzte Zahl von verschiedenen Sprachlauten produzieren. Das ist einfach deshalb so, weil manche Artikulationsdimensionen eher kontinuierlich als in begrenzten Schritten funktionieren. Zwischen den Positionen für [u:] und [a:] gibt es z. B. eine unendliche Zahl von Zungenhöhen, und folglich auch eine unendliche Zahl von entsprechenden Vokallauten. Ein anderes Beispiel wären die Verschlußlaute, bei denen der Verschluß an jeder beliebigen Stelle der Mundhöhle vorkommen kann. Die meisten dieser minimalen Unterschiede sind jedoch unterhalb der Wahrnehmungsschwelle. Darüberhinaus werden viele gröbere, klar wahrnehmbare Unterschiede von Sprechern einer Sprache nicht systematisch für kommunikative Zwecke verwendet. Damit sind wir bei einer entscheidenden Tatsache angekommen: der systematischen Ausnützung bestimmter phonologischer Unterschiede zu kommunikativen Zwecken durch die Sprecher einer Sprache. Eine Sprache kann als Kommunikationsmittel dienen, weil sie Bedeutungen und Lautformen einander zuordnet. Die Bausteine dieser Zuordnungen sind die einzelnen Morpheme, die (zusätzlich zu ihren syntaktischen Eigenschaften) einen Begriffswert und eine phonologische Repräsentation besitzen. Die phonologische Repräsentation eines Morphems bestimmt seine Aussprache. Damit dieses Kommunikationsschema wirksam funktioniert, muß im großen und ganzen gelten, daß verschiedene Morpheme verschiedene Lautformen haben. Auf Grund der phonologischen Form eines Morphems muß man es identifizieren und seine Bedeutung erschließen können; wäre dies nicht der Fall, so könnte der Hörer die Bedeutung eines Satzes nicht verstehen, und der Sprecher hätte keinen Anlaß, ihn zu äußern. Nehmen wir einen extremen Fall: wir könnten kaum kommunizieren, wenn alle Morpheme unserer Sprache gleich ausgesprochen würden. Einige gleichlautende Morpheme bereiten keine echten Schwierigekeiten (z. B. Tau .Niederschlag' und Tau ,Seil'). Dagegen könnte häufig auftretende Identität der phonologischen Form die Kommunikation ernsthaft behindern. Deshalb muß es möglich sein, die Morpheme auf Grund ihrer Lautform auseinanderzuhalten. In welcher Weise unterscheiden sich nun die Morpheme einer Sprache phonologisch voneinander? Mit und Mitte z. B. unterscheiden sich darin, daß das erste aus drei Segmenten besteht und das zweite aus vier. Offensichtlich spielt jedoch die Identität der Segmente eine viel größere Rolle. Tanne kann identifiziert und von anderen 138
Morphemen unterschieden werden, wenn das erste Segment als [t], das zweite als [a], das dritte als [n] und das vierte als [e] identifizierbar sind. Diese Information trennt die Tanne von der Kanne, die mit einem anderen Segment beginnt, und weiter von anderen Morphemen, die Tanne noch weniger ähneln. Aber in welchem Sinn ist man berechtigt, von der Identifizierung eines Lautsegments zu reden? Rein objektiv gesprochen, sind keine zwei geäußerten Laute sich jemals in allen phonetischen Einzelheiten genau gleich. Wann immer ein Laut ausgesprochen wird, so wird genau dieser Laut zum ersten (und letzten) Mal ausgesprochen. Die Unterschiede zwischen zwei geäußerten Lauten mögen minimal sein, fast unmeßbar, aber sie sind immer vorhanden. In welcher Weise identifizieren wir dann Laute, wenn jeder Laut einmalig ist? Die Antwort darauf ist, daß wir als Sprecher einer bestimmten Sprache systematisch bestimmte Lautunterschiede unbeachtet lassen, während wir andere beachten. Auf welche Unterschiede wir achten müssen, ist ein Teil der Lernleistung beim Erwerb des phonologischen Systems unserer Sprache. Als Sprecher des Deutschen achten wir z. B. darauf, ob ein Verschlußlaut stimmhaft ist oder nicht. Diese Verschiedenheit unterscheidet [b] und [p], [d] und [t], [g] und [k], die für uns funktional verschiedene Laute sind. Durch die Wahrnehmung der Stimmhaftigkeit unterscheiden wir Blatt und platt, Dorf und Torf, Gabel und Kabel. Andrerseits beachten wir nicht den Artikulationsort bei der Bildung eines r-Lauts. Der Unterschied zwischen dem Zungen-r [r] und dem uvularen r [R] ist im Deutschen nicht funktional. Es gibt keine zwei Morpheme des Deutschen, die sich nur darin unterscheiden, daß das eine Zungen-[r] und das andere in derselben Position uvulares [R] besitzt. Funktionale Unterschiede, d. h. solche, auf die Sprecher einer Sprache bei der Bestimmung der Identität eines Morphems achten, nennt man distinktiv. Stimmhaftigkeit bei Verschlußlauten ist also im Deutschen distinktiv, die Unterscheidung des Artikulationsorts beim r-Laut nicht. Das phonologische System einer Sprache überlagert das phonetische Kontinuum mit einer Struktur. Genau wie der weitgehend kontinuierliche Lautstrom psychologisch als eine Folge von Lautsegmenten behandelt wird, werden auch die kontinuierlichen Artikulationsdimensionen durch ein Sprachsystem in unterscheidbare Bereiche aufgeteilt. Ein Laut kann während seiner ganzen Artikulation stimmhaft sein, oder er kann ganz stimmlos sein, zuerst stimmlos, dann stimmhaft, stimmlos bis zur letzten hundertstel Sekunde — die Möglichkeiten sind unbegrenzt; aber für die Sprecher einer Sprache, in der Stimmhaftigkeit distinktiv ist, wird 139
ein Segment als stimmhaft oder stimmlos behandelt, eine Zwischenlösung gibt es nicht. Vom Zahndamm bis zum Velum gibt es eine unendliche Zahl von Stellen, an denen die Zunge an der Munddecke einen Verschluß bilden kann. Als Sprecher des Deutschen behandeln wir jedoch das Kontinuum, als sei es in zwei klar unterschiedene Bereiche geteilt. Ein mit der Zunge gebildeter stimmloser Verschlußlaut wird entweder als [t] oder als [k] eingeschätzt. Andere Möglichkeiten gibt es nicht; ein Verschlußlaut, der in einer Zwischenstellung gebildet wird, muß einer der beiden Möglichkeiten zugeschlagen werden. Die funktional verschiedenen Laute einer Sprache sind einander in einem Netz von distinktiven Unterschieden gegenübergestellt. Im Englischen tritt z. B. [s] auf Grund des distinktiven Unterschieds zwischen stimmlosen und stimmhaften Segmenten zu [z] in Opposition; zu [f], [e] und [s] auf Grund der distinktiven Opposition von alveolarer, labialer, dentaler und palataler Artikulation; zu [d] wegen der Merkmale Verschluß und Stimmhaftigkeit; und zu den anderen Lauten des Englischen auf Grund dieser und anderer distinktiver Unterschiede. Sprachen unterscheiden sich darin, welche Unterschiede sie als distinktiv behandeln und zur Unterscheidung von Morphemen verwenden. Im Englischen achtet man darauf, ob ein Verschlußlaut oder ein Reibelaut stimmhaft ist oder nicht. Das ist deshalb wichtig, weil manche Morpheme nur auf Grund dieses Unterschiedes auseinandergehalten werden (etwa pig/big; fan/van; fat/fad). In vielen Sprachen wird jedoch die Unterscheidung stimmhaft/stimmlos überhaupt nicht ausgenützt; es gibt dort keine Morpheme, die nur durch dieses Merkmal allein unterschieden werden. In manchen Sprachen ist der Unterschied zwischen aspirierten und nicht-aspirierten Verschlußlauten distinktiv, nicht so im Deutschen oder Englischen. In anderen sind sowohl Stimmhaftigkeit als auch Aspiration distinktiv. Das gleiche gilt für Labialisierung, Glottalisierung und Pharyngalisierung. Das Merkmal Stimmhaftigkeit ist im Englischen (und Deutschen) für die Liquide nicht distinktiv. Es gibt dort nur einen distinktiven [1]-Laut oder [r]-Laut; keine zwei Morpheme werden nur auf Grund des Unterschiedes zwischen einem stimmhaften und einem stimmlosen Liquiden auseinandergehalten. Manche Sprachen jedoch bedienen sich des Unterschieds zwischen einem stimmhaften und einem stimmlosen [1] zur Unterscheidung von Morphemen. Im Englischen muß man mehrere funktionale Vokalhöhen unterscheiden, um etwa bit, bet und bat auseinanderzuhalten. In verschiedenen anderen Sprachen genügt eine einfache Zweiteilung in hohe und tiefe Vokale. Ein Teil des Erwerbs einer Sprache besteht darin, das System der di140
stinktiven Oppositionen zu lernen, die die Sprache dazu verwendet, Morpheme auseinanderzuhalten. Darüberhinaus muß ein Sprecher die phonologischen Repräsentationen sämtlicher einzelner Morpheme einer Sprache lernen. Diese beiden Lernleistungen sind nicht getrennt, sondern hängen eng miteinander zusammen. Das System der distinktiven Oppositionen bestimmt, welche phonologische Information für jedes Morphem einzeln gelernt werden muß und wleche Information aus den allgemeinen phonologischen Regeln gezogen werden kann, die für alle Morpheme einer Sprache gelten. Die phonologischen Eigenschaften eines Morphems, die einzeln gelernt werden müssen, sind genau die distinktiven Eigenschaften. Phonologische Eigenschaften, die aus allgemeinen Regeln ableitbar sind, können nicht als distinktive Eigenschaften dienen. Betrachten wir den Anfangslaut des englischen Wortes tin. Phonetisch ist es ein aspirierter, stimmloser, alveolarer Verschlußlaut. Die Information, daß es ein stimmloser, alveolarer Verschlußlaut ist, muß für dieses einzelne Morphem gelernt werden. Die Information jedoch, daß der Laut aspiriert ist, kann von einer allgemeinen phonologischen Regel her vorausgesagt werden. Die Eigenschaft aspiriert oder nicht-aspiriert ist nicht distinktiv. Es ist in keiner Weise voraussagbar, daß das englische Wort für das Metall ,Zinn' mit einem stimmlosen alveolaren Verschlußlaut beginnt und nicht mit einem stimmhaften; sowohl stimmhafte als auch stimmlose alveolare Verschlußlaute kommen in Anfangsstellung vor; es ist eine rein willkürliche Tatsache, daß die Form tin und nicht din (,Lärm') lautet. Das Merkmal der Stimmlosigkeit ist deshalb in dieser Position distinktiv: es dient dazu, anzugeben, welche der beiden potentiellen Formen die richtige ist. Ebenso ist die Information, daß dieses Segment alveolar und nicht bilabial oder velar ist, eine distinktive Information. Es ist eine charakteristische Eigenart dieses einen Morphems und unterscheidet es von den möglichen englischen Formen pin (,Nadel') und kin (^Verwandtschaft'). Schließlich muß man ganz speziell für dieses Morphem lernen, daß der erste Laut ein Verschlußlaut und nicht etwa ein Reibelaut ist. Diese phonologische Eigenschaft unterscheidet die Morpheme tin und sin (,Sünde'). Die Tatsache jedoch, daß der Verschlußlaut von tin aspiriert ist, unterscheidet diese Form nicht von irgendeiner möglichen anderen englischen Form. Diese Information besitzt keinen kontrastiven Wert, da im Anlaut stehende Verschlußlaute im Englischen immer aspiriert sind, wenn der folgende Vokal betont ist. Weil diese Eigenschaft für alle Morpheme charakteristisch ist, die mit einem stimmlosen Verschlußlaut beginnen, 141
kann sie nicht dazu verwendet werden, sie auseinanderzuhalten. Es handelt sich vielmehr um ein redundantes phonetisches Detail, das auf der Grundlage anderer phonologischer Information durch eine allgemeine Regel des Englischen eingeführt wird. Wenn ein Sprecher lernt, wie man das Wort tin ausspricht, muß er nicht besonders für diese Form lernen, daß der anlautende Verschlußlaut aspiriert wird. Er aspiriert ihn automatisch in Übereinstimmung mit einem phonologischen Prinzip, das für das Englische ganz allgemein gilt. Vielleicht sind ein paar weitere Beispiele nützlich. Es ist ein phonologisches Prinzip des Deutschen, daß die hinten in der Mundhöhle gebildeten Vokale [u: u o: o] grundsätzlich gerundet sind, während es bei den vorne als Hoch-oder Mittelzungenvokale gebildeten eine gerundete und eine ungerundete Reihe gibt ([ü: ü ö: ö] gegenüber [i: i e: e]). Es muß also bei den hinteren Vokalen das Merkmal der Rundung nicht für jedes der Tausende von Morphemen der Sprache wieder einzeln gelernt werden. Wenn der Sprecher die Aussprache von deutsch Sud [zu:t] lernt, so muß er die distinktive Information lernen, daß der Vokal hinten gebildet wird, im Gegensatz zu den Wörtern Saat und sieht, daß er ein Hochzungenvokal ist, im Gegensatz zu Sod- und daß er lang ist, im Gegensatz zu einem möglichen deutschen Wort Sutt. Aber er muß nicht lernen, daß der Vokal gerundet ist. Dieses nicht-distinktive phonetische Detail stellt ein phonologisches Prinzip des Deutschen bereit, das für Tausende von anderen Morphemen genauso gilt. Es ist viel leichter, diese eine, einfache Regel zu beherrschen, als, Morphem für Morphem, Tausende von phonetischen Fakten zu lernen, die sie beschreibt. Umgekehrt muß man im Deutschen bei den vorne gebildeten Vokalen das Merkmal Rundung/Nicht-Rundung lernen, um etwa Süd [zü:t] und sieht [zi:t] lautlich differenzieren zu können. Betrachten Sie als letztes Beispiel das zweite Segment des englischen Wortes spin (,spinnen')- Phonetisch ist es ein unaspirierter, stimmloser, bilabialer Verschlußlaut. Von diesen vier Merkmalen sind nur die letzten zwei distinktiv. Die Information, daß der Verschlußlaut bilabial und nicht velar oder alveolar ist, unterscheidet dieses Morphem von skin (,Haut') und von stin, das eine mögliche englische Form ist, die es zufällig nicht gibt. Die distinktive Eigenschaft des Verschlusses unterscheidet das zweite Segment von [w 1 m n] und den Vokalen, die auch nach anlautendem [s] vorkommen können. Nun sind aber Verschlußlaute im Englischen nach anlautendem [s] immer unaspiriert; das ist eine allgemeine phonologische Regel und keine Besonderheit von spin. Deshalb ist die Unaspiriertheit des [p] nach anlautendem [s] nicht distinktiv. 142
Es sind keine zwei englischen Morpheme denkbar, die sich nur darin unterscheiden würden, daß das eine in dieser Stellung einen unaspirierten Verschlußlaut und das andere einen aspirierten hat. Das Merkmal der Stimmhaftigkeit ist im Englischen im Hinblick auf Verschlußlaute zumeist distinktiv, nicht aber nach anlautendem [ s ] . In dieser phonologischen Umgebung sind Verschlußlaute stets stimmlos. Ein Sprecher muß diese Information nicht für jedes Morphem, das mit [s] plus Verschlußlaut beginnt, einzeln lernen; er beherrscht eine einzige Regel, die besagt, daß alle Verschlußlaute in dieser Umgebung stimmlos sind. Es könnten also im Englischen keine Morpheme nur durch den Unterschied in der Anlautsequenz zwischen [sp] und [sb], [st] und [sd] und [sk] und [sgjunterschieden werden. Man bezeichnet den Kontrast zwischen den Paaren [p b], [t d] und [k g] als in dieser Umgebung neutralisiert. Die Unterschiede zwischen diesen Lauten werden in anderen phonologischen Umgebungen für die Kommunikation systematisch ausgenützt, aber nicht nach anlautendem [s]. Die phonologische Repräsentation eines Morphems ist demnach die Information, die der Sprecher für das betreffende Morphem einzeln lernen muß, um zu wissen, wie es ausgesprochen wird. Ein Morphem wird phonologisch als eine geordnete Folge von Segmenten repräsentiert. Jedes Segment ist spezifiziert durch jene und nur jene Eigenschaften, die für Segmente in der betreffenden Position distinktiv sind.
Phonologische Regeln Wie wir in Kapitel 4 gesehen haben, ist es die Funktion der phonologischen Regeln, Oberflächenstrukturen mit ihren phonetischen Realisierungen zu verknüpfen (vgl. Abb. 4.4). Eine Oberflächenstruktur ist, wie Sie sich erinnern werden, eine Stammbaumstruktur, deren letzte Ableitungsstufe eine lineare Morphemkette ist. Jedes Morphem in der Kette besitzt eine phonologische Repräsentation, eine Angabe der distinktiven Eigenschaften, die seine Aussprache bestimmt. Phonologische Regeln beziehen einen Satz und seine phonetische Realisierung auf der Basis dieser Angaben aufeinander.
143
Die Angabe von nicht-distinktiven Merkmalen Phonologische Systeme sind alles andere als einfach. Die Beziehung zwischen Oberflächenstrukturen und ihren phonetischen Realisierungen ist indirekt und wird durch eine lange und manchmal sehr komplizierte Folge von phonologischen Regeln vermittelt. Die Erläuterung dieses Vorgangs wollen wir damit beginnen, die Derivation des englischen Morphems Stack (.Stapel') zu untersuchen. Phonetisch besteht Stack aus einer Folge von vier Segmenten: [staek]. [s] ist ein stimmloser alveolarer Reibelaut; [t] ist ein unaspirierter, stimmloser, alveolarer Verschlußlaut; [ae] ist ein ungerundeter, nicht-nasaler, vorderer Tiefzungenvokal; und [k] ist ein unaspirierter, stimmloser, velarer Verschlußlaut. Wollten wir mit unserer Beschreibung Vollständigkeit anstreben, so müßten wir noch viele nicht-distinktive phonetische Details hinzufügen. Wir müßten z. B. anmerken, daß keines der Segmente labialisiert, pharyngalisiert oder glottalisiert ist. Wir müßten den genauen Ort des velaren Verschlusses für die Artikulation des [k] angeben. Irgendwann müßten wir angeben, daß [s] und [t] nicht mit der vordersten Zungenspitze artikuliert werden, sondern mit dem Teil der Zunge, der etwas dahinterliegt. Die komplette Regelfolge, die für die Realisierung von Stack verantwortlich ist, enthält demnach viele Regeln zusätzlich zu den von uns ausdrücklich berücksichtigten. Nicht alle der oben aufgezählten phonologischen Eigenschaften sind distinktiv. Die Unaspiriertheit von [t] kann z. B. durch eine generelle Regel des Englischen vorausgesagt werden; desgleichen die Nicht-Rundung von [ae] und einige weitere Merkmale. Wie in Abb. 6.4 dargestellt, machen die distinktiven phonologischen Eigenschaften, d. h. diejenigen Merkmale, die für dieses besondere Morphem gelernt werden müssen, seine phonologische Repräsentation aus, die der vollständigen phonetischen Realisierung zugrundeliegt. Sowohl in der zugrundeliegenden als auch in der phonetischen Repräsentation kann man ein Segment als ein Bündel von phonologischen Eigenschaften verstehen. In Abb. 6.4 ist jedes Bündel in eckigen Klammern angegeben. Die nicht-distinktiven Merkmale sind kursiv gedruckt. Diese werden durch phonologische Regeln angegeben, die die zugrundeliegende phonologische Repräsentation mit ihrer phonetischen Realisierung verknüpfen. Der Vergleich der beiden Repräsentationen von Stack in Abb. 6.4 zeigt, daß phonologische Regeln die Merkmale stimmlos und alveolar für [s] angeben; desgleichen die Merkmale unaspiriert und stimmlos für [t], die Merkmale ungerundet und nicht-nasal für [ae] und das Merkmal un144
Z U G R U N D E L I E G E N D E PHONOLOGISCHE REPRÄSENTATION
j^ReibelautJ
alveolar
tief vorne Vokal
Verschlußlaut
stimmlos velar Verschlußlaut
1 Phonologische Regeln
T stimmlos alveolar Reibelaut
unaspiriert stimmlos alveolar Verschlußlaut
tief vorne unge rundet nicht-nasal Vokal
unaspiriert stimmlos velar Verschlußlaut
PHONETISCHE REALISIERUNG Abb. 6.4
aspiriert für [k]. Die Hinzufügung all dieser phonetischen Einzelheiten ist die gemeinsame Wirkung einer Anzahl von Einzelregeln, die alle für den gesamten Morphembestand des Englischen gelten. Beginnen wir beim Vokal. Die Information, daß das dritte Segment ein vorderer Tiefzungenvokal ist, ist distinktiv; diese Merkmale unterscheiden [ae] von Vokalen, die nicht vorne und nicht mit tiefer Zungenstellung gebildet werden, sowie von dem Liquiden [r], alles Laute, die nach anlautendem [st] vorkommen können (z. B. stick, stool, Strip). Dagegen ist die Information, daß er nicht-nasal ist, nicht distinktiv. Es gibt ein allgemeines phonologisches Prinzip des Englischen, das angibt, daß alle Vokale nicht-nasal sind. Dies ist keine individuelle Eigenart eines besonderen Morphems. Keiner der englischen Vokale ist nasal, also kann diese Eigenschaft auch nicht dazu verwendet werden, sie oder Morpheme auseinanderzuhalten. Weiterhin gibt es die Regel, die besagt, daß hinten gebildete Vokale des Englischen, die keine Tiefzungenvokale sind, im Gegensatz zu den anderen Vokalen gerundet sind. Da [ae] vorne gebildet wird, fügt diese Regel das nicht-distinktive Detail hinzu, daß der Laut ungerundet ist. So wirken zwei Regeln zusammen, um ein als vorderer 145
Tiefzungenvokal angegebenes zugrundeliegendes Segment mit seiner phonetischen Realisierung als ungerundeter, nicht-nasaler, vorderer Tiefzungenvokal zu verknüpfen. Wir wenden uns nun den anlautenden Segmenten zu. Normalerweise sind die Merkmale stimmlos und alveolar fiir den Reibelaut [s] distinktiv. Im Anlaut eines Morphems sind sie jedoch vor einem Verschlußlaut nicht distinktiv, [s] ist der einzige Reibelaut, der in dieser Umgebung vorkommen kann; es gibt keine englischen Formen wie zdack oder ftack, wo ein stimmhafter oder nicht-alveolarer Reibelaut einem Verschlußlaut vorausgeht. Die Information, daß das erste Segment ein Reibelaut und nicht ein Vokal ist, genügt deshalb zur Identifikation. (Genau genommen genügt schon die Information, daß es ein Konsonant ist.) Die anderen Merkmale können als redundante phonetische Einzelheiten durch die Regel angegeben werden, daß ein Reibelaut im Anlaut vor einem Verschlußlaut stimmlos und alveolar ist. Dies ist ein allgemeines Kennzeichen des Englischen, nicht eine Eigenschaft von einzelnen Morphemen. Wir haben vorher gesehen, daß Stimmlosigkeit und Unaspiriertheit bei Verschlußlauten nach anlautendem [s] nicht distinktiv sind. Diese zwei Merkmale sollte man wohl zwei verschiedenen Regeln zuschreiben. Eine Regel gibt an, daß ein Verschlußlaut nicht aspiriert ist, wenn er auf einen Reibelaut folgt. Die andere bezieht sich auf bestimmte Folgen oder Häufungen von Konsonanten, die aus Verschlußlauten, Reibelauten oder Affrikaten bestehen. Es ist ein allgemeines Prinzip des Englischen, daß, wenn zwei oder mehr dieser Laute nebeneinander in einer Kette auftreten, entweder alle stimmhaft oder alle stimmlos sind. So kann z. B. das Wort exit auf zwei Arten ausgesprochen werden, als [eksit] oder [egzit]. Die Häufung von Verschluß- plus Reibelaut kann völlig stimmlos oder völlig stimmhaft sein, aber nicht gemischt. Das Merkmal Stimmhaftigkeit des Verschlußlauts bestimmt das des folgenden Reibelauts, wobei Kombinationen wie [kz] oder [gs] ausgeschlossen werden. Ein weiteres Beispiel: das Pluralmorphem ist normalerweise ein alveolarer Reibelaut, wie in books und beds. Es wird jedoch im ersten Wort als [s], im zweiten als [z] ausgesprochen. Offensichtlich stimmen das stimmlose [s] in [buks] und das stimmhafte [z] in [bedz] mit dem jeweils vorangehenden Verschlußlaut überein. Schließlich noch als Beispiel das Präteritalmorphem, das bei englischen regelmäßigen Verben ein alveolarer Verschlußlaut ist. Das Präteritalmorphem wird nach judge als stimmhaftes [d] realisiert (judged), da dieses Wort eine stimmhafte Affrikate im Auslaut hat, während es nach der stimmlosen Affrikate von reach als [t] realisiert wird (reached). Diese allgemeine Regel, die für die Behandlung vieler anderer 146
Fälle für das phonologische System des Englischen vorausgesetzt werden muß, gibt das zweite Segment von Stack als stimmlos an, um Übereinstimmung mit dem anlautenden [s] zu schaffen. Das letzte Segment von Stack haben wir als phonetisch unaspiriert beschrieben. Das ist in der Tat eine Möglichkeit, aber zufällig nicht die einzige Möglichkeit. Die Artikulation von Verschlußlauten im Auslaut ist ein Bereich, in dem den Sprechern des Englischen ein gewisser Spielraum gelassen ist. Verschlußlaute können im Auslaut aspiriert sein oder auch nicht, und es gibt sogar die dritte Möglichkeit, die Zunge für den Verschluß an die Munddecke zu bringen, aber das Sprengen des Verschlusses wegzulassen. Das geschieht, indem man einfach den Verschluß nicht öffnet. Demnach müssen die Regeln, die die phonetischen Einzelheiten für die Artikulation von auslautenden Verschlußlauten hinzufügen, alle diese drei Möglichkeiten berücksichtigen. Wir haben nun die Derivation der phonetischen Realisierung von Stack aus der zugrundeliegenden Repräsentation mit Hilfe von phonologischen Regeln untersucht. Selbst wenn wir minimale phonetische Einzelangaben außer acht lassen, stellen wir fest, daß zumindest sechs Regeln daran beteiligt sind, die beiden Ebenen zu verknüpfen. Jede dieser Regeln gibt ein oder mehrere nicht-distinktive Merkmale für ein jedes Segment an und umgibt damit die skelettartigen Repräsentationen, die nur distinktive Merkmale berücksichtigen, mit phonetischem Fleisch.
Andere Arten von phonologischen Regeln Es wäre falsch, aus dem obigen Beispiel zu folgern, daß phonologische Regeln nichts anderes leisten, als nur nichtdistinktive Merkmale anzugeben. Es wäre auch falsch, zu folgern, daß zugrundeliegende phonologische Repräsentationen und deren phonetische Realisierungen sich nur darin unterscheiden, daß die letzteren mit Fleisch versehene, detailliertere Versionen der ersteren sind: die Beziehung zwischen den beiden Ebenen kann außerordentlich entfernt und abstrakt sein. Phonologische Regeln fügen Segmente ein, tilgen Segmente und verändern die Identität und selbst die Anordnung von Segmenten. Zusätzlich fuhren sie noch suprasegmentale Merkmale ein und modifizieren sie. Ein hypothetisches Beispiel erlaubt uns, diese Bemerkungen einfach und zusammenhängend zu illustrieren. Betrachten Sie das phonetische Datenmaterial in der folgenden Tabelle, das durchaus in einer natürlichen 147
Sprache vorkommen könnte. (Ein Akzent auf einem Vokal gibt an, daß der Vokal betont ist.) [beb] [16t] [mék] [räba] [sónob] [if] [tif] [éso] [téso] [kinap] [etküiap] [süne] [estime] [sàrot] [estärot]
,Vogel' ,Baum' ,Hund' ,Feuer' ,Fels' .rennen' ,nicht rennen' ,schwimmen' ,nicht schwimmen' ,essen' ,nicht essen' .laufen' ,nicht laufen' schlafen' ,nicht schlafen'
[bébib] [lódib] [mégib] [rábib] [sómbib] [ifa] [tifa] [ésa] [tésa] [kimba] [etkimba] [sima] [estima] [sárda] [estárda]
,Vögel' ,Bäume' ,Hunde' ,Feuer' (Plur.) ,Felsen' .rannte' .rannte nicht' .schwamm' .schwamm nicht' ,aß' ,aß nicht' ,lief ,lief nicht' .schlief .schlief nicht'
Wir wollen zuerst die Formen für,Vogel' und,Vögel' vergleichen, [beb] und [bebib]. [bebib] besteht zweifellos aus dem Morphem [beb],Vogel', gefolgt von dem Suffix [ib], das den Plural bezeichnet. Es scheint also, daß der Plural in dieser Sprache durch Antreten des Suffixes [ib] an die Substantivwurzel gebildet wird. Das Substantiv für ,Baum' ist [lot], und nach dem Paar [beb] und [bebib] würde man als Form für ,Bäume' [lotib] erwarten, die Form, die sich ergibt, wenn man das Suffix [ib] an [16t] anfügt. In Wirklichkeit heißt die Form aber nicht [lotib], sondern [lodib]. Auf den ersten Blick scheint also das Substantiv ,Baum' in seiner Pluralbildung unregelmäßig zu sein; diese Wurzel hat zwei mögliche Formen, [lot] und [I6d], je nachdem, ob ein Suffix antritt oder nicht. Schauen wir uns jedoch die Wörter für ,Hund' und ,Hunde' an, so finden wir eine entsprechende Alternation, die vermuten läßt, daß [16t] vielleicht doch nicht unregelmäßig ist. Das Morphem für ,Hund' ist [mek], aber die Pluralform ist nicht [mekib], sondern [megib]. [lot] und [mek] verhalten sich also in ihrer Pluralbildung gleich; wenn das Suffix [ib] hinzutritt, wird der zugrundeliegende stimmlose Verschlußlaut als stimmhafter Verschlußlaut realisiert. In dem vorhandenen phonetischen Datenmaterial gibt es keinen Fall, in dem ein stimmloser Verschlußlaut zwischen zwei Vokalen auftritt. Es scheint ein allgemeines phonologisches Prinzip dieser Sprache zu sein, 148
daß ein Verschlußlaut immer stimmhaft ist, wenn er von Vokalen umgeben ist; dieses Prinzip wollen wir die Regel zur Stimmhaftigkeit von Verschlußlauten nennen. Nach dieser Regel sind also [räba], [lödib] und [megib] mögliche phonetische Folgen, im Gegensatz zu [räpa], [lötib] und [mekib], die intervokalisch stimmlose Verschlußlaute zeigen. Unter dem Aspekt der allgemeinen Regel zur Stimmhaftigkeit von Verschlußlauten erweisen sich die Formen [lödib],Bäume' und [megib] ,Hunde' als völlig regelmäßig. Wie [bebib],Vögel' werden sie einfach durch Anfügen des Suffixes [ib] an die Substantivwurzel gebildet. Man erhält auf diese Weise [lötib] und [mekib] als zugrundeliegende Repräsentationen für ,Bäume' und ,Hunde'. Die Regel zur Stimmhaftigkeit von Verschlußlauten wird auf diese zugrundeliegenden Repräsentationen angewendet und macht die intervokalischen Verschlußlaute stimmhaft: so entstehen die phonetischen Realisierungen [lödib] und [megib]. Demnach bilden [beb], [löt] und [mek] ihren Plural alle auf dieselbe Art, nämlich durch Anfügen des Suffixes [ib]. Es ist eine allgemeine phonologische Regel der Sprache, daß zwischen Vokalen [t] zu [d] und [k] zu [g] werden. Was in der Oberfläche als Unregelmäßigkeit erschienen war, erweist sich bei näherer Untersuchung als die Auswirkung einer tieferen Regelmäßigkeit. Die Wurzel für,Feuer' ist [räba], aber die Pluralform heißt einfach [rabib], statt des zu erwartenden [räbaib]. Wieder scheinen wir uns einer phonologischen Unregelmäßigkeit gegenüberzusehen, wenn wir die Lage nicht genauer prüfen. Das Vorkommen von [rabib] statt [räbaib] überrascht überhaupt nicht, wenn wir das übrige Datenmaterial untersuchen; in keinem einzigen Fall finden wir mehr als einen Vokal nach dem betonten Vokal eines Wortes. Dies ist offensichtlich ein phonologisches Prinzip der Sprache. Wir wollen, um es genauer zu sagen, das Vorhandensein einer Vokaltilgungsregel annehmen, die innerhalb eines Wortes anzuwenden ist und jeden Vokal tilgt, der auf eine betonte Silbe folgt und gleichzeitig einer weiteren Silbe vorangeht. Die Vokaltilgung ist also auf die regelmäßig gebildete, zugrundeliegende Repräsentation [räbaib] anzuwenden; sie tügt das [a] und bewirkt die phonetische Folge [rabib]. [a] kann getilgt werden, weil es der betonten Silbe [rä] folgt und der Silbe [ib] vorangeht. Eine weitere Illustration der Vokaltilgungsregel erhält man, wenn man das Substantiv [sönob] ,Fels' und seinen Plural [sömbib] untersucht. Wenn das Substantiv [sönob] eine regelmäßige Pluralbildung besitzt, dann muß die phonetische Folge [sömbib] eine abstraktere phonologische Repräsentation von [sönobib] realisieren, [sömbib] unterscheidet sich in zweierlei von dieser zugrundeliegenden Repräsentation. Erstens fehlt das 149
unbetonte [o] von [sönobib]. Zweitens erscheint das zugrundeliegende Segment [n] phonetisch als [m]. Beide Unterschiede lassen sich auf die Wirkung von allgemeinen phonologischen Regeln zurückführen. Die Vokaltilgungsregel gibt an, daß ein unbetonter Vokal getilgt wird, wenn es einer Silbe mit betontem Vokal folgt und einer weiteren Silbe (im selben Wort) vorangeht. Da [o] einer betonten Silbe in [sönobib] folgt, und da eine weitere Silbe dem [o] folgt, wird die Vokaltilgungsregel angewendet, die [sönobib] zu [sönbib] reduziert. Von der Repräsentation [sönbib], die durch die Vokaltilgungsregel gebildet wurde, leitet eine Regel, die wir die Nasal-Assimilationsregel nennen wollen, [sömbib] ab. Diese Regel gibt an, daß ein nasaler Konsonant als bilabial realisiert wird, wenn er einem bilabialen Verschlußlaut, in diesem Fall [b], vorausgeht. Unter Assimilation, einer sehr häufig vorkommenden Erscheinung, versteht man die Veränderung eines Lautes zur Angleichung an benachbarte Laute. In diesem Fall wird das zugrundeliegende Segment [n] an das folgende [b] assimiliert, so daß beide als Bilabiale realisiert werden. Man wird nirgends in unserem Datenmaterial die phonetische Folge [nb] finden, wo ein alveolarer Laut einem bilabialen Verschlußlaut vorausgeht; also scheint die Nasal-Assimilation ein allgemeines Prinzip der Sprache zu sein. Wenn das Datenmaterial nur die angeführten Substantiva und deren Pluralformen umfassen würde, könnte man mit Recht an der Existenz von bestimmten, von uns angenommenen Regeln zweifeln. Es könnte z. B. ohne weiteres möglich sein, daß [sönob], wie das englische Morphem child, eine besondere Form hat, die nur mit dem Pluralmorphem zusammen auftritt, und wir damit die Variante [sömb] zu Unrecht der Wirkung von allgemeinen phonologischen Regeln zugeschrieben hätten. Wenn wir uns jedoch den Verbformen zuwenden, finden wir die betreffenden Regeln weiter bestätigt. Das Verbum mit der Bedeutung ,rennen' hat die Form [if], wenn keine Zeitstufe spezifiziert ist. Vergleichen wir damit die Präteritalform [ifa] ,rannte', so stellen wir fest, daß das Präteritum durch Hinzufügen des Suffixes [a] bezeichnet wird. Die negativen Formen [tif] .nicht rennen' und [tifa],rannte nicht' bestätigen diese Analyse und zeigen gleichzeitig, daß die Negation beim Verb durch das Präfix [t] bezeichnet wird. Da »schwimmen' als [eso] ausgesprochen wird, erwarten wir die Form für ,nicht schwimmen' als [teso], was genau dem Datenmaterial entspricht. Nach demselben Prinzip würden wir für .schwamm' und ,schwamm nicht' [esoa] und [tesoa] erwarten, denn diese Formen ergäben sich durch direktes Anfügen des Suffixes [a] zur Bezeichnung des Präteritums. In Wirk-
150
lichkeit sind die Formen jedoch [ésa] und [tésa], nicht [ésoa] und [tésoa]. So scheinen [ésa] und [tésa] auf den ersten Blick unregelmäßige Formen zu sein, aber nur solange, bis wir uns an die Vokaltilgungsregel erinnern. Um das Vorkommen der Pluralformen [rábib] zu [rába],Feuer' und [sómbib] zu [sónob] ,Fels' erklären zu können, setzten wir diese Regel voraus, die einen Vokal tilgt, der einer betonten Silbe folgt und einer weiteren Silbe im selben Wort vorangeht, [éso] erweist sich unter Berücksichtigung der Vokaltilgungsregel als völlig regelmäßig in seiner Präteritalbildung. Durch Hinzufügen des Präteritalsuffixes [a] an [éso] und [téso] ergeben sich die zugrundeliegenden Repräsentationen [ésoa] und [tésoa]. Auf diese zugrundeliegenden Repräsentationen wird automatisch die Vokaltilgungsregel angewendet, die das [o] tilgt und die phonetischen Folgen [ésa] und [tésa] bewirkt. Das gleiche phonologische Prinzip, das die Pluralformen der Substantive [rába] und [sónob] erklärt, erklärt auch das Präteritum des Verbums [éso]. [kínap] ,essen' und [kimba] ,aß' bestätigen in der gleichen Weise die Regel zur Stimmhaftigkeit von Verschlußlauten, die Vokaltilgungsregel und die Nasal-Assimilation. Fügt man [kínap] das Suffix [a] hinzu, so ergibt sich die zugrundeliegende Repräsentation [kinapa], deren phonetische Realisierung, [kimba] durch die Anwendung der drei Regeln automatisch ableitbar ist. Die Stimmhaftigkeits-Regel besagt, daß ein Verschlußlaut stimmhaft wird, wenn er zwischen zwei Vokalen erscheint; die Anwendung dieser Regel auf [kinapa] ergibt [kmaba]. Die Vokaltilgung fordert den Verlust eines Vokals, der einer betonten Silbe folgt und einer weiteren Silbe vorausgeht; daraus folgt die Form [kinba] aus [kinaba]. Die Nasal-Assimilation macht einen Nasal bilabial, wenn er einem bilabialen Verschlußlaut direkt vorausgeht, wie es bei [n] in [kinba] der Fall ist. Auf diese Weise verknüpft die Nasal-Assimilationsregel [kinba] mit der phonetischen Folge [kimba]. Die anderen positiven Formen, [sime] .laufen', [sima] ,lief, [sárot] ,schlafen' und [sárda],schlief bestätigen unsere Analyse, [sima] ,lief ergibt sich direkt aus [sime] .laufen' durch Anfügen des Suffixes [a], zusammen mit der Vokaltilgungsregel. Die Suffigierung von [a] an [sárot] .schlafen' ergibt [sárota] als zugrundeliegende Repräsentation von [sárda] ,schlief. Aus dieser zugrundeliegenden Repräsentation erzeugt die Regel zur Stimmhaftigkeit von Verschlußlauten [sároda], was die Vokaltilgungsregel zu [sárda] reduziert. Ausgehend von [tif],nicht rennen' und [téso] ,nicht schwimmen' ist es klar, daß die Negation beim Verb durch das Präfix [t] bezeichnet wird. Fügt man dieses Präfix [kínap],essen' hinzu, so erhält man die zugrunde151
liegende Repräsentation [tkinap], deren phonetische Realisierung [etkinap] ist. Andere negative Formen wie [estime] .nicht laufen' und festarot] .nicht schlafen' zeigen, daß das Vorkommen eines [e] eine allgemeine Erscheinung ist, nicht eine Besonderheit von [kmap]. Folglich können wir eine Vokal-Einfügungsregel annehmen, die vor einer Konsonantenhäufung, mit der sonst ein Wort beginnen würde, [e] einfügt. Die Vokal-Einfügung wird also auf die zugrundeliegende Repräsentation [tkinap] angewendet und verknüpft sie mit der phonetischen Folge [etkinap]. [etkunba] ,aß nicht', die negative Präteritalform von [kinap],essen', muß die zugrundeliegende Repräsentation [tkinapa] besitzen, von der sie durch verschiedene Regeln, darunter die Vokal-Einfügung, abgeleitet wird. Diese Derivation ist in Abb. 6.5 dargestellt.
ZUGRUNDELIEGENDE REPRÄSENTATION [tkfnapa] Verschlußlaut -*• stimmhaft:
[tkfnaba]
Vokaltilgung:
[tkinba]
Nasal-Assimilation:
[tkimba]
Vokal-Einfügung:
[etkfmba] PHONETISCHE REALISIERUNG
Abb. 6.5
Da ,laufen' [siime] heißt, muß die zugrundeliegende Repräsentation von .nicht laufen' [tsune] heißen, vorausgesetzt, das Verb ist regelmäßig. Natürlich muß die Vokal-Einfugungsregel angewendet werden, sodaß [etsime] entsteht. Die im Datenmaterial gegebene Form für,nicht laufen' ist jedoch [estime] und nicht [etsime]. Auch [estärot], die negative Form zu [särot], zeigt die Häufung [st], wo wir eigentlich [ts] erwarten würden. Offensichtlich besitzt also diese Sprache eine Regel, die unter bestimmten Bedingungen die Reihenfolge der Segmente [ts] umkehrt. Wir wollen diese Regel die Metathese-Regel nennen; M e t a t h e s e ist der Terminus, den man für die Veränderung der Reihenfolge der Segmente verwendet. 152
Die Metathese leitet [estime] .nicht laufen' und [estârot],nicht schlafen' aus [etsime] und [etsârot] ab. Wir haben nun fünf Regeln gefunden, darunter solche, die Segmente einfügen oder tilgen, die Segmente verändern und die Reihenfolge von Segmenten ändern. Das Datenmaterial bezeugt noch eine weitere Regel, die die Position der Betonung bestimmt. Die Position der Betonung ist keine individuelle Eigenschaft von einzelnen Wörtern oder Morphemen; sie ist völlig regelmäßig. Die Betonung fällt immer auf den ersten Vokal der Wurzel, nie auf den zweiten Vokal der Wurzel oder auf ein Suffix. Deshalb finden wir Formen wie [béb], [sômbib] und [etkinap], aber keine wie [sombib], [etkinap] oder [étkinap]. Die Betonung wird aus diesem Grund in den abstraktesten zugrundeliegenden phonologischen Repräsentationen nicht angegeben, weil sie nicht distinktiv ist. Vielmehr wird sie durch die allgemeine Regel zur Position de Betonung eingeführt. Die Derivation von [estima] ,lief nicht' und [estârda],schlief nicht', die in Abb. 6.6 skizziert ist, gibt weitere Illustration für die von uns untersuchten Regeln.
ZUGRUNDELIEGENDE PHONOLOGISCHE REPRÄSENTATION [tsimea]
[tsarota]
Betonungsangabe:
[tsfmea]
[tsarota]
Verschlußlaut -*• stimmh.:
(nicht anwendbar)
[tsäroda]
Vokaltilgung:
[tsima]
[tsârda]
Nasal-Assimilation:
(nicht anwendbar)
(nicht anwendbar)
Vokal-Einfügung:
[etsima]
[etsârda]
Metathese:
[estima]
[estârda]
PHONETISCHE REALISIERUNG
Abb. 6.6 153
Die Abstraktheit phonologischer Systeme Die vorangegangenen Beispiele sollten andeuten, wie abstrakt die Beziehung zwischen zugrundeliegenden phonologischen Repräsentationen und deren phonetischen Realisierungen sein kann. Die Derivation einer phonetischen Folge aus ihrer zugrundeliegenden Repräsentation ist das kumulative Ergebnis der Anwendung einer langen Serie von phonologischen Regeln. In der Tat umfassen solche Derivationen sehr oft viel längere Regelfolgen als die von uns untersuchten, einigermaßen einfachen Fälle. Wir erkennen auch, daß scheinbare individuelle Besonderheiten und Unregelmäßigkeiten sich oft als Ergebnisse völlig regelmäßiger phonologischer Prozesse erweisen. Um diese Regelmäßigkeiten aufzudecken, müssen wir das phonologische System einer Sprache verstehen als ein System von Regeln, die phonetische Realisierungen aus sehr abstrakten zugrundeliegenden Repräsentationen ableiten. Recht häufig gibt es in den zugrundeliegenden Repräsentationen Regelmäßigkeiten, die durch die Anwendung von phonologischen Regeln in der phonetischen Ebene überdeckt werden. Ähnliches haben wir auch aus unserer Untersuchung von syntaktischen Systemen gelernt. Phonologische und syntaktische Systeme sind sich darüberhinaus darin ähnlich, daß ihre Regeln manchmal in einer bestimmten Reihenfolge angewendet werden müssen. In der Derivation von fkunba] aus der zugrundeliegenden Repräsentation [kinapa] wird etwa die Vokaltilgung vor der Nasal-Assimilation angewendet. Erst, wenn die Festlegung der BetonungsPosition, die Regel zur Stimmhaftigkeit von Verschlußlauten und die Vokaltilgung die Form [kinba] erzeugt haben, stehen der Nasal [n] und der bilabiale Verschlußlaut [b] nebeneinander, was die Assimilierung des Nasals bewirkt. Nehmen wir ein einfaches Beispiel aus der englischen Syntax: Die Konkordanz zwischen Subjekt und Verb muß hergestellt sein, bevor die Relativisierung möglich ist. The flowers which are on the table wird z. B. gebildet, indem man nach the flowers die Struktur einbettet, die The flowers are on the table zugrundeliegt. Die Relativisierung reduziert the flowers in der eingebetteten Struktur auf which; aber zuerst muß die Konkordanz-Regel für Subjekt und Verb angewendet werden, so daß das Verb zur Übereinstimmung mit seinem Subjekt the flowers nach Numerus und Person gekennzeichnet wird. Würde hingegen die Reduktion von the flowers auf which zuerst stattfinden, so wäre das Subjekt im Plural, mit dem are übereinstimmen muß, nicht mehr vorhanden, und die Konkordanz könnte nicht mehr richtig gekennzeichnet werden. Da phonologische Regeln in der Lage sind, die Identität von Segmen154
ten zu verändern, sowie Segmente einzufügen und zu tilgen, kann das in einer Sprache verwendete Lautinventar in den zugrundeliegenden Repräsentationen verschieden sein von dem der phonetischen Realisierungen. Das heißt: manche Segmenttypen kommen vielleicht in zugrundeliegenden phonologischen Repräsentationen vor, obgleich sie nie sichtbar auf der phonetischen Ebene realisiert werden oder umgekehrt. Wenn wir also von den Lauten einer Sprache reden, so können wir uns entweder auf sichtbar vorkommende phonetische Einheiten beziehen oder aber auf die abstrakten Einheiten von zugrundeliegenden Repräsentationen, und es ist natürlich notwendig, daß man klar sagt, wovon man redet. Bei der Aufzählung der Laute des Deutschen bzw. Englischen im Rahmen unserer Untersuchung der artikulatorischen Phonetik haben wir uns auf Laute bezogen, die auf der phonetischen Ebene vorkommen (wobei wir von gewissen kleineren phonetischen Variationen abgesehen haben).
Morphologie Wir haben in Kapitel 4 gesehen, daß ein Morphem mehrere verschiedene phonetische Realisierungen haben kann. Das Pluralmorphem des Englischen erscheint in verschiedener Form, als [z], [s] und [az], und es kommt noch in anderen phonetischen Formen vor (so in children, sheep, men usw.). Der Terminus Morphologie bezieht sich auf diejenigen Aspekte phonologischer Systeme, die Unterschiede in der phonetischen Realisierung von Morphemen erklären, obgleich es keine scharfe Trennungslinie zwischen Morphologie und der restlichen Phonologie gibt. Im Bereich der Morphologie pflegen die Sprachen ein beträchtliches Ausmaß an Unregelmäßigkeit zu zeigen, vor allem wenn man nicht unter die Oberfläche hinabschaut. Warum sollte der Plural von child gerade children sein und nicht das zu erwartende childs? Warum heißt es women und sheep und nicht wotnans und sheeps? Warum ist das Präteritum von eat das unregelmäßige ate und nicht das regelmäßige eated. Man kann auch keinen prinzipiellen Grund dafür erkennen, warum es went anstelle von goed heißen sollte. Für diejenigen Formen, die wirklich unregelmäßig sind, sind besondere Regeln notwendig. Eine Regel des Englischen muß z. B. angeben, daß die Folge eat+PRÄT als ate realisiert wird. Da es sich um die Feststellung einer Unregelmäßigkeit handelt, gilt diese Regel nicht für alle Morpheme des Englischen; es ist eine spezielle Regel, die nur für ein Morphem gilt und für dieses Morphem einzeln gelernt werden muß. 155
Ebenso muß der Sprecher des Englischen als willkürliche Tatsache für das Morphem woman lernen, daß woman+PLURAL als women realisiert wird; die dazu notwendige Regel wird dem Sprecher nichts nützen, wenn er die Pluralform anderer Morpheme vorhersagen will. (Der Plural von man wird anders gebildet - man verwechsle nicht den Unterschied von Schreibweise und Aussprache!) Phonologische Regeln, die auf nur ein Morphem oder eine Morphemfolge angewendet werden, bilden das eine Extrem des Kontinuums, das als anderes Extrem allgemeine phonologische Regeln besitzt, die für alle Morpheme der Sprache gelten. Zwischen den Extremen existieren Regeln, die morphologische Veränderungen angeben, die weder völlig einmalig noch völlig regelmäßig sind. Diese Regeln beziehen sich auf Morphemklassen, aber nicht auf alle Morpheme einer Sprache. Eine Anzahl von Verben des Englischen wird z. B. dadurch ins Präteritum gesetzt, daß der Präsensvokal [1] durch [ae] ersetzt wird. Die Regel, die PRÄTm dieser Weise realisiert, gilt nicht für alle Verben der Sprache, beschränkt sich aber auch nicht auf nur ein Verb. Diese Regel erklärt die Präteritalformen sat, spat, rang, sang, swam, began, drank, shrank, stank und sprang. Eine Anzahl von Verben werden ins Präteritum gesetzt, indem man für alles, was nach der anlautenden Konsonantenhäufung kommt, durch [Dt] ersetzt: brought, bought, caught, fought, sought, thought und taught. Die Bildung des Präteritums bei diesen Verben ist eine Teilregularität der englischen Morphologie und kann durch eine einzige Regel ausgedrückt werden, die für alle diese Fälle gilt. Wenn diese Verben völlig unregelmäßig wären, würde jedes Verb sein Präteritum auf eine besondere, individuelle Weise bilden, und jedes Verb würde eine besondere Regel erfordern wie bei eat und go. Es kommt jedoch sehr häufig vor, daß scheinbare morphologische Unregelmäßigkeiten sich als völlig regelmäßige Erscheinungen erweisen, wenn sie sorgfältig in ihrer Beziehung zum gesamten phonologischen System untersucht werden. Betrachten Sie z. B. die englischen Pluralformen auf faz], [s] und [z]. [sz] bezeichnet den Plural in Wörtern wie glasses, sizes, bunches, judges, bushes und rouges, [s] kommt in Pluralformen wie hips, bits, books, fifes und births vor. [z] bezeichnet den Plural in Wörtern wie ribs, beds, eggs, elms, bins, bars, pills, ¡oves, ways und bras. Die jeweilige Wahl von [az], [s] oder [z] zur Bezeichnung des Plurals ist in dieser Menge von Wörtern alles andere als zufällig. Beachten Sie, daß [sz] nur verwendet wird, wenn der letzte Laut der Substantivwurzel [s], [z], l£|> Dl. N oder [Í] ist. Endet das Substantiv auf einen anderen Laut, so wird die Pluralform durch die Stimmgebung bestimmt; [s] kommt nur 156
nach stimmlosen Segmenten vor, [z] nur nach stimmhaften Segmenten. Für alle diese Wörter können wir als zugrundeliegende phonologische Repräsentation des Pluralmorphems [z] ansetzen. Glasses, bunches, hips und books haben z. B. die zugrundeliegenden Repräsentationen [glaesz], [bAnCz], [hipz] und [bukz], genau parallel zu ribs und bras, [rtbz] und [braz]. Die Varianten [az] und [s] werden von dem zugrundeliegenden [z] durch allgemeine phonologische Regeln des Englischen abgeleitet, Regeln, die auch noch verschiedene andere phonologische Erscheinungen erklären. Glasses und bunches werden phonetisch als [glaesaz] und [bAnCaz] realisiert. Diese phonetischen Formen werden von den zugrundeliegenden Repräsentationen [glassz] und [bAnCz] durch eine Regel abgeleitet, die den Vokal [a] zwischen dem letzten Segment des Substantivs und dem Suffix [z] einfügt. Diese Regel gilt allgemein; sie fügt [a] immer dann zwischen einer Wurzel und einem Suffix ein, wenn das Suffix aus einem einzelnen Obstruenten besteht, und die Wurzel auf einen Obstruenten der entsprechenden Art ausgeht. (Ein Obstruent ist ein Verschlußlaut, ein Reibelaut oder eine Affrikate - lauter Laute, die durch Behinderung des entweichenden Luftstroms gebildet werden.) In dem hier zutreffenden Sinne sind [s z£ J $ Obstruenten von grundsätzlich gleichem Typ wie [z]. Sie sind Reibelaute, die am Zahndamm oder Palatum gebildet werden (Affrikaten wie [6 J] enden, wie Sie sich erinnern werden, nach einem verschlußlautähnlichen Ansatz auf einen Reibelaut). Die Folgen [sz zztz ]z Iz 2z] werden also durch die [sj-Einfügungsregel jeweils zu [saz zaz Caz jez Saz 2az] verändert, womit die phonetischen Realisierungen von glasses, sizes, bunches, judges, bushes und rouges bestimmt sind. Das Possessivmorphem und die Verbalendung der dritten Person Singular sind ebenfalls Suffixe, deren Grundform [z] ist, was Wörter wie Bill's, Ed's, goes und stabs zeigen, phonetisch geschrieben [bilz], [edz], [gowz] und [staebz]. Die zugrundeliegenden Repräsentationen von Chris's und reaches sind also [knsz] und [rife], parallel den oben angeführten Wörtern. Da die Regel, die [a] einfügt, eine allgemeine Regel ist, die nicht nur auf das Pluralmorphem beschränkt ist, wird sie automatisch auf diese zugrundeliegenden Repräsentationen angewendet und ergibt die korrekten phonetischen Realisierungen [krtsaz] und [riöaz]. Das Vorhandensein der [3]-Einfügungsregel wird weiter bestätigt durch die verschiedenen Formen des Präteritaemorphems. Seine zugrundeliegende Form ist [d], die sichtbar erscheint in Wörtern wie bribed [braybd] und freed [frid]. Die zugrundeliegenden Repräsentationen von rotted und raided sind dem157
nach [ratd] und [reydd]; diese werden zu [ratad] und [reydsd] verändert. Die [ 3]-Einfügungsregel wird deshalb zur Bildung dieser Lautfolgen angewendet, weil das Endsegment der Wurzel ein Obstruent von grundsätzlich gleicher Art wie das Suffix ist (ein alveolarer Verschlußlaut). Die [az]-Variante des Pluralmorphems wird durch eine allgemeine phonologische Regel des Englischen von der zugrundeliegenden Form [z] abgeleitet, eine Regel, die gleichzeitig noch eine ganze Anzahl von anderen Erscheinungen erklärt. Entsprechendes gilt auch für die [s]-Variante, die nach stimmlosen Konsonanten außer [s 6 5] erscheint. Wir haben schon festgestellt, daß alle Konsonanten einer Konsonantenhäufung stimmlos sind, wenn der erste stimmlos ist. Also ist [eksit] ein mögliches englisches Wort, [ekzit] nicht. Dieses Prinzip gibt auch an, daß das zweite Segment von Stack stimmlos ist, weil es auf den stimmlosen Reibelaut [s] folgt. Es ist klar, daß diese Regel auch auf die zugrundeliegenden Repräsentationen von hips und books, [hipz] und [bukz], angewendet werden muß, so daß sich die phonetischen Realisierungen [htpz] und [buks] ergeben. Diese Regel erklärt auch Varianten des Possessivmorphems, der Endung der dritten Person Singular und des Präteritalmorphems. Da diese die entsprechenden Basisformen [z], [z] und [d] besitzen, müssen die zugrundeliegenden Repräsentationen von Nat's, kicks und kicked [naetz], [ktkz] und [ktkd] lauten. Die stimmlosen Endkonsonanten der Wurzeln bewirken, daß die Endungen auch stimmlos werden, und so erklären sich die phonetischen Realisierungen [naets], [kiks] und [kikt]. Es werden also alle drei Pluralendungen [az s z] von derselben zugrundeliegenden Repräsentation abgeleitet. Auf diese abstrakte Repräsentation werden allgemeine phonologische Regeln angewendet, die die Vielfalt an der Oberfläche bewirken. Zu beachten ist, daß die [a]-Einfügungsregel vor der Regel zur Angabe der Stimmlosigkeit angewendet werden muß; wären die Regeln nicht in dieser Reihenfolge angeordnet, würden falsche Ergebnisse Zustandekommen. Glasses würde z. B. die phonetische Form [glaes9s] zugewiesen statt [glaesaz], da die zugrundeliegende Repräsentation [glaesz] zu [glaess] verändert werden würde, bevor die [3]-Einfügungsregel angewendet würde. Das hypothetische Datenmaterial, das wir im vorigen Abschnitt untersucht haben, ist eine weitere Illustration dafür, wie scheinbare morphologische Unregelmäßigkeiten sich manchmal als völlig regelmäßige Erscheinungen erweisen, wenn man sie in Beziehung zum gesamten phonologischen System sieht. Bei einer isolierten Untersuchung des phonetischen Datenmaterials 158
würden wir z. B. wenig Regelmäßigkeit in der Bildung des Präteritums der Verben finden: [if] [éso] [kinap] [sime] [sárot]
,rennen' .schwimmen' ,essen' ,laufen' .schlafen'
[ifa] [ésa] [kímba] [sima] [sárda]
.rannte' .schwamm' ,aß' .lief .schlief
[if] bildete das Präteritum durch Anfügen von [a]; [éso] durch Ersetzen des [o] durch [a]; [kinap] durch Anfügen des [a] und Veränderung des [nap] zu [mb]; [sime] durch Ersetzen des [e] durch [a]; [sárot] durch Anfügen des [a] und die Veränderung von [ot] zu [d]. Bei genauerer Untersuchung haben wir jedoch entdeckt, daß all diese Verben das Präteritum auf genau dieselbe Weise bilden, nämlich durch Suffigierung des [a]. Das Zusammenwirken der so erlangten zugrundeliegenden Repräsentationen mit allgemeinen phonologischen Regeln bewirkt die Vielfalt der Oberfläche, die im phonetischen Datenmaterial zu beoachten ist. Um die morphologischen Muster einer Sprache zu verstehen, darf man sich deshalb nicht mit der Untersuchung des phonetischen Datenmaterials begnügen. Die phonologischen Mechanismen, die hier mit hereinwirken, können nur entdeckt werden, wenn man unter die phonetische Oberfläche schaut und das phonologische System als eine integrierte Folge von Regeln versteht, die auf sehr abstrakte zugrundeliegende Repräsentationen angewendet werden. Wenn man das tut, erkennt man, daß sich die Verschiedenheit der Oberfläche häufig auf völlig regelhafte Weise aus einer zugrundeliegenden einheitlichen Form ergibt.
159
III Sprachverwandtschaft
7. Sprachwandel
Entlehnung Lexikalische Entlehnung Lebende Sprachen bleiben nie stehen. Jede Sprache ist das Ergebnis eines Wandels und wandelt sich weiterhin, solange sie gesprochen wird. Großenteils entgehen diese Veränderungen unserer Aufmerksamkeit, wenn sie vor sich gehen. Sie sind klein genug oder graduell genug, um unbemerkbar zu bleiben. Shakespeares Englisch ist für moderne Leser schwer zu verstehen, und ohne besondere Ausbildung kann man Chaucer fast gar nicht verstehen. Einer der Umstände, unter denen Sprache sich wandelt, ist der Einfluß anderer Sprachen. So war etwa zu einem Bestimmten Zeitpunkt das Wort patio ,offener Lichthof nicht im englischen Wortschatz enthalten. Jetzt gehört es dazu. Das Hinzufügen dieses Wortes zum englischen Lexikon bedeutet also eine Veränderung im Sprachsystem, wenn auch eine geringfügige. Darüberhinaus wurde das Wort patio von englischen Sprechern nicht aus der Luft gegriffen. Bevor es im Englischen gebräuchlich wurde, war es ein spanisches Wort mit etwa der gleichen Bedeutung (und ist es heute noch). Daß patio dem englischen Wortschatz hinzugefügt wurde, geht eindeutig auf spanischen Einfluß zurück. Sprecher, die das Wort vom Spanischen her kannten, begannen es im Englischen zu gebrauchen. Seine Verwendung verbreitete sich, und heute ist es ein durchaus gebräuchliches Wort der englischen Sprache. Hätte es dieses Wort im Spanischen nicht gegeben oder wären Sprecher des Englischen nie damit in Berührung geraten, wäre es nicht Teil des Englischen geworden. Kurz: patio wurde aus dem Spanischen ins Englische entlehnt. Die Entlehnung ist eine sehr häufige sprachliche Erscheinung. Höchstwahrscheinlich ist keine Sprache, deren Sprecher jemals mit irgendeiner anderen Sprache in Berührung geraten sind, völlig frei von entlehnten Formen. Die Sprachen sind jedoch grundsatzlich verschieden im Hinblick 163
auf den Anteil jener lexikalischen Einheiten in ihrem Wortschatz, die auf Entlehnung zurückgehen. Albanisch z. B. besitzt so viele entlehnte Wörter in seinem Lexikon, daß nur ein paar Hundert einheimischer Wörter übrigbleiben. Obgleich das Englische viel weniger entlehnt hat als das Albanische, wird es oft als eine Sprache angeführt, die viel entlehnt hat, da über die Hälfte des englischen Lexikons fremder Herkunft ist. Im Gegensatz dazu neigen die amerikanischen Indianersprachen der athabaskischen Sprachfamilie dazu, wenig zu entlehnen. Die Gründe für diese Unterschiede zwischen den Sprachen liegen wohl eher im historischen und kulturellen als im sprachlichen Bereich. Entlehnung ist nie eine sprachliche Notwendigkeit, weil es immer möglich ist, den Gebrauch von vorhandenen lexikalischen Einheiten auszuweiten oder zu verändern, um neue kommunikative Notwendigkeiten zu bewältigen. Eine interessante Variante der lexikalischen Entlehnung ist eine Erscheinung, die man Lehnübersetzung nennt. Der englische Ausdruck Thatgoes without saying ,Das versteht sich von selbst' ist z. B. eine wörtliche Übersetzung des französischen Qa va sans dire. Was die Sprecher des Englischen hier entlehnt haben, sind keine lexikalischen Einheiten, sondern ein Muster für ihre metaphorische Kombination zum Ausdruck eines bestimmten Inhalts. Das Wort skyscraper ist ein weiteres Beispiel. Das Französische, mit dem Begriff gratte-ciel, und das Spanische, mit rascacielos, haben aus dem Englischen die Metapher ,den Himmel kratzen' entlehnt, um die Vorstellung eines sehr hohen Gebäudes wiederzugeben. Das deutsche Wort Wolkenkratzer unterscheidet sich nur darin, daß statt der Form .Himmel' die Form .Wolken' erscheint.
Syntaktische und phonologische Entlehnung Lexikalische Einheiten werden verhältnismäßig leicht entlehnt. Das ist weiter nicht verwunderlich; eine lexikalische Einheit mehr oder weniger bedeutet nicht viel für eine Sprache, da das Lexikon größtenteils nur eine Liste von unabhängigen Elementen ist. Veränderungen in der Syntax oder Phonologie einer Sprache können auch auf Entlehnung zurückgehen, obgleich dies seltener vorkommt. Das hängt vielleicht damit zusammen, daß ein syntaktisches oder phonologisches System aus einer integrierten Folge von Regeln besteht, so daß die Veränderung einer Regel einschneidende Konsequenzen in anderen Teilen des Systems haben könnte. Das Ausmaß, in dem sich Sprachen im Hinblick auf Syntax und Phonologie beeinflus164
sen können, kennt man nicht genau, aber es gibt Fälle, an denen sich das Vorhandensein eines derartigen Einflusses nachweisen läßt. Als Beispiel für die Syntax können wir die Sprachen der Balkan-Halbinsel, Albanisch, Bulgarisch, Griechisch und Rumänisch, anführen. Sie ähneln sich alle syntaktisch darin, daß der Gebrauch von Infinitivsätzen stark eingeschränkt ist. Manche Balkansprachen haben sogar überhaupt keine Infinitive. Statt Die Kinder wollen gehen würde man eine Wendung wie Die Kinder wollen, daß sie gehen verwenden. Die Sprachen sind untereinander verwandt, wenn auch zum Teil nur sehr indirekt, und es besteht kein Zweifel, daß dieser gemeinsame syntaktische Zug auf gegenseitige Entlehnung zurückgeht. Die amerikanischen Indianersprachen des pazifischen Nordwestens geben ein Beispiel für Entlehnung im Bereich der Phonologie ab. Viele Sprachen dieser Gegend besitzen glottalisierte Konsonanten; der Prozentsatz ist viel höher als bei den Sprachen der Welt im allgemeinen, und trotzdem sind die Sprachen, die glottalisierte Konsonanten zeigen, nicht verwandt. Die Erklärung dürfte sein, daß die Glottalisierung sich unter den Stämmen durch Entlehnung verbreitet hat. Ein anderes Beispiel für phonologische Entlehnung findet man in den vielen indoeuropäischen Sprachen Indiens, die r e t r o f l e x e Konsonanten besitzen, d. h. Konsonanten, die mit der Zungenspitze am Palatum gebildet werden. Es ist ziemlich sicher, daß diese Laute sich in den indoeuropäischen Sprachen unter dem Einfluß der Familie der drawidischen Sprachen entwickelt haben, die auch in Indien gesprochen werden und die retroflexe Konsonanten verwenden.
Gründe für die
Entlehnung
Ein häufiger Grund für die Entlehnung ist die Notwendigkeit, Wörter für neue Gegenstände, Begriffe und Orte zu finden. Es ist einfacher, ein vorhandenes Wort aus einer Sprache zu entlehnen, als selbst eines zu erfinden. Viele Ortsnamen in Nordamerika stammen z. B. aus Indianersprachen: Mississippi, Michigan, Chicago, Dakota, Oklahoma, Kentucky, Manhattan und Waukegan, um nur einige anzuführen. Von den amerikanischen Indianern stammen auch, zusammen mit den Gegenständen, die Wörter totem, wampum, moccasin und tomahawk. Von den Sprachen der Ureinwohner Australiens stammen die Wörter kangaroo und wombat. Das Wort gnu, das sich auf eine afrikanische Antilopenart bezieht, ist aus den afrikanischen Bantu-Sprachen entlehnt. 165
Die Wege der lexikalischen Entlehnung spiegeln bis zu einem gewissen Grad die Wege des kulturellen Einflusses wider. So gehört z. B. ein großer Prozentsatz der arabischen Wörter im Englischen dem Bereich der Naturwissenschaft an: zero, cipher, zenith, alchemy, algebra, nadir, alcohol, bismuth und alkali. Diese Entlehnungen, die durch das Spanische ins Englische gelangten, bezeugen den arabischen Einfluß in den Naturwissenschaften und der Mathematik während des frühen Mittelalters. Die Bedeutung des italienischen Einflusses im Bereich der Musik und der anderen Künste wird ersichtlich aus der langen Liste von italienischen Lehnwörtern auf diesem Gebiet: opera, tempo, adagio, soprano, piano, sonata, scherzo, virtuoso, sonnet, fresco, miniature, dilettante, balcony, cornice, corridor, colonnade, mezzanine, parapet und niche. Nach der normannischen Eroberung gelangten große Mengen von Lehnwörtern aus dem Französischen ins Englische. Unter diesen Lehnwörtern finden sich Dutzende von Termini aus den Bereichen des Regierungswesens des Militärs, des Rechtswesens und der Religion, was die Tatsache widerspiegelt, daß die normannischen Franzosen als die Eroberer einen vorherrschenden Einfluß in diesen Bereichen ausübten. Zu den Begriffen aus dem Regierungswortschatz, die aus dem Französischen ins Englische gelangten, gehören: Crown, power, state, reign, country, peer, court, duke, duchess, prince, realm, sovereign, minister, chancellor, council, authority, parliament, baron und nation. Lehnwörter aus dem militärischen Bereich sind battle, army, war, peace, lance, banner, ensign, officer, lieutenant, vessel, navy, admiral, soldier, sergeant, troops, arms, armor, assault, siege, enemy, challenge, gallant, march, company, guard, force und danger. Das englische Rechtsvokabular wurde bereichert um jury, judge, plaintiff, accuse, crime, justice, privilege, damage, traitor, felony, summon, defendant, sue, attorney, session, fee, plead, suit und property. Aus dem Bereich der Religion und der Moral gehören hierher mercy, cruel, vice, nature, blame, save, pray, preach, angel, religion, virgin, saint, tempt, grace, pity, trinity, service, savior, relic, abbey, cloister, clergy, parish, baptism, friar, altar, miracle, sermon, sacrifice, virtue, charity, chaste, covet und lechery. Dem Einströmen von französischen Lehnwörtern ins Englische während der normannischen Periode entspricht kein vergleichbarer Fluß von Lehnwörtern in der umgekehrten Richtung. Der Faktor des Prestiges, der in Kapital 3 kurz erwähnt worden war, spielt zweifellos die entscheidende Rolle. Da die Franzosen die obere Klasse bildeten, mußten Sprecher des Englischen, die den sozialen Aufstieg suchten, natürlich Französisch lernen. Der Gebrauch französischer Wörter in englischer Rede wurde allge166
mein üblich wegen des damit verbundenen Prestigegewinns. Die Franzosen dagegen spürten keinen entsprechenden Druck, Englisch zu lernen, das ja schließlich nur die Sprache der Volksmassen war. Der Prestigefaktor ist ein häufiger Anlaß für lexikalische Entlehnung. Die französische Kultur stand auch im zaristischen Rußland in hohem Ansehen. Es war für die Mitglieder der besten Gesellschaft allgemein üblich, Französisch statt Russisch zu sprechen, und französische Ausdrücke drangen in russische Gespräche ein. Als Folge davon enthält das moderne Russisch eine Vielzahl von Entlehnungen aus dem Französischen. Die Macht und Bedeutung Amerikas in der Welt von heute haben eine Entlehnungswelle eingeleitet, die der im normannischen England entgegengesetzt verläuft. Die Anzahl der englischen Lehnwörter im modernen Französisch nimmt derart rasch zu, daß es bei manchen Leuten zu einem Grund zur Beunruhigung wird (obgleich nicht recht einzusehen ist, warum eine natürliche Erscheinung wie die lexikalische Entlehnung Grund zur Beunruhigung geben sollte). Symptomatisch für diese moderne ,Anglomanie' sind Dutzende von Ausdrücken wie snack bar, self-service, parking .Parkplatz', check list, deep freeze, pullover, living ,Wohnzimmer' expressway, pinup, whisky, Sandwich, weekend und dancing .Nachtlokal'. In einer gesungenen Werbung für bestimmte alkoholfreie Getränke, die häufig von einem Sender in Tijuana gesendet wird, folgt auf die Zeile a cada gusto, was ,für jeden Geschmack' bedeutet, unmittelbar die Zeile a cada taste. Man ist offenbar der Meinung, daß das Ansehen eines englischen Wortes solche Mexikaner, die modern und kultiviert wirken wollen, dazu bringen kann, die betreffenden Waren zu kaufen. Latein und Griechisch standen in der Welt der Gelehrten im Mittelalter in hohem Ansehen. Deshalb sind seit der Renaissance immer wieder Wörter aus dem Lateinischen und Griechischen ins Englische (oft über das Französische) und in andere europäische Sprachen gelangt. Sie stammen keineswegs alle aus klassischen Texten. Viele sind dadurch gebildet worden, daß man lateinische oder griechische Morpheme nach dem Muster der betreffenden Sprache oder auch nur irgendwie kombinierte, so daß das Ergebnis einen gelehrten Anstrich bekam. Wörter, die auf diese Art aus klassischen Quellen eingeführt wurden, werden manchmal gelehrte B i l d u n g e n genannt (engl.: learned words, frz.: mots savants)\ tausende von ihnen können in jedem großen englischen Wörterbuch gefunden werden. Am meisten konzentrieren sich gelehrte Bildungen wahrscheinlich im Wortschatz der Naturwissenschaften und anderer wissenschaftlicher Disziplinen. Selbst die Bezeichnungen für diese Disziplinen sind häufig aus 167
den klassischen Sprachen entlehnt: sociology, psychology, anthropology, philosophy, philology, biology. Gelehrte Bildungen beschränken sich aber keineswegs auf diesen Bereich. Hunderte von Wörtern der englischen Alltagssprache lassen sich aufs Griechische und Lateinische zurückführen. Um nur eine Gruppe von Beispielen zu nennen: betrachten Sie einmal die folgenden gewöhnlichen englischen Wörter mit dem lateinischen Morphem ex ,aus, von': exact, exaggerate, exalt, exasperate, excerpt, exclude, excrete, excursion, execute, exempt, exert, exhaust, exhibit, expand, expect, expel, explain, explicit, explode, explore, export, extend, exterminate, extinct, extort, exude. Gelehrte Bildungen sind im Englischen so häufig, daß eine Anzahl von lateinischen und griechischen Morphemen produktiv geworden ist. Diese Morpheme können mit Wurzeln jeder beliebigen Herkunft kombiniert werden, nicht nur mit solchen aus den klassichen Sprachen. Ex-husband und ex-wife zeigen z. B. das lateinische ex als Präfix zu germanischen Formen. Das Suffix able/ible wird in folgenden Wörtern mit einheimischen Wurzeln kombiniert: answerable, eatable, bearable, laughable und salable.
Auswirkungen der Entlehnung Normalerweise wird ein entlehntes Wort dem phonologischen System der entlehnenden Sprache angepaßt. Das englische Wort rendezvous stammt aus dem Französischen, aber es gehorcht den phonologischen Prinzipien des Englischen. Es wird mit dem englischen [r] und nicht mit dem französischen ausgesprochen: der erste Vokal ist nicht-nasal, obgleich er im Französischen nasaliert ist usw. Der Grund dafür ist offensichtlich: Sprecher des Englischen können Englisch, aber meist kein Französisch. Lehnwörter werden jedoch nicht immer dem phonologischen System der entlehnenden Sprache völlig angepaßt. Dieselben Leute, die hie und da aus Prestige-Gründen französische Wörter in ihre Rede einfließen lassen, werden, aus demselben Grund, vielleicht versuchen, die französische Aussprache zu bewahren. Wenn genug Sprecher mit der Sprache, aus der entlehnt wird, vertraut sind oder wenn eine sehr große Zahl von Wörtern entlehnt wird, können die Lehnwörter als phonologisches trojanisches Pferd wirken, mit dessen Hilfe sich neue Laute in das Lautinventar der entlehnenden Sprache einschleichen können. In der Tat sind auf genau diese Weise die stimmhaften Reibelaute [v z] aus dem Französischen ins Englische eingedrungen. Es hatte sie vorher schon als phonetische Varianten anderer Lauttypen gegeben, aber nicht als distinktive Laute. Lehn168
Wörter wie very, veal, zeal und zest waren für ihre Einführung verantwortlich. Ein anderes Ergebnis starker lexikalischer Entlehnung kann die Aufteilung des Vokabulars im Hinblick auf das Wirken der phonologischen Regeln sein. Das Türkische z. B. besitzt Hunderte von arabischen Lehnwörtern, von denen die meisten nicht den phonologischen Regeln der V o k a l h a r m o n i e folgen, die für einheimische türkische Wörter gilt. (Vokalharmonie bedeutet, grob gesprochen, daß die Vokale eines Wortes entweder alle velar oder alle palatal gebildet werden.) Folglich verhalten sich die arabischen Lehnwörter im Hinblick auf die phonologischen Regeln des Türkischen auf eine bestimmte Weise, während sich die einheimischen Wörter auf eine andere Weise verhalten. Das Kind, das türkisch lernt, muß für jedes Wort, das es neu hinzuerwirbt, lernen, in welche Klasse es gehört, denn diese Information bestimmt das Verhalten des Wortes im Hinblick auf die phonologischen Regeln und ist so teilweise verantwortlich für die Bestimmung seiner Aussprache. Eine vergleichbare Aufteüung des Wortschatzes gibt es in vielen anderen Sprachen auch. Die Entlehnung von lexikalischen Einheiten kann also einen wichtigen Einfluß auf das phonologische System einer Sprache haben. Man kann sogar die Hypothese wagen, daß dies der entscheidende Mechanismus ist, durch den Sprachen sich gegenseitig phonologisch beeinflussen.
Innerer Wandel
Veränderungen im Wortschatz Nicht alle Veränderungen in Sprachsystemen kommen durch den Einfluß anderer Sprachen zustande. Entlehnung kann in allen ihren Formen als V e r ä n d e r u n g v o n a u ß e n (external change) beschrieben werden, da sie sich aus einem sprachlichen Einfluß von außen ergibt. Ohne zu behaupten, daß es eine saubere Zweiteilung gibt, können wir Veränderungen, die nicht durch Entlehnung bewirkt werden, als i n n e r e n W a n d e l (internal change) bezeichnen. Innerer Wandel kann auf allen Ebenen der Sprachstruktur festgestellt werden. Er betrifft einzelne lexikalische Einheiten ebenso wie allgemeine Regeln und kommt gleichermaßen im semantischen wie im syntaktischen und phonologischen System einer Sprache vor. Die einfachste Form inneren Wandels ist das Hinzukommen oder Verschwinden von lexikalischen Einheiten. Es gab einmal ein englisches Wort
169
cere, das .Wachs' bedeutete; heute ist es veraltet. Um den Begriff,Götze' auszudrücken, würde kaum ein heutiger Sprecher sich des Wortes maumet bedienen wollen, aber es gab eine Zeit, da war dieses Wort gängig. Congree übereinstimmen' (heutiges Englisch: agree) wird nicht mehr gebraucht, und das gleiche gilt für das Wort neat ,Vieh' (ein einheimisches Wort, das man nicht mit dem modernen englischen Wort neat,ordentlich' verwechseln darf, das aus dem Französischen stammt). Diese Beispiele zeigen ganz einfach, daß Wörter aus dem allgemeinen Gebrauch in Vergessenheit geraten können. Gäbe es keine schriftlichen Zeugnisse, wir wüßten gar nichts von Wörtern wie maumet und cere. Der Verlust von lexikalischen Einheiten wird uns selten bewußt. Sie verschwinden nicht plötzlich, so daß wir uns fragen würden, wo sie denn geblieben sind; der Vorgang des Veraltens geht langsam vor sich. Aus irgendeinem Grund verlieren bestimmte Wörter ihre Beliebtheit und werden weniger gebraucht; nach und nach werden sie aus den Augen verloren, bis sie schließlich, nach Jahrzehnten oder Jahrhunderten, völlig verschwinden. Wir können viele lexikalische Einheiten angeben, die im Begriff sind, in Vergessenheit zu geraten. Lo ist z. B. kein gebräuchliches Wort mehr; manche Sprecher würden es ohne seinen zweiten Partner im Gespann Lo and behold (.siehe da!') gar nicht erkennen. Fro kommt nur noch in der festen Wendung to and fro (.hin und her') vor. Verily klingt deutlich nach Bibelsprache. Nicht einmal Eigennamen und Flüche entziehen sich der Ebbe und Flut sprachlicher Mode. Heutige amerikanische Eltern nennen ihre Kinder nur selten Egbert, Bertha oder Percival. Die archaischen Flüche Zounds! oder Egad! werden nie ohne scherzhaften Beiklang verwendet. Manche dieser Ausdrücke könnten natürlich wieder Beliebtheit erlangen, aber es ist doch wohl unwahrscheinlich. In einer hochtechnisierten und komplexen Gesellschaft wie der unsrigen werden dauernd neue lexikalische Einheiten gebraucht. Wo die Entlehnung sich nicht als Möglichkeit zum Erwerb eines neuen Begriffs anbietet, gibt es noch andere Möglichkeiten. Ein neuer Begriff kann völlig neu gebildet werden, genau auf den neuen Zweck gemünzt. Eine andere Möglichkeit besteht darin, lexikalische Einheiten zu kombinieren und damit zusammengesetzte Einheiten zu bilden, die auf irgendeine Weise beschreibend oder angemessen sind. Ein dritter Weg, einen neuen Begriff bereitzustellen, ist, den Gebrauch eines alten auszuweiten und ihn damit für neue Situationen anwendbar zu machen. Von diesen drei Methoden wird die erste am seltensten angewendet. Meistens neigt man eher dazu, schon vorhandenes lexikalisches Material neu anzupassen, als völlig neues Material zu schaffen. Warenbezeichnun170
gen könnte man als einen Bereich betrachten, in dem Neubildungen für neue Produkte häufig sind, aber selbst hier beziehen sich die meisten Begriffe auf schon vorhandene lexikalische Einheiten. Die meisten Warenbezeichnungen kommen entweder von Eigennamen her (Ford, Mercedes) oder von anderen schon vorhandenen Morphemen (Rambler, Thunderbird, Mustang). Von denen, auf die dies nicht zutrifft, ist bei weitem die Mehrzahl auf ziemlich durchsichtige Weise nach dem Muster vorhandener Morpheme gebaut. Vel, Lux, Jello, Brillo und Fab z. B. zeigen große Ähnlichkeit mit velvet, luxury, gelatin, brilliant und fabulous; diese Ähnlichkeit ist alles andere als zufällig. Der Slang dürfte eine wichtige Quelle sprachlicher Erfindungen sein, wie etwa gammeln, grapschen, die Piepen, der Macker. Aber auch Slang-Ausdrücke bestehen meistens aus alten lexikalischen Einheiten in neuem semantischen Gewand. Die Bildung von komplexen lexikalischen Einheiten ist ein derart häufiges Mittel zur Schaffung neuer Wörter, daß es vielleicht ausreicht, einige wenige Beispiele zu geben. Als die Linguisten von Stammbaumstruktur, spelling pronunciation (,Aussprache nach der Schreibung'), hyperkorrekten Formen, Lehnübersetzungen, Oberflächenstruktur und Idiolekten zu reden begannen, kombinierten sie schon vorhandene lexikalische Einheiten zu komplexeren Einheiten, die als technische Termini dienten. Das Wort hippie ist keine völlige Neuschöpfung; es besteht aus dem Diminutivsuffix y/ie (wie in sonny, birdie), das an das ältere Morphem hip angefugt wurde. Entsprechend wurden neue Wörter wie beatnik, peacenik und Vietnik dadurch gebildet, daß man an ein schon vorhandenes Wort das Morphem nik anfügte, das als Teil des russischen Lehnworts sputnik in die englische Sprache gelangt war. Das Wort hamburger (ursprünglich von Hamburg) wurde von Sprechern des Englischen offensichtlich als ham+burger analysiert. Die so entstandene lexikalische Einheit burger ist die Quelle einer endlosen Zahl von Wortschöpfungen geworden, zu denen cheeseburger, pizzaburger, chiliburger, tomatoburger, mushroomburger, tunaburger, beefburger, doubleburger, steakburger und Burger Chef gehören, wobei der erste Teil der Bildung zumeist die Art des Belages zwischen den beiden Brötchenhälften bezeichnet. Die Liste von Neuschöpfungen aus altem lexikalischem Material könnte unendlich verlängert werden. Die Ausweitung von vorhandenen lexikalischen Einheiten auf neue Situationen umfaßt sowohl die metaphorische Seite der Sprache als auch den semantischen Wandel. Metaphorische Ausweitungen kommen vor in so verschiedenen Bereichen wie der naturwissenschaftlichen Terminologie (elektromagnetische Welle, Strahlung^gürte/, Solarsfurm), den Warenbe171
Zeichnungen (das amerikanische Waschmittel Salvo, der Lastwagen Opel Blitz, die amerikanische Zigarettenmarke Spring .Frühling') und dem Slang (LSD-fnp, sich jemanden angeln, bei der Polente singen). Natürlich handelt es sich nicht bei allen Ausweitungen um Metaphorik. So ist es z. B. allgemein üblich, einen Eigennamen zur Bezeichnung eines neuen Produkts zu verwenden, wie bei Kent, Newport, Salem, Chesterfield, Marlboro, Winston etc. In anderen Fällen wir* eine Bezeichnung nur deshalb gewählt, weil sie einen günstigen oder ungünstigen Beiklang hat, oder aber, um einfach irgendeine Bezeichnung zu finden. Die Bezeichnungen True und Lucky Strike wurden zweifellos wegen ihrer positiven Assoziationen als Zigarettennamen gewählt. Fuzz als Bezeichnung für die Polizei dürfte der entgegengesetzten Absicht entspringen. Der Warenname Pure Oil ist offensichtlich werbewirksam gemeint, während Shell eine willkürliche Wahl darstellt. Die metaphorische Ausweitung ist eine der Möglichkeiten, wie es zum Bedeutungswandel kommt, aber keineswegs die einzige. Bei der Polente singen war zweifellos ein sehr farbiger Ausdruck, als er neu war, aber Metaphern verblassen durch häufigen Gebrauch. Die bildliche Ausdruckskraft von singen hat mit der Bekanntheit des Ausdrucks abgenommen. Singen hat, kurz gesagt, die Bedeutung jemanden verraten' angenommen, die es von Haus aus nicht hatte. Diese Ausweitung des Gebrauchs bedeutet einen Wandel im semantischen System. Über eine Zeitspanne von Jahrhunderten hin verändern sehr viele lexikalische Einheiten einer Sprache ihre Bedeutung. Das französische Verb traire besaß einmal die allgemeine Bedeutung .ziehen'. Im modernen Französisch ist es auf die Bedeutung ,melken' beschränkt. Cuisse Oberschenkel' bedeutete ursprünglich ,Hüfte' (lateinisch coxa). Das deutsche Wort geil hatte im Mittelhochdeutschen die Bedeutung .fröhlich'. Im Englischen bedeutete nice ,hübsch' ursprünglich ,töricht'. Silly ,töricht' dagegen hatte die Bedeutung .glücklich, selig, unschuldig'. Cheek ,Wange' ist die moderne Fortsetzung des altenglischen Wortes für .Unterkiefer'. Das Wort meat bedeutete früher .Nahrung', hat aber seinen Bedeutungsbereich eingeengt und bezeichnet nur noch eine bestimmte Art von Nahrung. Bird hat eine Bedeutungserweiterung erfahren: ursprünglich hieß es junger Vogel'. Bead .Perle' bedeutete einst .Gebet'; seine heutige Bedeutung erhielt es, weil man beim Gebet die Perlen des Rosenkranzes verwendete. Es dürfte klar sein, daß es keine eindeutige Formel zur Beschreibung der Beziehung zwischen der alten und der neuen Bedeutung einer lexikalischen Einheit gibt, die einen Bedeutungswandel durchgemacht hat. Die Beziehung ist zuweilen sehr indirekt und oft nur durch außer172
sprachliche Faktoren vermittelt. Hätte es den Gegenstand Rosenkranz nicht gegeben, besäße das Wort bead nicht seine heutige Bedeutung. Eine lexikalische Einheit läßt sich als ein Bündel von semantischen, syntaktischen und phonologischen Eigenschaften beschreiben. Wir haben eben festgestellt, daß es keineswegs ungewöhnlich ist, wenn eine lexikalische Einheit sich im Hinblick auf ihre semantische Repräsentation verändert. Es mag etwas seltener sein, daß sich die syntaktische oder die phonologische Repräsentation einer lexikalischen Einheit verändert, aber auch das kommt vor. Das englische Morphem friend hat sich in seiner syntaktischen Repräsentation verändert, so daß Wendungen wie I'm friends with Harvey (.befreundet') möglich wurden. Diese Wendung ist durch syntaktische Regeln mit Harvey and I are friends verwandt. Wie auch immer die Regeln im einzelnen zu formulieren sind, es sind die gleichen Regeln, die auch die folgenden Paare von Wendungen aufeinander beziehen: Paul and Mary came / Mary came with Paul; The car and the truck collided / The truck collided with the car; The water and the oil mixed / The oil mixed with the water. Normalerweise können diese Regeln nicht angewendet werden, wenn die Verbalphrase aus be plus einer Nominalphrase besteht. Also kann Harvey and I are a team nicht auf I'm a team with Harvey bezogen sein, da letzteres ungrammatisch ist \ Harvey and I are enemies kann nicht auch ¡Is I'm enemies with Harvey realisiert werden. Friend bildet demnach eine Ausnahme. Seine syntaktische Repräsentation hat sich verändert, so daß die besprochenen Regeln angewendet werden können. Es besitzt jetzt ein wenig andere syntaktische Eigenschaften als enemy, da I'm friends with Harvey möglich ist, aber I'm enemies with Harvey nicht. Diese Veränderung in dem Morphem friend war rein syntaktischer Natur, da friend in Harvey and I are friends und I'm friends with Harvey das gleiche bedeutet. Recht häufig treten jedoch syntaktischer und semantischer Wandel gemeinsam auf. Wenn ein Morphem in eine andere syntaktische Klasse übertritt, erwirbt es eine neue Bedeutung. Die Präposition bzw. das Adverb up kann z. B. heute als Verb verwendet werden (The manager upped the prices). Der neue syntaktische Gebrauch geht parallel mit einer neuen Bedeutung, .erhöhen'. Down ist ebenfalls ein Verb geworden, wobei es die Bedeutungen .trinken' und .aus der Luft herunterholen' besitzt (He downed the medicine, Snoopy downed the Red Baron's plane). Hunderte von Beispielen für einen derartigen doppelten Wandel ließen sich aufzählen. Wenn wir dies als syntaktischen Wandel 173
betrachten wollen, dann kann man sagen, daß lexikalische Einheiten sich häufig in ihren syntaktischen Eigenschaften verändern. Einzelne lexikalische Einheiten können auch eine Veränderung ihrer phonologischen Repräsentation erfahren. Unter dem Einfluß seiner Schreibung wird often heute von vielen Leuten mit [t] ausgesprochen. Diese Idiolekte spiegeln einen Wandel der phonologischen Repräsentation wider, denn in einer früheren Periode des Englischen wurde das [t] nicht ausgesprochen. Im Deutschen trat im 13. Jahrhundert an eine Reihe von Wörtern, die auf [s] ausgingen, ein [t] an, so bei Axt (mittelhochdeutsch ackes), Obst, Palast, Papst. Häufiger sind die phonologischen Veränderungen in Morphemen morphologischer Natur. Der Plural von kint ,Kind' lautete im Mittelhochdeutschen noch kint; erst später hat sich die Pluralbezeichnung durch -er durchgesetzt. Im Englischen war der Plural von brother einmal brethren, aber heute ist er brothers; brethren hat sich nur noch als religiöser Archaismus erhalten. Für manche Sprecher des Englischen ist der plural von ox nicht oxen, sondern oxes. Für diese Sprecher ist ox nicht mehr eine Ausnahme von den allgemeinen Regeln, die die phonetische Realisierung des Pluralmorphems bestimmen. Seine phonologischen Eigenschaften haben sich verändert, da es in einem veränderten Verhältnis zu den phonologischen Regeln des Englischen steht. Als letztes Beispiel wollen wir die Konjugation des französischen Verbs aimer betrachten. Als regelmäßige Entwicklung aus dem Lateinischen besaß es die Präsensformen j'aime ,ich liebe', tu aimes ,du liebst', il aime ,er liebt', nous amons ,wir lieben', vous amez ,ihr liebt', ils aiment ,sie lieben'. Beachten Sie, daß der Wurzelvokal in vier Formen ai [e] ist, aber einfaches a [a] in den zwei restlichen. Im modernen Französisch, ist ai auf alle Formen ausgedehnt worden: nous aimons ,wir lieben' und vous aimez ,ihr liebt'.
R egelveränderungen Veränderungen der Eigenschaften einzelner lexikalischer Einheiten sind meistens sporadisch und nur für die eine Einheit ch. rakteristisch. Da solche Veränderungen sich auf einzelne lexikalische Einheiten beschränken, ist ihre Auswirkung auf das Sprachsystem minimal. Von viel größerer Bedeutung sind Veränderungen in den Regeln einer Sprache. Da Regeln sich auf ganze Klassen von lexikalischen Einheiten und auf unendliche Mengen von Satzstrukturen beziehen, kann die Oberflächenwirkung einer Regelveränderung beträchtlich sein. Veränderungen kommen sowohl in dem 174
syntaktischen als auch in dem phonologischen System von Sprachen vor. Sie können darin bestehen, daß Regeln verloren gehen oder hinzukommen oder daß bestehende Regeln modifiziert werden. Im modernen Französisch sind Possessivausdrücke wie mon livre ,mein Buch' und le mien ,meines' syntaktisch verwandt. Zum Beispiel: die beiden Sätze Ce livre est mon livre ,Dies Buch ist mein Buch' (was ungeschickt, aber grammatisch ist) und Ce livre est le mien ,Dies Buch ist meins' realisieren dieselbe zugrundeliegende Struktur. Vor allem realisieren die beiden Nominalphrasen mon livre und le mien dieselbe zugrundeliegende Struktur. Verschiedene syntaktische Regeln wirken zusammen, um eine abstrakte Struktur der Form le mien livre, wörtlich ,das meine Buch' (analog zu le grand livre ,das große Buch') hervorzubringen. Daraufhin können zwei verschiedene Regeln auf diese abstrakte Struktur einwirken. Da livre ein Substantiv wiederholt, das schon vorher im Satz vorkommt, kann es gelöscht werden, so daß le mien übrigbleibt; wird die Nominaltilgungsregel angewendet, so entsteht der Satz Ce livre est le mien ,Dies Buch ist meines'. Andrerseits kann le mien livre durch die Tilgung des bestimmten Artikels zu mien livre reduziert werden. Wenn das geschieht, realisieren phonologische Regeln das Possessivwort als mon ,mein' statt mien. Auf diese Weise erklärt die Artikel-Tilgungsregel den Satz Ce livre est mon livre ,Dies Buch ist mein Buch'. Uns interessiert hier die Artikel-Tilgungsregel. Im modernen Französisch kann diese Regel nur angewendet werden, wenn das Substantiv nicht getilgt ist; wenn aber das Substantiv noch vorhanden ist, dann ist die Tilgung des Artikels obligatorisch. Wenn das Substantiv getilgt ist, so daß sich le mien ,meines' ergibt, kann der Artikel nicht getilgt werden, da mien allein ungrammatisch ist. Ist jedoch das Substantiv in le mien livre nicht getilgt, muß der Artikel getilgt werden, da nur mon livre grammatisch ist, nicht aber le mien livre. Die Artikel-Tilgungsregel kam auch im Altfranzösischen vor, aber sie wurde unter etwas anderen Bedingungen angewendet. Im Altfranzösischen, um das 12. Jahrhundert, konnte der Artikel getilgt werden, ob das Substantiv vorhanden war oder nicht, und die Regel war eher fakultativ als obligatorisch. Demnach waren Ausdrücke wie L 'abaie est moie ,Die Abtei ist meine' und Ii nostre deu ,(der) unsere Gott' waren wohlgeformt, obgleich ihre Gegenstücke im modernen Französisch es nicht mehr wären. Die Artikel-Tilgungsregel hat sich also im Laufe der historischen Entwicklung des Französischen insofern verändert, als die Bedingungen für ihre Anwendung sich verändert haben. Ein weiteres Beispiel für historische Veränderung in syntaktischen Re175
geln wollen wir im Englischen betrachten. Im heutigen Englisch kann die Negation not direkt nach gewissen Verben vorkommen, aber nicht nach anderen. Die Modalverben (wie can, may, will) können direkt vor not stehen, desgleichen have, be und do. Sätze wie He cannot come, He has not come, He is not coming und He does not come sind grammatisch, während solche wie He comes not, He likes not chicken ungrammatisch sind. Es war jedoch früher so, daß not jedem beliebigen Verb folgen konnte, nicht nur diesen wenigen. Beispiele dafür sind It aperteneth nat to a wys man ,Es schickt sich nicht für einen weisen Mann' und Y f f the maters went not to my maister entent ,Wenn die Angelegenheiten nicht nach der Vorstellung meines Herrn liefen', wo not den Verbformen aperteneth und went folgt. Also haben sich die syntaktischen Regeln, die die Stellung des not in englischen Sätzen bestimmen, geändert. Als letztes Beispiel wollen wir Possessivwendungen des Englischen betrachten, etwa John's friend. Man kann mit gutem Grund annehmen, daß solche Nominalphrasen auf zugrundeliegende Strukturen der Art the friend of John's (parallel zu a friend of John's) zurückgehen. Syntaktische Regeln permutieren die Possessiv-Nominalphrase John 's mit friend (und tilgen of und the) und produzieren so John's friend aus der vorausgesetzten zugrundeliegenden Struktur. Im heutigen Englisch kann die gesamte Possessiv-Nominalphrase permutiert werden, selbst wenn sie ziemlich komplex ist. (Man kann sich selbst Monstrositäten leisten wie The woman wholwent to the party with's husband.) Früher war jedoch die Permutationsregel in ihrer Wirkung weit mehr eingeschränkt, da Nebensätze und Satzteile, die die Possessiv-Nominalphrase ergänzen, nicht verschoben werden konnten. Statt The King of England's throne sagte man the King's throne of England; dabei wurde die Ergänzung of England nach dem Substantiv belassen. Die Regel, die diese Permutation bewirkt, ist folglich im Laufe der historischen Entwicklung des Englischen gelockert worden. Die Untersuchung von phonologischen Systemen erbringt eine Vielzahl von Beispielen für einen Wandel durch Hinzufügung oder Verlust von phonologischen Regeln. Betrachten wir z. B. die phonologischen Regeln, die die morphologischen Muster des Altenglischen bestimmten. Das Englische war einst eine stark flektierende Sprache; es war gekennzeichnet durch verschiedene Formen der Wortendungen, die Kasus, Genus, Numerus, Person, Tempus usw. unterschieden, ähnlich wie es im Lateinischen, Deutschen und Russischen der Fall ist. Das Wort scip ,Schiff besaß verschiedene Endungen, die von seiner grammatischen Funktion im Satz (Kasus) oder seiner Charakterisierung für Plural oder Singular 176
(Numerus) abhingen. Scip wurde für Nominativ und Akkusativ Singular verwendet; scipes war die Form des Genitiv Singular; scipe war Dativ Singular. Die entsprechenden drei Pluralformen waren scipu, scipa und scipum. Auch wenn wir die phonologische Struktur des Altenglischen nicht im einzelnen untersuchen, wird deutlich, daß es eine ganze Anzahl von phonologischen Regeln gegeben haben muß, deren Hauptfunktion es war, die Formen dieser Flexionsendungen anzugeben. Im heutigen Englisch ist jedoch die Flexion relativ schwach ausgebildet. Substantive besitzen nur eine Pluralendung und eine Genitiv- oder Possessivendung, die beide, wie wir gesehen haben, in den meisten Fällen [z] sind. Die Flexionen der Verben und Pronomina sind wesentlich vereinfacht worden, und die Flexion der Adjektive ist völlig beseitigt worden, mit Ausnahme der Komparativund Superlativformen (stronger, strongest). Es sind also viele phonologische Regeln des Englischen aus der Sprache entfernt worden. Auch einige syntaktische Regeln zur Kennzeichnung der Kasus und der Konkordanz müssen verloren gegangen sein. Beim Vergleich des Lateinischen mit dem Französischen finden wir den Fall einer phonologischen Regel, die zwar erhalten geblieben ist, sich aber im Laufe der Jahrhunderte verändert hat. Die Regel, um die es hier geht, ist die Betonungsregel. Im Lateinischen fällt die Betonung auf die zweitletzte Silbe eines Wortes, wenn diese Silbe „schwer" ist; andernfalls wird die drittletzte Silbe betont. Eine Silbe ist schwer, wenn sie entweder einen langen Vokal besitzt oder auf zwei oder mehr Konsonanten ausgeht (es sei denn, der zweite Konsonant ist ein Liquid). Anteponö ,ich ziehe vor' wird also auf der zweitletzten Silbe betont; diese Silbe ist schwer, weil sie einen langen Vokal enthält (ein Strich über dem Vokal bezeichnet die Länge). Ebenso wird adversus auf der zweitletzten Silbe betont, weil dem Vokal e zwei Konsonanten folgen. Difficilis .schwierig' dagegen wird auf der drittletzten Silbe betont, weil die zweitletzte nicht schwer ist. Um die Regel ganz auszuformulieren, müssen wir noch hinzufügen, daß ein Wort mit weniger als drei Silben auf der ersten Silbe betont wird (z. B. bene ,wohl\ res ,Sache'). Die Entwicklung des Lateinischen zum Französischen umfaßte neben vielen anderen Veränderungen auch eine Modifizierung der Betonungsregel. Die Regel im heutigen Französisch lautet einfach: der letzte Vokal eines Wortes ist betont. So werden z. B. ami,Freund', cheval,Pferd', finira ,er wird beenden' und examiner ,prüfen' phonetisch mit Betonung dargestellt als [ami], [Saval], [finira] und [egzamine]. Die einzige Einschränkung ist die, daß das End-[s] bei der Festlegung der Betonung un177
berücksichtigt bleibt. Femme ,Frau' kann man z. B. entweder [fams] oder [fäm] aussprechen, das [a] trägt auf jeden Fall die Betonung. Der Vergleich des Lateinischen mit dem heutigen Französisch zeigt auch ein Beispiel für phonologischen Wandel durch Hinzufügung einer Regel. Das Französische besitzt eine Regel, die betontes [a] in einer großen Klasse von Morphemen zu [e] verändert, wie die folgenden Wörter zeigen: mer sei claire
[mer] [sei] [kler]
,Meer' ,Salz' ,klar'
marine saline clarte
[marina] [salina] [klarte]
,Marine' .Saline' .Klarheit'
Mer, sei und clair besitzen die zugrundeliegende Repräsentation [mar], [sal] und [klar]. Der Vokal erscheint sichtbar in diesen Morphemen, wenn die Endung ine oder te hinzugefügt wird, da dann die Endung den Ton trägt. Erscheinen jedoch diese Morpheme isoliert als volle Wörter, ist [a] der letzte Vokal, und es ergibt sich [mär], [säl] und [klär]. Auf diese Formen ist nun die Regel anzuwenden, die betontes [a] in [e] überführt; sie leitet davon die phonetischen Folgen [mer], [sei] und [kler] ab. Diese Regel gehörte nicht zur lateinischen Phonologie, wie die Wörter märe ,Meer', säl und clärus zeigen, von denen die betreffenden französischen Wörter abstammen.
Sprachwandel und Spracherwerb Veränderungen in der Struktur einer Sprache spielen sich nicht in Augenblicken ab. In einem bestimmten Idiolekt, dem Sprachsystem eines einzelnen Sprechers, kann es vorkommen, daß bestimmte kleinere Veränderungen innerhalb von Augenblicken stattfinden; ein Sprecher kann etwa ein Wörterbuch aufschlagen und ein neues Wort lernen. Das ist jedoch nicht der Fall, wenn wir die Sprache als ein vielen Sprechern gemeinsames System betrachten, und es ist wahrscheinlich nicht einmal für IdiolektVeränderungen charakteristisch. Nehmen wir z. B. das Wort hippie, das sich sehr schnell in der ganzen englischsprechenden Welt verbreitet hat. Irgendjemand muß das Wort als erster gebraucht haben, oder vielleicht haben es mehrere Leute unabhängig voneinander erfunden. In beiden Fällen werden Wochen oder Monate vergangen sein zwischen seiner Prägung und dem Zeitpunkt, wo es in allgemeinem Gebrauch war. Man kann mit Sicherheit sagen, daß es immer 178
noch Sprecher des Englischen gibt, die es nicht kennen. Die meisten neuen lexikalischen Einheiten brauchen viel länger, sich zu verbreiten und in allgemeinen Gebrauch zu kommen, wenn es überhaupt dazu kommt. Darüberhinaus kann es sein, daß ein Sprecher sich eine neue lexikalische Einheit nur nach und nach aneignet. Vielleicht sieht ein Sprecher bei einem Besuch in San Francisco das Wort hippie in einer Zeitungsüberschrift; erst später jedoch, wenn es in weiteren Kreisen gebraucht wird und es ihm mehrfach und in verschiedenen Zusammenhängen begegnet ist, wird ihm klar, was es genau bedeutet. Veränderungen im Regelsystem einer Sprache verbreiten sich noch langsamer als lexikalische Veränderungen. Denken Sie an die Regel in manchen englischen Dialekten, daß [e] vor [n] phonetisch als [i] realisiert wird. Für die Sprecher, die diese Regel kennen, werden pen und pin beide [pm] ausgesprochen, und penny reimt sich auf mini Diese Regel ist ziemlich weitverbreitet. Die Sprache gewisser Radio- und Fernsehsprecher ist durch die Aussprache des [e] vor [n] als [i] charakterisiert, so daß praktisch alle Sprecher des amerikanischen Englisch diese sprachliche Besonderheit schon gehört haben. Aber, während die meisten Sprecher, die dem Wort hippie öfters begegnet sind, es in ihren Wortschatz und damit in ihr Sprachsystem aufgenommen haben, gilt dasselbe nicht für die genannte phonologische Regel. Obgleich praktisch alle Amerikaner schon gehört haben, daß pen und pin gleich ausgesprochen werden, haben die meisten sich die phonologische Regel, die dafür verantwortlich ist, nicht angeeignet. Idiolekte, die diese Regel besitzen, stehen also neben solchen, die sie nicht besitzen. Dieser sprachliche Unterschied beeinträchtigt die Kommunikation nicht (meistens wird er nicht ei.imal bemerkt), und die Kommunikation hat bis jetzt den Unterschied auch noch nicht beseitigt. Vielleicht wird das nie geschehen. Nehmen wir aber an, wir kämen in einigen Jahrhunderten zurück in das Sprachgebiet des amerikanischen Englisch und stellten fest, daß alle Sprecher eine Regel besitzen, die [e] vor [n] als [t] realisiert. Unter dieser größeren zeitlichen Perspektive würden wir sagen, daß das Englische eine phonologische Veränderung durchgemacht hat, die darin besteht, daß dem phonologischen System eine Regel hinzugefügt worden ist. Das hätte dann aber Jahrzehnte oder Jahrhunderte gebraucht, um sich auf alle Sprecher auszudehnen, und wäre alles andere als eine augenblickliche Veränderung. Wenn wir von Veränderungen sprechen, die eine Sprache in ihrer historischen Entwicklung durchgemacht hat, sind wir uns darüber im klaren, daß die allgemeine Annahme der Neuerungen vielleicht sehr lange Zeit benötigt hat. 179
Man nimmt an, daß Erwachsene in ihrer sprachlichen Beweglichkeit beschränkt sind. Ein Erwachsener, der eine Fremdsprache lernt, wird eine den Einheimischen nahekommende Sprachfähigkeit nur mit großer Schwierigkeit erwerben, und er wird die Sprache fast immer mit einem Akzent sprechen (was zum Teil darauf beruht, daß er von dem ihm schon bekannten phonologischen System auf das andere schließt). Trotz der sprachlichen Erstarrung der Erwachsenen kommen in ihrer Sprache doch Neuerungen vor. Selbst der letzte Mummelgreis kann z. B. das Wort hippie lernen. Außerdem können Erwachsene ihre Sprache auch im Hinblick auf Regeln verändern, wenn sie sie bewußt oder unbewußt, nach dem Muster eines anderen Dialekts formen. Ein erwachsener Texaner, der in den Mittelwesten zieht, wird mit einiger Wahrscheinlichkeit seine Aussprache anpassen, indem er die Unterschiede zwischen sich und den Sprechern seiner Umgebung verkleinert. Ein Erwachsener, der auf sozialen Aufstieg aus ist, wird, vielleicht mit einigem Erfolg, seine Grammatik zu verbessern suchen. Obwohl wir bis jetzt auf Vermutungen angewiesen sind, ist es durchaus möglich, daß neueingeführte Regeln bei erwachsenen Sprechern nur eine dünne Politurschicht über ihren im Kindesalter gelernten Regelsystem sind. In Augenblicken der Erregung können Feinheiten der Grammatik und der Aussprache, um die sich ein Erwachsener sorgfältig bemüht hat, spurlos verschwinden. Ob diese Einschätzung nun stimmt oder nicht, so ist es jedoch für ein klareres Verständnis des Sprachwandels wichtig, daß wir den kindlichen Erwerb der Muttersprache verstehen. Ein sprachlicher Zug, der für Erwachsene eine Neuerung bedeutet, wird von einem Kind, das das veränderte Sprachsystem als Muttersprache lernt, nicht als solche betrachtet werden. Ein Erwachsener, der eine neugeprägte lexikalische Einheit lernt, kann sie als Neuheit erkennen. Für Kinder späterer Generationen wird dieses Wort überhaupt keinen Klang der Neuheit haben, da es von Anfang an zu ihrem Idiolekt gehört. Wenn die Stellung des Wortes bei erwachsenen Sprechern unsicher ist, so wird diese Unsicherheit verschwinden, wenn es von neuen Generationen von einheimischen Sprechern der Sprache als gleichberechtigtes Wort neben älteren lexikalischen Einheiten gelernt wird. Der Unterschied zwischen dem Sprachenlernen von Kindern und dem von Erwachsenen hat zweifellos mehr Bedeutung im Hinblick auf Neuerungen im Bereich der sprachlichen Regeln, da ja auch Erwachsene sich lexikalische Einheiten verhältnismäßig leicht aneignen können. Man hat die Hypothese aufgestellt, daß neue syntaktische oder phonologische Regeln im Sprachsystem von Erwachsenen nur eine Sekundärstellung 180
einnehmen können und daß sie am Rande des im Kindesalter gelernten Regelsystems der Erwachsenen bleiben. Betrachten wir dagegen das Kind, das Sprache um sich hat, die durch neue Regeln gekennzeichnet ist. Da das Kind keine früheren sprachlichen Erfahrungen besitzt, in denen die Neuerungen fehlten, wird es ganz natürlich die neuen Sprachzüge gleichrangig mit allen anderen Zügen der Sprache behandeln, die es zu lernen versucht. Folglich lernt das Kind die neuen Regeln als einen integralen Bestandteil des Sprachsystems, das es erwirbt, und nicht etwa als oberflächliche Anhängsel daran. Das Sprachsystem, das sich das Kind selbst aufbaut, wenn es sprechen lernt, kann sogar einfacher sein als das entsprechende System der Erwachsenen, besonders wenn dieses Regelneuerungen enthält. Nehmen wir z. B. an, das phonologische System eines Erwachsenen wird durch die Hinzufiigung mehrerer Regeln modifiziert, und diese Regeln haben für ihn nur eine sekundäre, periphere Stellung. Wenn ein Kind den modifizierten Dialekt lernt, dann werden diese neuen Regeln als ein integraler Bestandteil in sein Sprachsystem eingebracht und nicht als isolierte Anhängsel. Auf diese Weise sehen Kinder die Sprache mit neuen Augen an, wenn sie sie lernen, und ihre Leistung kann eine Neustrukturierung des Systems mit sich bringen. Zur Illustration wählen wir ein hypothetisches Beispiel. Nehmen wir an, es gibt eine Sprache, die eine Regel enthält, nach der [t] am Ende eines Wortes aspiriert wird. Ein Morphem mit der zugrundeliegenden Repräsentation [kit] würde also phonetisch als [kit h ] realisiert, wobei das hochgestellte h nach einem Segment anzeigt, daß das Segment aspiriert ist. Wir nehmen weiter an, daß eine Neuerung stattfindet; aus irgendwelchen unbekannten Gründen, vielleicht nur wegen des stilistischen Werts, beginnen Sprecher Wörter mit [s] statt [ t h ] auszusprechen. Auf Grund dieser Neuerung wird dann das Morphem, dessen zugrundeliegende Repräsentation [kit] ist, [kis] ausgesprochen. Wenn wir davon ausgehen, daß Erwachsene neue Regeln vorwiegend als isolierte Elemente lernen, dann bedeutet Neuerung für sie die Hinzuftigung einer phonologischen Regel, einer Regel, die [ t h ] als [s] realisiert, [kitjwird also in zwei Schritten in die phonetische Folge [kis] überführt. Zuerst verändert die ursprüngliche Regel [kit] zu [kit h ], da das [t] am Ende des Wortes steht. Dann realisiert die neue Regel [kit h ] als [kis]. Wenn nun Kinder Sprecher dieser hypothetischen Sprache werden, sehen sie die Sache mit neuen Augen an. Nehmen wir an, es ist strukturell bezeugt, daß [kit] als die zugrundeliegende Form für [kis] anzusetzen ist (vielleicht ist z. B. dieses Morphem ein Verb, das im Präteritum als 181
[kita] realisiert wird, so daß das zugrundeliegende [t] sichtbar wird). Diejenigen, die diese Sprache lernen, sehen sich also zugrundeliegenden Formen wie [kit] gegenüber gestellt, die phonetischen Folgen wie [kis] zugeordnet sind; als Teil des Sprachelernens müssen sie sich eine Regel konstruieren, die alle solche Zuordnungen vornimmt. Die Regel, die sie konstruieren, wird wahrscheinlich folgende sein: Realisiere [t] im Wortauslaut als Reibelaut. Im Gegensatz zu den erwachsenen Sprechern wird es für sie keinen strukturellen Grund geben, eine Zwischenposition [t h ] zwischen [t] und [s] anzunehmen, und sie werden mit einer Regel statt zwei auskommen. Der einzige Grund, warum [ t h ] im System des Erwachsenen zwischen [t] und [s] vermittelt, ist, daß die erwachsenen Sprecher vor der Einführung der Neuerung ein System gelernt hatten, in dem [t] als [t h ] realisiert wurde; Kinder, die diese Sprache als erste lernen, werden diesen Grund natürlich nicht haben. Das neu strukturierte System, das sie sich aufbauen, ist einfacher als das der Erwachsenen, denn es enthält nur eine Regel zur Verknüpfung von [t] und [s] und nicht zwei. In diesem einleuchtenden, aber hypothetischen Beispiel entspricht der Dialekt des Erwachsenen unmittelbar dem Dialekt, der von neuen Sprechern gelernt wird. Beide sprechen unser Beispielverb als [kis] aus, obgleich sie sich in den Regeln unterscheiden, die [kis] aus dem zugrundeliegenden [kit] ableiten. Die Sprecher werden sich keines Unterschieds bewußt sein, da Sprachregeln nicht unmittelbar beobachtet werden können, sei es durch Introspektion, sei es durch andere Sprecher. Und trotzdem hat sich ein struktureller Wandel in der Sprache vollzogen; das phonologische System ist neu strukturiert worden, und diese Neustrukturierung kann man unmittelbar dem Prozess des Erwerbs der Muttersprache zuschreiben. Dies ist aber nicht der einzige Mechanismus, durch den eine Veränderung auf den Spracherwerb des Kindes zurückgehen kann. Ein weiterer, naheliegender Mechanismus ist der des u n v o l l k o m m e n e n L e r n e n s . Bei der Übermittlung eines Sprachsystems von einer Generation zur andern werden sich mit Sicherheit einige Veränderungen einschleichen; das System, das sich das Kind konstruiert, wird notwendig zumindest in kleineren Dingen von dem seiner sprachlichen Vorbilder abweichen. In diesem Fall ist anzunehmen, daß das neuerworbene System und das System der Erwachsenen nicht völlig äquivalent sind. Die Unterschiede werden sichtbar realisierte Folgen zeigen. Nehmen wir als Beispiel das Lernen des Wortschatzes. Da tausende von lexikalischen Einheiten bewältigt werden müssen, wird es bestimmt einige geben, die das Kind gar nicht oder nur unvollkommen lernt. Es 182
kann einige lexikalische Einheiten geben, die wegen der Seltenheit ihres Gebrauchs zufällig nicht in der sprachlichen Erfahrung des Kindes auftauchen. Wenn sie dem Kind nie begegnen, wird es sie natürlich auch nicht lernen. Andere lexikalische Einheiten wird das Kind kennenlernen, ohne genau zu erkennen, was sie bedeuten, sei es, daß sie zu selten vorkommen, sei es, daß sie nicht in einem Kontext vorkommen, der es erlaubt, ihre Bedeutung zu erschließen. Es ist keine ungewöhnliche Feststellung, daß ein Wort für andere Leute etwas anderes bedeutet als für uns selbst. Unregelmäßige morphologische Erscheinungen fallen zweifellos häufig dem unvollkommenen Lernen zum Opfer. Bei sehr alltäglichen Morphemen können sich morphologische Unregelmäßigkeiten unendlich lange erhalten. Das englische Verb go ist ziemlich unregelmäßig; die Präteritalform heißt nicht goed, sondern went und das Partizip des Präteritums heißt gone, während bei regelmäßigen Verben das Partizip des Präteritums mit der Form des Präteritums übereinstimmt. Da jedoch go ein derart häufig vorkommendes Verb ist, werden diese unregelmäßigen Formen leicht erlernt und behalten. Nehmen wir aber andrerseits ein weniger häufiges Verb wie strive ,streben, sich bemühen um'. Strive ist kein Verb, das wir jeden Tag zu benützen Gelegenheit haben, und so können einzelne Formen, wie etwa sein Partizip des Präteritums, nur selten in der sprachlichen Erfahrung eines bestimmten Sprechers vorkommen. Es ist deshalb nicht verwunderlich, daß die unregelmäßigen Präteritalformen strove und striven oft durch die regelmäßige Form strived ersetzt werden. Ein Kind, das Englisch lernt, hört vielleicht nie strove und striven, oder es hört die Formen so selten, daß sie ihm nicht im Bewußtsein bleiben. Da anderweitige Information fehlt, wird das Kind strive so behandeln, als sei es ein regelmäßiges Verb. Unvollkommenes Lernen muß auch bei der Veränderung von allgemeinen Regeln eine entscheidende Rolle spielen. Das Kind muß sich sein Sprachsystem auf der Grundlage von Sprachmerkmalen konstruieren, die es bei der Sprachverwendung anderer beobachtet. Das Datenmaterial, das ihm zur Verfugung steht, ist also zufällig, verzerrt und unvollständig. Es enthält Fehler, die seine Vorbilder beim Sprechen machen, und es enthält wahrscheinlich auch beträchtliche Lücken, da die Sätze, die zu hören das Kind Gelegenheit hat, nur einen minimalen Ausschnitt aus der unendlichen Menge der einer Sprache zugehörigen Sätze umfassen. Schon auf Grund der Unvollkommenheit des Datenmaterials, auf das sich das Kind verlassen muß, können die Regeln, die es formuliert, sich sehr wohl in kleineren Dingen von denen seiner Vorbilder unterscheiden. Die Konse183
quenzen dieser Abweichung können so gering sein, daß sie nie auffallen oder korrigiert werden. Man sollte aus dieser Darstellung keineswegs den Eindruck gewinnen, daß der Sprachwandel schon völlig erklärbar ist. Viele der Bemerkungen in diesem Abschnitt sind ganz vorläufig, vor allem die, die sich auf den Spracherwerb beziehen. Es muß noch vieles am sprachlichen und psychischen Aufbau erforscht werden, bevor alle unsere Fragen zum Sprachwandel beantwortet werden können.
Nochmals: Dialekte Die zugrundeliegende Einheitlichkeit der Dialekte Bei unserer Behandlung der sprachlichen Vielfalt haben wir festgestellt, daß keine zwei Menschen genau das gleiche Sprachsystem besitzen. Unterschiede im Idiolekt kann man stets zwischen zwei beliebigen Sprechern finden, ob diese Unterschiede nun bewußt erkannt werden oder nicht. Man darf sich jedoch nicht vom oberflächlichen Eindruck leiten lassen. Wenn man die Oberflächenunterschiede in Beziehung zu dem System von Regeln und abstrakten zugrundeliegenden Repräsentationen sieht, auf dem ja die Sprachstruktur beruht, so erweisen sie sich oft als sehr viel weniger zahlreich und gewichtig als man zunächst annimmt. Zur Illustration wollen wir nochmals auf Dialekteinteilungen zurückkommen, wie sie in Abb. 3.2 dargestellt sind. Der Dialekt Bi unterscheidet sich, so wollen wir annehmen, darin von den anderen Formen der Sprache B, daß seine Sprecher viele Sprachmerkmale gemeinsam haben, die sie von anderen Sprechern von B unterscheiden. Sprecher von B, so sagen wir, sprechen [u] in Wörtern, in denen andere Sprecher [u] sprechen; außerdem sprechen sie [i] in Formen, die in anderen Dialekten mit [i] gesprochen werden; diese und noch weitere Merkmale unterscheiden Bi von B2 und B3. Würde man sich nur auf die Oberflächenunterschiede konzentrieren, so könnten sie eindrucksvoll erscheinen. Man könnte Tausende von Wörtern aufzählen, die von Sprechern von Bi und anderen Sprechern von B verschieden ausgesprochen werden. Die erste Gruppe würde z. B. [tup], [kitane], [isu], [gilipumay] und [sumo] sprechen, während die zweite stattdessen [tup], [kitane], [isu], [gilipumay] und [sumo] sprechen würde. Auf der phonetischen Ebene unterscheidet sich demnach Bi von B2 und B3 in Tausenden von Einzelheiten. 184
Diese Unterschiede verschwinden aber fast völlig, wenn wir phonetische Einzelheiten nur als Oberflächenrealisierung eines Systems von phonologischen Regeln betrachten, die auf abstrakte zugrundeliegende Repräsentationen angewendet werden. Zuerst ist zu beachten, daß diese phonetischen Unterschiede völlig regelmäßig sind. Wann immer ein Wort in B i mit [i] ausgesprochen wird, wird das entsprechende Wort in B2 und B3 mit [t] ausgesprochen, wenn es in derselben Position auftritt. Wann immer ein Wort in B i mit [u] ausgesprochen wird, wird das entsprechende Wort in B2 und B3 in derselben Position mit [i>] ausgesprochen. Vergleichen wir .also B i mit den anderen Dialekten, so stellen wir eine systematische E n t s p r e c h u n g zwischen [i] und [1] und zwischen [u] und [u] fest.Die phonetischen Unterschiede sind nicht zufällig, vereinzelt und für einzelne lexikalische Einheiten charakteristisch. Vielmehr sind sie regelmäßig, folgen einem gleichbleibenden Muster und gelten für alle Morpheme von B. Nehmen wir an, B i besitzt fünf distinktive Vokale, deren phonetische Realisierungen [ i u e o a ] sind. Der Unterschied zwischen hoch, mittel und tief ist distinktiv; er trennt fi u] von [e o] von [a]. Für die hohen und mittleren Vokale ist der Unterschied vorne/hinten distinktiv; er trennt [i] und [u] sowie [e] und [o]. In den zugrundeliegenden phonologischen Repräsentationen von Morphemen wird demnach das Segment [i] als Vokal mit den Merkmalen hoch und vorne erscheinen, womit er von den Vokalen mit den Merkmalen mittel und tief [e o a] und von dem Vokal [u] (hoch, hinten) unterschieden ist. Entsprechend wird [u] einfach als Vokal mit den Merkmalen hoch und hinten aufgeführt. Die genaue phonetische Gestalt dieser distinktiven zugrundeliegenden Vokalsegmente werden von Regeln bestimmt, die nicht-distinktive phonetische Einzelheiten angeben und von relativ geringerem Interesse sind. Aber für B2 und B3 gilt genau dasselbe Schema. Auch sie besitzen fünf distinktive Vokale, einen tiefen Vokal, phonetisch [a], zwei Mittelvokale, phonetisch [e o], und zwei Hochvokale. Der einzige Unterschied besteht in der phonetischen Realisierung der zwei Hochzungenvokale als [1 u] statt fi u]. Die zugrundeliegenden Repräsentationen sind die gleichen, da [1 i] beide vordere Hochzungenvokale und [u u] beide hintere Hochzungenvokale sind. Das Vokalsegment in [tup] [tup] würde z. B. in allen Dialekten von B einfach mit den Merkmalen hoch und hinten aufgeführt; was die distinktive phonologische Information angeht, sind die Repräsentationen von Morphemen in allen Dialekten von B einheitlich. Außerdem sind die meisten entscheidenden phonologischen Regeln in B j und den anderen Dialekten identisch. So gilt etwa die Regel, 185
daß Vokale nicht-nasal sind, für alle Dialekte in gleicher Weise. Desgleichen die Regel, daß vordere Vokale und hintere Tiefzungenvokale ungerundet sind, während nicht-tiefe hintere Vokale gerundet sind. Die Unterschiede laufen auf das Folgende hinaus: Hochzungenvokale werden im Dialekt Bj mit etwas höherer Zungenstellung ausgesprochen als in B2 und B3. D.h., die Regel, die die Zungenhöhe angibt, liefert eine geringfügig (aber nicht völlig) verschiedene phonetische Angabe für die Sprecher von Bi. Dabei handelt es sich um nur eine Regel, da sich [i u] von [t D] in jeweils der gleichen Weise unterscheiden. Dieser eine minimale Unterschied in einer einzigen phonologischen Regel erklärt die Tausende von Unterschieden im phonetischen Detail. Natürlich erweisen sich nicht alle Unterschiede als so geringfügig wie in diesem Fall. Zwei Dialekte derselben Sprache können sich in sehr charakteristischer Weise unterscheiden, manchmal sogar im Hinblick auf ihre Regeln. Was man sich merken sollte, ist die wichtige Feststellung, daß Unterschiede in sprachlichen Zügen nicht unbesehen akzeptiert werden sollten. Wenn wir unter die Oberfläche schauen, bemerken wir normalerweise, daß die Dialekte einer Sprache in viel mehr Aspekten ähnlich als verschieden sind. Außerdem sind die Unterschiede in den meisten Fällen nur oberflächlich.
Das Auseinandertreten in deutlich unterschiedene
Dialekte
Das Bild der Dialekte einer Sprache ist nie statisch. Über eine Zeitspanne von Jahren können sich verschiedene Isoglossen, die die Grenzen von bestimmten sprachlichen Merkmalen angeben, verschieben. Wenn zwei Sprecher oder zwei Sprechergemeinschaften häufig miteinander in Kontakt treten, können sich die Dialektunterschiede zwischen beiden durch Entlehnung verringern. Eine Neuerung, die in dem einen Dialekt eingeführt wird, breitet sich leicht auch in dem anderen aus, wenn zwischen den beiden Kommunikation besteht. Der Sprachwandel trägt aber auch den Keim einer verstärkten Dialektvielfalt in sich. Nehmen wir z. B. an, eine ziemlich gleichartige Gruppe von Sprechern wird durch irgendeinen Zufall der Geschichte in zwei kleinere Gruppen aufgeteilt, die in der Folge nicht mehr viel Kontakt miteinander haben. Diese Zweiteilung mag Zustandekommen durch die Auswanderung eines Teils der Sprachgemeinschaft, durch eine aufgezwungene politische Grenze oder durch eine Fehde - der Grund tut hier nichts zur 186
Sache. Was wird nun das sprachliche Schicksal der beiden Gruppen sein, wenn die Kommunikation zwischen den beiden unterbrochen ist? Natürlich werden sich im Laufe der Zeit die Sprachsysteme der beiden Gruppen verändern, und nach einem Zeitraum von Jahrhunderten wird der gemeinsame Effekt der vielen einzelnen Veränderungen beträchtlich sein. Wenn die sprachliche Entwicklung der beiden Gruppen weiterhin unabhängig voneinander verläuft, so wird das Ergebnis die Aufspaltung in zwei Dialekte sein. Eine Neuerung, die sich in der einen Gruppe verbreitet, wird die Lücke im Kommunikationsnetz nicht überspringen und auf den zweiten Dialekt übergreifen können. Um diese Lücke werden sich Isoglossen zu einem Bündel aufhäufen, und dieses Bündel wird im Laufe der Zeit immer dicker werden, so daß immer mehr Merkmale die beiden Dialekte unterscheiden. Die Erscheinung des Sprachwandels wird demnach in einer Sprechergemeinschaft verstärkte sprachliche Vielfalt bewirken, wenn es nicht genügend Kommunikation und gegenseitigen sprachlichen Einfluß gibt, der dieser Tendenz entgegenwirkt. Solange sich die Mehrzahl der Veränderungen, die in einer Gruppe stattfinden, im Lauf der Zeit auf alle Mitglieder ausbreitet, bleibt die Gruppe sprachlich ziemlich einheitlich. Der betreffende Dialekt mag sich über einen Zeitraum von Jahrhunderten radikal verändern, aber die Veränderungen werden innerhalb der Gruppe gleichgerichtet sein. Geschehen die Veränderungen aber nicht für alle Sprecher der Gruppe gleichmäßig, so führen sie zu vermehrter Vielfalt. Das Sprachsystem jeder Teilgruppe wird sich unabhängig von den anderen vom gemeinsamen Ausgangspunkt wegentwickeln. Dieser Mechanismus ist außerordentlich wichtig für die historische Untersuchung von Sprachen; wir wollen ihn deshalb graphisch darstellen. In Abb. 7.1 steht L für das gemeinsame Sprachsystem einer Gruppe von Sprechern, und der Pfeil bezeichnet die vergehende Zeit. Bleibt die Gruppe zusammen, und beeinflussen sich die Sprecher weiterhin sprachlich, so ergibt sich ein verändertes aber doch einigermaßen einheitliches Sprachsystem L'. Nehmen wir aber andrerseits an, die Hälfte der Sprecher wandert auf eine ferne Insel aus und die beiden Teilgruppen haben keinen Kontakt mehr miteinander. Im Lauf der Zeit treten die Sprachsysteme der beiden Teilgruppen immer weiter auseinander. Diese Situation ist in Abb. 7.2 dargestellt. Je mehr das Isoglossenbündel zwischen den beiden Systemen an Umfang zunimmt, desto deutlicher wird das Auseinandertreten der beiden Dialekte von L, Li und L2. Über einen Zeitraum von vielen Jahrhunderten hin können sich Li und L2 so weit auseinanderentwickeln, 187
daß man eher geneigt ist, sie als zwei verschiedene Sprachen, denn als zwei Dialekte e i n e r Sprache anzusehen. In diesem Fall wird man L i und L2 v e r w a n d t e Sprachen nennen.
L
(
L
Abb. 7.1
L
/\ L,
L,
Abb. 7.2
Verwandtschaft von zwei Sprachen bedeutet also, daß sie Fortsetzungen ein und derselben geschichtlich älteren Sprache sind, die sich jedoch auseinande entwickelt haben. Ein gutes Beispiel dafür sind die romanischen Sprachen. Französisch, Spanisch, Italienisch, Portugiesisch, Rumänisch, Katalanisch und mehrere andere sind verwandte Sprachen in diesem Sinne. Sie alle sind voneinander abweichende Fortsetzungen des gesprochenen Lateins, die sich in den verschiedenen Gebieten, in die die römischen Eroberer das gesprochene Latein gebracht hatten, unabhängig entwickelten. Sie bleiben einander ähnlich genug, daß ihre Verwandtschaft offensichtlich ist, aber gleichzeitig sind sie doch so unterschiedlich, daß sie als verschiedene Sprachen betrachtet werden. Man könnte sie jedoch genauso gut Dialekte derselben Sprache nennen. Es sollte klar sein, daß die Unterscheidung zwischen verwandten Sprachen und Dialekten einer Sprache nur eine Frage des Grades ist.
188
8. Genetische Sprachverwandtschaft
Stammbäume Direkte und indirekte Verwandtschaft Zwei Sprachen werden als verwandt bezeichnet, wenn sie voneinander abweichende Fortsetzungen derselben älteren Sprache sind. Li und L2 in Abb. 7.2 erwiesen sich als verwandte Sprachen, weil beide spätere Stufen von L sind. Eine Sprache, die in einer derartigen Situation die Stelle von L einnimmt, bezeichnet man als Proto-Sprache; L ist der Prototyp von Li und L2. Das gesprochene Latein kann man deshalb als Proto-Romanisch bezeichnen, da es diejenige Sprache ist, aus der sich alle heutigen romanischen Sprachen entwickelt haben. Die verschiedenen slavischen Sprachen sind voneinander abweichende Fortsetzungen des Proto-Slavischen. Die Sprachwissenschaftler haben nie der Versuchung widerstehen können, für Sprachverwandtschaften die menschliche Verwandtschaftsterminologie zu verwenden. Eine Proto-Sprache kann auch als Mutter-Sprache (parent-language) bezeichnet werden (im Deutschen besser: V o r s t u f e ) , die voneinander abweichenden Fortsetzungen entsprechend T o c h t e r s p r a c h e n . L wäre demnach die Proto-Sprache von Li und L2. Li und L2, als Tochtersprachen derselben Proto-Sprache, sind Schwestersprac h e n . Eine Proto-Sprache und ihre Tochtersprachen bilden zusammen eine Sprach fam ilie. Das Lateinische und das Französische, das Spanische, das Italienische, das Portugiesische und deren Schwestersprachen bilden eine Sprachfamilie, desgleichen das Proto-Slavische und die heutigen slavischen Sprachen. Verwandtschaften dieser Art nennt man genetische Verwandtschaften. Eine Tochtersprache kann im Lauf der Zeit selber zu einer Proto-Sprache werden. Ihre historische Entwicklung kann eine Aufspaltung in eine Anzahl von unterscheidbaren Dialekten mit sich bringen, und wenn die Unterschiede ausgeprägt genug werden, können diese Dialekte als ver189
schiedene, aber verwandte Sprachen angesehen werden. Der S t a m m b a u m , der genetische Verwandtschaften darstellt, kann deshalb recht komplex sein. Betrachten Sie als Beispiel Abb. 8.1. B, C, D und E erweisen sich als Tochtersprachen von A, der Proto-Sprache. Im Verlauf der historischen Entwicklung dieser Sprachfamilie, teilt sich jede der Tochtersprachen von A in eine Anzahl von neuen Tochtersprachen auf, für die jene jeweils die Proto-Sprache sind. F und G sind z. B. voneinander abweichende Fortsetzungen von B; B ist also eine Tochtersprache von A, aber die Proto-Sprache F und G. G ist seinerseits wieder eine Vorstufe, von der Q und R abstammen. Um ein Beispiel aus der Wirklichkeit zu geben: das Proto-Slavische ist eine der Tochtersprachen des Proto-Indoeuropäischen. Die heutigen slavischen Sprachen wie Russisch, Tschechisch und Polnisch sind ihrerseits Tochtersprachen des Proto-Slavischen. Im weiteren Verlauf der Geschichte wird vielleicht das Russische oder Polnische die Rolle einer Proto-Sprache für weitere Tochtersprachen einnehmen.
F
Q R
H I J
K L
S T U
N O P
Abb. 8.1 Abb. 8.1 zeigt, daß die Beziehung zwischen verwandten Sprachen entweder direkt oder indirekt sein kann. Q und R sind direkt verwandt, da sie Fortsetzungen von G sind, die die unmittelbare Vorstufe von beiden ist. In derselben Weise sind S, T und U verwandt. Dagegen ist die Verwandtschaft zwischen Q und S nur indirekt. Sie stammen beide von A ab, aber dieser gemeinsame Vorfahr ist weit entfernt. Da sie sich beide so weit von A wegentwickelt haben, können sie außerordentlich verschieden sein. Die Ähnlichkeit der Schwestersprachen Q und R untereinander wird viel größer sein als die jeweilige Ähnlichkeit mit S. Das Englische und Deutsche sind sich z. B. ziemlich ähnlich, da sie beide vom Proto190
Germanischen abstammen. Ebenso sind sich das Russische und Polnische ziemlich ähnlich, da sie über das Proto-Slavische direkt verwandt sind. Auch das Englische und Russische sind verwandt, aber nur indirekt; das Proto-Germanische und das Proto-Slavische sind Tochtersprachen des Indoeuropäischen, und über diese Sprache sind das Englische und Russische verwandt. Weil das Englische und das Russische nur indirekt verwandt sind, sind sie sich viel weniger ähnlich als ihren jeweiligen Schwestersprachen. Es ist ganz natürlich, zu fragen, ob alle menschlichen Sprachen verwandt sind, und sei es noch so entfernt. Mit anderen Worten: Sind alle menschlichen Sprachen in einem riesigen Stammbaum vereinigt? Das ist etwas, was wir heute noch nicht wissen und vielleicht nie wissen werden. Es ist noch nie nachgewiesen worden, daß alle Sprachen Mitglieder einer einzigen, riesigen Familie sind. Auf der anderen Seite ist auch das Gegenteil noch nie bewiesen worden und ließe sich auch prinzipiell nicht beweisen. Es ist möglich nachzuweisen, daß zwei Sprachen verwandt sind, indem man zeigt, daß sie weitgehende Ähnlichkeiten der Struktur besitzen, die nicht anders sinnvoll zu erklären sind, als daß sie voneinander abweichende Fortsetzungen einer gemeinsamen Vorstufe sind. Wie aber könnte man zeigen, daß zwei Sprachen nicht verwandt sind? Wenn sie völlig verschieden sind, ist es klar, daß sie nicht direkt verwandt sind; aber Unterschiede der Struktur können nicht die Möglichkeit ausschließen, daß sie indirekt verwandt sind. Der gemeinsame Vorfahr, über den sie verwandt sind, kann so weit zurückliegen, daß alle die ursprünglichen strukturellen Ähnlichkeiten im Lauf ihres langen, unterschiedlichen Entwicklungsweges ausgelöscht worden sind. Es ist also durchaus denkbar, daß alle menschlichen Sprachen in der Tat verwandt sind, daß aber der Beweis für diese universelle genetische Verwandtschaft nie angetreten werden wird. Es ist ebenso möglich, daß die menschlichen Sprachen nicht alle verwandt sind; in diesem Fall ist der Nachweis prinzipiell unmöglich.
Die Methoden der historischen Untersuchung Es ist keine einfache Sache, den zwingenden Nachweis zu führen, daß eine Anzahl von Sprachen verwandt ist, und die genetischen Verwandtschaftsbeziehungen zu identifizieren, die sie verbinden. Sprachen tragen keine Zeichen, auf denen steht „Ich gehöre zur Sprachfamilie X". Auch wachsen die Stammbäume nicht in des Linguisten Vorgarten, wo sie in Ruhe betrachtet werden könnten. Nur auf Grund der genialen Leistung 191
früherer Generationen von Gelehrten sind wir heute in der Lage, von der indoeuropäischen Sprachfamilie zu sprechen und in groben Zügen ihre genetischen Verwandtschaften zu skizzieren. Zu entdecken, welche Sprachen verwandt sind und wie sie verwandt sind, ist eine Aufgabe ersten Ranges für Gelehrsamkeit und analytisches Denken. Zur Feststellung genetischer Verwandtschaften stehen meistenteils nur Beschreibungen heutiger Sprachen als Material zur Verfügung. Manchmal kann jedoch der Forscher schriftliche Zeugnisse früherer Sprachstufen heranziehen, und diese können außerordentlich wertvoll sein. Von der englischen (und der deutschen) Sprache besitzt man schriftliche Zeugnisse über einen Entwicklungszeitraum von über tausend Jahren; ohne sie könnte man viele Fragen ihrer Entwicklung nicht beantworten. In manchen Fällen bewahren schriftliche Zeugnisse die Kenntnis einer Sprache, die nicht mehr gesprochen wird und sonst gar nicht mehr einbezogen werden könnte. Unsere Kenntnis des Gotischen etwa war eine wertvolle Hilfe bei der Untersuchung der historischen Entwicklung der germanischen Sprachen. Das Gotische ist seit dem sechzehnten Jahrhundert ausgestorben, aber es ist aus schriftlichen Zeugnissen bekannt. Noch bedeutender für die Untersuchung genetischer Verwandtschaftsbeziehungen ist es, wenn die Proto-Sprache einer Sprachfamilie in schriftlicher Form überliefert ist. Weil wir umfangreiche schriftliche Zeugnisse des Lateinischen besitzen, von denen einige den mündlichen Gebrauch widerspiegeln, ist unsere Kenntnis des Proto-Romanischen einigermaßen vollständig. Wir kennen viele Eigenarten der Proto-Sprache, die nicht allein durch die Untersuchung der heutigen romanischen Sprachen gewonnen werden könnten. Nur selten sind die Sprachforscher in der glücklichen Lage, eine direkte Kenntnis der Proto-Sprache zu besitzen. Es ist sogar sehr oft der Fall, daß historische Untersuchungen ganz ohne schriftliche Zeugnisse auskommen müssen. Versetzen wir uns in die Lage eines Linguisten in dieser Situation. Wir nehmen an, er trifft auf die Sprachfamilie in Abb. 8.1. Als Beweismaterial sind die heutigen Sprachen F, Q, R, H, I, J, K, L, S, T, U, N, 0 und P vorhanden. Er kann feststellen, daß sie sich in verschiedener Hinsicht gleichen (abgesehen von den Dingen, in denen sich alle Sprachen gleichen). Das führt ihn zu der Hypothese, daß diese Sprachen genetisch verwandt sind. Wie und bis zu welchem Grad kann er das Wesen dieser genetischen Verwandtschaftsbeziehungen ohne schriftliche Zeugnisse entdecken? Offensichtlich gibt es einige Dinge, die er überhaupt nicht entdecken kann. Er kann z. B. das Vorhandensein der Sprache M annehmen, der Vor192
stufe von S, T und U (falls er bemerkt, daß diese drei sich besonders gleichen). Er kann durch den Vergleich der drei Tochtersprachen sogar einige der Eigenschaften von M feststellen. Aber er wird nie in der Lage sein, ein Bild von M zu rekonstruieren, das so vollständig ist wie seine Information über die Tochtersprachen. Viele wichtige strukturelle Einzelheiten sind mit Sicherheit in der historischen Umwälzung verlorengegangen. Nehmen wir als einleuchtendes Beispiel an, M sei hochgradig flektiert gewesen, aber die drei Tochtersprachen hätten unabhängig voneinander die ursprünglichen Flexionen aufgegeben. Dann wird es unmöglich sein, nur aus S, T und U sämtliche Einzelheiten der Flexionsprozesse in M zu erschließen. Bis zu einem gewissen Grad kann man bestimmte Merkmale früherer Stufen der einzelnen Sprachen von heute rekonstruieren. Diese Methode bezeichnet man als innere R e k o n s t r u k t i o n ; dabei werden frühere Sprachstufen auf der Grundlage der strukturellen Eigenschaften der späteren Stufen teilweise rekonstruiert. Nehmen wir etwa an, in der Sprache S kommt [£] nur vor [i] vor, und [t] kommt nie vor [i] vor. S besitzt demnach Morpheme wie [äk] und [tak], aber keine wie [£ak] und [tik]. [£] scheint eine Variante von [t] zu sein, die vor [i] auftritt. Wenn wir nun in S die Morpheme [maß] und [kaC] antreffen, so kommen wir leicht zu dem Schluß, daß diese Morpheme einmal phonetisch auf [i] ausgegangen sein müssen. Das [i] im Auslaut bedingte die Veränderung von [t] zu [£] in diesen Morphemen. Auf der Grundlage von innerem, nicht-historischem Beweismaterial können wir in der Vorstufe das Vorhandensein eines End-[i] bei solchen Morphemen annehmen. (Wahrscheinlich enthalten sie in ihrer zugrundeliegenden phonologischen Repräsentation immer noch ein Auslaut-fi]; dieses [i] bewirkt die Veränderung von [t] zu [£] und wird später durch eine phonologische Regel getilgt). Die Grenzen der Methode der inneren Rekonstruktion sind jedoch ziemlich eng gezogen. Ein früheres strukturelles Merkmal einer Sprache kann nur dann rekonstruiert werden, wenn ein Beweisstück für seine Annahme erhalten geblieben ist, und das ist keineswegs immer der Fall. Ein naheliegendes Beispiel ist der Verlust einer lexikalischen Einheit. Wenn S einmal ein Wort [tal] besessen hat, es aber nicht mehr besitzt, ist es durchaus möglich, daß keine Merkmale des heutigen S das frühere Vorhandensein dieses Wortes vermuten lassen werden. Eine sehr viel wirkungsvollere Methode gibt es für die Untersuchung der historischen Ursprünge und der Entwicklung einer Gruppe von Sprachen, die verwandt erscheinen. Statt Einzelsprachen zu untersuchen wie bei der inneren Rekonstruktion, kann man zwei oder mehr Sprachen 193
vergleichen, um herauszufinden, wie ihre gemeinsame Vorstufe beschaffen gewesen sein muß. Wenn Q und R eine größere Ähnlichkeit miteinander zu haben scheinen als mit anderen Sprachen der vermuteten Familie, kann man sinnvollerweise die Hypothese aufstellen, daß Q und R eine Teilfamilie ausmachen, und daß sie voneinander abweichende Fortsetzungen derselben früheren Sprache sind. Indem man das Beweismaterial aus zwei oder mehr Tochtersprachen zusammenträgt und gegenüberstellt, kann man ein sehr viel klareres Bild der Proto-Sprache bekommen, als wenn man nur eine Sprache untersucht. Die Methode des Vergleichs von Schwestersprachen zum Zweck der Rekonstruktion der Proto-Sprache ist bekannt als die sprachvergleichende oder k o m p a r a t i v e M e t h o d e , die im 19. Jahrhundert entwickelt wurde. In ihrer klassischen Form betrifft die komparative Methode vor allem die Laute einer Vorstufe und deren Reflex in den Tochtersprachen. Mit dieser Methode kann man sowohl die Verwandtschaft mehrerer Sprachen nachweisen als auch die Laute der Vorstufe rekonstruieren. Natürlich müssen wir uns nicht auf die Laute beschränken, wenn wir zwei oder mehr Sprachen vergleichen. Weitgehende Ähnlichkeiten in der Morphologie zweier Sprachen können als Beweis für die Behauptung dienen, sie seien verwandt; das gleiche gilt für syntaktische Ähnlichkeiten. Außerdem können natürlich durch den Vergleich der morphologischen und syntaktischen Eigenschaften der Tochtersprachen Schlüsse über diejenigen der Proto-Sprache gezogen werden. Der Linguist ist also, wenn schriftliche Zeugnisse fehlen, nicht völlig hilflos beim Aufspüren der historischen Verwandtschaft und Entwicklung einer Gruppe von Sprachen. Die genaue Untersuchung einer einzelnen Sprache liefert ihm schon einige Hinweise auf ihre früheren Stufen. Durch den Vergleich und die Gegenüberstellung von zwei oder mehr anscheinend verwandten Sprachen kann er verschiedene Kennzeichen der Proto-Sprache feststellen; wie durch geometrische Dreiecksaufnahme kann die Proto-Sprache teilweise rekonstruiert werden. Trotzdem gibt es dabei Grenzen. Eine Proto-Sprache kann nie vollständig rekonstruiert werden, gleichgültig wie viele von ihren Tochtersprachen bekannt sind. Da man weniger über die Struktur einer ProtoSprache als über die Struktur einer lebenden Sprache herausfinden kann, sind erschlossene Vorstufen im allgemeinen nicht soweit in Einzelheiten bekannt, daß man sie für weitere Rekonstruktionen verwenden könnte. Je weiter wir auf die historischen Vorstufen einer Sprachfamilie zurückgehen, desto weniger Datenmaterial haben wir zur Verfügung. Kommen wir nochmals auf die Sprachfamilie in Abb. 8.1 zurück. 194
Nehmen wir an, die Vermutung trifft zu, daß Q und R eine Teilfamilie bilden, und daß F näher mit Q und R verwandt ist als mit den anderen Sprachen. Aus Q und R kann man die Proto-Sprache G teilweise rekonstruieren, aber man wird G viel weniger genau kennen als ihre Tochtersprachen. Demzufolge ist der Wert von G für die Rekonstruktion der Vorstufe von G und F gering. Die Rekonstruktion von B wird also nur versuchsweise und unvollständiger als die von G möglich sein. Die Rekonstruktionen von B, C, D und E enthalten vielleicht nicht genug Information, um eine Rekonstruktion von A überhaupt zu erlauben, da keine der Tochtersprachen von A direkt bekannt ist. Wegen des zunehmenden Mangels an Datenmaterial beim weiteren Zurückgehen in die Vergangenheit gibt es einen Punkt, wo alle bekannten Methoden der historischen Rekonstruktion keine verläßlichen Ergebnisse mehr liefern. Wenn schriftliche Zeugnisse vorhanden sind, ist die Lage nicht grundsätzlich verschieden. Schriftliche Zeugnisse ermöglichen es, ein wenig tiefer in die sprachliche Vergangenheit zu blicken, weil sie frühere Sprachstufen ausfuhrlicher zeigen, aber sie führen uns nur einen kurzen Weg zurück. Wir besitzen gotische Texte, die noch aus dem 6. Jahrhundert stammen, aber selbst, wenn wir so weit zurückgegangen sind, haben wir nur die Oberfläche der Sprachgeschichte angeritzt. Es dürfte nun klar sein, warum noch niemand nachgewiesen hat, daß alle menschlichen Sprachen verwandt sind. Die Behauptung, daß sie verwandt sind, kann aufgestellt werden, aber es bleibt eine leere Behauptung. Um dieser Behauptung Wert zu geben, müßte man zeigen, welche bekannten Sprachfamilien zu größeren Familien zusammengehören, welche von diesen zu noch umfassenderen Familien gehören usw., bis alle menschlichen Sprachen untergebracht wären. Auf jeder Stufe müßte man eine Proto-Sprache rekonstruieren und zeigen, daß ihre vermutlichen Tochtersprachen in einer Weise verwandt sind, die sich am besten durch die Annahme erklären ließe, daß sie auseinanderentwickelte Fortsetzungen der Vorstufe sind. Selbst wenn alle Sprachen wirklich genetisch verwandt wären (eine reine Vermutung), wäre es nicht möglich, den Stammbaum zu rekonstruieren, der sie alle verbindet, und damit ihre Verwandtheit zu beweisen. Der Zeitraum ist so groß und es handelt sich um so viele Stufen von Proto-Sprachen, daß das in den lebenden Sprachen vorhandene Datenmaterial uns nicht weit genug zurückführen kann.
195
Das Problem der Entlehnung Das ganze Bild der genetischen Verwandtschaft wird durch das Phänomen der Entlehnung noch komplizierter. Wenn eine Sprache einen Zug von einer anderen entlehnt, sind sich beide nachher ähnlicher, als sie es vorher waren. Wenn nur ein Zug oder eine Handvoll von Zügen entlehnt werden, ist die Angleichung natürlich gering. Manchmal kommt es jedoch vor, daß zwei Sprachen einander in großem Umfang beeinflussen. Wenn der wechselseitige Einfluß weitreichend genug ist, können die beiden Sprachen bei oberflächlicher Untersuchung verwandt erscheinen, was sie in Wirklichkeit nicht sind. Um falsche Hypothesen über genetische Verwandtschaft zu vermeiden, muß man genau zwischen solchen Ähnlichkeiten unterscheiden, die gemeinsamem Erbe zugeschrieben werden können, und solchen, die auf Entlehnung zuriickgehen. Das Problem, das die Entlehnung aufwirft, ist im allgemeinen aber viel diffiziler und betrifft den Vorgang der Bestimmung der genetischen Verwandtschaft einer Gruppe von Sprachen, die in der Tat verwandt sind. Das wesentliche Problem besteht darin, daß solche Züge, die durch Entlehnung eingeführt worden sind, nicht für die Rekonstruktion einer ProtoSprache herangezogen werden dürfen; das Datenmaterial, das zulässigerweise für die Rekonstruktion verwendet werden kann, wird entscheidend vermindert, wenn eine oder mehrere Tochtersprachen in großem Umfang entlehnt haben. Nehmen wir z. B. an, daß zwei Schwestersprachen einem starken lexikalischen Einfluß von Sprachen anderer Sprachfamilien ausgesetzt waren, so daß in beiden mehr als die Hälfte des einheimischen Wortschatzes ersetzt worden ist. Da die einheimischen lexikalischen Einheiten per definitionem diejenigen sind, die von lexikalischen Einheiten der Proto-Sprache abstammen, vermindert ihr Verlust notwendigerweise den Anteil der Proto-Sprache, der rekonstruiert werden kann. Dasselbe gilt, wenn eine Sprache von einer verwandten Sprache entlehnt. Derartige Entlehnungen sind sehr häufig, weil die Sprecher von abweichenden Dialekten gewöhnlich auch während der historischen Entwicklung, die zu verschiedenen Sprachen führt, weiterhin miteinander Kontakt haben; es wäre eine Idealisierung, anzunehmen, daß sich die Sprecher einer Proto-Sprache plötzlich in kleinere Sprachgemeinschaften aufspalten, zwischen denen es dann keinerlei weitere Kommunikation mehr gibt. (Es wäre ebenfalls eine Idealisierung der Verhältnisse, den Sprechern der Proto-Sprache eine völlige sprachliche Einheitlichkeit zuzuschreiben.) Wenn Q während des Vorgangs der Auseinanderentwicklung von G in großem Umfang von R entlehnt hat, dann werden die ent196
lehnten Merkmale von Q wenig Information hinzufügen, die nicht schon durch die Untersuchung von R gefunden werden kann. Außerdem stehen die Merkmale, die Q unter dem Einfluß von R abgestoßen hat, nicht für die Bestimmung des Verwandtschaftsgrades zwischen Q und R oder die Rekonstruktion der Proto-Sprache zur Verfügung. Ein gutes Beispiel dafür ist das Albanische. Da es so weitgehend aus anderen Sprachen entlehnt hat, unter anderem aus dem Griechischen, dem Slavischen und aus romanischen Sprachen, bleiben nur noch ein paar hundert einheimische Wörter übrig. Dazuhin haben sich die Flexionsendungen beträchtlich verändert. Eine Folge davon war, daß die Stellung des Albanischen in der indoeuropäischen Sprachfamilie erst relativ spät erkannt wurde.
Die komparative Methode Wir werden die komparative Methode zuerst in ihrer klassischen Form behandeln und dann unter Berücksichtigung neuerer Erkenntnisse, wobei wir von der Notwendigkeit ausgehen, die Laute einer Sprache in Beziehung zu einem System von phonologischen Regeln und zugrundeliegenden Repräsentationen zu sehen. Die klarste und einfachste Art, die komparative Methode einzuführen, ist ihre Anwendung auf ein konkretes Beispiel. Wir werden ein hypothetisches Beispiel verwenden, so daß wir das Datenmaterial auf einen übersichtlichen Umfang beschränken können; die dargestellten Phänomene sind jedoch charakteristisch für die komplexeren Fälle, wie sie in der Wirklichkeit vorkommen.
Das Datenmaterial Nehmen wir an, auf einer großen Insel im Pazifik werden vier neue Sprachen entdeckt. Zum Zwecke der Identifizierung bezeichnen wir sie als L j , L2, L3 und L4. Zusätzlich zu der weitgehenden syntaktischen und morphologischen Übereinstimmung zeigen diese Sprachen auffallende Ähnlichkeiten im Lexikon. Eine repräsentative Liste von lexikalischen Einheiten samt Bedeutung ist unten angegeben. (Das Zeichen [x] steht für einen stimmlosen velaren Reibelaut.)
197
Li
L2
L3
U
Bedeutung
[puxa] [lisu] [mani] [lana] [kaxa] [tupi] [palmufo] [samu] [matu] [nipa]
[buga] [lisu] [mani] [lana] [gaga] [dubi] [nÜi] [samu] [madu] [niba]
[puka] [risu] [meni] [rena] [kaka] [tupi] [niri] [semu] [matu] [nipa]
[puk] [Iis] [man] [rena] [kak] [tup] M] [sam] [mat] [nip]
,Baum' ,Insekt' ,Himmel' ,Stein' ,Hütte' .Donner' .Speer' .Fluß' .Pfeil' .Meer'
Man sieht auf den ersten Blick, daß die vier Sprachen lexikalische Ähnlichkeiten besitzen, die weit über das geringe Ausmaß hinausgehen, das durch Zufall entstehen kann. Wort für Wort finden wir Ähnlichkeiten der Lautform und der Bedeutung. Die Wörter für ,Baum' in den vier Sprachen, [puxa], [buga], [puka] und [puk] unterscheiden sich nur geringfügig voneinander, und das gleiche gilt für jeden „Satz" von Wörtern mit der gleichen Bedeutung. Außerdem sind die Ähnlichkeiten so durchgängig, daß man die Erklärung dafür kaum in Entlehnung suchen dürfte. Wir würden es für unwahrscheinlich halten, daß jede der drei Sprachen dermaßen einheitlich und ausnahmslos von der vierten entlehnt hätte. Die Entlehnung ist eine sehr häufige Erscheinung, aber keine sehr regelmäßige. Wenn nun Zufall und Entlehnung als sinnvolle Erklärungsmöglichkeiten für die Ähnlichkeit der vier Sprachen ausscheiden, so bleibt uns die Hypothese, daß sie genetisch verwandt sind, daß sie sich deshalb ähnlich sind, weil sie Fortsetzungen derselben historisch früheren Sprache sind, die sich auseinanderentwickelt haben. Bevor wir aber die Regularitäten des Datenmaterials eingehender untersuchen, müssen wir uns mit zwei Formen beschäftigen, die unseren Erwartungen völlig widersprechen. Das Wort für,Speer' in L i hebt sich von den anderen ab; [palmufo] hat praktisch nichts mit [nili], [niri] oder [nil], den Wörtern für .Speer' in L2, L3 und L4 gemeinsam. Außerdem scheint [palmufo] sich nicht in die sonst für L j gültigen phonologischen Prinzipien zu fügen. Sämtliche anderen Wörter in L i bestehen aus genau zwei Silben, von denen jede die Form Konsonant plus Vokal besitzt; Konsonanten treten innerhalb eines Wortes nicht nebeneinander auf. [palmufo] fällt in beiderlei Hinsicht aus dem Rahmen: es besitzt drei Silben statt 198
zwei und enthält die Konsonantenfolge [Im]. Die wahrscheinlichste Erklärung für diese Eigenheiten ist die, daß [palmufo] aus einer anderen, nicht mit L i verwandten Sprache entlehnt ist. Da es aus einer anderen Sprache stammt, besitzt es bestimmte phonologische Eigenschaften, die einheimische Wörter von L j nicht besitzen; wahrscheinlich ist es von den entlehnenden Sprechern verändert worden, aber nicht völlig. Unsere Hypothese, daß es sich bei [palmufo] um ein Lehnwort handelt, würde natürlich erhärtet, wenn wir auf der Insel eine weitere Sprache finden würden, in der [palmufo] oder eine sehr ähnliche Form das Wort für ,Speer' ist. Die andere verdächtige Form ist [rena], das Wort für,Stein' in L4. Es ist das einzige Wort in L4, das einen Vokal im Auslaut besitzt, und außerdem ist es das einzige Wort, das den Vokal [e] und den Konsonanten [r] enthält. Wenn es ein Lehnwort ist, so muß es aus einer verwandten Sprache entlehnt sein, weil die Wörter für,Stein' in L i , L2 und L3 so ähnlich sind: [lana], [lana] und [rena]. Tatsächlich ist die wahrscheinlichste Erklärung die, daß L4 das Wort für ,Stein' von L3 entlehnt hat. Das erklärt sowohl die Gleichheit der Wörter in den beiden Sprachen als auch die Eigentümlichkeit von [rena] im Hinblick auf die phonologischen Eigenschaften von L4. [rena] ist für L3 ein keineswegs ungewöhnliches Wort, [r] und [e] kommen auch in anderen Wörtern von L3 vor, und es ist auch ganz normal, daß ein Wort in L3 einen Vokal im Auslaut besitzt. Da [palmufo] und [rena] durch Entlehnung in L i und L4 geraten sind, können sie nicht vollgültig für die Rekonstruktion der Proto-Sprache herangezogen werden. Das so reduzierte Datenmaterial, von dem wir ausgehen können, ist im folgenden angegeben: Li
L2
L3
U
Bedeutung
[puxa] [lisu] [mani] [lana] [kaxa] [tupi]
[buga] [lisu] [mani] [lana] [gaga] [dubi] [nüi] [samu] [madu] [niba]
[puka] [risu] [meni] [rena] [kaka] [tupi] [niri] [semu] [matu] [nipa]
[puk] [Iis] [man]
,Baum' ,Insekt' ,Himmel' ,Stein' ,Hütte' ,Donner' ,Speer' ,Fluß' ,Pfeil' ,Meer'
[samu] [matu] [nipa]
[kak] [tup] [nü] [sam] [mat] [nip]
199
Lautliche Entsprechungen Die entscheidende Feststellung im Hinblick auf dieses Datenmaterial ist nicht, daß die Wörter für die jeweils gleichen Begriffe sich in den vier Sprachen ähneln, sondern daß die Ähnlichkeiten und Unterschiede festen Mustern folgen.Die Laute der vier Tochtersprachen e n t s p r e c h e n sich völlig regelmäßig. Nehmen wir etwa den Laut [m]. das Wort für,Himmel' in L i beginnt mit [m]; das gleiche gilt für die entsprechenden Wörter in den anderen drei Sprachen: [mani], [mani], [meni], [man]. Das Wort für ,Fluß' hat [m] als drittes Segment nicht nur in einer oder zwei der Sprachen, sondern in allen. Alle Wörter f ü r , P f e i l ' haben [m] im Anlaut. Ein [m] in L j entspricht ohne Ausnahme einem [m] in L 2 , L3 und L 4 . Die sich entsprechenden Laute sind also in den vier Sprachen [m]-[m]-[m]-[m]. Weitere regelmäßige Lautentsprechungen sind [n]-[n]-[n]-[n] und [s]-[s]-[s][s]. Bei jedem Wort, das in L i [n] enthält, enthalten die entsprechenden Wörter in den anderen Sprachen auch [n], und zwar in derselben Position. So finden wir [mani], [mani], [meni], [man] für,Himmel' und [nipa], [niba], [nipa], [nip] für ,Meer'. Für die Wörter für .Stein' und ,Speer' können wir uns nur auf das Datenmaterial aus drei Sprachen beziehen, aber die verfügbaren Formen folgen demselben Muster: [lana], [lana], [rena]; [nili], [niri], [nil]. In derselben Weise entspricht [s] in einer Sprache dem [s] in den drei anderen. Alle vier Wörter für,Insekt' haben [s] als drittes Segment, und alle vier Wörter für ,Fluß' haben [s] als Anlaut-Segment: [lisu], [lisu], [risu], [Iis]; [samu], [samu], [semu], [sam]. Diese Entsprechungen sind also völlig regelmäßig. Eine vierte ausnahmslose Entsprechung ist [l]-[l]-[r]-[l]. In jeder Position, in der L i [1] hat, haben es auch L2 und L 4 ; in der entsprechenden Position hat L 3 immer [r]. Neben [lisu] in L i finden wir demnach [lisu], [risu] und [Iis] in L 2 , L 3 und L4. Das Datenmaterial f ü r , S t e i n ' und ,Speer' ist unvollständig, aber die vorhandenen Wörter passen sich genau dem Muster an. Beachten Sie, daß eine lautliche Entsprechung völlig regelmäßig sein kann, auch wenn die Elemente der Entsprechung von Sprache zu Sprache verschieden sind. L 3 unterscheidet sich von den anderen Sprachen darin, daß es statt [1] ein [r] hat, aber dieser Unterschied ist völlig systematisch. Man kann die Formel [l]-[l]-[r]-[l] aufstellen, die für alle lexikalischen Einheiten der Schwestersprachen gleichermaßen gilt, und gerade diese Regelmäßigkeit ist für die Rekonstruktion der Proto-Sprache von größtem Interesse, von größerem Interesse als phonetische Identität.
200
Zwei weitere völlig regelmäßige Entsprechungen dieser Art sind [p][b]-[p]-[p] und [t]-[d]-[t]-[t], Aus den Wörtern für ,Baum', .Donner' und ,Meer' können wir erkennen, daß jedesmal, wenn ein Wort in L i [p] hat, das entsprechende in L2 in dieser Position [b] hat; die entsprechenden Formen in L3 und L4 stimmen mit L i überein. ,Baum' ist z. B. wiedergegeben als [puxa], [buga], [puka] und [puk],,Donner' als [tupi], [dubi], [tupi] und [tup]. Die letztere Serie illustriert auch die Entsprechung [t][d]-[t]-[t], die auch die Wörter für,Pfeil' zeigen: [matu], [madu], [matu] und [mat]. Wir haben nun sechs vollständig regelmäßige Entsprechungen festgestellt: [m]-[m]-[m]-[m]; [n]-[n]-[n]-[n]; [s]-[s]-[s]-[s]; [l]-[l]-[r]-[l]; [p]-[b][p]-[p] und [t]-[d]-[t]-[t]. Wenn wir jedoch noch weitere suchen, scheinen sich Ausnahmen zu zeigen. Nehmen wir etwa den Laut [k] in L3. Auf der Grundlage des Wortes für ,Baum' scheint [k] in L3 [x], [g] und [k] in L i , L2 und L4 zu entsprechen: [puxa], [buga], [puka], [puk]. Wir würden also die Entsprechung [x]-[g]-[k]-[k] aufstellen. Auf der Grundlage dieser Formel und des Wortes für,Hütte' in L 3 , [kaka], würden wir als parallele Wörter in den anderen drei Sprachen [xaxa], [gaga] und [kak] erwarten (wobei es zunächst einmal nur um die Konsonanten geht). Unsere Erwartungen werden jedoch nicht ganz erfüllt, da das Wort in L i nicht [xaxa] sondern [kaxa] lautet. Der anlautende Konsonant widerspricht dem Muster. Das bedeutet, daß manche (aber nicht alle) Entsprechungen relativ zu einer bestimmten phonologischen Umgebung angegeben werden müssen. In unserem Fall gilt die Entsprechung [x]-[g]-[k]-[k], aber nur wenn wir die anlautenden Konsonanten ausschließen. Die nicht-anlautenden velaren Konsonanten in [kaxa], [gaga], [kaka] und [kak] stimmen vollkommen mit dem in den Wörtern für ,Baum' entdeckten Muster überein. Für die anlautenden velaren Konsonanten braucht man eine andere Formel, nämlich [k]-[g]-[k]-[k]. Wir erwarten nun, daß andere ,Sätze' von Wörtern diese umgebungsabhängige Entsprechung bestätigen; so zeigen etwa die vier entsprechenden Wörter [kili], [gili], [kiri] und [kil], daß das Wort für ,Hütte' in L i keine Ausnahme darstellt. In der gleichen Weise hängen auch die Entsprechungen für die Vokale [u] und [i] von spezifischen phonologischen Umgebungen ab. Aus den Wörtern für ,Baum' und ,Meer' könnte man die Entsprechungen [u]-[u][u]-[u] und [i]-[i]-[i]-[i] ableiten: [puxa], [buga], [puka], [puk]; [nipa], [niba], [nipa], [nip]. In beiden ,Sätzen' von Wörtern erscheint der betreffende Vokal in nicht-auslautender Stellung. Ein Blick auf die Wörter von L4 zeigt jedoch, daß für Vokale im Wortauslaut für L4 eine besondere 201
Regel gelten muß, da solche Vokale in L4 nicht vorkommen. Die Wörter für ,Fluß', [samu], [samu], [semu] und [sam] zeigen, daß die [u]-Serie im Wort-Auslaut [u]-[u]-[u]-[ ] lautet, wobei die leere Klammer das Fehlen eines Segments anzeigt. Dasselbe findet sich in der [i]-Serie: [i]-[i]-[i]-[ ] ergibt sich aus den Wörtern für,Himmel', [mani], [mani], [meni], [man]. Vergleichbar ist die [a]-Serie im Wort-Auslaut; aus [nipa], [niba], [nipa], [nip] schließen wir, daß die Serie [a]-[a]-[a]-[ ] lauten muß. Das bestätigen auch die Wörter für ,Baum' und ,Hütte'. In anderen Fällen entspricht aber dem [a] in L i , L2 und L4 manchmal [a] in L3 und manchmal [e]. So gibt es etwa [matu], [madu], [matu] und [mat] für ,Pfeil', aber [mani], [mani], [meni] und [man] für ,Himmel'. Ist dies nun eine Unregelmäßigkeit im System der Entsprechungen, oder gibt es ein allgemeines Prinzip, das bestimmt, wann in L3 [a] steht und wann [e]? Untersuchen wir die Wörter in L3, so bemerken wir, daß [e] nur vor nasalen Konsonanten auftritt und [a] nie vor Nasalen: [puka], [meni], [rena], [kaka], [semu], [matu], [nipa]. Das Variieren zwischen [a] und [e] bei dem Gegenstück zum [a] der anderen Sprachen erweist sich also nicht als Unregelmäßigkeit, sondern vielmehr als eine Regelmäßigkeit niedrigerer Ordnung. Die Entsprechung lautet [a]-[a]-[e]-[a] vor Nasal und [a]-[a]-[a]-[a] in allen anderen Stellungen. Die von uns gefundenen Entsprechungen sind in der folgenden Tabelle zusammengefaßt: [m]-[m]-[m]-[m] (1) [n]-[n]-[n]-[n] (2) [s]-[s]-[s]-[s] (3) [l]-[l]-[r]-[l] (4) (5) [p]-[b]-[p]-[p] [t]-[d]-[t]-[t] (6) [k]-[g]-[k]-[k] (7a) (im Wortanlaut) (7b) [x]-[g]-[k]-[k] (sonst) (8a) [u]-[u]-[u]-[ ] (im Wortauslaut) (8b) [u]-[u]-[u]-[u] (sonst) (9a) (im Wortauslaut) [i]-[i]-[i]-[ ] (9b) [i]-[i]-[i]-[i] (sonst) (10a) [a]-[a]-[a]-[ ] (im Wortauslaut) (10b) [a]-[a]-[e]-[a] (vor Nasal) (10c) [a]-[a]-[a]-[a] (sonst) Die Wörter der vier Schwestersprachen sind im Hinblick auf ihre phonetische Gestalt durch diese Formel aufeinander bezogen. Diese Aufstel202
lung der Regelmäßigkeiten ermöglicht es uns, die Lautform eines Wortes in einer Sprache vorherzusagen, wenn wir seine Aussprache in den Schwestersprachen kennen. Das einheimische Wort für,Speer' in L i , das durch das Lehnwort [palmufo] ersetzt worden war, könnten wir ohne Schwierigkeit aus den entsprechenden Wörtern der Schwestersprachen [nili], [niri] und [nil], erschließen; hätte sich das Wort erhalten, so müßte seine Lautform [nili] sein. Ebenso können wir aus den Formen [lana], [lana] und [rena] schließen, daß das einheimische Wort für,Stein' in L4 [lan] gelautet hätte, wenn es nicht durch das Lehnwort [rena] ersetzt worden wäre.
Die Regelmäßigkeit des Lautwandels Durch das Ausschließen anderer Möglichkeiten sind wir weiter oben zu dem Ergebnis gekommen, daß die Ähnlichkeiten zwischen den vier Sprachen auf genetische Verwandtschaft zurückzufuhren sein müssen. Wir wollen nun ausdrücklich die Hypothese aufstellen, daß sie auseinanderentwickelte Fortsetzungen derselben Proto-Sprache sind, die wir PL nennen wollen, wie Abb. 8.2 zeigt. Die beobachteten Regelmäßigkeiten lasPL L,
L,
L3
L4
Abb. 8.2
sen sich zum Teil durch diese Hypothese erklären; es ist z. B. nicht verwunderlich, daß die Wörter für ,Baum' in den Tochtersprachen ähnlich lauten, da sie alle auf dieselbe Form zurückgehen, das Wort für ,Baum' in PL. Trotzdem erklärt die Hypothese der genetischen Verwandtschaft allein noch nicht das Vorhandensein von systematischen Lautentsprechungen. Es wäre durchaus vorstellbar, daß zwar jeder „Satz" von Wörtern ähnlich, aber die Art der Ähnlichkeiten in jedem „Satz" wieder verschieden wäre. Dies wäre der Fall, wenn sich jedes einzelne Wort der Proto-Sprache individuell entwickeln würde. Anlautendes [m] z. B. könnte sich in dem Wort für,Himmel' auf die eine Art entwickeln und in dem Wort für,Pfeil' auf die andere Art. Wenn die Veränderungen 203
bei den Lauten einer Proto-Sprache ganz individuell verschieden oder charakteristisch für einzelne lexikalische Einheiten wären, könnte man niemals systematische Lautentsprechungen finden, die die Wörter der Tochtersprachen verbinden und für alle Sätze von Wörtern gleicher Herkunft gleichermaßen gelten. Um also das Vorhandensein systematischer Lautentsprechungen erklären zu können, benötigen wir eine Doppel-Hypothese. Zu der Hypothese der genetischen Verwandtschaft müssen wir noch die weitere hinzufügen, daß der Lautwandel grundsätzlich regelmäßig verläuft. Wenn anlautendes [m] von PL in dem Wort für,Himmel' in Li als [m] erscheint, so wird es in allen Wörtern von Li so erscheinen. Wenn ein [a] von PL in L3 als [e] erscheint, falls das darauffolgende Segment ein Nasal ist, dann wird [a] in dieser Umgebung immer als [e] erscheinen. Es mag vereinzelte Ausnahmen geben, wie es sie für jede Regel gibt, aber im ganzen betrachten wir den Lautwandel als regelmäßigen Vorgang. Der gemeinsame Ursprung jedes der Sätze von Wörtern im Verein mit der Annahme, daß der Lautwandel regelmäßig verläuft, erklärt sowohl die phonetische Ähnlichkeit der Wörter eines jeden Satzes als auch die Tatsache, daß sie durch Entsprechungsformeln systematisch verbunden sind, die für alle Wörter gemeinsamer Herkunft gelten. Einen Satz von genetisch in dieser Weise verwandten Wörtern können wir kurz als einen v e r w a n d t e n Satz bezeichnen; die Elemente eines solchen Satzes sind v e r w a n d t e Wörter. Die Wörter der Tochtersprachen für ,Baum' bilden etwa einen verwandten Satz; [puxa], [buga], [puka] und [puk] sind verwandte Wörter. Für jeden verwandten Satz gibt es per definitionem eine Proto-Form, auf die alle auseinanderentwickelten Formen zurückgehen. Der nächste Schritt besteht in dem Versuch der Rekonstruktion dieser Proto-Formen; weiterhin muß man die Lautveränderungen feststellen, die in der Entwicklung der einzelnen Tochtersprachen stattgefunden haben.
Die Rekonstruktion Das Vorhandensein von verwandten Sätzen, die durch systematische Lautentsprechungen miteinander verbunden sind, gibt starkes Beweismaterial für die genetische Verwandtschaft der vier Sprachen ab. Der nächste Schritt der komparativen Methode — die Teilrekonstruktion der Proto-Sprache und die Feststellung der Lautveränderungen — bestätigt weiter unsere Hypothese. Er zeigt im einzelnen, daß es sinnvoll
204
ist, die beobachteten Regelmäßigkeiten unter dem Aspekt der genetischen Verwandtschaft zu deuten, da er erkennen läßt, daß es in der Tat eine derartige Proto-Sprache gegeben haben kann, die dann durch einleuchtende Lautveränderungen in die Tochtersprachen auseinandergefallen wäre. Für jede Lautentsprechung können wir einen Segmenttyp in der Proto-Sprache aufstellen. Wenn die Entsprechung von einer bestimmten phonologischen Umgebung abhängt, gilt dieselbe Abhängigkeit auch für den rekonstruierten Segmenttyp. Nehmen wir die Entsprechung [m]-[m]-[m]-[m]. Wann immer [m] in einem Wort einer der Tochtersprachen auftaucht, enthalten seine verwandten Wörter auch [m], und zwar in derselben Position. Man kann sinnvollerweise annehmen, daß diese Übereinstimmung daherkommt, daß das zugrundeliegende Wort in der Proto-Sprache in dieser Position auch [m] enthielt. Die Annahme ist also mit anderen Worten die, daß [mani], [mani], [meni] und [man] deshalb mit [m] beginnen, weil das Wort für .Himmel' in der Proto-Sprache auch mit [m] begann; oder daß das dritte Segment in [samu], [samu], [semu] und [sam] immer [m] ist, weil das dritte Segment des Wortes für ,Fluß' in der Proto-Sprache [m] war usw. Als Ausgangsform für das Segment [m] in den Tochtersprachen rekonstruieren wir also das Segment *[m] in PL. (Das Sternchen setzt man immer vor rekonstruierte Einheiten, solche also, die nicht direkt beobachtet worden sind.) Das Ergebnis ist in Abb. 8.3 wiedergegeben. In diesem Fall haben keine Lautveränderungen stattgefunden, die das rekonstruierte Element hätten betreffen können. In ähnlicher Weise können wir für PL die Segmente *[n] und *[s] rekonstruieren. Das erste liegt der in den Tochtersprachen beobachteten Entsprechung [n]-[n]-[n]-[n] zugrunde, das zweite der Serie [s]-[s]-[s]-[s]. Wiederum zeigen die betreffenden Proto-Segmente keine Lautveränderung, da ihre R e f l e x e — ihre Realisierungen in den Tochtersprachen — einheitlich sind. Diese Einheitlichkeit fehlt in der Entsprechung [l]-[l]-[r]-[l]. Der Reflex des Proto-Segments in L3stimmt nicht mit den Reflexen in den anderen Tochtersprachen überein. Welches Segment sollen wir nun als Grundlage dieser Entsprechung rekonstruieren? Die wichtigste Vorbedingung ist, daß das rekonstruierte Segment in der Lage gewesen sein muß, sich sowohl zu [1] als auch zu [r] historisch zu entwickeln, da wir ja gerade eine derartige Entwicklung behaupten. Auf dieser Grundlage allein könnte man entweder fl] oder [r] als Proto-Segment ansetzen, da die beiden Laute sich sehr ähnlich sind und der Wechsel zwischen [1] und 205
*[m] [m]
[m]
[m]
Abb. 8.3
[m]
[I]
[I]
[r]
[I]
Abb. 8.4
[r] ein häufiges sprachliches Phänomen ist; d. h., [1] verändert sich oft zu [r], und auch die umgekehrte Entwicklung kommt vor. Als Grundlage der Serie [l]-[l]-[r]-[l] rekonstruieren wir *[1], wie es Abb. 8.4 zeigt. Indem wir diese Entscheidung treffen, behaupten wir implizit, daß zu der Entwicklung von PL zu L3 unter vielen anderen Dingen auch der Wandel von [1] zu [r] gehört. Diese Annahme ist etwas sinnvoller als die umgekehrte. Wenn wir stattdessen *[r] rekonstruieren, behaupten wir, daß sich [r] in Li, L2 und L4 unabhängig zu [l]entwickelt hätte und nur in L3 bewahrt worden sei. Obgleich dies nicht unmöglich ist, ist es doch etwas weniger wahrscheinlich als die einzelne Veränderung von [1] zu [r]. Aus diesem Beispiel können wir sehen, daß es nicht immer möglich ist, mit Sicherheit anzugeben, welches die genaue phonetische Form eines Proto-Segments gewesen sein muß. Wir müssen natürlich einen einzigen Segmenttyp als Grundlage für die Reflexe in den Tochtersprachen annehmen, aber von einem gewissen Punkt an bleibt die Frage nach seiner genauen Form Spekulation. Die nächsten zwei Entsprechungen stellen uns vor ähnliche Probleme, und wir werden eine ähnliche Lösung vorschlagen — die Mehrheit gibt den Ausschlag, es sei denn, das Gegenteil wäre zu erweisen. Für [p]-[b][p]-[p] rekonstruieren wir *[p], und für [t]-[d]-[t]-[t] rekonstruieren wir *[t]. Bei jeder Rekonstruktion setzen wir voraus, daß ein Lautwandel in L2 stattgefunden hat und zwar von [p] zu [b] und von [t] zu [d]. Es ist die einfachere Lösung, die Veränderungen in L2 anzusetzen, als [b] und [d] als die ursprünglichen Formen vorauszusetzen. Bei der letzteren Annahme müßten wir parallele Neuerungen in Li, L3 und L4 voraussetzen, was etwas weniger wahrscheinlich ist. Die Entsprechung [k]-[g]-[k]-[k] ist auf die Anlaut-Position beschränkt. Nach dem eben verwendeten Argumentationsschema können wir für PL in dieser Position *[k] rekonstruieren, wobei wir gleichzeitig in L2 einen Wandel von [k] zu [g] annehmen. Wenn unsere Rekonstruktion von *[p] und *[t] richtig war, dann muß 206
der dritte rekonstruierte Verschlußlaut fast notwendig *[k] sein und nicht *[g]. Der Grund dafür ist die Tatsache, daß das Inventar der in einer Sprache verwendeten Laute in vielen Fällen eine gewisse Symmetrie zeigt, vor allem im Hinblick auf Verschlußlaute, Reibelaute und Nasale. Es ist sehr häufig, daß Sprachen drei stimmlose Verschlußlaute haben, etwa [p t k], aber es ist äußerst selten, daß eine Sprache zwei stimmlose und einen stimmhaften Verschlußlaut besitzt, etwa [p t g]. Unsere rekonstruierten Verschlußlaute [p t k] tragen dieser Tendenz zur Symmetrie Rechnung. Besaß PL den Verschlußlaut *[k] im Anlaut, so kam derselbe Laut wahrscheinlich auch in nicht-anlautender Position vor. Deshalb liegt dasselbe Segment auch der Entsprechung [x]-[g]-[k]-[k] zugrunde. Beide Entsprechungen kommen in dem verwandten Satz für ,Hütte' vor: [kaxa], [gaga], [kaka] und [kak]. Das Proto-Wort für,Hütte' enthielt offensichtlich das *[k] zweimal. Beide Vorkommen sind in den Wörtern von L3 und L4 bewahrt; [k] war in diesen Sprachen keinem Lautwandel unterworfen. Der Lautwandel in L2 war auf keine besondere Umgebung beschränkt; in allen Umgebungen wurde [k] zu [g]. Deshalb finden sich beide Vorkommen von *[k] in dem Proto-Wort als [g] in dem entsprechenden Wort in L2. Dagegen muß in Li eine Lautveränderung stattgefunden haben, die von der jeweiligen Umgebung abhing: zwischen zwei Vokalen wurde [k] zu [x]. Das anlautende [k] wurde bewahrt, während das intervokalische [k] eine Veränderung durchmachte und in L j als [x] erschien. Diese Situation ist in Abb. 8.5 dargestellt. Der angenommene Lautwandel ist ganz einsichtig, denn es kommt häufig vor, daß ein Verschlußlaut zum Reibelaut wird, vor allem, wenn er zwischen Vokalen steht. Die umgekehrte Entwicklung, daß ein Reibelaut zum Verschlußlaut wird, ist weniger gewöhnlich. *[k]
[x|
[fll
W
[k]
Abb. 8.5
Wir kommen nun zu den Vokal-Entsprechungen. Wir haben im Auslaut die Entsprechung [u]-[u]-[u]-[ ] gefunden, während in anderen Umgebungen [u]-[u]-[u]-[u] gilt. Die naheliegende Lösung ist, *[u] für alle 207
Positionen der Proto-Sprache anzusetzen, wobei für L4 ein besonderer Lautwandel anzunehmen ist: [u] im Auslaut geht verloren. Dieselbe Lösung ist für die beiden Entsprechungen mit [i] angemessen, nämlich [i][i]-[i]-[ ] im Auslaut und [i]-[i]-[i]-[i] in den anderen Positionen. Das Proto-Segment war zweifellos *[i], und L4 zeigt folgenden Lautwandel: [i] im Auslaut geht verloren. Für [a] haben wir drei Entsprechungen gefunden. Im Auslaut war die Entsprechung [a]-[a]-[a]-[ ], vor Nasalen [a]-[a]-[e]-[a] und sonst [a]-[a][a]-[a]. Für jede Entsprechung setzen wir das Proto-Segment *[a] an. Folgende zwei Lautveränderungen erklären dann das Datenmaterial: in L3 wurde [a] vor Nasal zu [e]; in L4 ging [a] im Auslaut verloren. Es leuchtet unmittelbar ein, daß diese Lösung einfacher und vernünftiger ist als jede naheliegende Alternative. Alles in allem haben wir jetzt die zehn Proto-Wörter rekonstruiert, die dem Datenmaterial zugrundliegen, von dem wir ausgegangen sind. Jedes Segment im Datenmaterial ist durch eine Entsprechung erklärt worden, und wir haben für jede Entsprechung ein Proto-Segment rekonstruiert. Zur Rekonstruktion der Proto-Wörter müssen wir nur noch das zusammentragen, was wir schon gefunden haben. Die rekonstruierten Proto-Wörter sind in der folgenden Tabelle zusammen mit ihren verwandten Sätzen angegeben, und die postulierten Lautveränderungen, die die verwandten Sätze von den Proto-Wörtern ableiten, sind nochmals aufgeführt. PL
Li
L2
L3
*[puka] *[lisu] *[mani] *[lana] *[kaka] * [tupi] *[nili] *[samu] *[matu] *[nipa]
[puxa] [lisu] [mani] [lana] [kaxa] [tupi]
[buga] [lisu] [mani] [lana] [gaga] [dubi] [nili] [samu] [madu] [niba]
[puka] [risu] [meni] [rena] [kaka] [tupi] [niri] [semu] [matu] [nipa]
In In In In 208
Lj L2 L3 L4
[samu] [matu] [nipa]
u [puk] [Iis] [man] [kak] [tup] [nil] [sam] [mat] [nip]
Bedeutung ,Baum' ,Insekt' ,Himmer .Stein' ,Hütte' ,Donner' ,Speer' ,Fluß' ,Pfeil' ,Meer'
wurde [k] zwischen Vokalen zu [x]. wurde [pj zu [b], [t] zu [d] und [k] zu [g]. wurde [1] zu [r], und [a] vor Nasal zu [e]. fielen [u], [i] und [a] im Auslaut aus.
Zur Erläuterung wollen wir einige Beispiele durchsprechen. Wir werden die Proto-Wörter für ,Baum' und ,Stein' rekonstruieren und dann die rekonstruierten Formen in ihrer historischen Entwicklung verfolgen. Der verwandte Satz für ,Baum' lautet [puxa], [buga], [puka] und [puk]. Das anlautende Segment dieser Formen zeigt die Entsprechung [p]-[b]-[p]-[p], für die wir *[p] rekonstruiert haben. Für die Entsprechung [u]-[u]-[u]-[u] haben wir *[u] rekonstruiert: das zweite Segment des Proto-Worts muß also *[u] gewesen sein. Die letzten beiden Segmente zeigen die Entsprechungen [x]-[g]-[k]-[k] und [a]-[a]-[a]-[ ], für die wir *[k] bzw. *[a] rekonstruiert haben. Setzen wir die Segmente zusammen, so stellen wir fest, daß das Proto-Wort für ,Baum' *[puka] gewesen sein muß. Auf dem Wege ihrer Entwicklung von PL erfuhr L i eine Lautveränderung: [k] wurde zwischen Vokalen zu [x]. Eine spezielle Auswirkung dieser Veränderung ist es, daß * [puka] in L i als [puxa] realisiert wird. Wir beachten dabei, daß dieser Wechsel regelmäßig war, also alle Morpheme mit intervokalischem [k] betraf. Entsprechend entwickelte sich *[kaka] in L i zu [kaxa]. Zwei der Lautveränderungen in L2 werden bei *[puka] wirksam: [p] wurde zu [b] und [k] zu [g]. Das Ergebnis dieser regelmäßigen Veränderungen ist das Wort [buga] in L2. Von den für L3 charakteristischen Lautveränderungen betraf keine [puka], so daß das Wort für ,Baum' in L3 mit dem der Proto-Sprache identisch ist. Schließlich wurde *[puka] durch den Verlust des [a] in Auslautposition in L4 zu [puk]. Für .Stein' stehen nur drei verwandte Wörter zur Verfügung, [lana], [lana] und [rena], aber das fuhrt zu keiner Schwierigkeit beim Erschließen der Proto-Form. Das erste Segment steht für die Entsprechung [l]-[l]-[r][1], das zweite für [a]-[a]-[e]-[a], das dritte für [n]-[n]-[n]-[n] und das vierte für [a]-[a]-[a]-[ ]. Die rekonstruierten Proto-Segmente sind jeweils *[1], *[a], *[n], *[a]. Das Wort für ,Baum in PL muß also *[lana] gewesen sein. Die Form [lana] hat sich sowohl in L i als auch in L2erhalten, weil die Lautveränderungen in diesen Sprachen nur die Verschlußlaute betrafen. Beide Lautveränderungen in L3 wurden bei *[lana] wirksam: [1] wurde zu [r], und [a] wurde vor Nasal zu [e]. Folglich ist das Wort für ,Stein' in L3 [rena]. Das Wort in L4 wurde durch Entlehnung ersetzt, aber die von uns gezeigten Prinzipien lassen erkennen, daß es [lan] gelautet hätte, wenn es erhalten geblieben wäre, da auslautendes [a] in L4 regelmäßig ausfiel. Man kann bei der klassischen Form der komparativen Methode also 209
mehrere Schritte unterscheiden. Zuerst werden offensichtlich verwandte Wörter isoliert. Dann werden die systematischen Lautentsprechungen, die die verwandten Sätze verbinden, aufgedeckt. Drittens werden auf der Basis der verwandten Sätze Wörter der Proto-Sprache rekonstruiert. Viertens werden die Lautveränderungen festgestellt, die in der Entwicklung von der Proto-Sprache zu den Tochtersprachen stattgefunden haben. Diese Veränderungen müssen die Entwicklung eines jeden Satzes von verwandten Formen aus der gemeinsamen Proto-Form erklären. Darüberhinaus muß die Proto-Sprache, soweit sie rekonstruiert werden kann, einer natürlichen Sprache gleichen, und die postulierten Lautveränderungen müssen einleuchtend sein, d. h. Veränderungen, von denen man weiß, daß sie vorkommen. Wenn man nach diesen Schritten vorgegangen ist und alle Bedingungen erfüllt sind, hat man zweierlei erreicht: man hat gezeigt, daß die vermutlichen Schwestersprachen wirklich genetisch verwandt sind, und man hat die Proto-Sprache teilweise rekonstruiert. Natürlich ist die historische Rekonstruktion nicht immer so einfach wie man aus unserem hypothetischen Beispiel vielleicht schließen möchte. In natürlichen Sprachen handelt es sich um eine viel größere Anzahl von Lautsegmenten; nur selten ist die Zahl der Lücken im Datenmaterial so gering; normalerweise ist es nicht so einfach, entlehnte Formen zu erkennen; die Lautveränderungen, die für die Ableitung der Tochtersprachen von der Vorstufe verantwortlich sind, sind gewöhnlich viel zahlreicher; auch syntaktisches und morphologisches Material muß berücksichtigt werden; es gibt keine Methode, wie man von vornherein bestimmen könnte, ob und wie die verwandten Sprachen sich zu Gruppen ordnen — diese Liste von Problemen könnte noch verlängert werden. Trotzdem lassen sich die hier vorgeführten Prinzipien in vollem Umfang auf das Datenmaterial natürlicher Sprachen anwenden. Die komparative Methode ist ein funktionstüchtiges Werkzeug zur Feststellung der genetischen Verwandtschaft einer Gruppe von Sprachen und zur Rekonstruktion von Proto-Formen.
Interpretation des Lautwandels In unserem hypothetischen Beispiel ist es uns gelungen, die genetische Verwandtschaft festzustellen und Proto-Formen zu rekonstruieren, ohne je unter die phonetische Oberfläche hinabzugehen. Wir sind ausgegangen von den phonetischen Formen der Tochtersprachen, ohne jemals ihre zugrundeliegenden Repräsentationen oder die für ihre Realisierung verant-
210
wortlichen phonologischen Regeln zu berücksichtigen. Bei dieser Art des Vorgehens entdeckten wir eine recht erstaunliche Tatsache: Der Lautwandel verläuft regelmäßig. Wenn [a] in L3 vor Nasal zu [e] wurde, so galt das für samtliche Wörter, in denen [a] vor Nasal auftrat und nicht nur für einige. Die Veränderung von [a] zu [e] war nicht auf einzelne Morpheme beschränkt, sondern traf auf alle Morpheme der Sprache zu. Die gemeinsamen Proto-Formen und die Regelmäßigkeit des Lautwandels erklären die beobachteten Entsprechungen, die verwandte Wörter in den Tochtersprachen miteinander verbinden und auch die Glieder jedes verwandten Satzes in der gleichen Weise verbinden. Da die Entwicklung von den gemeinsamen Proto-Formen regelmäßig verläuft, sind verwandte Wörter ihrer phonologischen Gestalt nach in einem regelhaften Muster miteinander verbunden. Aber warum sollte der Lautwandel regelmäßig verlaufen? Die regelhafte Natur des Lautwandels war eine revolutionäre Entdeckung der Philologen des 19. Jahrhunderts, die die komparative Methode entwickelten, aber sie gaben nie eine zufriedenstellende Erklärung dafür, warum es so ist. Um dies zu erreichen, müssen wir das Ganze nochmals unter dem Aspekt der in Kapitel 6 dargelegten neueren Betrachtungsweise von phonologischen Systemen interpretieren. Wenn man das phonetische Datenmaterial, von dem wir ausgehen, als Realisierungen von abstrakten zugrundeliegenden Repräsentationen durch phonologische Regeln betrachtet, so wird die Regelmäßigkeit des Lautwandels recht einsichtig. Lassen Sie uns nochmals das Datenmaterial untersuchen, das den Wechsel von [a] zu [e] vor Nasal in L3 illustriert. Die zehn für L3 vorhandenen Formen lauten [puka], [risu], [meni], [rena], [kaka], [tupi], [niri], [semu], [matu] und [nipa]. Phonetisch kennt L3 sowohl [a] als auch [e]. Wir stellen jedoch fest, daß der Unterschied zwischen den beiden nicht distinktiv ist. Es gibt keine zwei Morpheme, die nur dadurch unterschieden werden, daß das eine [a] in einer Position hat, in der das andere [e] hat. Außerdem könnte das auch gar nicht der Fall sein (wenn wir unsere kleine lexikalische Auswahl als charakteristisch für die ganze Sprache ansehen). Da [e] nur vor Nasalen und [a] nie vor Nasalen auftritt, kann der Unterschied zwischen [e] und [a] in irgendeiner Position niemals der einzige Zug sein, der zwei Morpheme unterscheidet. Also ist [e] in L3 nichts anderes als eine Realisierungsvariante von [a]. Es ist die Form, die [a] sichtbar annimmt, wenn das folgende Segment ein Nasal ist. In den zugrundeliegenden Repräsentationen werden [e] und [a] nicht unterschieden, weil sie nicht distinktiv sind. Der erste Vokal in [semu] und [matu] würde einfach als tief aufgeführt (um [a] / [e] 211
von den hohen Vokalen [i u] zu unterscheiden). In den meisten Fällen wird ein tiefer Vokal endgültig als [a] angegeben wie in [matu]. Das [e] in [semu] ergibt sich aber aus der Anwendung der folgenden Regel von L3: ein tiefer Vokal wird vor Nasal als mittlerer Vordervokal realisiert. Verwenden wir zur Charakterisierung eines tiefen Vokals [a], so können wir die zugrundeliegende Repräsentation als [samu] angeben, wobei die angeführte Regel für die Oberflächenrealisierung [semu] verantwortlich ist. Entsprechend gehen [meni] und [rena] auf die abstrakteren Repräsentationen [mani] und [rana] zurück. Es gibt also in L3 einen zugrundeliegenden Segmenttyp [a] (d.h., einen tiefen Vokal) und eine phonologische Regel, die besagt, daß [a] vor Nasal als [e] realisiert wird. Wenn wir uns nun der Proto-Sprache PL zuwenden, so stellen wir fest, daß es dort überhaupt kein [e] gibt, sondern nur den rekonstruierten tiefen Vokal *[a], über dessen genaue Aussprache man nur Vermutungen anstellen kann. Vergleichen wir nun L3 mit ihrer Vorstufe PL, so finden wir als einzigen Unterschied im Vokalismus die Tatsache, daß es in L3 eine Regel gibt, die [a] als [e] realisiert. Im Hinblick auf die zugrundeliegende Repräsentation der betreffenden Vokalsegmente sind die beiden Stufen identisch; auf beiden Stufen reicht es aus, den Vokal als tief anzugeben. In PL wurde vermutlich ein zugrundeliegender tiefer Vokal immer als tiefer Vokal realisiert (zumindest gibt es keine Indizien für das Gegenteil); in L3 kann ein tiefer Vokal entweder als mittlerer oder als tiefer Vokal realisiert werden, je nach phonologischer Umgebung. Wir haben vorher gesagt, daß L3 in seiner Entwicklung von PL her einen Lautwandel durchgemacht hat, nämlich die Veränderung von [a] zu [e] vor Nasal. Das Wesen dieses Lautwandels sollte nun völlig klar sein: die Regel, daß [a] vor Nasal als [e] realisiert wird, ist zum phonologischen System von L3 hinzugefügt worden. Die Veränderung war keine Veränderung in den Lauten selbst, sondern vielmehr in dem System, das ihnen zugrundeliegt. Es sollte auch verständlich sein, warum dieser Lautwandel regelmäßig war und warum er für sämtliche Morpheme der Sprache galt und sich nicht nur auf einzelne Morpheme beschränkte. Der Wandel bestand in der Hinzufügung einer allgemeinen Regel, und eine allgemeine phonologische Regel ist per definitionem ein Prinzip, das allgemeingültig ist, und nicht nur eine individuelle Eigenschaft bestimmter lexikalischer Einheiten. Die Regelmäßigkeit der anderen Lautveränderungen, die wir angesetzt haben, läßt sich in ähnlicher Weise erklären. In L i wurde [k] zwischen Vokalen zu [x], so daß sich Formen wie [puxa] und [kaxa] ergaben. Der 212
Unterschied zwischen [k] und [ x ] ist jedoch nicht distinktiv, da [ x ] nur intervokalisch vorkommt, was bei [k] nie der Fall ist. Es gibt also sowohl in P L als auch in L i einen zugrundeliegenden velaren Konsonanten. Der Lautwandel bestand in der Hinzufügung der folgenden Regel zu dem System von L i : [k] wird zwischen Vokalen als Reibelaut realisiert. Der Wandel war regelmäßig, weil die phonologischen Repräsentationen einzelner Morpheme gar nicht betroffen waren; stattdessen wurde eine Regel hinzugefügt. Für L2 wurden drei Lautveränderungen postuliert: [p] wurde zu [b], [t] wurde zu [d] und [k] wurde zu [g]. Weder in P L noch in L2 ist der Unterschied zwischen einem stimmhaften und einem stimmlosen Verschlußlaut distinktiv. Vermutlich waren in P L alle Verschlußlaute stimmlos, und in L 2 sind alle stimmhaft. A u f beiden Stufen ist demnach die Stimmhaftigkeit der Verschlußlaute ein redundantes phonetisches Detail, ein Detail, das durch eine phonologische Regel hinzugefügt wird. Die Regel für P L ist einfach die, daß Verschlußlaute stimmlos sind, während sie für L 2 lautet, daß Verschlußlaute stimmhaft sind. Da eine Regel verändert wurde und nicht einzelne phonologische Repräsentationen, war der Wandel regelmäßig. Beachten Sie, daß es sich um eine einzige allgemeine Regel handelt. Alle Verschlußlaute werden in P L als stimmlos und in L2 als stimmhaft angegeben; die betreffende Regel gilt für alle Verschlußlaute. Es gibt keinen Grund, warum man die komplexere, weniger allgemeine und weniger Einsicht bringende Analyse vornehmen sollte, nach der es drei gesonderte Regeln für jede Art von Verschlußlaut geben müßte. Was die phonetischen Fakten der Oberfläche angeht, so haben sich drei verschiedene Lautveränderungen abgespielt, aber alle drei sind Folgen derselben geringfügigen Regelveränderung. Der Wandel von [1] zu [r] in L 3 ist eine parallele Erscheinung. Weder in P L noch in L3 ist der Unterschied zwischen [1] und [r] distinktiv. A u f beiden Stufen genügt es, das zugrundeliegende Segment als Liquid anzugeben, wobei phonologische Regeln die genaue Lautgestalt bestimmen. Der Wandel von [1] zu [r] war also eine geringfügige Regelveränderung, ähnlich wie bei den Verschlußlauten in L2. In L4 haben drei Veränderungen stattgefunden: [u] fiel im Auslaut weg, [i] fiel im Auslaut weg und [a] fiel im Auslaut weg. Inzwischen sollte es klar geworden sein, daß diese drei Veränderungen die Auswirkungen derselben historischen Erscheinung sind und keine isolierten Ereignisse. Um aber zu wissen, was für ein historisches Phänomen es war, müssen wir noch etwas mehr über L4 wissen. Eine Möglichkeit ist die, daß sich die zugrundeliegenden phonologi-
213
sehen Repräsentationen in der Entwicklung von PL zu L4 nicht geändert haben und daß vielmehr eine Regel zur Tilgung von auslautenden Vokalen zum phonologischen System hinzugekommen ist. Ist dies der Fall, dann werden die zugrundeliegenden Repräsentationen [puka], [lisu] und [mani] durch diese Tilgungsregel in die phonetische Gestalt [puk], [Iis] und [man] überführt. Will man aber die zugrundeliegenden Vokale im Auslaut bewahren, obgleich sie phonetisch nicht vorhanden sind, so muß es auch noch nicht-historische strukturelle Indizien geben, die es rechtfertigen, sie anzusetzen. Nehmen wir etwa an, daß [n] als Suffix angefügt würde, wenn man die Pluralform von Substantiven bildet, und die Plurale der angegebenen Substantive seien [pukan], [lisun] und [manin]. Da die zugrundeliegenden Vokale im Plural sichtbar auftreten (wo das [n]-Suffix sie aus der Auslautposition herausnimmt und damit ihre Tilgung verhindert), gibt es strukturelle Indizien für ihr Vorhandensein. Wenn Kinder die Sprache L4 lernen, ist das Anlaß dafür, daß sie phonologische Repräsentationen für diese Substantive lernen, die die Angabe von Auslautvokalen einschließen. Nehmen wir aber andrerseits an, derartige Indizien fehlten. Nehmen wir an, alle Wörter von L4 bestünden aus nur einer Silbe, und das Kind, das die Sprache lernt, hätte absolut keine strukturellen Gründe, zugrundeliegende Repräsentationen anzusetzen, die auslautende Vokale enthalten. In diesem Fall beruht der Unterschied zwischen PL und L4 nicht auf den phonologischen Regeln, sondern auf den zugrundeliegenden Repräsentationen, da ja in PL die Morpheme in ihren zugrundeliegenden Repräsentationen wirklich auf Vokale auslauten. Wenn aber die Repräsentationen von einzelnen Morphemen sich verändert haben und nicht Regeln, kann man dann noch von regelmäßiger Veränderung sprechen? Warum zeigen die Morpheme kein individuell verschiedenes Verhalten im Hinblick auf die Bewahrung des Auslautvokals? Darauf ist zu antworten, daß diese Veränderung ursprünglich eine Regelveränderung war. Zu einem bestimmten Zeitpunkt in der historischen Entwicklung von PL zu L4 nahmen die Sprecher eine Regel an, nach der auslautende Vokale ausfielen. Vielleicht verbreitete sich diese Art der Aussprache wegen ihres bestimmten stilistischen Valeurs oder vielleicht aus anderen Gründen. Auf jeden Fall begannen Sprecher, die phonologische Repräsentationen mit Auslautvokalen gelernt hatten, diese Vokale beim Aussprechen von Wörtern wegzulassen. Die Erscheinung war im wesentlichen regelmäßig, da sie auf einer Regel beruhte. Die Kinder, die in dieser Situation sprechen lernten, sahen die Lage mit neuen Augen an. Da sie keine Auslautvokale hörten und auch keinen 214
Grund hatten, solche anzunehmen, lernten sie phonologische Repräsentationen, in denen die Auslautvokale alle fehlten. Die Veränderung der zugrundeliegenden Repräsentationen ergab sich demnach als ein Vorgang der Neustrukturierung. Nachdem die Auslautvokale auf Grund der Hinzufügung einer neuen Regel zum phonologischen System der Erwachsenen phonetisch verschwunden waren, bauten sich die Kinder, die später die Sprache lernten, ein einfachers System, in dem die Auslautvokale völlig fehlten. In allen Fällen, bis auf einen, haben sich die Lautveränderungen in den Tochtersprachen als Regelveränderungen erwiesen; nur in einem Fall könnte man eine Veränderung in den zugrundeliegenden Repräsentationen annehmen, und auch hier muß eine Regelveränderung vorausgegangen sein. Unser hypothetisches Beispiel ist vielleicht nicht völlig repräsentativ, aber auch in der Wirklichkeit scheinen Regelveränderungen zu überwiegen. Das bis jetzt beschränkte, aber zunehmende Forschungsmaterial in diesem Bereich läßt vermuten, daß Regelveränderungen in phonologischen Systemen häufig vorkommen, während die zugrundeliegenden Repräsentationen vergleichsweise stabil sind.
Die indoeuropäische Sprachfamilie Wenn wir den vielbegangenen Pfad der indoeuropäischen Sprachen verlassen und uns weniger gut erforschten Sprachen zuwenden, sind genetische Klassifikationen häufig noch relativ unsicher. Es gibt Tausende von Sprachen in der Welt, und viele davon sind bisher nur in Umrissen oder noch garnicht beschrieben worden. Wenn man Sprachen nicht sehr gut kennt, können natürlich Versuche, sie zu Familien zu ordnen, mißlingen. Auch hier könnte man einen Gesamtüberblick andeuten, wir wollen uns aber an dieser Stelle auf die indoeuropäische Familie beschränken, über die am wenigsten Zweifel besteht. Die Verwandtschaftsverhältnisse dieser Sprachfamilie wurden im Verlauf der Entwicklung der komparativen Methode festgestellt. Das ProtoIndoeuropäische ist rekonstruiert worden, soweit man eben eine derart weit entfernte Sprache rekonstruieren kann, und die historische Entwicklung der indoeuropäischen Sprachen ist weitgehend bis in Einzelheiten erforscht. Die indoeuropäische Familie umfaßt zehn Teilfamilien, wie Abb. 8.6 zeigt. Alle Versuche, diese Teilfamilien in größere Familiengruppen zusammenzufassen, sind gescheitert. Über das genaue Verhältnis des Anato215
Proto-1 ndoeu ropä isch
Abb. 8.6
lischen zu den übrigen indoeuropäischen Sprachen ist man sich immer noch nicht einig; manchmal wird das Anatolische eher als eine Schwestersprache des Proto-Indoeuropäischen angesehen denn als Tochtersprache. Die anatolischen Sprachen, die schon lange ausgestorben sind, wurden in Kleinasien gesprochen. Man kennt sie von Inschriften, die bis etwa 1400 v. Chr. zurückgehen und ungefähr einen Zeitraum von tausend Jahren umfassen. Die am genauesten bekannte anatolische Sprache ist das Hethitische, aber es sind auch Zeugnisse des Luwischen, Palaischen und Lydischen erhalten. Da das Hethitische zu einer so frühen Zeit gesprochen wurde, ist es recht wichtig für die Rekonstruktion des Proto-Indoeuropäischen, das man um die Zeit vor 3000 v. Chr. ansetzt. Das Tocharische ist ebenfalls ausgestorben und nur aus schriftlichen Zeugnissen bekannt. Diese fragmentarischen Zeugnisse, die aus der Zeit vom 6. bis zum 8. Jahrhundert n. Chr. stammen, wurden in ChinesischTurkestan entdeckt. Es sind dabei offensichtlich zwei Dialekte vertreten, Tocharisch A und B. Albanisch bildet für sich allein eine Teilfamilie, und dasselbe gilt für Armenisch. Das erstere wird in Albanien gesprochen und erstreckt sich bis nach Griechenland und Italien. Armenisch wird im südlichen Kaukasus und in Teilen der Türkei gesprochen. Die erste größere Teilfamilie, die wir genauer behandeln wollen, ist das Germanische. Das Gotische, das zuletzt im 16. Jahrhundert auf der Krim gesprochen wurde, das Skandinavische und das Westgermanische betrachtet man gewöhnlich als Teilgruppen des Germanischen. Zum Skandinavischen gehören das Isländische, das Dänische, das Schwedische und Norwegische, wobei sich die letzten drei recht ähnlich sind. Das Englische gehört zur westgermanischen Gruppe. Sein nächster Ver216
wandter ist das Friesische, das entlang der niederländischen Küste und auf Inseln in der Nordsee gesprochen wird. Die germanischen Sprachen in Kontinentaleuropa werden gewöhnlich in Oberdeutsch und Niederdeutsch aufgeteilt. Das Oberdeutsche, so genannt wegen der höhergelegenen, bergigeren Gegend des Südens, in der es gesprochen wird, umfaßt die Dialekte von Österreich, Süddeutschland und der Schweiz. Zum Niederdeutschen gehören das Holländische, das Flämische (in Belgien gesprochen) und die norddeutschen Dialekte. Das Jiddische, die Sprache der Juden, die sich vor Jahrhunderten in Osteuropa niederließen, ist Oberdeutsch. Das Afrikaans, das in Südafrika gesprochen wird, hat sich aus dem Holländischen entwickelt. Die italische Teilfamilie umfaßt die Sprachen, die in der Antike in Italien gesprochen wurden, und deren Nachfahren. Neben dem Lateinischen, das sie schließlich alle verdrängte, gehörten dazu das Oskische, das Umbrische und das Venetische, alles längst ausgestorbene Sprachen. Das Lateinische hat sich natürlich in den modernen romanischen Sprachen erhalten. Zusätzlich zum Französischen, Spanischen, Italienischen, Portugiesischen und Rumänischen, die jederman kennt, gehören dazu noch das Provenzalische, Katalanische, Ladinische, Sardinische und Dalmatinische. Provenzalisch ist ein Sammelbegriff für die Dialekte von Südfrankreich. Während des frühen Mittelalters war es eine Literatursprache und stand im Wettbewerb mit dem Französisch von Paris. Katalanisch wird im östlichen Spanien gesprochen, in der Gegend um Barcelona. Ladinisch, auch als Rhäto-Romanisch oder Romansch bekannt, steht in der Schweiz neben Französisch und Schweizerdeutsch und erstreckt sich bis nach Norditalien hinein. Sardisch wird auf Sardinien gesprochen, während das seit dem Tod seines letzten Sprechers (1898) ausgestorbene Dalmatinische sein Zentrum im heutigen Jugoslawien hatte. Die keltischen Völker waren einst eine wichtige Macht in Europa; sie waren über den ganzen Kontinent bis hin nach Kleinasien verbreitet. Die keltischen Sprachen haben sich jedoch nach und nach zurückgezogen und existieren heute nur noch auf den britischen Inseln und in Frankreich. Das Bretonische ist die Sprache der Bretagne in Nordwestfrankreich. Auf den britischen Inseln finden wir das Walisische, das Irische, das schottische Gälisch und das Manx (auf der Insel Man). Eine weitere keltische Sprache, das Kornische, ist seit dem 18. Jahrhundert ausgestorben. Die Geschichte des Griechischen kann man über 3000 Jahre hinweg verfolgen. Das klassische Griechisch bestand aus vielen örtlichen Dialekten, von denen der wichtigste das Attische war, der Dialekt von Athen. 217
Das Attische trat wegen der kulturellen Vormachtstellung von Athen in den Vordergrund und verbreitete sich über das ganze griechische Reich. Praktisch alle heutigen Dialekte gehen auf das attische Griechisch zurück. Man ist sich nicht darüber einig, ob die baltischen und die slavischen Sprachen sich deshalb ähnlich sind, weil sie eine Teilfamilie ausmachen, oder v/eil sie sich gegenseitig beeinflußt haben. Es mag deshalb angemessen sein, statt von einer balto-slavischen Teilfamilie von zwei Teilfamilien, Baltisch und Slavisch, zu reden. In jedem Fall umfaßt die baltische Gruppe das Litauische und das Lettische, sowie das seit einigen Jahrhunderten ausgestorbene Altpreussische. Die slavischen Sprachen teilt man häufig in die südliche, die westliche und die östliche Gruppe auf. Zum Südslavischen gehören Serbo-Kroatisch, Slovenisch und Bulgarisch. In der Ostslavischen Gruppe finden sich Russisch, Ukrainisch und Weißrussisch, die sich sehr ähnlich sind. Tschechisch und Slovakisch, zwei Dialekte einer Sprache, gehören mit dem Polnischen zur Westslavischen Gruppe. Die ältesten schriftlichen Zeugnisse des Slavischen stammen aus einer Bibelübersetzung des 9. Jahrhunderts. Die Sprache dieser Übersetzung bezeichnet man entweder als Altkirchenslavisch oder Altbulgarisch; als liturgische Sprache hat sie sich erhalten. Bleibt noch die indoiranische Teilfamilie. Heutige Vertreter des Iranischen sind das Persische, das im Iran gesprochen wird, Paschto in Afghanistan, Ossetisch im nördlichen Kaukasus, Kurdisch im Iran, Irak und in der Türkei und noch mehrere andere. Zwei antike iranische Sprachen sind aus Texten und Inschriften bekannt: das Alt-Persische, das man schon aus dem 6. Jahrhundert v. Chr. kennt und das Avestische, die Sprache der Schriften des Zarathustra, das zwar aus derselben Zeit stammt, aber nur in späteren Handschriften überliefert ist. Zur indischen Gruppe gehören das Sanskrit, das man bis 1200 v. Chr. zurückverfolgen kann, und viele heutige Sprachen des nördlichen Indien und Pakistans, darunter Hindi, Urdu, Bengali, Panjabi, Gujerati, Marathi, Nepali und Kaschmiri.
218
9. Die Universalität des Sprachbaus
Zum Wesen des Spraeherwerbs Was das Kind vollbringt Jedes Kind lernt während seiner ersten Lebensjahre eine Muttersprache — vorausgesetzt, es hat nach Erbgut und Umgebung die Möglichkeit dazu. Der Spracherwerb findet auch trotz beträchtlicher geistiger oder körperlicher Behinderung statt und bedarf keines besonderen Unterrichts; es reicht aus, wenn die Sprache im Gebrauch ausreichend erlebt wird. Etwa im Alter von sechs Jahren beherrscht das Kind die wesentlichen Elemente seiner Muttersprache. Es besitzt ein Sprachsystem, das eine unbegrenzte Menge von Sätzen beschreibt, die es zum Sprechen und Verstehen heranziehen kann. Es besitzt die Fähigkeit, Sätze mühelos und spontan zu bilden oder zu verstehen, die seiner Erfahrung völlig neu sind. Wenn man es sich genauer überlegt, ist das eine ganz beachtliche Leistung. Die Größe der Leistung sollte jedem einsichtig sein, der versucht hat, nach dem Pubertätsalter noch eine fast perfekte Sprechfertigkeit in einer Fremdsprache zu erreichen; das ist nichts Einfaches oder Selbstverständliches. Der Erwerb der Muttersprache ist eines der größeren psychischen Ereignisse in der Entwicklung eines Kindes. Er ist eine Erscheinung, die erklärt werden sollte. Wenn wir den Spracherwerb verstehen, haben wir etwas Wichtiges über uns selbst gelernt. In einer gewissen Hinsicht ist das Kind, das Sprechen lernt, in derselben Lage wie der Linguist, der eine Sprache untersucht. Das Kind muß sozusagen die Struktur der in seiner Umgebung gesprochenen Sprache erschließen. Wie der Linguist kann es die Struktur nicht unmittelbar erkennen. Es kann sich bei seinen Schlüssen nur auf die beobachtete Sprachverwendung stützen, die zwar teilweise durch das abstrakte Sprachsystem bestimmt ist, aber dieses System auch im besten Fall nur indirekt und unvollkommen widerspiegelt. Das Sprachsystem, das jedes Kind für sich selbst aufbaut, bildet also 219
eine Hypothese über die Struktur der Sprache, die seine Umgebung verwendet. Indem es die Konsequenzen dieser Hypothese an seiner weiteren sprachlichen Erfahrung mißt, verfeinert das Kind sie immer mehr, bis sein System für den praktischen Gebrauch mit dem seiner Vorbilder übereinstimmt. Da die Systeme aber nie direkt verglichen werden können, bleibt immer die Möglichkeit der Neu strukturierung oder des unvollkommenen Lernens. Im Gegensatz zum Linguisten versucht das Kind nicht, die strukturellen Prinzipien einer Sprache explizit und der Überprüfung zugänglich darzustellen; es lernt einfach sprechen. Es versucht weitgehend unbewußt, ein abstraktes Sprachsystem seinem psychischen Aufbau einzugliedern. Das Kind formuliert nur im metaphorischen Sinne eine Theorie der Sprachstruktur und sucht dann nach empirischem Material, um die Theorie zu verifizieren oder zu falsifizieren; aber diese metaphorische Ausdrucksweise ist lehrreich. Irgendwie muß das Kind die Struktur seiner Muttersprache entdecken; niemand gibt sie ihm gebrauchsfertig in die Hand. Wenn das Kind sprechen gelernt hat, wenn es seine Muttersprache beherrscht, besitzt es ein abstraktes System von Regeln, das eine unbegrenzte Menge von wohlgeformten Sätzen beschreibt. Es ist sich dessen nicht bewußt, daß es ein solches System besitzt, und es kann die Art dieser Regeln auch nicht durch Introspektion bestimmen. Es besitzt dieses System in dem Sinne, daß die strukturellen Muster des Systems sich über die psychischen Prozesse gelagert haben, so daß diese Muster einen Faktor in der Bestimmung seiner verbalen Tätigkeit bilden. Sprechenlernen erfordert ähnlich dem Fahrradfahrenlernen das Beherrschen einer gewissen Menge von Prinzipien; dabei wird Struktur zu dem Vorrat an psychischen Fertigkeiten oder Fähigkeiten hinzugefügt, die unser geistig gesteuertes Verhalten formen. Diese Regeln sind demnach ebensowenig der direkten Beobachtung zugänglich wie die Regeln zum Balancieren eines Fahrrads. Wir reden, und wir halten die Balance auf dem Fahrrad, aber in keinem der beiden Fälle wissen wir auf der Ebene des Bewußtseins genau, welches dabei die entscheidenden Prinzipien sind. Analog dazu wird die Arbeit eines Computers durch ein Programm gesteuert, aber das Programm ist nicht Gegenstand seiner Arbeit; der Computer führt Berechnungen aus, die sich auf andere Dinge beziehen, aber nicht auf das ihn steuernde Programm.
220
Empirismus und Rationalismus Die Schwierigkeit, den Spracherwerb zu verstehen, liegt darin, genau herauszufinden, wie das Kind in den Besitz des abstrakten Sprachsystems gelangt, das weitgehend für die Form seiner verbalen Tätigkeit verantwortlich ist. Das Wesen dieses Vorgangs ist zum größten Teil unbekannt. Wir haben keine angemessene Theorie, die die Entdeckung der Sprachstruktur durch das Kind Schritt für Schritt erklären würde. Wir wollen deshalb unsere Aufmerksamkeit auf eine enger gefaßte Frage richten, die jedoch für das volle Verständnis des Spracherwerbs von außerordentlicher Wichtigkeit ist: Wie groß ist der Anteil der Sprachstruktur, der schon von Geburt an „vorprogrammiert" ist? Oder, um es anders zu sagen: Wie groß ist der Anteil des schließlich beherrschten Sprachsystems, den das Kind bei seiner Geburt schon besitzt, und wieviel muß es auf der Grundlage sprachlicher Erfahrung entdecken? Die eine Extremposition wäre, zu behaupten, daß überhaupt keine sprachliche Struktur angeboren ist und daß Sprache einzig und allein durch Erfahrung erworben wird. Dies ist die Ansicht der Empiristen, die wir in Kapitel 1 kurz erwähnt haben. Sie geht davon aus, daß wir keine besondere, angeborene Fähigkeit zum Spracherwerb besitzen. Die Tatsache, daß wir eine Sprache lernen, und die Struktur der gelernten Sprache beruhen auf der Schulung, die wir als Kinder erfahren. Was die Sprache betrifft, so beginnen wir unser Leben als tabula rasa. Das Sprachsystem, das schließlich auf diese leere Tafel geschrieben wird, wird von den kleinsten Anfängen irgendwie aufgebaut, wobei seine Struktur nur von der Erfahrung bestimmt wird. Die Sprache wird somit als durch Kultur übermittelt betrachtet, ähnlich wie Briefmarkensammeln oder der Gebrauch der Gabel. Die andere Extremposition ist die der Rationalisten, die annehmen, daß die Sprache bei Geburt schon fast vollkommen vorgebildet ist. Die Kinder lernen die Sprache, weil die Fähigkeit zu sprechen und auch der größte Teil der Sprachstruktur ihnen schon „eingebaut" ist. Die Rolle der sprachlichen Erfahrung ist nach Ansicht der Rationalisten nicht so sehr die, die Sprache zu formen, sondern vielmehr, die angeborene Sprachkompetenz zu aktivieren. Die Grundanlage für jedes mögliche Sprachsystem ist als ein Teil der angeborenen Ausrüstung an Nervenbahnen jedem Kind schon bei Geburt mitgegeben. Auf diese Weise spielt das Lernen eine sehr geringe Rolle. Das Kind muß nur jene strukturellen Einzelheiten lernen, die die Sprache seiner Umgebung von anderen möglichen menschlichen Sprachen unterscheiden. Es muß nur Fleisch an das 221
schon vorhandene sprachliche Skelett-System ansetzen. Nach dieser Ansicht wird der größte Teil der Sprache durch Vererbung überliefert. Nur die kleineren strukturellen Einzelheiten, die die Sprachen oberflächlich verschieden erscheinen lassen, werden auf der Grundlage des Einflusses der Umgebung erworben. Die Ansichten der Empiristen und Rationalisten widersprechen sich also im Hinblick auf den Anteil der erlernten Struktur, aber sie sind nicht völlig unvereinbar. Selbst Anhänger der empiristischen Position würden zugestehen, daß die Struktur des menschlichen Organismus die Möglichkeiten erlernbarer Sprachsysteme in einem gewissen Rahmen hält. Jedes derartige System muß z. B. endlich sein, weil der menschliche Organismus endlich ist; niemand kann eine unendliche Zahl von Regeln lernen. Darüberhinaus muß man annehmen, daß Kinder mit einer gewissen angeborenen Lernfähigkeit zur Welt kommen, mit einer bestimmten erblich übermittelten Anlage zur Kombination von einfachen psychischen Strukturen zu komplexeren Strukturen. Besäße dagegen das Kind keine angeborene Lernfähigkeit, so würde es auch nie lernen. Diese elementare Lernfähigkeit wird gewöhnlich als ziemlich einfach aufgefaßt, etwa wie die Fähigkeit zur Bildung von Assoziationen. (So werden etwa Bonbons und der Begriff Süßheit assoziiert, weil sie in der Erfahrung so häufig zusammen auftreten; das eine erinnert jeweils an das andere.) Der Empirist wird also zugestehen, daß bis zu einem gewissen Grad angeborene Eigenschaften für die Bestimmung des Aufbaus der Sprache verantwortlich sind. In derselben Weise vvird der Rationalist nicht leugnen, daß das Lernen beim Spracherwerb durchaus eine Rolle spielt. Was das Kind durch Vererbung übermittelt bekommt, ist nicht eine bestimmte Sprache, sondern die Sprachfähigkeit. Wenn es zur Welt kommt, sind die Organisations- und Struktureigenschaften in ihm angelegt, die allen Sprachen gemeinsam sind, aber diese Eigenschaften machen noch keine vollständige Struktur irgendeiner bestimmten Sprache aus. Auf der Grundlage des angeborenen Gerüsts eines Sprachsystems muß das Kind jene strukturellen Einzelheiten entdecken, die diese Grundlage in das voll ausgeprägte System überführen, das in seiner Umgebung verwendet wird. An diesem Punkt spielt das Lernen eine Rolle. Indem das Kind herausfindet, welche von allen möglichen menschlichen Sprachen in seiner Umgebung gesprochen wird, formuliert es sozusagen Strukturhypothesen und überprüft diese an seiner weiteren sprachlichen Erfahrung, wobei es sie so lange immer weiter verfeinert, bis es ein Sprachsystem besitzt, das dem seiner Vorbilder entspricht. Aber dieser Entdeckungsvorgang spielt sich 222
innerhalb von Grenzen ab, die von der Erbanlage genau abgesteckt sind, so daß die Rolle des Lernens unbedeutend bleibt. In zwei wichtigen Dingen unterscheiden sich die Positionen der Empiristen und Rationalisten. Der Empirist ist davon überzeugt, daß nur ein kleiner Teil der psychischen Struktur angeboren ist, während der Rationalist behauptet, daß es ein großer Teil sei. Dieser Unterschied ist nur gradueller Natur, während der zweite grundsätzlicher Art ist. Nach Ansicht des Empiristen wird das Kind mit keiner besonderen Fähigkeit für Sprache geboren, sondern nur mit einer allgemeinen Lernfähigkeit. Ein Sprachsystem wird dann auf Grund derselben elementaren geistigen Fähigkeit (etwa der Assoziationsfähigkeit) durch Erfahrung aufgebaut, die auch für die Ausbildung aller anderen Aspekte kognitiver Strukturen verantwortlich ist. Der Rationalist dagegen nimmt zusätzlich zur allgemeinen Intelligenz noch eine besondere, angeborene Sprachfähigkeit an. Über unsere natürliche Fähigke't hinaus, Begriffe zu bilden und zu handhaben, sind wir mit einer angeborenen Prädispoisition begabt, ein Sprachsystem zu erwerben, das bestimmte Eigenschaften hat, die es von allen anderen denkbaren Sprachsystemen unterscheiden.
Indizien für angeborene Programmierung Es gibt sehr gute Indizien für die Richtigkeit der rationalistischen Ansicht. Man denke zuerst an die Einheitlichkeit des Spracherwerbs in der gesamten Menschheit. Wir haben gesehen, daß jedes Kind eine Sprache lernt, wenn es nicht das Opfer extremer geistiger Mängel oder der Isolation vom Gebrauch der Sprache ist. Es gibt eine Vielfalt von körperlichen und geistigen Fertigkeiten, die Kinder manchmal trotz eines beträchtlichen Aufwands an Unterricht nicht lernen, aber das Sprechen gehört nicht dazu. Genau das erwartet man, wenn man von der Annahme ausgeht, daß die Sprache bei der Geburt schon fast vollständig vorprogrammiert ist, so daß die sprachliche Erfahrung in der Hauptsache nur dazu dient, das durch Vererbung übermittelte, vorprogrammierte System zu aktivieren. Während es sehr gut zu der rationalistischen Position paßt, daß der Spracherwerb gattungseinheitlich ist, widerspricht es dem, was wir von der empiristischen Position her erwarten würden. Wenn der Spracherwerb in der Hauptsache von der Schulung abhinge, die ein Kind erhält, so würde man eine direkte Korrelation zwischen Unterschieden der Schulung und des Spracherwerbs erwarten (bei konstant gehaltenem all223
gemeinem Intelligenzgrad). In Wirklichkeit erweist sich jedoch diese Erwartung als falsch. Ein Kind lernt sprechen, ob seine Eltern es immer überwachen, korrigieren und Sprachübungen machen lassen oder nicht. Manche Eltern tun es, andere tun es nicht — aber die Kinder lernen alle sprechen. Trotz großer Verschiedenheiten in der Menge von Sprache, die Kinder erfahren, erwerben sie alle ein voll ausgebildetes Sprachsystem. Man kennt keine Fälle, in denen Kinder eine Sprache nur deswegen halb gelernt hätten, weil sie keine syntaktischen Regeln gelernt oder keine zugrundeliegenden phonologischen Repräsentationen oder komplexe lexikalische Einheiten erworben hätten. Die Unregelmäßigkeiten der frühen Spracherfahrung schlagen sich in keiner vergleichbaren Verschiedenheit der Sprachstruktur nieder. Ein zweites Argument für die Position der Rationalisten ist die Tatsache, daß nur Menschen sprechen lernen. Am ehesten würde man es natürlich bei den Primaten, etwa den Schimpansen, erwarten. Sie sind dem Menschen anatomisch ähnlich und sind auch einigermaßen intelligent; sie können es lernen, Werkzeug zu benutzen und einfache Probleme zu lösen. Der Unterschied in der Intelligenz zwischen Primaten und Menschen ist also kein grundsätzlicher, sondern ein gradueller. Wenn wir jedoch die Sprache in Betracht ziehen, finden wir einen grundsätzlichen Unterschied. Die Fortschritte, die Primaten in Richtung auf die Beherrschung einer menschlichen Sprache machen können, stehen in keinem Verhältnis zu ihrer Intelligenz — genauer gesagt, sie machen überhaupt keine Fortschritte in dieser Richtung. Experimente haben nachgewiesen, daß ein Schimpanse, selbst wenn er genau wie ein Kind aufgezogen wird, nichts erwirbt, das auch nur die geringste Ähnlichkeit mit dem sprachlichen System hat, das menschliche Kinder so leicht lernen. Die Sprache ist demnach charakteristisch für unsere Gattung. Darüberhinaus ist sie nicht unmittelbar mit der Intelligenz gekoppelt. Diese Beobachtungen stimmen sehr gut zu der Ansicht, daß sich die Sprache im Kind auf Grund einer besonderen, angeborenen sprachlichen Fähigkeit entwickelt. Menschenaffen können deshalb keine Sprache lernen, weil ihnen diese angeborene Struktur fehlt. Diese einfache und natürliche Erklärung steht einem nicht zur Verfügung, wenn man sich der empiristischen Position verschreibt. Wenn die Sprache eine Funktion der allgemeinen Intelligenz wäre und nicht auf eine besondere Sprachfähigkeit zurückginge, dann müßte es anderen Tieren bei entsprechender Schulung gelingen, in einem solchen Maß Sprache zu erwerben, wie es ihrer Intelligenz entspricht. Experimente haben bewiesen, daß dies nicht der Fall ist. Es gibt absolut keine Indizien dafür, 224
daß irgendetwas, das auch nur im entferntesten dem komplexen System von Regeln und zugrundeliegenden Repräsentationen einer menschlichen Sprache gleicht, in anderen Gattungen entstehen kann. Die relative Vollkommenheit des Spracherwerbs ist ein drittes Argument für die angeborene Vorprogrammierung. Wäre die Sprache ein Reflex der allgemeinen Intelligenz und nicht einer speziellen Sprachfähigkeit, so müßte man eine direkte Korrelation der Intelligenz mit den Unterschieden im Spracherwerb erwarten (bei konstanter Menge der Schulung). Wir würden erwarten, daß kluge Kinder mehr Erfolg beim Erlernen eines Sprachsystems hätten als dumme. Wir würden ebenfalls erwarten, daß manche Kinder völlige Versager im Spracherwerb sein müßten, genau wie viele Kinder in der Geographie oder beim Ausrechnen von Quadratwurzeln versagen. Wir würden erwarten, daß manche Kinder schließlich ein derart mangelhaftes und verzerrtes Sprachsystem erlangen würden, daß es völlig unverständlich wäre. Diese Erwartungen bestätigen sich jedoch nicht. Kluge Kinder, durchschnittlich begabte Kinder und dumme Kinder lernen alle sprechen. Es gelingt ihnen, ein Sprachsystem zu beherrschen, das dem ihrer Vorbilder praktisch entspricht, ein Sprachsystem, das weder verzerrt noch mangelhaft ist. Unabhängig von seiner allgemeinen Intelligenz gelingt es einem Kind, ein komplexes System von Regeln und zugrundeliegenden Repräsentationen zu beherrschen, das eine unendliche Menge von Sätzen beschreibt. Kinder unterscheiden sich vielleicht in kleineren Dingen, etwa in der Zungenfertigkeit oder der Größe des Wortschatzes, aber sie unterscheiden sich nicht im Hinblick auf die entscheidenden strukturellen Merkmale des Sprachaufbaus. Wenn die Rolle des Lernens untergeordnet ist, indem es nur dazu dient, das angeborene System zu aktvieren und einige Lücken am Rande der Struktur aufzufüllen, dann können gar keine radikalen Strukturfehler entstehen. Ein viertes starkes Argument für die Ansicht der Rationalisten ist die Abstraktheit und Komplexität der Sprachen. Wir wissen sehr viel über die Sprache, aber trotz jahrhundertelanger, ernsthafter Forschung wären wir völlig außerstande, die Struktur irgendeiner Sprache erschöpfend zu beschreiben und sei es auch die besterforschte. Aber im wesentlichen ist es genau das, was das Kind leistet. Es erlernt die ganze Menge der lexikalischen Einheiten und strukturellen Prinzipien, die ein Sprachsystem ausmachen. Und es tut dies auf der Grundlage von indirekten und fragmentarischen Indizien und in einem Alter, in dem es noch nicht logisch-analytisch denken kann. Diese bemerkenswerte Erscheinung läßt sich unter dem Aspekt der rationalistischen Anschauung erklären, aber kaum im 225
Rahmen der empiristischen Position. Wenn die Sprachstruktur durch Vererbung übertragen wird, stellt ihre ungeheure Komplexität kein Problem für das Kind dar. Seine Aufgabe besteht einfach darin, den Bereich der durch angeborene Programmierung gegebenen Möglichkeiten soweit einzuschränken, daß es die richtige Möglichkeit wählt. Es geht also nicht darum, ein gesamtes Sprachsystem von Grund auf aufzubauen, sondern nur darum, einige periphere Einzelheiten einzubauen. Die Behauptung der Empiristen jedoch läuft darauf hinaus, daß das gesamte Sprachsystem wirklich von Grund auf aufgebaut wird und zwar auf der Basis der allgemeinen geistigen Fähigkeit des Kindes. Man erwartet von dem Kind, daß es nicht nur einige strukturelle Einzelheiten entdeckt, sondern auch das gesamte Aufbauschema der Organisation der Sprache. Es kommt ohne sprachliche Erwartungen zur Welt und soll dann in einem vorintellektuellen Alter eine Reihe von sprachlichen Entdeckungen machen, die weit über das hinausgehen, was die gemeinsamen Anstrengungen aller Forscher, die sich je mit Sprache beschäftigt haben, erreicht haben! Diese Behauptung kann nicht als sinnvoll gelten. Dabei muß man sich noch daran erinnern, daß das zu erwerbende Sprachsystem nie der direkten Beobachtung zugänglich ist. Die Struktur des Systems muß auf der Basis der sehr indirekten Indizien der Sprachverwendung gewonnen werden. Selbst wenn das Kind in einem Alter sprechen lernte, in dem es schon analytisch denken kann, könnte es doch nicht die Prinzipien des Aufbaus der Sprache erlernen, wenn sie nicht schon Teil seiner Erbanlage wären. Für die endliche Menge der sprachlichen Beobachtungen, die dem Kind als Material zur Verfügung stehen, läßt sich jede beliebige Zahl von erklärenden strukturellen Hypothesen denken; so gäbe es z. B. keinen Grund für das Kind, nicht anzunehmen, die Sprache sei nur eine endliche Liste von Äußerungen, die man auswendig lernen muß. Ohne angeborene leitende Strukturprinzipien könnte man von einem Kind kaum erwarten, daß es das Wesen des Sprachsystems entdeckt, das teilweise der verbalen Tätigkeit seiner Umwelt zugrundeliegt. Es hätte nicht einmal Anlaß, das Vorhandensein eines solchen Systems zu vermuten. Außerdem ist das System in seiner Abstraktheit und Komplexität weit außerhalb dessen, was durch Versuch und Irrtum („trial and error") entdeckt werden kann.
226
Sprachliche Universalien Wir haben gesehen, daß nach Ansicht der Rationalisten die Sprachstruktur bei der Geburt schon weitgehend bis in Einzelheiten vorprogrammiert ist. Allen Sprachen liegt derselbe angeborene strukturelle Rahmen zugrunde, und die sprachliche Erfahrung des Kindes dient eher dazu, die Sprachfähigkeit zu aktivieren, als sie zu formen. Wenn diese Betrachtungsweise zutrifft, dann müssen sich alle Sprachen strukturell sehr ähnlich sein. Wenn derselbe durch Vererbung übermittelte strukturelle Rahmen allen Sprachen zugrundeliegt, dann können sich die Sprachen nur im Hinblick auf jene untergeordneten Strukturmerkmale unterscheiden, die das Kind durch Erfahrung lernt. Trotz ihrer Oberflächenunterschiede müssen sich die Sprachen in den meisten Dingen ähnlich sein. Sie müssen Variationen desselben strukturellen Themas sein. Anders gesagt impliziert die Behauptung, daß die Sprache schon bei Geburt vorprogrammiert ist, die Feststellung, daß alle menschlichen Sprachen sich in einem verhältnismäßig engen Rahmen von strukturellen Möglichkeiten bewegen, wie Abb. 9.1 andeutet. Der Rahmen von Möglichkeiten, der mit den durchgezogenen Linien bezeichnet ist, ist durch das angeborene „Sprachprogramm" vorgegeben, das es dem Kind überhaupt ermöglicht, eine Sprache zu erwerben. Das Kind sieht sich also der Lernaufgabe gegenüber, diesen Rahmen von Möglichkeiten noch weiter einzuengen, bis es im wesentlichen herausgefunden hat, welche Sprache L von allen möglichen Sprachen diejenige ist, die in seiner Umgebung gesprochen wird. Von allen denkbaren Sprachen können nur diejenigen natürlich und spontan von dem Kind erworben werden, die in diesen engen Rahmen von Möglichkeiten fallen.
Abb. 9.1
227
Ein Strukturmerkmal, das allen Sprachen gemeinsam ist, nennt man eine sprachliche Universalie. Alles in allem können wir die sprachlichen Universalien mit den Strukturmerkmalen von Sprachen gleichsetzen, die angeboren sind; wenn alle Sprachen ein Merkmal gemeinsam haben, so liegt das wahrscheinlich daran, daß dieses Merkmal Teil unserer menschlichen genetischen Anlage ist. Die Behauptung, daß sich alle Sprachen sehr ähnlich sind, stößt oft auf Skepsis. Immerhin fallen uns doch beim Vergleich von Sprachsystemen, etwa beim Lernen einer Fremdsprache, ihre Unterschiede deutlich auf. Es wird auch niemand leugnen, daß sich Sprachsysteme in einer Vielfalt von Einzelheiten unterscheiden. Andrerseits müssen wir uns klarmachen, daß Eigenheiten der Oberfläche viel eher unsere Aufmerksamkeit erregen als zugrundeliegende Prinzipien; und gerade bei den letzteren können wir erwarten, sprachliche Universalien zu finden. Es sollte inzwischen klar sein, daß die sprachliche Vielfalt der Oberfläche häufig die zugrundeliegende Einheitlicheit verbirgt. Alle Sprachen zeigen dasselbe Grundschema des Aufbaus. Genauer gesagt umfaßt jede menschliche Sprache eine unendliche Menge von Sätzen, von denen jeder in phonetischer Form eine Begriffsstruktur realisiert. Eine komplexe Serie von syntaktischen Regeln verknüpft Begriffsstrukturen mit Oberflächenstrukturen, die aus linearen Ketten von hierarchisch gruppierten lexikalischen Einheiten bestehen. Eine Serie von phonologischen Regeln verknüpft die Oberflächenstruktur eines jeden Satzes auf der Grundlage der zugrundeliegenden phonologischen Repräsentationen seiner lexikalischen Einheiten mit seiner phonetischen Realisierung. Jede einzelne lexikalische Einheit besteht aus einer Verbindung von semantischen, syntaktischen und phonologischen Eigenschaften, wobei die Beziehung zwischen den semantischen und den phonologischen Eigenschaften zumeist willkürlich ist. Phonologisch wird eine lexikalische Einheit als eine lineare Folge von Segmenten repräsentiert, bei der jedes Segment mit der Angabe von distinktiver phonologischer Information versehen ist. Von diesem Grundschema des Aufbaus gibt es schlechterdings keine Ausnahmen. Niemand hat je eine menschliche Sprache gefunden, in der syntaktische Regeln, phonologische Regeln oder unterscheidbare lexikalische Einheiten gefehlt hätten. Niemand hat je eine Sprache gefunden, in der lexikalische Einheiten nicht aus linearen Folgen von Lautsegmenten aufgebaut gewesen wären. Von allen denkbaren Möglichkeiten, wie eine Sprache aufgebaut sein könnte, bedienen sich alle menschlichen Sprachen einmütig dieser besonderen Möglichkeit. Sprachsysteme unterschei228
den sich ein wenig in ihrer Struktur, aber nur innerhalb dieses gemeinsamen Rahmens. Indem wir dieses gemeinsame Organisationsschema umrissen haben, haben wir gerade erst begonnen, die universellen Eigenschaften des Sprachbaus aufzuzeigen. Sprachen haben viel mehr gemeinsam als nur diesen allgemeinen Rahmen, so daß die Variationsbreite zwischen den einzelnen Sprachen noch weiter eingeschränkt wird. Deswegen weiß ein Linguist, der mit der Untersuchung einer neuen Sprache beginnt, von vornherein schon ziemlich viel über ihre Struktur. Auf der Grundlage seiner Erfahrung mit anderen Sprachen hat er eine beträchtliche Menge von Vorerwartungen erworben, ob er sie nun ausdrücklich zu formulieren versucht hat oder nicht. Er hat, wenn auch nur halbbewußt, das Vorhandensein von offensichtlich allgemeingültigen Sprachmerkmalen registriert, und er würde sich sehr wundern, wenn er eine Sprache fände, die seinen stillschweigenden Voraussagen widerspräche. Er weiß etwa, daß es in der neuen Sprache möglich sein wird, Fragen zu stellen, Befehle zu geben und die Negation auszudrücken. Er weiß, daß die neue Sprache eine unbegrenzte Menge von komplexen Sätzen haben wird, zu deren Bildung Einbettung, Koordination oder beides verwendet wird. Es wird Demonstrativformen irgendwelcher Art, Wörter zur Angabe der Quantität, Pro-Formen, Substantiva und Verba geben. Höchstwahrscheinlich wird es Konkordanz-Erscheinungen irgendwelcher Art geben. Man muß dem Linguisten auch nicht besonders sagen, daß er viele komplexe lexikalische Einheiten zu erwarten hat, die aus einfacheren Einheiten aufgebaut sind. Er wird idiomatische Wendungen finden, desgleichen Fälle von metaphorischer Ausweitung des Gebrauchs von einfachen lexikalischen Einheiten. Die lexikalischen Einheiten der Sprache werden sich nach ihrem Verhalten zu grammatischen und phonologischen Regeln in Klassen gruppieren, und diese Klassen werden sich überschneiden. Der Linguist wird in der Sprache Vokale, Verschlußlaute, Reibelaute, Nasale, Liquide und vielleicht Gleitlaute und Affrikaten erwarten. In keinem Morphem werden sich neun aufeinanderfolgende Vokale oder Verschlußlaute finden. Sollte die Sprache eine Tonsprache sein, so wird sie nicht mehr als ein halbes Dutzend distinktive Ton-Arten besitzen, wahrscheinlich weniger. Wir könnten diese Aufzählung von gemeinsamen Sprachmerkmalen noch lange fortsetzen, aber das hätte nicht viel Sinn. Wir wollen vielmehr die Eigenart der syntaktischen und phonologischen Regeln etwas genauer untersuchen, um die Behauptung weiter zu belegen, daß die menschlichen 229
Sprachen aus allen möglichen Arten des Aufbaus einer Sprache einmütig eine besondere Art gewählt haben. Syntaktische Regeln werden auf abstrakte Satzstrukturen angewendet und modifizieren diese Strukturen in einer gewissen Weise, wobei sie sie mit weniger abstrakten Strukturen verknüpfen, d. h. Strukturen, die Oberflächenstrukturen ähnlicher sind. Die Wirkungsmöglichkeiten der syntaktischen Regeln sind aber stark beschränkt. In einer Sprache nach der anderen erkennt man, daß die Arten der von syntaktischen Regeln bewirkten Modifikationen sich sehr ähneln, und daß diese sich in einem sehr schmalen Bereich des Spektrums denkbarer Modifikationen bewegen. Eine der Wirkungen syntaktischer Regeln ist das Einführen von semantisch leeren Morphemen als Satzverzierungen. Das to in I want to go wird z. B. durch eine syntaktische Regel des Englischen eingeführt; to besitzt offensichtlich keinen semantischen Gehalt, aber verschiedene Verben, darunter want, fordern dieses Morphem bei einem eingebetteten Satzteil. Auf ähnliche Weise fügt eine syntaktische Regel das semantisch leere Morphem daß nach weiß ein, wenn wir etwa einen Satz wie Ich weiß, daß er reich ist bilden. Eine weitere Funktion syntaktischer Regeln ist die Kennzeichnung der Konkordanz. Eine Regel des Englischen kennzeichnet etwa bei Verben die Übereinstimmung mit dem Subjekt nach Numerus und Person; auf der Grundlage dieser syntaktischen Angabe geben phonologische Regeln den Verben ihre angemessene phonologische Form. Eine ähnliche Regel besitzt auch das Französische, aber zusätzlich noch eine weitere, die bei Adjektiven die Übereinstimmung mit dem von ihnen näher bestimmten Substantiv nach Numerus und Genus kennzeichnet. Syntaktische Regeln dienen auch dazu, Konstituenten zu reduzieren, sei es durch völlige Tilgung, sei es durch Einsetzen von Pro-Formen als Ersatz; außerdem können sie die Reihenfolge der Konstituenten in einem Satz ändern. In der Derivation von englischen Possessivbildungen werden sowohl Tilgung als auch Permutation angewendet, so etwa in Peter's hat, was auf abstrakte Strukturen wie the hat of Peter's zurückgeht. The und of müssen durch syntaktische Regeln getilgt werden, und die PossessivNominalphrase, hier Peter's, wird verschoben und vor das vorhergehende Substantiv gestellt. Eine andere Permutationsregel des Englischen bezieht sich auf Verb-Partikeln und stellt sie hinter die folgende Nominalphrase. Aus der Struktur, die The mayor hurriedly looked up the number zugrundeliegt, bildet diese Regel die Struktur, die als The mayor hurriedly looked the number up realisiert wird. 230
Weitere Beispiele für Tilgung und Permutation finden sich in Possessivausdrücken des Aztekischen. In conetl ical ,des Kindes Haus' besteht aus: dem Artikel in ,das', dem Substantiv conetl ,Kind\ dem Possessivpräfix i ,sein' und cal ,Haus'. Die Struktur, die in conetl ical zugrundeliegt, kann noch auf verschiedene andere Arten realisiert werden; die Varianten in ical conetl, conetl ical und ical conetl bedeuten dasselbe. Zwei fakultative syntaktische Regeln bilden die Varianten. Die eine vertauscht eine Nominalphrase, die ein Possessivpräfix wie i enthält, mit einem vorausgehenden Substantiv, und die zweite tilgt den Artikel in. Die erste bringt in ical conetl hervor, die zweite conetl ical. Wenn beide Regeln angewendet werden, ergibt sich ical conetl. Anstelle dieser Regeln, die in menschlichen Sprachen immer wieder vorkommen, ließen sich unbegrenzt viele andere a priori mögliche Regeln vorstellen, die aber überhaupt nie vorkommen. Von all den syntaktischen Regeln, die wir auf der Grundlage der allgemeinen Intelligenz formulieren könnten, machen die Regeln, die die Kinder beim Spracherwerb tatsächlich lernen, eine außerordentlich beschränkte Teilmenge aus. Es kommt häufig vor, daß eine Regel eine semantisch leere Form an einer bestimmten Stelle im Satz einfugt, wie es in der Derivation von Ich weiß, daß er reich ist geschieht. Aber wir werden in keiner menschlichen Sprache eine Regel finden, die nach jedem Wort zwei leere Formen einfügt. Eine Regel, die einen Satz wie Ich daß daß weiß daß daß er daß daß reich daß daß ist daß daß erzeugt, wäre ein sprachliches Unding. Es gibt ebenfalls keine wirklichen Regeln, die zu einem vorhandenen Satz noch eine Kette mit der gleichen Zahl von Morphemen hinzufügen; solche Regeln hätten etwa folgende Wirkung: Ich weiß, er ist reich würde verändert zu Ich weiß, daß daß daß daß daß er reich ist; und Ich weiß, Robert wird nie Schwierigkeiten machen würde zu Ich weiß, daß daß daß daß daß daß daß Robert nie Schwierigkeiten machen würde. Niemand hat je eine Sprache gefunden, in der eine syntaktische Regel jedes Wort verdoppelt, so daß sich Sätze folgender Art ergäben: Tennis Tennis ist ist ein ein anstrengender anstrengender Sport Sport. Es dürfte klar sein, daß eine unbegrenzte Zahl von Regeln dieser Art erfunden werden könnten, die jedoch noch nie in menschlichen Sprachen vorgekommen sind. Auch Konkordanz- und Reduktionsregeln sind in ihrer Anwendung beschränkt. Man wird in keiner Sprache eine Regel finden, die alle Verben eines Satzes zur Ubereinstimmung mit der ersten Nominalphrase nach Numerus und Person kennzeichnet und dabei nur dasjenige Verb ausläßt, dessen Subjekt die erste Nominalphrase ist; eine solche Regel würde etwa folgenden Satz erzeugen: Ich suchen das Buch, von dem He-
in
len enttäuscht bin und Georg sehr gern habe. Man wird auch nie eine syntaktische Regel finden, die ein Adjektiv mit irgendeinem beliebigen Substantiv des Satzes in Übereinstimmung bringt, mit Ausnahme dessen, das es näher bestimmt. Keine Sprache besitzt eine syntaktische Regel, die jedes zweite Morphem oder jedes dritte Wort tilgt. Wenn durch Koordination von zwei einfacheren Satzstrukturen ein komplexer Satz gebildet wird, so wird niemals die erste von zwei identischen Nominalphrasen in koordinierten Strukturen pronominalisiert werden, sondern immer die zweite. Deshalb sind Sätze wie Hans besuchte uns, und er blieb einen Monat möglich — wobei Hans und er sich auf die gleiche Person beziehen —, während man keine Sprachen findet, in denen die Pronominalisierungsregel auf die erste Nominalphrase einwirkt und deshalb Sätze wie Er besuchte uns, und Hans blieb einen Monat erzeugt. Ebenso ist die Wirkung von Permutationsregeln weitgehenden Beschränkungen unterworfen. Eine Regel, die die Wörter eines Satzes nach der Zahl der in ihnen enthaltenen Lautsegmente anordnen würde, wäre sprachlich unmöglich. Keine Sprache enthält eine syntaktische Regel, die fakultativ die Reihenfolge der Wörter eines Satzes genau umkehren könnte, so daß Essen zum morgen kommen Boston aus Männer alte blinde drei als Variante von Drei blinde alte Männer aus Boston kommen morgen zum Essen erscheinen könnte. Auch wird man nie eine Regel finden, die jeweils innerhalb eines aufeinanderfolgenden Paars von Wörtern die Reihenfolge vertauscht wie in Blinde drei Männer alte Boston aus morgen kommen Essen zum. Ähnliche Beobachtungen können im Hinblick auf phonologische Regeln gemacht werden. Phonologische Regeln fügen Segmente hinzu, tilgen Segmente, modifizieren und bestimmen genauer die Identität von Segmenten, die in zugrundeliegenden Repräsentationen angegeben sind usw. Innerhalb dieser Grenzen gibt es ein weites Feld struktureller Möglichkeiten, von denen aber relativ wenige jemals in menschlichen Sprachen ausgenützt werden. Wir wollen nur zwei Sorten von phonologischen Regeln betrachten, diejenigen, die Segmente einfügen, und diejenigen, die die Identität von Segmenten verändern. Bestimmte Arten von Segment-Einfügungsregeln findet man ziemlich häufig in den Sprachen der Welt. Beim Beginn der Untersuchung einer unbekannten Sprache würde ein Linguist sich nicht wundern, eine Regel anzutreffen, die einen Glottisschlag zur Trennung von zwei nebeneinanderstehenden Vokalen oder als Einsatz eines sonst vokalisch anlautenden Wortes einfuhrt. Er wäre auch nicht überrascht, eine Regel zu finden, die zwischen zwei identische oder ähnliche Konsonanten einen Vokal einfügt 232
(wie in englisch judges [JAJSZ]). Auch eine Regel, die am Beginn eines Wortes, das sonst mit einer Konsonantenhäufung beginnen würde, einen Vokal einfügt, wäre nicht ungewöhnlich. Andrerseits würde kein Linguist eine Regel erwarten, die nach jedem zweiten Segment eines Satzes ein [a] einfügt; eine derartige Regel wäre sprachlich unmöglich. Er würde auch keine Regel erwarten, die jeweils zwei nebeneinanderliegende stimmhafte Verschlußlaute in einer Kette durch die Einfügung eines stimmlosen Verschlußlauts trennt oder am Schluß eines jeden Wortes, das auf einen Nasal auslautet, [Cpl] hinzufügt. Desgleichen pflegen phonologische Regeln, die die Identität von Segmenten verändern, in allen Sprachen der Welt ziemlich ähnlich zu sein. Die gleichen Phänomene finden sich in einer Sprache nach der andern, während andere überhaupt nicht vorzukommen scheinen. So wäre es z. B. gar nicht ungewöhnlich, wenn eine Regel ein [i] im Auslaut in ein [i] verwandeln oder Verschlußlaute in dieser Stellung stimmlos machen würde. Es wäre auch nicht erstaunlich, eine Sprache zu finden, in der anlautendes [f] als [h] realisiert wird oder in der ein stimmhafter Verschlußlaut zwischen Vokalen als stimmhafter Reibelaut erscheint. Assimilationsregeln pflegen von Sprache zu Sprache ähnlich zu sein. Häufig werden z. B. Vokale zumindest teilweise nasaliert, wenn ihnen ein Nasal folgt. Nebeneinanderstehende Konsonanten richten sich o f t in der Stimmhaftigkeit nacheinander, so daß entweder beide stimmhaft oder beide stimmlos werden. Eine Assimilationsregel, die einen Verschlußlaut vor [w] labialisiert, ist keineswegs ungewöhnlich usw. Aber kein Linguist erwartet, eine Sprache zu finden, in der ein Konsonant stimmlos wird, wenn er zwischen zwei stimmhaften Konsonanten auftritt. Man kann mit einiger Sicherheit sagen, daß es keine Sprache mit einer Regel gibt, die [a] vor Nasal zu [t] verändert. Es scheint keine Sprache zu geben, die eine Regel besitzt, die einen Glottisschlag als Nasalvokal realisiert oder [£] zu [m] verändert. Aus der Vielzahl von denkbaren Regeln, die dazu dienen könnten, die phonologischen Eigenschaften von einzelnen Segmenten zu verändern, wird nur eine höchst beschränkte Menge in natürlichen Sprachen angetroffen.
Schluß Man hat die Sprache schon aus vielen verschiedenen Gründen untersucht; unsere Darstellung hat sich auf zwei Gründe konzentriert, die wohl die 233
bedeutendsten überhaupt sind. Einerseits haben wir die Untersuchung der Sprache als einen Versuch betrachtet, die sprachliche Kreativität zu erklären, d. h. herauszufinden, wie es einem Sprecher möglich ist, eine potentiell unbegrenzte Menge von Sätzen zu bilden und zu verstehen, die ihm von seiner Erfahrung her völlig neu sind. Andrerseits haben wir in der Untersuchung der Sprache einen Zugang zum Problem des Spracherwerbs gesehen, über den schließlich ein vollständiges Verstehen dieses Vorgangs möglich sein wird. Wir haben festgestellt, daß sich die Unbegrenztheit der Sprache auf den Charakter der menschlichen konzeptuellen Kräfte zurückführen läßt. Als menschliche Wesen sind wir prinzipiell in der Lage, Konzeptualisierungen von beliebiger Komplexität zu bilden (obgleich natürlich die Komplexität eines Gedankens, den wir zu einem bestimmten Zeitpunkt formen und handhaben können, beschränkt ist). Jede beliebige begrifflich geformte Situation aus der unbegrenzten Zahl denkbarer Situationen läßt sich durch die Wahl von angemessenen lexikalischen Einheiten und durch die Anwendung von syntaktischen Regeln in eine Oberflächenstruktur überführen. Phonologische Regeln verknüpfen alle diese Oberflächenstrukturen mit phonetischen Realisierungen. Das abstrakte Sprachsystem beschreibt also eine unendliche Menge von phonetischen Folgen, von denen jeder eine Begriffsstruktur zugeordnet ist. Weil der Sprecher ein derartiges abstraktes Sprachsystem besitzt, beherrscht er eine unendliche Zahl von Sätzen, deren er sich beim Sprechen und Verstehen bedienen kann. Indem wir die Struktur dieser Systeme untersuchen, sind wir auf dem Weg zu einer Erklärung der sprachlichen Kreativität. Wir werden dann die sprachliche Kreativität völlig verstehen, wenn wir die Struktur von Sprachsystemen völlig verstehen, wenn wir verstehen, wie diese Systeme in der Sprachverwendung selbst angewendet werden und welches die psychischen Vorgänge sind, die Begriffsstrukturen hervorbringen. Wir sind zu dem Schluß gekommen, daß Kinder deswegen das Sprechen lernen, weil die Sprache schon in sie „eingebaut" ist. Die Behauptung, daß die Sprachfähigkeit bei Geburt schon vorprogrammiert ist, wird von verschiedenen Seiten gestützt. Die Ansicht, daß die sprachliche Erfahrung eher dazu dient, die Sprache zu aktivieren, als sie zu formen, erklärt die Tatsache, daß die Sprache gattungseinheitlich und gattungsspezifisch ist. Sie erklärt die relative Vollkommenheit des Spracherwerbs, und sie läßt uns verstehen, wie ein Kind in einem vorintellektuellen Alter in der Lage ist, ein System von beachtlicher Komplexität und Abstraktheit zu beherrschen. Darüberhinaus stimmt die Hypothese, daß die Spra234
che bei Geburt schon vorprogrammiert ist, gut mit der Beobachtung überein, daß alle Sprachen ähnlich aufgebaut sind. Sie erklärt die Tatsache, daß sich alle Sprachen in einem außerordentlich engen Rahmen struktureller Möglichkeiten halten, einem Rahmen, der sehr viel beschränkter ist als das Feld der Möglichkeiten, die wir uns auf der Grundlage der allgemeinen Intelligenz vorstellen können. Aber auch wenn wir die Hypothese der angeborenen Vorprogrammierung akzeptieren, bleiben uns noch viele interessante Fragen, die gelöst werden müssen, bevor wir unser Verständnis des Spracherwerbs als vollständig betrachten können. Zum Beispiel: Welche Aspekte der Sprachstruktur sind im einzelnen nicht schon bei Geburt vorprogrammiert, sondern müssen durch Erfahrung erworben werden? Wie geht dieses Lernen vor sich? In welchen Phasen vollzieht sich die Entdeckung der Sprachstruktur und das Erlernen der Sprachverwendung beim Kind? Von welchem Datenmaterial hängt der Spracherwerb letztlich ab? In welchem Maß werden die sprachlichen Universalien von allgemeinen psychischen Beschränkungen bestimmt (Beschränkungen, die auch andere kognitive Phänomene betreffen), und inwiefern werden sie von unserer besonderen angeborenen Sprachfähigkeit bestimmt? Es steht außer Zweifel, daß diese Fragen nur im Zusammenhang einer adäquaten Theorie der Sprachstruktur und einer adäquaten Theorie des allgemeinen psychischen Aufbaus befriedigend gelöst werden können, wobei im Augenblick keine von beiden verfügbar ist. Die Linguisten wissen demnach bei weitem nicht alles, was man über die Sprache wissen kann. Die tatsächlichen Ergebnisse der Sprachforschung sind weitreichend und beträchtlich, aber im Vergleich zu dem, was uns an Erkenntnis noch fehlt, nehmen sie sich bescheiden aus. Die Sprache ist ein schwieriger Untersuchungsgegenstand, weil sie ein psychisches Phänomen ist, das mit anderen Aspekten der psychischen Struktur unmittelbar zusammenhängt. Genau deshalb ist aber auch das Verständnis der Sprache so wichtig. Die Untersuchung der Sprache mag sehr wohl den Schlüssel zum Verständnis unserer selbst liefern.
235
Auswahlbibliographie
Anderson, Wallace L., und Norman C. Stageberg, eds.: Introductory Readings on Language, rev. ed. New York: Holt, Rinehart and Winston 1966 Bach, Emmon: An Introduction to Transformational Grammars. New York: Holt, Rinehart and Winston 1964 *Bechert, Johannes, Daniele Clement, Wolf Thtimmel und KarlHeinz Wagner: Einführung in die generative Transformationsgrammatik. München: Hueber 1970 Bloomfield, Leonard: Language. New York: Holt, Rinehart and Winston 1933 Bloomfield, Morton W., und Leonard Newmark: A Linguistic Introduction to the History of English. New York: Alfred A. Knopf 1963 Boas, Franz: Introduction to the Handbook of American Indian Languages. Washington, D.C.: Georgetown University Press, Institute of Languages and Linguistics 1966 Brown, Roger: Words and Things. New York: The Free Press 1958 Cherry, Colin: On Human Communication. New York: John Wiley & Sons 1961. Dt. Übers. Kommunikationsforschung — eine neue Wissenschaft. 2. Aufl. Frankfurt: S. Fischer 1967 Chomsky, Noam: Syntactic Structures. The Hague: Mouton and Co. 1957 — : Cartesian Linguistics. New York: Harper & Row 1966. Dt. Übers. Cartesianische Linguistik. Ein Kapitel in der Geschichte des Rationalismus. Tübingen: Niemeyer 1971 Denes, Peter B., und Elliot N. Pinson: The Speech Chain. New York: Bell Telephone Laboratories 1963 Dinneen, Francis P: An Introduction to General Linguistics. New York: Holt, Rinehart and Winston 1967 Fodor, Jerry A., und Jerrold J. Katz, eds.: The Structure of Language: Readings in the Philosophy of Language. Englewood Cliffs, N.J.: Prentice-Hall 1964 Gelb, I.J.: A Study of Writing. Chicago: University of Chicago Press 1952 236
Gleason, H.A.: An Introduction to Descriptive Linguistics, rev. ed. New York: Holt, Rinehart and Winston 1961 Hockett, Charles F.: A Course in Modern Linguistics. New York: Macmillan 1958 Hudson-Williams, T.: A Short Introduction to the Study of Comparative Grammar (Indo-European). Cardiff: University of Wales Press 1961 Hudspeth, Robert N., und Donald F. Sturtevant, eds.: The World of Language: A Reader in Linguistics. New York: American Book Company 1967 Jakobson, Roman, C. Gunnar M. Fant und Morris Halle: Preliminaries to Speech Analysis. Cambridge, Mass.: M.I.T. Press 1952 - , und Morris Halle: Grundlagen der Sprache. Berlin: Akademie-Verlag 1960 Jespersen, Otto: Growth and Structure of the English Language. Garden City. N.Y.: Doubleday & Company 1955 — : Language: Its Nature, Development and Origin. New York: The Macmillan Company 1949 (als Taschenbuch erhältlich) *Katz, Jerrold J.: Philosophie der Sprache. Frankfurt: Suhrkamp 1969 Ladefoged, Peter: Elements of Acoustic Phonetics. Chicago: University of Chicago Press 1962 Lehmann, Winfred P.: Historical Linguistics: An Introduction. New York: Holt, Rinehart and Winston 1962. Dt. Übers. Einfuhrung in die historische Linguistik. Heidelberg: Winter 1969 Lenneberg, Erich H.: Biological Foundations of Language. New York: John Wiley & Sons 1967 *Linguistik I. Lehr- und Übungsbuch zur Einführung in die Sprachwissenschaft. Autorengruppe: Hans Bühler, Gerd Fritz, Wolfgang Herrlitz, Franz Hundsnurscher, Bernd Jnsam, Gerd Simon, Heinrich Weber. 2., durchgesehene Aufl. Tübingen: Niemeyer 1971 Malmberg, Bertil: Phonetics. New York: Dover Publications 1963 Pedersen, Holger: The Discovery of Language. Bloomington: Indiana University Press 1931 Reibel, David A., und Sanford A. Schane, eds: Modern Studies in English. Englewood Cliffs, N.J.: Prentice-Hall 1969 Samarin, William J.: Field Linguistics: A Guide to Linguistic Field Work. New York: Holt, Rinehart and Winston 1967 Sapir, Edward: Language: An Introduction to the Study of Speech. New York: Harcourt, Brace & World 1921 (als Taschenbuch erhältlich). Dt. Übers. Die Sprache. Eine Einführung in das Wesen der Sprache. München: Hueber 1961 237
Saussure, Ferdinand de: Grundlagen der allgemeinen Sprachwissenschaft. 2. Aufl. Berlin: De Gruyter 1967 Smalley, William A.: Manual of Articulatory Phonetics, rev. ed. Tarrytown, N.Y.: Practical Anthropology 1963 Stern, Gustaf: Meaning and Change of Meaning. Bloomington: Indiana University Press 1931 Sturtevant, E.H.: Linguistic Change: An Introduction to the Historical Study of Language. Chicago: University of Chicago Press 1917 *Wängler, Hans-Heinrich: Grundriß einer Phonetik des Deutschen mit einer allgemeinen Einführung in die Phonetik. Marburg: Elwert 1960 Waterman, John T.: Perspectives in Linguistics. Chicago: University of Chicago Press 1963 Wilson, Graham, ed.: A Linguistics Reader. New York: Harper & Row 1967
238
Sachregister
Ähnlichkeit der Sprachen, 31, 192, 227-233 Affixe (Definition), 54 Ableitungsaffixe, 5 4 - 5 8 Flexionsaffixe, 5 4 - 5 6 Affrikaten, 135, 229 afrikanische Sprachen, 10, 165 Afrikaans, 217 Akustik, 4 9 - 5 0 , 127, 129 Albanisch, 164, 165, 197, 216 Altbulgarisch, 218 Altenglisch, 176-177 Altfranzösisch, 175 Altkirchenslavisch, 218 Altpersisch, 218 Altpreussisch, 218 Analogie, 15 Anatolisch, 216 angeborene Struktur, 4, 13, 2 2 1 226, 234-235 anthropologische Linguistik, 6 Arabisoh, 54, 134, 166, 169 Armenisch, 216 artikul. Phonetik, 127-136 Aspirierung, 134 Assimilation, 150, 233 Athabaskisch, 10, 164 äußerer Sprachwandel, 169 Ausrufeformen, 24, 25 Aztekisch, 5 3 - 5 5 , 59, 63, 231 Baltisch, 218 Bantu, 165 Bedeutung, 62, 6 4 - 7 9 von Sätzen, 17 von Wörtern, 1 7 - 1 9 Begriffsstruktur, 6 8 - 7 2 , 8 6 - 9 0 Beziehung d. Begriffsstruktur zur Oberflächenstruktur, 9 7 - 1 0 4 Behaviorismus, 15 Bengali, 218
Betonung, 137, 1 7 7 - 1 7 8 in Zusammensetzungen, 58 Beziehung Laut - Bedeutung, 65-74 Bretonisch, 217 Bulgarisch, 165, 218 Chinesisch, 137 conditioning, 15 Dänisch, 216 Dalmatinisch, 217 Denken und Sprache, 4—5, 27—33, 68-79 Derivation, 9 7 - 9 8 deskriptive Linguistik, 6 Deutsch, 18, 2 0 - 2 1 , 30, 31, 3 6 - 3 7 , 44, 6 0 , 6 3 - 6 4 , 132, 134-136, 137, 139, 171-172, 191, 217 Morphologie, 5 0 - 5 8 Phonologie, 140, 142, 174 Syntax, 37, 44, 77, 8 0 - 1 2 6 , 231-232 Zusammensetzungen, 5 8 - 6 1 , 164 Dialekte, 3 7 - 4 2 , 184-188 Auseinandertreten von Dialekten, 186-188
geographische Grenzen von Dialekten, 3 7 - 4 2 zugrundeliegende Einheitlichkeit, 184-186 Dialektgeographie, 3 4 - 4 2 distinktive Unterschiede, 1 3 8 - 1 4 3 Einbettung, 9 0 - 9 7 , 229 Empirismus, 4, 2 2 1 - 2 2 6 Englisch, 18, 20, 32, 3 4 - 3 5 , 61, 6 4 - 6 5 , 132, 134-136, 137, 163, 165-168, 170-173, 178-179, 190-191, 216
239
Morphologie, 51, 56, 57, 1 5 5 158, 183 Phonologie, 62, 63, 140-143, 144-147, 168-169, 174, 1 7 6 178 Syntax, 62, 77, 84, 92, 102, 1 0 3 104, 106-108, 110-112, 1 1 7 119, 123, 154, 176, 230 Zusammensetzungen, 5 8 - 6 0 , 164 Entlehnung, 163-169, 196-197, 198-199 Gründe, 1 6 5 - 1 6 8 Auswirkungen, 168-169 lexikalische Entlehnung, 163-169 phonologische Entlehnung, 1 6 4 165 syntaktische Entlehnung, 1 6 4 165 Eskimosprache, 11, 30 Flämisch, 217 Französisch, 18, 20, 32, 36, 44, 58, 61, 132, 134, 136, 164, 166-167, 168, 172, 174, 175, 177-178, 188, 189, 217 Pariser Französisch, 44 Fremdsprachenlernen, 8 freie Morpheme, 52, 53 Friesisch, 217 gebundene Morpheme, 52, 53 gelehrte Bildungen, 1 6 7 - 1 6 8 genetische Verwandtschaft, 1 8 9 - 2 1 8 Genus, 3 1 - 3 2 , 55, 176, 230 Germanisch, 216 Gleitlaut, 136 glottaler Konsonant, 133, 135 Gotisch, 192,195, 216 Grammatik, 2 6 - 2 7 Definition, 6 Grammatikalität, 2 3 - 2 7 , 7 6 - 7 9 grammatische Kategorien, 3 1 - 3 2 grammatische Klassen, 52, 57, 6 4 - 6 5 , 173, 229 grammatische Morpheme, 5 2 - 5 3 Griechisch, 165, 167, 168, 197, 217 Gujerati, 218 Halbvokale, 136 Hethitisch, 216 Hindi, 218 historische Linguistik, 6, 163-218 Holländisch, 34, 217 hyperkorrekte Formen, 45
240
Idiolekt, 40 idiomatische Wendungen, 6 0 - 6 1 , 229 Indoeuropäisch, 165, 190, 191, 197, 215-218 Indo-Iranisch, 218 Infix, 54 innerer Sprachwandel, 169-184 bei lexikalischen Einheiten, 1 6 9 174, 178-179 bei Regeln, 174-178, 1 7 9 - 1 8 3 innere Rekonstruktion, 193 Irisch, 217 Isländisch, 216 Isoglosse, 3 8 - 4 2 , 187 Isolierbarkeit von sprachlichen Einheiten, 4 9 - 5 0 Italienisch, 36, 166, 188, 217 Italisch, 217 Jiddisch, 217 Kaschmiri, 218 Kasus, 32, 176-177 Katalanisch, 188, 217 Keltisch, 217 Keresisch, 10 Kommunikation der Tiere, 1 2 - 1 4 Komparative Methode, 193-195, 197-210, 215 Kompetenz, 2 5 - 2 7 , 66, 77 komplexe Sätze, 8 6 - 9 7 Konsonanten alveolare, 133, 135, 136 Artikulation, 133-136 aspirierte Kons., 134 glottalisierte, 134 labialisierte, 134 labiodentale, 135 pharyngalisierte, 134 Stimmhaftigkeit, 134, 135 uvulare, 136 velare, 133,135 Konstituente (Definition), 81 Konstituententypen, 8 4 - 8 6 Koordination, 9 1 - 9 7 , 229 Kornisch, 217 Kreativität, sprachliche, 14-15, 234 Kultur und Sprache, 1 0 - 1 1 Ladinisch, 217 Länge, 137 Lateinisch, 55, 167-168, 172, 174, 177-178, 188, 189, 192, 217 Laterale, 136
Lautentsprechungen, 185, 2 0 0 - 2 1 0 Lautmalerei, 18 Lautsymbolik, 18 Lautwandel, 2 0 3 - 2 1 5 Regelmäßigkeit, 2 0 3 - 2 1 5 als Regelveränderung, 2 1 1 - 2 1 5 Lehnübersetzung, 164 Lehnwort, 1 6 5 - 1 6 8 Lettisch, 218 lexikalische Einheiten: Veränderungen, 1 6 9 - 1 7 4 , 1 7 8 - 1 8 0 Prägung, 1 7 0 - 1 7 1 Kombination, 171 Ausweitung, 1 7 1 - 1 7 2 Verlust, 1 6 9 - 1 7 0 lexikalische Morpheme, 5 2 - 5 3 Lexikon, 21 Definition, 56 Linguistik (Definition), 5 Zweige der, 6 Liquide, 136, 229 Litauisch, 218 literarischer Stil, 10 liturgische Sprache, 218 Lydisch, 216 Mehrdeutigkeit, 8 2 - 8 3 , 9 9 - 1 0 0 , 1 1 2 - 1 1 3 , 121 Metapher, 43, 6 0 - 6 1 , 64, 172, 229 Metathese, 152, 153 Morphem, 5 0 - 5 4 , 6 2 - 6 5 Definition, 5 0 - 5 1 Morphemtypen, 5 2 - 5 4 Morphologie, 1 5 5 - 1 5 9 Veränderungen in der Morphologie, 173, 1 7 6 - 1 7 7 , 1 8 2 - 1 8 3 nasale Konsonanten, 135, 229 Nasalität, 132 Nasenhöhle, 129 Negation, 51, 57, 1 1 2 - 1 1 3 , 121, 124, 1 4 8 - 1 5 3 , 176, 229 Nepali, 218 Neustrukturierung, 1 8 0 - 1 8 2 , 2 1 4 215 Neutralisierung, 143 Nominalphrase (Definition), 8 4 - 8 5 Norwegisch, 216 Numerus, 32, 55, 77, 112, 146, 1 4 8 151, 154, 1 5 5 - 1 5 8 , 174, 1 7 6 177, 2 3 0 - 2 3 2 Oberflächenstruktur, 69, 7 3 - 7 4 , 80-86
Beziehung zur Begriffsstruktur, 97-104 Obstruenten, 157 Oskisch, 217 Ossetisch, 218 Palaisch, 216 palatale Konsonanten, 133, 135 Palatum, 130 Panjabi, 218 Paschto, 218 Performanz, 2 5 - 2 7 , 66, 7 6 - 7 7 Persisch, 218 Person, 55, 77, 112, 154, 174, 176-177, 230-232 Personalpronomen, 108 Pharynx, 134 Philosophie und Linguistik, 4 Phonetik, 6 s.o. artikulatorische Phonetik, 127-136 phonetische Realisierung, 71 phonologische Regeln, 21, 67, 1 4 3 159, 1 8 5 - 1 8 6 Anordnung der phonologischen Regeln, 154, 158 Hinzufügung von phonologischen Regeln, 178, 2 1 1 - 2 1 5 Verlust von phonologischen Regeln, 1 7 6 - 1 7 7 für Assimilation, 1 5 0 - 1 5 2 , 158 für Betonung, 153, 1 7 7 - 1 7 8 für Einfügung, 152, 1 5 7 - 1 5 8 , 232-233 für Merkmalveränderung, 1 4 7 152, 158, 178, 232 für Metathese, 1 5 2 - 1 5 3 für Redundanz, 1 4 4 - 1 4 7 für Tilgung, 1 4 9 - 1 5 1 Veränderung von phonologischen Regeln, 1 7 7 - 1 7 8 , 213 phonologische Repräsentation, 6 2 63,140-143, 185-186 Veränderungen, 174, 2 1 3 - 2 1 5 phonologische Systeme, 21, 67, 164-165, 168-169 Veränderungen, 1 7 6 - 1 7 8 , 1 8 1 182, 2 1 1 - 2 1 5 Polnisch, 190, 218 Portugiesisch, 188, 189, 217 Possessivbildungen, I I I , 1 5 7 - 1 5 8 , 175-176, 230-231 Präfix (Definition), 54
241
praktische Anwendungen der Linguistik, 4 - 6 Pro-Formen, 108-110, 229 Definition, 108 Pronominalisierung, 108, 120, 124 Proto-Sprache, 189-190, 192 Rekonstruktion der, 193-195, 196 Provenzalisch, 217 Psycholinguistik, 6 Psychologie und Linguistik, 4 , 9 - 1 0 , 6 8 Rassenmerkmale und Sprache, 10 Rationalismus, 4, 2 2 1 - 2 2 6 Redeteile, 54 Reflex, 205 Regelveränderungen, 174-178, 1 7 9 180 Reibelaute (Frikative), 135, 229 reinforcement, 7, 15 Rekonstruktion, 1 9 3 - 2 1 0 Problem der Entlehnung, 1 9 6 199 Relativsatz, 9 6 , 1 1 5 - 1 1 9 , 1 2 0 - 1 2 1 , 125 Relativpronomen, 117, 120, 125 Rhäto-Romanisch, 217 romanische Sprachen, 188,189, 192, 197, 217 Romansch, 217 Rumänisch, 165, 188, 217 Rundung, 129, 132 Russisch, 1 8 - 1 9 , 135,167, 171, 176, 190, 218 Sanskrit, 218 Sardisch, 217 Satzbruchstiicke, 2 4 - 2 5 Satzlänge, 22, 7 6 - 7 7 , 9 3 - 9 5 Satzverzierungen, 110-112, 121, 122, 230 Schottisches Gälisch, 217 Schwedisch, 216 Schweizerdeutsch, 217 Schwestersprachen, 189 Semantik, 68 s. auch Bedeutung semantische Repräsentation, 62—65 semantischer Wandel, 1 7 1 - 1 7 2 semantisches System, 19, 7 1 - 7 4 Serbo-Kroatisch, 218 Slavisch, 189,190, 198, 218 Slovakisch, 218 Slovenisch, 218 242
Sozialstruktur und Sprache, 42 Sozialwissenschaft und Linguistik, 5 Soziolinguistik, 6 Spanisch, 35, 6 0 - 6 1 , 134, 136, 163, 164, 188, 189, 217 Sprache: geographische Grenzen, 34-37 Ursprünge, 1 0 - 1 2 Spracherwerb, 7 - 1 0 , 13, 15-16, 22, 140-143, 219-226, 2 3 3 - 2 3 5 und Sprachwandel, 43, 1 8 1 - 1 8 4 Sprachfamilie, 189, 2 1 5 - 2 1 8 sprachliche Universalien, 2 2 7 - 2 3 3 sprachliche Vielfalt, 3 4 - 4 3 Sprachstil, 42 Sprachwandel s. äußerer, innerer Sprachwandel Sprechorgane, 127-136 Stammbaumstruktur, 81 Stimmbänder, 129 Stimmgebung, 129 Stimmhaftigkeit, 134, 135, 146 stimulus-response-Modell, 15 Suffix (Definition), 54 suprasegmentale Merkmale, 137 Synonymie, 100-104 syntaktische Regeln, 2 3 - 2 4 , 74, 8 6 90, 9 7 - 1 2 6 Anordnung, 154 Durchbrechen der Regeln, 7 7 - 7 9 für Einfügung, 110-112, 121, 122-123, 2 2 9 - 2 3 0 für Konkordanz, 112, 121, 123, 229-231 für Permutation, 112-115, 1 2 3 124, 176, 2 3 1 - 2 3 2 für Reduktion, 104-110, 1 2 0 121, 123-124, 2 3 1 - 2 3 2 für Tilgung, 104-108, 123, 124, 175, 2 2 9 - 2 3 0 Veränderungen, 1 7 5 - 1 7 6 syntaktische Repräsentation, 74, 112 Veränderungen, 173 syntaktisches System, 2 3 - 2 4 , 7 1 - 7 4 , 164-165 Veränderungen, 175-176 Syntax (Definition), 68 Tempus, 32, 55, 56, 67, 71, 82, 111-112, 122-123, 146, 1 4 8 153, 155-159, 173, 176, 183 Tocharisch, 216 Tochtersprachen, 189 Tonsprachen, 137, 229
Tschechisch, 190, 218 Türkisch, 19, 169 Ukrainisch, 218 Umbrisch, 217 Universalien, 227-233 unvollkommenes Lernen, 182-183 Uvula, 136 Velum, 129 Verbalphrase (Definition), 84 Verb-Partikel-Konstruktion, 102, 230 Verschlußlaut, 133, 135, 229 verwandt, 204 verwandter „Satz", 203-204 Verwandtschaft der Sprachen, 188, 189-218
Vokale: Artikulation, 129-133 Länge, 137 Nasalität, 132 Rundung, 129, 132 Vokalharmonie, 169 Weißrussisch, 218 Wort, 50 willkürlicher Charakter des Worts, 17-18 Wurzel, 52 Definition, 5 3 - 5 4 Zahndamm (Alveolen), 130 Zusammensetzungen, 5 8 - 6 0 Zweig (im Stammbaum), 81
243