232 103 24MB
German Pages 112 Year 1973
Linguistische Arbeiten
9
Herausgegeben von Herbert E. Brekle, Hans Jürgen Heringer, Christian Rohrer, Heinz Vater und Otmar Werner
Hubert Lehmann
Linguistische Modellbildung und Methodologie
Max Niemeyer Verlag Tübingen 1973
Dem unbekannten Native Speaker gewidmet
ISBN 3-484-10184-9
Max Niemeyer Verlag Tübingen 1973 Alle Rechte vorbehalten. Ohne ausdrückliche Genehmigung des Verlages ist es auch nicht gestattet, dieses Buch oder Teile daraus auf photomechanischem Wege (Photokopie, Mikrokopie) zu vervielfältigen. Printed in Germany
VORWORT
Den Anstoß für diese Arbeit gab eine Frage, die mich vom Beginn meines Linguistikstudiums an bewegte: Wie können sprachliche Einheiten einer unbekannten Sprache gefunden werden? Diese Frage ist für einen Linguisten nahezu selbstverständlich und alles andere als neu. Trotzdem fand ich beim Studium der einschlägigen Literatur nur unbefriedigende oder teilweise befriedigende Antworten. Das veranlaßte mich, den Versuch zu machen, einen möglichst vollständigen Rahmen für linguistische Beschreibung zu suchen und zu formulieren, der es gestatten würde, einerseits Analysemethoden zu begründen und andererseits ein Format für die Ergebnisse zur Verfügung zu haben. Es ist klar, daß in einem solchen Rahmen vieles neu formuliert werden mußte, was schon bekannt war oder bekannt schien, da ja die Grundlagen dieses Wissens in Frage gestellt waren. Wegen der angestrebten Geschlossenheit der Darstellung scheint diese Arbeit auf den ersten Blick einen gewissen Lehrbuchcharakter zu haben. Hier wird jedoch eine gewisse Vertrautheit mit linguistischen und sprachphilosophischen Kontroversen und Problemen vorausgesetzt, was natürlich in einem Lehrbuch nicht erlaubt wäre. An dieser Stelle möchte ich recht herzlich danken für wertvolle Anregungen, die ich während meines Studiums an der State University of New York at Buffalo in vielen Diskussionen erhalten habe mit John Corcoran, Newton Garver, Paul L. Garvin, David G. Hays und vielen Teilnehmern des Linguistic Summer Institute "71. Daneben gilt mein besonderer Dank Prof. Dr. Klaus Baumgärtner für die Betreuung dieser Arbeit.
INHALTSVERZEICHNIS
Vorwort
V
1.
Einleitung
l
1.0. 1.1.
Vorbemerkung Ansatz des amerikanischen Strukturalismus
l l
1.1.1. Wissenschaftstheoretische Position 1.1.2. Konzeption des Sprachmodells
l 4
1.2. Modell und Methoden des vorliegenden Versuchs 1.2.1. Wissenschaftstheoretische Position 1 . 2 . 2 . Grundriß eines Sprachmodells und seiner
8 8
Analyse- und Verifikationsmethoden
12
2.
Definition des Sprachmodells
17
2.1.
Weltmodell, Individuum, Weltbild
17
2.2.
Kommunkation, Sprache, Gesellschaft
22
2.3. 2.4.
Sprachliche Variation Äußerungen
24 29
3.
Sprachbeschreibung und Grammatiktypen
32
3.1. 3.2.
Erkennungsverfahren (Discovery Procedure) Generative Grammatik und Erkennungsgrammatik
32 37
3.2.1. Generative Grammatiken 3 . 2 . 2 . Erkennungsgrammatiken 4. Analysemethoden 4.1. Ansatz der Beobachtung 4.1.1. Informanten 4 . 1 . 2 . Corpus 4 . 1 . 3 . Normierung 4 . 1 . 4 . Analysefehler
37 43 47 47 47 49 53 56
VIII
4.2.
Charakterisierung der Methoden mit Hilfe der Begriffe Syntaktik, Semantik, Pragmatik 4.2.1. Klärung der Begriffe Syntaktik, Semantik, Pragmatik 4 . 2 . 2 . Syntaktische Methoden 4 . 2 . 3 . Semantische Methoden
58 58 61 63
5. Analysegebiete 5.1. Phonologie 5.1.1. Phone und Phoneme 5.1.2. Kombination von Phonemen 5.2. Morphologie und Lexikographie 5.3. Syntax 5.3.1. Phrasenstruktur von Sätzen 5.3.2. Semantische Beziehungen zwischen Sätzen 5.3.3. L als dreiwertige Logik 5.4. Texte und Kontexte
67 67 67 68 7l 76 76 81 83 85
6. Appendix 6.1. Morph- und Wortgrenzen 6.2. Distributionstests 6.3. Paraphrasetests 6.3.1. Paraphrasierbarkeit von Nominalphrasen, die 'quelque chose1 enthalten 6 ; 3 . 2 . Folk Taxonomy 6 . 4 . Fragment eines formalen semantischen Systems
88 88 94 96 96 97 98
l.
EINLEITUNG
0.O. Vorbemerkung In dieser Arbeit wird die Absicht verfolgt, empirische Fragestellungen in der Linguistik wieder stärker zu betonen, nachdem in den vergangenen fünfzehn Jahren das Hauptgewicht auf der Konstruktion formaler Syntaxmodelle gelegen hat. Dabei wird versucht, linguistische Arbeitsweisen in einen größeren wissenschaftstheoretischen Zusammenhang zu stellen und gleichzeitig die bestehenden formalen Modelle so zu erweitern, daß auch semantische und pragmatische Probleme in ihnen dargestellt werden können. In diesem Zusammenhang erschien es zweckmäßig, den amerikanischen Strukturalismus nochmals näher zu betrachten, da dieser um strikte Methoden in der empirischen Untersuchung sehr stark bemüht war. Dabei sollen seine Unzulänglichkeiten herausgearbeitet werden und die Konsequenzen sichtbar gemacht werden, die daraus zu ziehen sind. An die Betrachtung des amerikanischen Strukturalismus schließt sich in der Einleitung eine Skizze des hier entwickelten Sprachmodells und seiner Analysemethoden an, die die Intuition vermitteln soll für die präziseren Darstellungen der Kapitel 2 bis 4. In Kapitel 5 und im Appendix werden dann exemplarisch Analysemethoden und Darstellungsweisen in einzelnen Gebieten der Linguistik vorgeführt. 1.1.
Der Ansatz des amerikanischen Strukturalismus
1.1.1. Wissenschaftstheoretische Position Die Entwicklung der Linguistik seit dem letzten Jahrhundert und insbesondere die des amerikanischen Strukturalismus verlief in gewisser Zeit parallel zur Entwicklung der Psychologie jener Zeit, und die theoretischen Standpunkte und Kontroversen der
Psychologie spiegeln sich in der Diskussion der Linguisten wieder. Aber neben dem Auftreten des Behaviorismus war natürlich auch die wachsende Unbefriedigung an der traditionellen Grammatik, deren Untauglichkeit sich bei den gerade aktuellen Untersuchungen von Indianersprachen deutlich zeigte, Anstoß für einen Neubeginn der Linguistik. Dieser Neubeginn fand seinen Ausdruck 1926 in Leonard Bloomfiels "Set of Postulats für the Science of Language". Bereits im Titel wurde klar, worum es ging: Sprachwissenschaft sollte aufgefaßt werden als Naturwissenschaft, als empirische Wissenschaft. Sie sollte axiomatisch aufgebaut sein, und das Set of Postulates versuchte die erforderlichen Grunddefinitionen und Axiome (die dort als Annahmen bezeichnet werden) zu liefern. Bloomfield begründete sein Vorgehen, indem er auf A Set of Postulates for Psychology, das von A . P . Weiss zuvor veröffentlicht worden war, hinwies, und damit, daß es an der Zeit sei, die linguistische Terminologie zu klären und den Gegenstandsbereich der Linguistik abzugrenzen - interessanterweise vor allem auch gegenüber der Psychologie. Bloomfield wollte Unabhängigkeit von bestimmten psychologischen Richtungen erreichen, scheute sich dann aber trotzdem nicht, das Stimulus-Reaktion-Konzept des Behaviorismus in seinen Postulaten an entscheidender Stelle zu verwenden. Daß Bloomfield Anleihen bei der Psychologie macht, scheint nach dem eben Gesagten zunächst paradox, daß diese psychologischen Anleihen aber beim Behaviorismus gemacht werden, ist völlig einleuchtend, wenn man Verwandschaft der wissenschaftstheoretischen Postitionen von Behaviorismus und amerikanischem Strukturalismus in Betracht zieht. Beide versuchten, sich auf das Beobachtbare und seine Beschreibung zu beschränken: Der Behaviorismus auf Verhaltensweisen und der Strukturalismus auf Sprechereignisse oder Äußerungen, - und bei beiden erwies sich diese Einschränkung als zu eng. Hieraus wird k l a r , daß beide Richtungen die Haltung des Empirismus einnehmen, wenn das auch Bloomfield weder in den Postulaten noch in seinem Buch Language so ausdrückt.
Damit stellen sich dem amerikanischen Strukturalismus natürlich auch alle Probleme des Empirismus und zusätzlich eines, das sich als das zentrale Problem des Strukturalismus herausstellen sollte, nämlich das des Begriffs Meaning . Dieses Problem wurde von Bloomfield und seinen Nachfolgern energisch - wenn auch vergeblich - verdrängt und verursachte dadurch Konfusionen, die zum Teil bis heute bestehen. Wenn man Carnaps Unterscheidung von Beobachtungssprache und theoretischer Sprache annimmt, so läßt sich feststellen, daß der amerikanische Strukturalismus die Intention hatte, mit einer Beobachtungssprache in der Linguistik auszukommen, was die Versuche begründet, alle Definitionen zu operationalisieren und Analyseverfahren zu entwickeln, die zumindest im Prinzip auf den Gebrauch von Meaning verzichten (vgl. vor allem Harris). Innerhalb des amerikanischen Strukturalismus entstanden zwei Richtungen, die man als realistisch und idealistisch (oder mit M. Joos: "God's-truth and hocus-pocus linguistics") bezeichnen könnte. Erstere vertrat die Auffassung, daß die Struktur bereits in der Sprache vorhanden sei und nur vom Linguisten entdeckt werden müßte mit Hilfe geeigneter Methoden. Die Vertreter dieser Richtung bemühten sich konsequenterweise auch darum, einen Algorithmus (discovery procedure) für die Analyse von Sprachstrukturen, Die zweite Richtung nahm an, daß die Struktur den Sprachen erst durch die linguistische Analyse aufgeprägt werde und vorher nicht vorhanden sei. Bei den Vertretern dieser Richtung stand die Einfachheit und die Zweckmäßigkeit einer Beschreibung im Vordergrund. Bei näherem Hinsehen erweisen sich diese Standpunkte als rein metaphysisch begründet, d.h. ohne praktische Auswirkungen, was sich auch daran zeigte, daß sich die praktische Arbeit beider Richtungen kaum unterschied.
Unter Beobachtungssprache wird eine Sprache v e r s t a n d e n , die nur Begriffe verwendet, die der Beobachtung direkt zugänglich sind. Das sind B e g r i f f e w i e s i e i n d e n s o g e n a n n t e n P r o t o k o l l s ä t z e n a u f t r e t e n ( B s p . Objekt a befindet sich zur Zeit t am Ort (x,y,z). I n d e r t h e o r e t i s c h e n S p r a c h e sind h i n g e g e n a u c h d e r B e o b a c h t u n g nicht direkt zugängliche B e g r i f f e e r l a u b t , in der Physik zum B e i s p i e l Kraft, Masse, Elektron.
1.1.2. Konzeption des Sprachmodells Der theoretische Rahmen des Sprachmodells des amerikanischen Strukturalismus geht bis auf Details auf Bloomfield zurück. Der Begriffsapparat des Set of Postulates hat sich bis 1957 nur wenig gewandelt, wenn auch versucht worden ist, Bloomfields Definitionen teilweise durch Operationelle Definitionen zu ersetzen: Für den Begriff Phonem vgl. Swadesh, ( 1 9 3 4 ) , für den Begriff Morphem, vgl. Nida, (1948) . Den Hintergrund für das strukturalistische Sprachmodell bildet eine Gesellschaft, d . h . eine Gemeinschaft von Individuen mit gleicher Kultur und "Sprache". Eine solche Gemeinschaft heißt auch Sprechgemeinschaft (speech community) . In bestimmten gesellschaftlichen "Situationen" (social situations) werden Sprechakte (acts of speech) oder Äußerungen (utterances) von Mitgliedern der Sprechgemeinschaft hervorgebracht. Der Anlaß für eine Äußerung ist ein "Stimulus", ihr Ergebnis ist eine "Reaktion". Die Bedeutung (meaning) einer Äußerung ist nach Bloomfield die Menge von Stimulus-Reaktion-Paaren, die diese Äußerung begleiten oder begleiten können, nach Harris die Menge von gesellschaftlichen Situationen, in denen die Äußerung hervorgebracht wird oder hervorgebracht werden kann. Die Menge von Äußerungen, die in einer Sprechgemeinschaft gemacht werden können, ist die Sprache dieser Sprechgemeinschaft. Hier tauchen sofort einige Probleme a u f : 1. Das Problem der Abgrenzung einer Sprechgemeinschaft. Wie läßt es sich entscheiden, ob zwei Individuen derselben Sprechgemeinschaft angehören? Natürlich ist sich auch Bloomfield bewußt, daß es innerhalb von Sprechgemeinschaften soziale und geographische Untergemeinschaften gibt, daß sich alle Sprecher einer Sprache voneinander unterscheiden, d . h . verschiedene Idiolekte besitzen, und daß die Übergänge zwischen verschiedenen Sprechgemeinschaften oft fließend sind. Trotzdem wird im amerikanischen Strukturalismus die oben gestellte Frage nur auf intuitiver Basis beantwortet. 2. Der Situationsbegriff. Was ist eine Situation? Wie unterscheiden sich Situationen? Der Begriff der Situation wird nur umgangssprachlich verwendet.
Es wird vor allem nicht untersucht, ob sich nicht daraus Konsequenzen für die Sprachbeschreibung ergeben. Es wird sich in späteren Abschnitten zeigen, daß dieser zunächst recht harmlos erscheinende Begriff besonders bei der Bedeutungsanalyse erhebliche Schwierigkeiten bereitet. 3. Das Problem der Gleichheit von Äußerungen. Es war auch den Strukturalisten bekannt, daß Äußerungen zunächst als physikalische Ereignisse vorliegen und daß deshalb keine zwei Äußerungen völlig gleich sind. Da nun aber die Bedeutung von Äußerungen eine Menge von Situationen sein soll, in welcher diese Äußerung verwendet wird, ergibt sich die Notwendigkeit, erstens Äußerungen nicht als physikalische Ereignisse sondern als abstrakte Entitäten zu verstehen und zweitens zwischen diesen einen neuen Gleichheitsbegriff zu definieren. Dies ist eingesehen worden, ohne daß ein zufriedenstellender Gleichheitsbegriff definiert worden wäre. Das liegt an folgender Schwierigkeit: Im wesentlichen kommt es auf so etwas wie Bedeutungsgleichheit an, Zeitpunkt, Ort, Sprecher der Äußerung sind ziemlich gleichgültig. Genau das ist aber das Problem, da ja mit Hilfe der Gleichheit von Äußerungen gerade deren Bedeutung erfaßt werden soll. Die Gefahr des Zirkels ist offenbar; es gibt jedoch einen praktischen Ausweg, aber zumindest für den Strukturalismus keinen theoretischen. Der praktische Ausweg lag übrigens in der Frage an den Informanten, ob zwei Äußerungen (bedeutungs-)gleich seien oder nicht. 4. Die Sprache als Menge von Äußerungen. Das Problem liegt hier einerseit in der allzu strengen Einschränkung auf das Beobachtbare. Diese Sprachdefinition erscheint mir wie folgende "Definition" einer Tasse: "Eine Tasse ist lOOg Porzellan". Mit anderen Worten: Es wird ein Aspekt natürlicher Sprachen herausgegriffen zuungunsten einer Reihe anderer Aspekte wie zum Beispiel der der kommunikativen Funktion. Dadurch wird die Definition viel zu weit, was man daran erkennt, daß es unvernünftig wäre, jede Menge von Äußerungen als Sprache zu bezeichnen. Andererseits ergibt sich eine mehrfache Mehrdeutigkeit, auf
die Bar-Hillel 1964 hingewiesen hat. Nach Bar-Hillel hängt die Interpretation der Definition erstens davon ab, ob man Äußerungen als types oder tokens (die abstrakten Entitäten oder die physikalischen Ereignisse von 3.) betrachtet und zweitens davon, ob man die Sprache als Menge möglicher oder tatsächlich gemachter Äußerungen ansieht. Beschränken wir uns auf die zweite Alternative: Hier wird man sicherlich nicht nur tatsächlich gemachte Äußerungen zulassen wollen sondern nicht gemachte aber mögliche. Doch wie ist der Begriff der möglichen Äußerung zu definieren? Auch hier bleiben die strukturalistischen Linguisten die Antwort schuldig. Nach der Betrachtung der Grundlagen des strukturalistischen Sprachmodells nun eine Darstellung seiner wesentlichen Teile: In Language teilt Bloomfield ) 9 1950:138) die Linguistik in die Teilbereiche Phonetik und Semantik ein, wobei diese sich weiter in Grammatik und Lexikon aufteilt. Diese Aufteilung hat sich allerdings nicht durchgesetzt. Harris zum Beispiel teilt die Linguistik in Structural Linguistics in Phänologie und Morphologie auf. Diese verschiedenen globalen Einteilungen sind jedoch nicht wesentlich, da dieselben Grundbegriffe verwendet und dieselben Bereiche untersucht werden. Wenden wir uns deshalb vor allem der Darstellung dieser Grundbegriffe zu. Äußerungen liegen zunächst als physikalische Ereignisse vor, die abgesehen von Sprechpausen die Eigenschaft haben, kontinuierlich zu sein. Die Beschreibung solcher Äußerungen durch den strukturalistischen Linguisten läuft auf eine Segmentierung hinaus, durch welche minimale Einheiten erzeugt werden, derart daß die Äußerungen dann als diskrete Ketten endlich vieler solcher minimaler Einheiten dargestellt werden. Aufgrund der physikalischen Eigenschaften existiert - wie auch Bloomfield schon wußte - keine "natürliche" Segmentierung, weshalb die Gesichtspunkte der Einfachheit und Eindeutigkeit der Beschreibung hinzugezogen wurden. Es wurde außerdem unterschieden in bedeutungsunterscheidende aber bedeutungslose Einheiten und bedeutungstragende Einheiten.
Diese Einheiten wurden Phonem bzw. Morphem genannt. Beim Begriff des Phonems tritt dieselbe Problematik auf wie bei Äußerungen ( s . o . ) . In seinem Aufsatz On Defining the Phoneme (1935) hat Twaddell das wohl von den Strukturellsten am klarsten erkannt. In der Carnapschen Terminologie ließe sich Phonem als theoretischer Term charakterisieren, da der Begriff nicht für ein physikalisches Objekt steht. Beim Begriff des Morphems ergibt sich folgender Sachverhalt: Die Bedeutung von Bedeutung (meaning) hat sich nbemerkt gewandelt, denn die Bedeutung des Morphems kann nicht so definiert werden wie die einer Äußerung. Bloomfield nennt die Bedeutungen von Morphemen Semeine, ohne jedoch nur den geringsten Hinweis zu geben, was darunter zu verstehen sei. Daß die amerikanischen Strukturalisten trotzdem vernünftige Morphemanalysen zustandebrachten, lag daran, daß ihre Intuition weit besser war als ihre theoretischen Formulierungen. Nach der Betrachtung der minimalen Einheiten soll nun eine Darstellung der nicht-minimalen und maximalen Einheiten angeschlossen werden. Phrasen sind Ketten von Morphemen oder Wörtern, wobei Wörter nach Bloomfield minimale Formen sind. Phrasen werden darüber hinaus in den Postulaten noch durch die Beispiele the book und book on erläutert, wobei nur das erste eine Phrase darstellt. Ein Grund dafür wird leider nicht angegeben. Eine maximale Kette in einer Äußerung ist ein Satz.Doch wie weiß man, daß eine Kette maximal ist? Auch hier scheint es nur eine intuitive Antwort zu geben. Als letztes sollen die Begriffe Kategorie und Redeteil dargestellt werden; dazu müssen allerdings erst die Begriffe Konstruktion, Position und Funktion eingeführt werden: Nicht minimale Formen (Phrasen) können bezüglich ihrer Anordnung gleich oder teilweise gleich sein. Solche Gleichheiten der Anordnung sind Konstruktionen. Dabei ist jede der Einheiten der Anordnung eine Position^ ihre Bedeutung eine funktionelle Bedeutung. Die Positionen, in welchen eine Form (Morphem, Wort, Phrase) vorkommt, sind ihre Funktionen , und alle Formen mit denselben Funktionen
8 konstituiren eine Formklasse, deren Bedeutung eine Klassenbedeutung ist. Klassenbedeutungen und funktionelle Bedeutungen einer Sprache sind deren Kategorien. Eine Formklasse von Wörtern ist eine Wortklasse. Die maximalen Wortklassen sind die Redeteile einer Sprache. (Vgl. Set of Postulates) Es ist offenbar, daß hier die Begriffe Bedeutung und Sprache erneut modifiziert werden. Wie man Bloomfields Beispielen entnimmt, soll nichts weiter als die üblichen Begriffe von Kategorie, Konstruktion u. s.w. definiert werden. Daß dies formal mißlingt, ja mißlingen muß, liegt natürlich daran, daß der Begriff der Bedeutung so undurchsichtig bleibt und nur immer Facetten davon verwendet werden. Bei Harris (1951; ^ 1 9 6 9 ^ Kap. 15f) wird versucht, diese Schwierigkeit dadurch zu umgehen, daß Morphemklassen definiert werden als Klassen von Morphemen, die in der gleichen Menge von Umgebungen stehen können. Dies allein hilft aber leider auch nicht weiter, denn die dadurch erzeugten Klassen decken sich wohl kaum mit den intuitiv gewünschten Nomen oder Adjektiv. Man denke nur an folgende Beispiele wie (a) (b) (c) (d) etc .
die die die die
grüne Birne gefällt mir. grüne Bedeutung gefällt mir. langsame Fahrt gefällt mir. langsame Birne g e f ä l l t m i r .
Abschließend sei bemerkt, daß die meisten der hier aufgeführten Mängel des strukturalistischen Sprachmodells den Strukturalisten selbst mehr oder weniger bekannt waren. Nur wurden leider nur sehr selten Konsequenzen daraus gezogen und bessere Ansätze versucht. Es sei hinzugefügt, daß auch der Chomskysche Ansatz hier keine Abhilfe geschaffen hat, denn dort wurde die Sprache aus einem anderen Blickwinkel betrachtet, der es (scheinbar) erlaubte, den Großteil der hier angeführten Problematik zu vernachlässigen. 1.2. Modell und Methoden des vorliegenden Versuchs 1.2.1. Wissenschaftstheoretische Position Der hier vertretene wissenschaftstheoretische Standpunkt läßt sich mit dem Etikett Pragmatismus charakterisieren. Was
darunter verstanden werden soll, soll im folgenden erläutert werden. Man denke sich auf der einen Seite den Gegenstandsbereich die Sprache - gegeben, auf der anderen Seite ein Modell für den Gegestandsbereich - das Sprachmodell -, das die Phänomene des Gegenstandsbereichs beschreibt. Das Modell habe die Form einer deduktiven Theorie, in welcher aus Grundhypothesen spezielle Hypothesen abgeleitet werden, für die eine Verifikationsmethode existiert. Nachdem die Hypothesen vermittels der Verifikationsmethoden überprüft worden sind, wird das ursprüngliche Modell so modifiziert, daß nur die korrekten Hypothesen abgeleitet werden können. Der eben beschriebene Vorgang heiße Analysezyklus. Es ist offenbar, daß beliebig viele derartige Zyklen hintereinandergeschaltet werden können; die fundamentale Annahme dabei ist, daß die sukzessive Anwendung des Verfahrens das Modell präziser und "besser" macht. (Ähnliche Überlegungen wurden auch angestellt von Quine, 1953, S . 4 2 f f , Saumjan, 1968, S . 2 8 , Mathiot, 1971). Hier stellt sich natürlich auch die Frage des Anfangs, d . h . nach der Form des ersten Modells. Denn einerseits scheint jede Untersuchung Hypothesen vorauszusetzen, andererseits können (vernünftige) Hypothesen nur aufgrund einer vorausgegangenen Untersuchung des Gegenstandsbereichs gewonnen werden. Dabei ist zu bemerken, daß Theorien nicht losgelöst von vorwissenschaftlicher Erfahrung - "Intuition" - entwickelt werden, daß es immer ein Erkenntnisinteresse geben muß und daß immer eine Beobachtungsperspektive vorliegt. Diese beiden Begriffe Erkenntnisinteresse und Beobaohtungspevspektive sind in der Vergangenheit der Wissenschaft oft vernachlässigt, ja geleugnet worden zugunsten der Mythen von der "Wahrheitssuche" und der "Objektivität", womit dann der Wissenschaftler auch nicht für die Ergebnisse seiner Forschung verantwortlich gemacht werden konnte. Gerade die Verantwortlichkeit des Wissenschaftlers leitet sich ja aus seinem Erkenntnisinteresse (oder dem seiner Auftraggeber) ab. Beschäftigen wir uns also etwas näher mit dem Erkenntnisinteresse. Dabei ist zwischen einem vordergründigen, partiellen und
10
einem globalen Interesse zu unterscheiden. Im ersten Fall abstrahiert man zum Beispiel vom Situationskontext von Äußerungen, weil man nur an deren Syntax interessiert ist. Im zweiten Fall kann dieses Interesse schlicht anwendungsbezogen verstanden werden oder aber auch gesellschaftlich motiviert: Zum Beispiel: (1) (2)
Ein Ziel der Linguistik ist es, Grundlagen für einen besseren Sprachunterricht zu s c h a f f e n . Ein Ziel der (Sozio-)Linguistik ist es, unterprivilegierten Schichten zu besseren Chancen zu v e r h e l f e n .
Es ist klar, daß die Ziele der ersten Art die sind, die traditionell vom Wissenschaftler erwartet werden. Wenn jedoch nur solche Ziele verfolgt werden, kann der Wissenschaftler leicht zum Spielball politischer Interessen werden. Durch Ziele der zweiten Art wird er dagegen recht oft dem Druck politischer Gruppen ausgesetzt sein. Sie erlauben es ihm aber eher, die politische Relevanz seiner Forschungen einzuschätzen und zu verantworten. Eine letzte Anmerkung zum Erkenntnisinteresse: In der Vergangenheit sind oft Scheinziele formuliert worden; zum Beispiel sei es ein Ziel der Forschung, ein besseren Verständnis der Struktur des Gegenstandsbereichs zu erlangen. Dieser Satz ist aber analytisch, da er auf jegliche Art von Forschung zutrifft. Nun zum Begriff der Beobachungsperspektive. Dieser Begriff hängt mit dem Erkenntnisinteresse insofern zusammen, als letzteres bestimmt, unter welchen Aspekten ein Gegenstandsbereich betrachtet wird. Zusätzlich ist festzustellen, daß die Ergebnisse einer Untersuchung nicht nur vom Bereich sondern auch von der Perspektive der Beobachtung abhängen. Darauf kam man bei der Entwicklung der Quantenphysik (vgl. Heisenberg, "Die physikalischen Prizipien der Quantentheorie", S . 2 . ) . Damit ist die Idee der Objektivität aufgegeben worden zugunsten der Idee der Zweckmäßigkeit. Doch nun zurück zum Ausgangspunkt unserer Überlegungen. Die Grundhypothesen einer Theorie werden demnach formuliert aufgrund des Vorwissens und des Erkenntnisinteresses. Der Gegenstandsbereich soll von der Theorie soweit als möglich korrekt und
11
vollständig beschrieben werden. Dabei bedeutet korrekt, daß keine Hypothesen der Theorie falsifiziert werden durch die Überprüfung am Gegenstandsbereich, und vollständig, daß alle Phänomene des Gegenstandsbereichs von der Theorie beschrieben werden. Eine vollständige und korrekte Theorie heißt adäquat. Die Hypothesen einer Theorie haben nicht alle denselben Status. Da ist zunächst zu unterscheiden zwischen speziellen und allgemeinen (grundlegenden) Hypothesen. Letztere werden in den meisten linguistischen Untersuchungen nicht in Frage gestellt, da es nicht sinnvoll wäre, bei jeder Problemstellung gleich die Grundlagen einer Theorie anzuzweifeln. Das wird vielmehr erst dann der Fall sein, wenn es keinen anderen Ausweg mehr gibt. Hypothesen sind zu bewerten nach dem Grad ihrer Bestätigung. Naturgesetze wie K = m s sind als recht gut bestätigte Hypothesen anzusehen, da Tausende von Experimenten zur Überprüfung durchgeführt worden sind. Jedoch ist es prinzipiell nicht möglich, ein solches Gesetz zu verifizieren, wohl aber zu falsifizieren. Ebenso ist es möglich, die Behauptung zu verifizieren, daß eine bestimmte Grammatik G eine adäquate Grammatik einer Sprache sei, wenn man davon ausgeht, daß dafür unendlich viele Sätze überprüft werden müssen. Daneben ist zu unterscheiden zwischen direkt und indirekt überprüfbaren Hypothesen. Dabei ist klar, daß solche Hypothesen, die in einer theoretischen Sprache (vgl. S . 3 . ) formuliert sind, nur indirekt überprüfbar sein können. So kann man einem Körper nicht ansehen, ob eine Kraft auf ihn wirkt, sondern man kan nur beobachten, ob er beschleunigt wird oder nicht. (Zu den Problemen der Bestätigung und Uberprüfbarkeit vgl. Stegmüller, 1969) . Insoweit sich Sätze aus einer theoretischen Sprache nicht in eine entsprechende Beobachtungssprache übersetzen lassen, treten Probleme der Interpretation solcher Sätze a u f . So fällt es in der Physik schwer anzugeben, was man mit dem Begriff des Elektrons meint, seit sich herausstellte, daß man Elektronen
12
nicht als Objekte interpretieren kann, ohne sich in Widersprüche zu verwickeln. In solchen Fällen spricht man davon, daß eine Theorie nur partiell deutbar sei (vgl. Stegmüller, 1970) . In der Linguistik ist neben der Dichotomie von Beobachtungsund theoretischer Sprache noch die von Objekt- und Metasprache oder untersuchte und Untersuchungsspräche relevant. (Beobdchtungs- und theoretische Sprache sind Formen einer Metasprache) In der linguistischem Untersuchung besteht prinzipiell die Gefahr, daß Objekt- und Metasprache vermengt werden, indem zum Beispiel Strukturen der Metasprache auf die Objektsprache übertragen werden. Eine andere Form der Vermengung liegt vor, wenn bei Zitaten in der Objektsprache Teile der Objektsprache als metasprachlich angesehen werden. Abschließend noch eine Bemerkung zum Verhältnis der Linguistik zu anderen Wissenschaften. Es wäre sicher falsch, die Linguistik als reine Naturwissenschaft, reine Sozialwirtschaft oder reine Formalwissenschaft aufzufassen, denn sie besitzt Eigenschaften all dieser Arten von Wissenschaften. Daneben läßt sich keine klare Grenze der Linguistik angeben zu Nachbarwissenschaften wie Logik, Mathematik, Biologie, Psychologie, Soziologie, etc. Doch sollte sich an dieser Tatsache niemand allzusehr stören, da ja zum Beispiel auch Grenzen zwischen Physik und Chemie oder Chemie und Biologie verschwimmen. 1 . 2 . 2 . Grundriß eines Sprachmodells und seiner Analyse- und Verifikationsmethoden Wie das strukturalistische so basiert auch dieses Sprachmodell auf dem Begriff der Sprechgemeinschaft. Eine Sprechgemeinschaft wird hier verstanden als eine Gruppe miteinander kommunizierender Individuen, deren Kommunikationsmedium die Sprache dieser Sprechgemeinschaft darstellt. Im vorstehenden Satz sind mehrere Schlüsselbegriffe durcheinander "erklärt" worden. Es ist deshalb nötig, das Ganze von einer anderen Seite her nochmals neu zu formulieren. Beschränken wir uns zunächst einmal auf zwei Individuen A und B, und nehmen wir an, daß der A dem B
13
etwas mitteilen möchte, zum Beispiel den Befehl, ihm eine Birne zu holen, worauf er ein Geräusch produziert, das etwa so klingt " B u s c a - m e uma p e r a . " worauf der B ein Geräusch von sich gibt wie "NSo q u e r o ! " und der A sich ärgert; oder B sagt Ich versteh n i c h t , was du w i l l s t . "
und A fängt an zu gestikulieren. Es lassen sich sicher noch einige weitere hundert Varianten von Bloomfields Jack-und JillGeschichte finden. Die Essenz all dieser mehr oder weniger amüsanter Szenen aber wäre, daß Individuen wie A das Bedürfnis haben, anderen Individuen etwas mitzuteilen, und daß diese darauf in irgendeiner Weise reagieren. Der Nachweis, daß die Laute, die A von sich gibt, nicht zufällig sind sondern mit irgendeiner Absicht geäußert werden, läßt sich leicht erbringen; denn selbst, wenn die Kommunikation mißglückt, wird der Angesprochene irgendwie charakteristisch reagieren, und sei es durch demonstratives Ignorieren des Sprechers. Es kann selbst für den striktesten Behavioristen keine Frage sein, daß Kommunikation zwischen Individuen stattfindet; die Fragen, warum sie stattfindet und wann sie erfolgreich ist, sind schon schwieriger zu beantworten. Wie schon festgestellt, unterscheiden sich die Äußerungen verschiedener Individuen, und das Problem ist, zu entscheiden, wann zwei Individuen dennoch dieselbe Sprache sprechen und wann nicht. Behauptung: Zwei Individuen sprechen dieselbe Sprache, wenn sie ohne Schwierigkeiten miteinander kommunizieren. Diese Behauptung ist prinzipell falsch. Man stelle sich dazu folgendes vor. A und B verstehen beide Deutsch und Englisch; A spricht zu B auf Deutsch und B spricht zu A auf Englisch. Diesem Gegenbeispiel ist aber entgegenzuhalten, daß es keinen Normalfall der Kommunikation darstellt und daß deshalb die Behauptung für heuristische Zwecke durchaus brauchbar ist. Damit läßt sich in groben Zügen eine Sprechgemeinschaft vorläufig abgrenzen.
14
Im Anschluß daran können Äußerungen der Mitglieder einer solchen Sprechgemeinschaft untersucht werden auf Gemeinsamkeiten und Unterschiede, und es können erste Versuche gemacht werden, relevante von irrelevanten Unterschieden zu trennen (vgl. phonemische und phonetische Unterschiede). Nachdem auf diese Weise Charakteristiken von Äußerungen festgestellt worden sind, kann die vorherige Behauptung verschärft werden, dadurch daß die gefundenen Charakteristiken miteinbezogen werden. Da inzwischen zumindest einigermaßen klar ist, wie man Sprechgemeinschaften abgrenzen kann (genauere Verfahren werden später angegeben), kann der Begriff der Kommunikation noch etwas näher beleuchtet werden. Bisher haben wir Kommunikation nur durch Aktionen und Reaktionen charakterisiert und verschwiegen, daß Mitteilungen auch Inhalte haben, um es überspitzt auszudrücken: Angesprochene reagieren ja nicht nur auf den mehr oder weniger angenehmen Klang einer Stimme (sonst könnte der Sprecher mit viel weniger Aufwand auskommen). Hier stellt sich dann die Frage: was wird mitgeteilt, und was ist mitteilbar? Bevor man der Versuchung nachgibt und antwortet: Alles, oder alles mögliche, wäre es vielleicht zweckmäßig, den Versuch zu machen, etwas genauer zu klassifizieren. Außerdem könnte die Frage so erweitert werden: Wann, in welcher Situation, ist etwas mitteilbar? Es ist hier bewußt der Begriff der Situation oder auch Sprechsituation mit dem des Inhalts von Äußerungen zusammengebracht worden, denn Gesprächspartner reden über Situationen und wollen mit ihren Äußerungen Situationen verändern; sie wollen "Informationen" erlangen über ihnen unbekannte Situationen u . s . w . Dies läuft im Gespräch auf mehreren Ebenen ab, denn es wird nicht nur mitgeteilt, angeordnet, aufgefordert oder gefragt sondern auch unterstellt, verheimlicht, gelogen, lächerlich gemacht, überredet, vorgeworfen, angebettelt, getröstet, beraten u . s . w . Und all das drückt sich erfahrungsgemäß in der Sprache aus, sei es in Wortwahl, Syntax oder Intonation. Es scheint mir
15
nötig, diese Dinge wenigstens in Ansätzen in Betracht zu ziehen, wenn man Sprache beschreiben will, und ihnen deshalb einen Platz im Sprachmodell zuzuweisen, vor allem wenn man versucht, über Inhalte von Äußerungen zu sprechen. Nach wie vor ist der Situationsbegriff ungeklärt. Er ist in Beziehung zu setzen mit den Begriffen Sachverhalt, Ereignis, Prozeß^ Eandung, Tatsache. Im Tractatus logico-philosophicus versuchte Wittgenstein, die Begriffe Sachverhalt und Tatsache zu erklären und in Beziehung zu bringen mit Sätzen. Ein Satz sollte einen Sachverhalt abbilden. In der Logik gibt es Elementarsätze. Gibt es dementsprechend auch elementare Sachverhalte? Carnap und Wittgenstein versuchten, auf diese Frage eine Antwort zu finden, und zumindest Wittgenstein gab die Suche a u f , indem er erklärte, die Frage sei falsch gestellt. Damit brach das Konzept der sogenannten naiven Abbildtheorie des Traktats zusammen. Es gibt hier aber noch mehr Fragen, die einem erhebliche Kopfschmerzen bereiten können: Wo fängt ein Sachverhalt an und wo hört er auf? Wie lassen sich Sachverhalte gegeneinander abgrenzen? Woraus bestehen Sachverhalte? ("Der Sachverhalt ist kein Komplex von Gegenständen", Wittgenstein, 1 9 6 9 : 5 8 ) . Hier muß ein anderer Ansatz gemacht werden. Man denke sich die Welt als einen Prozeß ohne Anfang und Ende, man denke sich ferner ein Individuum, das einen Ausschnitt dieser Welt erkennt und nach bestimmten Gesichtspunkten segmentiert und ordnet und mit sprachlichen Etiketten versieht. Dabei kann man dann unterscheiden zwischen einer Perspektive der Erkenntnis und einem Fokus des Interesses, zwischen dem, was bereits bekannt ist und vorausgesetzt ("präsupponiert") wird und dem Brennpunkt des Interesses. Die Pointe dieses Modells ist dann, daß Sachverhalte von unserem Individuum nach Bedarf geschaffen und abgegrenzt werden und schließlich in Form von Sätzen mitgeteilt werden. Das eben von dem Individiuum Gesagte läßt sich auf Gruppen und gegebenenfalls auf die ganze Menschheit ausdehnen.
16
Im nächsten Schritt geht es darum zu erfahren, wann Sachverhalte zutreffen, also Tatsachen sind, und wann nicht. Wenn ein Sachverhalt der nach den oben genannten Segmentierungs- und Orientierungskriterien erfaßten Realität entspricht, dann ist er eine Tatsache, und ein Satz, der diesen Sachverhalt beschreibt, ist wahr. Dieser Ansatz riecht etwas nach der Sapir-Whorf-Hypothese, die besagt, daß die Sprache das Denken beeinflusse. Dazu ist aber zu bemerken, daß neben sprachlichen Faktoren doch wohl in erster Linie biologische und kulturelle das Weltbild eines Individuums bestimmen. Daneben sei bemerkt, daß auch die Weltbilder eines Atomphysikers und eines Kleinbauern erheblich voneinander abweichen dürften, auch wenn letztere dieselbe Sprache sprechen. Nach diesem Ansatz ist es nun eine später zu erledigende Definitionsfrage, die Verhältnisse zwischen Situation und Sachverhalt, Prozeß, Ereignis und Handlung zu erklären. Es ist jetzt möglich, den Begriff Sprache zu explizieren als ein kommunikatives System, das von Gruppen von Individuen Sprechgemeinschaften - benützt wird, um Mitteilungen über Situationen zu machen. Im Anschluß hieran ist zu untersuchen, wie Sprachen analysiert werden können. Zunächst ist das bis jetzt skizzierte Modell so zu formulieren, daß einschlägige Hypothesen über Sprachen gewonnen werden können. Das wird in Kapitel 2 geschehen. Danach muß festgelegt werden, nach welchen Verfahren solche Hypothesen zu überprüfen sind. Entsprechend dem in Abschnitt 1 . 2 . 1 . skizzierten Wissenschaftsmodell ist zu erwarten, daß die Analyse einer Sprache mit Hilfe der dort eingeführten Analysezyklen vorsichgeht. Auf diese Weise wird dann sukzessive die Grammatik einer Sprache aufgebaut und zwar unter Einschluß der Bedeutungsund Gebrauchsregeln. Als Analyseverfahren kommen aus dem Strukturalismus bekannte Methoden in Betracht, wie Distributionstests, Substitutions- und Permutationsproben, jedoch oft unter anderen Voraussetzungen als im Strukturalismus. Daneben werden aber auch statistische und kombinatorische Methoden und Paraphrasetests (zum Teil in verallgemeinerter Form) untersucht. Dies wird in den Kapiteln 4 und 5 unternommen werden.
2.
DEFINITION DES SPRACHMODELLS
2.1. Weltmodell, Individuum, Weltbild Das im folgenden zu definierende Modell soll die in diesem Rahmen relevanten Eigenschaften und Funktionen von Welten und Individuen simulieren. Es werden hier keine Behauptungen aufgestellt darüber, was die Welt wirklich sei und dergleichen, sondern es soll lediglich ein Rahmen geschaffen werden, der ausreicht, natürliche Sprachen zu beschreiben. Im folgenden werden einige Begriffe aus der Mathematik vorausgesetzt, und zusätzlich wird der Begriff des Objekts als Undefinierter Begriff verwendet. Gegeben sei ein vierdimensionaler euklidischer Raum R über eine Menge R = ( : = (x3ytztt) & x,y, z, t e R) . Sei U eine Menge von Objekten. Dann sei ferner / eine ein-eindeutige Abbildung von U in die Potenzmenge von R. f
:
U—fR.
Def 2.1-1: Ein Tripel M = ( R 3 U , f ) ist eine Welt. Dabei heißt U Objektsbereich von W. Sei u = { u-. 3Ä 1 e f R ( f ( u ) = R & 3x e R ' ( p r ^ ( x ) = t ) ) } wobei pr.(x) die Zeitkoordinate von ist. Sei f(u) = R' epR. Dann ist f^iu) = R' [ .· pr4(x) = t] D e f . 2.1-2: Das Tripel Z - ß,U ,f \ heißt Zustand der Welt ^
L·
L·
W zur Zeit t. Def 2.1-3: Sei U' eine beliebige Teilmenge von U (U's U). Dann heißt P = (R, U ' 3 f ) ein Prozeß der Welt W. Def 2.1-4: Sei P - ( R 3 U ' } f ) ein Prozeß. Z heißt Anfangssustand von P genau dann, wenn 3t CL Vt(U' ~u 0 & t < t a — - i / 'u, - 0. Z heißt Endzustand von P genau dann, wenn 3t V t f u ' 0 & e e t
t > te^u>t = 0.
Def 2.1-5: Ein Prozeß, der einen Anfangs- und einen Endzustand besitzt, heißt Ereignis.
18 Def
2,1.-6: Eine Funktion v : Z —· Z, wobei Z die
Menge der
Zustände der Welt W ist, heißt Veränderung s funkt ion von W. Entsprechend heißt v ( Z ,Z ,) die Veränderung von t bis t' ~C
"D
der Welt W. Th 2.1.-1: Prozesse sind charakterisierbar als Folgen von Veränderungen oder Folgen von Zuständen. Das möge zur Festlegung des Weltmodells vorerst genügen. Wenden wir uns nun dem Begriff des Individuums zu. Zu dessen Einführung bedarf es einiger Grundbegriffe aus der
Informatik:
Speicher, Inputmedium, Outputmedium, Operation, Befehl, Inhalt; zusätzlich werden Undefiniert verwendet: Wert, Regel, perzipierter Zustand. Sei P eine Menge perzipierter Zustände; P sei Inhalt des Inputmediums I, P - ( I ) . Def. 2.1.-7: Eine Abbildung der Menge Z von Zuständen einer Welt W auf (I) De f.
heißt Perzeption p. p : Z — (I). 2.1.-8: Sei V eine Menge von Werten, dann heißt eine Ab-
bildung b : P —> V eine Bewertung von P. Die Elemente von V heißen bewertete perzipierte Zustände. Explikation: Eine Operation, die den Inhalt von einem Speicher X in einen Speicher
überführt heißt Transfer
von X nach Y.
Input- und Outputmedium sind spezielle Speicher, ebenso ein sogenanntes Operationsregister OR. Alle Operationen mit Ausnahme einiger Transfers finden im OR statt. Die Operationen sind in einem Operationsspeicher OS gespeichert. Bewertungen sind Teile bestimmter Operationen. Was im Operationsspeicher gespeichert ist, entspricht in etwa einem Computerprogramm. Def 2.1.-0: Ein Tripel OE = (OR,OS,V), wobei V eine Menge von Werten ist, heißt Operationseinheit. Def 2.1.-10: Eine Folge bewerteter perzipierter Zustände heißt Erfahrung. Def.
Der Speicher für Erfahrung heißt Gedäohtnis.
2.1.-11: Ein Quadrupel # = ( ,
, , ), wobei G ein Ge-
dächtnis, OE eine Operationseinheit, I ein Inputmedium und 0 ein Outputmedium ist,3heißt Bewußtsein. Def 2.1.-12: Ein Individuum ist ein geordnetes Paar a = (u, B), wobei u ein Objekt und -3 ein Bewußtsein ist.
19
Zur Verdeutlichung der Struktur eines Bewußtseins möge folgendes Schema dienen.
INPUTMEDIUM
OPERATIONSSPEICHER«
WERTE
OPERATIONSREGISTER 4 OUTPUTMEDIUM
GEDÄCHTNIS
Ein Erkenntnisvorgang soll durch folgendes Schema veranschaulicht werden: Zustand Z von W INPUTMEDIUM
perzipierter Zustand z
OPERATIONSREGISTER OPERATIONSSPEICHER
p
erzeption
Z wende Bewertung b an
OPERATIONSREGISTER
(V,z
)
OPERATIONSSPEICHER
speichere (OR) in G an Stelle i
GEDÄCHTNIS
i:
(v,zf
1
)
)
1) Hier könnte als Operation zum Beispiel auch stehen: Lösche (OR), was soviel bedeuten würde wie "Vergiß, was du gesehen hast". Die Darstellung der Operationseinheit ist hier sehr stark vereinfacht. Im folgenden wird aber vielleicht klarer werden, welche Funktionen von der Operationseinheit wahrgenommen werden müssen. Dazu sollen noch einige Begriffe eingeführt werden. Def 2.1.-13: Eine Operation, die eine Menge von Erfahrungen mit einem Befehl verknüpft, entspricht einer Abbildung
heißt Entscheidung. Diese Operation
e: (G) · B wobei B die Menge von Befehlen ist. B ist auch im Gedächtnis gespeichert und Elemente davon können durch die Operationseinheit abberufen werden. Def 2.1.-l4: Eine Abbildung eines in 0 gespeicherten Befehls auf die Menge Z der Zustände der Welt W heißt Handlung (Aktion).
20
Mit diesen beiden Definitionen ist also festgelegt worden, wie es zu Handlungen von Individuen kommt. Def 2.1.-lS: Die Teilmenge Z ' von Z, die von einem Individuum a erkannt wird, heißt Perzeptionsrahmen des Individuums a. Def 2.1.-l6: Die Bewertungsfunktion b eines Individuums a heißt auch Erkennungsperspektive von a. Die Erkennungsperspektive ist verantwortlich dafür wie etwas gesehen wird. Durch die Operationen von OE können auch nichtperzipierte oder hypothetische Zustände und Zustandsfolgen erzeugt werden, die ebenfalls bewertet werden können. Diese hypothetischen Zustände können dann zu einer bestimmten Art von Befehlen und Handlungen - Überprüfungen - führen. Die Art der hypothetischen Zustände bestimmt das in §1.2.1 erwähnte Erkenntnisinteresse, das seinerseits dafür mitverantwortlich ist, was gesehen wird. Im folgenden soll eingegangen werden auf die Art, wie ein Bewußtsein die Welt strukturiert. Dazu sei folgende Explikation vorausgeschickt: Explikation: Invarianten sind Bestandteile verschiedener Zustände, die einander gleich sind. Jetzt lassen sich zwei Prinzipien der Erkenntnis formulieren: Prinzip I: Ein Bewußtsein stellt Invarianten in Folgen perzipierter Zustände fest. Prinzip II: Ein Bewußtsein unterscheidet zeitliche Abfolgen perzipierter Zustände und räumliche Verhältnisse von Invarianten. Ein Bewußtsein ordnet demnach seine Erfahrung nach den Prinzipien I und II. Diese beiden Prinzipien sind verwandt mit dem, was Carnap in "Der logische Aufbau der Welt" als "Ähnlichkeitserinnerung" eingeführt hat. Daraus folgt jedoch nicht, daß hier dieselbe Erkenntnistheorie zugrundliegt wie in Carnaps "Aufbau" Prinzip I ermöglicht das Erkennen von Gemeinsamkeiten und daher Abstraktion und Bildung von Begriffen. Es ist damit auch Grundlage für die Bildung von Zeichen. Def 2.1.-17: Ein Zeichen steht für die Gemeinsamkeit einer Menge perzipierter Zustände, wobei die Gemeinsamkeit die
21
Intension des Zeichens darstellt und die Menge der perzipierten Zustände die Extension. Jedem Zeichen kann eine Menge von (perzipierten) Zuständen zugeordnet werden als Menge von Realisationen des Zeichens, und die Gemeinsamkeit dieser Realisationen heißt die Form des Zeichens. Jetzt bleibt noch zu erklären, wie ein Bewußtsein die Begriffe Objekt, Eigenschaft, Relation, Sachverhalt behandelt. Dazu sei angenommen, daß sich ein Bewußtsein zunächst provisorische Auffassungen von diesen Begriffen schafft. Es werde ferner angenommen, daß ein Individuum gewissen Eigenschaften wie rot, hell, hart, weich, laut, süß, groß, rund, schwer etc. gewissen Teilen perzipierter Zustände zuspricht (aufgrund von Prinzip I; das hat nichts damit zu tun, ob es solche Eigenschaften "wirklich" erkennen k a n n ) . Damit sind dann Objekte Teile perzipierter Zustände, die zum Beispiel gleichzeitig hart, rot, glatt und eckig sind (man denke an einen roten Würfel) . Ähnlich werden auch Relationen zwischen Objekten behandelt. Damit läßt sich der Begriff Assertion einführen, der bedeuten soll, daß einem Objekt Eigenschaften zu- oder abgesprochen werden, oder daß zwischen Objekten Relationen festgestellt werden. Solchen Assertionen entsprechen Teile perzipierter Zustände, die Sachverhalte genannt werden, derart daß jeder perzipierte Zustand als eine Menge gleichzeitig bestehender Sachverhalte aufgefaßt werden kann. Sachverhalte bestehen demnach nicht unabhängig von Individuen, und daher ist es müßig (zumindest in diesem Modell), in der Welt nach elementaren Sachverhalten zu suchen. Es bleibt noch anzumerken, daß hier eine vorsprachliche Begriffsbildung beschrieben wurde. Solche Begriffe stimmen nicht notwendig mit sprachlichen Begriffen überein, und sie sind deshalb auch keineswegs immer mitteilbar. Daß diese Unterscheidung sinnvoll ist, ergibt sich daraus, daß durchaus konkrete und lebhaft wahrgenommene Empfindungen sprachlich nicht erfaßt werden können. Dennoch ist es einem Individuum möglich, Schlüsse daraus zu ziehen.
22
Unter Situation wird jetzt ein Sachverhalt verstanden zusammen mit der Haltung, die ein Individuum diesem Sachverhalt gegenüber einnimmt. Weltbild soll nun bedeuten: Die Rekonstruktion der Welt nach der Erfahrung eines Individuums innerhalb seines Perzeptionsrahmens. Diese Rekonstruktion ist eine Menge von Assertionen, denen eine Menge von bestehenden und nicht bestehenden Sachverhalten entspricht. 2.2. Kommunikation, Sprache, Gesellschaft Nachdem im vorhergehenden Abschnitt festgelegt worden ist, wie sich ein Individuum gegenüber der Welt verhält, soll nun dargestellt werden, wie sich Individuen zueinander verhalten. Schon im vorigen Abschnitt sind Handlungen (Aktionen) definiert worden, und es ist nun klar, daß wenn zum Beispiel ein Individuum irgendeine Handlung vollzieht, diese Handlung von einem Individuum b perzipiert werden kann und b seinerseits dadurch veranlaßt sein kann, eine Handlung (Reaktion) zu vollziehen. Wenn solche Handlungen darin bestehen, Zeichen zu realisieren, dann spricht man von Kommunikation. Def 2.1.-l8: Eine Handlung, die Zeichen realisiert, ist eine Kommunikation. Es fragt sich nun, wie Zeichen eingeführt und erlernt werden können. Die Antwort ist: Aufgrund der Prinzipien I und II des vorigen Abschnitts. Wenn für irgendeine Invariante von Zuständen ein Begriff geschaffen wurde, so kann dieser Begriff mit einem Befehl verknüpft werden, worauf der Befehl dann in eine Handlung umgesetzt wird. Das entspricht der Einführung eines Zeichens. Das Lehren eines Zeichens kann durch eine Steuerung des Verhaltens eines Individuums vorgenommen werden, welche bestimmte Reaktionen auf das Zeichen bevorzugt. Daneben ist die Erklärung mittels anderer Zeichen möglich, zum Beipiel in Form einer ostensiven Definition (vgl. Wittgenstein, The Blue and Brown Books) . Das Lernen eines Zeichens besteht im Feststellen eines Zusammenhanges zwischen dem Zeichen und anderen Invarianten
23
perzipierter Zustände. Def 2.1.-l9: Individuen, die miteinander kommunizieren, heißen Kommunikationspartner. Dabei ist das Individuum, das eine kommunikative Handlung vollzieht, ein Sender, das Individuum, das eine Handlung perzipiert, ein Empfänger·. Eine Menge miteinander kommunizierender Individuen ist eine Kommunikationsgemeinschaft. D e f . 2.1.-20: Die Menge der Zeichen, die in einer Kommunikationsgemeinschaft verwendet werden, heißt Zeicheninventar oder Zeichenrepertoire. Def 2.1.-21: Folgen von Zeichen heißen Zeichenketten. Zwischen Zeichenketten ist eine Verknüpfung, Verkettung (Konkaten tat ion) definiert. Die Menge der Verkettungsregeln heißt Grammatik einer Zeichenmenge. Def 2.1.-22: Ein Paar ZS = (Zeicheninventar, Grammatik) heißt Zeichensystem oder formale Sprache. Jedem Kommunikationspartner läßt sich ein solches Zeichensystem ZS zuordnen. Damit zwischen solchen Partnern erfolgreiche Kommunikation stattfinden kann, müssen ihre Zeicheninventare und ihre Grammatiken einen nicht-leeren Durchschnitt besitzen (Hierfür wird im folgenden gesagt, daß ihre Zeichensysteme einen nicht-leeren Durchschnitt besitzen). Damit läßt sich eine Kommunikationsgemeinschaft bestimmen als eine Menge von Individuen, deren Zeichensysteme einen nicht-leeren Durchschnitt besitzen. Def 2.1.-23: Die Menge von Zeichensystemen, die den Mitgliedern einer Kommunikationsgemeinschaft zugeordnet sind, heißt Kommunikatives System. Def 2.1.-24: Eine natürliche Sprache ist ein kommunikatives System, die zugehörige Kommunikationsgemeinschaft ist eine Sprechgemeinschaft, und ein Mitglied einer Sprechgemeinschaft ist ein Sprecher. Mit Def. 2.1.-24 ist eine Sprachdefinition gegeben worden, die den Begriff der formalen Sprache einschließt, aber deutlich darüber hinausgeht. Außerdem wurde die strukturalistische Sprachdefinition damit sehr stark präzisiert, obwohl einige der
24
vorbereitend eingeführten Begriffe, auf denen Def 2.1.-24 basiert, nur recht grobe Annäherungen der Wirklichkeit darstellen. Am Ende dieses Abschnitts ist es notwendig, noch einige Bemerkungen zum Begriff der Gesellschaft zu machen, die jedoch im Rahmen dieser Arbeit nicht sehr vertieft werden können. Es ist offensichtlich, daß Gesellschaft oder politische Gemeinschaft nicht gleichzusetzen ist mit Spvechgemeinschaft, wenn in speziellen Fällen auch dieselben Gruppen von Menschen, die eine Sprechgemeinschaft bilden, eine politische Gemeinschaft bilden. Es ist hier festzuhalten, daß Gesellschaften durch kulturelle Gemeinsamkeiten konstituiert werden, zu denen Systeme von Werten gehören, und daß Gesellschaften im allgemeinen keine Gebilde sind, in denen jedes Mitglied denselben Status hat, vielmehr existieren in der Regel Schichtungen, die für die Linguistik deshalb interessant sind, weil sie sich in sprachlichen Variationen, auf die im nächsten Abschnitt eingegangen wird, widerspiegeln. Daneben ist auch linguistisch interessant, daß gesellschaftliche Probleme immer dann auftreten, wenn Gesellschafts- und Sprachgrenzen nicht übereinstimmen. Das äußert sich zum Beispiel dadurch, daß in solchen Fällen meist Bestrebungen bestehen, die Grenzen der vorherrschenden Sprechgemeinschaft den Grenzen der Gesellschaft anzugleichen. Ich nehme an, daß es möglich ist, solche Phänomene im Rahmen des oben entwickelten Modells durch entsprechende Ausarbeitungen der Details zu beschreiben, möchte aber darauf verzichten, das im einzelnen hier darzulegen. 2.3. Sprachliche Variation Eine Sprechgemeinschaft (SG) haben wir in §2.1.2. mit Hilfe von Individuen definiert. Es ist aber zweckmäßig, zwischen Sprechgemeinschaft und Indivuduum noch eine weitere Einheit anzunehmen, die wir intensiv intevagievende Gruppe (IIG) nennen werden. Darunter ist intuitiv so etwas zu verstehen wie eine Familie, eine Gruppe von Freunden, Bekannten oder Arbeitskollegen, jedenfalls aber eine Gruppe von Individuen, die für eine gewisse
25 Zeit intensiven sprachlichen Kontakt haben. Nach dieser Charakterisierung versteht es sich fast von selbst, daß jeden Individuum verschiedenen IIGs angehören kann, Wegen des Beiwortes •intensiv ist es nicht ganz einfach, den Begriff der IIG zu definieren, vorausgesetzt, man will mehr feststellen als "Eine IIG ist eine Teilmenge einer SG". Deshalb wollen wir es bei dieser intuitiven Charakterisierung der intensiv interagierenden Gruppen belassen. Da nach unseren Definitionen von §2.1.2 jedes Individuum über ein eigenes Zeichensystem verfügt, das wir im Fall der natürlichen Sprache seinen Idiolekt nennen wollen, wird es bei der Kommunikation zwischen Individuen immer wieder vorkommen , daß 1. Zeichen von einem Individuum anders verwendet werden als ein anderes Individuum b sie versteht, und 2. Zeichen von verwendet werden, die b nicht versteht. Beides veranlaßt a im allgemeinen, b solche Zeichen zu erklären, wie er sie versteht. Das hat aber zur Folge, daß der gemeinsame Durchschnitt der Zeichensysteme von und b größer wird. Ein solcher Vorgang soll im folgenden Konvergenz heißen. Es wird hieraus klar, daß je mehr und b miteinander kommunizieren desto größer die Übereinstimmung zwischen ihren Zeichensystemen wird. (Ähnliches gilt übrigens auch für die Art, wie und b ihre Zeichen verknüpfen und wie sie sie realisieren) Dagegen betrachtete man drei Individuen a, b, a. 1. Es lerne von b ein Zeichen, über das o nicht verfügt. Damit wird die Komplementärmenge des Durchschnitts der Zeichensysteme von a und c größer, also ihre Nichtübereinstimmung. 2. a vergesse ein Zeichen aus dem Durchschnitt der Zeichensysteme von und c. Damit wird die Übereinstimmung dieser beiden Zeichensysteme kleiner. Beide Vorgänge sollen im folgenden Divergenz genannt werden. Nun wird die (recht plausible) Annahme gemacht, daß sowohl Konvergenz als auch Divergenz von der Häufigkeit der Kommunikation abhängt. Neben den eben genannten gibt es noch etwas subtilere Erscheinungen, die die Interaktionen von Kommunikationspartnern
26 kennzeichnen, denn es werden nicht nur deren Zeichensysteme beeinflußt, sondern auch die Häufigkeiten, mit denen Zeichen und Zeichenketten verwendet werden. Intuitiv liegt das daran, daß in bestimmten IIGs bestimmte "Themenbereiche" häufiger diskutiert werden, "zur Sprache kommen", als andere; und daran, daß "Codes" entwickelt werden, oder auch an "ästhetischen" Präferenzen. Das soll hier jedoch nicht weiter vertieft werden. Ausgehend vom Begriff der intensiv interagierenden Gruppe soll nun ein Vorschlag zur Beschreibung des Phänomens der Sprachentwicklung gemacht werden, der meiner Ansicht nach aufschlußreicher ist als die meisten der bisher gemachten Vorschläge. Durch Kommunikation zwischen Individuen sind deren Idiolekte ständigen Veränderungen unterworfen, die wir Schwankungen nennen wollen. Solche Schwankungen mögen sich in IIGs fortpflanzen, jedoch soll dabei gelten, daß die Gemeinsamkeiten zwischen den Idiolekten der Mitglieder einer IIG in geringerem Maße schwanken als die einzelnen Idiolekte selbst. (Dies ist ebenfalls eine plausible Annahme). Da Individuen im allgemeinen mehreren IIGs gleichzeitig angehören, werden sich zwischen allen IIGs Gemeinsamkeiten ausbilden, die ebenfalls Schwankungen unterworfen sind, die jedoch wiederum geringer sind als die Schwankungen in den einzelnen IIGs. Daraus erklärt sich einerseits die relative Stabilität dessen, was man nach de Saussure ein Sprachsystem nennt, im Vergleich zu einem Indiolekt; andererseits folgt aber, daß sich eben dieses Sprachsystem mit der Zeit ändert. Und zwar treten dabei Phänomene auf wie das "Aus-der-Modekommen" von Zeichen und der dazu komplementäre Vorgang, die beide auf Schwankungen in der Häufigkeit des Gebrauchs zurückzuführen sind. Ähnliches gilt aber auch für die Realisation (Aussprache) von Zeichen oder für Verkettungsregeln. Alle solche Vorgänge gehen nach diesem Modell nicht auf einen Konsensus einer gesamten Sprechgemeinschaft zurück sondern auf die allmähliche Verbreitung von Eigenarten von Individuen und kleinen Gruppen. Warum sich dabei bestimmte Phänomene durchsetzen und andere nicht, hängt mit davon ab,
27
welchen sozialen Status bestimmte Individuen oder HGs besitzen. (Wenn ein Volk ein anderes unterjocht, so setzt sich im allgemeinen eher die Sprache der Herrschenden durch; und ähnliches gilt auch sonst in sozialen Schichtungen). Diesem Erklärungsversuch könnte entgegengehalten werden, daß Lautgesetze wie /p/ »· /f/ solch große Verbreitung erfahren und in völlig verschiedenen Sprachen gelten. Dem ist zu erwidern, daß 1. dieser Einwand der gegebenen Erklärung nicht widerspricht, daß aber andererseits die Erklärung nicht ganz ausreicht, da Gesichtspunkte der Regularisierung bis jetzt außer acht gelassen worden sind; 2. solche Gesetze leider nicht allgemeingültig sind, nicht einmal für eine Sprache. Dieses Phänomen aber spricht für die gegebene Erklärung, vor allem da diese verständlich macht, warum solche Phänomene oft regional begrenzt sind (die Grenzen liegen naturgemäß dort, wo wenig Kommunikation stattfindet). Daher also zum Beispiel /peat/ vs / f e a t / vs /pfert/ für 'Pferd' in verschiedenen deutschen Dialekten; und /apl/ v s / a p f j /
für
'Apfel1
wobei / a f l / meines Wissens ebenso wenig existiert wie /apfa/ für ' A f f e ' . Eben wurde schon der Begriff "Dialekt" verwendet, der jetzt ebenfalls mit Hilfe der intensiv interagierenden Gruppe erklärt werden soll. Es ist nahezu trivial, daß räumlich entfernte IIGs wenige Individuen gemeinsam haben, und daher mehr oder weniger stark divergieren. Die daraus resultierende Verschiedenheit soll im folgenden geographischen Variation heißen. Es werden angenommen, daß es möglich sei, die sprachlichen Gemeinsamkeiten zwischen verschiedenen IIGs nach bestimmten Gesichtspunkten zu klassifizieren. Von solchen IIGs, die besonders viele charakteristische Merkmale gemeinsam haben, soll dann gesagt werden, daß sie denselben Dialekt besitzen. Diese Bestimmung ist noch als vorläufig anzusehen, da hier noch genauere sprachliche Begriffe fehlen, die benötigt werden, um die Erklärung
28 zu präzisieren. Neben der geographischen Variation ist in den meisten Gesellschaften eine soziale Variation zu berücksichtigen, die dadurch entsteht, daß Angehörige verschiedener sozialer Schichten 1. weniger miteinander kommunizieren als Angehörige derselben Schicht; 2. bestimmte sprachliche Einflüsse anderer Schichten bewußt zu verhindern suchen. Wegen des zweiten Punktes ergibt es sich, daß Individuen, die JIGs verschiedener sozialer Schichten angehören, ihren Idiolekt entsprechend variieren, d.h. es ergeben sich rollenabhängige Varianten ihrer Idiolekte. Nach den vorausgegangenen Überlegungen läßt sich eine Sprechgemeinschaft nun mit Hilfe eines historischen, eines geographischen und eines sozialen Parameters beschreiben. Das läßt sich durch folgendes Schema veranschaulichen, das allerdings aus Darstellungsgründen auf den historischen Parameter verzichtet, (g steht für geographischer Parameter, s sozialer Parameter, d , d 2 , ... Dialekte, s.. , s „ , ... Soziolekte) .
29 2 . 4 . Äußerungen Ausgehend von den Defs 2.1.-l8 und 2.1.-24 kann der Begriff der Äußerung definiert werden: Def 2.2.-1: Eine Äußerung ist eine Kommunikation eines Sprechers in einer natürlichen Sprache, und damit auch ein Bestandteil einer Folge von Zuständen. Prinzip I von §2.1.2 läßt sich so modifizieren: Prinzip I': Ein Bewußtsein stellt Invarianten in perzipierten Äußerungen und Folgen von Äußerungen fest. Prinzip I' bildet einerseits die Voraussetzung für das Verstehen von Äußerungen für Individuen einer Sprechgemeinschaft, andererseits ist es aber auch Grundlage der Sprachanalyse des Linguisten, sofern man bereit ist, den Linguisten als ein Individuum nach Def 2.1.-12 aufzufassen. Nach Prinzip I' lassen sich also Äußerungen segmentieren. Dabei sollen auch Segmente als Einheiten zugelassen werden, die selbst nicht wieder Zeichen bzw. Äußerung sein können. Unabhängig davon, was für Einheiten gewählt werden, lassen sich Äußerungen als Ketten solcher Einheiten darstellen. Das führt zu. folgenden Def 2.2.-2: Mittels Prinzip I 1 erzeugte Segmente sind sprachliche Einheiten. Jetzt soll ein Prinzip formuliert werden, das eine Aussage über Ketten sprachlicher Einheiten macht: Prinzip III: Die Verkettung sprachlicher Einheiten erfolgt nach Regeln. Wenn Prinzip III nicht aufgestellt wird, dann ist eine Segmentierung von Äußerungen zwecklos, da sie keinen Aufschluß über deren Struktur gibt. Im Falle natürlicher Sprachen wäre es aber unplausibel, so etwas anzunehmen, da dann nicht erklärt werden könnte - wie Chomsky bemerkte -, warum jemand eine nie zuvor gehörte Äußerung verstehen kann. Außerdem ist es aber wichtig festzuhalten, daß Prinzip III verschiedene Segmentierungen und entsprechend verschiedene Regeln zuläßt. Ferner ergibt sich, daß Segmentierungen abhängig von den Individuen einer fraglichen Sprechgemeinschaft
30
sind, und es ist daher für den Linguisten unrealistisch, vernünftige Segmentierungen unabhängig von ihnen zu erwarten. Inzwischen ist es an der Zeit, sich Gedanken über den Inhalt von Äußerungen zu machen. Wegen Def 2.1.-l8 sind Äußerungen Realisationen von Zeichen, und wegen Def 2.1.-l7 haben Zeichen Extensionen, welch letztere für Mengen perzipierter Zustände bzw. deren Gemeinsamkeiten stehen. Mit den Prinzipien I und II werden perzipierte Zustände in Sachverhalte aufgeteilt. Mengen von Sachverhalten können neu geordnet werden, wodurch hypothetische Zustände entstehen. Perzipierten wie auch hypothetischen Zuständen können Assertionen zugeordnet werden. Wenn solche Assertionen sprachlich sind, sollen sie Präpositionen heißen. Propositionen können auf Äußerungen abgebildet werden. Diese Überlegungen sollen im folgenden formal dargestellt werden. Def 2.2.-3: Saohverhalte sind mittels Prinzipien I und II erzeugte Segmente perzipierter Zustände. D e f . 2.2.-4: Objekte, Eigenschaften und Relationen sind Gemeinsamkeiten von Mengen und Sachverhalten. D e f . 2.2.-5: Propositionen sind Zeichen, deren Intensionen Sachverhalte und deren Extensionen perzipierte Zustände oder Folgen perzipierter Zustände sind. Äußerungen sind Realisationen von Propositionen oder Folgen von Propositionen. Nun kann von der Haltung eines Individuums gegenüber Propositionen und Sachverhalten gesprochen werden. Ein Individuum kann wissen, glauben, bezweifeln, wünschen, verlangen, behaupten, unterstellen, daß ein Sachverhalt bestehe oder eii._ Proposition wahr sei; er kann ferner fragen ob ein Sachverhalt bestehe. Und solche Haltungen finden ebenfalls in seinen Äußerungen ihren Ausdruck. Um den Begriff der Haltung in den formalen Rahmen aufnehmen zu können, formulieren wir Def 2.2.-6: Eine Haltung ist eine Bewertung eines Sachverhalts oder einer Propostition. So wird zum Beispiel im geläufigen Fall der Behauptung
31
einem Sachverhalt der Wert "besteht 1 oder einer Proposition der Wert 'wahr' zugeordnet, im Fall einer Vermutung werden Propositionen Werte zugeordnet wie 'vielleicht w a h r ' , "vermutlich w a h r ' , 'wahrscheinlich w a h r 1 , etc. Jetzt ist es möglich, den Begriff der Situation auch in den formalen Rahmen aufzunehmen: Def 2.2.-7: Eine Situation ist ein Tripel 5 - (s,h (s)3a) wobei s ein Sachverhalt, h ( s ) die Haltung eines Individuums a gegenüber s ist. Die Haltung, die ein Individuum einer Äußerung gegenüber einnimmt, kennzeichnet eine Sprechsituation, die Situation, die Gegenstand einer Äußerung ist, ist die besprochene Situation. Ausgehend von den hier definierten Begriffen lassen sich verschiedene Einheiten der Segmentierung von Äußerungen postulieren wie Satz, Wort, Morphem, Phonem etc. sowie die zugehörigen Verkettungsregeln, die Grammatiken bilden.
3.
SPRACHBESCHREIBUNG UND GRAMMATIKTYPEN
3.1. Erkennungsverfahren (Discovery Procedure) Dieser Abschnitt stellt eine Auseinandersetzung mit Ideen dar, die Chomsky in seinen Büchern "Syntactic Structures", § 6 und "Aspects of the Theory of Syntax", §§4 - 7 entwickelt hat. Allerdings kommt es hier mehr auf eine brauchbare Darstellung der Probleme als auf eine polemische Auseinandersetzung an. Der strukturalistische Traum von einem Algorithmus, der aus einem Corpus von Äußerungen eine Grammatik erzeugt, hat sich als unerfüllbar herausgestellt. Einen solchen Algorithmus nannte Chomsky eine discovery procedure und verwarf es sodann als unvernünftig, so etwas von einer Sprachtheorie zu erwarten. Zu einem ähnlichen Ergebnis waren wir in unserem Sprachmodell in § 2 . 2 . 2 gekommen. In "Syntactic Structures", p.51 führt Chomsky zusätzlich die Begriffe "decision procedure" und "evaluation procedure" ein. Dabei soll eine decision procedure ein Verfahren sein, das relativ zu einem Corpus entscheidet, ob eine gegebene Grammatik die beste Grammatik für eine gegebene Sprache sei oder nicht ; und eine evaluation procedure soll relativ zu einem Corpus
1) "A w e a k e r r e q u i r e m e n t w o u l d be that the t h e o r y m u s t p r o v i d e a p r a c t i c a l a n d mechanical method for determining whether or not a g r a m m a r p r o p o s e d for a g i v e n corpus is, in f a c t , the best g r a m m a r o f t h e l a n g u a g e f o r m w h i c h t h e c o r p u s i s d r a w n . Such a t h e o r y . . . . m i g h t be said to p r o v i d e a decision procedure for grammars.
33
entscheiden, welche von zwei gegebenen Grammatiken für eine Sprache besser sei . Entgegen Chomskys Meinung bin ich der Auffassung, daß wenn eine evaluation procedure im Chomskyschen Sinne vorliegt, daß dann auch eine decision procedure vorliegt, zumindest dann, wenn nur endlich viele Grammatiken für eine Sprache zu testen sind. Der Grund für meine Auffassung ist folgender: Gegeben zwei Grammatiken G , G ; angenommen, G ist besser als G-, dann ist G die beste der beiden Grammatiken. Analoges gilt für jede endliche Menge von Grammatiken. Des weiteren bin ich der Auffassung, daß die beiden ersten Begriffe -"discovery procedure" und "decision procedure" bei Chomsky ungeschickt definiert sind. Es ist offensichtlich, daß mehr Information zur K o n s t r u k t i o n einer Grammatik nötig ist als nur eine Menge von zufällig gesammelten Äußerungen. Zu dieser zusätzlichen Information gehört es zu wissen, welche Teile von Äußerungen von einer Sprechgemeinschaft als gleich bzw. verschieden angesehen werden und wo Äußerungen segmentiert werden können. Dazu kommen je nach Analyseziel noch weitere Informationen. Wenn man nun ein Erkennungsverfahren als einen Algorithmus definiert, der ausgehend von einem Corpus und den genannten Informationen im Rahmen des in Kapitel 2 entwickelten Sprachmodells eine Grammatik konstruiert, dann erscheint die Frage nach der Existenz eines solchen Algorithmus nicht mehr so absurd wie nach der Chomskyschen Definition. Die Beantwortung dieser Frage ist keineswegs so einfach wie die der Chomskyschen, und deshalb wird ein wesentliches Resultat dieser Arbeit sein, darüber Aufschluß zu geben.
1) "An even w e a k e r r e q u i r e m e n t w o u l d be t h a t g i v e n a c o r p u s and given two p r o p o s e n d g r a m m a r s G and G , the t h e o r y m u s t t e l l us which is the better grammar of the language from which the c o r p u s is d r a w n . In t h i s c a s e we m i g h t say t h a t the t h e o r y p r o v i d e s an evaluation procedure for g r a m m a r s . "
34
Nun zum Begriff des Entscheidungsverfahrens. Streichen wir in Chomskys Definition das Wort "beste". Was bedeutet es dann, ein Verfahren zu haben, das relativ zu einem .Corpus entscheidet, ob eine Grammatik eine Grammatik für eine gegebene Sprache ist? Das ist offenbar eine Frage nach Adäquatheitsbedingungen für Grammatiken. Auch hierüber hat sich Chomsky Gedanken gemacht ("Aspects1; §4) . Unglücklicherweise sind seine Begriffe descriptive adequacy und explanatory adequacy nur im Rahmen seiner Theorie anwendbar, denn er schreibt zum Beispiel auf Seite 24: " ( a g r a m m a r ) is d e s c r i p t i v e l y adequate to the extent that it c o r r e c t l y describes the i n t r i n s i c competence of the idealized native speaker."
Da wir hier von etwas anderen Voraussetzungen ausgehen, sind wir gezwungen, ein neues Adäquatheitskriterium zu formulieren. Dazu stützen wir uns auf den in §1.2.1 eingeführten Adäquatheitsbegriff für Theorien. Zusätzlich ist es aber nötig, sich darüber klar zu sein, worüber die Regeln einer Grammatik operieren. Nach § 2 . 2 . 2 sind das Ketten sprachlicher Einheiten, die aus der Analyse von Äußerungen gewonnen werden. Solche Ketten sind nicht wie Äußerungen als Realisationen von Zeichen anzusehen, sondern als Zeichenketten oder als Ketten von Konstiuenten von Zeichen. über solchen Einheiten und Ketten operieren also die Regeln einer Grammatik. Nun wird jede Grammatik zwar ausgehend von gemachten Äußerungen konstruiert, sie soll aber möglichst festlegen, welche Äußerungen in einer Sprache gemacht werden können, oder wie bisher nicht gemachte Äußerungen segmentiert werden können. Nicht gemachte Äußerungen wollen wir hier kurz zukünftige Äußerungen nennen. (Wir wollen hier von sprachlichen Veränderungen, die zukünftige Äußerungen beeinflussen, zunächst einmal absehen). Jetzt läßt sich ein Adäquatheitskriterium für Grammatiken formulieren: Eine Grammatik heißt adäquat wenn sie 1. alle Äußerungen eines Corpus einer Sprache beschreibt; 2. alle zukünftigen Äußerungen einer Sprache beschreibt; 3. keine Äußerungen beschreibt, die der Sprache nicht angehören.
35
Wenn eine Grammatik Bedingung l erfüllt, soll sie vorläufig adäquat heißen. Der Begriff der vorläufigen Adäquatheit wurde eingeführt, weil über den Begriff der Adäquatheit nicht entschieden werden kann. Da jedes Corpus endlich ist, ist der Begriff der vorläufigen Adäquatheit einer Grammatik selbstverständlich entscheidbar. Letzten Endes hängt der Wert einer Grammatik demach vom Corpus ab, über dem sie formuliert wurde; wenn das bei der Analyse verwendete Corpus repräsentativ für eine zu beschreibende Sprache ist, dann wird auch eine brauchbare Grammatik zu konstruieren sein (vorausgesetzt, die zusätzlichen Informationen von vorhin sind vorhanden). Diese Konsequenz aus dem hier vorgeschlagenen Adäquatheitskriterium scheint trival, sie ist aber wesentlich, weil sie zeigt, daß sich das Kriterium in Übereinstimmung mit der wissenschaftlichen Intuition befindet. Da vorhin schon Chomskys explanatory adequacy erwähnt wurde, sei auch dazu noch eine Bemerkung angefügt. Dieser Begriff ist ebenfalls nur anwendbar, wenn man Chomskys theoretischen Rahmen akzeptiert, vor allem seine Innate Ideas Hypothese. Der Begriff ließe sich etwa so verallgemeinern, daß man eine Theorie explanatorily adequate nennt, wenn sie die Phänomene ihres Gegenstandsbereichs innerhalb einer allgemeineren Theorie zu erklären vermag, derart daß sie angibt, warum diese Phänomene auftreten. Die allgemeinere Theorie wäre dann wohl eine Theorie des menschlichen oder tierischen Verhaltens. Bei Chomsky soll eine linguistische Theorie angeben können, warum ein Kind seine Muttersprache erlernt. Ich würde bestreiten, daß sie das muß - ohne zu bestreiten, daß das eine interessante Frage ist. Wie dem auch sei, das "Warum" ist mehrdeutig, und bevor man sich nicht darüber einigt ob man es logisch oder kausal oder sonstwie verstehen will, bleibt es auch dunkel, was man mit explanatory adequacy meint. Vor allem am Anfang wurde bei Chomsky noch der Gedanke der Einfachheit von Theorien verfolgt. Dieser Gedanke geistert seit langem durch die Wissenschaftstheorie und ist meiner Ansicht nach oft überbewertet worden.
36
Natürlich soll eine Grammatik oder eine Theorie so einfach wie möglich sein, vorausgesetzt sie ist adäquat! Doch wann ist eine Theorie oder Grammatik einfach? Die Versuche, das allgemein festzulegen, sind einschließlich des Chomskysehen bisher alle gescheitert. Es gibt allerdings die Bedingung, daß eine Theorie keine unnötigen Annahmen enthalten soll. Diese Bedingung scheint praktikabel, aber im allgemeinen wird unter dem Begriff der Einfachheit noch mehr subsumiert: Zum Beispiel soll eine Theorie möglichst einfach zu verstehen sein - doch, was mir einleuchtet, mag für Herrn N . N . ein böhmisches Dorf sein, und umgekehrt. Daneben spielen noch Fragen der Eleganz bei diesem Begriff eine Rolle, die mir allerdings bei gegenwärtigem Stand der linguistischen Theorienbildung völlig gleichgültig sind. Abschließend noch etwas zum Begriff der Heuristik. Im Strukturalismus versuchte man, ein formales Verfahren zu entwickeln, das mit möglichst wenigen Voraussetzungen die Grammatik einer Sprache liefern sollte. Das heuristische Geschick und die Intuition des Linguisten sollten dadurch überflüssig gemacht werden. Wie schon mehrfach bemerkt, waren die Voraussetzungen aber zu gering, so daß der Linguist letztlich doch auf seine Intuition angewiesen war, wenn er zu vernünftigen Grammatiken kommen wollte. In der Chomskyschen Schule war heuristisch o f f i z i e l l alles erlaubt, vorausgesetzt die Grammatik "stimmte" hinterher. Der hier eingeschlagene Weg orientiert sich in dieser Hinsicht mehr am Strukturalismus, obwohl auch Chomskys Weg pragmatisch zu rechtfertigen ist. Es besteht dort aber die Gefahr, daß unnötige Voraussetzungen gemacht werden, die später möglicherweise lästige Konsequenzen haben. Hier wird vielmehr versucht, das heuristische Vorgehen des Linguisten nicht als bloßen "short-cut" anzusehen, sondern es zu analysieren und diese sogenannten short-cuts, falls mit den übrigen Annahmen in Einklang, zu formalisieren. Dies ist zunächst zwar unbequemer, auf die Dauer aber sicher erfolgreicher als die übermäßige Rigidität auf der einen Seite und die übermäßige Freiheit, die leicht in methodische Unsicherheit ausartet, auf der anderen.
37
3.2. Generative Grammatik und Erkennungsgrammatik Die Abschnitte 3.1 und 3.2 sind hier in einem gemeinsamen Kapitel zusammengefaßt worden/ weil in der Vergangenheit vielfach der Unterschied zwischen einem Erkennungsverfahren (discovery procedure) und einer Erkennungsgrammatik (recognition grammar) nicht erkannt worden ist. Im Gegensatz zu Erkennungsverfahren dienen Grammatiken dazu, die Ergebnisse sprachlicher Analysen darzustellen, nicht sie zu erreichen. Im vorigen Abschnitt ist der Begriff der Grammatik recht selbstverständlich verwendet worden, ohne daß darüber mehr bekannt war, als daß er für eine Menge von Regeln steht. Das war dort auch nicht erforderlich; jetzt soll jedoch der Begriff der Grammatik näher untersucht werden. Es wird dabei in erster Linie um eine Weiterentwicklung der Grammatiken gehen, die über Bar-Hillel und Chomsky auf Entwicklungen Carnaps für die Logik zurückgehen (vgl. Carnap, "On the Character of Philosophical Problems" und "The Logical Syntax of Language") . 3.2.1. Generative Grammatiken Ausgangspunkt für die Definition einer generativen Grammatik ist der Begriff des Produktionssystems oder Semi-Thue-Systems . Def 3.2.-1: Ein Produktionssystem ist ein Paar P = (VtR). Dabei ist V ein Vokabular (Zeicheninventar) und R eine endliche Menge von Produktionsregeln. Jede Produktionsregel ist ein Paar (u, v) mit u, v e V. (V* steht für die freie Halbgruppe über V3 d . h . alle endlichen Ketten, die aus den Elementen des Vokabulars gebildet werden können). (Vgl. Maurer, 1969. S. 2 3 ) . Jetzt ist zu definieren, was unter einer Ableitung zu verstehen ist. Def S. 2. -2: Sei P - (V, R) k, 1 € V*1 sagt man, k führt Ketten k f k e V* gibt, so gilt. Man sagt k führt zu k ri £ V* gibt, so daß Die Folge k , . . . }k heißt
ein Produktionssystem. Für Ketten unmittelbar zu l, k —» l, wenn es daß k = k-uk l = k vk und ( u f v ) e R l, k -^ l , wenn es Ketten k ,k ^,kc.,k^) 0 l k = k O —* k J. —·>. . . —>· k f l = l gilt. eine Ableitung der Länge n. (vgl
Maurer, 1969, S. 23) · Davon ausgehend läßt sich der auf Chomsky zurückgehende
38 Begriff der Typ-O-Graitunatik definieren, der gleichzeitig der allgemeinsten Form einer generativen Grammatik entspricht. Def 3.2.-S: Eine Typ-0-Grammatik ist ein Quadrupel G - (V 3V ,R,S) Dabei sind 7 ffJ V Vokabulare mit V V = 0; die Elemente von 7 heißen Variable, die Elemente von 7 Basisseiahen. V U v = V ist das Gesamtvokabular. Eine Kette aus V„ heißt eine terminate Kette. R ist eine endliche Menge von Regeln, S ist eine ausgezeichnete Variable, die Startvariable. L ( G ) ist die Menge der ausgehend von S ableitbaren terminalen Ketten und heißt die von G erzeugte formale Sprache. Durch Restriktionen auf der Menge von Regeln lassen sich weitere Typen von generativen Grammatiken definieren. Regeln wie die hierfür definierten nennt Chomsky Phrasenstrukturregeln (PS-Regeln), weshalb eine Grammatik der obigen Art auch Phrasenstrukturgrammatik (PSG) genannt wird. Da es in der Logik bei Carnap neben Formationsregeln auch Transformationsregeln (Deduktionsregeln) gibt, lag es nahe, so etwas auch für generative Grammatiken zu definieren. Formal unterscheiden sich Transformationsregeln nicht von den Formationsregeln, jedoch besitzen generative Grammatiken, die über Transformationsregeln verfügen, einen etwas anderen Aufbau. Def Z.2-4: Eine generative Transformationsgrammatik ist ein Paar TG - ( G 3 P ) mit G = (VN>VT,R,S) und P = ( L ( G ) , T ) . Dabei haben alle Symbole dieselbe Bedeutung wie in Def 3.2.-3 und T ist eine Menge von Transformationsregeln. Hier sind noch weitere Einschränkungen möglich, zum Beispiel durch Ordnen der Regeln in T und durch Einführung sogenannter syntaktischer Merkmale. Darauf soll hier jedoch nicht eingegangen werden. Eine kurze Bemerkung zur Grammatikalität: Ketten aus V heißen wohlgeformt in Bezug auf eine Grammatik G, genau dann, wenn sie ableitbar sind in G. Wenn eine Grammatik adäquat ist, so sind alle wohlgeformten Ketten grammatisch, d . h . diesen Ketten entsprechen Äußerungen eines Corpus oder zukünftige Äußerungen. Bei Chomsky ist der Begriff der Grammatikalität an den der Kompetenz geknüpft. Dabei wäre die Kompetenz in etwa die Grammatik
39
eines Sprechers einer Sprechgemeinschaft. Diese Grammatik ist dem Beobachter jedoch nicht direkt zugänglich, wenn er auch versuchen mag, sie zu simulieren. Grammatische Ketten sind also nach Chomsky wohlgeformte Ketten solch einer Sprechergrammatik (vgl. "Syntactic Structures, S . 1 4 f , "Aspects", S.3, S.11). Grammatikalität ist demnach ein per definitionem nicht-verifizierbarer Begriff, d.h. es ist kein Kriterium angebbar, nach welchem festzustellen wäre, ob eine Äußerung oder eine von einer Grammatik erzeugte Kette grammatisch ist. Um dies zu verdeutlichen, sei Chomskys Begriff Akzeptabilität erwähnt und an einem Beispiel veranschaulicht: (1) (2)
Die, d i e die, d i e die, die d i e Ä p f e l k l a u e n , a n z e i g e n , verhauen, werden belohnt. Die, die die verhauen, die die a n z e i g e n , die die Äpfel k l a u e n , werden b e l o h n t .
Nach Chomskys Ansicht wären beide Sätze grammatisch, jedoch nur (2) halbwegs akzeptabel. Da nach Chomskys Meinung ein Satz wie (1) auf Ablehnung stößt, ist es nicht möglich, von der Ablehnung eines Informanten generell darauf zu schließen, daß ein Satz ungrammatisch sei. Ferner bemerkt Chomsky in "Aspects", S.11, "Note that it w o u l d be q u i t e i m p o s s i b l e to characterize the unacceptable sentences in g r a m m a t i c a l t e r m s . For e x a m p l e , we cannot f o r m u l a t e p a r t i c u l a r rules of the g r a m m a r in such a way as to e x c l u d e t h e m . "
Damit wird es aber prinzipiell unmöglich, Chomskys Begriff der Grammatikalität sinnvoll anzuwenden. Ich halte diesen Begriff deshalb für unzweckmäßig definiert und schlage vor, ihn allenfalls in dem oben definierten Sinne zu verwenden, nämlich für wohlgeformte Ketten einer adäquaten Grammatik. Doch nun zurück zum Begriff der generativen Grammatik. Die generativen Grammatiken, die oben angegeben wurden halte ich einer angemessenen Beschreibung der in unserem Sprachmodell möglichen Phänomene nicht für angepaßt. Dafür gibt es eine Reihe von Gründen: 1. Die kommunikative Funktion einer natürlichen Sprache bleibt unberücksichtigt. 2. Sprachliche Veränderungen werden nicht berücksichtigt. 3. "Semantische" und "pragmatische" Phänomene werden als
40
quasi-syntaktische Phänomene dargestellt - das führt zu seltsamen Transformationsregeln, ("semantisch" und "pragmatisch" sind noch nicht explizit definiert worden; s. dazu § 4 . 2 ) . Zu Punkt 3 einige Beispiele zur Veranschaulichung einiger Phänomene: (3) Die S c h a c h t e l auf dem T i s c h ist an e i n e r (4) (5) (6) (7) (8)
Ecke rot. Eine Ecke der Schachtel auf dem Tisch rot. R a i n e r b e r ü h r t Susi a m A r m . R a i n e r b e r ü h r t Susi a m A u t o . Rainer b e r ü h r t Susis A r m . Rainer b e r ü h r t Susis Auto.
ist
Die Sätze (3) und (4) sowie die Sätze (5) und (7) sind Paraphrasen, jedoch nicht die Sätze (6) und ( 8 ) . Angenommen, man konstruiert eine TG für diese Sätze, die Paraphrasen aus gleichen Tiefenkonstrukturen ableitet, dann wird die semantische Relation "Paraphrase" als eine quasi-syntaktische Relation abgebildet, die außerdem bei den Sätzen (3) und (4) eine recht seltsame Gestalt haben muß. Das wird klar, sobald man sich die entsprechenden Strukturbäume ansieht.
(31)
Det
die rot
dem Tisch einer Ecke Es fällt a u f , daß aus der Baumstruktur kein Zusammenhang zwischen 'Schachtel' und 'Ecke' zu erkennen ist. Das ist anders in ( 4 ' ) :
41
Det
eine
Ecke
Det
N PP
der
S. P
auf
ist NP
Adj rot
Det
dem
Tisch
Die Sätze (3) und (4) würde man wohl beide ableiten aus (9a) Ob) (9c)
Die Die Die Die
Schachtel Schachtel E c k e ist Schachtel
ist auf dem T i s c h . hat eine Ecke rot. i s t a n e i n e r E c k e rot.
(?)
Das Unbefriedigende ist, daß (3) nicht aus (9a) - (9c) allein ableitbar ist, denn dazu brauchte man die Information, daß wenn eine Ecke einer Schachtel rot ist, daß dann die Schachtel an einer Ecke rot ist. Solche Überlegungen führen zu der Einsicht, daß zur adäquaten Sprachbeschreibung ein erheblich komplizierterer Apparat notwendig ist als der von Chomsky gebotene. Ein erster Schritt in dieser Richtung soll das im folgenden beschriebene "generative semantische System" darstellen. Nach §2.4 sind Äußerungen Situationen zuzuordnen. Dazu ist der Rahmen eines Weltmodells mit Individuen, die über Weltbilder verfügen, nötig. Betrachten wir vorläufig den Spezialfall, in welchem alle Äußerungen relativ zu einem Individuum gesehen werden (das entspricht dem Fall, in welchem alle Individuen gleich sind). Nehmen wir ferner eine Menge von Sachverhalten an, denen unser Individuum jeweils die Werte 'besteht 1 bzw. 'besteht nicht 1 zugewiesen habe. Nun soll eine Kunstsprache L konstruiert werden, die aus Ketten - genannt Sätze - besteht, derart daß eine ein-ein-
42
deutige Abbildung zwischen den Sätzen von L und der Menge der Sachverhalte besteht. Dabei werden den Sätzen von L die Werte 1 1 bzw. als Extensionen zugeordnet, je nachdem, ob die zugehörigen Sachverhalte bestehen oder nicht. L soll verstanden werden als eine Erweiterung der Sprache des Prädikatenkalküls - etwa im Sinne von Keenan (vgl. Keenan, 1 9 7 2 ) . Nun werde eine Abbildung / definiert von den Sätzen von L in Ketten sprachlicher Einheiten einer natürlichen Sprache N.
Daraus ergibt sich, daß ein generatives semantisches System wie es hier verstanden wird, ein System ist, das aus zwei formalen Sprachen besteht und einem Interpretationsmodell - einer Menge von Sachverhalten. Def 3.2.-5: Ein generatives semantisshes System ist ein Septupel = (Wj V, L (G ), L( G„) 3i,f3v) wobei W eine Menge von Sachverhalten ist, V eine Menge von Werten, hier {o3l} , L (G,), L ( G N ) sind formale Sprachen, i : W—*-i(G,) ist eine ein-eindeutige Abbildung, /; L ( G T ) L(G„), (f: L(G„) »L(GT)} L· IV IV L· und v: L(G ) —·· V sind rechts-eindeutige Abbildungen. L· Zu L gehört ferner ein deduktives System D, das aus einer Menge von Deduktionsregeln und einer Menge von Axiomen besteht (Axiome sind Elemente von L(G,). L· Ein solches System bildet den Ausgangspunkt für folgende Verallgemeinerung. Sei ein Individuum, das über das System · verfügt; nennen wir das Paar (a, ) = a und sei A eine Menge solcher Paare. Ferner mögen folgende beiden Bedingungen erfüllt sein: (1) für je zwei Paare a, b aus A gelte, daß die Grammatiken G„ und ,G„ schwach äduivalent seien bis auf Vokabularuntera N b N schiede, d.h. die Mengen der von G und , G erzeugten Sätze stimmen insoweit überein als in ihnen nur Elemente aus dem als nicht leer vorausgesetzten Durchschnitt der Vokabulare von und b vorkommen. (2) für alle e (W W.) gelte bis auf Synonymie f oi (w) =
43
Def 3. .-6: Ein kommunikatives System ist ein Tripel KS = (A, W, ) , wobei W eine Welt ist und eine Relation zwischen Sachverhalten eines Systems und Zuständen oder Prozessen der Welt, wenn in KS (1) und (2) erfüllt sind. Hiermit ist ein Format geschaffen für Sprachbeschreibung, das erheblich mehr Phänomene erfassen kann als eine generative Grammatik im üblichen Sinn. 3 . 2 . 2 . Erkennungsgrammatiken Die Aufgabe von Erkennungsgrammatiken ist es, 1. festzustellen, ob eine Kette sprachlicher Einheiten wohlgeformt ist oder nicht; 2. Aufschluß über Struktur und Inhalt einer solchen Kette zu geben. Traditionell werden Erkennungsgrammatiken analog zu generativen Grammatiken formuliert, wobei dann Ketten auf ein ausgezeichnetes Symbol S reduziert werden. Dabei gilt jedoch nicht, daß eine Erkennungsgrammatik aus einer generativen Grammatik einfach durch Umkehrung der verwendeten Regeln entstünde, so daß etwa aus "S—* NP VP" " NP VP —- S" würde, sondern diese Regeln sind zumindest teilweise neu zu formulieren. Der Hauptgrund dafür ist das, was unter der irreführenden Bezeichnung "syntaktische Ambiguität" in die Literatur eingegangen ist. Wir wollen dafür im folgenden Begriff "strukturelle Ambiguität" verwenden, da es dabei um ein semantisches Problem geht. Def 3.2.-?: Eine Kette k heißt strukturell ambig in Bezug auf eine Grammatik G, wenn es mindestens zwei verschiedene Ableitungen gibt, mittels derer k aus S erzeugt werden kann. Ebenso, falls : auf mindestens zwei verschiedene Arten auf S reduziert werden kann. Um ein semantisches Problem geht es hierbei deshalb, weil seit Chomsky von einer Grammatik verlangt wird, daß Ketten dort als strukturell ambig genau dann repräsentiert werden, wenn ein Sprecher als mehrdeutig empfindet (und zwar ohne daß dabei lexikalische Ambiguität vorliegt). Die Formulierung ist nicht ganz durchsichtig, was im Augenblick nicht wichtig ist. Wesentlich ist vielmehr, daß hier wiederum ein semantisches Phänomen aufgrund
44
des gegebenen grammatischen Formats zu einem
quasi-syntaktischen
Phänomen wird. Einige Beispiele mögen der Illustration der strukturellen Ambiguität dienen. (1)
Rainer und Franz-Josef in Kreßbronn ankamen.
schliefen,
als
sie
Dieser Satz wird z . B . mit Hilfe von einer Pronominalisierungstransformation erzeugt - um im TG-Jargon zu sprechen; das Unsympatische dieser Transformation ist, daß sie strukturelle Ambiguität erzeugt. Damit ergeben sich für (1) mehrere Rekonstruktionsmöglichkeiten. Eine Erkennungsgrammatik muß dementsprechend so konstruiert sein, daß alle Rekonstruktionsarten in der Tat verfolgt werden, wodurch sie sich wesentlich von einer generativen Grammatik unterscheidet, bei der man sich damit zufriedengibt, Ketten abzuleiten und gelegentlich zu entdecken, daß es auch noch anders gegangen wäre. (2) (3) (4) (5) (6) (7) (8) (9)
Udo küßt das Mädchen im D o r f . Udo küßt das Mädchen im Vorübergehen. Udo küßt das Mädchen aus der Stadt. Udo jagt das Mädchen aus der Stadt. Kurt f ü l l t das Glas mit Wein. Kurt f ü l l t das Glas mit Unbehagen. Kurt leert das Glas mit W e i n . Kurt leert das Glas mit einem Schluck.
Zu diesen Sätzen seinen folgende Paraphrasen möglich. 1
(2 ) (2") (31) (3") (41) (4") (51) (5") (6') (6") (71) (7") (81) (91) (9")
Udo küßt das Mädchen, das im Dorf ist. Udo küßt das Mädchen. Das geschieht im D o r f . Udo küßt das Mädchen. Das geschieht im Vorübergehen. Udo küßt das Mädchen, während er ( e s ) vorübergeht. U d o k ü ß t d a s M ä d c h e n , d a s a u s d e r Stadt ist. Udo veranlaßt das Mädchen durch K ü s s e n , d i e Stadt z u v e r l a s s e n , ( ( a b w e g i g ) ) Udo j a g t das M ä d c h e n , das aus der Stadt ist. Udo v e r a n l a ß t das M ä d c h e n , die Stadt zu verlas sen. Kurt f ü l l t das Glas. Das tut er mit Wein. Kurt f ü l l t das G l a s , das [etwas] Wein en-thält, mit Wasser Kurt f ü l l t das Glas. Das tut er mit Unbehagen. Kurt f ü l l t das G l a s , wobei er sich unbehaglich fühlt. Kurt leert d a s G l a s , d a s Wein e n t h ä l t . Kurt leert das Glas. Das tut er mit einem Schluck. Kurt leert das Glas, das einen Schluck [Wein] enthält.
45 Anmerkung: Es ist gleichgültig, ob alle Paraphrasen akzeptiert werden - dies ist ein Modellfall. Diesen recht verschiedenen Phrasen entsprechen in üblichen Grammatiken genau zwei Strukturen für die Sätze (2) bis ( 9 ) , nämlich (a) (NP V (NP PP) ) (b) ( (NP V NP) PP) Mit Hilfe syntaktischer Merkmale kann erreicht werden, daß in einigen Fällen Eindeutigkeit entsteht. Es dürfte jedoch schlicht unmöglich sein, alle Sätze mit - in adäquater Weise - verschiedenen syntaktischen Strukturen zu repräsentieren. Und das ist auch gar nicht nötig, denn es handelt sich um semantische Unterschiede in diesen Sätzen, welche durch syntaktische Manipulationen nur verschleiert würden. Daraus läßt sich wiederum der Schluß ziehen, daß für eine adäquate Beschreibung mehr nötig ist als eine nur syntaktische Grammatik. Bevor hier jedoch auf das Gegenstück zum generativen semantischen System eingegangen werden soll, soll noch ein sprachliches Phänomen beleuchtet werden, daß bei der Erkennung sprachlicher Ketten von Bedeutung ist und das Ambiguität aufhebt. Es handelt sich um kontextuelle Desambiguierung. Dazu ein Beispiel: (10)
Ingo ärgert sich über I r i s . Udo j a g t das Mädchen aus der Stadt.
Dazu gehört die Information, daß Iris ein Mädchen ist etwa ein Wellensittich. (11)
und nicht
Udo jagt das Mädchen aus der Stadt vergeblich.
Verwandte Erscheinungen treten bei Problemen der anaphorischen Referenz auf: (12)
Die Katze l ä u f t die Straße h i n u n t e r ; Schwanz b l u t e t .
ihr
Ein gewöhnlicher Sprecher des Deutschen weiß, daß Straßen keine Schwänze besitzen und daß ' i h r ' sich deshalb nur auf 'die Katze 1 beziehen kann. Das Gegenstück zum generativen semantischen System des vorigen Abschnitts bildet ein explikatives semantisches System, das ganz analog gebaut ist, es enthält allerdings anstelle der Abbildung /
46
die Abbildung / ' , die in Def 3.2.-5 schon angegeben wurde. Zusammen mit dem zugehörigen deduktiven System lassen sich die hier gegebenen Beispiele der strukturellen Ambiguität und der kontextuellen Desambiguierung einwandfrei darstellen, ebenso die angedeuteten Referenzprobleme. Für ein Fragment eines semantischen Systems, das sowohl generativ als auch explikativ arbeitet, siehe Appendix 6 . 4 .
4.
ANALYSEMETHODEN
4.1. Ansatz der Beobachtung 4.1.1. Informanten Jede sprachliche Untersuchung beginnt damit, das sprachliche Verhalten von Mitgliedern einer Sprechgemeinschaft zu beobachten. Def 4.1.-1: Ein Mitglied einer Sprechgemeinschaft, das der Beobachtung unterliegt, ist ein Informant. Dabei sind Beobachtungen Perzeptionen (Def 2.1.-7) eines Individuums ( D e f . 2 . 1 . - 1 2 ) , das auch Beobachter genannt wird. Das Sprachmodell des Beobachters und sein Erkenntnisinteresse bestimmen den Beobachtungsrahraen der sprachlichen Untersuchung. Es sind grundsätzlich zwei Verhältnisse zwischen Informanten und Beobachter möglich: 1. Der Beobachter kommuniziert nicht mit den Informanten; dann heiße er passiv. 2. Der Beobachter kommuniziert mit den Informanten? dann heiße er aktiv. In jedem Fall erkennt der Beobachter Äußerungen der Informanten und klassifiziert sie nach Invarianten, wodurch er einerseits sprachliche Einheiten erhält und andererseits Ketten solcher Einheiten, die Repräsentanten von Äußerungen darstellen. Es ist überflüssig zu betonen, daß die Analyse des Beobachters nicht mit der der Informanten übereinzustimmen braucht, daß der Beobachter aber im allgemeinen versuchen wird, eine möglichst ähnliche Analyse zu erreichen wie die Informanten. Aus dem Sprachmodell des Beobachters leiten sich Hypothesen ab, die es zu verifizieren gilt. Das geschieht durch Überprüfung einschlägiger Äußerungen, bzw. deren Repräsentanten oder durch Tests, die den Informanten vorgelegt werden. Tests heißen passiv, wenn sie darin bestehen, daß Informanten eine Menge von Äußerungen bewerten - nach 'Korrektheit 1 , 'Syno-
48 nomie 1 oder dergleichen. Tests heißen aktiv, wenn sie in einer Vorschrift bestehen, nach welcher Informanten Äußerungen erzeugen sollen. Z . B . : "Übersetze "Bilde zu
Paraphrasen."
etc.
in deine Muttersprache.",
(vgl. zu dieser Einteilung von
Tests, Garvin-Brewer-Mathiot, 1967, S . 4 ) . Hier ergibt sich folgendes Problem: Es sind oft Diskrepanzen zu beobachten zwischen dem sprachlichen Verhalten von Informanten und ihrer Beurteilung dieses Verhaltens. Beispiel: In einem der Tests von §6.3, der semantische Klassifikation französischer Nomina zum Gegenstand hat, Informant folgende Aussagen zu 'animal (1) " ' b e t e ' est
1
machte der 1
und bete :
u n a u t r e m o t pour ' a n i m a l ' . "
Auf weiteres Fragen ergab sich aber (a)
"Un poisson est
un a n i m a l . "
(b) "Un poisson n ' e s t pas une b e t e . " und daraufhin: (2)
"bite1 c ' e s t un peu a f f e c t i f ,
e n r e l a t i o n avec l ' h o m m e . "
Aber: (c)
"Un e l e p h a n t est
une b§te s a u v a g e . "
(d) " U n e r a o u c h e e s t u n e p e t i t e b e t e . " Außerdem: (3) " O n n e p e u t p a s d i r e ' a n i m a l s a u v a g e 1 . " Das zeigt, daß metasprachlichen Aussagen von Informanten, wie ( 1 ) , ist.
(2) oder auch (3) gesundes Mißtrauen
entgegenzubringen
Um so mehr, als solche widersprüchlichen Aussagen in gu-
tem Glauben gemacht werden und ohne Absicht, den Beobachter zu belügen. Dies hat Auswirkungen auf die Art, wie Fragen in Tests zu formulieren
sind.
Es geht hier um das Problem der Beeinflussung, das in §2.3 unter dem Begriff der intensiv interagierenden Gruppen angesprochen wurde. Wenn ein Beobachter metasprachliche Aussagen eines Informanten
unbesehen akzeptiert, so läßt er sich von
ihm beeinflussen. Doch auch die umgekehrte Form der Beeinflussung tritt in Tests a u f , nämlich dann, wenn der Beobachter sogenannte Suggestivfragen stellt wie "x und y sind doch synonym?" oder "Es macht doch keinen Unterschied, ob ich sage [baröelona] oder
49
[ fcaröelona ] ?" oder "Was ist [ kanöjon ] und [ kanejog] Hier ist
der Unterschied zwischen
?"
anzumerken, daß auch die beliebte Frage "Kann man
sagen?" Informanten derart beeinflussen kann, daß sie nach kurzer Zeit entweder für
alles oder nichts mehr akzeptieren.
4 . 1 . 2 . Corpus Durch die Beobachtung von Informanten erhält man eine Menge von Äußerungen bzw. eine Menge von Repräsentanten von Äußerungen. Eine solche Menge wird im allgemeinen Corpus genannt. doch ist
Je-
nicht jede beliebige Menge von Äußerungen als Corpus
geeignet. Das folgt daraus, daß man ausgehend von einem Corpus eine Grammatik einer Sprache konstruieren w i l l , mit dem Z i e l , auch zukünftige Äußerungen beschreiben
zu können. Danach muß
ein Corpus in irgendeiner Weise "repräsentativ" für eine Sprache sein. Bevor man aber über die Repräsentativ!tat eines Corpus Aussagen t r i f f t ,
ist
es nützlich, sich noch ein anderes Kriterium
zu s c h a f f e n . Wie schon mehrmals gesagt, sucht ein Sprecher oder Beobachter in Äußerungen Invarianten. Um diese aber finden zu können, müssen irgendwelche Bruchstücke von Äußerungen mehrfach auftreten. M . a . W . bei der Perzeption gewisser Äußerungen hält der Beobachter bestimmte Teile davon für 'gleich 1 oder ' ä h n l i c h 1 , d . h . er ordnet ihnen denselben Repräsentanten zu in Übereinstimmung mit den Informanten oder nicht; das wird der Beobachter früher oder später merken. Der Beobachter konstruiert also sprachliche Einheiten. Überlegen w i r , was für Einheiten in Frage kommen: In der linguistischen Literatur heißen sie
Phonem (Phon),
Morphem
(Morph),
Wort, Phrase, Satz,
Die Definition dieser Einheiten ist
Text.
nicht ganz unproblema-
tisch. Beschränken wir uns daher vorerst auf Text und Satz. Def
4.1.-2: Ein Text ist
der Repräsentant einer Äußerung.
Def
4.1.-S: Ein Text T heißt minimal, wenn er nicht in zwei
Texte T', T" zerlegt werden kann. Ein minimaler Text ist Satz . Anmerkung: Betrachte die Texte (T)
I've got to run.
ein
50 (T') (T")
Beachte:
I ' v e got to. Run!
' " X T. Da keine andere Zerlegung möglich
ist,
ist T ein Satz. Aus der Anmerkung ergibt sich ( l e i d e r ! ) , daß Def 4 . 1 . - 3 ohne Berücksichtigung von Intonationsmerkmalen nicht zum Ziel f ü h r t . In der traditionellen Grammatik wurde der Versuch gemacht, die Einheit Satz inhaltlich zu definieren. Es ergab sich dabei in groben Zügen die Korrelation Satz - Sachverhalt. Dieser Versuch mußte aus zwei Gründen scheitern: 1. Sachverhalt war unklar. 2. Nicht jeder Einheit, die man Satz nennen wollte, konnte man guten Gewissens einen Sachverhalt zuordnen. Man denke dabei an Sätze wie " A h a l " , "Kommst d u ? " , "Bitte!" etc. Ein weiteres Problem, das hierbei a u f t r a t , war die Tatsache, daß ein Satz durch eine Folge von Sätzen paraphrasiert werden konnte, d.h. daß derselbe Sachverhalt sowohl einem einzigen Satz wie auch einer Folge von Sätzen zugeordnet werden konnte. All dies legt nahe, daß die Korrelation Satz-Sachverhalt ziemlich komplex ist
und daher nicht sehr gut geeignet, um die
Einheit Satz zu definieren. Ein weiterer - vielversprechender - Versuch der traditionellen Grammatik, Satz zu definieren, war der, strukturelle Kriterien anzugeben. Z . B . : "Ein Satz besteht aus einem Subjekt und einem Prädikat." Eine generative Grammatik, wie sie Chomsky entwickelt hat, könnte in diesem Sinne als Definition von Satz aufgefaßt werden. Eine solche strukturelle Definition setzt allerdings die im Augenblick noch verfügbaren Begriffe Morphem und Phrase voraus. Sie setzt ferner - und das ist bedenklicher - erheblich mehr Wissen über eine Sprache voraus als Def 4.1.-3, und das ist der Grund, weshalb im jetzigen Stadium der Untersuchung diese vorgezogen wird. Eine Folgerung aus Def 4.1.-3 ist Th 4.1.-1: Jeder Text besteht vollständig aus Sätzen. Beweis: 1. Angenommen, T ist
minimal, dann ist
T ein Satz ( D e f . 4 . 1 . - 3 ) .
2. Angenommen, T ist
nicht minimal, dann existieren T'3T" mit
51
T'T" =
und
', " sind Texte (Def 4 . 1 . - 3 ) .
3. Ersetze T durch T ' b z w . T"; geh nach 1. Es wird erst in Kapitel 5 der Versuch unternommen werden, Phonem, Morphem,
Wort und Phrase zu definieren, es soll hier
lediglich gefordert werden, daß 1. jeder Satz vollständig aus Phonemen, Morphemen, Wörtern und Phrasen besteht bzw. vollständig in solche Einheiten zerlegbar ist und
2. jeder Satz als Kette von Phonemen, Morphemen, Wörtern oder Phrasen darstellbar ist. Das genügt für eine Definition der Gleichheit von Sätzen: Def
4.l,-4: Zwei Sätze s, s ' heißen phonemweise gleich, wenn
sie die gleiche Anzahl (n) von Phonemen enthalten, d . h . gleich lang sind und wenn für l = i = n gilt, daß wenn p., p'. Phoneme 1r
't'
sind und s - p . . . p j.
7
und s ' - p'...p', dann auch p. -p', gilt. j.
1*
1r
Analog: morphemweise, wortweise und phrasenweise Gleichheit. Sätze, die phonemweise, morphemweise, wortweise oder phrasenweise gleich sind, heißen (strukturell) Def
gleich.
4.1.-5: Zwei Sätze s, s ' heißen teilweise gleich^ wenn es
eine Kette von Phonemen (Morphemen e t c . ) gibt, deren Länge größer O ist, derart, daß s - k L kk
und s' = k'kk', wobei J.
k ,k ,k'tk' beliebige Ketten (möglicherweise der Länge O) sind. JL
Z
J.
Th 4.1.-2: Gleiche Sätze sind teilweise gleich. Beweis: Trivial. Def 4.1.-6: Eine nicht-leere Menge 5 von Sätzen heißt zusammenhängend im weiteren Sinn, wenn es zu jedem Satz s e S mindestens einen Satz s' e S gibt, so daß s und s ' teilweise gleich aber nicht gleich sind. S heißt zusammenhängend im engeren Sinn, wenn zu jedem s £ S Sätze s ,s ts L
S
e S existieren, so daß wenn s = kk'k", dann O
l = klkk2' S2 = k3k'k4' bige Ketten sind. Def
S
3
= k
5k"k6*
wobei
k^ .. .,
4.1.-7: Sei S eine Menge von Sätzen und sei
Q
belie-
B eine Menge
von Phonemen (Morphem etc.) mit
B - [k: s = k.kk & s>s' e S & k^k-^k-, 0u & s' - k-kk. I 0 4 J. o k
sind beliebige Ketten] {s:
V s ' e S (s £ s '
s nicht teilweise gleich mit s ' J , dann heißt B Basis von S.
52 Mit den j e t z t verfügbaren B e g r i f f e n läßt sich das zweite der anfangs dieses Abschnitts erwähnten Kriterien präziser formulieren. Kriterium Cl: Eine Menge C von Sätzen ist
als Corpus verwend-
bar, wenn sie zusammenhängend (möglichst im engeren Sinn)
ist
oder vollständig aus zusammenhängenden Teilmengen besteht, d . h . eine Partition in zusammenhängende Teilmengen möglich
ist.
Mit Hilfe eines Corpus C, das Cl e r f ü l l t , läßt sich durch später zu erläuternde Kriterien und entsprechende zusätzliche Beobachtungen, welche die Bedeutung b z w . Verwendung von Sätzen b e t r e f f e n , eine Grammatik G konstruieren, die die Sätze von C
beschreibt. Es werde nun eine Satzmenge S konstruiert mit 5 = C u {s} 3
wobei s ein beliebiger Satz ist, halten ist.
der nicht bereits in C ent-
Wenn 5 Kriterium C l nicht e r f ü l l t , so sind weitere
Sätze, die mit s teilweise gleich sind, h i n z u z u f ü g e n . Es entsteht dadurch ein neues Corpus C '. Nun prüfe man, ob die Grammatik G alle Sätze von C ' beschreiben kann - falls nicht, konstruiere man G', derart daß G 1 die Sätze von C' beschreibt. Dieses Vorgehen läßt sich fortsetzten. Man erhält eine Folge von Corpora C, C', C", C tiken G, G'3
G", G
(3)
, . . . und eine Folge von Gramma-
,...
Unter der Annahme, daß von den Informanten unendlich viele Sätze gebildet werden können, läßt sich die Folge der Corpora beliebig fortsetzen. Unter der weiteren Annahme, daß die Kapazität des Gedächtnisses eines Individuums endlich ist, ergibt sich, daß ihm zur Bildung dieser unendlich vielen Sätze nur endlich viele Bildungsregeln zur Verfügung stehen können. Daraus folgt aber, daß eine Grammatik, die alle Sätze beschreiben kann, nur endlich viele Regeln enthalten braucht, und daß deshalb ein (n ) (m ) Index existiert, so daß für alle m>n gilt G = G . Damit läßt sich ein Kriterium der Repräsentativität eines Corpus angeben: Kriterium C2: Wenn sich in einer Folge von Corpora von einem Index n an die zugehörigen Grammatiken nicht mehr ändern, so heißen alle Corpora von diesem Index n ab repräsentativ. Damit läßt sich das Adäquatheitskriterium von §3.1 präzisieren
53
zu
Kriterium A: Eine Grammatik, die alle Sätze eines repräsentativen Corpus beschreibt, ist
adäquat.
Zur Repräsentativ!tat von Corpora läßt sich die Vermutung anstellen, daß sie dann erreicht ist,
wenn keine Sätze mehr
gefunden werden können, die nicht mit mindestens einem Satz aus dem gegebenen Corpus teilweise gleich sind. In diesem "Nichtmehrfindenkönnen" steckt allerdings ein P f e r d e f u ß , denn es kann zwei Ursachen haben: 1. die Ungeschicklichkeit von Beobachter oder Informanten, 2. die tatsächliche Erschöpfung bisher nicht erfaßter Strukturen. Damit zeigt sich allerdings auch: So schön C2 auch ist, ist
nicht entscheidbar. Es ist
es
an der Praxis trotzdem zu ver-
wenden, da einfache statistische Überlegungen zeigen, ob es einen Sinn hat, weiterzusuchen oder nicht: Wenn auf l OOO neue Sätze eine Revision der Grammatik nötig wird, ist
es wohl bes-
ser abzubrechen - wenn man sich nicht den R u f , Perfektionist zu sein, einhandeln will. 4 . 1 . 3 . Normierung Jedes Individuum besitzt nach § 2 . 2 ein eigenes Zeichensystem, das wir dann in § 2 . 2 seinen Idiolekt genannt haben. Daraus folgt, daß zwischen verschiedenen Informanten Abweichungen feststellbar sind, es folgt außerdem, daß die Ergebnisse sprachlicher Tests davon abhängen, welche Informanten befragt werden. Hierbei ergibt sich für den Beobachter die Frage, wie diese Abweichung der jeweiligen Ergebnisse festzustellen und zu beurteilen ist;
ferner wie
die sprachliche Beschreibung verein-
facht werden kann. Hinzu kommt, daß das primäre Interesse eines Beobachters im allgemeinen nicht darin besteht, irgendeinen Idiolekt oder ein Konglomerat von Idiolekten zu beschreiben, sondern "die natürliche Sprache", die alle Mitglieder eine Sprechgemeinschaft sprechen. Um das zu erreichen, bietet sich ein Verfahren an, das wir Normierung nennen wollen. Angenommen, ein Beobachter nimmt einen bestimmten Test mit
54 einer Anzahl von Informanten vor. Dann wird er Invarianten und Abweichungen zwischen den jeweiligen Antworten der Informanten feststellen. Z . B . produziert eine Lautfolge p mit einer bestimmten Grundfrequenz /, b hingegen mit der Grundfrequenz / ' , jedoch schließen beide zunächst den Mund und ö f f n e n ihn dann relativ weit. (Zusätzlich behaupten beide vielleicht noch, dasselbe zu sagen) . Selbstverständlich wird der Beobachter daraufhin die Invarianten in diesen Äußerungen von
und b festhalten und
weitere Merkmale unberücksichtigt lassen. Es wird gelegentlich vorkommen, daß ein Informant
Äuße-
rungen macht, die b für nicht wohlgeformt hält, und umgekehrt; und der Beobachter wird nur Äußerungen in sein Corpus aufnehmen,
die mindestens von der überwiegenden Mehrheit für wohlge-
formt gehalten werden. Ferner wird es vorkommen, daß ein Informant a Äußerungen macht, die b für falsch hält; und hier können unter Umständen Konfusionen auftauchen, die darin bestehen, daß falsche Äußerungen f u ß nicht wohlgeformt gehalten werden. Es wird vorkommen, daß ein Informant a Äußerungen macht, die b nicht versteht, und solche Äußerungen wird der Beobachter aufnehmen in sein Corpus, es sei denn
wäre der einzige
in der Sprechgemeinschaft, der die Äußerung versteht. Durch Befolgen derartiger - hier nur informell angegebener Kriterien erhält der Beobachter ein normiertes Corpus, das alles das unberücksichtigt läßt, was spezifisch für einzelne Informanten ist,
jedoch möglichst alles enthält, was sie ge-
meinsam haben. Mit Hilfe eines solchen Corpus läßt sich dann eine normierte Grammatik (keine normative Grammatik) bilden. Wenn nun eine normierte Grammatik erstellt ist, läßt sich diese als Norm verwenden, um die Abweichung von Idiolekten, Dialekten oder Soziolekten zu bestimmen. Eine normierte Grammatik soll in einem gewissen Sinne das "Zentrum" einer Sprechgemeinschaft repräsentieren. Dabei kann sich im Laufe der Untersuchung ergeben, daß das Zentrum anders festzulegen und die Norm entsprechend zu verändern ist. Das wird vor allem deshalb gelegentlich nötig werden, da sprachliche Untersuchungen meist mit relativ wenig Informanten begonnen
55
werden müssen, die sich später dann als wenig repräsentativ für die Sprechgemeinschaft herausstellen mögen. Hier stellt sich nun wieder das Problem nach der Abgrenzung von Sprechgemeinschaften, das mittels des Begriffs der normierten Grammatik angegangen werden kann. Je weiter man sich vom eben erwähnten Zentrum entfernt, desto stärker werden die Idiolekte (Dialekte) der Sprecher von der Norm abweichen. Es wäre zu unterscheiden zwischen zulässigen und unzulässigen b z w . wesentlichen und unwesentlichen Abweichungen solcher Idiolekte jedoch gibt es dafür bis jetzt keine zuverlässigen Kriterien. Vorläufig besteht allerdings die Möglichkeit, ein anderes ziemlich heuristisches - Verfahren anzuwenden: Es hat folgenden Aufbau: Seien a,b}cid Informanten {möglichst ähnlicher sozialer Schichten). Es werde als
bekannt vorausgesetzt, daß a und b bzw. o
und d jeweils der gleichen Sprechgemeinschaft angehören. Festzustellen ist,
ob atb3Gtd zusammen einer oder zwei Sprechgemein-
schaften angehören. Es werde weiterhin vorausgesetzt, daß und o versuchen, miteinander zu kommunizieren. Dann sind
fol-
gende Fragen zu beantworten: 1. Sind ato regionale Nachbarn? 2. Gibt es gegenseitige Vorurteile? 3. Verstehen sich a,c überhaupt? - Ja: 4.
Nein: 9.
4. Unterscheidet sich das sprachliche Verhalten von gegenüber Q von dem von für otd)
gegenüber b? (Analog - Ja: 5.
Nein: 8.
5. Verständigen sich a,o durch Gesten? - Ja: 9. Nein: 6. 6. Gibt es Mißverständnisse über einfache Sachverhalte? - Ja: 9. 7. Imitiert
Nein: 7.
das Verhalten von o oder umgekehrt? - Ja: 9.
Nein: 8.
8. a3bsS3d gehören derselben Sprechgemeinschaft an. 9. a3b}c,d gehören verschiedenen Sprechgemeinschaften an. 1. und 2, sind Vorfragen. Wenn l positiv beantwortet wird, erhöht sich die Wahrscheinlichkeit, daß 8. richtig
ist.
Wenn 2. positiv beantwortet wird, kann es vorkommen, daß
56
oder G sich "weigern", einander zu verstehen. Dies ist
ein Pseudo-Algorithmus, denn die in den Fragen
vorkommenden Begriffe sind bewußt vage gewählt; er ist
mehr
oder weniger als eine H i l f e zum Über-den-Daumen-Peilen zu verstehen. 4 . 1 . 4 . Analysefehler Zu jeder empirischen Untersuchung gehört eine Fehlerbetrachtung, denn der Beobachter muß sich klar darüber werden, an welchen Stellen sich Fehler in seine Analyse einschleichen können und wie sie entweder vermieden oder - falls unvermeidlich kalkuliert werden können. Es geht hier nicht um Fehler aus Nachlässigkeit - Sorgfalt wird unterstellt -, ler,
sondern um Feh-
die trotz aller Vorsicht auftreten.
Es ist
üblich, Fehler in sogenannte systematisahe und akz-i-
dentelle Fehler einzuteilen. Systematische Fehler treten regelmäßig a u f , akzidentelle Fehler - wie der Name sagt - z u f ä l l i g . Ein Sprachfehler bei einem Informanten zum Beispiel wäre ein typischer systematischer Fehler, ein Versprecher hingegen ein typischer akzidenteller Fehler. Wir wollen außerdem im folgenden die Fehler bei der Sprachanalyse in drei Kategorien einteilen: 1. Fehler der Informanten, 2. Fehler des Beobachters, 3. Fehler der Theorie. Ad 1: Hier läßt sich weiter unterteilen: 1.1. Fehler, die durch unvollkommene Sprachbeherrschung entstehen, 1.2. Versprecher, 1.3. Fehler, die auf Beeinflussung durch den Beobachter zurückgehen. Fehler vom Typ 1.1 sind systematisch und dadurch zu beheben, daß der entsprechende Informant nicht mehr konsultiert wird, wo sich sein Sprachfehler auswirkt. Sie sind zu erkennen, indem man das Verhalten des Betreffenden mit dem anderer Informanten vergleicht. Fehler vom Typ 1.2 sind akzidentell und können nicht behoben werden. Sie sind aber kalkulierbar dadurch, daß man Informanten
57
Äußerungen wiederholen läßt und im übrigen darauf h o f f t , daß sie nicht so zahlreich sind, daß sie sich statistisch auswir-
ken. Fehler vom Typ 1.3 sind heimtückisch. Sie entstehen durch Suggestivfragen oder Assoziationen, die der Beobachter weckt. Sie können außerdem sowohl systematisch als auch akzidentell sein und können nur mit Hilfe von Mißtrauen bekämpft werden. Fehler vom Typ 1.3 sind besonders bei semantischen und pragmatischen Fragestellungen (vgl. folgender Abschnitt) zu erwarten, weil Informanten in diesen Gebieten besonders leicht verunsichert werden können. Beispiel: H e r r N . N . sagt n o r m a l e r w e i s e f ü r ' W a l 1 ' W a l f i s c h 1 und hat in der Schule g e l e r n t ' W a l e sind keine F i s c h e ' . Man s t e l l t i h m d i e F r a g e : ' W a s s i n d W a l e ( W a l f i s c h e ) f ü r T i e r e ? ' Aufgrund der Diskrepanz zwischen seinem Alltagsgebrauch und seinem Schulwissen ist er leicht zu b e e i n f l u s s e n . Das kann zum B e i s p i e l d u r c h f o l g e n d e F r a g e n g e s c h e h e n : ( 1 ) Sind W a l e F i s c h e ? 1 (2) Was sind Wale für F i s c h e ? '
Ad 2: Fehler des Beobachters können ebenfalls weiter unterteilt werden: 2.1. Aufnahmefehler, 2 . 2 . Interpretationsfehler. Fehler, vom Typ 2.1 sind vor allem Hörfehler des Beobachters. Sie können nur durch Training beseitigt werden; erkannt werden sie dadurch, daß Informanten den Beobachter mißverstehen. Interpretationsfehler sind hier nicht gemeint als Fehler, die dadurch entstehen, daß aufgrund fehlerhafter Hypothesen falsche Schlüsse gezogen werden - das wären Fehler der Theorie -, sondern als Fehler, die durch falsche Anwendung der Theorie entstehen. Soche Fehler führen irgendwannn zu Widersprüchen, und können dann mit etwas Glück entdeckt werden. Ad 3: Fehler der Theorie können nach dem in §1.2.1 angegebenen Modell gefunden und beseitigt werden. Dazu sei noch folgendes bemerkt: Die Wahrheit einer Theorie ist
eine Prestigeangelegenheit. Daher sind Fehler in Theorien
nur von deren Gegnern leicht zu finden. Es sei hinzugefügt,
daß Fehler in Theorien nicht von vorn-
herein vermeidbar sind - es sei denn durch einen Verzicht, Theorien zu formulieren.
58
4 . 2 . Charakterisierung der Methoden mit Hilfe der Begriffe "Syntaktik", "Semantik", "Pragmatik" 4 . 2 . 1 . Klärung der Begriffe "Syntaktik", "Semantik", "Pragmatik" Diese Begriffe gehen in dieser Zusammenstellung zurück auf Morris, der sie in seiner Zeichentheorie verwendet hat (vgl. z. B. Morris, "Signs, Language, and Behavior"). In der Logik haben die Begriffe "formal" und "Syntax" schon eine ältere Tradition, und Tarski hat seit 1935 den Begriff der Semantik unabhängig von Morris verwendet, (vgl. Tarski, "The Concept of Truth in the Formalized Languages" in "Logic, Semantics, Metamathematics"). Mit der Verwendung dieser Begriffe ist bereits sehr viel Verwirrung gestiftet worden - vor allem in der Linguistik. Machen wir deshalb den Versuch, sie neu zu definieren, und ziehen wir zunächst Carnaps Definition für "logische Syntax" und "formal" zu Rate (Carnap 1937, S . l ) : "By t h e l o g i c a l s y n t a x o f a l a n g u a g e , w e m e a n the formal theory of the linguistic forms of that language - the systematic statement of the formal rules which govern it together with the development of the consequences which follow from these rules." "A t h e o r y , a r u l e , a d e f i n i t i o n , or the l i k e is to be c a l l e d formal w h e n no r e f e r e n c e is m a d e in it either to the m e a n i n g of the symbols ( e . g . the w o r d s ) or to the sense of the e x p r e s s i o n s ( e . g . the s e n t e n c e s ) , but simply and solely to the kinds and order of the symbols f r o m which the expressions are constructed."
In diesem Sinne sollen im folgenden diese Begriffe auch verwendet werden, für "logische Syntax" werden wir allerdings auch "Syntaktik" sagen, und "syntaktisch" werden wir synonym zu "formal" verwenden. Es ist wichtig, festzustellen, daß in der Linguistik der Begriff Syntax sehr oft nicht so verwendet wird wie Logische Syntax bei Carnap, sondern einfach als Begriff für Lehre vom Satzbau, ohne daß dabei auf die Betrachtungsweise Bezug genommen würde (so wird der Begriff Syntax auch in §5.2 verwendet). Es ist weiterhin festzustellen, daß eine Theorie der Bedeu-
59
tung als formale Theorie konzipiert werden kann. Eine solche Theorie ist
dann zu verstehen als eine (mindestens) zweischich-
tige Theorie, und Symbole und Ausdrücke der ersten Schicht werden erklärt durch Symbole und Ausdrücke der zweiten Schicht, diese können dann allerdings nicht mehr formal erklärt werden. Das führt uns schon zum Begriff der Semantik. Semantik
ist
die Lehre von den Extensionen und/oder Intensionen von Zeichen oder Kombinationen von Zeichen. Es ist
damit gesagt, daß eine
Semantik extensional, intensional oder beides sein kann. Eine formale Theorie der Semantik eines syntaktischen Systems (einer formalen Sprache) heißt formales semantisches System
(Dieser Begriff ist
in §3.2 schon als Name verwendet
worden. Es sind dort aber keine Schlüsse gezogen worden, die eine Definition dieses Begriffs vorausgesetzt hätten. Obwohl die Abgrenzung von Syntaktik und Semantik auf den ersten Blick sehr klar erscheint, gibt es hier doch Probleme, die am folgenden Beispiel erläutert werden sollen. Dabei
sei
darauf hingewiesen, daß eine generative Grammatik eine formale Sprache definiert und selbst ein formales System darstellt. Beispiel: G = V R =
Man b e t r a c h t e die
(VN,VT,R,S) =
mit
generative
Grammatik
VN = ( S , N P , V , V S , A D J , A R T , N } ,
{ das,die,de r,eine,Phonem(Quadratwurzel,Maikäfer, Primzahl,Käse,Karl,frißt,is t,müde,irrational } , { S — » N P V N P , S —» NP V s A D J , S —. NP Vs N P , N P — » A R T N , N P —» N , V . f r i ß t , Vs — » i s t , ADJ-»{müde , i r r a t i o n a l } , A R T — » { d a s , die , de r ,e ine } , N —^ {Phonem » Q u a d r a t w u r z e l , M a i k ä f e r , P r i m z a h l , Käse,Karl} } .
Folgende Sätze können abgeleitet w e r d e n : (1) das Phonem f r i ß t Käse (2) d i e Q u a d r a t w u r z e l i s t müde (3) d e r M a i k ä f e r i s t eine P r i m z a h l Diese Sätze mögen durch eine semantische Theorie als ausgeschieden werden.
unsinnig
Man ä n d e r e n u n G u m i n G ' , s o d a ß R ' = ( s — » N P l V A N P 2 , S — » N P l Vs ADJ1, S —»NPl Vs N P l , S — - N P 3 1 Vs A D J 3 , S—»NP33 Vs ADJ3, NPl » N l , NPl »ART2 N 1 2 , NP2 — - N 2 , NP31—- ARTl N 3 1 NP33—»-ART3 N33, Nl—- Karl , 12 — - M a i k ä f e r , A R T l —»· das , ART2 — » d e r , A R T 3 —{die , e i n e } , N 3 l —- P h o n e m , N3 3 —«-{Quadratwurzel ,P r i m z a h l } , ADJl — » m ü d e , AD J3—·· i r r a t i o n a l , V I — » f r i ß t , V s — » . i s t , N 2 —» K ä s e } .
60
In G ' können die Sätze
(1) bis
den, sind also in Bezug auf G
1
(3) nicht mehr abgeleitet wernicht wohlgeformt.
Aus dem Beispiel läßt sich entnehmen, daß die Menge der wohlgeformten Sätze mit der Menge der sinnvollen Sätze (nach einer hier nicht explizit angegebenen Theorie) übereinstimmen kann, aber nicht muß. Das ist
ein weiterer Grund für eine
Konfusion von Syntaktik und Semantik. Hier kann gefragt werden, was soll dann die Unterscheidung überhaupt? Die Antwort darauf ist, daß die Intension des Beg r i f f s "sinnvoller Satz" verschieden ist von der des Begriffs "wohlgeformter
Satz", selbst wenn in speziellen Fällen extensio-
nale Gleichheit vorliegen mag. Man kann sich nämlich auf der einen Seite nicht darauf verlassen, daß es immer möglich ist, extensionale Gleichheit zu erreichen. Auf der anderen Seite bedient sich eine semantische Untersuchung anderer Methoden als eine syntaktische. Außerdem sind syntaktische Untersuchungen, die sich nicht auf semantische Untersuchungen stützen, unmöglich (wie seit Bloomfield bekannt). Diese Argumente legen eine sorgfältige Unterscheidung nicht nur bei der Untersuchung von Sprachen sondern auch bei der Darstellung der Ergebnisse solcher Untersuchungen nahe. Nun zum Begriff der Pragmatik. Pragmatik ist
die Lehre von
den Verhältnissen, die Sprecher und Angesprochener zu den Bedeutungen von Sätzen (Äußerungen) haben. Pragmatik beschäftigt sich also mit der Relativierung von Bedeutungen, mit den Haltungen von Individuen gegenüber Sachverhalten. Dazu gehören die Absicht, mit der Äußerungen gemacht werden, die Wirkungen von Äußerungen auf ein Individuum, die Beurteilung von Sachverhalten durch einen Sprecher etc. Bezüglich der Abgrenzung von Semantik und Pragmatik tritt ein ähnliches Problem auf wie bei der Abgrenzung von Syntaktik und Semantik, ebenso bezüglich der Abgrenzung von Syntaktik und Pragmatik. So ist zum Beispiel hinsichtlich des Begriffs der Präsupposition eine Kontroverse entbrannt, ob es sich dabei um einen semantischen oder um einen pragmatischen Begriff handele. Um die Verwirrung zu vervollkommnen, sei bemerkt, daß in einer
61
dreiwertigen Logik wie sie auch von Keenan verwendet wird (vgl. Keenan, 1 9 7 2 ) ein Junktor 'präsupponiert' formal eingeführt werden kann. Daneben gibt es bei Keenan ( a . a . O . ) eine korrekte semantische Definition des B e g r i f f s 1 ) , und eine korrekte pragmatische Definition ist
ebenfalls denkbar.
Die Kontroverse kommt dadurch zustande, daß in diesen drei Definitionen derselbe umgangssprachliche Name verwendet wird. Es liegt aber ein ähnlicher Sachverhalt vor wie beim syntaktischen und semantischen Folgerungsbegriff, die umgangssprachlich beide als
"wenn - dann 1 erscheinen. Es geht also nicht
darum, sich zu streiten, ob "Präsupposition" ein syntaktischer, semantischer oder pragmatischer Begriff sei,
sondern syntak-
tische, semantische und pragmatische Präsupposition säuberlich auseinanderzuhalten. Zum Schluß sei noch gesagt, daß ähnlich wie man in der Semantik ein formales semantisches System konstruieren kann, man auch ein formales pragmatisches System konstruieren kann - ein Beispiel dafür bildet in etwa das in Def 3 . 2 . - 6 angegebene System. 4 . 2 . 2 . Syntaktische Methoden Def
4.2.-1: Syntaktische Methoden sind sprachliche Unter-
suchungsmethoden, die sich nur auf Formen und Anordnungen von Zeichen (sprachlichen Einheiten) stützen. Diese Definition kann etwas liberaler gefaßt werden, indem man für syntaktische Methoden auch die Frage an Informanten nach der Wohlgeformtheit von Äußerungen zuläßt. Syntaktische Methoden beruhen sehr oft auf Distributionstests, deshalb zunächst eine Erklärung dieses B e g r i f f s : Def
4. 2.-2: Sei C ein Corpus von Ketten beliebiger sprachlicher
Einheiten, sei k eC mit k = k'k k",
so daß k , k', k" Ketten
sprachlicher Einheiten sind. Dann heißt das Paar (k',k")
" D E F : S logically p r e s u p p o s e s T j u s t in c a s e S is neither true nor false in each interpretation in w h i c h T is u n t r u e . "
ein
62
Kontext von k . Die Menge der Kontexte von k die Distribution von k
bezüglich C heißt
bezüglich C. Schreibweise:
(k )}
falls
keine Verwechslung möglich: D ( k ). Def
4.2.-3: Eine sprachliche Untersuchung, die sich auf die
Distributionen sprachlicher Einheiten stützt, heißt Distributions test. Def.
4.2.-4: Zwei Ketten k, k' sprachlicher Einheiten heißen
distributionsgleiah genau dann, wenn D ( k )
= D(k')3
sie heißen
in komplementärer Distribution stehend genau dann, wenn D(k)f\D(k')
- 0. Die Distribution von k heißt weiter als die
von k' genau dann, wenn D(k')^D(k)3 dann, wenn Def
sie heißt enger genau
D(k)&D(k').
4.2.-5: Sei K eine Menge von Ketten sprachlicher Einheiten.
Dann ist K.
J e\ D ( k )
- d ein Distributionsmerkmal der Ketten von
Andere syntaktische Methoden beruhen auf Substitutions-, Permutations-, Deletions- und Expansionstests. Def
4.2.-6: Seien k, l zwei Ketten aus einem Corpus C, mit
k = u v w und l - u
wt wobei u,vtwtx Ketten sprachlicher
Einheiten sind. Dann sagt man, daß k aus 1 durch Substitution von
durch v entsteht. l/x. 'v 4.2.-?: Eine Deletion ist
Schreibweise: fe Def.
eine Substitution einer Kette
durch die Kette der Länge O, e . Eine Expansion ist die Substitution von e durch eine Kette v. (Weder noch v sind gleiche ) Def 4.2.-8: Sei E eine Menge mit n Einheiten. Dann heißen die Ketten der Länge n, die aus den Einzelheiten von E bestehen Permutationen einer gegebenen Kette dieser Einheiten. Beispiel: von Je und
Sei Je = abcd, l = bacd. D a n n ist umgekehrt.
l eine Permutation
A. Syntaktische Methoden zur Untersuchung syntaktischer Phänomene Das sind Methoden, die syntaktisch sind und die dazu dienen, Formen und Anordnungen sprachlicher Einheiten festzustellen. Ein Beispiel ist ein Verfahren zur Feststellung der Phrasenstruktur von Sätzen. Dabei sei bekannt, welche sprachlichen Ketten Sätze und welche Phrasen sind bzw. es existiere ein Verfahren, das gegebenenfalls feststellt, ob eine Kette ein Satz
63
bzw. eine Phrase ist.
Ein solches Verfahren kann darin beste-
hen, einen Informanten sagen zu lassen, welche Ketten Sätze sind. Ziel der Analyse ist
es, festzustellen, welche Kombi-
nationen von Phrasen Sätze ergeben. B. Syntaktische Methoden zur Untersuchung semantischer Phänomene Das sind syntaktische Methoden, die dazu dienen, semantische Beziehungen zwischen sprachlichen Einheiten festzustellen. Die Grundlage für die Wirksamkeit solcher Methoden ist
ein
Prinzip, das Garvin "form-meaning-covariance" nennt. Es läßt sich etwa so formulieren: Verschiedene sprachliche Formen haben im allgemeinen verschiedene Bedeutungen -
verschiedene
Bedeutungen drücken sich im allgemeinen in verschiedenen Formen aus.
Wenn es weder Homonyme noch Synonyme gäbe, wäre dieses Prinzip allgemeingültig. Da in den meisten Sprachen Synonyme und Homonyme nicht sehr häufig sind, ist
es für heuristische Zwek-
ke recht brauchbar. Daraus ergibt sich in Distributionstests, daß Distributionsmerkmale gleichzeitig mit Einschränkungen als semantische Merkmale aufgefaßt werden können. Für ein Beispiel eines solchen Tests siehe § 6 . 2 2 . 4 . 2 . 3 . Semantische Methoden Def
4.2.-9: Semantisahe Methoden sind Methoden, die Extensio-
nen und/oder Intensionen sprachlicher Einheiten und Beziehungen zwischen Extensionen und Intensionen zum Inhalt haben. Aus Def 2.1.-17 und den Prinzipien I und II ergibt sich, daß Extensionen Mengen von Objekten oder n-tupeln von Objekten sind oder Mengen von Eigenschaften, Relationen oder Sachverhalten. Intensionen stehen hingegen für Gemeinsamkeiten zwischen Objekten, n-tupeln von Objekten, Eigenschaften, Relationen oder Sachverhalten. Seien k,l Ketten sprachlicher Einheiten. Dann sind folgende Fragen in semantischen Tests zugelassen: l. Hat k eine Bedeutung?
64 2. Was ist
die Bedeutung von k?
3. Hat k dieselbe Bedeutung wie l?
bzw. Ist
die Bedeutung von k verschieden von der von 11
Hier wurde anstelle der Begriffe Extension und Intension der vortheoretische und deshalb nur heuristisch verwendbare Begriff Bedeutung verwendet. Die Beziehung zwischen diesen Begriffen ist
folgende: Wenn k eine Bedeutung hat, so hat k
auch eine Extension und eine Intension. Die Frage nach der Bedeutung von k ist
eine Frage nach der Intension von k. Die
Frage nach der Extension von k lautet: Für welche Dinge, unter welchen Umständen sagt man fe? Wenn k, l bedeutungsgleich sind, so sind sie extensions- und intensionsgleich. Wenn sie nicht bedeutungsgleich sind, so sind sie nicht intensionsgleich. Def.
4.2.-10: Seien k, l Ketten sprachlicher Einheiten. Dann
heißt die Extension von k weiter als die von 1, wenn die Extension von k die Extension von l umfaßt. Schreibweise: e x t ( Z )
cext(fe).
Analog: . . .enger... Def. 4, 2.-11: Intensionsgleiche Sätze heißen Paraphrasen. Intensionsgleiche Morpheme heißen Synonyme. Da Morpheme erst in §5.2 definiert werden, ist
der zweite Teil dieser Definition
gewissermaßen eine Definition auf Vorrat. Def. 4. 2.-12: Ein Satz heißt analytisch, wenn er auf alle Sachverhalte z u t r i f f t . Beispiel: K u g e l n s i n d r u n d . -
Vx ( K u g e l ( x ) - v
Rund(x)).
Def. 4. 2.-13: Ein Satz heißt tautologisch, wenn er aufgrund der formalen Struktur der Sprache auf alle Sachverhalte zutrifft. Beispiel: Def.
Kugeln sind K u g e l n . -
4. 2.-14: s folgt
V x ( K u g e l ( x ) -»·
Kugel
(x)).
analytisch aus t genau dann, wenn s aus
t aufgrund der Deduktionsregeln und analytischen Sätzen abgeleitet werden kann. Schreibweise: s - * · » * · Wenn s analytisch aus t folgt und t aus s, dann heißen s,t £\
65
analytisch äquivalant. Schreibweise: s s t. (vgl. Stegmüller, "Wissenschaftliche f\ Erklärung und Begründung", S . 6 0 f f ) Beispiel:
Karl ist
Pauls Vater s
Paul ist
Karls Sohn.
Axiom 4.2.-1: Sätze sind genau dann intensionsgleich, wenn sie analytisch äquivalant sind. Def 4.2.-15: Die Bedingungen, unter welchen ein Satz wahr ist, heißen die Wahrheitsbedingungen des Satzes. Th. 4.2.-1: Sätze sind genau dann intensionsgleich, wenn sie dieselben Wahrheitsbedingungen haben. Damit besteht die Möglichkeit, Intensionsgleichheit durch Feststellen von Wahrheitsbedingungen zu testen. A. Semantische Methoden zur Untersuchung syntaktischer Phänomene Das sind semantische Methoden, die dazu dienen, Formen und Anordnungen sprachlicher Einheiten zu untersuchen. Man könnte sich darum streiten, ob man Untersuchungen, die zur Festlegung des Phonem- oder Morphemsystems führen, hier einordnen soll. Wie sich jedoch in §5.1 bzw. §5.2 zeigen wird, gibt es dafür recht gute Gründe. Ähnliches gilt für sogenannte syntaktische Dependenzen, die die Grundlage für Strukturbäume von Phrasen oder Sätzen bilden und die in §5.3 näher untersucht werden sollen. Wahrscheinlich kann man auch Untersuchungen, die zur Feststellung von Paradigmen von Wörtern führen, hier einordnen. Beispiel:
i c h e s s e , d u i ß t , e r ißt, w i r e s s e n , i h r e ß t , sie essen, ich aß, du aßt etc.
Hier führen Distributionstest nicht zum Ziel, sondern Tests, die Verhältnisse formulieren wie ' i c h esse1
v e r h ä l t sich z u ' d u i ß t ' w i e ' i c h s c h l a f e '
zu 'du schläfst'.
Schreibweise: ich esse : du ißt = ich s c h l a f e : du s c h l ä f s t . Wenn nun zusätzlich aufgrund anderer Untersuchungen bekannt ist, daß ' s c h l a f e 1 , 'schläfst 1 zu einem Paradigma gehört, läßt sich schließen, daß 'esse 1 , 'ißt' auch zu einem Paradigma gehören. B. Semantische Methoden zur Untersuchung semantischer Phänomene
66
Das sind semantische Methoden, die dazu dienen, Extensionen und/oder Intensionen sprachlicher Einheiten oder semantische Beziehungen solcher Einheiten zu untersuchen. Hierzu gehören beispielsweise Frage- und Antwortspiele dieser Art: Was
3. B.
ist
Was ist
? -
ist
y.
ein Mops? - Ein Mops ist
ein S c h o ß h u n d
Dann gehören dazu Paraphrasen üblicher Art wie (1) (l1) (l") (2) (21) (3) (4)
Je c r o i s , que j ' a i vu un homme. J ' a i v u u n horame, j e crois. J'ai vu quelque chose, un homme, je crois Ein Tier mit vier Beinen ist ein T i e r , das vier Beine hat. Ein Tier mit vier Beinen ist ein Vierbeiner. Ein P f e r d mit einem Hörn ist ein E i n h o r n . Ein Mann mit langen Haaren ist ein M a n n , der das Geld für den Friseur spart.
Es gehört aber auch eine Methode dazu, die Corcoran und Keenan "paralogistic technique" nennen (persönliche Kommunikation) . Diese Methode beruht d a r a u f , semantische Eigenschaften mittels Schlußschemata herauszuarbeiten. Beiepi-e 1: (1)
(2)
Hans ist Hans ist
reich klug
Hans ist
reich und klug
jemand ist jemand ist
reich klug
jemand ist
reich und klug
Da (2) kein gültiges Schlußschema ist,
ergibt sich, daß 'Hans 1
und 'jemand 1 sich semantisch verschieden verhalten.
5.
ANALYSEGEBIETE
5.1. Phonologie 5.1.1. Phone und Phoneme Phone und Phoneme sind sprachliche Einheiten, also Invarianten von Äußerungen. Wegen der Endlichkeit des Gedächtnisses von Individuen gibt es in einer natürlichen Sprache nur endlich viele Phone bzw. Phoneme. Phone und Phoneme werden realisiert als akustische Ereignisse und lassen sich deshalb - im Prinzip - durch Angabe akustischer Merkmale klassifizieren. Allerdings ist die akustische Phonetik bis heute nicht in der Lage, relevante von irrelevanten Merkmalen so zu unterscheiden, daß eine Klassifikation von Phonen und Phonemen mit diesen Merkmalen allein möglich wäre. Dagegen ist es möglich, Phone (und Phoneme) zu klassifizieren, indem man sie mit Bewegungen und Positionen von Sprechwerkzeugen korreliert. Diese Korrelation nennt man "Angabe artikulatarischer Merkmale". Es ist möglich, zwischen teilweise gleichen Äußerungen minimale Unterschiede der Artikulation an einer bestimmten Stelle der Äußerungen festzustellen. Ausgehend davon können Phone repräsentiert werden durch Angabe der artikulatorischen Merkmale, die bei allen Äußerungen auftreten, die diese Phone enthalten, und die mindestens bei einer Äußerung fehlen, die diese Phone nicht enthalten. Def 5.1.-1: Phone sind sprachliche Einheiten, die aufgrund minimaler artikulatorischer Unterschiede an bestimmten Stellen teilweise gleicher Äußerungen konstituiert werden. Beispiel: [ k a n t o u n a k a n e j o n ] vs [ k a n t o u n a k a n O j 013 ] . Hier soll nochmals darauf hingewiesen werden, daß bei der
68
Segmentierung in sprachliche Einheiten, insbesondere in Phone, die Willkür des Beobachters eine gewisse Rolle spielt. Diese Willkür kann im späteren Verlauf einer Untersuchung zum Beispiel durch trial-and-error Methoden oder (intuitive) Einfachheitsüberlegungen abgebaut werden. Def
5.1.-2: Phoneme sind sprachliche Einheiten, die aufgrund
minimaler artikulatorischer Unterschiede an bestimmten Stellen teilweise gleicher Äußerungen mit verschiedener Bedeutung konstituiert werden. Beispiel: / i ? t r a : g a d a s k i n t / v s / i p f r a : g a d a s k i n t / Phoneme werden gefunden zum Beispiel durch die Frage an Informanten: "Bedeutet
dasselbe wie y?", wobei
- y/^ ,
wobei p,q Phone sind. Def 5.1.-3: Ein artikulatorisches Merkmal heißt distinktiv, wenn es in einer Repräsentation von Phonen (Phonemen) p durch artikulatorische Merkmale notwendig ist, um p von Phonen (Phonemen) p' zu unterscheiden. Anmerkung: Wenn das Merkmal 'stimmhaft 1 als distinktiv angenommen wird, so ergibt sich, daß 'stimmlos 1 nicht distinktiv ist
und umgekehrt. Es ist
hier gelegentlich übersehen worden,
daß Distinktivitat nur relativ zu einem gegebenen System von Merkmalen definiert werden kann. Die Probleme der Konstituierung von Phonen und Phonemen und ihre Beschreibung durch distinktive Merkmale soll hier nicht weiter vertieft werden, da es hier wenig ungelöste praktische oder theoretische Probleme gibt. 5 . 1 . 2 . Kombinationen von Phonemen Der Einfachheit halber soll hier nur auf Kombinationen von Phonemen eingegangen werden. Im wesentlichen gilt aber mutatis mutandis dasselbe für Phone. Dieser Abschnitt beschäftigt sich vor allem mit Distributionen von Phonemen in Ketten, allerdings in anderer Weise als bei Chomsky und Halle in "The Sound Patterns of English". Zu diesem Zweck habe ich an der SUNY/Buffalo eine statistische Untersuchung am Französischen mit einem Computer durchgeführt, deren Ergebnisse sich in §6.1 finden.
69 Man denke sich ein Phoneminventar einer Sprache gegeben, erweitert um ein Phonem ' P a u s e 1 , das durch / # / symbolisiert sei. Nun lassen sich die Phoneme dieses Inventars nach ihren Distributionen klassifizieren. Def
5.1.-4: Eine Kette von Phonemen (mit Länge l > 1) heißt
initial, wenn sie unmittelbar rechts von /%/ stehen kann, sie heißt final, wenn sie unmittelbar l i n k s von / # / stehen k a n n , heißt medial, wenn sie weder initial noch f i n a l ist,
sie
und sie
heißt neutral, wenn sie sowohl initial als auch f i n a l
ist.
So ergibt sich zum Beispiel für das Französische, daß /n/ f i n a l ist,
während /w/ und / ^ / initial sind. Ebenso ist zum
Beispiel /rbr/
final (vgl. / f t s e t o"enarbrt /) oder auch /rn/
(vgl. / # il£borji#/) . Mit Hilfe statistischer Methoden lassen sich hier jedoch wesentlich differenziertere Aussagen machen. Hierzu ist
ein Corpus in phonemischer Transkription nötig,
das an den entsprechenden Stellen auch / # / enthält. Sofern dieses Corpus für die phonologische Untersuchung repräsentativ ist,
kann die Häufigkeit der einzelnen Phoneme die Wahr-
scheinlichkeit für ihr Auftreten in Äußerungen gesetzt werden. Sei nun a ein Phonem, p (a)
die Wahrscheinlichkeit des A u f -
tretens von a, sei p ( / # / ) die Wahrscheinlichkeit für das A u f treten von / # / . Dann ist die Wahrscheinlichkeit von / /a, p (/ %/a), unter der Voraussetzung der Unabhängigkeit gleich dem Produkt der Einzelwahrscheinlichkeit, also p (£·. /a)
= p (/#/).p (a).
Wenn sich aus den tatsächlichen Verhältnissen im Corpus
er-
gibt, daß P / j , / ( c O < P ( / # / ) · ( ) dann ist ein typisch initiales Phonem, wenn p (/#/) < p (/1/) .p (a) , so ist a ein typisch finales Phonem, wenn , ^ ( ) - p ( / # / ) . p ( ) und P a (/#/0 > ? ( / # / ) · p ( a ) so ist a ein typisch mediales Phonem. Mit der Angabe des Grades der Abweichung von p ( / 4 / ) . p ( a ) läßt sich dies natürlich auch quantitativ erfassen. Beispiel: F r a n z ö s i s c h . Sei a = / ü / . P ( / # / ) - p ( / 2 / ) = 0,0007 p
(/i/)
Damit erweist sich /i/
·= 0 , 0 0 6
als typisch initiales Phonem. Die Be-
deutung der Klassifikation von Def 5 . 1 . - 4 wird sich in §5.2
70
erweisen, wo sie eine wesentliche Rolle bei der Bestimmung von Morph- bzw. Wortgrenzen spielen wird. Statistische Distributionsuntersuchungen doch auch noch für
lassen sich je-
andere Zweck"! verwenden.
So ergibt sich zum Beispiel im Französischen, daß in 9 7 , 8 % aller Fälle /u/ von /i/ gefolgt wird. Das kann zum Anlaß genommen werden, /ui/ zu einem Phonem zu vereinigen, /üy. Ähnliches liegt vor bei /w/: In 8 3 , 2 % aller Fälle ist
/w/ ge-
folgt von /a/ und in 15,O% von /£/. Das Fazit aus diesen Beobachtungen ist,
daß durch stati-
stische Distributionsuntersuchungen auch Revisionen am Phonemsystem motiviert werden können. Interessante Aufschlüsse geben bei Distributionsuntersuchungen auch Korrelationen von Häufigkeit von Phonemketten und den distinktiven Merkmalen von Phonemketten. Hierdurch lassen sich Gesetzmäßigkeiten finden, wie sie von Chomsky und Halle ( a . a . O . ) dargestellt werden. Distributionstests ermöglichen ferner, eine phonologische Typologie von Sprachen. Das sei am Beispiel des Französischen erläutert. Es stehe C für
Konsonant, V für Vokal, S für
Semivokal.
1. Häufigkeit von C,V.,S: Häufigkeit überhaupt
/#/x
x/#/
C
57,4%
63,7%
40,7%
V
39,53%
35,9%
56,7%
S 2. Phonempaare
3,06%
0,4% 2,6%
2.1. Paare mit Semivokalen SV
90% aller Vorkommnisse von S
SC
4% aller Vorkommnisse von S
S/#/
6% aller Vorkommnisse von S
CS
8O,8% aller Vorkommnisse von S
VS
19,O% aller Vorkommnisse von S
/%/S
O , 2 % aller Vorkommnisse von S
2 . 2 . Paare mit Vokalen und Konsonanten 1. W
äußerst selten
2. CV,VC
weitaus größter Teil der Paare
71
3. CC
einige ausgezeichnete Paare
3. Ergebnis: Typische Struktur französischer Phonemketten ist wegen 1. und 2 . 2 . 2 CV, daneben VC, und deswegen auch CVC. Wegen 2 . 2 . 3 CCV3CCVC,CVCC,CCVCC,CCCV
etc., wobei diese Struk-
turen weitaus seltener sind. Wegen 2.1 kommen auch die Strukturen CSV und CVS (vor allem C*/ij/, i7/ej/, C/aj/) vor. Insgesamt läßt sich Französisch als CV-Sprache charakterisieren. ((Genauere Ergebnisse lassen sich erzielen durch Untersuchungen von längeren K e t t e n ) ) . Da statistische Untersuchungen der Linguistik nicht sehr in Mode sind, sei es erlaubt, darauf hinzuweisen, daß sie besonders gut gestatten, typische Strukturen herauszuarbeiten und akzidentelle Fehler ( § 4 . 1 . 4 ) auszuschalten. Es ist
aller-
dings hinzuzufügen, daß uninterpretierte Prozentzahlen überhaupt nichts helfen, sondern, daß es darauf ankommt zu untersuchen, welche Gesetzmäßigkeiten für diese Prozentzahlen verantwortlich sind. Bei der Untersuchung von Phonemketten zeigt sich, daß morphologische Erscheinungen für etliche phonologische Gesetzmäßigkeiten verantwortlich sind. So mag man sich wundern, daß p ( / l a / ) = 1% und p(/pa/) = 0 , 8 % unverhältnismäßig hoch sind solange, bis man sich klarmacht, daß /la/ der Artikel 'la 1 und /pa/ die Negationspartikel 'pas' entspricht, die naturgemäß beide recht häufig auftreten. Die phonologische Untersuchung, die in §6.1 dargestellt ist, sollte wegen ähnlicher Überlegungen ursprünglich dazu dienen, morphologische Fakten in den Griff zu bekommen; die hier dargestellten phonologischen Phänomene entstanden gewissermaßen als Nebenprodukt. 5.2. Morphologie und Lexikographie Gegenstand dieses Abschnitts sind Morphe, Morpheme und Wörter. Bei Bloomfield sind Morpheme minimale Formen und ihre Bedeutungen sind Sememe. Wörter sind minimale freie Formen (vgl. Bloomfield, 1 9 2 6 ) . Phoneme sind nach Bloomfield bedeutungsunterscheidende minimale Formen und Morpheme bedeutungstragende Formen.
72 Diese Definitionen führen dazu, daß man jedem Morphem eine Bedeutung zuordnen muß, und das ist
der erste Punkt, wo man
auf erhebliche Schwierigkeiten stößt. Der zweite Punkt, der Kummer bereitet, ist
der der Angabe geeigneter Methoden zur
Isolierung so definierter Morpheme. In "The Identification of Morphems" versucht Nida, Prinzipien anzugeben, nach welchen Morpheme erkannt und isoliert werden können: "Principle l: Forms w h i c h p o s s e s s a common sem a n t i c d i s t i n c t ! v e n e s s and an i d e n t i c a l f o r m in all t h e i r o c c u r e n c e s c o n s t i t u t e a s i n g l e m o r p h e m e . " "common semantic distinctiveness" wird so erläutert: "To s a y t h a t f o r m s p o s s e s s ' a common s e m a n t i c d i s t i n c t i v e n e s s 1 does n o t m e a n t h a t a l l t h e o c currences of these forms must have an identical m e a n i n g , b u t r a t h e r t h a t they p o s s e s s some s e m a n t i c f e a t u r e i n common w h i c h r e m a i n s c o n s t a n t i n all their meanings and which sets them apart from all other forms in the language."
Die übrigen Prinzipien, die Nida in dem genannten Artikel formuliert, beschäftigen sich mit Morphemalternanten, Synonymen und Homonymen Man betrachte außerdem Prinzip IV von Nida, "Morphology", §2.26: P r i n c i p l e VI: A m o r p h e m e can be i s o l a t e d if it occurs under the following conditions: 1. in i s o l a t i o n , 2. i n m u l t i p l e c o m b i n a t i o n s , i f a t l e a s t o n c e the e l e m e n t with w h i c h it is c o m b i n e d is in isolation or o c c u r s in o t h e r c o m b i n a t i o n s , 3. in a single c o m b i n a t i o n , p r o v i d e d t h a t the e l e m e n t with w h i c h it is c o m b i n e d also o c c u r s in i s o l a t i o n or in o t h e r c o m b i n a t i o n s w i t h n o n unique constituents." Zunächst fällt a u f , daß mit Prinzip l auch Phoneme isoliert werden können, da der Ausdruck "common semantic distinctiveness" auch eine solche Interpretation zuläßt; überdies können alle übrigen sprachlichen Einheiten damit erfaßt werden. Prinzip VI wird auch von größeren Einheiten als Morphemen erfüllt. Daß Nidas Prinzipien vom theoretischen Standpunkt aus nicht besser sind, ist weniger seinem eigenen Unvermögen anzulasten, als vielmehr einem ungeschickten Morphembegriff.
73
In "From Phoneme to Morpheme" versuchte Harris, einen völlig
anderen Weg zur Isolation von Morphemen einzuschlagen. Er
versuchte, eine statistische Eigenschaft von Phonemketten zur Erkennung von Morphemgrenzen auszunützen. Wenn man eine Menge teilweise gleicher Phonemketten untersucht, so stellt man fest, daß nach bestimmten Teilketten bestimmte Anzahlen verschiedener Phoneme folgen können. Wo diese Anzahlen besonders hoch sind - so behauptet Harris - liegen Morphemgrenzen vor. Das Harris"sehe Verfahren sei an folgendem Beispiel veranschaulicht: (1)
/v
o:
14 31
d
i:
15 31
z a
a
n
t
s
a:
l . . ·/
l 31 21 3O 17 14 e t c .
Die Anzahl der möglichen Nachfolger steht unter jedem Phonem Hierzu ist eindeutig ist
zu bemerken, daß das Verfahren alles andere als und deshalb ungeeignet zur Feststellung von Mor-
phemen . Bevor auf ein weiteres statistisches Verfahren eingegangen wird, soll versucht werden, den Begriff des Morphems weiter zu klären. Dazu ist festzuhalten, daß - wie bereits gesehen die strukturalistischen Definitionsversuche inadäquat waren und daß in der Praxis der Sprachanalyse recht vernünftige Einheiten gefunden wurden, wobei allerdings in einigen Fällen Unsicherheit herrschte. Für (1) ergibt die intuitive Analyse nämlich so etwas wie (2)
/vo:di:z antsa:!.../
Es ergibt sich also folgende Liste von Morphemen: (3)
/vo:/ /di:z/ /9/ /an/ /tsa:l/ /an/ /be/
leitet lokalen R e l a t i v s a t z ein verweist auf bereits Erwähntes z e i g t F e m i n i n u m an P r ä f i x mit nicht genau festlegbarer Bedeutung steht f ü r Dinge w i e 1 , 2 , 3 . . . zeigt P l u r a l a n P r ä f i x mit nicht genau festlegbarer Bedeutung
Es fällt a u f , daß die Angabe der Bedeutungen abgesehen von ihrer Vagheit recht heterogen sind. Das liegt daran, daß die entsprechenden Morpheme sich in ihrem Status unterscheiden. Wenn man demnach von der Bedeutung eines Morphems redet, kann man damit eine ganze Reihe völlig verschiedener Dinge meinen.
74
Um das formal in den Griff bekommen zu können, bedient man sich am besten einer Kunstsprache L, wie sie in Def 3. 2. -5 definiert worden ist, und der ebenfalls dort definierten Abbildung / (bzw. / ' ) die Ausdrücke von L in Ausdrücke der natürlichen Sprache abbildet. Da in L verschiedene Kategorien von Zeichen und Ausdrücken verwendet werden, ist
es nur plausibel,
daß dann in der natürlichen Sprache auch verschiedene Kategorien von Morphemen und Phrasen zu unterscheiden sind. Der Vorteil dieses Vorgehens liegt darin, daß Morphemen einer natürlichen Sprache nicht mehr Bedeutungen zugeordnet werden, sondern nur Ausdrücke in der Kunstsprache L, die ihrerseits Extensionen und Intensionen haben mögen, oder aber auch sogenannte
synkategorematische Ausdrücke, d.h. Ausdrücke,
die nur im Kontext anderer Ausdrücke Bedeutung haben. Zur Illustration sei das Vokabular einer einfachen Kunstsprache L
angegeben, die allerdings nur einen kleinen Aus-
schnitt einer natürlichen Sprache beschreiben kann: (4)
1.
Eine Liste von P r ä d i k a t s n a m e n : P11
P1
P1
Eine Liste von Individuenvariablen: x
'
x
o '
x
' · ··
Eine Liste von Individuenkonstanten: a
4. 5. 6. 7.
' a 2' Ein e i n s t e l l i g e r J u n k t o r : n Ein z w e i s t e l l i g e r J u n k t o r : —» Ein e i n s t e l l i g e r O p e r a t o r : V P u n k t u a t i o n s z e i c h e n : ) , ( , , und ,
Nun lassen sich die Werte der Abbildung f angeben: z. B.
-f(-i)
= nixt
(nicht)
f(P^?)
= ro:t
(rot)
f(P^)
= zi:t)
(sieht)
Eine solche Abbildung / läßt sich so definieren, daß jedem Morphem mindestens ein Ausdruck einer Kunstsprache L zugeordnet wird (in Ausnahmefällen mag der leere Ausdruck zugelassen sein) . Das führt zu folgender
75
Def 5.2.-1: Ein Morphem ist
eine minimale sprachliche Einheit,
der ein Ausdruck einer Kunstsprache L entspricht
(vermittels
einer Abbildung / ) . Prinzip V Eine Abbildung / (bzw. / ' ) ist
so zu definieren,
daß jeder Satz vollständig aus Morphemen besteht. Da ferner jeder Satz darstellbar ist Phonemen, ist
als eine Kette von
auch ein Morphem darstellbar als eine Kette von
Phonemen. Def 5. 2. -2: Zwei teilweise gleiche Phonemketten heißen Allomorphe eines Morphems, wenn ihnen derselbe Ausdruck von L zugeordnet wird. Eine Kette von Phonemen, der ein Ausdruck von L zugeordnet werden kann, heißt Morph. Wegen Def 5 . 2 . - 2 nennt man Morphe auch Realisationen von Morphemen. Def
5.2.-3: Morpheme, denen in L Prädikatsnamen oder Indi-
viduenkonstanten entsprechen, heißen Lexeme. Wörter sind Einheiten von etwas folkloristischem Einschlag, die eigentlich nur in der Orthographie eine Rolle spielen und die deshalb hier nicht definiert werden sollen. Da sie relativ oft mit Morphemen übereinstimmen, wird "Wort" sehr oft anstelle von Morphem verwendet. Bloomfields Definition von Wort als minimaler freier Form ist
inadäquat, da nicht alles,
was im Sprachgebrauch als Wort bezeichnet wird, auch tatsächlich frei vorkommt (Man denke an Präpositionen oder dergleichen) . Um den willkürlichen Charakter dessen, was als Wort bezeichnet wird, zu veranschaulichen, seien folgende Beispiele erwähnt: (5) (6a) (6b)
moon l a n d i n g vs. Mondlandung the boy is five years old the five-year-old boy
Nachdem j e t z t diese Begriffe geklärt sind, stellt sich die Frage, wie nun Morpheme ( b z w . Morphe) erkannt und ihre Bedeutungen gefunden werden können. Da Morphe als Phonemketten definiert wurden, ergeben sich bestimmte distributionelle und statistische Eigenschaften, die Phonemketten haben müssen und die zur Erkennung von Morphgrenzen ausgenützt werden können. Einen - unzureichen-
76 den - Ansatz dafür bildet das oben erwähnte Harris 'sehe Verfahren. Neben dem Harris 1 sehen Kriterium gibt es eine Reihe weiterer Kriterien, die in §6.1 angegeben werden. Es muß hier jedoch hinzugefügt werden, daß keine syntaktischen Kriterien gefunden werden können, die hinreichen, die Morphgrenzen in einem gegebenen Satz eindeutig bestimmen. Um Sätze e f f e k t i v in Morphe bzw. Morpheme zu
zerlegen,
bedarf es also semantischer Methoden. Die geläufigste Methode besteht hier in der Übersetzung von einer Menge teilweise gleicher Sätze in die Muttersprache des Beobachters, wobei dort die Morpheme als bekannt vorausgesetzt werden. Mit Vorsicht angewandt ist
diese Methode recht brauchbar
(vgl. Nida,
Wenn nun anstelle der Muttersprache des Beobachters eine Kunstsprache L verwendet wird, ergibt sich ein hier angemessenes Verfahren. Das Hauptproblem besteht j e t z t darin, eine solche Kunstsprache zu finden, die reich genug ist,
alle Mor-
pheme einer natürlichen Sprache in irgendeiner Weise zu repräsentieren. Das Verfahren ist
jedoch selbst dann anwendbar,
wenn nicht alle Morpheme auf L abgebildet werden können. Die restlichen Morpheme lassen sich mit Distributionstests erfassen. Quasi nebenbei liefert eine solche Kunstsprache dann noch ein Format, um semantische Beziehungen zwischen Morphemen mittels analytischer Sätze darzustellen (vgl.
§4.2.3).
Außerdem können die Kategorien der Kunstsprache auf die Morpheme projiziert werden. Mit Hilfe von Distributionstests können nicht erfaßte Morpheme klassifiziert werden und es können Subkategorisierungen vorgenommen werden, (s. dazu § 6 . 2 ) Damit sind gleichzeitig Verfahren zur Erstellung eines brauchbaren Lexikons angegeben worden, und es kann nun übergegangen werden zu Ketten von Morphemen: Phrasen und Sätzen. 5.3. Syntax 5.3.1. Phrasenstruktur von Sätzen Def
5,3.-l: Eine Kette von Morphemen ist
eine Phrase.
In den meisten Sprach theorien werden neben Morphemklassen
77
(traditionell: Wortklassen) auch Klassen von Phrasen betrachtet, zum Beispiel Nominalphrasen, Verbalphrasen, Adverbialphrasen etc. Allerdings werden solche Phrasen oft "funktional" charakterisiert und dann Subjekt, Prädikat, Objekt etc. genannt. Im amerikanischen Strukturalismus ist ein Verfahren entwickelt worden, IC-Analysis, das gestatten soll, spezielle Phrasen zu isolieren und zu klassifizieren. Dieses Verfahren beruht auf Substitutions- und Permutationstests, wobei Phrasen in Sätzen substituiert und permutiert werden. Beispiel: (1) (2) (3) (4) (5) (6) (7) (8)
E l l e avait Elle avait Elle avait ses bras. Elle avait E l l e avait E l l e avait E l l e avait Elle avait
des f o u r m i s d a n s les j a m b e s . entendu rire. e n v i e d e p r e n d r e P i e r r e dans l'air malicieux. l a t £ t e dans s e s m a i n s . le sang ä la t e t e . un d e m i - s o u r i r e c a n d i d e . p r i s s o u d a i n l ' a i r be"te.
( ( Diese Serie stammt aus Sartre, "La chambre")). Diese Serie von Sätzen würde einen (ersten) Schnitt nach 'avait 1 nahelegen. Weitere Schnitte ergeben sich durch Permutationen wie (l1) (l")
Dans les jambes eile avait des f o u r m i s . Avait-elle des fourmis dans les jambes (?)
Das ergibt für Satz (l'")
(1) die
Segmentation:
E l l e / a v a i t / d e s f o u r m i s / dans l e s j a m b e s .
Betrachtet man nun (91 )
E l l e avait p r i s soudain l ' a i r m a l i c i e u x .
und ( 5 ) , so ergibt sich die etwas unorthodoxe Segmentation (9")
Elle / avait / pris soudain / l ' a i r / m a l i cieux .
Daraus ist der Schluß zu ziehen, daß IC-Analyse als rein formales Verfahren nicht praktikabel ist, da dann 1. inuitiv nicht gewünschte Segmentierungen erzeugbar sind; 2. hierarchische Klassifikation - wie sie allgemein üblich sind - damit nicht gewonnen werden können. Traditionell werden unter Punkt 2 angesprochene Hierarchien nach dem auf Aristoteles zurückgehenden Schema Subjekt -
78 Prädikat
(o'vo^oc- gTjjJ«) konstruiert, das sich bedauerlicherweise
bis zu Chomsky konserviert hat. Abweichungen von diesem Schema gibt es in der Linguistik zum Beispiel bei Fillmore (1968) . Die aristotelische Subjekt-Prädikat-Dichotomie stellt sich, da sie mit formalen Mitteln nicht gewonnen werden kann, als semantisch motiviert heraus. Sie basiert auf einer Logik, in der es nur einstellige Prädikate gibt, was vom modernen Standpunkt aus in der Logik indiskutabel wäre, wogegen es in der Linguistik eine schwerabzulegende liebgewonnene Gewohnheit darstellt. Wenn man in der Hierarchie der Redeteile weiter geht, die Begriffe Objekt, Adverbial, Attribut und dergleichen betrachtet, so stellt man fest, daß wegen des aristotelischen Ansatzes eine unzureichende semantische Basis vorhanden ist, um diese Begriffe zu explizieren, was zwangsläufig zu einem Konglomerat von Ad-hoc-Festlegungen geführt hat mit einem Netz von Widersprüchen und Ausnahmeregelungen. Es erübrigt sich nahezu zu sagen, daß hier wieder eine Kunstsprache L als semantische Basis vorgeschlagen wird, wobei das allein selbstverständlich nicht genügt, um unmittelbare Konstituenten vernünftig zu bestimmen. Um dies zu illustrieren, betrachte man nochmals den Satz (I) Elle avait des f o u r m i s dans les j a m b e s . (Zu d e u t s c h : " I h r e B e i n e w a r e n e i n g e s c h l a f e n . " )
zusammen mit dem Satz (1O) E l l e avait des f o u r m i s dans une h o l t e . (Zu d e u t s c h : " S i e h a t t e A m e i s e n i n e i n e r S c h a c h t e l . " )
Für (1) wäre eine Repräsentation in L angebracht wie (II)
2x . Avoir-des-fourmis-dans(elie,x) & Jambe(x) & Avoir(elle,x)
wobei das Tempus hier außer Acht gelassen wurde. Man vergleiche damit eine Repräsentation von (10): (12)
3x ly
. Fourmi(x)' & Boite(y) & Avoir (eile, )
& Dans(x,y)
(11) und (12) mögen noch viele Wünsche offen lassen,gegenüber dem traditionellen Ansatz bedeuten sie jedoch einen riesigen Fortschritt. Wie dem auch sei, es ging hier vor allem
79
darum, zu zeigen, wie verschieden semantische Repräsentationen auf den ersten Blick recht "ähnlicher" Sätze sein können. Entsprechend verschieden sind dann auch die Segmentationen der Sätze (1) und ( 1 O ) : (l"")
Elle /
wobei 'les jambes 1
avait des f o u r m i s dans / 1
les j a m b e s .
noch weiter segmentiert wird in ' l a ' ,
j ambe' und ' P L U R A L ' ;
(loj
Elle /
a v a i t / des f o u r m i s /
dans /
une h o l t e ,
wobei diese Struktur zunächst in zwei Sätze zerfällt: (lOa) (lOb)
Elle avait des fourmis. D e s f o u r m i s e t a i e n t dans u n e b o t t e .
und dann werden 'des fourmis 1 und 'une boite 1 weiter zerlegt wie oben 'les jambes 1 . Die Unterschiede zwischen den Strukturen der Sätze (1) und (1O) verdeutlichen das Problem auch, das darin besteht, Zusammenhänge zwischen semantischen Repräsentationen und Morphkettendarstellungen von Sätzen zu finden - und damit Kriterien für die Segmentierung und Klassifikation von Phrasen zu finden. Beispiele wie das Paar ( 1 ) , ( 1 0 ) machen dabei deutlich, daß semantische Kriterien allein ebensowenig zum Ziel führen wie rein syntaktische. Da in der Praxis der Analyse Segmentierung und Klassifikation nicht voneinander getrennt werden können, wollen wir sie hier ebenfalls zusammen behandeln. Ein rein syntaktisches Kriterium für Klassifikation stützt sich dabei auf Distributionsgleichheit (vgl.: Def 4 . 2 . - 4 ) . Ein solches Kriterium ist
aber
ebensowenig praktikabel wie rein syntaktische Substitutionstests. Es ist notwendig, die syntaktischen Kriterien so durch semantische Kriterien zu ergänzen, daß unsinnige Substitutionen ebenso ausgeschlossen werden wie irrelevante Distributionsunterschiede . Die Entwicklung solcher semantischer Kriterien ist
eine
heikle Angelegenheit. Das soll durch einige Beispiele demonstriert werden. Ersetzt man beispielsweise
'des fourmis 1 aus den Sätzen (1)
und (1O) durch ' L ' a i r malicieux 1 aus Satz ( 5 ) , so erhält man
80 (13) (14)
E l l e a v a i t l ' a i r m a l i c i e u x d a n s les J a m b e s Elle avait l ' a i r malicieux dans une holte.
die beide semantisch nicht wohlgeformt sind. Trotzdem wird man vielleicht 'des fourmis 1 und ' l ' a i r malicieux 1 der Kategorie 'Nominalphrase' zuordnen wollen, nicht jedoch die Phrase 'entendu rire" aus Satz ( 2 ) . Nach einer solchen Argumentation wäre es dann nicht relevant, daß ( 1 3 ) , ( 1 4 ) nicht akzeptabel sind, wohl aber, daß (15)
Elle avait entendu rire dans les j a m b e s .
nicht akzeptabel ist. (16)
Mehr noch,
Elle avait e n t e n d u rire dans une boite.
(z. d t . : Sie hatte in einem Nachtlokal g e h ö r t , daß gelacht wurde).
ist völlig akzeptabel, beeinflußt aber nicht die Entscheidung, 'entendu rire 1 nicht in dieselbe Kategorie einzuordnen wie 'des fourmis'. Ähnliches wurde von Harris in "Structural Linguistics" auch bemerkt (vgl. §15.3). Jedoch spricht er nur von "certain conditions", die erfüllt werden müßten, ohne diese näher zu erläutern. Hier kann ein erstes Kriterium formuliert werden mit Hilfe des Begriffs Anwendungsbereich (range of applicability , Corcoran, persönliche Kommunikation). Def 5.3.-1: Der Anwendungsbereich eines Prädikates ist diejenige Menge von Objekten, von denen das Prädikat wahr oder falsch ausgesagt werden kann. Wenn ein Prädikat von einem Objekt ausgesagt wird, das dem Anwendungsbereich dieses Prädikates nicht angehört, so entsteht ein sinnloser Satz. Beispiel:
Der S c h l a f w a n d l e r ist synkategorematisch Der A b s o l u t e i s t g r ü n . E t c .
Kriterium Sl: Substitutionen, die sinnlose Sätze erzeugen, sind unzulässig. Wenn durch eine Substitution ein sinnloser Satz erzeugt wird, so gehören die fraglichen Phrasen verschiedenen (Sub)Kategorien an, es sei denn, es handelt sich um einen singulären Distributionsunterschied. Dabei soll ein solcher Unterschied singular heißen, wenn in der Mehrzahl der Fälle die Kontexte der ersten Phrase auch Kontexte der zweiten Phrase sind. Mit diesem Kriterium läßt sich begründen, warum 'etendu
81
rire 1 und 'des fourmis 1 nicht derselben Kategorie angehören, da trotz der semantischen Wohlgeformtheit des Satzes (16) in der Mehrzahl der Fälle eine Substitution nicht möglich ist. In den Sätzen (13) und (15) liegen die Verhältnisse jedoch etwas anders. Hier entspricht die vorgenommene Substitution den folgenden Ersetzungen: (17) (18)
Ameise Giraffe
denn hier ist
vs. vs.
Aspecht Girschimp anse
'des fourmis 1 kein eigentlicher Bestandteil von
"avait des fourmis d a n s ' . Das führt zur Formulierung von Kriterium S2: Uneigentliche Teile von Sätzen dürfen nicht durch andere Phrasen ersetzt werden. Ein eigentlicher Teil eines Satzes ist
ein Teil des Satzes, dem in einer semantischen Re-
präsentation dieses Satzes keine Einheit der verwendeten Kunstsprache entspricht. Es soll hier nicht versucht werden, alle Kriterien anzugeben,
die bei der Segmentation und Klassifikation von Sätzen
benötigt werden, da das wohl eine eigene Untersuchung wert wäre, die dann den Rahmen dieser Arbeit sprengen würde. 5 . 3 . 2 . Semantische Beziehungen zwischen Sätzen Während sich der vorige Abschnitt mit den Elementen beschäftigt hat, aus denen Sätze bestehen und deren semantische Repräsentation, wird dieser Abschnitt sich mit Beziehungen zwischen Sätzen wie "Paraphrase" und Folgerung auseinandersetzen. Mit Hilfe des analytischen Folgerungsbegriffs
(Def 4 . 2 . - 1 4 )
läßt sich eine Beziehung zwischen Folgen teilweiser gleicher Sätze feststellen, die hier mit einem Beispiel illustriert werden soll: (1)
a. b. c. d. e.
Meine Tante kommt zu B e s u c h . Deine Tante kommt zu Besuch. D i e Tante k o m m t z u B e s u c h . S i e kommt z u B e s u c h . Jemand kommt zu Besuch.
Man stellt leicht fest, daß gilt ( a v b )
·*
A
c
->· d A
·* e A
Nun heiße c eine Generalisierung von a b z w . b, und a heiße eine Spezialisierung von c bzw. d bzw. e. b , c , d , e heiße eine Generalisations folge, e , d , c , b heiße eine Spezialisations folge.
82
Von a und b werde gesagt, sie besitzen eine gemeinsame Generalisie rung (nämlich zum Beispiel c) Es ist nun möglich, Sätze daraufhin zu untersuchen, ob zwischen ihnen semantische Beziehungen dieser Art bestehen. Man betrachte nun den Satz (2)
J e m a n d kommt z u B e s u c h , u n d d a s deine T a n t e .
ist
Satz (2) stellt offenbar eine Paraphase (Def 4.2.-11) von Satz (Ib) dar. Das Bemerkenswerte daran ist, daß Satz (2) Satz (le) als Teil enthält, der eine Generalisation von Satz ( I b ) darstellt. Das erlaubt Rückschlüsse darauf, daß - zumindest bestimmte Arten von - Paraphrasen systematisch gefunden werden können. Weitere Beispiele bilden folgende Sätze: (3) (4) (5)
Z u B e s u c h kommt d e i n e T a n t e E s i s t deine T a n t e , d i e z u B e s u c h k o m m t . E s kommt d e i n e T a n t e z u B e s u c h .
Hier ist zu bemerken, daß aufgrund eines anderen Verständnisses des Begriffs Paraphrase solche Sätze oft nicht als Paraphrasen zugelassen worden sind, da sie sich in "Nuancen" unterscheiden. Diese Unterschiede sind nach meiner Auffassung pragmatischer Natur und gehen deshalb in eine semantische Beschreibung nicht ein. Da "Paraphrase" hier als semantischer Begriff definiert worden ist, ist es auch zulässig, ( 3 ) , ( 4 ) und (5) als Paraphrasen von (Ib) zu bezeichnen. Was ist nun der Nutzen, den man für die Sprachanalyse aus der Untersuchung von Paraphrasebeziehungen ziehen kann? Auf dem Gebiet der Syntax (im traditionell linguistischen Sinn) liegt er vor allem darin, semantisch komplexe Sätze gewissermaßen zu "entwirren" und zu Normalformen oder kanonischen Formen von Sätzen zu kommen, die leicht in die Sprache der semantischen Repräsentation, L, übertragen werden können. Implizit wurde davon im vorigen Abschnitt bereits Gebrauch gemacht. Ein solches Verfahren ist in der formalen Logik von jeher üblich - allerdings wird es meist nur intuitiv angewendet. Es ist hinzuzufügen, daß in der generativen Transformationsgrammatik von Chomsky Paraphrasebeziehungen oftmals
83
zur Rechtfertigung von Transformationsregeln herangezogen werden. Gerade hier erwies es sich in der TG-Schule aber als besonders nachteilig, keine klare semantische Theorie zu haben, denn es entbrannten letzten Endes müßige Kontroversen über korrekte "Tiefenstrukturen", die im Rahmen der angenommenen Theorie nicht eindeutig geklärt werden konnten. Aber auch in der Logik wirkte sich die rein intuitive Übersetzungsweise als verhängnisvoll aus. Man denke an das folgende überstrapazierte Beispiel: (6)
Ein Hund bellt.
(6)
ist paraphrasierbar als
(7) (8) (9)
Alle Hunde bellen. Alle Hunde können bellen. Alle Hunde, sofern sie gesund sind, können bellen.
Daß jemand, der (6) sagt, oft
(9) meint, ist
Logikern lange
Zeit offenbar schwer verständlich gewesen. Es ergibt sich damit also folgende semantische Repräsentation: (10)
Vx .
(Hund(x)
& G e s u n d ( x ) } ->-
Bellt(x).
5 . 3 . 3 . L als dreiwertige Logik Zum Abschluß des Abschnitts über die Lehre vom Satz noch einige Bemerkungen zu einer dreiwertigen Logik als Sprache für semantische Repräsentationen, da eine solche Logik im Zusammenhang mit Präsuppositionen zum Beispiel von Keenan diskutiert wird (vgl. "A Presuppositional Logic for Natural Languages"). In einer dreiwertigen Logik L Wahrheitswerten 'wahr' und 'falsch
gibt es neben den üblichen 1
noch einen dritten, für
den zunächst natürlich verschiedene Interpretationen möglich sind. Keenan nennt ihn 'sinnlos 1 und bezeichnet ihn mit ' z 1 . Das wollen wir im folgenden übernehmen. Nun ergeben sich aber einige Probleme, die in einer zweiwertigen Logik nicht auftreten: 1. Es sind zwei Definitionen (a) Ein Satz ist
für "Tautologie" möglich:
eine strikte Tautologie, wenn er
unter allen Interpretationen wahr (b) Ein Satz ist
ist.
eine sahwaahe Tautologie, wenn
er unter allen Interpretationen entweder wahr
84 oder sinnlos ist. 2. Noch verwirrender ist das Bild bei Begriff der logischen Folgerung; doch halten wir uns hier an die übliche Definition für die zweiwertige Logik. 4 3. In einer zweiwertigen Logik gibt es 2 = 1 6 zweistellige 3 9 Wahrheitsfunktionen, in L sind es 3 = 19683, von denen vermutlich nur ein kleiner Teil interessant ist. Das Problem liegt hier darin, geeignete Interpretationen der Wahrheitsfunktionen zu finden und die Zusammenhänge zwischen ihnen darzustellen. Greifen wir aus diesen Wahrheitsfunktionen einige heraus und geben wir ihren Wahrheitswerteverlauf an: p q
-^p
f
W
W
W
f
W
z
f
f
W
f f f z z W z f z z
-^q
f
s2
-^
-> 2 -
&
2 -
V
2
~~"2P
f
~'2q §
f
W
W
W
W
W
W
W
W
W
f
f
f
W
W
z
z
W
f
z
W
f
z
f
f f
z
f f
f W
W
W
W
W
W
W
W
W
W
W
W
W
z
W
W
W
f
z
z
W
z z z z
f
z z z
z z z
f f
f f
f
W
f
f
W W W
f
f f f f z f z z z
f
f f
z z z z
f
W
f f
f f
W
f
W
f
W
W
W
W
W
z z W
z z z z z
- , wird dabei durch 'nicht' wiedergegeben, - 2 durch 'es ist nicht der Fall, daß' Beispiel:
Es ist n i c h t der F a l l , daß der M a i k ä f e r e i n e Primzahl ist.
§ steht für 'präsupponiert' Die übrigen Wahrheitsfunktionen sind so definiert, daß sie für den Fall, daß nur die üblichen zwei Wahrheitswerte betrachtet werden, sie die üblichen Bedeutngen von - · , = , - > · , &, v haben. Es ergeben sich folgende schwache Tautologien: (p § q) &_ (-. JP § q) , (p § q) =! (-· jF § q) . Eine strikte Tautologie ist (p § q) = 2 (—^P § q) d.h. p präsupponiert q genau dann, wenn nicht p q präsupponiert, Nun läßt sich ein semantischer Unterschied zwischen folgenden beiden Sätzen herausarbeiten:
85 (1) (2)
Deine Tante kommt zu Besuch. D u h a s t e i n e T a n t e , u n d d i e kommt z u B e s u c h .
Die semantische Repräsentation von (l) in L (3)
3x . K o m m t - z u - B e s uch ( x ) Tante(x)).
ist
§ ( H a t ( d u , x ) Ji
Entsprechend: (4)
3x . H a t ( d u , x ) &^ T a n t e ( x ) ^ K o m m t - z u - B e such (x) .
Obwohl offensichtlich mit L
eine bessere semantische Be-
schreibung für diese Sätze möglich ist, ist es sehr sorgfältig zu überlegen, ob wegen der Komplexität von L es nützlich sein kann, eine solche Logik zu verwenden. Eine Alternative zu einer dreiwertigen Logik kann möglicherweise eine entsprechende Pragmatik darstellen, jedoch herrscht hierüber noch weitgehend Unklarheit. 5.4. Texte und Kontexte Aus dem noch nicht sehr fortgeschrittenen Gebiet der Textlinguistik soll hier nur eine Erscheinung herausgegriffen werden/ und zwar die der Referenzbeziehungen zwischen Sätzen in einem Text. Wie viele Phänomene, die an Texten beobachtet werden, ist dieses eigentlich ein pragmatisch zu behandelndes. Es ist jedoch möglich, dieses Phänomen auch mit semantischen Mitteln zu beschreiben. Die geläufigsten Referenzbeziehungen, die hier in Frage kommen, manifestieren sich durch definite und indefinite Artikel, Pronomina und/oder bestimmte Flexionsaffixe. Wenn von einem Objekt in einem Text zum ersten Mal die Rede ist, so muß dieses Objekt für den Angesprochenen gekennzeichnet werden, daß er es identifizieren kann. Inwieweit eine solche Kennzeichnung notwendig ist, hängt vom Angesprochenen und der besonderen Sprechsituation ab. Damit ist klar, daß das Phänomen prinzipiell pragmatisch zu beschreiben ist. Da jedoch auch in der formalen Logik Kennzeichungen formuliert werden, ist es möglich, Kennzeichnungen wenigstens in speziellen Fällen nur mit semantischen Mitteln zu beschreiben. Erläutern wir das zunächst an einem Beispiel:
86 (1) (2)
Hans sieht einen Mann. Hans sieht den Mann.
Traditionell werden diese Sätze so repräsentiert: (3) (4)
3x . M a n n ( x ) & S i e h t ( h a n s , x ) Sieht (hans ,-jx M a n n ( x ) )
Beide Repräsentationen sind inadäquat: (3) ist selbst dann wahr, wenn Hans mehrere Männer sieht und (4) ist falsch, wenn es mehr als einen Mann gibt. Diese Überlegungen führen dazu, sowohl (1) als auch (2) durch (5) Ix . M a n n ( x ) & S i e h t ( h a n s , x ) zu repräsentieren, was äquivalant ist zu 3x. M a n n ( x ) & S i e h t ( h a n s , x ) S i e h t ( h a n s ,y) ^ x = y.
& Vy . M a n n ( y ) &
(Analog: 2x ( P x ) = 3x 3y . Px & Py & x ^ y & Vz . Pz (x = z v y = z) nx ( P x ) = 3x . . .3x . Px & . . . & Px & V i V j ( (0 < i < l n l n & o < j x ± + x.) & Vy . Py ->. 3i
. O < i ^ n & x.
= y)
Ändert man nun (5) zu (51)
Ix . M a n n ( x )
& Sieht(hans,x)
& x =
„ a def
wobei a eine bisher nicht verwendete Individuenkonstante ist, so kann innerhalb des ganzen Textes auf den Mann, den Hans sieht, damit Bezug genommen werden. Zum Beispiel: (6) (7)
Hans sieht einen M a n n . ^ f* ißt iDer M a n n J l x ( M a n n ( x ) & S i e h t ( h a n s , x) & x =
einen A p f e l .
& Ix
b)
.
Ißt(a,x)
& Apfel(x)
& x =
a)
Damit ist ein Format gegeben, in welchem Referenzbeziehungen semantisch beschrieben werden können. Im nächsten Schritt geht es dann darum, Regeln zu finden, die es gestatten, semantische Beschreibungen und Texte einander zuzuordnen. Solche Regeln wollen wir Referenzregeln nennen. Referenzregeln können gefunden werden durch Substitutionen
folgender Art (8)
. e i n e n M a n n .Dieser Hans sieht /Qtt ·/ o t t
„t l.ß
,_ , einen Apfel.
87
Referenzbeziehungen können ziemlich komplex sein: (9) (10) (11)
Die Katze läuft die Straße h i n u n t e r . Ihr Schwanz blutet. Ingo ä r g e r t s i c h ü b e r I r i s . U d o j a g t d a s M ä d c h e n aus der S t a d t . Schwartz k i s s e d a b e a u t i f u l redhead who was wearing a purple m i n i s k i r t . The girl yelled for the police.
( (11) stammt von McCawley) In diesen Sätzen kann die Referenzbeziehung mit Hilfe analytischer Sätze festgestellt werden wie (12a) (12b) (13) (14)
Katzen haben Schwänze. Straßen haben keine Schwänze. Iris ist ein Mädchen. A r e d h e a d in a m i n i s k i r t is a g i r l .
Ähnlich komplizierte Verhältnisse liegen vor in Sätzen wie (15) (16)
L o r e l e y kämmt sich d a s H a a r . Kurt besteigt sein A u t o und k n a l l t die Tür zu.
wo es darauf ankommt zu erkennen, daß es sich um Loreleys Haar bzw. die linke oder rechte Tür von Kurts Auto handelt. Im Deutschen wird gelegentlich eine Regel über die Einführung neuer Gegenstände in Texte formuliert, die besagt, daß zuerst der indefinite Artikel verwendet werden müsse. Diese Regel hat eine Reihe von Ausnahmen, zum Beispiel: (17) (18) (19) (20)
Hans überquert die Straße. Rainer zieht die Konsequenzen. Emma liegt in d e r Sonne. Luise f ä h r t in die S t a d t .
In diesen Sätzen ist es allerdings zweifelhaft, ob die fraglichen Nominalphrasen als eigentliche Bestandteile der Sätze anzusehen sind. Falls dies verneint würde, läge hier gar kein Referenzproblem vor. Das soll hier zum Bereich der Textlinguistik im allgemeinen und der Referenzbeziehungen im besonderen genügen. Eine erschöpfende Behandlung der einschlägigen Probleme war hier ohnehin nicht beabsichtigt, denn es ging wie in den anderen Abschnitten des Kapitels 5 vor allem darum, die Anwendung der Methoden von Kapitel 4 und den Darstellungsrahmen der Kapitel 2 und 3 zu exemplifizieren - nicht ohne gelegentlich neue oder abweichende Ergebnisse anzusprechen.
6.
APPENDIX
6 . 1 . Morph- u n d W o r t g r e n z e n In diesem Abschnitt wird ein Test b e s c h r i e b e n , der in mancher H i n s i c h t n u r e i n P l a n b l i e b . Soweit e r d u r c h g e f ü h r t w u r d e , f a n d er s t a t t an der CDC 6400 der S U N Y / B u f f a l o u n t e r der Anl e i t u n g v o n David G . H a y s . In d i e s e m Test g i n g es d a r u m , M o r p h - b z w . W o r t g r e n z e n auf s t a t i s t i s c h e m Wege z u e r m i t t e l n , m i t H i l f e v o n K r i t e r i e n , d i e um e i n i g e s über d a s H a r r i s ' s c h e h i n a u s g e h e n ( v g l . 5 Ä 2 ) . ( ( A l s Wort w u r d e h i e r e i n e m i n i m a l e F o l g e v o n P h o n e m e n a n g e n o m m e n , die m i n d e s t e n s e i n e n Vokal e n t h ä l t und die sowohl am A n f a n g als auch am Ende von P h r a s e n s t e h e n k a n n ) ) . Die v o l l s t ä n d i g e D u r c h f ü h r u n g scheiterte an den großen Datenmengen, die benötigt worden wären. Der Test h a t f o l g e n d e n A u f b a u : G e g e b e n war ein C o r p u s von P h r a s e n des F r a n z ö s i s c h e n in p h o n e mischer Transkription. Folgende P h o n e m e w u r d e n v e r w e n d e t : i y a e e 9 o o ^ c e u a £ 5