220 67 10MB
German Pages 109 [112] Year 1972
Germanistische Arbeitshefte
6
Herausgegeben von Otmar Werner und Franz Hundsnurscher
Hans Jürgen Heringer
Formale Logik und Grammatik
Max Niemeyer Verlag Tübingen 1972
ISBN 3-484-25005-4 ©
Max Niemeyer Verlag Tübingen 1973 Alle Rechte vorbehalten. Ohne ausdrückliche Genehmigung des Verlages ist es auch nicht gestattet, dieses Buch oder Teile daraus auf photomechanischem Wege [Photokopie, Mikrokopie) zu vervielfältigen.
INHALT
0. 0 0.1 0. 2 0. 3 1.0 1.11 1.12 1.20 1.21 1.22 1.23 1.31 1.32 1.40 1.41 1.42 1.43 1.44 1.45 2.0 2.1 2. 2 2.3 2.4 2.50 2. 51 2. 52 2. 53 3.0 3.11 3.12 3.13
Vorwort . Einleitung D e r Wert f o r m a l e r S p r a c h e n f ü r die Linguistik Methoden d e r Verwendung f o r m a l e r S p r a c h e n O b j e k t s p r a c h e und M e t a s p r a c h e Individuenkonstanten. P r ä d i k a t e Individuenvariablen W a h r h e i t von Sätzen E i n f ü h r u n g d e r J u n k t o r e n und W a h r h e i t s t a b e l l e n F e s t s t e l l u n g des W a h r h e i t s w e r t e s m e h r f a c h e r Satzverknüpfungen Äquivalenzen und Implikationen zwischen S a t z s c h e m a s Quantoren U m f o r m u n g e n von Q u a n t o r e n Mengen und E l e m e n t e Grundbeziehungen z w i s c h e n Mengen O p e r a t i o n e n mit Mengen Relationen E i g e n s c h a f t e n von Relationen Isomorphie Algebraische Strukturen Abbildungen Funktionen. Verknüpfungen Axiomatisiertes System. F o r m a l e s System Turingmaschine. Algorithmus G r a p h e n . Definitionen Anwendung von G r a p h e n in d e r Phonologie Anwendung von Graphen z u r D a r s t e l l u n g von S a t z s t r u k t u r e n Anwendung von Graphen z u r D a r s t e l l u n g von R e g e l s y s t e m e n . . . . F o r m a l e S p r a c h e n ü b e r e i n e m Alphabet K o m b i n a t o r i s c h e S y s t e m e . P r o d u k t i o n . Herleitung Definition e i n e r f o r m a l e n G r a m m a t i k Definition e i n e r k o n t e x t f r e i e n P h r a s e n s t r u k t u r g r a m m a t i k . Restriktionen 3. 14 O p t i m i e r u n g e i n e r G r a m m a t i k 3 . 1 5 Schreibkonventionen f ü r P h r a s e n s t r u k t u r g r a m m a t i k e n 3. 16 V e r h ä l t n i s von G r a m m a t i k und S p r a c h e . Ambiguität
1 1 3 6 7 9 10 10 13 16 19 20 21 23 24 26 28 30 32 32 34 36 38 40 42 43 43 45 45 47 48 49 51 53
VI 3.2 3.30 3.31 3.32 3.41 3.42 3.43 3.44 3.45 3.5 3.51 3.52 3.60 3.61 3.62 3.63 4.1 4.2
Konstitutions systeme 55 E r z e u g u n g s g r a m m a t i k und R e k o g n i t i o n s g r a m m a t i k 59 Kategoriale Grammatik 59 Definition einer kategorialen Grammatik 61 Dependenzgrammatik. Grundlegende Definitionen 62 F o r m a l i s m u s für Dependenzgrammatiken 63 Beispiel einer formalen Dependenzgrammatik. Erzeugung 64 Rekognition 65 Projektivität 66 V e r s t ä r k u n g von P h r a s e n s t r u k t u r g r a m m a t i k e n 68 Definition von T r a n s f o r m a t i o n s r e g e l n 69 Deletion. Substitution. P e r m u t a t i o n 70 Voraussetzungen der Phonemik 72 O p p o s i t i o n e n und K o r r e l a t i o n e n 74 Distributionen 76 Generative Regeln 77 Z u s a m m e n s t e l l u n g w i c h t i g e r F o r m e l n , D e f i n i t i o n e n und R e g e l n . 82 L ö s u n g e n d e r Übungen 88 Literatur 104
0.0
Vorwort
D i e s e s Skript wurde benutzt a l s Teil e i n e r E i n f ü h r u n g in die Linguistik. Seine Notwendigkeit ergibt sich a u s d e r Überlegenheit f o r m a l e r l i n g u i s t i s c h e r T h e o r i e n g e g e n ü b e r a n d e r e n . Seine Absicht i s t e s , den L i n g u i s t e n zu b e w a h r e n v o r d e r E s o t e r i k s e i n e r T h e o r i e n , die d u r c h d a s weitgehende U n v e r s t ä n d n i s g e g e n ü b e r f o r m a l e n T h e o r i e n bedingt und v e r s t ä r k t w i r d . D i e s i s t b e s o n d e r s f ü r e i n e S o z i a l w i s s e n s c h a f t eine G e f a h r , da i h r e Wirkung in i h r e r weiten V e r breitung besteht. A u ß e r d e m soll e s andeuten, welche noch ungenutzten Möglichkeiten f o r m a l e B e s c h r e i b u n g s s p r a c h e n in d e r Linguistik bieten und damit A n r e i z zur w e i t e r e n B e s c h ä f t i g u n g mit f o r m a l e n S p r a c h e n geben. J e d e n f a l l s scheint m i r die in w e i t e r e n K r e i s e n bekanntgewordene f o r m a l e G r a m m a t i k in d e r A r t von C h o m s k y n u r ein B e i s p i e l f ü r die Möglichkeiten d e r Verwendung f o r m a l e r S p r a c h e n zu sein. D a s Skript kann nicht a l l e i n a l s E i n f ü h r u n g in die L i n g u i s t i k benutzt w e r d e n , da e s a l s E r g ä n z u n g die Kenntnis u n f o r m a l e r l i n g u i s t i s c h e r T h e o r i e n b r a u c h t . A u t o d i d a k t i s c h wird e s d a r u m auch n u r f ü r den b r a u c h b a r sein, d e r b e r e i t s l i n g u i s t i s c h e T h e o r i e n kennt. E s bleibt a b e r nicht F o r t g e s c h r i t t e n e n v o r b e h a l t e n , s o n d e r n sollte s o f o r t in e i n e r e r s t e n E i n f ü h r u n g mitbenutzt w e r d e n . Denn e s scheint m i r kein g u t e s d i d a k t i s c h e s P r i n z i p d a s j e n i g e zu sein, daß m a n z u e r s t e i n m a l alle ä l t e r e n und w e n i g e r guten T h e o r i e n kennen m ü s s e , u m dann a u c h b e s s e r e , n e u e r e und f o r m a l e T h e o r i e n v e r s t e h e n zu können.
0. 1
Einleitung
Dieses Skript gibt keine zusammenhängende Einführung in die formale Lögik oder in formale Sprachen linguistischer Beschreibungen. Es stellt vielmehr in der losen Form eines Albums einige besonders wichtige Teile formaler Sprachen dar und legt dabei den Hauptwert auf ihre Verwendbarkeit in linguistischen Beschreibungen. Zu diesem Zweck sind meistens empirische Beispiele aus der Linguistik gewählt und als Teil der Darstellung Aufgaben gegeben, in denen die Anwendung dieser Teile formaler Sprachen in linguistischen Beschreibungen geübt wird. Naturgemäß entsteht dadurch eine Mischung allgemeiner und sehr spezieller Teile formaler Sprachen. Zur Vertiefung, zur Beurteilung und Konstruktion anderer Kalküle sollten weitergehende Einführungen in die formale Logik und Automatentheorie benutzt werden, von denen einige im Literaturverzeichnis genannt sind. Die schwierigen sind durch " * " gekennzeichnet. 0.2
Der Wert formaler Sprachen für die Linguistik
Die Linguistik ist eine empirische Wissenschaft. Sie macht empirische Theorien, d. s. strukturierte Mengen von behauptenden Sätzen, über bestehende natürliche Sprachen. Eine Theorie ist nur dann zufriedenstellend, wenn sie nur wahre Sätze enthält. Die Wahrheit oder Falschheit der Sätze kann festgestellt werden durch geeignete Methoden der Überprüfung. Entgegen diesem Gebrauch von Theorie wird Theorie oder theoretisch häufig für Aussagen und Überlegungen über Theorien in unserem Sinn gebraucht. Dafür sollte man Metatheorie und metatheoretisch gebrauchen. Im allgemeinen werden an wissenschaftlichen Theorien folgende Anforderungen ge stellt: (i) Sie sollen widerspruchsfrei (a. konsistent) sein. (ii) Sie sollen angemessen (a. adäquat) sein. (iii) Sie sollen explizit sein. (iv) Sie sollen einfach sein. Die bewertenden Adjektive aus (ii), (iii), (iv) sind wie Komparative zu v e r stehen, weil es keinen absoluten Maßstab gibt, an dem eine Theorie gemessen werden könnte. Denn wir haben keinen unmittelbaren Zugang zu der Welt, von der die Theorien handeln. Dieser Zugang ist immer nur über eine Theor i e möglich. Darum können die Anforderungen ( i i ) - ( i v ) immer nur durch V e r gleich mit anderen Theorien nachgeprüft werden. So erhält man Sätze wie die Theorie T ist einfacher als T , weil... Eine etwas andre Rolle in der
3
Bewertung von Theorien spielt das Adjektiv widerspruchsfrei. Es bezieht sich nicht direkt auf die beschriebenen Sachverhalte, sondern auf die logische Form des Zusammenhangs der theoretischen Sätze. Die Widerspruchsfreiheit kann deshalb ohne direkte Anwendung der theoretischen Sätze festgestellt werden. Widersprüche sind in Theorien zu vermeiden, weil (i) zwei sich widersprechende Sätze nicht beide wahr sein können, so daß die Theorie also mindestens einen unwahren Satz enthalten muß, und weil man (ii) aus einem Widerspruch jeden beliebigen Satz der Beschreibungssprache folgern kann. Die Sätze einer Theorie sind formuliert in einer Sprache, die wir Beschreibungssprache nennen. Je nach ihrem Aufbau wird uns eine Beschreibungssprache die Nachprüfbarkeit von ( i ) - ( i v ) erleichtern und uns damit zu stärkeren Theorien verhelfen. Es hat sich gezeigt, daß Beschreibungssprachen, die nach bestimmten Prinzipien konstruiert sind, z . B . denen der formalen Logik, besonders starke Theorien ermöglichen. Darum ist es auch für die Linguistik wichtig, ihre Theorien in formalen Beschreibungssprachen zu formulieren, die sie übersichtlicher und leichter nachprüfbar machen. Logik und Mathematik sind für die Linguistik in zweifacher Weise von Bedeutung geworden: (i) als eine Art Universalsprache, mit deT man natürliche Sprachen beschreibt, indem man deren Sätze in logische übersetzt, (ii) als Vorbild für Aufbau und Entwicklung linguistischer Theorien und Beschreibungssprachen. Wenn man nur den ersten Aspekt beachtet, führt das zu sehr verkürzten linguistischen Theorien, da in ihnen die Logik als eine vorgegebene, allgemeingültige Universalsprache für linguistische Beschreibungen angenommen wird. Eine solche Beschränkung ist aber für die Linguistik besonders dubios, da man die Logik als eine von den natürlichen Sprachen, d.h. den Objekten der Linguistik, abgeleitete Sprache ansehen kann. Daraus entspringt einerseits die Möglichkeit eines unangenehmen Zirkels der A r t , daß der Maßstab, den man mit einer logischen Beschreibungssprache an natürliche Sprachen anlegt, letztlich durch diese Sprachen gegeben ist. Andrerseits wird fraglich, wie eine solche Logik als verkürzte natürliche Sprache überhaupt genügen kann, um natürliche Sprachen zu beschreiben. Ein Beispiel hierfür wäre der V e r such, in die linguistische Theorie den Terminus Eigenname einzuführen, indem man ihn anwendet auf genau alle sprachlichen Einheiten, die in logische Eigennamen übersetzbar sind. Da ein logischer Eigenname definiert ist als Ausdruck, der genau ein Objekt bezeichnet, wäre z . B . Sonne ein Eigenname nach dieser Theorie. Obwohl ein solches Verfahren durchaus hilfreich sein kann zur E r mittlung sprachlicher Zusammenhänge, kann seine alleinige Verwendung wichtige sprachliche Zusammenhänge verdecken, etwa daß sich Sonne syntaktisch anders verhält als Paris, Anna, die in.der Logik auch als Eigennamen angesehen werden. Dagegen zeigt die Auffassung der Logik als einer bestimmten Sprache oder mehrerer logischer Sprachen deutlich, daß die Linguistik auch die Logik zu ihrem Objekt haben müßte oder wenigstens - wenn man hier eine irgendwie begründete Trennung der Objektbereiche einführen will -
4
aus dem Aufbau und der Entwicklung der logischen Sprachen Erkenntnisse für ihr eigenes Verfahren schöpfen könnte. Wir wären dann in der günstigen Lage, daß die Linguistik auch ihre eigene Beschreibungssprache kritisch reflektieren könnte. Im folgenden wird der Hauptwert gelegt auf die Verwendung logischer Sprachen zur Konstruktion von Beschreibungssprachen, die für die Linguistik im Sinn von (ii) brauchbar sind. Da über die Konstruktion solcher Sprachen Rechenschaft abgelegt wird, e r reicht dieses Verfahren einen höheren Reflexionsstand und eine bessere Einsicht in die Relativität von Theorien, als die selbstverständliche Verwendung einer nicht hintergehbaren Umgangssprache. 0.3
Methoden der Verwendung formaler Sprachen
Die bekannteste Art der Verwendung logischer Sprachen in den empirischen Wissenschaften ist die Axiomatisierung. Sie besteht darin, daß man von einer endlichen Anzahl von grundlegenden Sätzen, sog. Axiomen, ausgeht, aus denen man aufgrund logischer Schlußregeln alle übrigen Sätze der Theorie herleiten (a. deduzieren) kann. Eine solche Theorie hat den Vorteil, daß sie unnötiges Beiwerk vermeidet und von jedem anerkannt werden muß, der die Axiome und die Schlußregeln anerkennt. Außerdem hängen die Sätze einer solchen Theorie streng zusammen. E s ist darauf hinzuweisen, daß axiomatisierte Theorien entgegen einer weitverbreiteten Ansicht sehr wohl empirisch sein können. Genauer besteht eine axiomatisierte Theorie aus drei Komponenten: (i) Syntaktische Regeln (für alle möglichen Sätze), (ii) Axiome, (iii) Deduktionsregeln. Die syntaktischen Regeln definieren die Beschreibungssprache, in der die Sätze der Theorie formuliert werden können. Da eine Theorie eine Untermenge der Sätze dieser Sprache ist, nämlich die der wahren Sätze, muß diese Menge aus der Menge der möglichen Sätze charakterisiert werden. Das geschieht mittels der (wahren) Axiome und den Deduktionsregeln. Da verschiedene Theorien auch verschiedene syntaktische und deduktive Mittel brauchen können, erweist es sich als sinnvoll, die Mittel unabhängig von den Theorien zu untersuchen, wie e s in der Logik geschieht. Daraus ergibt sich auch ihr Sinn für empirische Theorien. Eine andere Art der Verwendung formaler Sprachen ist die in Modellen. Sie geht etwa so vor sich: Gegeben sei eine formalisierte oder axiomatisierte Theorie T^ über einen beliebigen Objektbereich und eine nicht-formale Theorie T2 über den Objektbereich der Untersuchung. Nun bemerkt man einige strukturelle Ähnlichkeiten zwischen T j und T2 und versucht deshalb, die gesamte F o r m von T i auf T2 zu übertragen, indem man das R e lationennetz, das T j zwischen den Objekten postuliert, überträgt auf die Objekte von T2. F a l l s diese Übertragung möglich ist, sagt man, die beiden Theorien seien isomorph (zu einer präzisen Definition der Isomorphie s. 1.45 und 2.1) und T j sei ein Modell für T2. Ein Beispiel für ein Modell ist die axiomatisierte, klassische Theorie der Planetenbewegungen als Modell für die Bohr-Rutherfordsche Atomtheorie.
5
Die Idee des Modells ist heuristisch wichtig, weil sie der Erforschung von Objektbereichen eine Richtung geben kann, u.U. aber auch eine schlechte. Eine solche Verwendung von formalen Sprachen kann nicht alle unsre Wünsche erfüllen, da sie im unklaren läßt, wie denn T^ entwickelt wurde. Offenbar doch nicht auf die gleiche Weise wie . Außerdem ist nicht klar, wie das Verfahren zur Änderung der Struktur von Theorien führen kann: denn entweder ist die Übertragung möglich oder nicht. Wo sie nicht möglich ist, endet aber die Modellfunktion. Hier muß ein anderes Verfahren benutzt werden. Außerdem ist fraglich, wie die Isomorphie festgestellt werden soll, wenn Tg gar nicht so weit entwickelt ist, daß es möglich ist. Und falls Tg so weit entwickelt ist, daß es möglich ist, dann ist diese Feststellung in gewissem Sinne überflüssig, da sie an Tg nichts ändert. Eine dritte Art der Verwendung von formalen Sprachen ist die, daß man einen Formalismus aus uninterpretierten Zeichen konstruiert, der nur eine bestimmte Kombination dieser Zeichen zuläßt. Nachdem man die Widerspruchsfreiheit dieses Systems bewiesen hat, gibt man Zuordnungsregeln an, die den Zeichen des Formalismus bestimmte Objekte aus dem Objektbereich zuordnen. Man nennt dies eine Interpretation des Formalismus. Sind die Interpretationen der Sätze wahr, dann sagt man auch, der Objektbereich sei ein Modell f ü r den interpretierten Formalismus. Hierbei wird Modell also in einem andern Sinn v e r wendet, der in der sog. Modelltheorie sehr weitgehend formalisiert ist. Strenggenommen würde auch dieses Vorgehen voraussetzen, daß die Objekte schon beschrieben sind, denn sie sind uns ja nicht anders als in einer Theorie zugänglich. Falls es eineindeutige Zuordnungsregeln gibt, läuft dies dann auch nur auf die Feststellung der Isomorphie hinaus. Um diese Schwierigkeiten zu vermeiden, könnte man das Verfahren so modif i z i e r e n , daß man nicht mit der Interpretation aufhört, sondern sie benutzt zum Vergleich mit andern Theorien, um so festzustellen, welche besser ist. Ist unsere formale Theorie noch unzureichend, so werden wir unseren F o r malismus verändern, und zwar nicht i m luftleeren Raum, sondern i m Hinblick auf den Zweck und die Beschreibungsstärke der Theorie. In der Linguistik wird danach etwa folgendermaßen verfahren: Nehmen wir an, wir wollen M j , die Menge der Sätze einer Sprache, beschreiben und diese Sätze seien uns bekannt. Dann konstruieren wir einen Formalismus, der nach der Interpretation eine Menge M 2 von Sätzen erzeugt (beschreibt). Es sind jetzt zwei Fälle denkbar: (i)
A l l e Sätze aus Mj^ sind neben andern auch in Mg (also M^ciy^), dann muß der Formalismus restringiert werden. (ii) A l l e Sätze aus M2 sind neben andern auch in M^ (also M g C M j ) , dann muß der Formalismus erweitert werden. In der Regel wird (i) und (ii) der Fall sein, so daß eine Approximation von M i und Mg versucht wird durch Veränderung des Formalismus in beiden Richtungen. Dabei kann auch der Fall eintreten, daß die benützte Sprache keinen Formalismus erlaubt, mit dem wir unser Ziel M, = M , erreichen. Dann werden wir
6
unsere Beschreibungssprache ändern. Eine solche linguistische B e s c h r e i bung ist deshalb ein ständiger Wechsel zwischen empirischer Beobachtung und Beschreibung und der Reflexion und konstruktiven Veränderung des B e schreibungsinstruments. Man könnte sich denken, daß auf diese Weise auch die logischen Regeln entstanden sind, nach denen wir unsre Beschreibungssprache konstruieren.
1.0
OBJEKTSPRACHE UND METASPRACHE
Man kann heute nicht m e h r davon s p r e c h e n , e s gebe eine a l l g e m e i n v e r b i n d l i c h e L o g i k . V i e l m e h r i s t die Logik eine W i s s e n s c h a f t , die v e r s c h i e d e n e f o r m a l e Sprachen behandelt, die z . T . nicht i n e i n a n d e r ü b e r s e t z b a r sind, weil nicht f ü r alle Sätze d e r einen S p r a c h e Äquivalente in d e r a n d e r e n S p r a che e x i s t i e r e n . Die l o g i s c h e Analyse i s t d a r u m i m w e s e n t l i c h e n s p r a c h l i c h e A n a l y s e . Sie behandelt die F o r m d e r Sätze d e r f o r m a l e n S p r a c h e , s e m a n t i s c h e Z u s a m m e n h ä n g e z w i s c h e n den Sätzen, n a c h denen mein sie u . U . a u s e i n a n d e r h e r l e i t e n kann usw. Z e i c h e n ( W ö r t e r , Sätze u. a . ) k o m m e n in Sätzen, m i t denen w i r ü b e r sie s p r e c h e n , in a n d r e r W e i s e v o r a l s in Sätzen, in denen w i r m i t ihnen über die Welt s p r e c h e n . Im e r s t e n F a l l z i t i e r e n (oder erwähnen) w i r s i e , i m zweiten F a l l g e b r a u c h e n w i r s i e . B e i s p i e l 1 Wenn w i r s a g e n : "Kuh hat d r e i B u c h s t a b e n " , wollen wir damit nicht ü b e r irgendeine Kuh r e d e n , s o n d e r n ü b e r das Zeichen Kuh . Die B e deutung von Kuh ist a l s o ein Zeichen. D i e s i s t ein e i g e n a r t i g e r G e b r a u c h von Kuh , da das Zeichen h i e r b e i m S p r e chen a l s Zeichen f ü r sich s e l b s t g e b r a u c h t w i r d . Um solche F ä l l e v o m n o r m a l e n G e b r a u c h zu u n t e r s c h e i d e n , s e t z e n w i r die e r w ä h n t e n Z e i c h e n beim S c h r e i b e n in A n f ü h r u n g s z e i c h e n o d e r w i r u n t e r s t r e i c h e n sie o d e r s c h r e i b e n s i e k u r s i v oder s c h r e i b e n sie a l s B e i s p i e l s ä t z e auf eine e i g e n e Z e i l e . Die S p r a c h e , in d e r m a n ü b e r eine Sprache L r e d e t , nennt m a n M e t a s p r a c h e zu d i e s e r S p r a c h e . Die Bedeutungen d e r Zeichen d e r M e t a s p r a c h e sind d e m nach die Zeichen d e r S p r a c h e L . D a r u m können w i r d u r c h U n t e r s t r e i c h u n g o d e r d e r e n Äquivalente ein Zeichen in die M e t a s p r a c h e e r h e b e n . D e r z i t i e r t e Satz in B e i s p i e l 1 i s t ein Satz e i n e r M e t a s p r a c h e zum D e u t s c h e n . Da m a n auch ü b e r die M e t a s p r a c h e w i e d e r r e d e n kann, gibt e s auch M e t a s p r a c h e n zu d i e s e r M e t a s p r a c h e . Man nennt sie auch M e t a m e t a s p r a c h e n . Da f ü r d i e s e das gleiche z u t r i f f t , i s t e s e i n f a c h e r , die S p r a c h e n in v e r s c h i e d e n e Stufen zu o r d n e n . W i r u n t e r s c h e i d e n a l s o S p r a c h e n , m i t denen w i r ü b e r Gegens t ä n d e r e d e n , sog. O b j e k t s p r a c h e n , von M e t a s p r a c h e n e r s t e r Stufe, z w e i t e r Stufe u s w . W i r h a b e n g e s e h e n , daß d e r z i t i e r t e Satz a u s B e i s p i e l 1 ein Satz d e r Metas p r a c h e i s t , a b e r zugleich dennoch ein Satz des D e u t s c h e n , obwohl Deutsch a u c h die behandelte O b j e k t s p r a c h e i s t . Das i s t v o r a l l e m d e s h a l b möglich, w e i l in n a t ü r l i c h e n Sprachen Objekt- und m e t a s p r a c h l i c h e E l e m e n t e enthalten sind. E i n B e i s p i e l h i e r f ü r i s t d a s dt. Wort, d a s z u r M e t a s p r a c h e g e h ö r t .
8 D e s h a l b i s t i n s o l c h e n S p r a c h e n a u c h n u r s c h w e r e i n e G r e n z e zu z i e h e n z w i s c h e n o b j e k t - u n d m e t a s p r a c h l i c h e m G e b r a u c h . In l o g i s c h e n S p r a c h e n b e m ü h t m a n sich d a g e g e n u m eine s t r e n g e Trennung, weil die Nichtbeachtung d e s U n t e r s c h i e d s zu I n k o n s i s t e n z e n f ü h r t . W i l l m a n z . B . S ä t z e a u s e i n a n d e r h e r leiten und dabei nur i h r e F o r m berücksichtigen, dann kann m a n , falls m a n die U n t e r s t r e i c h u n g nicht berücksichtigt, aus (1) Lena i s t k u r z . (2) L e n a i s t K a r l s S c h w e s t e r , den Satz h e r l e i t e n (3) K a r l s S c h w e s t e r i s t k u r z . d e r u n t e r g a n z a n d e r n B e d i n g u n g e n w a h r i s t a l s (1). Übungen 1 K e n n z e i c h n e n Sie i n d e n f o l g e n d e n S ä t z e n d u r c h U n t e r s t r e i c h u n g d i e m e t a s p r a c h l i c h e S t u f e , s o d a ß d i e S ä t z e l o g i s c h w o h l g e b i l d e t und a k z e p t a b l e Ü b e r setzungen d e r u m g a n g s s p r a c h l i c h e n Sätze sind: (4) H a u s w i r d f l e k t i e r t w i e K i n d . (5) A r b o r b e d e u t e t d a s g l e i c h e w i e B a u m . (6) D i e S o n n e i s t g r ö ß e r a l s d e r M o n d . (7) S i n g e n w u r d e v o r h i n z i t i e r t . (8) K l a u s i s t e i n s i l b i g . 2 In G r a m m a t i k e n k ö n n e n S i e e t w a f o l g e n d e S ä t z e f i n d e n : (i) Das Subjekt ist Teil eines Satzes. (ii) D a s Subjekt e i n e s S a t z e s nennt d a s Ding o d e r W e s e n , von d e m e t w a s ausgesagt wird. (iii) D a s S u b j e k t w i r d in v i e l e n F ä l l e n zu d e m v o n d e r A u s s a g e u n m i t t e l b a r b e t r o f f e n e n Ding o d e r W e s e n i m Satz. a Z e i g e n Sie a n f o l g e n d e m B e i s p i e l , w i e m a n a u f g r u n d v o n ( i ) - ( i i i ) zu W i d e r s p r ü c h e n oder m i n d e s t e n s komischen Konsequenzen kommen kann: (9) D i e K a s s e s t i m m t . b W a s w i r d i m f o l g e n d e n S a t z v e r w e c h s e l t , f a l l s m a n a n n i m m t , d a ß (i) w a h r i s t : (iv) D i e K a s s e i s t S u b j e k t v o n (9), d a v o n i h r a u s g e s a g t w i r d , d a ß s i e s t i m m t . W i e k ö n n t e m a n (iv) k o r r e k t f o r m u l i e r e n ? 1.11
Individuenkonstanten.
Prädikate
Wie i n d e n n a t ü r l i c h e n S p r a c h e n i s t a u c h in d e n l o g i s c h e n S p r a c h e n d i e w i c h t i g s t e E i n h e i t d e r S a t z . E i n S a t z i s t in d e r L o g i k d a s , w a s w a h r o d e r f a l s c h sein kann. M a n s a g t a u c h , d e r Satz habe einen W a h r h e i t s w e r t , e n t w e d e r d a s W a h r e ( W ) o d e r d a s F a l s c h e ( F ) . D a s i s t e i n G r u n d d a f ü r , d a ß Satz in d e r L o g i k n i c h t g a n z s y n o n y m i s t m i t Satz in d e r L i n g u i s t i k . D e n n d i e S ä t z e n a t ü r l i c h e r S p r a c h e n k ö n n e n n i c h t a l l e n a c h i h r e r W a h r h e i t b e u r t e i l t w e r d e n . So gibt e s k e i n e n Sinn, b e i e i n e m B e f e h l s s a t z o d e r e i n e m F r a g e s a t z v o n s e i n e r W a h r h e i t zu s p r e c h e n . D i e S ä t z e d e r l o g i s c h e n S p r a c h e n b e s t e h e n a u s T e i l e n , d i e m a n in z w e i A r t e n
9 unterteilt. Die eine A r t sind Namen von Individuen des Objektbereichs, über den man redet. Man nennt diese Namen Individuenkonstanten und verwendet für sie meistens die vorderen Kleinbuchstaben des Alphabets: a, b, c, d, oder diese Buchstaben mit Indexen: a^, a 2 , a y . . . Die andre Art von Teilen logischer Sätze bezeichnen Eigenschaften und Relationen, die von den Individuen ausgesagt werden können. Man nennt sie Prädikate und verwendet für sie normalerweise die Großbuchstaben P, Q, R, ... oder diese Buchstaben mit Indexen: PP2, P3, . . . Ein Satz könnte demnach lauten: P(a), Q(a), P(b). "P(a) M wird gelesen: " P v o n a " . Beispiel 2 Nehmen wir an, a stünde für Doris, b für die Sonne, P für ist rund und Q f ü r ist lieb, dann wäre P(a) eine Übersetzung von Doris ist rund, P(b) v o n Die Sonne
ist rund und Q(a) v o n Doris ist lieb.
Weil die bisher eingeführten Prädikate jeweils nur eine Individuenkonstante fordern, nennen wir sie einstellige Prädikate. Ein Satz mit einem zweistelligen P r ä d i k a t w ä r e R(a,b), der die Ü b e r s e t z u n g v o n Doris ist kleiner als die Sonne
wäre, wenn R die Übersetzung von ist kleiner als wäre. Ein dreistelliges Prädikat wäre r in T(c,a,b) . Es könnte schenkt übersetzen, so daß T(c,a,b) , f a l l s c f ü r Hans stünde, ü b e r s e t z e n würde Hans schenkt Doris die
Sonne.Prä-
dikate, die mehr als eine Individuenkonstante fordern, nennt man auch Relatoren (in manchen logischen Sprachen auch Relationen). Will man von P r ä dikaten allein sprechen und dabei ihre Stellenzahl kennzeichnen, so kann man o
dazu Zahlen als Superskripte benutzen: p bezeichnet dann ein zweistellliges Prädikat. Diese Kennzeichnung ist notwendig, weil die Zahl der notwendigen Individuenkonstanten sonst nur in Sätzen ablesbar wäre. In Sätzen wie P(a) und R(a,b) heißen a und ¿Argumente von P und R. Man schreibt sie gewöhnlich durch Komma getrennt in zwei Rundklammern hinter dem Prädikat, wie wir es bisher getan haben. Bei mehrstelligen Prädikaten unterscheidet man nach der Reihenfolge die erste Argumentstelle, zweite Argument stelle usw. Gewöhnlich ist die Reihenfolge der Argumente bezüglich der Argumentstellen relevant. So wäre R(b,a) in der obigen Interpretation e i n e Ü b e r s e t z u n g v o n die Sonne
ist kleiner
als
Doris.
Übungen 3 Übersetzen Sie die folgenden deutschen Sätze in logische Sätze, indem Sie zuerst den Namen Individuenkonstanten zuordnen und dann den Rest des Satzes als Prädikat ansehen. Geben Sie die Gleichsetzungen an, die Sie vornehmen: (10) Eintracht besiegt Concordia. (11) Klaus erinnert Paul an Klara. (12) Heidelberg liegt zwischen Stuttgart und Mannheim. (13) Haus ist ein Wort. (14) Zwei verhält sich zu vier wie drei zu neun.
10 1.12 Individuenvariablen Neben Individuenkonstanten verwendet man auch Individuenvariable, d. s. nicht Namen für Individuen, sondern Platzhalter, für die man verschiedene Individuenkonstanten einsetzen kann. Sie dienen v o r allem dazu, um in längeren Sätzen gleiche Einsetzungsmöglichkeiten anzuzeigen. Beispiel 3 In R(x,y,x) kann man nacheinander verschiedene Konstanten für x und y einsetzen, man muß aber bei jedem Vorkommen von x immer die gleiche Konstante einsetzen. Also R(a,b,a) oder R(d,c,d) . Dagegen wäre eine Einsetzung R(a,b,c) nicht erlaubt. Die möglichen Einsetzungen für eine Variable kann man auch durch sog. Einsetzungsregeln beschreiben, die folgende F o r m haben können: (15) x/a, d Sie besagt, daß für x a oder d eingesetzt werden kann. Wie aus Beispiel 3 hervorgeht nimmt man zur Bezeichnung der Individuenvariablen die hinteren Kleinbuchstaben des Alphabets. Falls man viele V a r i able braucht, kann man sie auch durch Indexe differenzieren: x^, x 2 , Xy . . . Dabei ist x^ dann eine andre Variable als x^. Die Einsetzungsbedingung besagt nicht, daß man für verschiedene Variablen nicht gleiche Konstanten einsetzen darf. Falls eine solche Bedingung gelten soll, muß sie noch zusätzlich angegeben werden, z . B . durch "x f y " , was sov i e l bedeutet wie x ist verschieden von y. Setzt man in die Argument stellen von Prädikaten Individuenvariable, so erhält man keinen Satz, denn setzen w i r 0 für ist grösser als, so können wir von Q(x,y) nicht sagen, ob er wahr ist oder nicht. Das ginge erst, wenn wir für x die Zahl 3 einsetzten und für y die Zahl 5 . Dann wäre der daraus resultierende Satz falsch. Ein Zeichen, das aus einem Prädikat und Variablen besteht, so daß bei deren E r setzung durch Konstanten ein Satz entsteht, nennt man eine Satzfunktion oder Satzform. Die Individuen, auf die sich eine Variable einer Satzfunktion bezieht,heißen die Werte dieser Variablen. Die Menge der Werte einer Variablen bilden den Bereich eines Prädikats in dieser Argument stelle. So sind beide Bereiche der Relation " + " gewöhnlich die Menge aller Zahlen, nicht aber Menschen, Bälle und dgl. Übungen 4 Übersetzen Sie die folgenden deutschen Sätze in die eingeführte logische Sprache. Verwenden Sie dabei, falls erforderlich, die Anfangsbuchstaben der Prädikate und Individuennamen als Abkürzung, z . B . G(f) für Fritz geht. Geben Sie an, welche Übersetzungen logische Sätze (S) sind, welche Satzfunktionen (Sf): (16) Sie geht weg. (17) P a r i s hat mehr Einwohner als Frankfurt.
11 (18)
2 ist in 8 enthalten.
(19)
J e d e r ist g r ö ß e r a l s B e r n d .
(20)
Anna, B e r t a und Christa sind Schwestern.
5
Geben Sie U n t e r s c h i e d e an z w i s c h e n dem l o g i s c h e n Gebrauch v o n
Prädikat
und d e m linguistischen Gebrauch. 6
Ü b e r s e t z e n Sie in die l o g i s c h e Sprache: (21)
Günter kennt L u t z .
(22)
Günter kennt Günter.
(23)
Günter kennt sich.
Geben Sie die a l l g e m e i n e F o r m d e r Sätze m i t t e l s V a r i a b l e n an. V e r g l e i c h e n Sie mit sog. echten r e f l e x i v e n P r ä d i k a t e n w i e schämt
sich.
N s e i a l s d r e i s t e l l i g e R e l a t i o n d e f i n i e r t , die f ü r das A u f e i n a n d e r f o l g e n
7
v o n d r e i Buchstaben in e i n e r g e s c h r i e b e n e n Kette steht, so daß Einsetzungen in die Satzfunktion N(X1,X2,X3>
nur w a h r e Sätze e r g e b e n , wenn die R e i h e n -
f o l g e xx X2 xg i s t , sonst f a l s c h e . Geben Sie E i n s e t z u n g s r e g e l n f ü r x ^ , y~2' x 3 mit den Buchstaben e , m, s a l s Konstanten, so daß die Einsetzung d i e s e r Buchstaben f ü r die V a r i a b l e n nur w a h r e Sätze e r g i b t , wenn d i e s e m ö g l i c h e Buchstabenkombinationen a m Anfang deutscher W ö r t e r (nicht E i g e n n a m e n ) angeben. 1.20
Wahrheit von Sätzen
W i r haben uns b i s h e r mit dem Aufbau e i n f a c h e r Sätze aus P r ä d i k a t e n und A r g u m e n t e n b e s c h ä f t i g t . Die f o r m a l e B e s c h r e i b u n g d i e s e r l o g i s c h e n T e i l sprache l e i s t e t d e r Prädikatenkalkül. E s ist a b e r in den l o g i s c h e n Sprachen üblich, e i n f a c h e Sätze mit S a t z f o r m e n zu l ä n g e r e n Sätzen und S a t z f o r m e n zu v e r k n ü p f e n . D e r T e i l d e r L o g i k , d e r solche Verknüpfungen behandelt, heißt allgemein
Aussagenkalkül. I m Aussagenkalkül i n t e r e s s i e r t die L o g i k b e s o n -
d e r s die Abhängigkeit des W a h r h e i t s w e r t e s e i n e r Verknüpfung v o n den W a h r h e i t s w e r t e n i h r e r T e i l e . So w ä r e d e r f o l g e n d e deutsche Satz z . B .
immer
w a h r , ohne daß die Wahrheit o d e r F a l s c h h e i t d e r beiden T e i l s ä t z e ins G e wicht f ä l l t : (24)
B e r t ist g r o ß oder B e r t i s t nicht g r o ß .
Man w i r d s o g a r i m m e r einen w a h r e n Satz b e k o m m e n , wenn man die F o r m v o n (24) und die T e i l e oder und nicht
beibehält und v o r und nach oder den
g l e i c h e n S a t z einfügt. D i e s e A r t v o n Wahrheit nennt man auch l o g i s c h e W a h r h e i t , da sie unabhängig v o n den F a k t e n i s t , und d i e f r ü h e r behandelte A r t v o n Wahrheit faktische W a h r h e i t . Sätze w i e (24) nennt man auch tautologisch und S ä t z e , die i m m e r f a l s c h sind, k o n t r a d i k t o r i s c h . 1.21
Einführung der Junktoren und. W a h r h e i t s t a b e l l e n
F ü r die W ö r t e r , die in natürlichen Sprachen Sätze v e r b i n d e n , w i e z . B . oder in (24) haben w i r auch Pendants in den l o g i s c h e n Sprachen. W i r nennen sie Junktoren. Die w i c h t i g s t e n "A " , "v " , " - » " , " « - * " , " - " entsprechen etwa in i h r e r Bedeutung den deutschen W ö r t e r n und, oder, dann - wenn, nicht. stellig.
wenn - so,
genau
Dabei ist d e r Junktor " - " e i n s t e l l i g , a l l e andern
zwei-
12
W i r verwenden nun für Teilsätze und Satzformen schematische Buchstaben, die als Abkürzungen für ganze einfache Sätze, Satzformen oder für Wahrheitswerte stehen. Dies sind die Kleinbuchstaben p, q, r . . . , die in Satzverknüpfungen bezüglich der Identität wie Individuenvariable behandelt werden. Beispiele für Schemas von Verknüpfungen sind : "p -» q", " - p A q " . Die Junktoren bestimmen eindeutig den Wahrheitswert einer Verknüpfung, f a l l s die Wahrheitswerte der verknüpften Teile bekannt sind, bzw. durch Einsetzungen bestimmt werden. Weil also der Wahrheitswert der Verknüpfung eine Funktion der Wahrheitswerte der Teile ist nennt man die Junktoren auch wahrheitsfunktionale Zeichen. Man kann ihre Bedeutung präzis einführen durch sog. Wahrheitstabellen. In diesen Tabellen werden alle möglichen Kombinationen der Wahrheitswerte der Teile aufgeführt zusammen mit den jeweiligen Wahrheitswerten der Verknüpfung. Für den Junktor " A " gilt folgende Tabelle: p
q w
P A q w
F
F F
w
F F F
w w
F
Die "A "-Verknüpfung, die man als und liest und Konjunktion nennt, ist danach nur dann wahr, wenn beide Teilsätze wahr sind, sonst immer falsch. Das entspricht gut der Bedeutung des deutschen und zwischen Sätzen. Mathematisch gibt es in der Spalte unter dem Verknüpfungsschema 2 4 = 16 mögliche WF-Kombinationen, so daß man auf diese Weise genau 16 Junktoren definieren könnte. Sie sind aber nicht alle gleich wichtig. Insbesondere deshalb nicht, weil man sie teilweise durch Regeln von der Art (41)- (55) in 1.23 aufeinander reduzieren kann und damit die Bedeutung eines Junktors durch zwei andre ausdrücken kann. Darum beschränken wir uns hierauf die Einführung der'fünf oben aufgeführten. Die Wahrheit stabeile für die " v "-Verknüpfung, die man als oder liest und Disjunktion (manchmal auch Alternation oder Adjunktion) nennt, sieht wie folgt aus: P W W F F
q W F W F
p Vq W W W F
Die Disjunktion ist also nur falsch, wenn p und q beide falsch sind. Sie entspricht nicht immer der deutschen'oder-Verknüpfung, weil diese manchmal so gemeint ist wie entweder-oder, daß also die Verknüpfung nur wahr ist, wenn genau einer der verknüpften Sätze wahr ist. Doch kommt auch im Deutschen das nicht ausschließende oder v o r , u. zw. häufiger als gemeinhin angenommen wird. Ein nicht ausschließendes oder liegt vor in:
13
(25) Wer studiert oder wer Zeitung liest, wird klüger. Denn man meint wohl, daß auch einer klüger wird, der beides tut. Daß in vielen oder-Verknüpfungen die WW-Kombination F ergibt und nicht W, braucht man nicht über die Bedeutung des deutschen oder zu erklären, wenn in diesen Fällen die WW-Kombination F wird, weil die Teilsätze p und q entgegengesetzte Bedeutung haben, also nie beide gleichzeitig wahr oder falsch sein können. Das ist der Fall in (26) Benno war der leibliche Vater von Michel oder er war sein Sohn. Die Wahrheitstabelle für "-> " sieht so aus: p
w w
F F
q w
p
q W F W W
F
w F
Diese Verknüpfung nennen wir Konditionalverknüpfung und " - » " das Konditional. Wir lesen "p - » q " als "p P f e i l q " . Damit wird die früher geläufige Bezeichnung Implikation vermieden, die zu Schwierigkeiten führte, weil es in der Logik noch eine andre Art von Implikation gibt. Das Konditional entspricht nicht genau einem deutschen Wort. So wird auch die oben angeführte Entsprechung wenn-so nicht genau wie " -» " gebraucht. Wir würden nämlich bei wenn-so einen (vielleicht kausalen) Zusammenhang zwischen den verknüpften Sätzen postulieren, so daß (27) Wenn es regnet, so ist der Mont Blanc 4800 m hoch, eigenartig klingt. Logisch wäre aber eine solche Verknüpfung korrekt und nur falsch, wenn es regnet und der Mont Blanc wäre nicht 4 800 m hoch. Der vierte der aufgeführten Junktoren "«—»" heißt Bikonditional. E r wird durch folgende Wahrheitstabelle definiert: P W W F F
q w
p
w
F
F F
F
w
w
q
Das Bikonditional entspricht ziemlich gut dem Gebrauch von genau dann - wenn im Deutschen, so daß die Verknüpfung nur wahr ist, wenn p und q den gleichen Wahrheitswert haben. Wir lesen "p «-» q " als "p Doppelpfeil q". Die Wahrheitstabelle f ü r den Junktor " - " , der Negation heißt, ist einfacher, weil er nur ein Argument und damit nur zwei Kombinationen hat: p
-p F
F
w
w
Es hat also " - p " (gelesen "nicht p " ) immer genau den entgegengesetzten Wahrheitswert wie " p " . Das entspricht dem deutschen nicht in den Fällen, wo dieses
14 sich auf Sätze bezieht. Doch kann die Übersetzung in andern Fällen Schwierigkeiten machen. Ein genaueres Pendant zu " - " kann man in es i s t nicht der Fall, dass . . . . sehen. Diese Übersetzung ist ohne weiters anwendbar für (28), sie zeigt aber bei (29), daß nicht hier verschieden bezogen werden kann: (28) Es regnet nicht. (29) F r i t z kommt heute und morgen nicht. In (29) ist nämlich nicht klar, wie weit nicht reicht, ob der Satz heißen soll, daß F r i t z weder heute noch morgen kommt, oder, daß er zwar heute, nicht aber morgen kommt. 1.22 Feststellung des Wahrheitswertes mehrfacher Satzverknüpfungen Die große Zahl möglicher Verknüpfungen entsteht dadurch, daß sie mehrmals hintereinander ausgeführt werden können, so daß Verknüpfungen wieder v e r knüpft werden usw.: "p A q A r A s " . Die Reihenfolge der Verknüpfung wird dabei durch Klammern gekennzeichnet. Es gehören in: (30) (p V q)-* (r A p ) p und q enger zusammen als q und r . Die Bezeichnung der Zusammengehörigkeit ist deshalb wichtig, weil (31) p V ((q-* r) A p ) eine andre Bedeutung hat als (30), obwohl (31) abgesehen von der Klammerung gleich gebaut ist wie (30). Die Bedeutungsverschiedenheit läßt sich feststellen, indem man die Wahrheitswerte der beiden Verknüpfungen ermittelt unter der Annahme, daß p wahr, q falsch und r falsch sei. Man kann das in einem Graphen machen, in dem man diese Wahrheitswerte einträgt und dann nach den definierenden Wahrheitstabellen das Ergebnis der jeweiligen Verknüpfung in der durch die Klammern angegebenen Reihenfolge. Wir erhalten für (30) folgenden Graphen
A l s o wäre (30) unter unserer Annahme falsch. Für (31) erhalten wir bei g l e i cher Belegung den Graphen:
15
(31) w ä r e a l s o unter u n s e r e r Annahme w a h r . M a n kann die K l a m m e r s c h r e i b w e i s e vereinfachen dadurch, daß man Konventionen einführt, welche d e r Junktoren enger binden, d . h . welche der V e r knüpfungen f r ü h e r ausgeführt w e r d e n müssen. W i r wollen annehmen, daß " - " a m engsten bindet,
" A " und " V " enger binden a l s "-> " und " « - » " . Damit
können w i r (30a) statt (30) schreiben und (32a) statt (32): (30a)
p V q
(32)
(( - p ) A q) ( - p -» q )
11 Ü b e r s e t z e n Sie, indem Sie f ü r ist (37)
Teil
von das P r ä d i k a t " T "
verwenden:
Ist a d e r T e i l e i n e s T e i l s v o n b, dann ist a T e i l v o n b.
12 Z e i g e n Sie durch Übersetzung
m i t K l a m m e r u n g , daß man (38) in z w e i e r l e i
W e i s e v e r s t e h e n kann: (38)
Ein W o r t ist durch L ü c k e n von andern getrennt und semantisch s e l b ständig o d e r allein z i t i e r b a r .
13 In d e r L i n g u i s t i k ist e s üblich zu sagen, daß in dt. kaut d e r Laut k I
in p a r a d i g m a t i s c h e r R e l a t i o n (P) steht,
dagegen mit t
mit
in s y n t a g m a t i s c h e r
R e l a t i o n (S) . Eine der D e f i n i t i o n e n von p a r a d i g m a t i s c h und syntagmatisch b e s a g t , daß p a r a d i g m a t i s c h mit d e r Disjunktion und syntagmatisch mit der K o n junktion d e f i n i e r t w e r d e n können. Z e i g e n Sie, (i)
daß ein Satz w i e
steht m i t l in p a r a d i g m a t i s c h e r R e l a t i o n " nicht
ohne w e i t e r e s mit d e r Disjunktion in Verbindung g e b r a c h t w e r d e n kann; (ii)
daß f a l l s eine D e f i n i t i o n d e r Relationen m i t t e l s Junktoren m ö g l i c h
(iii)
daß sich z w e i A u s s a g e n w i e "P(k,l)"
ist, f ü r die P - R e l a t i o n nicht der Junktor " v "
benutzt w e r d e n kann;
und "S(7c,i;" nicht ausschließen.
17
1.23 Äquivalenzen und Implikationen zwischen Satzschemas Mit der in 1.22 beschriebenen Methode der Feststellung der Wahrheitswert-' Verteilung von Verknüpfungen können wir ermitteln, daß manche Schemas die gleiche Verteilung haben. D i e s gilt für (39) und (10): (39) p A p -» q (40) -(p A -q) In diesen Fällen können wir zwischen die beiden Schemas ein Bikonditional schreiben und feststellen, daß die so entstehende Verknüpfung tautologisch ist. Beispiel 4 p q p A p p A p W W W W F w W F F W F F
-q p
A
-q
F W F F
(P A -q)|| (p W F W W
A
p -» q) «-> -(p
w w w w
A
-q)
Man sagt, daß Schemas wie (39) und (40) äquivalent sind. Die Äquivalenz g e stattet e s , in längeren Schemas äquivalente Teile gegeneinander auszutauschen, ohne daß sich der Wahrheitswert des ganzen Schemas verändert. Für die Äquivalenz, die für die logische Wahrheit des Bikonditionals steht, verwenden w i r "«=*". Sie wird in manchen Theorien auch " logische Äquivalenz " genannt, weil dort der Bikonditional mit "Äquivalenz" bezeichnet wird. Die Äquivalenz muß streng unterschieden werden vom Bikonditional. Denn der doppelt g e schwänzte Doppelpfeil gehört zu einer Metasprache zur behandelten logischen Sprache, da e r etwas über die Schemas aussagt, die als seine Argumente stehen. Die Äquivalenz ist zusammen mit der noch einzuführenden Implikation e i n e r der wichtigsten Begriffe der Logik, da sie a l s Grundlage für die logische F o l gerung dienen, die man als nur durch die Gestalt der Zeichenreihen gestattete Umformungen definieren kann. Unter Berücksichtigung der metasprachlichen Stufen schreiben wir die eben ermittelte Äquivalenz formal so:
(41) "p A p - » q " » " - ( p A - q ) " D e r Einfachheit halber läßt man die Anführungszeichen öfter auch weg. Weitere Äquivalenzen sind: (41a) " p -» q" "-(p A -q)" (42)
(43) (44) (45) (46) (47) (48) (49) (50) (51) (52)
"
p
' ' * = > " " P "
"p A q" «=» "q A p'! "p V q" "q V p" "(p A q) A r" "p A (q A r)" « "p Aq A r" "(p V q) V r" "p V (q V r)" «=> "p V q V r" "p V (q A r)" "(p V q) A (p V r)" "p A (q V r)" q) -»- r (p A - q ) •* r (41a), (42) -((p A - q ) A - r ) (41a) -(pA(-qA-r)) (45) -p V -(-q A - r ) (50) -p V q V r (50), (42) Wir benutzen dabei, daß die schematischen Buchstaben " p " und " q " auch für ganze Verknüpfungen stehen können. Denn beim Übergang von der vierten zur fünften Zeile behandeln wir den hinteren Teil der Verknüpfung "(-q A - r ) " als eine Einheit und ersetzen ihn durch eine einzelne Variable, damit wir (50) anwenden können. Nach der Kürzung redundanter T e i l e gemäß (54) und (55) könnten wir dann den Wahrheitswert b e s s e r ablesen als in Verknüpfungen der Ausgangsform. Die Äquivalenzen können auch dann benutzt werden, wenn der Nachweis erbracht werden soll, daß zwei Schemas äquivalent sind. Wir können uns damit die umständliche Methode mit der Tabelle aus 1.22 ersparen. Beispiel 6 Es soll nachgewiesen werden, daß gilt: "p V ( - p -* q ) " "p V q " . Wir führen diesen Beweis durch Umformung nach den Äquivalenzen, p V ( - p -» q) p V ( - ( - p A -q)) (41a) p Vp Vq (50), (42) p Vq (55) Neben den Äquivalenzen gibt es auch schwächere logische Beziehungen zwischen Schemas. Für logische Schlußfolgerungen ist hiervon besonders die Implikation wichtig, die wir definieren durch die logische Wahrheit des Konditionals. Wir schreiben dafür " =s>". Bei Umformungen mit Implikationen darf eine Ersetzung nur in Richtung des P f e i l s durchgeführt werden. Wichtige Implikationen sind:
19
(56) (57) (58) (59)
p"*"p p A q*
Vq "p"
p *-> q • qM r) (p-> q) A (q (60) r)"=> (p >q) A (q (p V q) A - p ' - ^ V (61) Sie sind z . T . bekannte Gesetze, die in logischen Beweisen benutzt werden. (59) und (60) definieren die sog. Transitivität des Konditionals und Bikonditionals, aus der auch die Transitivität der Implikation und Äquivalenz folgt. Beispiel 7 E s s e i zu b e w e i s e n , daß aus Wenn dieses Huhn Subjekt des Satzes S^ ist, bezeichnet dieses Huhn ein Ding, und Wenn dieses Huhn ein Ding bezeichnet, dann ist dieses Huhn ein sprachliches Zeichen, l o g i s c h f o l g t ! Wenn dieses Huhn Subjekt des Satzes S^ ist, dann ist dieses Huhn ein sprachliches Zeichen.
W i r kürzen dazu die Sätze wie folgt ab und schreiben sie untereinander in der F o r m eines Beweises. Die beiden ersten werden dabei als Prämissen, der unter dem waagrechten Strich als Konklusion betrachtet, p -> q q -» r p -» r Dies ist das allgemeine Schema (59) nach dem die obige Folgerung zu beweisen ist. Wie wir bereits bei der Einführung der Satzbuchstaben vorgesehen haben, lassen sich für sie auch ausführliche prädikatenlogische Satzformen einsetzen. Damit werden auch logische Beziehungen faßbar, die auf Bedeutungszusammenhängen der Prädikate und der Junktoren beruhen. Ein Beispiel dafür wäre: (62) Wenn x Vater von y ist, dann ist y Kind von x . , dessen allgemeine Gültigkeit darauf beruht, daß zwischen ist Vater von und ist Kind von ein besonderer semantischer Zusammenhang besteht. Man kann (62) in die logische Sprache übersetzen als (62a) " V ( x , y ) " => " K ( y , x ) " . Sätze wie (62a), die nur aufgrund ihrer Bedeutung wahr oder falsch sind, nennt man auch analytisch wahr oder analytisch falsch. Die Tautologie ist ein Sonderfall der analytischen Wahrheit, der nur für Schemas gilt. Übungen 14 Zeigen Sie durch Umformungen, daß die folgenden Äquivalenzen gültig sind: (63) "p-> -(q A p)" " - p V - q " . (64) "p - q " «=» "(p V q) A (-p V - q ) " . 15 Zeigen Sie durch Umformungen, daß folgende Implikation gültig ist: (65) " - ( p v q ) " = > ' , - p " . 16 Zeigen Sie, daß der folgende Schluß nicht logisch wahr ist, indem Sie das logische Schema des Schlusses analysieren:
20
(66) Ein Monem ist ein sprachliches Zeichen. Haus ist ein sprachliches Zeichen. Haus ist ein M o n e m .
Zeigen Sie auch durch eine Wahrheit stabeile, daß dieser Schluß nicht logisch wahr ist. 1.31
Quantoren
Die allgemeinen Satzformen des Prädikatenkalküls waren nicht nach ihrer Wahrheit beurteilbar, weil sie noch Variablen enthielten, die erst belegt werden mußten, damit die Wahrheit oder Falschheit feststellbar wurde. Wir können nun aber einerseits die Allgemeinheit solcher Satzformen beibehalten und sie dennoch zu Sätzen machen. Wir sagen dann, daß ein Satz für beliebige Individuen wahr oder falsch ist und benutzen dafür das Zeichen " Vx",
d a s m a n a l l g e m e i n ü b e r s e t z t m i t f ü r alle
x gilt
(gilt,
dass..)
und Allquantor (a. Alloperator) nennt. Beispiel 8 Wenn wir ausdrücken wollen, daß für beliebige positive Zahlen 2x größer ist als x, können wir dafür den logischen Satz "vx(2x > x ) " schreiben, in dem " > " für die Relation i s t grösser als verwendet wird. Selbstverständlich können wir für x auch y verwenden, ohne daß sich die Bedeutung ändert, nur müssen wir in längeren Sätzen, wo wir beide Variablen verwenden, die Regeln aus 1.12 beachten. Sätze wie "Vx(2x > x ) " nennt man auch Allsätze. Die Variablen in Satzformen heißen f r e i e Variablen, dagegen die durch einen Quantor gebundenen gebundene Variablen. Allsätze sind in den meisten empirischen Wissenschaften wichtig. Sie sind meistens nicht so zu verstehen, daß für die gebundene Variable alle beliebigen Individuenkonstanten einsetzbar sind. Vielmehr werden die V a r i ablen auf einen bestimmten Individuenbereich (a.universe of discourse) beschränkt, so in Beispiel 8 auf die positiven Zahlen. Für negative wäre der Satz nämlich falsch. Wenn man den gebundenen Variablen eines quantorenlogischen Satzes einen bestimmten Individuenbereich und den,Prädikaten bestimmte Prädikate aus einer natürlichen Sprache (oder Teilmengen aus diesem Individuenbereich) zuordnet, sagt man auch dies sei eine Interpretation und, falls sie wahr ist, ein Modell für den quantorenlogischen Satz. Die Reichweite eines Quantors wird durch Klammern angegeben. So ist " Vx (P(x) -» Q(x)) A R ( x , y ) " eine Satzform, in der das letzte Vorkommen von x nicht durch den Allquantor gebunden ist. Wenn mehrere gleichartige Quantoren in einem Satz vorkommen und die gleiche Reichweite haben, so ist ihre Reihenfolge irrelevant, und sie brauchen auch nicht durch Klammern getrennt zu werden. Es gilt also: (67) " Vx Vy (P(x) A Q(x) A R(x, y ) ) " " Vy Vx (P(x) A Q(x) A R(x, y ) ) " Zu beachten ist aber, daß " V x - B L ( x ) " und " - V x B L ( x ) " nicht äquivalent sind. Man erkennt das auch an den möglichen Übersetzungen: für alle x gilt, dass
21 s i e nicht
blau sind
und
nicht
für
alle
x gilt,
dass sie
blau
sind.
Will man ausdrücken, daß ein allgemeiner Satz für mindestens ein Individuum aus dem angenommenen Individuenbereich gilt, so verwendet man den Existenzquantor (a. E x i s t e n z o p e r a t o r ) " 3 x " ,
ein x, so dass . . . sätze.
den man mit es gibt (mindestens]
übersetzt. Sätze mit Existenzquantor heißen Existenz-
Beispiel 9 "3xM(x)" könnte heißen es gibt einen Menschen , wobei der Individuenbereich etwa Lebewesen umfassen könnte. " V x 3 y V ( y , x ) " könnte h e i ß e n für
alle
x gibt
e s ein
y,
so dass y der Vater
von x
ist.
Der Existenzquantor wird bezüglich der Klammern, der Reichweite und V e r tauschbarkeit wie der Allquantor gehandhabt. Eine Vertauschung von Quantoren wie in (67) ist aber unzulässig in (67a) Vx3yR(x,y), der zwei ungleichartige Quantoren enthält. In Verknüpfungen können nicht immer gleichartige Quantoren mit gleichen Variablen, die v o r verschiedenen Teilen stehen, zu einem mit größerer Reichweite zusammengefaßt werden. Zulässig in beiden Richtungen ist z . B . die Ersetzung von (68) durch (68a): (68) 3xP(x) V 3 xQ(x) (68a) 3x(P(x) V Q(x)). Dagegen ist nicht zugelassen die von (69) durch (69a): (69) VxP(x) V VxQ(x) (69a) Vx(P(x) V Q(x)). Dies hängt mit der Definition der Quantoren zusammen, nach der der A l l quantor in " V x P ( x ) " als unendliche Konjunktion der F o r m "P(a^) A PU2) A.. . " aufgefaßt werden kann, dagegen der Existenzquantor in " 3 x P ( x ) " als unendliche Disjunktion der F o r m " P f a ^ V P ( a 2 ) V. . . " 1. 32 Umformungen von Quantoren Wie zwischen den Pendants in den natürlichen Sprachen gibt es auch zwischen dem Allquantor und dem Existenzquantor einen Zusammenhang. Wenn wir s a g e n alle Menschen haben zwei Beine, so können w i r dafür mit d e m selben W a h r h e i t s w e r t s a g e n e s gibt
nicht
einen
Menschen,
der nicht
zwei Beine
hat.
Analog gelten für die Quantoren folgende Äquivalenzen: (70) " V x P ( x ) " " - 3 x - P ( x ) " (71) n 3 x P ( x ) " • • •» ^ ' n ' heißen isomorph, wenn für sie eine bijektive Abbildung f von M., in M 2 definiert ist und wenn g i l t : f(R^ ( x j , x« )) = R ' . ( fx-^, f x 2 ). E s m ü s s e n a l s o j e d e r Relation und j e d e m Element der einen Struktur j e eine Relation und j e ein Element der andern entsprechen.
35
B e i s p i e l 37 Sei " R ( x l l x 2 ) " eine Relation, die genau dann wahr i s t , wenn entweder "x^ ist L e h r e r von x 2 " oder " x j ist Schüler von X 2 " wahr i s t , und f eine bijektive Abbildung m i t : 4 -» Schelling, 1 -» W . v . Humboldt, 6 •* Courtenay, 7 -* Trubetzkoy, 2 -» G. v . Gabelentz, 3 -> de S a u s s u r e , 8 -» Bally, dann ist das Eisenbahnnetz von B e i s p i e l 33 isomorph mit der R-St.ruktur der fraglichen Wissenschaftler. Übungen 35 Ist die Abbildung der Menge der deutschen Phoneme auf die Menge der l a t e i n i s c h e n Buchstaben eineindeutig? 36 Sei X1 = í a , b, c, d|, X 2 = I 00, 01, 10, 11 Man sagt X 2 sei ein Kode für X j , wenn e s eine eineindeutige Abbildung gibt, so daß f(a) = 00, f(b) = 01, f(c) = 10, f(d) = 11, und wenn die Isomorphie bezüglich d e r Verkettung d e r E l e m e n t e aus X j und X 2 gewahrt bleibt. " 0 0 0 1 0 1 0 0 " kann dann dekodiert werden zu " a b b a " . Wäre X 3 = Í 0, 1, 10, 11 | ein Kode für X j ? K o n s t r u i e r e n Sie einen Kode für X 4 = | d , e , j , r ! m i t t e l s X 5 = jx|x i s t eine Kombination aus " + " und " - " j . Kodieren Sie zwei deutsche W ö r t e r . 2.2
Funktionen. Verknüpfungen
Seien f und g zwei Funktionen mit gleichen B e r e i c h e n A. Dann definiert man eine Verknüpfung " o " von f und g , die man das Produkt h von f und g nennt: (122) f o g = h = def(f o g)(x) = f(g(x)) = h(x) Wenn a l s o g(x) = y und f(y) = z, dann ist h(x) = z. Solche Verknüpfungen können folgende Eigenschaften haben: (123) (f o g)o h = f o(g o h) (124) f o g =g o f Nach (123) ist diese Verknüpfung a s s o z i a t i v , nach (124) ist sie kommutativ. Man sagt außerdem, der B e r e i c h von " o " sei a b g e s c h l o s s e n bezüglich "o", wenn für alle f und g ein s o l c h e s h nach (122) e x i s t i e r t . Dies ist für unser h der F a l l , weil g für alle x € A definiert i s t , und da der Nachbereich von g in A ist und f auch für alle x € A definiert i s t , ist das E r g e b n i s von f(g(x)) auch in A. Man definiert nun noch ein n e u t r a l e s Element e , für das g i l t : (125) f o e = e o f = f . B e i s p i e l 38 Neutrales E l e m e n t unter der Verknüpfung " + " in der Arithmetik ist " 0 " , n e u t r a l e s Element unter " u " ist " 0 " , da gilt M j f S 0 = M j . W e i t e r kann man ein i n v e r s e s E l e m e n t (126) f o f " 1 = f - 1 o f = e .
i oder " f - 1 " definieren:
B e i s p i e l 39 In der Arithmetik ist -a das i n v e r s e Element zu +a, da - a + a = 0. I ist i n v e r s e s E l e m e n t zu a , weil unter der Verknüpfung der Multiplikation " l " n e u t r a l e s Element ist (denn a- 1 = 1 - a = a) und 5 • a = 1.
36 Mit diesen Gesetzen können wir den wichtigen algebraischen Begriff der Gruppe definieren: Eine Gruppe G = (A, o, e) ist ein Tripel aus einer Menge A, einer Verknüpfung " o " und einem neutralen Element e, so daß die Verknüpfung in A assoziativ i s t (123), zu jedem x c A ein Inverses existiert und außerdem ein neutrales Element existiert. Ist die Verknüpfung außerdem kommutativ (124), dann heißt die Gruppe abelsch. Beispiel 40 Die Menge der ganzen Zahlen unter der Verknüpfung " + " mit dem neutralen Element " 0 " ist eine abelsche Gruppe. Wichtiger ist in der Linguistik der Begriff der Halbgruppe geworden. Eine Halbgruppe H = (A, o) ist ein Paar aus einer Menge A und einer Verknüpfung " o " , so daß die Verknüpfung in A assoziativ ist, also (123) gilt. Eine Gruppe ist ein Sonderfall einer Halbgruppe. Beispiel 41 Sei A = ja, b, c ¡. Wir deuten nun die Verknüpfung " o " als lineare Verkettung, die wir durch das Zeichen oder gar nicht bezeichnen. Dann wären die Ketten abb (oder a b b), baba 6 M. Es können alle Elemente aus A beliebig oft in Verknüpfungen vorkommen. Ein solches Vorkommen nennen wir eine Okkurrenz des Elements. Nehmen wir außerdem an, A enthalte ein neutrales Element e, so nennen wir die Halbgruppe H ein f r e i e s Monoid über A, das wir mit A * bezeichnen. Die Elemente von A heißen die Erzeugenden von A * . Beispiel 42 Deuten wir wieder die Verknüpfung als lineare Verkettung und e als leere Kette 0, so gilt, wenn wir k j , k 2 . . . als Variablen für Ketten benutzen: k 1 e = k j . Da die Verkettung assoziativ ist, gilt (bajk^ = b f a k j ) = bakj. Da die Verkettung nicht kommutativ ist, gilt ab f ba. k j ist eine Unterkette (a. Teilkette) von k 2 genau dann, wenn es zwei Ketten k3 und k^. gibt, so daß ^3
^4
=
^2
Beispiel 43 aa, ab sind Unterketten von aabab; abb, aaa sind keine Unterketten von aabab, weil abb, aaa nicht verkettet sind. Sei k j = aab, k 2 = baa, dann ist die Verkettung k^ kg = aabbaa. Die Verkettung von mehrelementigen Ketten ist auch asymmetrisch. Es gilt also allgemein k^ k 2 ^ k 2 k^. Übungen 37 S = (A, o, e) sei eine algebraische Struktur. Deren Verknüpfung sei kommutativ, assoziativ, sie enthalte ein neutrales Element e und zu jedem Element ein inverses -x. Es sei A = jm 1 ( m 2 , . . . ! eine Menge von phonetischen
37 M e r k m a l e n , deren b e l i e b i g e Kombinationen als Phoneme aufgefaßt werden. Dann läßt sich S d a r s t e l l e n als
Nehmen Sie an, A = |v(orn), h(och) S und geben Sie m i t t e l s eines D i a g r a m m s der m ö g l i c h e n Kombinationen die i m Deutschen e x i s t i e r e n d e n Kombinationen durch die entsprechenden V o k a l e an. I n t e r p r e t i e r e n Sie dabei " - v + v " als ' m i t t e l ' und ebenso " - h + h " . 38 k^ = der ochs kam
sei eine K e t t e . Sind
hsk, am, 0cs
Unterketten?
I n t e r p r e t i e r e n Sie die Nullkette a l s Lücke ( B l a n k ) . W e l c h e Funktion hat sie dann in u n s e r e r O r t h o g r a p h i e ?
2.3
A x i o m a t i s i e r t e s System. F o r m a l e s System
Seit langem v e r s u c h t man, m a t h e m a t i s c h e und l o g i s c h e T h e o r i e n in a x i o m a t i s c h e r F o r m d a r z u s t e l l e n . Man nennt sie dann a x i o m a t i s i e r t e S y s t e m e . U n t e r e i n e m a x i o m a t i s i e r t e n S y s t e m v e r s t e h t man dabei e i n e Menge v o n A u s drücken, die aus z w e i U n t e r m e n g e n A X u n d D bestehen, so daß die Elemente v o n D durch e x p l i z i t f o r m u l i e r t e R e g e l n R aus denen v o n A X gewonnen werden können. Die E l e m e n t e von A X heißen A x i o m e , die von D T h e o r e m e . F ü r das A b l e i t e n v o n E l e m e n t e n v o n D aus E l e m e n t e n von A X m i t t e l s d e r erwähnten R e g e l n sagt man deduzieren,
die R e g e l n heißen D e d u k t i o n s r e g e l n .
N e b e n den Deduktionsregeln enthält ein a x i o m a t i s i e r t e s S y s t e m Bildungsr e g e l n f ü r die Ausdrücke aus den T e r m e n des S y s t e m s , d. s. A u s d r ü c k e d e r e n T e i l e keine A u s d r ü c k e sind, m i t andern W o r t e n nicht a n a l y s i e r b a r e A u s d r ü c k e . F ü r unsre Z w e c k e ist nun d e r B e g r i f f des f o r m a l e n S y s t e m s w i c h t i g , das man auch Kalkül nennt. E i n f o r m a l e s System i s t ein a x i o m a t i s i e r t e s System, d e s s e n R e g e l n nur die g r a p h i s c h e F o r m d e r Ausdrücke in B e t r a c h t ziehen, a l s o nicht d e r e n B e deutung. Ein s o l c h e s f o r m a l e s S y s t e m kann deshalb n a c h t r ä g l i c h in v e r s c h i e dener Weise interpretiert werden.
38 Beispiel 44 Wir können einen Teil des in 1.2 behandelten Aussagenkalküls als formales System darstellen. Wir gehen aus von einer Menge A = {(, ), - , -*, p^, pg, . . . , P n l , die die Atome des Systems ( p j , pg, p n ), logische Zeichen (-,-*) und Hilfszeichen ((, )) enthält. Man nennt A auch das Alphabet und seine Elemente Buchstaben. Die Elemente des freien Monoids A * über A unter (oder nichts für die Verkettung) nennt man auch Wörter. In unserm formalen System sollen sie für die Ausdrücke stehen. Allerdings ist die Menge der Ausdrücke AS eine Untermenge von A * da nicht alle beliebigen Verkettungen zugelassen werden dürfen: z.B. nicht " - ) - » k j " . Wir müssen deshalb noch Regeln formulieren, die AS definieren: ( R l ) Jedes Atom ist ein Ausdruck. (R2) Wenn das Wort (die Kette) k j ein Ausdruck ist, dann ist auch das Wort -k^ ein Ausdruck. (R3) Wenn die Wörter k^ und k2 Ausdrücke sind, ist auch das Wort (k 1 "»k 2 ) ein Ausdruck. (R4) Ein Wort ist genau dann ein Ausdruck, wenn es durch (evtl. mehrmalige) Anwendung von ( R l ) , (R2) und (R3) erzeugt werden kann. Durch Anwendung der Regeln können wir etwa folgendermaßen den Ausdruck " ( ( - - p 1 - > p 2 ) ~ > p 2 ) " generieren: (127) (Rl) Pl -Pi (R2) —Pl (R2) (__Pl-*P2) (R3) ((— P i " > P 2 ) ^ P 3 ) (R3) Dieses formale System berücksichtigt im Gegensatz zum Aussagenkalkül von 1.2 nur die Junktoren "-»" und " - " . Darum erzeugt es weniger Ausdrücke als es im Aussagenkalkül Schemas gibt. Wegen den in 1.23 behandelten Umformungsmöglichkeiten läßt sich aber mit der Menge dieser Ausdrücke das gleiche ausdrücken wie mit der Menge aller Schemas, da " A " und " v " und alle übrigen Junktoren durch "-»" und " - " ausgedrückt werden können. Wenn wir nun aus AS einige Elemente auswählen als Axiome und Übergangsregeln ähnlich wie die Äquivalenzen (41)- (55) formulieren, haben wir ein vollständiges formales System S. Wir können es formal definieren als ein Quadrupel S = (A, AX, AS, R) wobei AS c A * . Übungen 39 Sind die folgenden Ketten Ausdrücke unseres formalen Systems in 2.3: "P 1 A p 2 ^ q", " ( P l (-kj)) p 2 ", " ( ( P l - k j ) -» k 2 )"? 40 Welche Regeln muß man nacheinander anwenden, um aus dem Ausdruck "-(Pl P2'" Ausdruck " - ( - ( p -* p 9 ) -» -P^)" zu erzeugen?
39
2.4
Turingmaschine. Algorithmus
Formale Systeme sind die Grundlage abstrakter Automaten. Im Gegensatz zu konkreten selbstregulierenden Maschinen definieren diese nur die abstrakte F o r m solcher Maschinen. Ein Beispiel hierfür ist eine Turingmaschine, die besteht aus einem endlichen Speicher, einem Lese-Schreibkopf und einer Transporteinrichtung über einem Band, das in Felder eingeteilt ist, auf die Anfangsdaten geschrieben sind und auf die die Maschine selbst schreiben kann. Sie kann dabei auf jedes Feld nur einen Buchstaben eines vorgegebenen Alphabets schreiben: Speicher
r
, Lese-Schreibkopf
J
Den Inhalt des Speichers zu einem Zeitpunkt i nennt man Zustand qi der Maschine, die Menge der Zustände Q. Liest die Maschine in einem Zustand q^ ein Zeichen Z j auf dem Band, so reagiert sie darauf durch Änderung ihres Zustandes und Operieren (Löschen oder Schreiben von Zeichen) auf das Band. Damit die Maschine in der richtigen Weise reagiert, muß man ihr genaue Regeln geben, die explizit in einer wohldefinierten Sprache formuliert sind. Denn die Maschine kann nicht wie ein Mensch selbst intelligente Entscheidungen treffen. Eine solche Menge von expliziten Regeln, die in jedem einzelnen Fall die Ausführung gewisser Operationen mechanisch gestatten, nennt man einen Algorithmus. Wir kennen solche Algorithmen z . B . als Regeln für die Multiplikation größerer Zahlen. Mit diesem Algorithmus, den wir in der Schule gelernt haben, können wir die Multiplikation beliebiger Zahlen durchführen. Beispiel 45 Für das Aufsuchen eines Wortes im Wörterbuch dient folgender Algorithmus: (1) Nimm den ersten Buchstaben des Wortes und suche den T e i l des Wörterbuches, in dem die Wörter mit diesem Buchstaben beginnen. (2) Schlage die letzte Seite des fraglichen T e i l s auf. (3) Steht der zweite Buchstabe des ersten Wortes auf der linken aufgeschlagenen Seite im Alphabet nach dem zweiten Buchstaben des zu suchenden Wortes, dann schlage eine Seite zurück. (4) Falls nicht wieder (3) gilt, dann suche auf diesen beiden Seiten das Wort. (5) Falls das Wort dort nicht steht, dann führe wieder (2) aus und suche dort das Wort. (6) Falls es dort nicht steht, kaufe ein andres Wörterbuch. Der Begriff des Algorithmus kann exakt an einer Turingmaschine expliziert werden. Nehmen wir an, eine Turingmaschine T sei definiert für das Alphabet A = | Z Q , Z\, Z 2 ! und habe die internen Zustände q i , q r , , q 3 , wobei q 1 der Anfangszustand und Z Q das Leerzeichen (Blank) sei. Die ZeichenRund L drücken aus, daß das Band nach rechts oder links bewegt wird. Die Anweisungen an die Ma-
40 s c h i n e w e r d e n in F o r m v o n Q u a d r u p e l n f o l g e n d e r A r t f o r m u l i e r t : (128) q i Z k Zy q j (Ql) (Q2) q i Zk L qj Qi Z k R Qj (Q3) D i e s e Quadrupel sind wie folgt zu i n t e r p r e t i e r e n : ( Q l ) Die M a s c h i n e i s t i m Z u s t a n d q^ und l i e s t Z k . Sie e r s e t z t Z k d u r c h Z x und geht in den Z u s t a n d q j ü b e r . (Q2) Die M a s c h i n e i s t i m Z u s t a n d q^ und l i e s t Zy. Sie bewegt d a s Band ein F e l d w e i t e r n a c h l i n k s und geht von q j i n q^. (Q3) Die M a s c h i n e i s t i m Z u s t a n d q^ und l i e s t Z ^ . Sie b e w e g t d a s Band ein F e l d n a c h r e c h t s und g e h t v o n q j in q j . Nehmen wir weiter an, u n s r e Maschine T bestehe a u s folgenden Quadrupeln: Ql Z Q L q x (1) Ql z i L q 2 q 2 Zx Z2 q 2 q2 Z2 L qx
q2
z
L 0
(2) (3) (4)
(5)
q 3 Zx ZQ q3 (6) E s s t e h e nun auf d e m Band f o l g e n d e s W o r t : z o Z1 z i z l Zo Z1 Die M a s c h i n e beginnt a l s o in q^ u n d l i e s t Z . W i r s c h r e i b e n d a s s o : Ii Zo Z1 Z l Z l Zo Z1 Sie w i r d n a c h d e r A n w e i s u n g (1) h a n d e l n und w i r e r h a l t e n : Z Q qx Z x Zx Zx Z 0 Z± nach (1) Sie f ä h r t j e t z t f o l g e n d e r m a ß e n f o r t , i n d e m s i e i m m e r die in K l a m m e r g e nannten Anweisungen befolgt: ZQ Z 1 q 2 Z 1 Z x ZQ Zx (2) Z Q Zx q 2 Z 2 Zj^ Z Q Zx (3) ZQ Zx Z 2 q x Z j Z q Zx (4) Z 0 Z l Z 2 Z l q 2 ZG Z x (2) z
o Z 1 z 2 Z 1 z 0 ^3 Z 1 o Z 1 Z 2 Z i Z o ^3 Z o (6) In d i e s e m l e t z t e n Z u s t a n d h ö r t die M a s c h i n e in q^ a u f , w e i l k e i n e A n w e i s u n g e x i s t i e r t f ü r den F a l l , daß s i e s i c h in qg b e f i n d e t und Z Q l i e s t . Z
B e i s p i e l 46 E i n e T u r i n g m a s c h i n e kann l i n g u i s t i s c h benutzt w e r d e n , urji e i n e n A l g o r i t h m u s f ü r die T r a n s k r i b i e r u n g e i n e s T e x t e s o d e r W o r t e s von e i n e m A l p h a b e t in ein a n d e r e s zu k o n s t r u i e r e n . N e h m e n w i r an, w i r h a b e n zwei A l p h a b e t e A = ( a ^ a ^ a , , . . . , a n j , B = {a Q , b-^, b 2 > . . . , b n } . Die T u r i n g m a s c h i n e T r a n as wLi r d d e f i n i e r t d u r c h (wobei i ^ a 0 und a Q d a s L e e r z e i c h e n s e i ) : % 0
q j a i b x q. q. b x L q^ q. a Q L r
(b) (c) (d)
41
Stünde auf dem Band a o a 2 1 a l 0 a 1 2 a o ' dann würde Trans folgendermaßen arbeiten: qx a 0 a 2 1 a 1 Q a 1 2 aQ ao
a 2 i a 10 a i 2 a o
ao
b
ao
b 21
ao
b 21
ao
b 21
ao ao ao Im Zustand hat. Er hat
(nach (a))
21 10 i2 o
(b)
10 l2 o
(c)
a
a
a
a
a
a
b10a12ao
blO^j a 1 2 a o
b a blO^j (b) 12 o b 21 b 1 0 b 1 2 qj aQ (c) b 21 b i 0 b i 2 a o r (d) r hört Trans auf, weil er keine Anweisung für diesen Zustand a2j a^ 2 umgeschrieben in b2^ b 1 Q b j 2 . b 21
Wir können jetzt eine Turingmaschine definieren als ein Quadrupel T = ( A , B , Q, P), wobei A und B disjunkte Alphabete sind. A heißt Eingabealphabet, B Ausgabealphabet (mit L , R £ B), Q ist die Menge der Zustände mit einem ausgezeichneten Element q Q , dem Anfang s zu stand , und P eine Menge von Regeln der F o r m (128), die wir als Abbildungen deuten können. Eine Turingmaschine ist für die meisten Zwecke sehr unökonomisch. Darum hat man auch andre abstrakte Automaten entwickelt. Man kann sie als Abbildungen f: A * -> B* verstehen. Sie schreiben Ketten k^ 6 A * Ketten kj € B* zu. Dabei kann man verschiedene Fälle unterscheiden: Eine Menge L ^ c ß * heißt aufzählbar (erzeugbar) genau dann, wenn für beliebige k- 6 A * gilt: kj € L^ genau dann, wenn kj mittels der Regeln ableitbar ist. Eine Menge L ^ C A * heißt akzeptiert, wenn es für beliebige k^ € L^ eine Ableitung gibt, so daß ihr Endelement AX 6 B (das Axiom) ist. Sei L ^ A * , dann sagt man, L^ sei in bezug auf A * entscheidbar, wenn es einen abbrechenden Algorithmus gibt, der für jedes x € A * entscheiden kann, ob x € L^ oder nicht. Dazu müssen L^ und A * - L j aufzählbar sein. Übungen 41 Verbessern Sie den Algorithmus aus Beispiel 45. 42 Nehmen Sie an, es sei ein Text aus einem früheren Sprachzustand in einen späteren zu transkribieren, so daß sich nur p, t, k zu f, th,h gewandelt hätten. Konstruieren Sie eine Turingmaschine L V , die diesen Teil der ersten Lautverschiebung darstellt als Transkribierungsalgorithmus. 2.50
Graphen. Definitionen
Für die Linguistik ist der Begriff des Graphen wichtig geworden. Ein Graph G ist definiert durch G = (K, R , f ) , also ein Tripel aus einer Menge K, einer Menge R und einer Vorschrift f (Abbildung), die jedem Element aus R genau zwei (evtl. gleiche) Elemente aus K zuordnet. Da sich jeder Graph auch
42
z e i c h n e r i s c h r e p r ä s e n t i e r e n läßt, benützt m a n d i e s e s Pendant a l s a n s c h a u l i c h e D a r s t e l l u n g von S t r u k t u r e n . Wir wollen jetzt einige g r a p h e n t h e o r e t i s c h e Grundbegriffe einführen. Sei z . B . K = | l , 2 , 3 , 4 , 5 , 6 , 7 ) und es gelte R ( l , 2 ) , R(2, 1), R ( l , 3), R ( 3 , 4 ) , R(4,4), R(3, 5), R(5, 6), R ( 3 , 7 ) . Dann kann m a n d i e s e n G r a p h e n g e o m e t r i s c h wie folgt d a r s t e l l e n : (129) 3
Die E l e m e n t e a u s K sind h i e r a l s mit Z i f f e r n e t i k e t t i e r t e Punkte d a r g e s t e l l t . Sie heißen Knoten. Die v e r b i n d e n e n Linien zwischen zwei b e n a c h b a r t e n Punkten, d. s. sind s o l c h e , f ü r die R f x ^ x g ) gilt, wenn XpXg € K, h e i ß e n Kanten. In u n s e r e m B e i s p i e l handelt e s sich um g e r i c h t e t e Kanten, d e r e n Richtung durch die P f e i l e b e z e i c h n e t i s t . Ein Graph mit g e r i c h t e t e n Kanten heißt g e r i c h t e t e r G r a p h . F a l l s die E l e m e n t e a u s R s y m m e t r i s c h sind, sind die Kanten u n g e r i c h t e t . Ein Knoten, in dem keine Kante a n s t ö ß t , heißt ein i s o l i e r t e r Knoten. Ein Kantenzug i s t eine F o l g e von Kanten, die m a n n a c h e i n a n d e r d u r c h l a u f e n kann, s o daß das Ende e i n e r Kante d e r Anfang d e r n ä c h s t e n Kante i s t : (2, 1, 2, 1, 3, 5, 6) in (129) i s t ein Kantenzug. Ein Weg i s t ein Kantenzug, d e r keinen Knoten m e h r m a l s d u r c h l ä u f t : (2, 1, 3, 5, 6) in (129) i s t ein Weg. Ein Kantenzug, d e s s e n Anfang mit seinem Ende i d e n t i s c h i s t , heißt eine S c h l e i f e : (1, 2, 1) in (129) i s t e i n e S c h l e i f e . Besteht d e r Kantenzug n u r a u s e i n e m Knoten, so liegt eine d i r e k t e Schleife (a. Schlinge) v o r : (4,4) in (129) ist eine d i r e k t e Schleife. Ein Graph heißt konnex, wenn zwischen beliebigen k^ und kg (wobei k-^ f- kg) e i n Kantenzug e x i s t i e r t . Ein s o l c h e r Graph enthält keine i s o l i e r t e n Knoten. In d e r G r a p h e n t h e o r i e w e r d e n b e s t i m m t e U n t e r s c h e i d u n g e n durch Verwendung m e n g e n t h e o r e t i s c h e r B e g r i f f e g e t r o f f e n . Ein U n t e r g r a p h Gg = (Kg, Rg, f.j) von G^ = ( K ^ . R ^ . f j ) ist ein G r a p h , m i t Kg c K^, so daß j e d e Kante von G^, die zwei Knoten von G^ v e r b i n d e t , auch zu Gg g e h ö r t . (Also gilt auch Rg c R^). Wir s c h r e i b e n d a f ü r Gg c G^. Man kann auch" in G r a p h e n U n t e r g r a p h e n e n t f e r n e n oder durch a n d r e e r s e t z e n . Will m a n einen G r a p h e n Gg von e i n e m Graphen G^ s u b t r a h i e r e n (wobei G g c G-^), so s u b t r a h i e r t m a n die Knoten Kg von G2 mit allen an s i e a n s t o ß e n d e n Kanten und e r h ä l t G^ - Gg. Will m a n a n einen Knoten k^ von G^ einen Graphen G2 anhängen, so sagt man, m a n h e f t e t beide G r a p h e n z u s a m m e n . D a s Z u s a m m e n h e f t e n von zwei d i s junkten Graphen i m Knoten k j i s t eine V e r e i n i g u n g G 1 U Gg mit e i n e r i d e n t i schen Abbildung von k 1 € G x auf k € G . E s gilt K^fl Kg = { k j } . Das E r -
43 s e t z e n e i n e s G r a p h e n Gg 5 1 G^ in G^ d u r c h Gg kann a l s eine Subtraktion von G2 mit a n s c h l i e ß e n d e m Z u s a m m e n h e f t e n von G^ - G2 mit Gg d e f i n i e r t w e r d e n . In d e r Linguistik sind a l s S t r u k t u r d a r s t e l l u n g e n b e s o n d e r s auch Bäume b e nutzt worden, d . s . konnexe (u. U. g e r i c h t e t e ) G r a p h e n ohne S c h l e i f e n .
(130) i s t ein g e r i c h t e t e r B a u m , wobei die Richtung d e r Kanten d u r c h die Konvention gegeben w i r d , daß m a n sie n u r von oben nach unten d u r c h l a u f e n d a r f . 1 heißt die W u r z e l d e s B a u m e s . Man sagt, in e i n e m B a u m d o m i n i e r t ein Knoten k j direkt einen Knoten k2, wenn k^ ü b e r k2 steht und beide Enden d e r g l e i c h e n Kante sind. B e i s p i e l 48
In (130) d o m i n i e r t
1 direkt
3 , nicht a b e r
5 oder 7 .
Man sagt, in e i n e m Baum d o m i n i e r e ein Knoten k^ i n d i r e k t e i n e n Knoten k^, wenn e s einen Kantenzug gibt, d e s s e n o b e r e s Ende k^ und d e s s e n u n t e r e s Ende k2 i s t . B e i s p i e l 49
In (130) d o m i n i e r t
1 i n d i r e k t 7 und 4 nicht a b e r
2
E i n e n U n t e r g r a p h e n e i n e s B a u m e s nennen wir einen Zweig. 2.51
Anwendung von G r a p h e n in d e r Phonologie
W i r haben schon eine l i n g u i s t i s c h e Verwendung von Graphen in Übung 37 k e n n e n g e l e r n t . Eine a n d r e V e r w e n d u n g in d e r Phonologie wollen wir jetzt d a r s t e l l e n : Nehmen w i r an, w i r wollten die möglichen d r e i f a c h e n Konsonantenkombinationen a m Anfang d e u t s c h e r W ö r t e r , die m i t s beginnen, d a r s t e l l e n . Wir v e r w e n d e n dann einen B a u m , d e r mit s beginnt und s c h r e i b e n die A l t e r n a t i v e n u n t e r e i n a n d e r nach i h r e n P o s i t i o n e n von links nach r e c h t s in e i n e n Graphen: (131)
44 2.52 Anwendung von Graphen zur Darstellung von Satz strukturen Weit verbreitet sind Graphen heute zur Darstellung der Struktur von Sätzen. Hier sind v o r allem zweierlei Strukturen dargestellt worden. In der einen A r t von Darstellungen repräsentieren die Kanten des Graphen die Abhängigkeit der Wörter im Satz, in der andern, wie sich der Satz aus Teilen zusammensetzt (hier ist also R die Teil-Ganzes-Relation). Nach seinen Teilen wäre (132) Jeder verwendet diese schönen Graphen, darzustellen als (133)
diese schönen
Graphen
In dieser Struktur wird der Satz nicht sofort in Wörter geteilt, sondern über Zwischenstufen, die hier mit geindextem x bezeichnet sind. Der Graph, der die Abhängigkeit darstellt, enthält dagegen keine solchen Hilfsymbole, in ihm repräsentieren alle Knoten je ein Wort: (134) verwendet jeder diese
schönen
2.53 Anwendung von Graphen zur Darstellung von Regelsystemen Eine dritte Möglichkeit der Verwendung von Graphen ist die Abbildung von Regelsystemen, z . B . allgemeine Regeln für die Bildung von Sätzen. So könnten w i r die Regeln des formalen Systems aus Beispiel 44 in einem Graphen darstellen. Wir verwenden "k^" als Abkürzung für Ausdruck: (135)
Dieser Graph gibt an, daß ein beliebiger Ausdruck ein "p", " - k " oder zwei Ausdrücke in Klammern mit "-*" dazwischen sein kann. Da hier in dem Konditionalsatz nicht Atome vorkommen, sondern Ausdrücke, wird man von ihm wieder zurückverwiesen auf k.. Ebenso bei - k j . Durch diese Schleifen könnte
45
man in d e r Erzeugung von A u s d r ü c k e n a l s o beginnen mit " k ^ " und von dort zu "(k^ "^kg)" gehen und dann w i e d e r zweimal zurückgehen zu " k . " . Würden w i r dann j e w e i l s den linken Weg wählen, so e r h i e l t e n w i r etwa "(p^ P2)"W i r könnten a b e r auch z w e i m a l den r e c h t e n Weg wählen und e r h i e l t e n "((k^ •* k3) -» (kg -* k ^ ) ) " . B e i m n ä c h s t e n Durchlauf wählen w i r j e e i n m a l den linken und j e e i n m a l den m i t t l e r e n Weg und kommen zu "((p^ -» - k g ) -* ( p 2 -* - k ^ ) ) " . W i r kämen dann noch z w e i m a l ü b e r " k j " und würden, wenn w i r den linken Weg wählen, "(( p -* - pg) -» (p 2 -* - p ^ ) ) " e r h a l t e n . Übungen 43 Die M ö g l i c h k e i t e n in d e r deutschen Wortbildung, Moneme e i n e r syntakt i s c h e n K a t e g o r i e in eine a n d r e s y n t a k t i s c h e K a t e g o r i e zu ü b e r f ü h r e n , kann man durch Graphen d a r s t e l l e n , z. B . Ärmlichkeit, Altertum durch A
S
wobei A = Adjektiv, V = V e r b , S = Substantiv. Geben Sie B e i s p i e l e , wo die s y n t a k t i s c h e K a t e g o r i e d r e i m a l v e r ä n d e r t wird und s t e l l e n Sie sie in e i n e m Graphen d a r .
3.0
FORMALE SPRACHEN ÜBER EINEM A L P H A B E T
W i r sind in 2.2 von e i n e r Menge von Buchstaben A a u s g e g a n g e n , d e r e n m ö g liche V e r k e t t u n g e n w i r a l s A*, d a s f r e i e Monoid ü b e r A b e z e i c h n e t haben. Die E l e m e n t e von A* w a r e n Ketten von E l e m e n t e n von A. J e d e U n t e r m e n g e L von A* wird a u c h ( f o r m a l e ) S p r a c h e genannt. Eine Sprache w ä r e z . B . die Menge d e r W ö r t e r , die genau a u s zwei B u c h s t a b e n b e s t e h e . Da eine Sprache n a c h d i e s e r Definition eine Menge ist, kann m a n m i t Sprachen m e n g e n t h e o r e t i s c h e O p e r a t i o n e n a u s f ü h r e n : L i fl L2, L^U L2 u s w . Wenn w i r eine f o r m a l e Sprache a l s B e s c h r e i b u n g einer n a t ü r l i c h e n Sprache benutzen wollen, w e r d e n wir folgende I n t e r p r e t a t i o n v o r n e h m e n : A heißt ein Vokabular und enthält die Menge d e r Moneme (oder der W ö r t e r ) e i n e r n a t ü r l i c h e n S p r a c h e , s o daß j e d e s Monem (oder Wort) ein Element von A i s t . Die E l e m e n t e von A * sind dann M o n e m k e t t e n (oder Wortketten). Wir wählen die U n t e r m e n g e L so a u s , daß s i e n u r solche Monemketten e n t h ä l t , die Sätze sind. Dann b e s c h r e i b t L genau die Menge d e r Sätze d e r n a t ü r l i c h e n S p r a c h e . Wir m ü s s e n n u r eine Möglichkeit finden. Regeln zu f o r m u l i e r e n , die genau die richtige Menge L a u s A* a u s w ä h l e n können, so daß L a l s B e s c h r e i b u n g d e r n a t ü r l i c h e n S p r a c h e a k z e p t i e r t w e r d e n kann. 3.11
K o m b i n a t o r i s c h e S y s t e m e . Produktion. H e r l e i t u n g
Solche Regeln sind e i n g e f ü h r t w o r d e n f ü r sogenannte k o m b i n a t o r i s c h e S y s t e m e . B e z e i c h n e n w i r die E l e m e n t e a u s V mit g r o ß e n B u c h s t a b e n und die aus V* m i t kleinen, dann haben d i e s e Regeln folgende F o r m : (136) x-l -» x 2 (137) yx^z -* y x 2 z Man nennt solche Regeln P r o d u k t i o n s r e g e l n o d e r r e w r i t e - R e g e l n . Der P f e i l "-»" ist nicht d e r Konditional, e r steht v i e l m e h r f ü r die Anweisung, e t w a s auf d e r linken Seite zu e r s e t z e n d u r c h etwas auf d e r r e c h t e n Seite: (136) gibt an, daß m a n x^ e r s e t z e n kann d u r c h x 2 - In (137) i s t die E r s e t z u n g von x-^ d u r c h x^ auf b e s t i m m t e Kontexte b e s c h r ä n k t , a l s o n u r in d e r Umgebung y z m ö g l i c h , d . h . wenn x-^ U n t e r k e t t e v o n yx^z i s t . E i n k o m b i n a t o r i s c h e s S y s t e m i s t d e f i n i e r t d u r c h ein Q u a d r u p e l K = (V,H, S, P), wobei V ein Alphabet i s t , H i s t eine Untermenge d e s A l p h a b e t s und enthält t h e o r e t i s c h e Z e i c h e n , die e v e n t u e l l notwendig sind, u m die P r o d u k t i o n s r e g e l n a u f z u s c h r e i b e n . S i s t ein a u s g e z e i c h n e t e s E l e m e n t a u s V, von d e m die P r o d u k t i o n s r e g e l n a u s g e h e n , und P i s t die Menge d e r P r o d u k t i o n s r e g e l n . Ein k o m b i n a t o r i s c h e s S y s t e m kann aufgefaßt w e r d e n a l s ein f o r m a l e s System mit
47
einem einzigen Axiom S, von dem durch Regeln alle Theoreme (in dieser Interpretation Sätze) abgeleitet (deduziert) werden können. Beispiel 50 Sei V = } S , X l l , X 1 2 , X 2 i , ^ 2 ' X 2 3 ' ' X 2 4 ' X 2 5 ' X 3 1 ' X 3 2 ' M 1 > M 2 ' H = j S , X 1 1 , X 1 2 , X 2 1 , X 2 2 , X 2 3 , X 2 4 , X 2 5 , X 3 1 , X 3 2 ! . P sei definiert durch s -> x n x 1 2 (1) (2) (3) (4) X25 X31X32 X21-M1 (5) x22^M2 (6) (V) X23">M3 (8) X 24 M4 X31-*M5 (9) (10) X32"*M6 Dann erzeugt dieses kombinatorische System genau die Kette M^MgMgM^M^Mg und beschreibt damit eine Sprache, die genau aus dieser Kette besteht. Wir können dieses Regelsystem folgendermaßen interpretieren, um damit einen Teil des Deutschen zu beschreiben: S = Satz, M j = kein, M^ = Linguist, Mg = kenn, M 4 = t, Mg = die, Mg = Sprache. Die Hilfszeichen X^j sind als syntaktische Positionen interpretiert: X11
X21X22
x12
X23X24X25
X u = Subj(ekt), X 1 2 = Präd(ikat), X 2 1 = Art(ikel), X 2 2 = N(omen), X 2 3 = V(erb), x 2 4 = V(erbal)m(orphem), X 2 5 = Obj(ekt), X 3 1 = Art(ikel), X 3 2 = N(omen). Wir können also mit der erzeugten Kette (formal dem aus S hergeleiteten Theorem) den deutschen Satz (138) Kein Linguist kennt die Sprache, beschreiben. Die Anwendung der Regeln von ( G l ) kann in zweierlei Weise aufgeschrieben werden. Bei der ersten A r t werden die durch die Produktionen erzeugten Ketten zeilenweise untereinander geschrieben, indem man mit "S" beginnt und dann eine Regel nach der anderen in der angegebenen Reihenfolge anwendet. Die Nummer der angewandten Regel aus ( G l ) wird hinter die Zeile g e schrieben. A l s Verkettungszeichen verwenden wir der Übersicht halber (139) S _ Subj^Präd (1) Art N~Präd (2) Art~N~V~Vm~Obj (3) A r t~N"y~V m~A r t~N (4) kein~Linguist~kenn t die Sprache (5-10) Wir haben dabei der Einfachheit halber die letzten sechs Zeilen zu einer zusammengefaßt. (139) nennt man eine Herleitung von (138) nach ( G l ) , wenn folgende Bedingungen erfüllt sind: (i) jedes X^ muß aus einer Folge von
48 Ketten k p k 2 , . . . , k n hergeleitet werden, so daß k^ k ^ 2 . (ii) Kein X i darf mehr in einer Regel X j -» x vorkommen. Die zweite A r t , eine Herleitung aufzuschreiben, geschieht mit einem Graphen. Wir beginnen wieder mit "S" und schreiben darunter die Zeichen, die rechts vom Pfeil in der Regel auftauchen, in der "S" links vom Pfeil steht, also in (1) von (Gl). Wir verbinden diese Knoten mit "S" durch Kanten. Dann suchen wir der Reihe nach diese Zeichen in Regeln auf, in denen sie links vom Pfeil stehen und v e r f a h r e n in gleicher Weise, d.h. wir schreiben die Zeichen rechts vom Pfeil eine Zeile darunter und verbinden sie durch Kanten mit dem Zeichen, das in dieser Regel links vom Pfeil steht. Wir erhalten unter unserer Interpretation: (140)
kein
Linguist
kenn
t
die
Sprache
(140) nennen wir einen P(hrase)-Marker oder Konstitutionsgraphen. Natürlich ist es ein überflüssiger Aufwand, mittels (Gl) dieses Wort zu erzeugen. Wir werden aber gleich sehen, daß das System leicht zu erweitern ist. 3.12 Definition einer formalen Grammatik Der Wert solcher kombinatorischer Systeme f ü r die Linguistik besteht darin, daß man sie auffassen kann als eine Grammatik G, die die wohlgeformten, d.h. grammatischen Sätze einer zu beschreibenden Sprache charakterisieren kann. Eine Grammatik ist also ein Algorithmus, der genau die grammatischen Sätze einer Sprache erzeugt oder auch entscheiden kann, ob eine vorliegende Kette aus A* ein Element aus L ist, ob sie also unter unsrer Interpretation zur Menge der grammatischen Sätze einer natürlichen Sprache gehört. Die Grammatik (Gl) können wir leicht erweitern, damit sie mehr deutsche Sätze erzeugt, indem wir die Elemente des Endvokabulars E = |x|x = MjJ verändern. Wir können statt (5) X21 M-| bzw. X21 -* kein eine Regel vorsehen, die eine Auswahl zuläßt: X 2 j -* M^, M^, Mg bzw. Xg^ kein, ein, der. Dann könnten wir schon drei deutsche Sätze beschreiben: (138) und (141) Ein Linguist kennt die Sprache. (142) Der Linguist kennt die Sprache. Alle diese Sätze haben die gleiche Struktur, wie es die entsprechenden Konstitutionsgraphen anschaulich zeigen. Der Unterschied der Graphen besteht darin, daß der Knoten unter X 2 , bzw. A r t jeweils anders etikettiert ist. Die
49
Struktur des Graphen ist also nicht nur die von (138), also eines einzigen Satzes, sondern schon eine Generalisierung, die auch für andre deutsche Sätze benützt werden kann. Es ist klar, daß die Zahl der beschriebenen Sätze mit der gleichen Struktur noch viel größer gemacht werden kann, wenn man für alle Regeln, die Moneme einführen, viele Alternativen zuläßt. Trotzdem ist eine solche Grammatik als Beschreibung des Deutschen noch sehr unbefriedigend. W i r werden sie deshalb im übernächsten Kapitel erweitern. 3.13
Definition einer kontextfreien Phrasenstrukturgrammatik. Restriktionen Es hat sich gezeigt, daß kombinatorische Regelsysteme zu weit sind, um natürliche Sprachen angemessen zu beschreiben. Man hat darum eine grundsätzliche Restriktion eingeführt, die wir auch in ( G l ) schon eingehalten haben. Diese Restriktion besteht darin, daß nur Regeln der F o r m (136a) X x (137a) yXz -» yxz zugelassen sind, so daß nur Einzelzeichen ersetzt werden. Ein solches System nennt man eine Phrasenstrukturgrammatik (PSG). Wenn sie außerdem keine Regeln der F o r m (137) enthält, heißt sie eine kontextfreie Phrasenstrukturgrammatik ( K F - P S G ) . Eine PSG ist definiert als ein Quadrupel (143)
PSG = (V, E, S, P),
wobei V ein Vokabular ist, E das Endvokabular, d . i . die Menge der Moneme, die auch Endzeichen heißen, weil sie nicht in Regeln links vom Pfeil v o r kommen. Es gilt E Z1Z2 J J Z, V 12 1 z 2,6,3 12 5
(1)
(2)
(3)
1
(4) '2 > (i) Geben Sie j e d r e i B e i s p i e l e f ü r Zahlen, die m a n mit (154) g e n e r i e r e n bzw. nicht g e n e r i e r e n kann. (ii) Welche d e r folgenden Zahlen sind mit (154) g e n e r i e r b a r : 010; 160; 13336; 3325; 3352? 49 S c h r e i b e n Sie d r e i Herleitungen nach (139) und (140) f ü r folgende G r a m matik: S -* P r " P r ä c f > p (1) P r ä d -» V~Vm (2) Dat Dat N Pp P r ä p Ar Ad (3) Akk Akk -> er, keiner, niemand Pr (4) -> klag, sieg V (5) Vm -* t , te (6) P r ä p -» über, auf (7)
Ar
-* dies,
Ad
-» schön,
N
-» Berg,
ein, gross, Feld,
d
(8) dick Pfad
(9)
(10)
Dat •* em ( U ) (12) Akk -» en 50 S c h r e i b e n Sie eine G r a m m a t i k , die u . a . folgende Ketten g e n e r i e r t : cdxb, ccxbb, cdcxbb, cdcdxbb, ccdxbb. 51 Machen Sie eine G r a m m a t i k , die d a s folgende Gedicht von A . S t r a m m g e n e r i e r t (ohne Titel): VERNICHTUNG Die H i m m e l wehen Blut m a r s c h i e r t marschiert auf t a u s e n d Füßen Die H i m m e l wehen Blut z e r s t ü r m t zerstürmt auf t a u s e n d Schneiden Die H i m m e l wehen Blut z e r r i n n t zerrinnt in tausend Fäden
Die H i m m e l wehen Blut z e r s i e g t zersiegt in tausend Scharten Die H i m m e l wehen Blut z e r s c h l ä f t zerschläft zu t a u s e n d Toden
54 3.16 Verhältnis von Grammatik und Sprache. Ambiguität W i r haben eine formale Sprache definiert als Untermenge des freien Monoids über einem Alphabet. Eine Grammatik sollte ein Algorithmus sein, der die Wörter (bzw. in der Beschreibung Sätze) einer Sprache charakterisiert. Daraus folgt, daß jeder Grammatik eine Sprache entspricht und jeder K F PSG genau eine kontextfreie Sprache. Es gilt aber nicht umgekehrt, daß jede kontextfreie Sprache genau von einer Grammatik charakterisiert wird. Vielmehr kann die gleiche Sprache durch mehrere Grammatiken charakterisiert werden. Beispiel 51 Sei (G3) definiert durch: Hx = i X 2 , Xg, X 4 , Xg, S j, E j = |a, b, c, d, e } ,
s x2x3 x 3 -> x 4 x 5
(1) (2) (3) (4) (5) (6) (7)
X2 ax2a X2 bX 2 b X2^ c x4 d definiert durch: H 2 = ¡ X 2 , X 4 , X 5 , S},
s
E
2
=
x2x4x5
(1) X2 aX 2 a (2) X2 bX 2 b (3) X 2 -» c (4) X4 d (5) X5->e (6) Dann erzeugen (G3) und (G4) die gleiche Sprache, weil die Mengen der Endketten (Sätze) identisch sind. (G3) ist insofern umständlicher als (G4), als es eine Regel mehr enthält. Dafür hat (G4) eine Art von Regel» die (G3) nicht enthält, nämlich eine, wo drei nicht-terminale Zeichen rechts vom P f e i l stehen (Regel 1). Man nennt zwei Grammatiken G^ und G 2 schwach äquivalent, wenn sie die gleiche Sprache charakterisieren. Da (G3) und (G4) die gleiche Sprache erzeugen, sind sie schwach äquivalent. Es ist möglich, daß eine Endkette (ein Satz) in einer Grammatik in mehrfacher Weise herleitbar ist. Wir sagen, der Satz sei nach Gj n-fach mehrdeutig (ambig), wenn nach G- n Herleitungen möglich sind. Beispiel 52 Sei (G5) definiert durch H = j s } , E = ja, b, c } , S 1 aS (1) S Sb (2) S -» aSb (3) S -» c (4) Dann kann "acb" nach (G5) in zweifacher Weise hergeleitet werden, ist
55 also zweideutig:
Da die Mehrdeutigkeit einer Herleitung auch linguistisch relevant sein soll, indem sie eine strukturelle Mehrdeutigkeit eines Satzes beschreiben soll, ist es für die Linguistik nicht nur wichtig, Endketten zu erzeugen, sondern auch diesen Ketten ihre Struktur zuzuordnen. Denn die syntaktische Struktur eines Satzes sollte die Basis seiner semantischen Beschreibung sein. Die Zuordnung der Struktur geschieht am leichtesten in der F o r m eines Konstitutionsgraphen. Beispiel 53 Sei gegeben eine Grammatik (G6): S -> Präd Subj (~Pp) Präd -* V Vm Subj -» Art~N f P p ) Pp -» Präp N
(1) (2) (3) (4)
V
-» komm
(5)
Vm Art
-* en -> die
(6)
N
-» Verwandten,
(7) (8)
Spanien
Präp -» aus (9) Dann kann der Satz (155) Kommen die Verwandten aus Spanien? in zweifacher Weise erzeugt werden: (155a)
Art
„die
N
Präp
Verwandten
aus
N
I
I Spanien I
(155b)
en
die
Verwandten
Präp Spanien
56
Die Möglichkeit zweier Herleitungen b e s c h r e i b t genau die strukturelle M e h r deutigkeit von (155). E s ist deshalb für eine gute syntaktische B e s c h r e i b u n g e r f o r d e r l i c h , einen Satz m i t s a m t s e i n e r syntaktischen Struktur zu c h a r a k t e r i s i e r e n . Die richtige Zuordnung von Mehrdeutigkeiten i s t darum auch ein K r i t e r i u m für die Angemessenheit von G r a m m a t i k e n . G r a m m a t i k e n , die die g l e i c h e Sprache c h a r a k t e r i s i e r e n und jedem Satz die gleiche Strukturbeschreibung zuordnen, heißen s t a r k äquivalent. Übungen 52 Schreiben Sie eine kleine Grammatik, die nur binäre Verzweigungen zuläßt (wo a l s o r e c h t s vom P f e i l höchstens zwei n i c h t - t e r m i n a l e Zeichen stehen dürfen) und f o r m u l i e r e n Sie für die gleiche Sprache eine G r a m m a t i k , die n - n ä r e Verzweigungen enthalten darf. 53 S c h r e i b e n Sie eine G r a m m a t i k , die die Zweideutigkeit von die Untersuchung des Arztes (= Nona) b e s c h r e i b e n kann. 3.2
Konstitutions s y s t e m e
W i r wollen j e t z t eine andere K F - G r a m m a t i k behandeln, die schwach äquivalent ist mit e i n e r K F - P S G . W i r nennen sie Konstitutionssystem. E i n s o l c h e s S y s t e m besteht aus zwei Arten von Regeln: (156) [ X v Y 1 + Y 2 + Y 3 + . . . + Y n ] (157) [ Y i , X 1 / X 2 / . . . / X n ] Dabei stehen X^ und Y . nicht für Ketten von Monemen, sondern für Mengen von Monemen. Das Komma bedeutet, daß eine Menge X^ links vom Komma sich konstituieren kann aus den Mengen r e c h t s vom K o m m a . Darum kann das Komma auch generativ wie "-»" gedeutet werden. Durch die Art der V e r knüpfungszeichen r e c h t s vom Komma sind die zwei Arten von Regeln u n t e r schieden in Konjunktionsregeln wie (156) und Adjunktionsregeln wie (157). Dabei bedeutet " + " , daß alle mit " + " verbundenen Mengen r e c h t s vom Komma v o r l i e g e n können, " / " , daß i m m e r nur eine der Mengen r e c h t s vom Komma v o r l i e g e n kann. Darum heißen auch V a r i a b l e der Art Y^ Konjunkte und der A r t X i Adjunkte. B e i s p i e l 54 a u s Y^ =
Wollen w i r b e s c h r e i b e n , daß X-^ =
ein,
Yg = lieb,
Y g = es,
Y^ =
ein liebes Mädchen
Mädchen,
besteht
s o können w i r d a f ü r
s c h r e i b e n : [X^, Y^ + Y2 + Y 3 + Y 4 ] und, da X^ und Y^ V a r i a b l e sind, damit zugleich eine R e g e l angeben, die auch für andre Syntagmen der gleichen F o r m gilt wie ein schöner Graph. Wollen wir b e s c h r e i b e n , daß ein Subjekt = Y^ bestehen kann aus e i n e m Satz = X ^ oder aus e i n e r Infinitivkonstruktion = X 2 oder aus e i n e m Pronomen = Xg oder aus einem Nominale = X ^ , so können wir dafür s c h r e i b e n [ Y j , X J / X 2 / X 3 / X 4 ] . Wegen d e r Kommutativität d e r Verknüpfungszeichen " + " und " / " wird durch
57 diese R e g e l noch nicht die endgültige Reihenfolge der Moneme in der Kette h e r g e s t e l l t . D i e s hat den e m p i r i s c h e n V o r t e i l , daß einfache Umstellungen von Monemen in Sätzen nicht notwendig eine Strukturänderung zur Folge haben, und das zu v e r m e i d e n scheint notwendig, weil diese Umstellungen keine s e m a n t i s c h e Änderung zur F o l g e haben m ü s s e n , die Struktur a b e r die Grundlage der semantischen B e s c h r e i b u n g bilden soll. Darum ist eine K F - P S G der oben definierten A r t oft zu s t a r k , da sie gleichbedeutenden Sätzen v e r schiedene Strukturen zuordnet. F ü r die Konstitutionsregeln g i l t : (158) " [ X j , Y 1 + Y 2 ] " < = > " [ X 1 , Y 2 + Y 1 ] " (159) " [ Y l X 1 / X 2 ] " "[Y^, X 2 / X ! ] " Außerdem sind alle Zeichen r e c h t s vom Komma fakultativ und es gelten f ü r die Argumentstelle v o r dem Komma die gleichen Restriktionen wie für die v o r "-»" in e i n e r K F - P S G . Hinter dem Komma darf kein l e e r e s oder ein einzelnes Zeichen stehen. Ein Konstitutionssystem ist eine F o l g e von Konstitutionsregeln, deren e r s t e mit S beginnt, so daß j e d e s Adjunkt in einer Konstitutionsregel e r k l ä r t wird und j e d e s Konjunkt in e i n e r Adjunktionsregel. B e i s p i e l 55 Ein sehr einfaches Konstitutionssystem für einen T e i l des Deutschen könnte folgendermaßen lauten: (Kl) [S, V + V M + E 1 + E 2 + E 3 + A 1 ] (1) [Ei, ES/NOMj] (2) [ES, E T + S ] (3) [NOMj, AR + ARMj + A D J + AM^ + N + NMj+ NOMj] (4) [ A j , AS/NOMj] (5) [AS, A T + S ] (6) Dazu kämen noch L e x i k o n r e g e l n , die wir h i e r in der F o r m von Mengen s c h r e i ben. Dabei nennen wir die Zeichen, die in den Konstitutionsregeln nicht l i n k s vom Komma vorkommen, syntaktische K a t e g o r i e n . Die Lexikonregeln zählen a l s o die E l e m e n t e von syntaktischen Kategorien auf: E T
j dass,
ob, 0,
A T
j weil,
wenn,
A R
1 ein,
A R M i
1
A D J
1 schon,
gross,
A M i
j
er,
... [
e ,
kein, en,
e r ,
em,
. . .
N
{ Mann,
Faden,
{ e, 0,
...
V
j komm,
gib,
V M
|
t e ,
j
(8)
...
}
(9)
J
dick,
(10)
...
|
( U ) (12)
Kerl,
j
. . . }
(7)
}
dies,
N M
t ,
... ...
Hans,
... }
(13) (14)
... J
(15) (16)
Kommt ein Zeichen, das in e i n e r vorhergehenden R e g e l schon einmal links vom Komma v o r k a m , in e i n e r späteren R e g e l noch einmal r e c h t s vom K o m m a v o r , so sagen w i r , es liegt eine Schleife v o r , z . B . " S " in (3). Kommt das gleiche Zeichen in e i n e r R e g e l links und r e c h t s vom Komma v o r , so sagen
58 w i r , es liegt eine direkte Schleife v o r , z . B . " N O M " in (4). Mit dem Konstitutionssystem ( K l ) könnte man den Satz (160) Weil ein K e r l kommt, gibt dieser Mann Hans einen dicken Faden, durch folgenden Konstitutionsgraphen beschreiben:
W i r sehen, daß die Schleifen im Konstitutionsgraphen nicht als solche auftreten, sondern sich so auswirken, daß das gleiche Zeichen in einem von ihm dominierten Zweig noch einmal vorkommt. Konstitutionsgraphen und P - M a r k e r kann man auch durch Klammern äquivalent beschreiben, indem man die Klammern indiziert und von oben nach unten für jeden Knoten einer Stufe eine Rechtsklammer und, wenn der Zweig beendet ist, eine Linksklammer macht. Der Graph (160a) wäre dann darstellbar durch: (160b) (( ( ( weil ) ( ( ( (ein) ( 0 ) (Kerl) ( 0 ) ) ) S AjAS.AT A T S E j N O M j A R A R A R M A R M N N N M N M NOMj E j ( komm )
V
{
t
)
)
)
(
gib)
V VM VMASAjV
( Mann )
( 0 )
)
{ t
)
(
(
( dies
V V M VM E j NOMj AR )
(
(
( Hans )
( 0 )
)
(ex
)
AR A R M A R M )
)
N N NM NM NOM x Eg NOMg N N NM NM NOMg Eg ( ( (ein ) ( en ) ( dick ) ( en ) (Faden) E 2 NOM 2 AR AR A R M A R M ADJ ADJ A M A M N N ( 0 ) ) ) )• NM NM NOM 2 E 2 S Bei Konjunktionsregeln für natürliche Sprachen ist es öfter der Fall, daß bestimmte Untermengen eines Konjunkts nur mit bestimmten Untermengen eines anderen Konjunkts vorkommen. In unserer normalen Schreibweise wären solche Untermengen erst in der nachfolgenden Adjunktionsregel einführbar. Dann könnten wir aber nicht mehr die Verträglichkeit der jeweiligen Untermengen ausdrücken.
59 B e i s p i e l 56 Die V e r b a l m o r p h e m e des Deutschen können nicht a l l e bei b e liebigen Subjekten (E-^) stehen, z . B . ist abweichend (161) Du geht. Im Konstitutionssystem ( K l ) könnte man v e r s u c h e n , dies durch Subklassifizierung von E j und VM zu b e s c h r e i b e n . Wenn wir a b e r die beiden Adjunktionsregeln für E^ und VM folgendermaßen f o r m u l i e r e n (162) [ E 1 ( E l 1 / E 2 1 / . . . / E 5 1 ] (163) [VM, V M 1 / V M 2 / . . . / V M 5 ] und annehmen E 2 j f du |, VM2 i s t }, dann haben wir noch nicht b e s c h r i e b e n , daß E 2 j nur mit VM2 zusammen vorkommen d a r f . Zu d i e s e m Zweck führen wir schon in die vorhergehende Konjunktionsregel einen Index ein, der die Kongruenz b e s c h r e i b t : (164) [S, E j x + VMj + . . . ] D i e s e r Index, den wir Kongruenzindex nennen, kann auch Kongruenzen über das Komma hinweg b e s c h r e i b e n , was wir in der Regel (4) von ( K l ) schon b e nutzt haben. Verwendet man bei n i c h t - t e r m i n a l e n Zeichen mehr a l s einen Index, dann kann man auf diese Weise auch die r i c h t i g e Zuordnung in e i n e r sog. K r e u z k l a s s i fikation b e s c h r e i b e n . E s würde z . B . X i j für i = 1, 2; j = 1, 2, 3 , 4 , 5 folgende Kreuzklassifikation b e s c h r e i b e n : (165)
Xll
X I 2 X13 X14 X15
X21 X22 X23 X24 X25
E i n e Konjunktionsregel (166) [ Y l t X ^ j + X 2 i j . . . ] würde gleichzeitig noch die richtige Zuordnung d e r Untermengen regeln, so daß für i und j i m m e r nur gleiche Zahlen eingesetzt würden, a l s o X^-12 nicht v o r k ä m e zusammen m i t X 2 l 3 usw. Übungen 54 Übersetzen Sie die folgenden Regeln in Konstitutionsregeln ( " + " i s t Zeichen für Verkettung):
[1] Y
[2]
11 1-MY12 ri3'
Y
n
-Y
2 1 +
Y
™
2 2
(+Y
2
3)
[4]
Y
Y
12^
Y
31
+ Y
32
2 1 ~*j Y 212 | 213 >
Müssen Sie neue Zeichen einführen? Ist eine p r ä z i s e Übersetzung möglich?
60 55 Schreiben Sie (4) aus ( K l ) s o um, daß die Kongruenz zwischen A R , AMN,
ARM,
N, N M b e s c h r i e b e n w i r d . Geben Sie L e x i k o n r e g e l n an.
56 E r w e i t e r n Sie (4) aus ( K l ) so, daß alle i m Deutschen m ö g l i c h e n n o m i nalen A t t r i b u t e durch Schleifen eingeführt und unzulässige Kombinationen ausgeschlossen werden. 57 Ü b e r s e t z e n Sie den f o l g e n d e n K l a m m e r a u s d r u c k in einen Konstitutionsgraphen: ( S 3.30
( (a) ( X l
(a) (b) )
X^
(b)
X^
) X^
(
c
) X2
(
d
) Xg
) S
E r z e u g u n g s g r a m m a t i k und R e k o g n i t i o n s g r a m m a t i k
B i s h e r haben w i r nur G r a m m a t i k e n kennengelernt, die die Sätze e i n e r S p r a che dadurch c h a r a k t e r i s i e r e n , daß sie s i e e r z e u g e n . Solche G r a m m a t i k e n können P r o b l e m e l ö s e n w i e die Aufzählung d e r g r a m m a t i s c h e n Sätze e i n e r Sprache m i t s a m t i h r e r Strukturbeschreibung. Sie heißen g e n e r a t i v e G r a m m a t i k e n o d e r E r z e u g u n g s g r a m m a t i k e n . E s stellt sich in d e r L i n g u i s t i k a b e r auch das P r o b l e m , daß e i n e K e t t e x gegeben ist und f e s t g e s t e l l t w e r d e n s o l l , ob d i e s e K e t t e v o n e i n e r G r a m m a t i k a k z e p t i e r t w i r d , a l s o ob d i e s e K e t t e ein Satz d e r b e s c h r i e b e n e n Sprache i s t . Eine solche G r a m m a t i k heißt eine R e kognitionsgrammatik. 3.31
Kategoriale Grammatik
E i n e R e k o g n i t i o n s g r a m m a t i k , die e i n e r K F - P S G schwach äquivalent i s t , ist die kategoriale Grammatik (KG), die wir im folgenden darstellen wollen. E i n e solche G r a m m a t i k ordnet a l l e n Konstituenten ( T e i l e n ) e i n e s S a t z e s k o m p l e x e o d e r e i n f a c h e K a t e g o r i e n s y m b o l e zu, die durch ein q u a s i - a r i t h m e t i s c h e s K ü r z u n g s v e r f a h r e n r e d u z i e r t w e r d e n können. Ist das E r g e b n i s e i n e r Kürzung s, dann ist die f r a g l i c h e K e t t e von d e r G r a m m a t i k a l s Satz akzeptiert. B e i s p i e l 57
N e h m e n w i r an,
(167) E r l i e b t s i e . bestehe aus d r e i T e i l e n . U n s e r e G r a m m a t i k ordne den T e i l e n f o l g e n d e K a t e g o r i e n zu:
er = n,
sie = n,
liebt - n\s/n. Dabei w i r d die l e t z t e k o m p l e x e
K a t e g o r i e g e l e s e n n unter s, s ü b e r n. Das bedeutet, daß eine K a t e g o r i e zu s g e k ü r z t w e r d e n kann, wenn unmittelbar links v o n ihr n und u n m i t t e l b a r r e c h t s v o n ihr n steht: (167a)
liebt
n\ s/n s
61
Verwenden wir für Variable von Kategorien kleine griechische Buchstaben, dann können wir die Kürzungsregeln f o r m a l definieren, wobei und " / " enger binden als " " und dieses enger als "-»": (168) cfa\ß -> ß (169) ß/a~a-*ß. Diese Regeln sind wie folgt zu lesen: (168) falls a unmittelbar links von a unter ß, kürze zu ß, (169) falls a unmittelbar rechts von ß über a, kürze zu ß. Es darf nicht wie folgt gekürzt werden: (170) c f a / ß -» ß. (171) ß \ a ~ a - » ß . Wir nennen in (168) und (169) "ß" einen Operator und " a " jeweils sein Argument. Allgemein ist das, was direkt rechts von " \ " steht und was direkt links von " / " ein Operator und zwar soweit, wie durch eine Klammer angegeben ist. " ß " in (168) und (169) ist ein einstelliger Operator. Wie wir in (167a) g e sehen haben, gibt es aber auch mehrstellige. Darum können wir unsre Regeln (168) und (169) allgemeiner für 2n-stellige Operatoren fassen: (172)
a 1 " a 2 ~ . . .~an~(a1~a2~. . ,~an\ ß/YI~Y2~
•-~Ynf Y I ~ Y
2
~
•-~Y
N
ß
Gemeinhin werden anders als in (167a) mehr als ein T e i l eines Satzes aus komplexen Kategoriensymbolen bestehen, so daß sie zuerst gekürzt werden müssen. Dann geschieht die Kürzung in Stufen. Beispiel 58 (173)
Ich
n
weiss,
n/s\n
dass
Fritz
n/s
kommt.
n
n\s
s I
"
s A l s Kategorienzeichen haben wir schon komplexe und einfache unterschieden. Einfache Kategorienzeichen sind in unsrer Darstellung nur " n " und " s " . A l l e andern sind komplex. In einer ausführlichen kategorialen Grammatik einer natürlichen Sprache müßten eventuell mehr einfache Kategorien angenommen werden. Es ist möglich, daß Monemketten mehreren Kategorien angehören. Dadurch werden mehrdeutige Sätze beschreibbar wie (155). Der T e i l kommen würde nämlich einmal der Kategorie s/n~n und einmal s/n angehören. Außerdem müßte man auch annehmen, daß andre Teile des Satzes verschiedenen Kategorien angehören könnten. Wir würden für (155) z . B . folgende beiden Kürzungen erhalten, deren Verschiedenheit die Mehrdeutigkeit des Satzes beschreibt.
62 (155c)
Kommen die
Verwandten aus Spanien?
s/n n n/n
n
n/n
n
n
n s
(155d)
Kommen die
s/n
Verwandten aus Spanien?
n /n
n
n
/n
/n
n n n s 3.32 Definition einer kategorialen Grammatik Eine kategoriale Grammatik kann definiert werden durch ein Quintupel KG = ( V , E , s, R, Z), wobei V ein Vokabular ist, E * die Menge der Kategorien, d . i . die Menge der Ketten einfacher Kategorien unter " / " und wenn a l s o a ^ und a2 einfache Kategorien sind, dann ist a^\a2 € E * unda^/a^ £ E*, s ist eine ausgezeichnete Kategorie s€E, R ist die Menge der Kürzungsregeln nach (172) und Z ist eine Zuordnungsfunktion auf V, so daß ihr Wertbereich W E*. Man sagt, eine Kategorie a ist direkt kürzbar in ß, wenn entweder (i) a = y c 1 / c 2 c 2 ® unc * ß = Y C1 6 oder (ii) a = y C2 c 2 \ c j 6 und ß = y c j 6 Unformal heißt das, daß das Zeichen direkt neben einer unmittelbar anwendbaren komplexen Kategorie stehen muß. Man sagt, eine Kategorie a ist kürzbar in ß, wenn es Folgen yQ, . . ., Yk S^bt, so daß a = Y 0 » ß = Yk u n d Y j _ i direkt in Yj kürzbar ist für 1 5 y — k. Es muß also zwischen den beiden Kategorien eine ununterbrochene Folge direkter Kürzungen geben. Übungen 58 Konstruieren Sie zwei Kürzungen, die die Zweideutigkeit von (174) Man schneide zwei Tage alte Semmeln. beschreiben. 59 Wie kann man in einer kategorialen Grammatik vorsehen, daß zwar akzeptiert werden
die
alten
Tage,
alte
Tage, die
Tage,
nicht a b e r
alten
die Tage?
63 3.41
Dependenzgrammatik. Grundlegende Definitionen
Im folgenden Abschnitt werden wir eine andere Grammatik darstellen, die schwach äquivalent ist einer K F - P S G . Wir nennen sie Dependenzgrammatik. Eine Dependenzgrammatik beschreibt nicht die auf der Teil-Ganzes-Relation beruhende Struktur der Sätze, sondern die Struktur nach der Abhängigkeit der Teile, hier der Moneme. Man kann feststellen, daß in einer Satzkette m^rr^. • • m n nicht nur eine lineare Relation der direkten Nachfolge besteht, sondern daß auch noch Zusammenhänge bestehen bezüglich der Kookkurrenz (Miteinandervorkommen) von Elementen. So kann in (17 5) Jede gute Grammatik
ist
verbesserungswürdig,
gute weggelassen werden, ohne an der Restkette etwas zu ändern, nicht aber jede. Eine solche Relation besteht aber nicht nur für benachbarte Elemente, sondern auch für weiter voneinander entfernte. Wir nennen sie Dependenz. Mit dieser Relation können wir (17 5) darstellen durch einen Dependenzgraphen der folgenden F o r m . (175a) ist
verbesserungswürdig
jed
Darin repräsentieren die Kanten eine Relation, die w i r Abhängigkeit nennen und mit der Dependenz definieren. Wenn wir einen Produktionspfeil definieren durch: "m^ ^ m j " bedeutet "m.2 kann von m j abhängig sein", können w i r eine generative Grammatik auf dieser Relation konstruieren. Beispiel 59 Eine einfache Dependenzgrammatik ( D l ) für einen Teil des Deutschen wäre: (Dl) V =»NPN2 N N , VM, ADJ, ADV (1) NJ, => ADJ, NM, AR (2) ADJ =I> A M , ADV (3) AR ARM (4) Mit ( D l ) können wir Strukturen erzeugen wie (176) VM AR^
/
ARM
ADJ
AR^ ADV
I
ARM
NM
ADV
(Regel 1) (Regel 2) (Regel 3,4)
64 Da hier sämtliche Zeichen f ü r syntaktische Kategorien stehen, können wir durch eine Lexikonregel jedem Zeichen eine Menge von Monemen zuordnen und durch Auswahl aus dieser den Sätzen (177) und (178) die Struktur (176) zuordnen: (177) Meine sehr schlechte Grammatik gefällt diesen Leuten nicht. (178) Dieser gut gebaute Mann verschmäht heute keine Zigaretten. A l s Grundlage für eine Grammatik, die solche Satzstrukturen erzeugt, definieren wir Dependenz und Abhängigkeit. Wir verwenden dazu folgende Zeichen: " D ( k j , kg)" für k2 ist dependent von k , " A ( k p k 2 ) " für k2 ist abhängig von k2", "l(k2, k 2 ) " für kJ ist interdependent mit k2, und " E f k ^ " f ü r k1 ist
die
einflussreichste
Kette
dieser
Stufe.
Sei A ein Vokabular von Monemen und L c A* k x € L , k j k j ^ k - 6 L : (179) D f k ! , ^ ) = def ^ k g k j ^ L (180) I f k ^ k g ) = def D ( k 1 , k 2 ) A D(k 2 ,k 1 ) (181) A ( k x , k 2 ) = def ( D ^ , k 2 ) A -D(k 2 , k ^ ) V (I(k x , k 2 ) A E ( k x ) ) Dabei bedeutet, daß k^ der einflußreichste Knoten ist, wenn von ihm die meisten Dependenzen ausgehen, in Graphen: wenn in ihm die meisten Kanten anstoßen. Nach (18C) ist die Interdependenz ein Sonderfall der Dependenz, sozusagen Dependenz in beiden Richtungen. Bei Interdependenz ist weder zugelassen k^kjkj noch kjk 2 kj, wohl aber kjkj und k.k^kgkj. Diese Definitionen gelten nicht nur für Endketten, sie können auch übertragen werden auf Ketten aus dem Hilfsvokabular, z. B. D(N, Adj). Man müßte sie noch einschränken, so daß man Dependenz nur für Unterketten gleicher Stufe annimmt. Übungen 60 (182)
Mein sehr großes Ungeschick
kl k2 k3 k4 sei ein Element des Deutschen. Wir wollen annehmen D(k 4 , kg) und -D(kg, k 4 ). Danach müßte aber gemäß (179) k^kgk^ 6 L gelten, was fürs Deutsche nicht zutrifft. Wie kann man trotzdem unsre Annahme halten? 61 Schreiben Sie eine Dependenzgrammatik, die deutsche Sätze erzeugen kann mit Subjekt-Prädikat-Akkusativobjekt-Struktur, wobei als Subjekt und Objekt Art N und Sätze der angegebenen Struktur zugelassen sind, z . B .
der Mann weiss, ärgert
dass die
Maus die
Katze sieht.
Dass die
Maus die Katze
sieht,
den Mann.
3.42 Formalismus für Dependenzgrammatiken Da unsere Grammatik ( D l ) nicht die Reihenfolge der Moneme in der Kette miterzeugt, verwendet man im allgemeinen für Dependenzgrammatiken eine andre Regelform: (183) X . ( X Xj2 * X )
65
Diese R e g e l gibt die Abhängigkeit der E l e m e n t e X j ^ von X^ an. Der zweite Index bei X . . bezeichnet die S t e l l e , an der ein Zeichen in d e r Kette steht, jk und der Stern hält den Platz f r e i für das regierende E l e m e n t , das ja in der Kette nicht an e r s t e r Stelle stehen muß. Neben Regeln d e r F o r m (183) gibt e s noch R e g e l n : (184) * ( X i ) (185) X i ( * ) (184) gibt an, daß X^ in e i n e m Satz nicht r e g i e r t wird. E s heißt dann z e n t r a l e s E l e m e n t . F o r m a l kann man das zentrale Element definieren durch: k^ sei z e n t r a l e s E l e m e n t genau dann, wenn g i l t : (184a) g k i V k ^ - A i k i , k x ) A V k j i - A i k ^ k j ) =>kj = k j ) ) (185) gibt an, daß X j kein a n d e r e s Element r e g i e r t , a l s o Endzeichen i s t . Eine Dependenzgrammatik kann definiert werden durch ein Quintupel: DG = (H, E , z, Z, D), wobei H das Hilfsvokabular, die Menge der kategorialen Symbole i s t , E die Vereinigung der syntaktischen Kategorien, a l s o die Menge der Moneme e i n e r Sprache, z ein ausgezeichnetes E l e m e n t aus H, das zent r a l e E l e m e n t , Z eine Zuordnungsfunktion, die den Zeichen aus H Moneme zuordnet, und D eine Menge von Regeln der F o r m (183), (184) und (185). F ü r Dependenzgrammatiken sind sowohl generative wie auch rekognitive A l gorithmen entwickelt worden. Wir wollen j e t z t beide s k i z z i e r e n . 3.43 B e i s p i e l e einer f o r m a l e n Dependenzgrammatik. Erzeugung Nehmen wir an, e s sei folgende Grammatik gegeben: (186) * (X-) (1) Xi(Xjl,Xj2,*,Xj3) (2) Xjl(Xki,*,Xk2) (3) Xj2(*) (4) Xj3(*) (5) Xkl(*) (6) xk2(*) (7> Will man mit diesen Regeln eine Satzstruktur erzeugen, so beginnt man mit dem zentralen Knoten, a l s o mit der R e g e l , die mit " * " beginnt. W i r schreiben d i e s e s Zeichen hin. Dann sucht man die R e g e l , in der das Zeichen a l s r e g i e rendes Zeichen, a l s o vor d e r Rundklammer steht, in u n s e r m F a l l (2). D i e s e s V e r f a h r e n wird für alle Zeichen in der K l a m m e r von (2) f o r t g e s e t z t , bis wir zu e i n e r R e g e l der F o r m (185) kommen. Im Graphen m ü s s e n wir j e w e i l s vom regierenden Knoten zu j e d e m r e g i e r t e n eine Kante e i n t r a g e n . W i r erhielten folgenden Graphen:
66
Will man Sätze d i e s e r Struktur e r z e u g e n , so muß man noch die B e l e g u n g s r e g e l n benutzen, die j e w e i l s ein E l e m e n t aus der K a t e g o r i e anhängen an den Knoten mit dem j e w e i l i g e n K a t e g o r i e n s y m b o l . Die in (187) g e n e r i e r t e Kette wäre
62 S c h r e i b e n Sie die Dependenzgrammatik a u s Übung 61 um in Regeln der F o r m (183). Geben Sie auch B e l e g u n g s r e g e l n an. 63 Nehmen S i e an, die Regeln d e r F o r m (183) s e i e n so v e r ä n d e r t , daß m i t t e l s R u n d k l a m m e r n fakultative E l e m e n t e gekennzeichnet würden. E s wäre X1((X2),*,X3) eine Abkürzung für die alternativen Regeln Xi(X2.*,X3) Xj^.Xg) a m n Moneme der K a t e g o r i e A n , a l s o E s seien a ^ , a ^ » • • • > 2 l > a 2 2 , j e d e s Monem £ Aj. a
S c h r e i b e n Sie eine Dependenzgrammatik, die folgende Ketten e r z e u g t : a12; a 1 3 a i 2 ' a12a15> a13a12al5» a 1 l a 1 3 a I 4 a 1 2 a 1 5 ' a22; a 2 3 a 2 2 - • • a b e r nicht: a u a 1 3 ; a 1 3 ; a n a 1 3 a 1 4 ; a 1 5 ; a ^ a ^ ; a 2 1 a 2 3 ; . . .
a
32
Ordnen Sie dabei a l l e Moneme a y e i n e r K a t e g o r i e A j zu. 3.44
Rekognition
D a s rekognitive V e r f a h r e n geht den Weg, der bei d e r Erzeugung e i n e r Kette gegangen wurde, sozusagen wieder zurück. Wir m ü s s e n a l s o die Kette bis zu e i n e m nach d e r G r a m m a t i k möglichen Zentralknoten zurückverfolgen. Kommt d i e s e r Knoten in e i n e r R e g e l der F o r m (184) v o r , dann i s t die Kette akzeptiert. W i r wollen das an u n s e r e r Kette (188) z e i g e n . Dazu s c h r e i b e n w i r die Kette hin und kennzeichnen die Z e i c h e n , die in e i n e r R e g e l d e r F o r m (185) v o r kommen: ^ # „ # (188a) X k l X j l X k 2 X ; j 2 X i X j 3 Nun suchen w i r eine R e g e l , die auf einen T e i l der Kette anwendbar i s t . (2) i s t nicht anwendbar, weil s i e die Reihenfolge X j ^ X j 2 . . . enthält, u n s r e Kette (188a) a b e r X j i X k 2 X j 2 . . . A b e r (3) ist anwendbar. W i r nehmen eine A r t Kürzung (189) v o r , in d e r nur das r e g i e r e n d e E l e m e n t übrig bleibt, und e r h a l t e n : *
x
jl
(xkl'xk2-*)
*
*
*
(3a)
67 e n t h a l t e n , dann könnten w i r d i e s e h i e r nicht anwenden, weil die Reihenfolge r e l e v a n t i s t und von d e r in d e r Kette v e r s c h i e d e n . Auf (188a) w ä r e a b e r z . B . eine R e g e l x X (2a) i (Xk2' x j 2.*> i2 a n w e n d b a r , wenn u n s r e G r a m m a t i k sie e n t h i e l t e . Sie w ü r d e jedoch nicht zu e i n e r w e i t e r e n Kürzung g e m ä ß den a n d e r n Regeln f ü h r e n und damit auf keinen F a l l zu e i n e r A k z e p t i e r u n g d e r Kette (188). Denn d a f ü r ist V o r a u s s e t z u n g , daß m a n überhaupt einen Z e n t r a l k n o t e n f i n d e t . Nun s u c h e n w i r eine R e g e l , die auf (189) anwendbar i s t , und zwar n u r auf die nicht g e k ü r z t e n Zeichen. (2) ist a n w e n d b a r . Wir b e k o m m e n , weil (2) v i e r Z e i c h e n enthält, in e i n e m S c h r i t t : (190)
Nach (1) kann X. Zentralknoten sein. A l s o i s t (188) von u n s r e r G r a m m a t i k a k z e p t i e r t . Nicht a k z e p t i e r t w ä r e (188) von e i n e r G r a m m a t i k , die statt (3) die R e g e l (3a) e n t h i e l t e . 3.45 Projektivität E s i s t f r a g l i c h , ob m a n m i t e i n e r G r a m m a t i k a u s Regeln d e r F o r m (183), (184), (185) alle Sätze e i n e r n a t ü r l i c h e n S p r a c h e e r z e u g e n kann, so daß m a n die E n d kette d u r c h P r o j e k t i o n d e s D e p e n d e n z g r a p h e n nach unten e r h ä l t . Ein Satz heißt p r o j e k t i v , wenn in d e r P r o j e k t i o n die P r o j e k t i o n s l i n i e n w e d e r Dependenzkanten noch P r o j e k t i o n s l i n i e n s c h n e i d e n . Eine G r a m m a t i k heißt p r o j e k t i v , wenn sie n u r p r o j e k t i v e Sätze e r z e u g t . P r o j e k t i v i s t (191), nicht projektiv sind (192), (193), (194): (191) X2
X4 Xl
X2
X3
X4
x3
x4
X5
(192)
X'l
x2
X5
68 (193)
(194)
i i i i i i i i
Xi
0
1 lJ
i
x2
x3
-_
^-
x4
x5
Die Bedingung dafür, daß ein Dependenzgraph projektiv ist lautet unformal: Wenn ein X j nicht zu einem von X dominierten Zweig gehört, zu dem aber X j und X k gehören, dann kann X . nicht zwischen X^ und X k stehen oder anders formuliert: wenn X j zwischen X^ und X^ stehen soll und es einen Weg gibt von X i nach unten zu X k > dann muß es einen Weg von X j nach unten zu X j geben. (195)
In (195) kann X j auf keinen F a l l zwischen X j und X k projiziert werden, wenn e s nicht tiefer als X steht, genauer: von X oder X j oder X k aus nach unten erreichbar ist. Das gleiche gilt, wenn X^ und X oder X k und X vom gleidhen Knoten regiert werden. Empirisch machen zusammengesetzte Prädikate Schwierigkeiten, wenn man sie in projektiven Dependenzgraphen darstellen will. So wäre der Graph für (196) Von niemandem wird der stille Mann gesehen, nicht projektiv: (196a) "Hl Mann
seh
69 Es wäre aber möglich, ihn projektiv darzustellen. Nur müßte man dann andre Abhängigkeiten annehmen. Ob sich diese Annahme auch anders rechtfertigen läßt, ist fraglich: (196b) wird
Übungen 64 Zeichnen Sie Dependenzgraphen für folgende Sätzteile und stellen Sie fest, ob s i e p r o j e k t i v sind: ein ausserordentlich uns verbessert werden können; über diesen
gut gelungener Scherz; hätte von gepflegten Gästen von gestern.
65 Ändern Sie (194), so daß er projektiv wird. 3, 5
Verstärkung von Phrasenstrukturgrammatiken
Die bisher behandelten kontextfreien Grammatiken reichen nicht aus, um natürliche Sprachen angemessen zu beschreiben. Es wurde deshalb versucht, an ihrer Stelle kontextsensitive Grammatiken zu benutzen. Da aber auch diese nicht allen Ansprüchen genügen und außerdem theoretische Schwierigkeiten mit sich bringen und sehr kompliziert würden, versucht man heute allgemein, mit kontextfreien Grammatiken einen T e i l der zu beschreibenden Sprachen zu beschreiben, und zusätzlich andre Komponenten der Beschreibung anzunehmen, die Regeln andrer A r t enthalten. Für sie stellen sich v o r allem zwei empirische Aufgaben: (i) Sie sollen es ermöglichen, daß die Grammatik eine ausreichende Basis für eine semantische Beschreibung einer Sprache ist, (ii) sie sollen Zusammenhänge zwischen bestimmten Sätzen einer Sprache beschreiben. Da auch Phrasenstrukturgrammatiken Zusammenhänge zwischen Sätzen beschreiben, nämlich durch die Zuordnung gleicher und verwandter Strukturen, sind die hier gemeinten Zusammenhänge genauer zu spezifizieren. Im allgemeinen werden als Zusammenhänge, die über den Zusammenhang der konstitutionellen Struktur hinausgehen, solche zwischen folgenden Satzpaaren angesehen: (197a) (197b) (198a) (198b) (199a) (199b)
Jerry sieht den Zusammenhang. Der Zusammenhang wird von Jerry gesehen. Dienstag folgt auf Mittwoch. Mittwoch kommt vor Dienstag. Klaus übernachtet im Freien. Seine Übernachtung im Freien hat Folgen.
70 3.51 Definition von Transformationsregeln A m weitesten entwickelt sind die formalen Mittel zur Erfüllung der Aufgaben (i) und (ii) in der Transformationsgrammatik. Sie enthält eine Komponente, in der Strukturen mit einer KF-PSG erzeugt werden, und eine weitere, in der diese Strukturen in andre umgeformt werden können. Die Regeln, die diese Umformungen bewirken, heißen Transformationsregeln. Transformationen ( T ) werden durch Regeln der folgenden F o r m beschrieben: (200) x i => x 2 Dabei ist der Doppelpfeil wie der einfache eine Anweisung, daß die links von ihm stehende Kette durch die rechte wiedergeschrieben wird. Der Doppelpfeil wird hier nur benutzt, um T-Regeln von PSG-Regeln zu unterscheiden. Der wichtige Unterschied zwischen Regeln der Form (136a) und solchen der F o r m (200) ist, daß in T-Regeln auf beiden Seiten Ketten aus mehr als einem Zeichen stehen. Zusätzlich muß die Kette x j im Bezug auf einen Konstitutionsgraphen und damit auf eine Grammatik analysierbar sein. Das soll folgendes heißen: Sei zum Beispiel x^ eine Endkette aus den Teilketten ki k 2 . . . kjj, dann muß jedes k^ dominiert werden von einem A^ in einem Konstitutionsgraphen. Darum kann eine Transformation auch in einfachen Fällen für die Strukturbeschreibung A^, A 2 , . . . , A n formuliert werden. Sie ist dann anwendbar auf alle Ketten, die nach A^, Ag, . . . , AJJ analysierbar sind. Weil strenggenommen auch für x 2 die Analysierbarkeitsbedingung gelten muß, kann eine Transformation als Abbildung eines Konstitutionsgraphen auf einen andern verstanden werden. Beispiel 60 Die T - R e g e l (201) NOM~P"A DV => AD V~P~NOM würde aus dem Konstitutionsgraphen (202) den Graphen (203) ableiten können und analog für alle mit (202) strukturgleichen Graphen: (202) S
er
t
komm
S
(203)
heute
V
komm
VM
PR
er
71
Graphentheoretisch ist diese Operation als Subtraktion und Zusammenheften von Untergraphen zu erklären. T - R e g e l n werden folgendermaßen f o r m u l i e r t : Man gibt zuerst eine Strukturbeschreibung (SB), die eine nach einer PSG analysierbare Zeichenkette ist, und dann die durch die Transformation bewirkte Strukturänderung (SV), in der die Zeichen der SB durch Z i f f e r n symbolisiert werden: Beispiel 61 SB: N P ~ V ~ V M N P SV:
1
2
3
4
4 " werd '?Tge~2en
"l
Abgekürzt schreibt man dafür auch N P ~ V ~ V M ~ N P ' => N P T w e r d " V M ~ g e V~en N P Die abgekürzte Schreibweise ist mißverständlich, weil die Unterscheidung der beiden " N P " durch Einstreichung nicht durch die PSG gerechtfertigt w i r d . 3.52 Deletion. Substitution. Permutation W i r wollen nun die F o r m der wichtigen Transformationsarten (Deletion, Substitution, Permutation) darstellen und mit Beispielen für das Deutsche e r klären. Die Deletion (Tilgung) tilgt Elemente der Kette der SB in den entsprechenden Konstitutionsgraphen mitsamt den daranhängenden Knoten und Kanten, subtrahiert also Untergraphen. Ihre allgemeine F o r m ist: (204) SB X ] ~ X 2 ~ X 3 ~ X 4 SV 1 2 3 4 =»1004 Das bewirkt in dem entsprechenden Konstitutionsgraphen folgende Veränderun™'
Beispiel 62 Sätze mit zweiwertigem Prädikat und fakultativer zweiter E r gänzung können i m F a l l , daß diese ausgelassen ist, aus den vollständigen Sätzen abgeleitet werden. Dies geht nicht so, daß ein bestimmter Satz aus einem andern abgeleitet wird, sondern durch Regeln über die Strukturen. Eine solche Regel w ä r e (205) E f P 2 ~ E 2 * El~P22 Allerdings kann dies einfacher schon in der PSG vorgesehen werden durch (205a) X Ej P22( E2) Es müssen also besondere empirische Gründe für die Formulierung (205)
72 geltend gemacht werden. Im Gegensatz zu d i e s e r Deletion von E 2 steht der F a l l der echten E l l i p s e , wo ein b e s t i m m t e s Syntagma a u s g e l a s s e n i s t . Die Substitution e r s e t z t Z e i c h e n der SB durch andre in den entsprechenden Konstitutionsgraphen m i t s a m t den daranhängenden Knoten und Kanten. Ihre allgemeine F o r m ist: (206) S B X1~X2~X3~X4 SV 1 2 3 4 => 1 2 X 5 ~ X 6 D i e s e s Zusammenheften bewirkt in den entsprechenden Konstitutionsgraphen folgende V e r ä n d e r u n g :
B e i s p i e l 63 Wenn man die PSG so einrichtet, daß a l s Ergänzungen von Prädikaten nur Nominale möglich sind, kann man Ergänzungssätze an dies e r Stelle durch T r a n s f o r m a t i o n einführen. Sätze der Struktur (207) könnten dann aus Sätzen der F o r m (208) erzeugt werden: (207) Ich weiß, e r kommt. (208) Ich weiß diese T a t s a c h e . Die notwendige T - R e g e l w ä r e : SB NOM~P 2 2~NOM SV 1 2 3 => 1 2 S Die Permutation bewirkt die Umordnung von Zeichen d e r S B in den entsprechenden Konstitutionsgraphen mitsamt den dominierten Zweigen. Sie könnte auch a l s s p e z i e l l e Substitution b e s c h r i e b e n werden. I h r e allgemeine Form ist: (209) S B X 1 ~ X 2 ' ~ X 3 ~ X 4 SV 1 2 3 4 =»4321 D i e s bewirkt in den entsprechenden Konstitutionsgraphen folgende Änderung:
73 B e i s p i e l 64
Geht man davon aus, daß eine P S G f ü r s Deutsche die folgende
Reihenfolge d e r Satzglieder erzeugt: (210)
E1~P~E2"ADV,
dann könnte man durch eine T - R e g e l die Spitzenstellung des A d v e r b s mit gleichzeitiger Inversion folgendermaßen b e s c h r e i b e n : (211) SB
E1~P"E2~ADV
SV
1
Damit würde z . B .
2 3
4
=>4213
(212) erzeugt aus (213):
(212)
Heute sieht e r ihn.
(213)
E r sieht ihn heute.
Übungen 66 Schreiben Sie eine PSG, die unter anderem folgende deutschen Sätze e r zeugt, a b e r keine abweichenden: P a u l ist g r o ß . E m i l ist klein. E m i l ist sehr g r o ß . Paul ist so g r o ß . Paul ist so groß wie E m i l . E m i l ist g r ö ß e r a l s Paul. P a u l ist viel kleiner a l s E m i l . Schreiben Sie die P S G um, indem Sie zusätzlich T - R e g e l n v e r w e n d e n . 67 Gegeben seien folgende Konstitutionsregeln f ü r einen T e i l des Deutschen: [S, E 1 + V + V M + E 2 ] [ %
a
NOM./ES]
(1) (2)
[NOM-, A R + A R M + A D J + A M + N + N M + N O M 4 ]
(3)
[ES, E T + S]
(4)
F o r m u l i e r e n Sie T - R e g e l n , die andre mögliche Verkettungen des Deut-
schen beschreiben a l s die, die man erhält, wenn man die in den Konstitution sregeln angegebene Reihenfolge einhält: b
Ä n d e r n Sie (1) a b in [S, E 1 + V + V M + E 2 + P T ] ,
(5)
so daß zusammengesetzte P r ä d i k a t e erzeugt w e r d e n wie in er hat ihn gesehen ( P T = P a r t i z i p P e r f e k t ) , und geben Sie dann weitere V e r k e t t u n g s regeln. 3.60
V o r a u s s e t z u n g e n d e r Phonemik
A l s wichtiger Bestandteil einer universalen Sprache f ü r phonemische B e schreibungen w i r d eine Menge M von M e r k m a l e n angesehen, mit denen man Phoneme b e s c h r e i b e n kann. D i e s e M e r k m a l e w e r d e n gewonnen aus den Eigenschaften d e r geäußerten L a u t e d e r natürlichen Sprache, d e r e n Abgrenzung a l s Typen wiederkehrender Ausschnitte aus Kontinuen w i r h i e r v o r a u s s e t z e n . A m geläufigsten ist die Methode, daß man die M e r k m a l e a l s relevante
74 ( a . d i s t i n k t i v e ) E i g e n s c h a f t e n d e r Laute gewinnt, wobei die Relevanz f e s t g e s t e l l t w i r d durch V e r g l e i c h m i t a n d e r n L a u t e n . Sei E eine Menge von E i g e n s c h a f t e n e^ und e^ eine E i g e n s c h a f t von E^ und e 2 eine von E2. Dann sind e ^ und e 2 r e l e v a n t e E i g e n s c h a f t e n f a l l s (i) E J - E 2 = 16j j A E 2 ~ E l = | e 2 l (ii) e s eine L a u t k e t t e gibt, in d e r d e r A u s t a u s c h von E^ gegen E 2 eine Bedeutungsänderung bewirkt. (iii) a E i i e j « E. A - ( e 2 6 Ej)) Die d r i t t e Bedingung s i c h e r t , daß die E i g e n s c h a f t e n e j und e 2 unabhängig s i n d . F a l l s sie nicht unabhängig sind, können sie in e i n e m M e r k m a l z u s a m mengefaßt werden. Die M e r k m a l e m^ a u s M können dabei a k u s t i s c h z . B . ' k o m p a k t ' , 'dunkel' oder artikulatorisch, z . B . ' n a s a l ' , 'gerundet' beschrieben werden. E s i s t behauptet und b i s h e r nicht w i d e r l e g t w o r d e n , daß m a n z u r B e s c h r e i b u n g n a t ü r l i c h e r S p r a c h e n mit e i n e r Menge M von 12 E l e m e n t e n a u s k o m m e und j e d e s P h o n e m d u r c h die Angabe b e s c h r e i b e n könne, ob ein M e r k m a l m^ v o r liegt o d e r nicht, u . z w . so, daß " + m j " d a s V o r l i e g e n des M e r k m a l s m^ und d a s k o n t r a d i k t o r i s c h e " - m ^ " d a s N i c h t - V o r l i e g e n von m^ b e s c h r e i b t . D i e s e r s o g . B i n a r i s m u s i s t oft k r i t i s i e r t w o r d e n . Doch w ü r d e das Z u t r e f f e n d i e s e r K r i t i k n i c h t s an u n s e r e n f o r m a l e n Überlegungen ä n d e r n , i n s b e s o n d e r e nicht d i e F r a g e , welche E i g e n s c h a f t m a n dem positiv a u s g e z e i c h n e t e n M e r k m a l z u o r d n e n und w e l c h e dem negativ a u s g e z e i c h n e t e n , da dies eine Konvention i s t , die m a n d u r c h Umbenennung ä n d e r n kann, indem m a n etwa " - m 2 " f ü r " + m i " verwendet. J e d e s P h o n e m e i n e r n a t ü r l i c h e n Sprache i s t nun b e s c h r e i b b a r a l s eine U n t e r m e n g e P^ von M, a l s o P j c M, die man m e i s t e n s voll s p e z i f i z i e r t , i n d e m m a n d u r c h " - m ^ " auch angibt, welche E l e m e n t e sie nicht enthält. Da und -m^ k o n t r a d i k t o r i s c h e M e r k m a l e sind, kann e s in d i e s e r S c h r e i b w e i s e kein P h o n e m P^ = i . . . , -m^, . . . | g e b e n . Die volle S p e z i f i z i e r u n g ä n d e r t n i c h t s an u n s e r e n w e i t e r e n Überlegungen und Definitionen. Deshalb w e r d e n w i r s i e auch ö f t e r benutzen. A l s Zeichen f ü r Phoneme v e r w e n d e n w i r G r o ß b u c h s t a b e n o d e r phonetische Zeichen z w i s c h e n S c h r ä g s t r i c h e n , z . B . / £ / . B e i s p i e l 6 5 Die d e u t s c h e n Vokale u, o, i kann m a n wie folgt b e s c h r e i b e n : U = j+dunkel, - k o m p a k t , + t i e f } , O = i + dunkel, + k o m p a k t , + t i e f ! , I = j - d u n k e l , - k o m p a k t , -tief i. Die Menge a l l e r möglichen P h o n e m e ist d e m g e m ä ß i d e n t i s c h m i t d e r P o t e n z m e n g e "P(M) von M, d . i . die Menge a l l e r U n t e r m e n g e n von M. B e i s p i e l 66 Die P o t e n z m e n g e von X = { m ^ m 2 , m 3 | i s t f (X) = ¡0, ¡ m i i , \ m 2 i > I m 3 ! > i m 1 , m 2 ! , | m 2 , m 3 ) , | m 1 , m 3 | , f n i j , m 2 , m 3 j !.
75
Die l e e r e Menge, die ja auch Element von tp(M) ist, würde als Pause interpretiert. Da die Anzahl der Untermengen einer Menge mit n Elementen 2 n ist, würde eine universale Menge von 12 Merkmalen Phoneme beschreiben können. 3.61 Oppositionen und Korrelationen In jeder einzelnen Sprache L^ ist jeweils nur eine Untermenge PS^ von f(M) zugelassen, die wir auch das Phonemsystem von L^ nennen. Dies ist z . T . bedingt durch Redundanzen, die es ermöglichen, daß bei Vorliegen eines Merkmals m^ auch ein anderes, etwa m 2 , vorliegen muß. Eine solche R e dundanz ist etwa bei den meisten deutschen Konsonanten, daß mit '+dauernd 1 i m m e r ' + w e i c h e r Abglitt 1 vorkommt. Die Elemente von PS- werden i . a . e r mittelt durch eine kontrastive Methode, auf die wir hier nicht näher eingehen. PSj_ hat im Vergleich zu *p(M) nur wenig Elemente, z . B . im Deutschen etwa 36. PS^ hat meistens eine innere Struktur, deren Beschreibung die Beschreibung von PS^ v e r b e s s e r t . Diese Struktur beruht auf bestimmten Beziehungen der Pj € PS^, die wir mittels Oppositionen beschreiben können. Die a m häufigsten benützten Opposistionen wollen wir noch einmal i m Zusammenhang definieren: (214) PO(P^, P 2 ) = def P x c P 2 v P 2 c P l (215) A O ^ , P 2 ) = def P j n P 2 / A Pj ^ P2 A i 0 AP2 f 0 (216) NO(P^, P 2 ) = def P j = P 2 (217) DO(P^, P 2 ) = def Px n P 2 = 0 A i 0 A P2 £ 0 E s gilt nach diesen Definitionen: (218) NO c PO. " P O " heißt privative Opposition, "AO" äquipollente Opposition, "NO" Nullopposition und "DO" disjunktive Opposition. P^ - P 2 und P 2 - P^ heißen die Differenzen einer Opposition. Seien X O ( P j ^ , P12) u n < ^ X O ( P 2 i , P 2 2 ) z w e i beliebige Oppositionen, dann sagt man, sie seien proportional, wenn gilt: (219) P n - P 1 2 = P 2 1 - P 2 2 u n d (220) P 1 2 - P n = P 2 2 - P 2 1 Den Satz (221) nennt man dann eine Proportion: (221) X O ( P n , P 1 2 ) ~ X O ( P 2 1 , P 2 2 ) . Beispiel 67 Sei P 1 1 = T = i - v o k a l . , + k o n s o n a n t . , + a n t e r i o r , + koronal, . . . , + g e s p a n n t j P12=D= j - v o k a l . , + k o n s o n a n t . , + a n t e r i o r , + k o r o n a l , . . . , -gespannt} P21 = ^ = f - v o k a l . , + k o n s o n a n t . , - a n t e r i o r , -koronal, + gespannt} P22 = ® = i_ v ° k a l . , +konsonant., -anterior, -koronal, . . . , -gespannt! Dann g i l t : T - D = l + g e s p a n n t } = K-G; D - T = |-gespannt i = G - K . Da gemäß (219), (220) die Differenzen identisch sind, gilt für (T, D) und (K, G) auch (221). Sie bilden eine P r o p o r t i o n .
76 Eine Opposition heißt isoliert, wenn sie mit keiner anderen Opposition proportional ist. Beispiel 68 Im Deutschen ist die Opposition (P, §) isoliert, da keine proportionale Opposition mit der Differenz P-S = ¡-dauernd, +vorn, -hoch} existiert, z . B . nicht (B, i,). Setzt man eine isolierte Opposition proportional fort, z . B . XO(B, P ) ~ XO(Y, S), so kommt man zu einem Phonem Y, das nicht in L^ existiert. Ein solches Y nennt man eine case vide (leeres Fach). Beispiel 69
Im Deutschen wäre Z eine case vide, wegen PO(P, S) ~ PO(B, Z).
A l l e Proportionen sind transitiv: (222) " X O ( P j , P 2 ) ~ X O ( P 3 , P 4 ) A X O ( P 3 , P 4 ) ~ X O ( P 5 , P g ) " => " X O f P j , P g ) ~XO(P5,P6)". Seien XO(P^, Pg), XO(Pg, P4), . . . Proportionen, dann heißt die Menge dieser Oppositionen eine Korrelation. Eine Korrelation im engeren Sinne liegt v o r , falls XO = PO. Beispiel 70 Eine Korrelation bilden die deutschen Phoneme T, D, K, G, P, B. Man schreibt sie gewöhnlich so, daß die Differenzen in Spalten untereinander stehen und die Basis der Proportion, das ist P 1 n Pg für POfP^, P ), auf der gleichen Zeile steht: T K P D G B Die Zeilen werden manchmal Serien, die Spalten Ordnungen genannt. Diese Unterscheidung wird durch Subklassifizierung der Merkmale begründet, da sich in der Waagrechten der Artikulationsort ändere, in der Senkrechten die Artikulationsart. Formal ist die Unterteilung nicht begründbar, weil man durch Änderung der Definition von Opposition und Korrelation auch zu einer Darstellung T D f| G P B kommen kann. Übungen 68 Machen Sie eine Merkmalsbeschreibung der deutschen Phoneme A , E , I, O, U unter Benutzung von W. G. Moulton, The Sounds of English and German, Chicago (III.) 1962, oder einer anderen Behandlung deutscher Vokale. Welche Oppositionen bestehen zwischen diesen Phonemen? 69 Stellen Sie eine Korrelation auf für /p/, /k/, /m/, /n/, /t/, /q/.
77 3.62
Distributionen
S e i PS^ d i e M e n g e d e r P h o n e m e e i n e r S p r a c h e L^ u n d k e i n e K e t t e v o n E l e m e n t e n a u s PSj, so daß k von P a u s e n begrenzt ist, dann ist d e r W o r t s c h a t z W^ v o n L . n i c h t d i e M e n g e a l l e r k , w e i l in L . n i c h t a l l e m ö g l i c h e n K e t t e n k z u bg e l a s s e n s i n d . E s i s t a l s o n i c h t W. = P S * , f a l l s w i r P S * a l s f r e i e s M o n i o d 1 1 1 ü b e r PS^ d e f i n i e r e n . B e i s p i e l 71 D a s d e u t s c h e P h o n e m s y s t e m e n t h ä l t d i e P h o n e m e P , T , G, a b e r P T G , G T P sind keine E l e m e n t e des deutschen W o r t s c h a t z e s . Nun kann m a n z w a r keine p h o n e m a t i s e h e n Regeln f o r m u l i e r e n , mit denen m a n g e n a u die Menge d e r W ö r t e r o d e r M o n e m e e i n e r n a t ü r l i c h e n S p r a c h e b e s c h r e i b e n kann, m a n kann a b e r R e s t r i k t i o n s r e g e l n f o r m u l i e r e n , die eine T e i l m e n g e v o n P S ? c h a r a k t e r i s i e r e n , die i h r e r s e i t s d e n W o r t s c h a t z a l s T e i l m e n g e e n t h ä l t . S o l c h e R e g e l n b e s t e h e n in d e r A n g a b e , d a ß b e s t i m m t e P h o n e m e o d e r P h o n e m k e t t e n nicht in d e r N a c h b a r s c h a f t a n d e r e r P h o n e m e o d e r P h o n e m ketten v o r k o m m e n können. B e i s p i e l 72 I m D e u t s c h e n k a n n X ( g e s c h r i e b e n h ) n i c h t v o r k o m m e n in d e r K e t t e 0 X L . E s g i b t a l s o k e i n e m i t hl a n l a u t e n d e n W ö r t e r . F a l l s k p k g , kg 6 P S ? u n d k } , k 2 , k g 6 L^, d a n n s a g t m a n , ( k j . k g ) s e i e i n i n Li z u g e l a s s e n e r Kontext von k 2 . B e i s p i e l 73 Sei k x = WU, k 3 = S T u n d k 2 = R , d a n n b i l d e t ( k p k g ) f ü r k 2 e i n e n i m D e u t s c h e n z u g e l a s s e n e n K o n t e x t , n i c h t h i n g e g e n f ü r k 2 = W. D i e M e n g e a l l e r P a a r e ( k p k g ) , d i e e i n e n f ü r k 2 i n L^ z u g e l a s s e n e n bilden, heißen D i s t r i b u t i o n D (a. V e r t e i l u n g ) von k 2 : (223) D ( k 2 ) = i O ^ . k a J l k j k g k g e L l . B e i s p i e l 74 (WU, S T ) .
Kontext
Z u r D i s t r i b u t i o n v o n W g e h ö r t i m D e u t s c h e n (O, E ) , n i c h t
aber
M a n k a n n a u f g r u n d d e r D e f i n i t i o n (223) v e r s c h i e d e n e R e l a t i o n e n z w i s c h e n d e n Distributionen je z w e i e r P h o n e m e d e f i n i e r e n : Z w e i P h o n e m k e t t e n k 2 i u n d k 2 2 s t e h e n in k o m p l e m e n t ä r e r V e r t e i l u n g g e nau dann, wenn gilt: (224) D ( k 2 1 ) n D ( k 2 2 ) = 0 B e i s p i e l 75 D i e d e u t s c h e n P h o n e m e / h / u n d / r ) / s t e h e n in k o m p l e m e n t ä r e r V e r t e i l u n g , / h / s t e h t n u r i m A n l a u t ( a l s o 0H. . .) u n d v o r V o k a l e n a u ß e r u n b e t o n t e m E u n d I, / q / v o r u n b e t o n t e m E u n d I, i m A u s l a u t u n d v o r K o n s o nanten.
78
Zwei Phonemketten k2^ und k^^ stehen in identischer Verteilung genau dann, wenn gilt: (225) D ( k 2 1 ) = D(k 2 2 ). Beispiel 76 Die deutschen Phoneme A und O stehen in identischer V e r t e i lung, da A in den gleichen Kontexten vorkommt wie O. Zwei Phonemketten k 2 j und k 2 2 stehen in teilkomplementärer Verteilung genau dann, wenn gilt: (226) D(k 2 1 ) ^ D(k 2 2 ) A D ( k 2 1 ) 0 D(k 2 2 ) ^ 0 Beispiel 77 Die deutschen Phoneme /n/ und /q/ stehen in teilkomplementär e r Verteilung. Sie haben einige Kontexte gemeinsam, z . B . in sinnen: singen,
rinnen:
ringen,
h i n g e g e n kann v o r /k/ nur
Ranke und i m Anlaut nur /n/, z . B .
niemand,
/q/ stehen, z . B .
Tank,
null.
Zwei Phonemketten stehen in defektiver Verteilung genau dann, wenn gilt: (227) D ( k 2 1 ) c D ( k 2 2 ) V D ( k 2 2 ) c D ( k 2 1 ) A D(k 2 1 ) ^ D ( k 2 2 ) Beispiel 78 Die deutschen Phoneme G und K stehen in defektiver Verteilung. Im Anlaut nach S steht nur K und ebenfalls im Auslaut, sonst haben sie gleiche Kontexte. Die Regeln über die kontextuelle Verträglichkeit von Phonemen kann man abstrakter formulieren, wenn man den inneren Aufbau der Phoneme berücksichtigt. So ist das Beispiel 72 nur ein Sonderfall einer Regel fürs Deutsche, die besagt, daß nach 0X kein Phonem folgen kann, das ein Merkmal ' - v o kalisch 1 enthält. Übungen 70 Geben Sie einen Kontext an, in dem zwar A stehen kann, nicht aber N. 71 Nennen Sie deutsche Phoneme, die nicht im Kontext (/s/, /l/) stehen können. 72 In welcher Art von Verteilung stehen /x/ und /?/ im Deutschen? ( / x / e n t s p r i c h t d e m ch
in Nacht, /g/ dem ch in nicht
).
73 Sei X eine Variable für Phoneme. Welche der folgenden Kette sind im Deutschen zugelassen: XD0, XK0, XO0, XB0, XT0, XG0? 3.63 Generative Regeln Die kontextuellen Verträglichkeiten beschränken sich nicht auf generelle Aussagen wie in 3.62. Es kommt nämlich nicht nur vor, daß Phoneme in bestimmten Kontexten nicht stehen können, sondern auch, daß sie sich in bestimmten Kontexten regelmäßig verändern. Zur Beschreibung der Veränderung von Phonemen durch ihren Kontext kann man Ersetzungsregeln der folgenden
79
Fbrm verwenden: (228) P x -* P 2 / X Y Diese Regel besagt, daß P^^ im Kontext (X, Y ) ersetzt wird durch P 2 . Man könnte mit ihr die Veränderung von G zu K im Kontext 0 beschreiben. Der Kontext braucht dabei nicht nur phonematisch angegeben zu sein. Er kann auch syntaktische Merkmale enthalten in der F o r m indizierter Klammern, wie wir sie in (160b) eingeführt haben: (229) P x P 2 /X Y]k Beispiel 79 Eine syntaktisch bedingte Phonemänderung liegt im Deutschen v o r , wenn wir aus dem Adjektiv kalt ein Verb bilden . Wir müssen dabei das Phonem A ändern je nach der syntaktischen Kategorie des resultierenden V e r b s : Ist es einwertig, so bleibt A : (230) Die Suppe erkaltet. Ist es zweiwertig, so wird A durch E ersetzt: (231) Man erkältet sich leicht. W i r könnten das in der folgenden, allerdings sehr speziellen Regel formulieren (P22 = zweiwertiges Prädikat, VM = Verbalmorphem): (232) A -* E/[ erk lt VM]p22 Eine derartige Erweiterung der kontextuellen Regeln wird deshalb notwendig; weil man bei der Beschreibung der Sätze einer Sprache mindestens zwei Komponenten annimmt, einerseits die Syntax, die z . B . in einem der behandelten Formalismen geschrieben sein kann, andererseits das Lexikon, in dem die kleinsten bedeutungstragenden Einheiten (Moneme) nach syntaktischen Kategorien geordnet aufgezählt sind. Für die Moneme muß im Lexikon eine phonematische und eine semantische Beschreibung vorgesehen sein. Da nun aber bei der syntaktischen Kombination von Monemen sich deren phonematische Beschreibungen ändern können, müssen für diese Veränderungen eigene Regeln vorgesehen sein, u.zw. solche, die u.U. auch syntaktische Merkmale berücksichtigen. Ähnlich wie bei den syntaktischen Regeln in 3.15 können wir auch hier abkürzende Schreibkonventionen einführen. In Analogie zu (a) und (b) in 3.15 nehmen wir an, daß (233) P 1 ^ P 2 / X 1 ( X 2 ) eine Abkürzung ist für (233a) P : -* P 2 / X 1 X 2 Yl P l - P2/X1
Y1
und Y1 (234) P i - P 2 / { x ^ } eine Abkürzung ist für Y1 (234a) P x -» P 2 / X l X Y1 P l "" P 2 / '2 Außerdem kann man mehrfache Kontextbedingungen angeben. Nach (137) ist
80 (228) eine andre Schreibweise f ü r (228a) X P j Y - » X P 2 Y . Demgemäß wäre eine Regel mit doppelter Kontextbedingung (235) P 1 - » P 2 / X 1 X2/Y1 Y2 eine andre Schreibweise für (235a) Y 1 X 1 P 1 X 2 Y 2 -* Y 1 X 1 P 2 X G Y 2 , wie die zweimalige Anwendung der Äquivalenz von (233) und (233a) zeigt. Die Schreibweise (235) hat den V o r t e i l , daß man bestimmte Regeln einfacher schreiben kann. Z . B . kann man zwei Regeln wie (236) P 1 ^ P 2 / X 1 X 2 PX P2/X1X2 zusammenfassen zu
X30 x3x4
( 2 3 6 a ) P ^ P 2 / x 2 _ x 3 / { $ i - | 4 } Neben den bisher eingeführen Zeichen benutzt man noch grenze und " + " für eine Monemgrenze.
für eine Wort-
Beispiel 80 Für die Formulierung der Regel, daß X im Deutschen nach hellen Vokalen /g/ entspricht, muß die Monemgrenze berücksichtigt werden, da nach + auch /?/ steht, etwa /tauxan/ mit /x/ und /tau+^an/ 'kleines Tau' mit / f / . Die Zeichen Pj^ in (228) fassen wir als Abkürzungen auf für Mengen von Merkmalen, die wir in Eckklammern untereinanderschreiben. Dann könnte z . B . (228) so geschrieben werden: (237) +mi -m2 +m 3 -Hn | +m 4 -m4 +mj +m 2 m 2 / • • -m3 m • + 5. -mn -mn Eine solche Darstellung hat den erheblichen V o r t e i l , daß sie gleichartige Veränderungen verschiedener Phoneme in einer Regel beschreiben kann, weil eine Regel, die für eine Untermenge U von f ( M ) formuliert ist, auf alle Untermengen von f ( M ) angewendet wird, die U als Untermenge haben. Sei z . B . P j = l+mx, +m 2 , +m 3 , - m 4 ) I - m 1 , +m 2 , +m 3 , +m 4 j P 3 = l - m i , +m 2 , +m 3 , +m 4 , - m g ! p 4 = i + n n . +m 2 , +m 5 , - m 6 | +m 9 , +mc. + m 6 ! p5 = Dann würde durch (238) -m2 +m 2 " +m2 +m 3 +mr. — +m c
81
im Kontext (X, P^und (X, P^) P 1 verändert zu P ^ = l + m ^ - m 2 , - m 4 , +m 7 |, P 2 zu P 2 1 +m 7 }.
+mn
und Pg zu P3^ =
- m j , +m,j,
_m5»
Beispiel 81 Ein solcher Fall ist der Umlaut im Deutschen, der nicht nur in der Ersetzung A -» E/ X besteht, sondern ähnlich auch bei andern umlautfähigen Phonemen auftritt. Deshalb kann in einer Regel der Umlaut a l l gemeiner beschreiben werden. Eine solche Regel wäre: +vokal. +vokal. (239) -konsonant. -konsonant. +hinten -hinten /X_ _+U miaut Sie würde A in E, U in Ü und O in Ö usw. überführen. (239) ist als Beschreibung der deutschen Umlautverhältnisse aber noch v o l l kommen ungenügend, weil der Umlaut einer Reihe noch näher zu spezifizierender Bedingungen unterliegt, die z . T . durch genaue Beschreibung des Kontexts (X, Y ) anzugeben wären. Dazu kommt, daß er nicht rein phonematisch beschreibbar ist. Er wird etwa durch ganze Suffixe bewirkt wie durch lieh in schwärzlich. Es müßte bereits im Lexikon gekennzeichnet sein, welche Moneme umlauten können und welche nicht, z . B . Wand - Wändchen, Tarnte - Tantchen. Dazu müßte das Merkmal [+Umlaut] aus (239) den Monemen im Lexikon mitgegeben werden. Will man all das einbeziehen, so müßte man auch den hier gebotenen Formalismus noch erweitern. Übungen 74 Formulieren Sie eine Ersetzungsregel für die in Übung 73 behandelte Änderung von G zu K, B zu P und D zu T im Auslaut deutscher Wörter. 75 Geben Sie eine Regel für die Alternation von E und I [+Alt] bei deutschen Verben wie geh (gebe: gibst). Kann diese Regel auch auf die Ausgabe von (239) angewendet werden?
Zusammenstellung wichtiger Formeln, Definitionen und Regeln
(4la)
x/a.d ' "p - q»
(42)
"p" «—p»
(15)
»-(p A -q)"
(43)
p
(44)
'p v q'' "q v p"
(45)
'(p 'p
(46)
q" "q
A
f ^. I Einsetzung von j a 0der d fÜr X
A
r"
a q) a
p"
Kommutativität
"p A (q
a
r)"
a q a r"
' (p v q) v r" "p v (q v r)"
Assoziativität
'p v q v r" (47)
'p v
(q a r ) " "(p v q) a
(48)
*p
(q v r)" "(p
(49)
'-(p v q)" ^
(50)
'-(P A q)" "-P V -q"
(51)
— 'p —
(52) (53)
a
"-p
- q"
'p v p" "p"
(56)
'p" S> "p v q"
(57)
'p A q" * "p" -p « q » => » p - q » '(p - q) '(p —
(61)
'(p
V
r)"
Distributivität
-q"
a
"-q - -p"
(55)
(60)
A
q" " (p - q) A (q - p) " » q — p »
•p A P" "p"
(59)
q) v (P
r)"
q"
(54)
(58)
a
(P v
q) q)
(q
A
A
A
(q —
r)" r)
-p" => "q"
"p - r" n
"p —
r"
Transitivität
83 (68)
"ExP(x) v 3xQ(x)" "3x(P(x) v
(70)
"VxP(x)" " -3x-P(x)"
(71)
"3xP(x)" " -Vx-P(x)
(72)
"-VxP(x)" "3x-P(x)"
(73)
" -3 xP ( x ) "
(87)
"Mi C
(88)
"M, = Ma"
(90)
"Mi und Ma überlappen sich "
"Vx-P(x)" Inklusion
Ma" "Vx(x e Mi - x e Ma)" "Mi C
Gleichheit
Ma A Ma
Yn]
Konstitutions regeln
Kategoriale Grammatik
cf~a\ß - ß
Kürzungsregeln
(169)
ß/oTa - ß
(179)
D ( k i , k a ) = def k . k i k a k . £ JJ
L A k.k3k. % JJ
(180)
I ( k i , k a ) = def D ( k i , k 2 ) A
D(ka,ki)
(181)
A(ki,ka) = def (D(ki,k a ) A - D ( k a , k i ) ) V
(I(ki,k a ) A
DG =
_
"[Yi,X,/X,]"
KG = (V,E,s,R,Z) (168)
zugelassene
L
E(ki))
(H,E,z,Z,D)
Dependenzgrammatik
86 (183)
"
(184)
•(X i )
(185)
xiC)
(204)
SS X 1 Xj X3 Xif
V Regeln einer DG
SV 1 2 3 4 = » 1 0 0 4 (206)
SB X 4 3 2 1
Permutation
(214)
P0(F,,P a ) = def F, c
(215)
AO(P1,Pa) = def P-,0 P a t 0 A P, / PjA
Pa V
FacP,
P1 / 0 A PaJ* 0
Private Opposition Squipollente Opposition
(216)
N O C P u P a ) = def P,= P a
Nullopposition
(217)
D 0 ( P 1 , P a ) = def P, n P a = 0 A P,
Disjuktive Opposition
i 0 A Pa * 0 (219)
P11 - Pia = Pa1 - Paaund
Bedingungen für Proportion
Pia - Pi 1 = P a a ~ P a i
Proportion
(221)
XO(P,,,P 1 a )^XO(P a l ,Paa)
(222)
"XO(P1 ,Pa)^X0(P3,Pi») A X0(P3,P p) (51) (41a, 42) - ( P A q) A - ( - q A - p ) ( - p V - q ) A (p V q) (50,43) ( 6 5 a ) - ( p V q) -p A -q (49) (57) "P 16 D i e l o g i s c h e Ü b e r s e t z u n g l a u t e t : ( 6 6 a ) M(x) -» Z ( x ) Z(a) M(a) D a " P ( x ) " a u s s a g t , d a ß d a s P r ä d i k a t " P " b e l i e b i g e n I n d i v i d u e n z u k o m m t , muß a u c h " P ( a ) " a l s o d i e B e h a u p t u n g f ü r ein b e s t i m m t e s I n d i v i d u u m w a h r s e i n , w e n n " P ( x ) M w a h r i s t . W i r können d e s h a l b den U n t e r s c h i e d d e r A r g u m e n t e in d e n d r e i Z e i l e n v o n ( 6 6 a ) a u ß e r a c h t l a s s e n und d e n B e w e i s a u f d i e F o r m (66b) bringen: (66b) p - » q q P D i e s e r B e w e i s w ä r e g ü l t i g , wenn e s eine I m p l i k a t i o n g ä b e : " ( p -» q) A q " = > " p " E i n e s o l c h e i s t nicht u n t e r d e n a n g e g e b e n e n I m p l i k a t i o n e n o d e r Ä q u i v a l e n z e n . D a r u m z e i g e n w i r m i t t e l s e i n e r W a h r h e i t s t a f e l , daß die V e r k n ü p f u n g " ( p -» q ) A q -» p " nicht a l l g e m e i n g ü l t i g i s t :
91
p q p q (p -» q) A q (P W w w w F w F F F w W W F F w F
q) A q -» p
W W F W Der Schluß wird trotzdem häufig gemacht, weil e r v e r w e c h s e l t wird mit
p-* q _p
q
der gültig i s t . 17 (78a) -3xVy(S(x) A Rd(y) K2(x,y)) 18 (79a) 3 x i ( B r ( X l , c ) A L ( x i ) A V x 2 ( B r ( x 2 , c)-» x i = x 2 ) ) Da in (7 9) mitgesagt wird, daß Churchill überhaupt und nur einen Bruder habe, genügt nicht a l s Übersetzung: (79b) 3 X i ( B r ( x i , c ) A L(x^)) 19 (80aa) 3xSE(x) (80ba) V X X 3 X 2 3 X 3 ( T ( X 1 , X 2 ) A T ( X 2 , X 3 ) A S(x 3 ) T ( x 1 # x 3 ) A S(x 3 )) ( 8 0 c a ) Vx J 3 X 2 ( P k ( x i ) P k ( x 2 )
AL(X2,XI»
20 (81aa) 3x(P(x) V Q ( x ) ) ; - v x - P ( x ) V - V x - Q ( x ) (81ba) Vx(P(x) A Q(x)); - 3 x - P ( x ) A - 3 x - Q ( x ) Die zweite und die v i e r t e Satzverknüpfung können nicht w e i t e r z u s a m m e n g e faßt werden. Wollte man die zweite etwa z u s a m m e n f a s s e n zu " - v x ( - P ( x ) V -Q(x))", käme man m i t t e l s (50) zu " - V x - ( P ( x ) A Q(x))" und w e i t e r mittels (71) zu M 3 x ( P ( x ) A Q(x))", w a s offensichtlich nicht mit der e r s t e n Satzverknüpfung äquivalent i s t . 21 (82a) 3 x i 3 x 2 ( M ( x i ) A M(X 2 ) A L ( X I ) A L ( X 2 ) A X 1 ^ x 2 ) D a s deutsche Artikelwort einige kann nicht einfach durch den Existenzquantor ü b e r s e t z t werden, da e i n mit " 3x" quantifizierter Satz schon bei der E x i s t e n z e i n e s einzigen x wahr s e i n kann, dagegen einige m i n d e s t e n s zwei voraussetzt. 22 M i = M 2 i M 3 , da 1 keine P r i m z a h l i s t . 23a Mi M 2 , weil M 2 an Stelle der zwei Elemente auf und gang von M j nur das eine Element aufgang enthält. b B = f s , i , f } . Da A s e c h s E l e m e n t e , B nur drei enthält, sind A und B nicht gleichmächtig. 2 4 M i = i ei,e,es,en\,
M2
=
) en },
M 3 = i en |, M 4 = | en,e,es
j. M 2 = M 3 .
Außer M 2 und M3 überlappen sich alle P a a r e , weil s i e d a s g e m e i n s a m e Element en enthalten. Es gilt w e i t e r M 2 M i , M 3 "D x € G ) A Vx(x 6G x €J)" " Vx(x6 D -» x €J)" Das ist nach (54) gültig. nach (87) 29 " D O ( M ! , M 2 ) " " M ! n M 2 = 0" "AO(M 1 , M 2 ) " " M i n M 2 ^ 0 A Mj f M 2 " 30 Die allgemeine F o r m einer Deklinationsform (DF) ist: DF = N x M , wobei M = K x U K 2 U K3 U K4. Nach Kasus geordnete DF sind: N x K i , N x K 2 , N X K 3 . Die umgekehrte Reihenfolge z . B . Kl x N ergäbe falsche Formen wie ermann statt minner. Mögliche P a a r e sind:
(haus,e),
(kind,e)
(kind,er), (kuhn,ern) , ...
31 "ist Kind von" = " K " , "ist Urenkel" = "K|K|K". Für "K|K|K" schreibt man auch kürzer K3, was nicht mit der im Skript üblichen Angabe der Stellzahl zu verwechseln ist. 32 Leider kann ich Ihre Beispiele nicht nachprüfen. (i) schlägt = K n w i r d geschlagen, ( i i ) geht voran = K n folgt nach, ( i i i ) erinnert sich an = K n ist erinnerlich.
33 ist Präsident von ist voreindeutig, irreflexiv, asymmetrisch und intransitiv; ist Nachfolger von ist asymmetrisch, transitiv, mehrmehrdeutig und r e flexiv; i s t verbunden mit ist transitiv, reflexiv, mehrmehrdeutig und symmetrisch. 34 " K " ist reflexiv, z . B . messer m i t K ( s , s ) . " k " ist symmetrisch. " K " ist intransitiv. Dagegen wäre die Nachbarschaftsrelation ohne den Zusatz direkt transitiv. Denn in messer ist "> Nachbar von e und e Nachbar von s, aber auch m (indirekter) Nachbar von s . " K " ist nicht eineindeutig, da jeder Buchstabe einen rechten und einen linken Nachbar hat, wobei die Lücke auch als Buchstabe des lateinischen Alphabets angesehen ist. Dagegen wäre eine Relation " L " , die definiert ist durch ist direkter linker Nachbar von, eineindeutig wegen L ( x l , x 2 ) A L ( X 3 , X 2 ) =>XI = x 2
und
L ( X 1 # X 2 ) A L(XI, X 3 ) => x 2 = X3.
35 Die Abbildung ist nicht eineindeutig, was zu erheblichen Schwierigkeiten bei der Rechtschreibung führt: f ( F ) = v und f ( F ) = f, z . B . viel, fiel; f(c)
= K , f ( c ) = T S , f ( c ) = 0, z . B .
Creme, cirka,
hacke.
36 X 3 wäre kein Kode, weil er keine eineindeutige Abbildung ermöglichen würde, z . B . könnte f( c ) = 10, aber auch f( ba ) = 10 sein. f( N1Z34
Z
34
Z
54"*zN24
P r ä f
siegt
Z11Z25Z35Z45Z55 Z25-»N1Z35 Z35 Präf schlaft
Z55 -*
zN25
N25-»'roden
D i e a l l g e m e i n e Struktur e i n e r Strophe ohne L e x i k o n i s t : (A)
Sj Z2i z
-»
ZnZ2iZ3iZ4iZ5i
-
3i
N
lZ3i
P r ä f
Z5i
x
i
Ausnahme S ^ wo P r ä f = 0
zN3i
Nehmen wir als v a r i a b l e Lexikonelemente an: Xg
-*
platzt
Z46 -»
bei
N2g Graden W i r können dann m i t t e l s ( A ) f o l g e n d e Strophe d a z u g e n e r i e r e n : Die H i m m e l wehen Blut z e r p l a t z t zerplatzt bei tausend Graden V i e l l e i c h t müßte auch Z45 = Z45 sein, w e i l nach j e d e r u n g e r a d z a h l i g e n phe in d e r nächsten Z41 w i e d e r h o l t w i r d . E i n e w e i t e r e Strophe g e n e r i e r t ( A ) mit: X 7 •* rottet X47 -* nach N27 Kriegen
X x
1 2
3 x7 X
-»
2X3 (x4)x5
(1) (2)
-»
x6x7
(3)
8 9 der
(4)
X
-»
x4 x
5 6
x
s
X
X
X
(6)
->
kenn, sieh
(7)
-»
t
(8)
das, Heidelberg 9 D i e g l e i c h e Sprache e r z e u g e n : X
(N)
X!
->
(X4)X5X6X8Xg
w e i t e r (5) - (9) v o n ( B ) (T)
Xx
(5)
Hans, Michel
X2X3X9
(9)
Stro-
97
X2
(x4)x5
X 3 -» XgXg weiter (5) - (9) von (B) 53
Nom -» X x [ X-^
-» die Untersuchung des Arztes,
...
Xg
-* des Arztes,
...
Durch diese Grammatik würde das fragliche Nominale auf zweierlei Weise generiert, so daß die beiden Graphen als Grundlage verschiedener semantischer Beschreibungen benutzt werden könnten. 54
[la] [Yi,Yu/Y12/Y13] [2a] [Yn,Y21 +Y22 +Y23] [3a] [Y12,Y31 + Y32] [4a] [Y21,Y211/Y212/Y213] Man braucht keine neuen Hilfszeichen einzuführen, weil die angegebenen PSRegeln sehr ungewöhnlich geschrieben sind. Meistens würde man z . B . die ersten drei so schreiben: |y2I +Y22(+Y23) Yi
1 |Y3i+Y32 Dann hätte man die Zeichen Y ] ^ , ' Y^ 2 , Y ^ 3 eingespart, was natürlich nur von Vorteil ist, wenn man sie in der weiteren Beschreibung nicht braucht. Eine präzise Übersetzung ist nicht möglich, weil (i) das Pluszeichen in [2a], [3a] kommutativ ist, nicht aber in [2] und [3], So könnte [3a] auch rückübersetzt werden in [3b] Y12->Y3o+Y3i Das ist aber nicht mit [3] äquivalent. (ii) in [2a] und [3a] alle Hilfszeichen fakultativ sind, in [2] alle und in [3] alle außer Y 2 3 obligatorisch sind. So würde also [3a] auch einen Graphen zulassen wie Yl2
Y 31
[3] aber nur
55 (4a) [NOMi, A R j + ARMjik + A D J + A M j i k + N 1 + N M i k l ] A R I i dies,
ARM111 ARM121 ARM131 ARM141
jen,
l er, es, I em, en,
e es ! er I er | e, es }
)
AR2
i ein,
kein,
ARM112 ARM122 ARM132 ARM142
1 A R 3 101
I e Ì er en e !
A R M 2 1 1 0, * I Ä R M 2 2 1 es, er J A R M 2 3 1 em, er j A R M 2 4 1 en, e , 0 j e! AM111 en J AM121 AM131 en 1 AM141 en, e, 1 er, e, es ) AM211 en ) AM221 en J AM231 en, e, es j AM241 N 1 Tisch, Schaf, ... N 2 Wald, Leib, Brett N 3 Garten, ... j N 4 Uhu, Hurra, .... N 5 Lehrer, Kloster, Trübsal, Kraft, N6 N i l . 1 0) , N 2 1 . 1 es 1 N31. 1 ( e ) j N41. 1 0 ! N i l . 2 0t , N 2 1 . 2 es 1 N31. 2 ( e ) j N41. 2 0 Nil. 3 0 N21. 3 s 1 N31. 3 0 N41. 3 0 Nil. 4 0 N21. 4 s 1 N 3 1 . 4 0t N 4 1 . 4 0t N i l . 5 0!. N21. 5 s ! N31. 5 0 N41. 5 0 Nil. 6 0 N21. 6 0 N31. 6 0 N41. 6 0 Nil. 7 0 N21. 7 0 N31. 7 0 N41. 7 0 N i l . 8 0t N21. 8 j 0 1
ARM212 " ! A R M 2 2 2 er j A R M 2 3 2 en i ARM242 - t en l A M I 12 en i AM122 en j AM132 en 1 AM142 en 1 AM212 en 1 AM222 en j AM232 en j AM242 N 7 Mutter, N 8 Mutti , N 9 Mensch, Hase N 1 0 Frau, Gabe, N U Stadt, See, N12.1 e ( N22.1 eI N 3 2 . 1 en } N42.1 e | N 1 2 . 2 er | N 2 2 . 2 er } N32.2 em } N 4 2 . 2 er | N 1 2 . 3 01 N 2 2 . 3 01 N 3 2 . 3 01 N 4 2 . 3 01 N12.4 s N22.4 s N 3 2 . 4 ss N42.4 N12.5 0 1 N 2 2 . 5 01 N32.5 n \ N42.5 0} N12.6 e l N22.6 e j N 3 2 . 6 en 1 N42.6 e j N12.7 0j N22.7 0) N32.7 n 1 N42.7 0) N12.8 js N22.8 js
99 N32.8 N42.8
|s) |s|
en en (en
N12.9 N22.9 N32. 9 N42. 9
en en en en
Nil.10 N21.10 N31.10 N41.10
0 0 0 0
N12.10 N22.10 N32.10 N42.10
en en en en
Nil.11 N21.ll N31.ll N41.ll
0 0 0 0
N12.11 N 2 2 . 11 N 3 2 . 11 N42.11
N31.8 N41.8
|0|
N21.9 N31.9 N41.9
|0| Nil. 9 j0 j
D u r c h e i n e n w e i t e r e n I n d e x b e i N und N M könnte m a n a u c h d i e G e n u s k o n g r u e n z einführen. 56 (4b) [NOMi, A R + + N M j + NOM4 +NOM5 + N O M J D a b e i s t e h t NOM4 f ü r G e n i t i v - , NOM5 f ü r P r ä p o s i t i o n a l a t t r i b u t e . NOMi steht f ü r Attribute i m gleichen K a s u s , s o g . Appositionen. Ein B e i s p i e l für e i n N o m i n a l e m i t a l l e n A t t r i b u t e n n a c h (4b) wäre.- das Verlangen eines Mannen nach Bier vor seiner Hochzeit, ein selbstverständliches Verlangen. 57
S
58 Man
schneide
zwei
Tage
n
n\s/n n
n/n
n n
s
alte
Semmeln n
n/n n
100 Man
schneide
zwei
Tage
alte
n\s/n
n/n
n
(n\n)/n
n
Semmeln
n n\n
n s die
59 M a n ordnet
Dann kann man
x/n,
alten
n/n, alte
alten
die
Tage
n/n
x/n
n
n/n und Tage n zu.
x nicht mehr weiter kürzen. Allerdings ist das Ergebnis der zugelassenen Kürzungen bei alte Tage n und sonst x, was für spätere Kürzungen (evtl. zu s) von Nachteil sein könnte. 60 W i r nehmen an D(k3, k 2 ) A - D ( k 2 , k 3 ) . Dann folgt, daß kjk 2 k4 keine zugelassene Kette ist, da k 2 nicht ohne k 3 v o r kommen kann. Zwischen k 2 und besteht nur indirekte Dependenz. Sie würde sich im Graphen so darstellen, daß und k 2 nicht benachbarte Knoten wären: (182a) k4
61
62
Xj X j =» Xi => Xi =» D => N1 => N2 =>
N1.N2 N1,D D, N2 D,D Xj Artl Art2
(1) X i ( N l . * , N 2 )
(1)
(2)
(3) (4) (5) (6)
(7)
101 (2) (3) (4) (5) (6) (7)
Xi(Nl,\D) Xi(D,*,N2) X^(D, * , D) D^.Xt) Nl( Arl, * ) N2( A r 2 , * )
(8)
Xj^ i sieht,
(9)
N 1 ) Mann,
(10)
ärgert,
weiss,
... }
Maus,
Katze,
...
}
N 2 ¡ M a n n , Maus,
Katze,
...
|
(11) A r t l | die, der, ... i (12) A r t 2 j die, den, ... j (13)
63 (i) (ii)
D
{ dass |
A 2 ( ( A 3 ) , * , (A5)) A3(A1.*.A4)
ausserordentlich (2)
hätte
t
werd
102
Alle drei Graphen sind projektiv. Allerdings ist in (2) die Abhängigkeit von von uns fraglich. 65 (194a)
66 (PSG66) S EN V ADV AD A ADJ ID1 KM ID2
-* E N V
-» -* -» -» -*
ADV AD A
ADJ
IID1 1 {KM ID2J
EN
Paul, Emil ist sehr, so so viel gross, klein wie
(Umlaut +) er als
(TFG66) S AV
-* EN V ( AV) ADJ -» (ADV 1A D „ l (A) Komp ) _ Komp -* (Umlaut ) er als Lexikonregeln weiter wie (PSG66) AD~ADJ =» AD~ADJ~wie ~EN K o m p ADJ => ADJ~Komp~EN
67a (la) (3a) b (5a) (5b) (5c)
E1 + V + V M + E 2 => E 2 + V + V M + E ! A R + A R M + A D J + A M + N + N M + N O M 4 => NOM4+ADJ+AM+N+NM E 1 +V+VM+E 2 +PT => E 2 +V+VM+Ei+PT ES 1 +V+VM+E 2 + P T =» E 2 +V+VM+ESj+PT E 1 +V+VM+ES 2 +PT => E 1 +V+VM+PT+ES 2 obligatorisch
68 U = i+hinten, +hoch, +vok. O = f+vok., +hinten, +mittel|, A = i-hoch, + vok. I, E = |+vok., -hinten 1, I = |+vok., -hinten, +hoch). 69 Sei m j = hoch, m 2 = hinten, 1113 = niedrig, 1114 = vorn, mg = koronal, 6 = gespannt, m^ = dauernd, mg = nasal, mg = weicher Abglitt, /p/ = {-m 1 ,-m 2 ,-m 3 ,+m4,-mg,+m 6 ,-m 7 ,-m 8 ,-m 9 S /t/ = i-m^,-m 2 ,-m 3 ,+m 4 ,+m 5 ,+m 6 ,-m 7 ,-m 8 ,-m g |
m
103
/k/ /m/ /n/ /q/
= +m2, - m 3 , - m 4 , - m 5 , + m 6 , - m 7 , - m 8 , -mg j = 1 - m j , - m 2 , -013, + m 4 , - m 5 , - m g , - m 7 , +mg, - m g | = i - m j , - m 2 , - m 3 j + m 4 , +m5, - m 6 , - m 7 , +m8, -mg | = I + m 2 , - m 3 , - m 4 , - m 5 , - m 6 , - m 7 , +mg, - m g |
/ p / - / m / = { + m 6 , - m 8 }, / m / - / p / = /t/ - /n/ = j + m 6 , - m 8 j , /n/ - /t/ = / k / - / g / = | + m 6 > - m 8 | , /r]/ - / k / = / p / - / m / = / t / - / n / = / k / - /r)/ /m/ - /p/ = /n/ - /t/ = /q/ - /k/ Also X O ( / p / , / m / ) ~ X O ( / t / , /n/) ~ X O ( / k / , / q / ) , maßen d a r s t e l l e n kann: P T K M N r)
i-m6,+m8! j-m6,+m8| |-m6,+m8!
was man auch folgender-
70 ( F , M) 71
T,K, F
u.a.
72 / x / und / f / stehen in k o m p l e m e n t ä r e r V e r t e i l u n g : / x / nach dunklen Vokalen und / f / nach hellen Vokalen und Konsonanten L, R , N ( manch
u s w . ).
73 Zugelassen sind: X K 0 , X P 0 , X T 0 . lautverhärtung.
Man nennt diese Erscheinung Aus-
74
"-vok +kons +verschluß +stimmhaft
-vok +kons +verschluß - stimmhaft
75
"+vok -kons -hoch -hinten +Alt
+vok -kons +hoch -hinten
/ _ X + [+Alt]
Auf die Ausgabe von (239) kann diese Regel nicht angewendet werden, weil j e n e nicht das M e r k m a l [+Alt] enthält. D i e s b e s c h r e i b t die T a t s a c h e , daß z . B . umgelautete A nicht noch e i n m a l mit I a l t e r n i e r e n .
LITERATUR
* M . A . A r b i b , T h e o r i e s of A b s t r a c t Automata, Englewood Cliffs (N.J.) 1969. E . B a c h , An Introduction to T r a n s f o r m a t i o n a l G r a m m a r s , New Y o r k 1964. * Y . B a r - H i l l e l , Language and Information, Reading ( M a s s . ) 1964 J . B e c h e r t u . a . , Einführung in die generative T r a n s f o r m a t i o n s g r a m m a t i k , München 197 0. I. M. B o c h e n s k i - A . Menne, Grundriß d e r L o g i s t i k , P a d e r b o r n 31965. R . C a r n a p , Einführung in die symbolische Logik, Wien 2 1 9 6 0 . * N . Chomsky, On the Notion "Rule of G r a m m a r " , in: The S t r u c t u r e of Language, J . A . F o d o r - J . J . K a t z (eds) Englewood Cliffs ( N . J . ) 1964, 1 1 9 - 1 3 6 . N.Chomsky, Aspekte der S y n t a x - T h e o r i e , Frankfurt/M. 1969. M. G r o s s - A . Lentin, Introduction to F o r m a l G r a m m a r s , Heidelberg 1970. P . R . H a i m o s , Naive Set T h e o r y , Princeton 1960. D . G . H a y s , Dependency T h e o r y : A F o r m a l i s m and Some Observations, in: Language 4 0 (1964), 5 1 1 - 5 2 5 . * D . Hilbert - W . A c k e r m a n n , Grundzüge d e r t h e o r e t i s c h e n Logik, Heidelberg 51967. * D . Hilbert - P . B e r n a y s , Grundlagen d e r Mathematik I, Heidelberg 2 1 9 6 8 . A. Koutsoudas, Writing T r a n s f o r m a t i o n a l G r a m m a r s , New Y o r k 1966. J . L y o n s , Introduction to T h e o r e t i c a l L i n g u i s t i c s , Cambridge 1968. S . M a r c u s , Introduction mathématique à l a linguistique s t r u c t u r a l e , P a r i s 1967. * E . Mendelson, Introduction to Mathematical L o g i c , New Y o r k 1964. * R . J . Nelson, Introduction to Automata, New Y o r k 1968. * W . V . O . Q u i n e , Methods of L o g i c , London 2 1 9 5 8 . H. R e i c h e n b a c h , E l e m e n t s of Symbolic L o g i c , New Y o r k 1966. N.Ruwet, Introduction à la g r a m m a i r e générative, P a r i s 1968. * J . Schmidt, Mengenlehre, B d . l , Mannheim 1966. W. S t e g m ü l l e r , P r o b l e m e und Resultate d e r W i s s e n s c h a f t s t h e o r i e und Analytischen Philosophie, Heidelberg 1969. A. T a r ski, Einführung in die mathematische Logik, Göttingen 1966. * K . Wagner, Graphentheorie, Mannheim 1970.
* kennzeichnet schwierige Arbeiten