284 116 5MB
German Pages 148 Year 1980
Linguistische Arbeiten
91
Herausgegeben von Herbert E. Brekle, Hans Jürgen Heringer, Christian Rohrer, Heinz Vater und Otmar Werner
Ludwig Hitzenberger
Automatisierung und Phonologie Automatisierte generative Phonologie am Beispiel des Französischen
Max Niemeyer Verlag Tübingen 1980
CIP-Kurztitelaufnahme der Deutschen Bibliothek Hitzenbeiger, Ludwjg: Automatisierung und Phonologie : automatisierte generative Phonologie am Beispiel d. Franz. / Ludwig Hitzenberger. - Tübingen : Niemeyer, 1980. (Linguistische Arbeiten , 91) ISBN 3-484-10407-4
ISBN 3-484-10407-4
ISSN 0344-6727
© Max Niemeyer Verlag Tübingen 1980 Alle Rechte vorbehalten. Ohne ausdrückliche Genehmigung des Verlages ist es auch nicht gestattet, dieses Buch oder Teile daraus auf photomechanischem Wege zu vervielfältigen. Printed in Germany. Druck: fotokop Wilhelm weihert KG, Darmstadt
V Vorwort
Die
sprechende
Maschine
ist
jedem
science-fiction-Leser
seit
langem bekannt. Um dieser Maschine ein Stückchen näher zu kommen - bis dieser
zum Jahr
Arbeit
generativen
die
1984
ist nicht mehr
Umsetzung
Phonologie
in
einer eine
lange Zeit - wird
linguistischen automatisierte
Theorie
in der
Realisierung
vorgestellt. Dem Buch liegt ein Anhang auf Microfiche bei, der die Programmdokumentation
enthält.
Diese
Publikationsform
wurde
ge-
wählt, um einerseits den Umfang nicht durch lange Computerausdrucke aufzuschwemmen, andererseits die in den Programmen enthaltene Information Interessierten zugänglich zu halten. Ich danke allen, die am Zustandekommen dieses Buches mitgewirkt
haben.
Prof.
Dr.
Harald
Zimmermann
danke
ich
für
das
Interesse, das er dieser Arbeit entgegengebracht hat. Prof. Dr. Herbert-E. Brekle danke
ich
für seine Unterstützung, die auch
das Erscheinen in dieser Reihe ermöglichte. Besonders verbunden bin
ich
Krause
meinen für
die
Kollegen auch
Christine
über
das
Schneider
fachliche
und
Dr.
Jürgen
hinausgehende
Hilfe,
die sie mir geleistet haben.
L. H.
VI INHALTSVERZEICHNIS
Vorwort
V
1.
Einleitung
1
1.1
Ziel und Zweck
1
1.2
Methode und Vorgehen
2
2.
Definitionen und linguistische Grundlagen
4
2.1
Definitionen
4
2.2
Die Stellung der phonologischen Komponente in der generativen Grammatik
5
2.3
Grammatiktheorie der generativen Grammatik
6
3.
Stand der Forschung
9
3.1
Die lexikalische Methode
3.2
Die algorithmische Methode
10
3.2.1
Compiler Systeme
10
3.2.2
Interpreter Systeme
12
3.2.3
Exkurs: Lernende Systeme
15
3.3
Die lexikalische Methode mit vorangehender Segmentierung
3.4
(morphologische Methode)
9
17
Zusammenfassung
18
4.
Generative Phonologie und Automatisierung
20
4.1
Überblick
20
4.2
Merkmale, Segmente, Merkmalsmatrizen
21
4.3
Lexikon und phonologische Struktur
26
4.4
Der formale Apparat der generativen Phonologie und dessen computative Realisierung
29
4.4.1
Die Regeln der generativen Phonologie
29
4.4.2
Redundanzen in Regeln
30
VII 4.4.3
Die technische Realisierung der Regeln
31
4.4.4
Kategorialsymbole
34
4.4.5
Limitangaben bei Kategorialsymbolen
36
4.4.6
Variablen-Spezifikationen
38
4.4.7
Fakultative Elemente in Regeln
40
4.4.8
Numerische Spezifikationen: Binäre und skalare Spezifikationen der Merkmale
45
4.4.9
Nichtphonologische Merkmale
46
4.4.10
Grenzsymbole
47
4.5
Regelordnungen
49
4.6.
Der Transformationszyklus
51
4.7
Zusammenfassung
55
5.
Programmbeschreibung PANAMA
56
5.1
Allgemeiner Überblick
56
5.2
Die Einzelkomponenten von PANAMA
56
5.2.1
GPMO: Steuermodul
57
5.2.2
GPM1: Regelverarbeitung
59
5.2.3
Das Modul GPM2
70
5.2.4
Das Modul GPM3
72
5.2.5
Das Modul GPM4
75
5.2.6
Das Modul GPM5
77
6.
Anwendung
78
6.1
Vorbemerkung
78
6.2
Anwendungsfall "französische Orthographie"
78
6.3
Automatische Transkription von französischen orthographischen Texten
82
6.3.1
Definition der Ausgangs- und Zielalphabete
82
6.3.2
Das Merkmalinventar
84
6.3.3
Umsetzungstabellen
87
6.4
Die Transkriptionsregeln des Französischen
94
6.4.1
Der Vokalismus
94
6.4.2
Der Konsonantismus
100
6.4.3
Nasalierung
101
6.4.4
Liaison und Elision
103
6.5
Der Regelkorpus
104
6.6
Ergebnisse
117
VIII 7.
Anmerkungen
7. 1
A n m e r k u n g e n zum K a p i t e l 1
127
7. 2
A n m e r k u n g e n zum K a p i t e l 2
128
127
7. 3
A n m e r k u n g e n zum K a p i t e l 3
128
7. 4
A n m e r k u n g e n zum K a p i t e l 4
129
7. 5
A n m e r k u n g e n zum K a p i t e l 5
131
7. 6
A n m e r k u n g e n zum K a p i t e l 6
132
8.
Literatur
134
Anhang :
PROGRAMMDOKUMENTATION
PANAMA
(auf M i c r o f i c h e d e m B u c h
beigelegt)
AI
P r o g r a m m l i s t e n und A b l a u f d i a g r a m m e
Al.l
E r l ä u t e r u n g e n zu d e n
AI. 2
GPMO
AI.3
GPMl
AI.3.1
Programmliste
und
Ablaufdiagrammen (Programmliste)
AI.3.2
Ablaufdiagramme
AI.4
GPM2
AI.4.1
Programmliste
AI.4.2
Ablaufdiagramme
AI.5
GPM3
AI.5.1
Programmliste
AI.5.2
Ablaufdiagramme
AI.6
GPM4
AI.6.1
Programmliste
A I . 6.2
Ablaufdiagramme
AI.7
GPM5
A2
Outputlisten
(Programmliste)
Programmlisten
1
1.
EINLEITUNG
1.1
ZIEL U N D
Die
phonologische
schreibt
den
Komponente ist e i n rierung" Ziel
und
generativen
dem
phonetischen
zur
Arbeit
Ergebnis
ist
zur
mit
es,
diese
Umsetzung
Transkription darstellt,
Programmsystem
deren
vielfältige Der der
tiv
Phonologe
hat
Hand,
dem
mit
ausreichenden
zur
Erzeugung
die
die
Para-
Automat,
der
damit
bildet.
Der einer
einer
beliebigen
EDV-Anlage
durch
Programmbeschrei-
die
und die
Infor-
automatisiertes
Modell
damit er
Basis
ein
Instrument
als
"grammar-tester"
seine
Hypothesen
auf
einer
quantita-
statistisch
absichern
überprüfen
und
größerer phonologischer
Gram-
intellektuell vom Menschen kaum geleistet
wer-
(3)
Ausserdem stems
zur
schen
Input
kann
das
Programmsystem
Sprachproduktion
der) . D a b e i der
natür-
realisiert
(2)
solches
intektuelle Anwendung
m a t i k e n auf T e x t e d e n kann.
erzeugt.
bis
auf
ein
Struktu-
Korrelat
Komponente
dem Benutzer
bietet
Sie syn-
Möglichkeiten.
kann, d a die
Sinne
syntaktischen
d i e L i n g u i s t i k , die L i t e r a t u r w i s s e n s c h a f t
mationswissenschaft
an
Sprechakt.
zu a u t o m a t i s i e r e n ,
von Texten
ist
im
be-
syntaktischen
der die K e t t e n
akustische
bung und - l i s t e n z u g ä n g l i c h g e m a c h t . Für
(...)
Grammatik
der
Realisation
und d a s
Transkription
akustischen
Sprache
als
zusammen
interpretiert
dieser
lichen
einer
zwischen
Formative (1)
ein Modell und
der
phonetischen
meter
Komponente
Bereich
"Ein- und A u s g a b e m e c h a n i s m u s ,
taktischer
der
ZWECK
als
akustisch
handelt
"natural
es
angesehen
werden,
realisierte
sich
phonology"
nicht
als B e s t a n d t e i l Sprache
um
ein
(4) , s o n d e r n
m o d e l l im Sinn der A u t o m a t e n t h e o r i e .
(5)
das
eines
einen
wiedergibt
graphi(Voco-
Simulationsmodell um e i n
Sy-
im
Übersetzungs-
2 Weitere
linguistische
angedeutet:
Anwendungen
z. B. U n t e r s u c h u n g e n
Lexikonerstellung
seien
über
Feinstrukturanalysen ist auch
formationswissenschaft den
das
orthographischer
von
denke
dabei
dazu
einer
schen
Form
wieder
alle
und d a m i t
als
im R e t r i e v a l . die
für
die
auch
für
In d i e s e m
Diskrepanz
Information
zwischen
aufzulösen.
die
in die p h o n e t i s c h e
möglichen Recherche
Recherche
phonetische Abspeicherung
Denkbar
Man
"Mayr",
Form
das
orthographischen wiederholt.
könnte
Suchspekphoneti-
Schreibweisen wäre
außer-
von Information,
da
ist.
Komponente
einer
d i e s e r A r b e i t als a u t o m a t i s i e r t e s Modelldefinition
n e m sehr für
scher
oder
jemanden
und
diesem
-Zusammenhangs werden,
daß
Zusammenhang deren
die
stellt wird.
zur
perzeptiver,
an W U N D E R L I C H :
"In
System verstehen,
operativer
oder
ausgehend,
Automatisierung und
generative Einheit
in Bei eije-
wenn
motorian-
(12)
dargestellt
adäquater
kleinste
uns
S i n n l ä ß t sich unter e i n e m M o d e l l
Modellbegriff
Möglichkeiten
soll
innerhalb einer g e w i s s e n Z e i t s p a n n e e i n
deres System ersetzt". Von
wir
künstlich geschaffene
bezüglich
Funktionen
generativen Grammatik
Modell dargestellt werden.
orientieren
verallgemeinerten
des n a t ü r l i c h e
die
sowohl
In-
METHODE UND VORGEHEN
Die p h o n o l o g i s c h e
es
zwar
indem m a n z. B. aus der
sie in d i e s e r F o r m k o m p r i m i e r t e r
der
(11)
orthographischen
erweitert werden,
dem eine generelle
1.2
linguistischen
als Modell,
dienen,
phonetischer
erfolglosen
Klanganaly-
nur an eine R e c h e r c h e m i t d e m N a m e n "Maier",
trum s i n n v o l l erzeugt
Und
(10)
"Meyer", usw. D u r c h die U m s e t z u n g bei
phonologisch
den B e r e i c h der
Bedeutung.
System
und
und
(9)
für
Datenverarbeitung"
könnte
(7) , D i a -
sind vor a l l e m für R e i m - ,
"Dialogbereich Mensch-Computer"
Bereich
(6),
(8) u s w .
transkribierte
sierte T e x t e v o n B e d e u t u n g .
"linguistische
Möglichkeit
mit phonetischen Einträgen, Entropie
In der L i t e r a t u r w i s s e n s c h a f t
Diese A r b e i t
als
funktionale Belastung
stratie, automatische Fehlerkorrektur und
nur
(13) durch
werden des
diskutiert.
Phonologie
auf
beschreibt
als
das
Zeichen
in dieser
Arbeit
Laut-SchriftzeichenDabei
soll
Merkmalbasis andere
oder
den
gezeigt diesen
Grammatiken, Laut
darge-
3 Auf der Basis der gie"
"Standardtheorie
der generativen
Phonolo-
(14) wird das Modell einer automatischen generativen Phono-
logie entwickelt stem
gezeigt,
dells
(Kap.4)
das
und deren Umsetzung
einen
Automaten
darstellt.
Dieses
Analysegrammatik"
(PANAMA)
zur
in ein
Programmsy-
Verarbeitung
Programmsystem
einer
dieses
Mo-
"Phonologischen
(15) ist anschließend
(Kap.5)
detail-
liert beschrieben. Das gesamte Modell wird im letzten Teil
(Kap.6) auf die fran-
zösische Orthographie angewendet. Dabei gehen wir von der Tatsache
aus,
(16),
d.
daß
die
h.,
daß
widerspiegelt, hat
aber
auf
französische die
als
Schriftsprache
die
diesem
Orthographie
gesprochene
einen
historisierend älteren
Sprache.
älteren Sprachstand der
Die
ist
Sprachstand Orthographie
gesprochenen
che eher entsprochen als heute, d. h. es haben seither
Spra-
phonolo-
gische Prozesse stattgefunden, die die Relation zwischen gesprochener
und
geschriebener
Sprache
verändert
haben
und
die
auch
heute noch wirksam sind. So gesehen, kann man deshalb versuchen, die
Orthographie
des
Form der
phonologische
sie
phonologische
eine
peut
etre
considérée
synchronique) vigueur".
heutigen
Französisch
Tiefenstruktur Grammatik comme
als
anwenden.
l'inventaire
(17)
"La
(projeté
besondere phonologie
sur
le
plan
de celles des lois phonétiques qui sont encore en
(18)
Die Ergebnisse dieser Anwendung werden als aufgeführt
eine
zu interpretieren und auf
(Kap. 6 und Anhang)
tik ausführlich dargestellt
Computerausdrucke
und die zugrunde gelegte
Gramma-
(Kap.6).
Der Anhang ist als Microfiche beigelegt. Er enthält die vollständigen
Programmlisten
putlisten
(A2) .
und Ablaufdiagramme
(AI)
und die
Out-
4 2.
DEFINITIONEN
2.1
DEFINITIONEN
"Phonologie möglichen schen
ist
der
zeichnet. zu
wird
"Phonologie"
der
zum
generative
Phonologie
Lexikoneinträgen,
der
phonetischen
tion
der
zwischen Die
sche
(=
ist
phonetische
Unter
der
die
Laute
das
(1)
und
in
ihre
angelsächsi-
Im
"phonemics"
sind
dieser
Bezeichnung
einem
(2)
be-
Arbeit
sy-
h.
der
Phonemfolge)
formal
gesprochen
(s. u . ) ,
in d e r
das
der
auf
zu
einem
Zusammenhang
nicht
steht.
Graphem
muß
Phoneme
repräsentieren
h.
Der
eineindeutig ( jx | =
ist
der
Wir
Termini
in
als
Input
die
Gram-
nennen
wurden und
sind
klassischer Einheit
Graphem
Ein
einem
oder
einer
genauer
in
Zusammenhang sein: /KS/),
dazu ist
Sprache,
(7)
über
Phonem d.
Arbeit
operiert
gewählt
Im G e g e n s a t z
Kette
der
Rela-
sie
in
An-
in
der
(5)
wir
"Das
und der
systematisch-phoneti-
Diese
geschriebenen
eine
Sie
zwi-
Phonetik".
in d i e s e r
ihr
Die
Syntax
repräsentiert". -
bildungsbeziehung
(6)
definiert.
Einheit
(bzw.
relationalen
wird
Ausschluß
Regelanwendungen.
verstehen
Sprache".
phonemischen
bezeichnet. d.
Relationen
physikalischen
bedeutungsunterscheidende
einer
den
der Ebene
gebräuchlicher.
Phonem
von
unter
Regelsystem).
Ergebnis
relational
stinktive
ben
und
Komponente,
Linguistik
kleinste
Graphem
Laute
(3),
(Oberflächen-)Struktur.
an
deutschen
"die
als
systematischen
(Tiefen-)Struktur
phonologisches
Ebene
lehnung
die
hat".
oft
Ebene
letzteren
phonologischen
matik
der
handelt
systematisch-phonemische
phonologische der
Gegenstand
"Phonemik"
systematischen
(4)
Grammatik,
Phonologie und
GRUNDLAGEN
verstehen.
"Die schen
Teil
Kombinationen
Sprachraum
nonym
UND LINGUISTISCHEN
Ein sowie
Definition
auf wird
die
der der
die
ein ist aus
zwischen
ein
Phonem also
in
Phonem kann
Phonem
-
einem
eindeutigen
Graphem
di-
Buchsta-
Phonemkette einer
Begriff
kleinste
Graphem Alphabet
Ebene
Abund
mehrere
eine
Gra-
5 phemsequenz (8) darstellen kann ( /s/ = ISCHI ). Unter einem Zeichen verstehen wir die graphische Repräsentation von Phonemen oder Graphemen, oder von Teilen davon
(9) (z.
B. Schrägstrich, Haken, diakritisches Zeichen, u. ä.). Ein Buchstabe ist ein Zeichen oder eine Zeichenkombination, die zu einem Alphabet
gehören.
Dieses
Alphabet
ist
extensional
definierbar
(aufzählbar) . 2.2
DIE STELLUNG DER PHONOLOGISCHEN KOMPONENTE INNERHALB DER GENERATIVEN GRAMMATIK
Das folgende Schema
(Tabelle 1) zeigt die Beziehung zwischen den
verschiedenen Ebenen der syntaktischen, phonologischen und phonetischen
Repräsentation
und deren Stellung
zu den
Komponenten
der Grammatik. Die phonologische Tiefenstruktur Oberflächenstruktur Struktur
durch
die
(Merkmalmatrizen)
der
gewonnen. Diese
Struktur
wird
wird aus der
Zuordnung
der
Einzelelemente in der Regel
syntaktischen phonologischen
(Wort,
(10) einem
Morphem) Lexikon
entnommen, das auch mit dem syntaktischen Lexikon gekoppelt sein kann. Die
readjustment-Komponente
modifiziert
die
phonologische
Tiefenstruktur, indem sie z. B. die syntaktische Information in die
phonologische
Struktur
einbringt
oder
die
Einsetzung
von
Grenzsignalen durchführt. (11) Diese modifizierte phonologische Tiefenstruktur
ist die Ein-
gabe der phonologischen Komponente, in der durch Regelanwendungen die phonetische Oberflächenstruktur erzeugt wird.
TABELLE 1
2.3 Der
GRAMMATIKTHEORIE DER GENERATIVEN Ausdruck
werden. der (...)
Zum
"generativ" einen
einen
und
Sinn.
Dieser
"explizit"
Grammatik oder
und
Bedeutungen
den
Sinn,
könnte,
Aber
angegeben
wenn
in
dem
besagt,
unter
denen
werden
verstanden
schöpferischen
wichtigen,
zweite
s t e h t bei einer
tik im V o r d e r g r u n d .
zwei
Grammatik
Bedingungen genau
in
widerspiegeln.
gleich
umschreiben die
"operieren"
zweite A s p e k t
die
Sprache
zweiten
sentlicheren als
soll
menschlichen
kann
GRAMMATIK
daß sie
Aspekt
"generativ nicht man die
sogar
we-
"generativ" Regeln
anzuwenden
müssen".
hat
(12)
generativen phonologischen
der sind
Dieser Gramma-
7
Die Grammatik G, die der phonologischen Komponente
zugrunde-
gelegt wird, stellt ein Quadrupel dar: G =
2 , R, s }
wobei: § = Eingabealphabet S = Ausgabealphabet R = Regelcorpus S = Startsymbol und: p = $ u
2
ri
r*= u • i
Die Regeln sind in der Gestalt: yl A y2
yl y y2
Es gelten folgende Einschränkungen: A € § yl, y2 €. T * y € r* - {£} Dadurch Sie
ist eine umgebungsbedingte Grammatik definiert.
entspricht
einer
Typ-l-Grammatik
nach
CHOMSKY.
Sprache, die durch eine umgebungsbedingte Grammatik
(14)
(13) Die
beschrieben
wird, heißt kontextsensitiv. Wir müssen bei diesen Definitionen der Grammatik jedoch berücksichtigen, daß die Elemente der Einund
Ausgabealphabete
in
der
generativen
Phonologie
auch
aus
Merkmalmatrizen bestehen können. (15) Da die Regeln nicht simultan angewendet werden können, muß für
die Ordnung
daß eine
der
Regel mit
identischen
Regel
Regelanwendung einem
mit
generell
längeren Kontext
kürzerem
Kontext
festgelegt vor
einer
angewendet
Wir legen also für die Regelanwendung fest:
werden,
ansonsten
werden
muß.
8 W e n n p_ Al f • • • / Ak £ I
m i t der Länge v o n p = l(p) = k
dann
— ^
ist
G auf p
eine
Regel
A
y
/
yl
y2
(16)
von
anwendbar,
g.d.w. (1)
A = Ai
(1-i-k)
(2)
es z l , z 2 f c r * g i b t , s o d a ß p = zl yl A y2 z2
(3)
es
keine
Regel
A ,
so d a ß es z l ' , z 2 €
— >
y'
/
yl'
_
y2'
gibt,
T * g i b t m i t p = z l ' yl' A y2'
z2'
und 1 (yl' A y 2 ' ) > l ( y l A y2) (1/) Eine
kontextsensitive
Sprache
A u t o m a t e n a k z e p t i e r t , oder -beschränkter bedingte
Automat,
Sprache.
schränkter
Automat
Das
so
wird
von
einem
linearbeschränkten
anders ausgedrückt: ist die
Sprache
Programmsystem
aufgefaßt
werden.
L
PANAMA Die
Ist B e i n
umgebungs-
kann als
linear-be-
Theorie
ten ist a u s f ü h r l i c h b e s c h r i e b e n bei M a u r e r .
linear-
(B) eine
(18)
dieses
Automa-
9
3.
STAND DER FORSCHUNG
Im f o l g e n d e n w i r d e i n Ü b e r b l i c k dem
Gebiet
gegeben.
der
Die
exemplarisch
über d e n S t a n d der F o r s c h u n g
Automatisierung
theoretischen einige
der
von
auf
Zeichen-Laut-Zusammenhängen
Möglichkeiten
bisherigen
werden
Arbeiten
diskutiert
auf
diesem
und
Gebiet
dargestellt. In der B e h a n d l u n g
des P r o b l e m s
lassen sich
folgende
Methoden
unterscheiden:
(1) die l e x i k a l i s c h e
Methode
(2) die a l g o r i t h m i s c h e (3) die
lexikalische
rung
Methode
Methode
(morphologische
mit vorangehender
Segmentie-
Methode) (1)
3.1
DIE LEXIKALISCHE
Bei der
Graphemkette Lexikon dessen
repräsentierte,
nachgeschlagen, phonetische
netische dert
zu
Darstellung
wird
VENETZKY
hält
das
Lexikon
weil
Grundformen,
die
Wörter
abgespeichert
von
einem
der
direkt
Wort
Graphemkette
abgespeichert übernommen,
ist.
ohne
dieses
weiter
jeden Rahmen
sondern sein
Umfang
von
auch
müßten.
nur d e s h a l b
Er
e i n e T r e f f e r q u o t e v o n 96% zu e r r e i c h e n .
geht
verän-
für
abhänunprak-
(3)
nicht
Flexionsformen
dabei
60.000
pho-
einfach,
sprengen würde, da
sämtliche
mindestens
einem
Adresse
Diese
ist in der A n l a g e sehr
Verfahren
seine
in
als
ist a l l e i n v o n der G r ö ß e der L e x i k o n s
(2)
tikabel,
jedes d u r c h
transkribierende
unter
zu w e r d e n . D i e s e s V e r f a h r e n
nur sche
wo
wird prinzipiell
Repräsentation
u n d die F e h l e r q u o t e gig.
METHODE
lexikalischen Methode
für
das
Einträgen
der
Engliaus,
um
10
Dabei Struktur
wurde der
einem diese hängen
Wörter auch
kann,
anderen
in
sam
s i n d , die auf
sich
keiner dings
des
für
ein
immer
in
"Intuitiv
jede
Operationen
kann
ebensowenig
oder
das,
es
wenn
bole) (4)
auf
angewendet
Der
fern.
Die
da
wirk-
sondern
wie
hier
auf
ein
über
fachsprachlich
sie
ist
solche
ständiges
wäre. Diese Methode
stark
wurde
kann
in
aller-
orientierte
An-
sein.
eine M e n g e
Operation, ein
dem
(Graphemen)
Programmierung
einem
Klasse
von S y m b o l e n
kann
Regeln,
einem
Al-
(Eingangssym-
einen
eine
liefert". Algorithmus
Klasse
Endsymbole
Algorithmus
uns von
verstehen,
Endsymbol
durch
auf
angewendet, dieses
Unter
Verfahren
ein
es Typ
gewissen
auszuführen.
möglicherweise
bei
von Regeln, die
die
mechanisches
gewisse
wird,
werden,
gangssymbolen
anwendbar,
durchgeführt,
Zeichen-Laut-Zusammenhang
beschrieben
ausreicht,
Prozesse
beschränken,
Umfang
mechanisch
auch
eine
zum ab-
METHODE
spezielle man
ist,
nicht
phonologische
erforderlich
entspricht,
gorithmus
da
des W o r t e s
(z. B. L i a i s o n ) . D i e s e s V e r f a h r e n
ist e i n A l g o r i t h m u s
gestattet,
phonetische
angebbar
Nachschlagen
Sprachen
größerem
DIE ALGORITHMISCHE
die
Kategorie
Wortbildungskapazität,
Miniwelten
daß
eindeutig
einfaches
wendungen durchaus sinnvoll 3.2
beachtet,
n i c h t auf e i n W o r t
Lexikons
Arbeit
nicht
syntaktischen
Sprachen
starken
Ergänzen
der
hinausgehen
diese
einer
nicht
bestimmten
die W o r t g r e n z e damit
noch
von
so d a ß
zum
mit
aber
ist
von
Ein-
(Phoneme)
lie-
auf
zwei
Arten
möglich: 1. als C o m p i l e r S y s t e m in der p r o z e n d u r a l e n 2. als I n t e r p r e t e r
S y s t e m in der
Methode,
nicht-prozeduralen
Methode. 3.2.1
COMPILER-SYSTEME
In e i n e m
compilierenden
chen-Laut-Zusammenhang geschrieben. schriften ten
für
müssen,
Die
grammatischen
den zu
System
Computer
einem
wird
beschreibt,
die
Regeln
direkt
sind
zu v e r s t e h e n .
Programm
G r a m m a t i k , die d e n
selbst
dabei
Diese
zusammengestellt,
einer b e s t i m m t e n P r o g r a m m i e r s p r a c h e
abgefaßt
als als
Zei-
Prozedur Rechenvor-
Rechenvorsehrifals
werden.
Statements
11 So
könnte
z. B. die phonologische
Regel
des
Französischen:
3
g /g/wird zu[3]vor hellen Vokalen, sonst zufjg] etwa so formuliert werden: IF Inputzeichen
(I) = 'g' (41)
Inputzeichen
(1+1) = 'e' OR * i*
AND THEN Outputzeichen
(J) = '3'
ELSE (J) = 'g 1 .
Outputzeichen Ein Beispiel grammiert scher
für
einen Algorithmus, der
ist, bildet
Texte
von
Programmierung
die Transkription
FISCHER/TAVOLATO.
dieser
her prinzipiell
sehr
teile
Zum einen muß bei
das
aufweist.
Programm,
Computer tisch nur
neu
einfach der
übersetzt
zwar
ist
von
bekannt,
der
daß
Algorithmus werden.
Änderung
selbst,
Damit
sind
die
Programmierung
ist, jedoch auch gravierende jeder
pro-
laoti-
der
korrigiert diese
Nach-
Grammatik und
Systeme
vom
prak-
für eine Sprache einsetzbar. Zum anderen ist es einem
Linguisten, nicht
also
(5) Es
Algorithmen
auf diese Art
orthographischer
der
kennt,
entsprechende
unmöglich,
grundegelegten entworfenen
die Regeln
Systeme
zu
hinter
verwendete
den
Programmstatements
erkennen. Wie
jedoch
zeigen,
Programmiersprache
die
trifft
nach auf
keinen
Kritik von VENETZKY zu, daß "die Faktoren, die den -Zusammenhang können ". (7)
beschreiben,
nicht
effizient
die
dieser
zu-
Methode Fall
die
Zeichen-Laut-
programmiert
werden
12 3.2.2
INTERPRETER-SYSTEME
U m das von zu
Problem
der
der
Methode
konstruieren,
Die
DV-Theorie
Diese der
sind
Laufzeit
die
solche
Inputs
in
daß
als
sie
kann
verarbeiten.
Interpreter.
Anweisungen
unmittelbar
(8)
während
ausführen.
Die
in d i e s e m F a l l die R e g e l n der G r a m m a t i k . Sie für
die
das
System,
Inputdatei
d.
h.
bei
und n i c h t mehr
man
Algorithmen
Regelform
Systeme
gekennzeichnet, und
zu e r l e i c h t e r n ,
nicht-prozedurale
Grammatiken
interpretieren
Teil
nur
machen,
bezeichnet
sind
des
die
dadurch
weisungen braucht
Grammatikänderungen
Gebrauch
einer
Ansind
Regeländerung
das g a n z e
System
ver-
zur a u t o m a t i s c h e n T r a n s k r i p t i o n
sind
ä n d e r t zu w e r d e n . Interpretierende bereits
in
ist
Beispiel
ein
Systeme
größerer
Zahl
für
realisiert.
die A n w e n d u n g
(9)
Das
eines
de,
die
einem nach
jedem
Graphem
rechts
ken
und
muß
es
Teilwort
eine
so
die
Regeln ein.
ausgeführt,
Grammatik
teil, und
und
diesen
Kontextes
Regel
restlichen beitende
wird,
Bei
rechten
die
Eingabealphabet Das
erneut
Ergibt
und
die
auf.
sich
det,
Testcorpus
das
die
wird
tausend
h ä l t . Das R e g e l c o r p u s der 5
Prozentsatz
%.
(12)
der
Diese
Ausnahmelisten Fälle wie:
des
setzt
diesem System
mit zu
s e i n , d. h. für jedes
Français
häufigsten
keine
identisch Fondamental
Wörter
gelin-
kein W i d e r s p r u c h ,
Verarbeitung
s e i n , d. h. es darf
das
noch
Regeln
Regel g e b e n m i t d i e s e m G r a p h e m als l i n k e n
sie m u ß e i n d e u t i g
aus
links
Regeltei-
die Ü b e r p r ü f u n g
Die m i t
muß vollständig
von
indem der
infragekommenden
tritt
zugrun-
Phonem
wird
an a l l e n l i n k e n
ben, bei der das G r a p h e m und der K o n t e x t Als
ein
Eingabewort
T e i l des E i n g a b e w o r t e s
vorbeigeführt
funden werden. wird
einem
Grammatik
auf m ö g l i c h e G r a p h e m e h i n u n t e r s u c h t ,
zu b e a r b e i t e n d e len
aus
zuordnet.
(10)
Einzelwörter.
liegt eine u m g e b u n g s a b h ä n g i g e
Ausgabealphabet
GRAPH
regelinterpretierenden
S y s t e m s auf die T r a n s k r i p t i o n f r a n z ö s i s c h e r Dem Verfahren
System
des
so dem
verarGraphem
BestandRegel
ge-
sind. (11)
verwen-
Französischen
ent-
u m f a s s t 170 R e g e l n . Die F e h l e r q u o t e , d. h.
falsch
transkribierten
Fehlerquote
arbeitet,
kaum
ist zu
bei
einem
Wörter
liegt
Verfahren,
unterschreiten
(13),
bei
ca.
das
ohne
da
sich
13
nicht
über
Regeln
satzphonetische
ville
C v illl
fille
CfijH
lösen
richtige
ist
dieses schen
der
Systems
chenden
ist
von
Aus
Ctutalôér^
nur
einem compilierendem
es, zu
und
Regeln
oder
Ketten
Ketten.
mit
ROLSHOVEN.
Texte
Dazu
Zahlen,
interpretierendem
von
nichtrestringierte
transkribieren.
des
gehört
Ziffern
Französi-
in
die
Datumsangaben,
entspre-
in die
"mille neuf c e n t
so
vervollständigten,
Regelverarbeitung Stellung
Ebene
werden
ein
zwar
als
während
der
Regelüberprüfung
textbedingung
graphemischen
aufgerufen
lediglich eine
wird.
wird
nun
Äquivalent
Text
er-
phonologischen
(15)
Die
kontextsensitive
Kontextangabe
soi^-
(14)
der
ist.
die
"ausgeschriebe-
phonologisches
zwischen
anzusiedeln
die
Jahreszah-
usw. werden
"1er" w i r d "premier".
Ziel
zunächst
"1975" w i r d
besteht
dazu
Regeln
aus
pho-
bezeichnet,
einem
explizit
Die
und der
verwendeten Index,
doch
über
den
programmierte
Kontextverarbeitung
Re-
Kon-
erfolgt
prozedural.
In d i e s e m T e i l der A n a l y s e sen.
wortübergreifende
Ausdrücke,
zeugt, dessen
also
durch
g e b r a c h t , d. h. aus dem
die
netischen geln
tout à l ' h e u r e
Ziffern
sante q u i n z e " , über
ent-
[^tudœku]
graphemischen
Form
Fondamental
Français
Transkriptionsalgorithmus
len, mathematische ne"
sind
tout d ' u n c o u p
aus
vollständig
Auflösung
Das
Fehlerquelle
kann.
Mischung
System
weitere
wie:
Transkription
erreicht werden Eine
Eine
Erscheinungen.
h ä l t feste W e n d u n g e n
deren
lassen.
Bei
jedem
Wortanfang
p r ü f t . Die U n t e r s u c h u n g ierenden
Wortes
chen
oder
oder
Teilwörter
mit
mit nicht
ROLSHOVEN
einem
Lexikon
Wortliste, Wörter
mögliche
mit
sie
als
ihrem
in der
aufgelistet
regelhafter
bezeichnet
zusammen
auf
Probleme
Liaison
zu
hin
lö-
über-
e r f o l g t d u r c h e i n e n V e r g l e i c h des zu l i -
einer
ligemfeindlichen
tion,
sind v e r s c h i e d e n e
wird
die
ligemfreundli-
sind.
phonologischer "Logogramme"
phonologischen
(16)
Wörter
Repräsenta-
(17) , s i n d Äquivalent
in ab-
14
gespeichert. Struktur
ein mehrsilbiges
taktischer oder z.
feststellt.
Nichtverbum. als
bzw.
Wort
Diese
(ils
in die
phonologische
die
der
ist
der
die da
Person
Adverbien
um
Verbum
diese
Plural
oder
transkribiert
Realisation
phonetischen
ist, w e r d e n
erzeugt.
Oberfläche
in d i e s e m
Schritt
Kette
als C ^ D /
Substantiven
wird. Da
die
bereits nur
das f a k u l t a t i v e S c h w a und H a r m o n i e n
syn-
Wortklasse
es dabei
notwendig,
dritten in
der
geht
ein
j e d e n S a t z e s w i r d aus der p h o n o l o g i s c h e n
phonetische
Struktur
| - E N T ^ | , so w i r d
aufgerufen,
président),
A m Ende eines
auf
Analyse
Flexionsmorphem
Schwa
hert
direkt
Hauptsächlich
d a g e g e n als Qâ*] (le p r é s i d e n t ) tur
wird
Analysealgorithmus
Wortes
B.
Darstellung
übernommen.
Endet dieses
Diese
phonologische
weitgehend
noch die
Strukangenä-
Vokalquantität,
behandelt.
R O L S H O V E N s t r e b t eine enge p h o n e t i s c h e T r a n s k r i p t i o n an, aber
dem Benutzer
stratische schiede
die
Ebene
der
zwischen
Regeln
fakultativ
erklärt
Das
Lage,
zurückzuführen und
Automaten
gegebenenfalls bisher
oder
ist d i e
nierte
und
syntaktischer Wörtern,
nur
als
berücksich-
und
in F o r m
hintereinan-
in
FORTRAN
zeigen, durchaus
IV
in der
der A u s n a h m e l i s t e n , die
die
Tran-
ist
Graphemen.
Analyse
Regeln,
beziehen,
(20) , s o n d e r n
muß
kleinsten
in d e n
Einheiten.
über
z. B.
zu d e n
So
B.
Code
kann
z.
sich
auf
defivon
einzelnen
ROLSHOVEN
die
Ergebnisse
der
in d e n R e g e l n dafür
dar-
Zuordnung
Information die
Voka-
extensional die
Re-
Dadurch
systemimmanent
außerdem
nicht
einen
zeichenorientiert,
Klassenbildung
Verarbeitung
suprasegmentaler seiner
sind die
usw. n i c h t mehr
Schwierig
oder
sind
ansprechbaren
notwendige
Okklusive,
(19)
Phonemen
syntaktischen
dia-
Unter-
Weglassen
diese
nicht
Rechenanlage
Verfahren
das Phonem
Phonologie
Kontextbedingungen mulieren
einer
Programm
erfordert
Listen.
auf
bei E r g ä n z u n g
das
le, helle V o k a l e , stellbar
die
oder d a s
brauchen
ist
die A n w e n d u n g e n
vorgestellten
durch
in der
die
Da
f r a n z ö s i s c h e r T e x t e zu l e i s t e n .
d. h. d a s G r a p h e m oder geln
sind,
im T r a n s k r i p t i o n s p r o z e ß
ist, w i e
skription beliebiger Alle
bestimmen.
Transkriptionsverfahren
dergeschalteter und
e i n e n Schalter
zu
(18)
gesamte
realisiert
über
d e n E b e n e n auf die A n w e n d u n g
bestimmter
tigt zu w e r d e n .
Möglichkeit Transkription
läßt
selbst
einführen,
for-
der
im
15 Programm
die
entsprechende,
explizit
formulierte
Routine
auf-
ruft. Im R a h m e n der durch die
die
oben
generativen
Verwendung
der
skizzierten
von Merkmalen klassen
den
universellen
phonetischen Sprache
erbringen.
lassen
sich
Lösungsvorschläge
für
die
Zusammenhang
Die M e r k m a l e
Theorie.
Theorie
Durch
strukturellen
ausdrücken.
nanten
einer
Merkmaltheorie
Probleme
kann m a n
adäquat
phonologischen
sind
Verwendung der
Laut-
Bestandteil
einer
(21) U m die K l a s s e der
zu b e z e i c h n e n ,
brauchen
wir
e i n z e l n a u f z u z ä h l e n , s o n d e r n k ö n n e n d u r c h die
Konso-
sie n i c h t
mehr
Merkmale
Qf konsonantisch, - v o k a l i s c h ^ diese
ganze
Erweiterung
Klasse
artikulatorischen ren z.
Weise
orientiert,
syntaktischer
B. W o r t k l a s s e
einheitlich
und
Streß
darstellen,
formalen Apparat
arbeitung
natürliche
Ebene
Informationen
chen
auf
beschreiben.
des B e g r i f f s der M e r k m a l e , der
l a s s e n sich
und
damit
behandeln.
nicht-phonologischer
auch
in
C+VerbH den
Damit
eine
alle
suprasegmentaler
als M e r k m a l
und
Durch
sich n i c h t nur an der
oder C 2
Regeln
mit
ande-
Art
(22)
StreßJ
dem
glei-
ist d a s P r o b l e m der
Information
ohne
Ver-
algorithmischen
M e h r a u f w a n d zu lösen. 3.2.3 E x k u r s : L E R N E N D E Interessant die A r b e i t selber
SYSTEME
im Z u s a m m e n h a n g von
E. W O L F .
wiederum
einen
m i t den a l g o r i t h m i s c h e n S y s t e m e n
Er hat e i n e n A u t o m a t e n
Umsetzungsautomaten
Zeichen-Laut-Zusammenhanges
erzeugt.
tomaten
2.3
ist
die
samtverfahren
im K a p i t e l
besteht
aus
einem
fahren.
Der
ist
Sprache
(bei W O L F d e s
Paares
die
komponente
aufbereitungsverfahren handelnde
Paare,
te
lang
gleich
Corpus Form
transkribierte, bei sind,
und
von
Paaren
UmsetzungsauDas
Ge-
des
Wortes
phonetische
schwerer
zu
Überprüfungsver-
von
Wörtern
einer
die E r s t k o m p o n e n t e
orthographische in
des
Grammatik.
enthält, Form.
teilt die E i n g a b e d a t e n denen
der
dieses
und e i n e m
Englischen) , wobei
orthographische die
konstruiert, Beschreibung
Materialaufbereitungsverfahren,
einem Syntheseteil ein
Basis
beschriebene
einem Analyseteil, Input
zur
ist
Das
die
Zweit-
Material-
in leichter
zu
und p h o n e t i s c h e
behandelnde,
des
bei
beKet-
denen
16 die
Ketten
dem
gleichen
eingefügt
ungleich Auf die
Regeln
für
werden
zu
und jedes
die
Corpus
die
dann
von
Das
Analyse
die
Ausgabekette
Kontext
wenn
es
Regeln
das
wird
wieder
des
wertet.
zur
und
das
Das
Regeln
sierbaren
des
pus,
solange
werden
läuft
ab,
bis
verfahren erreicht
setzte geht
jedoch
materials
aus,
berücksichtigt
Hilfestellung hangs
zu
auf von
10
bei
Wert
%
einer
erreicht
scheint bei
leisten,
Zyklen.
(24)
dem Verfahren Werte
Sättigung
nichtanaly-
herausgenommen für
be-
Äquivalenz
die
Die
vergliund
eventuell mit vergrößertem
2800 W ö r t e r ihm
dieses
der d.
selbst
das
und Cor-
Bewertungs-
werden
beim
kann.
des
angeange-
erreicht.
Er
Untersuchungs-
Das Verfahren
wurde
abgebrochen.
Verfahren Entwurf
durchaus
des der
in
der
Lage,
Zeichen-Laut-ZusammenGrammatik.
einen
der
in e i n e m
Tran-
skriptionsverfahren
ist es aber w e g e n der h o h e n F e h l e r r a t e
nicht
Systeme
Die
bereits
des Verfahrens
Für
ernsthaften Einsatz geeignet.
Ergebnisse
Schwellwert
nicht
Verdreifachung
Beschreibung h.
des Englischen als
(=Fehlerquote)
j e d o c h aus K o s t e n - u n d Z e i t g r ü n d e n Insgesamt
die
zum O b j e k t b e r e i c h ,
geforderten
die
von
daß
dieser
festgestellt
Wörter)
sind.
dabei
Äquivalenz
davon
werden
der
aus
W O L F h a t sein V e r f a h r e n wendet,
Erstkomponenten
Zweitkomponenten
zyklisch, die
die
den
Konvergenz
Ausnahmen
das G e s a m t s y s t e m
auf
mit
Verfahrens
die
"geordnete
orthographischen
Umsetzungen
mit
durch
Buchstabenumsetzungs-
die
Bewertungsverfahren und
Sinne
den
(also
Ergebnis
fehlerhaften
(= F e h l e r q u o t e ) der
Überprüfung
Das
den
Regeln,
Regel
zu
entsprechende
der
Eingabecorpus
wurden, die
Im
speziellere
konstruiert
verfahren
Die
häufigsten
beschreiben.
keine
(23)
chen.
Paaren
es s i c h u m k o n t e x t f r e i e
Syntheseverfahren
generierten
angewendet,
Die
das
zwischen
den
zusammengefaßt,
generellsten
handelt
Buchstabenumsetzungsverfahren". Paare
gewinnt
in
notiert.
mit
Leerzeichen
Beziehungen
es
und
Basisregeln
am
zutreffen,
gibt.
können,
sie
Z e i c h e n , die d u r c h die A n a l y s e g e w o n n e n
einem
immer
werden
damit
indem
Ein-
formalen Grammatik
Kontext
müssen,
Material
jeweiligen
Umsetzungszusammenhang einer
diese
aufbereiteten
Regeln, von
den
In
behandelt
diesem
Einzelelementen
feststellt,
sind.
Algorithmus
werden.
Analyseverfahren den
lang
aufgeführten Nachteile
zeichenorientierter
s i n d a u c h d i e s e m V e r f a h r e n e i g e n , w a s s i c h vor a l l e m
bei
17
der A n w e n d u n g auf der T e x t e b e n e z e i g t . 3.3
DIE LEXIKALISCHE METHODE MIT VORANGEHENDER (Morphologische
Die
dritte
die
morphologische bei
Möglichkeit
der
aussetzung die
der
teilt.
Durch
den
(26)
Text
in
die
Algorithmen
Die
Morphemlexikon fanges
eines
ist
SchwierigkeiWortbil-
sind
hat
nur
einen
wie bei e i n e m
bereits
der
der
Zahl
reasind
zu der
geringeren
lexikalischen
hierbei
nicht
der auf-
Morpheme
entspre-
zusammengesetzt.
wesentlich
tauchen
Elemente
in g r ö ß e r e r
Strukturen
und w e r d e n d a r a u s
Vollformenlexikons
Vor-
Analysealgorithmus,
Gesamtstruktur
mit Neueinträgen
Nicht
Phonologie
die
morphologischen
phonologischen
phonologischen
Probleme
der
können
der, f l e k t i e r t e n F o r m e n oder die
in e i n e m L e x i k o n a b g e s p e i c h e r t chenden
sie
ist e i n m o r p h o l o g i s c h e r
oder
Derartige
lisiert.
Automatisierung
Methode.
r e i n e n W ö r t e r b u c h s u c h e , v e r m i n d e r t w e r d e n . Die
dafür
Wörter
SEGMENTIERUNG
Methode)
ten, w i e d i e B e h a n d l u n g dung
(25)
Teil
Dieses des
Um-
Methode.
(27)
in d e m M a ß e
auf
Vollformenlexikon.
gelöst
bei
dieser
Methode
ist h i n g e g e n
die
Behandlung
v o n p h o n o l o g i s c h e n A l t e r n a n t e n , z. B.:
Obwohl und
auf
hat
r i t h m u s der also
die
fest,
hier
jedoch Wege
Die
tet, e r f o l g r e i c h
praktikablen
nur
nur
mit
"text-
automatischen
Segmentierung
soweit
nicht
im
recht,
lösbar Methode
werden.
"einzig
daß
sind, mit
nicht
diese für
Punkt
ist."
(29)
Probleme
einen
k e n n t , b i e t e n sie keine
Zusammenhang
Algo-
Schwie-
Segmentierung
mit
einer
kann
algorithmi-
Information
auswer-
Praktiziert wird das
morpho-
einer
algorithmischen
to-speech
conversion"
akustischen
die
in d i e s e m
Anwendung
z. B. die s y n t a k t i s c h e
eingesetzt
Verfahren
automatischen zur
der zwar
für
er d i e s e s P r o b l e m als
"die
lexikalische
offensichtlich
Methode
daß
z. B. d i e W o r t k l a s s e (30)
s c h e n K o m p o n e n t e , die logische
morphologische
jenseits
lexikalischem
rigkeiten.
QsatnitiD
(28) h ä l t , b e t r a c h t e t
stellt
offensichtlich VENETZKY
£sain3
sanity VENETZKY
arbeitsfähige" lösbar
sane
Komponente (31) , e i n e m
Sprachproduktion.
Das
in
der
Projekt System
18
transformiert
einen
Transkription,
die
Längen
enthält.
graphemischen zusätzlich
Diese
s t i s c h e n Output
Input
Angaben
phonetische
in
über
eine
Streß,
Struktur
wird
phonetische Konturen
zu
und
einem
aku-
weiterverarbeitet.
Dafür sind folgende K o m p o n e n t e n "morphological
notwendig:
analyzer
parts-of-speech
determiner
parser letter-to-sound lexical-stress
Converter analyzer
p r o s o d i c correlate
determiner
phonemic synthesizer"
(32)
Die m o r p h o l o g i s c h e A n a l y s e stützt sich auf e i n mit
11000
zung
der
eine
(33)
Die
Aus dieser
Komponenten
Regelverarbeitung
zeugt. der
Einträgen. übrigen
die
Darstellung
Merkmalsebene.
Diese
nemic-synthesizer,
der
Analyse und m i t
wird auf enge
dieser
Morphemlexikon
phonetische
Ebene
ist d a n n
der
über
Transkription
"low-level p h o n o l o g y "
über
Unterstüt-
algorithmischem Wege
Input
Tongeneratoren
er-
erfolgt für d e n
die
auf pho-
synthetische
Sprache erzeugt. Das Projekt läuft bereits seit 1973, wobei
sich
der
pro-
Schwerpunkt
der
Forschung
zunehmend
auf das G e b i e t der
s o d i s c h e n Probleme wie T o n h ö h e , V o k a l q u a n t i t ä t , u. ä. (34) , d a schen
diese
Sprache
Eigenschaften am
stärksten
außerdem
einen
der
leisten m u ß , die
Zeit
fügung
steht.
prozessoren
hohen In
die
technischen
diesem
entwickelt,
"Natürlichkeit"
beeinflussen. Aufwand,
Das da
die
werden
deshalb
einzelne
der
syntheti-
System
erfordert
es
für den Sprechvorgang Rahmen
verlagerte
die
Analyse
selbst
zur
verstärkt
Systemteile
in
Ver-
Micro-
übernehmen.
(35) 3. 4 Aus
ZUSAMMENFASSUNG der
Kapitel
Bewertung
vorgestellten
ein u n i v e r s e l l e s , stem
der M e t h o d e n
aufstellen.
Systemen
und der lassen
phonologisches,
Kritik
an den
in
diesem
sich die A n f o r d e r u n g e n
automatische
an
Transkriptionssy-
19
Algorithmische den
technischen
bedarfs
Systeme haben lexikalischen Systemen
Vorteil,
ökonomischer
daß
sie
einsetzbar
wegen
des
geringeren
sind. M e t h o d i s c h
mit dem Problem unbekannter Lexikoneinträge Unter
den
vorzuziehen, gen
über
Systeme
algorithmischen da
die
sie
sprachunabhängig
Inputdateien
sind
Systemen
dagegen
leichter
schneller
im
Speicher-
sind
sie
nicht
belastet.
sind
sind zu
gegenüber
Interpreter
und
Grammatikänderun-
handhaben
Ablauf
Systeme
und
sind.
Compiler
leichter
zu
pro-
k ö n n e n j e d o c h d u r c h a u s s i n n v o l l als
Pro-
grammieren . Lexikalische
Systeme
duktionssysteme
eingesetzt
fachsprachliche
Anwendungen
Lexikonpflege (bei
kleinem
klein
Lexikon)
Die
Komponente
Trennung
ist d e s h a l b
wenn
werden
kann.
der
Beschränkung
der
Aufwand
Sie
haben
einfachen
auf
für
die
ebenfalls
Programmierung.
immer eine g e w i s s e F e h l e r q u o t e
auf-
ihnen in der R e g e l n i c h t g a n z auf
eine
verzichten,
in
durch
Miniwelten
den Vorteil Systeme
w e i s e n , k a n n m a n a u c h bei deln.
oder
gehalten
Da a l g o r i t h m i s c h e lexikalische
werden,
um
algorithmische
in der P r a x i s n i c h t
die und
Ausnahmen
zu
lexikalische
immer g a n z k o n s e q u e n t
behan-
Methoden durchführ-
bar . Die
in d i e s e m K a p i t e l
schliesslich
ihnen w i c h t i g e tax
nicht Die
Dies
Generalisierungen
ausdrückbar
rientierte Systeme folgt
vorgestellten
zeichenorientiert. sind.
Systeme
hat
den
in K l a s s i f i k a t i o n
Aus
diesem
Grunde
und
sind
aus-
daß
in
Regelsynmerkmalso-
vorzuziehen.
Anforderungen
für
ein
generelles
System
können
wir
wie
zusammenfassen:
Für e i n e a l l g e m e i n s p r a c h l i c h e A n w e n d u n g ein
algorithmisches
zur
Ausnahmenbehandlung.
terpreter aufweisen.
Systeme Vom
System Für
mit
einer
linguistische
vorzuziehen,
da
sie
e i g n e t sich a m
lexikalischen die
größere
Systeme adäquater
als
besten
Komponente
Anwendungen
grammatikalisch-phonologischen
sind m e r k m a l s o r i e n t i e r t e te.
s i n d fast
Nachteil,
sind
In-
Variabilität
Standpunkt
aus
zeichenorientier-
20
4.
GENERATIVE PHONOLOGIE UND AUTOMATISIERUNG
4.1
ÜBERBLICK
Im
folgenden
generativen theorie
Kapitel
der alle
zunächst
eingeführt.
(1968)
noch
einige
Ausgehend
Phonolgie
generativen
Pattern of English gehend
werden
Phonologie
von
Begriffe der
in CHOMSKY/HALLE,
der
StandardThe
Sound
(abgekürzt ab hier als SPE), die weit-
syntaktischen
Möglichkeiten
einer
phonologischen
Grammatik abdeckt, werden dann jeweils Zug um Zug die Fakten der generativen Phonologie erläutert tisierungsmöglichkeiten
und die entsprechenden
Automa-
sowie die technische Realisation
in PA-
NAMA diskutiert. Durch dieses Vorgehen kann die computative Realisierung eines linguistischen Problems nachvollzogen werden. Durch dieses Vorgehen wird auch deutlich, daß die im letzten Abschnitt schen
geforderten
Leistungen
Transkriptionssystems
in PANAMA
PANAMA arbeitet ausschließlich Bezug
zur
Zeichenebene
eines
universellen
erfüllt
automati-
sind: Das
System
auf der Merkmalsebene, wobei der
auf jeder Stufe herstellbar
ist. Es hat
eine lexikalische Komponente, die, verwendet man PANAMA im Sinne der
klassischen
Lexikon dung
Theorie
abdecken,
auch
als
der
generativen
andererseits
in
einer
reines Ausnahmelexikon
Phonologie,
das
algorithmischen
funktionieren
ganze Anwen-
kann.
ist es sowohl als algorithmisches System mit lexikalischer ponente, als
auch
als
Damit Kom-
rein lexikalisches System einsetzbar. Je
nach der Definition der Grenzsymbole durch den Benutzer kann das Lexikon auch als morphologisches Lexikon aufgebaut werden. PANAMA kann auch als rein algorithmisches System arbeiten, wenn man keine Einträge in das Lexikon vornimmt. Sogar eine zeichenorientierte Anwendung
ist möglich, indem man die Zeichen benennt und
in den Regeln die Zeichennamen verwendet. Jedes Zeichen besteht dann
aus
Merkmal.
einem
einzigen
von
jedem
anderen
Zeichen
distinkten
21 Bei P A N A M A h a n d e l t es sich u m e i n I n t e r p r e t e r phonologischen tet, d i e
Regeln
als
Inputdatei
in
einer
MERKMALE, SEGMENTE,
Die
Syntax
verarbei-
s i c h s o w e i t wie t e c h n i s c h m ö g l i c h a n d e n g ä n g i g e n
t i o n s k o n v e n t i o n e n der g e n e r a t i v e n P h o n o l o g i e 4.2
System, das die
Elemente
der
Nota-
orientiert.
MERKMALSMATRIZEN
Beschreibung
der
phonologischen
und
phoneti-
s c h e n S t r u k t u r sind M e r k m a l e und S e g m e n t e . Distinktive tationsebenen
Merkmale
benutzt.
klassifikatorischen che
sind
Plus
sie
oder
zu einer
werden Auf
für
der
Merkmale
der
Minus
annehmen
Klasse
der
phonetische
durch
und
oder ben B.
bzw.
können
nicht
Vorhandensein
( C ¿ S t immhaftj den
Grad
skalare schen
der
Öffnung
Spezifikation
Skala"
(3)
und
einer
Ebene
Merkmalinventar
ist
zwar
ne v ö l l i g
Parameter
für
dienen. Die führen,
das
der
des
Stimmbänder
ganzen
Zahl,
beschreiben.
aus einer
die
ange-
s e i n , w e n n sie
Sprachtraktes besteht
Vorhandensein
die
auf
eine
Die
"phoneti-
Position
der
phonologischen
und
des
phonetischen
Funktion. Auf
der p h o n o l o g i s c h e n
nur k l a s s i f i k a t o r i s c h e n C h a r a k t e r
binär. Auf
z.
der
phonetischen
physikalische
Ebene
Interpretation
und
sind
k ö n n e n sie aufgefaßt
System als
eiEbeals wer-
Instruktion
(4) Unterscheidung Ebene
lässt
zwischen sich
da
bei
der
Regeln
der
Grammatik
angewendet dung
B.
k ö n n e n skalar
für e i n p h y s i k a l i s c h - a k u s t i s c h e s
netischen die
z.
i d e n t i s c h , es h a t j e d o c h , wie e b e n e r l ä u t e r t ,
strikt
den, die
sie
im
Phonetische
angibt.
unterschiedliche
ne h a b e n die M e r k m a l e deshalb
Segment
sie e i n z e l n e A s p e k t e
Schwingung
sie
der
sol-
charakterisier-
Sprachprozess.
eines Merkmals
S e g m e n t e s auf d i e s e r S k a l a Das
wenn
einer
). Oder
"ob e i n
Merkmal
beschreiben
sein,
Als
die
(2)
akustischen
binär
Ebene.
sie
(1), die d e n W e r t
festlegen,
ein gegebenes
Repräsen-
bezeichnen
phonologischen
können,
Merkmale
artikulatorischen Merkmale
verschiedene
Seite
"abstrakte differentielle Marker"
ten E l e m e n t e g e h ö r t oder n i c h t " . Als
zwei
einen
werden
bereits
Überführung
der
Input
das für
phonologischen
immer
in
diese
(5) , w o b e i
wieder
der
nicht
die
in
ganz
phonetische
einer
Ergebnis die
und der
konsequent Ebene
festgelegten der
einen
nächstfolgende
pho-
durchdurch
Ordnung
RegelanwenRegel
ist.
22 D.
h.,
daß
nach
Ebene
bereits
schon
erreicht
Regeln
den
Regelanwendungen
ist,
ohne
wäre. Ausserdem
zyklisch,
Struktur
ersten
verändert so
daß
schrittweise
bei
in der
die
in der
für
jeden
von
die
zur p h o n e t i s c h e n e n t w i c k e l t ist eine
phonologische
phonetische
Durchlauf
Spalten den Segmenten, die
und
die
die
ist die A n w e n d u n g jedem
Die "phonetische Repräsentation sprechen
daß
bestimmten
phonologische
wird.
'phonetische
angegeben
ist,
Low-level tischen tomie
man
von
Phonologie
"low-level" findet
Spracherzeugung. entspricht
Transkription sprechende
weite
ist
der
jedoch
Merkmale
Repräsenta-
"high-level"
ihre A n w e n d u n g
(7)
z. B.
Der
high-level
und
enge
/
Phonologie.
in der
Transkription.
wiederzugeben.
nicht
an eine
gebunden,
Enge
oder
b i n ä r e oder
sondern
die
automa-
low-level
alle p h o n e t i s c h e n S a c h v e r h a l t e
Kennzeichnungen
skription kation
die
versucht
bzw.
Die
enge
durch
ent-
weite
skalare
skalare
Dicho-
(8) oder
fe n o t w e n d i g Um
Betonung
Spezifikation
die
metasprachliche
aber
generative Ausdruck ein.
Inkonsequenz
Beschreibung etische
Einheiten
Phonologie
Phonem
und
emische
im
führt
zu
verwendet
Gegensatz
umgehen,
Einheiten, zur
statt dessen
daß
in der
werden,
in
vermeidet
taxonomischen den Begriff
der
morpholo(10)
des
die den
Segments
(11) Ein
sie
Intona-
Transkriptionsstu-
sein.
phonologischen gischen
(9) auf einer w e i t e r e n
Tran-
Spezifi-
k a n n a u c h b e r e i t s bei b e s t i m m t e n M e r k m a l e n wie z. B. der tion
ent-
inwieweit
(6)
Je n a c h d e m G r a d der G e n a u i g k e i t der p h o n e t i s c h e n spricht
Matrix'
Zeilen den Merkmalen
Eintrag
das Segment das entsprechende Merkmal besitzt". tion
Ebene
Segment
k ö n n e n wir
gabealphabet
wird
durch
eine
als A b k ü r z u n g
ein
Merkmalmatrix
dargestellt.
Z e i c h e n aus d e m E i n - oder
verwenden. Als Notationskonvention
f ü h r e n wir
Für Aus-
dabei
ein: 1.
Segmente
2.
Segmente
in
ihrer
graphematischen
stehen zwischen senkrechten Strichen als
phonologische
zwischen Schrägstrichen 3.
Segmente
als
I...I.
Repräsentation
stehen
/.../.
phonetische
zwischen eckigen Klammern
Repräsentation
Repräsentation C...U .
stehen
23 Das Wort |SIEB| hat z. B. als Merkmalmatrix die Form:
und
- Vokalisch
+ Vokalisch
- Vokalisch
+ Konsonantisch
- Konsonantisch
+ Konsonantisch
+ Coronal
- Coronal
- Coronal
+ Anterior
- Anterior
+ Anterior
- Geschlossen
+ Geschlossen
- Geschlossen
- Offen
- Offen
- Offen
- Vorne
+ Vorne
- Vorne
- Hinten
- Hinten
- Hinten
- Rund
- Rund
- Rund
- Nasal
- Nasal
- Nasal
- Lateral
- Lateral
- Lateral
+ Dauernd
+ Dauernd
- Dauernd
- Stimmhaft
+ Stimmhaft
+ Stimmhaft
+ Scharf
- Scharf
- Scharf
könnte
in dieser Form
hen. Als Abkürzung
in einem phonologischen
/i/, /b/ verwendet werden. Da härtung
Lexikon
ste-
kann dafür die Schreibweise /sib/, oder /s/, für das Deutsche die
Auslautver-
eine phonologische Gesetzmäßigkeit darstellt, würde die
phonetische
Form Qsi:p^
lauten, wobei
Merkmal E + Stimmhaft^] im Segment /p/ zu
in der Merkmalmatrix das Q - Stimmhaft^] wird.
Zwei Segmente A und B sind distinkt, wenn es wenigstens ein Merkmal in A gibt, das anders spezifiziert ist, als das gleiche Merkmal
in B, oder
wenn die Anzahl der Merkmale
in A ungleich
der Anzahl der Merkmale in B ist. (12) Die
Darstellung
in Merkmalsmatrizen
ziert, wenn aus einem
vorgegebenen
ist
dann
Merkmalsystem
vollspezifialle
Merkmale
eines Segments spezifiziert sind. Die computative
Darstellung
der Merkmale prägt
das gesamte Design eines Systems zur Verarbeitung
entscheidend einer
genera-
tiven phonologischen Grammatik. Die einfachste Art, nämlich die Abspeicherung eines Merkmals mit seinem Namen und seiner fikation
in expliziter
Darstellung
(z. B. + Vokalisch)
Spezierweist
sich als unmöglich, da man bei diesem Verfahren sehr schnell an die
Grenze
der
Speicherplatzkapazität
Diese Form der Abspeicherung
der
EDV-Anlage
stößt.
würde bedeuten, daß ein vollspezi-
24 fiziertes Segment bei 30 Merkmalen belegt, ein Lexikoneintrag KB. Da ein Lexikon aber fassen
kann, und
chend aufwendig
mit
(13) bereits 150 Bytes
(14)
zehn Segmenten also bereits
sicherlich
einige tausend Einträge
die Regelabspeicherung
auch
nochmals
1,5 um-
entspre-
ist, erweist sich diese Art der Darstellung als
wenig praktikabel. Zur Komprimierung bietet sich die Möglichkeit der Ausnutzung der Binarität der Merkmale an, da die Informationsstruktur digitalen EDV-Anlage steht bei der hier Geht man
ebenfalls binär
einer
ist. Ein Maschinenwort
be-
verwendeten Anlage SIEMENS 4004 aus 32 Bit.
von den oben erwähnten
30 Merkmalen aus, so kann man
jedem Merkmal eine feste Position in diesem Maschinenwort zuweisen. Ein Segment besteht dann nur noch aus vier Bytes: Segment (15)
Maschinenwort
Bitposition
/i/ + Vokalisch
0
- Konsonantisch
1
- Coronal
2
- Anterior
3
+ Geschlossen
4
- Offen
5
+ Vorne
6
- Hinten
7
- Rund
8
- Nasal
9
- Lateral
10
+ Dauernd
11
+ Stimmhaft
12
- Scharf
13 14
31
(16)
25 Damit
kann
werden.
nun
Wir
nenwortes dezimal
jedes
können
Merkmal
aber
gleichzeitig
darstellen. können
Für
damit
die
Bitkombination
numerischen
unser
die
jeder Programmiersprache
dessen
auch
als
2**4 + 2**6 + 2**11 + 2**12 menten
und
runden
Merkmals
Vokal,
"Rund"
so
Wert
Beispiel
=
ist
somit
Maschi-
bedeutet
dies:
und
2**0
+
Rechenoperationen,
wie
sie
in
zur Verfügung stehen, verwendet werden. — / y / ,
bedeutet
von Minus
wesentlich
dieses
interpretieren
dies,
auf
Plus
daß
also zum entsprechendie
Spezifikation
gesetzt werden muß und
spricht einer Addition um dem Wert 2**9. Diese eine einfachere
bestimmt
6225. Zur Manipulation von Seg-
normalen
Gibt es eine Regel z. B. /i/ den
Spezifikation
ökonomischer
und
des ent-
Darstellungsweise
ermöglicht
gleichzeitig
Programmierung.
Bei dem in dieser Arbeit realisierten System PANAMA wurde für die Abspeicherung
eines Segments
ein Umfang
von
zwei
Maschinen-
wörtern vorgegeben, d. h. es können Merkmalssysteme bis zu einem Umfang
von
notwendig, Merkmale Bit
Merkmalen z.
B.
verarbeitet
bei
den
werden.
CHOMSKYschen
Dieser
63 Bit ihnen
haben
als Vorzeichenbit
jeweils
entspricht
ein
eine
direktes
Dezimalzahl
Umfang
Merkmalen
für suprasegmentale Einheiten hinzukommen.
ist maschinenintern
von h.
63 da
dezimales
die
(17) Das 64.
belegt. Die
zwischen
ist
noch
Bitfolgen
Äquivalent,
0 und
d.
2**64 - 1.
Mit diesen Werten können die Segmente verarbeitet werden. Diese
Binärdarstellung
Auswirkungen durch nur
die
auf
den
Zuordnung
zwei Werte
der
einer
(18)
der -
möglich. dings auf
Lexikoneinträge
) für
die
Position
mit
einer
zu
Auswirkungen der
hat
diese
Aus den gleichen Gründen nicht
(21)
zusätzlich
nicht die
0
(neben nicht
Beschränkung
phonologischen
Segmenten
Merkmalen
Darstellung
ist dadurch
Grammatik
arbeiten müssen
her über Redundanzregeln aufgefüllt worden sind.
heitstheorie
den
Auch
Spezifikation
hier
allerohnehin
(19) , die
können
'markiert'
+
mehr
vor-
(20)
ist auch die Anwendung der
möglich.
Da
Merkmalsmatri-
Spezifikation
Merkmale
starke
Grammatik.
sein. Eine redundanzfreie
nicht, da die Regeln
vollspezifizierten
allerdings der
können, müssen die
voraussagbaren
Praktische
hat
Status
einzigen
benutzt werden
zen immer vollspezifiziert und
Merkmale
theoretischen
oder
die
MarkiertMerkmale
'unmarkiert'
annehmen. Doch auch dieser Nachteil wirkt sich auf die Anwendung
26 nicht tung
aus,
da die M a r k i e r t h e i t s t h e o r i e
von Grammatiken
von p h o n o l o g i s c h e r Auswirkungen 4.3
eine
Rolle
vor
spielt,
zu p h o n e t i s c h e r
allem
für die
bezüglich
E b e n e aber
der
keine
Bewer-
Umsetzung
inhaltlichen
hat.
LEXIKON UND PHONOLOGISCHE
STRUKTUR
D a s L e x i k o n h a t n a c h der p h o n o l o g i s c h e n T h e o r i e die A u f g a b e , phonologischen stellen. nente
Diejenigen
einer
Analyse
Struktur
eines
ment-Komponente Komponente
Strukturen,
generativen
phonologische sche
S t r u k t u r e n v o n W ö r t e r n oder
werden,
sind
noch n i c h t g e e i g n e t , so d a ß die
(22)
oder
Wortes
durchlaufen soll,
muß.
lassen
spiel v e r d e u t l i c h e n .
Die
über
im S i n g u l a r
SIEB
erzeugt
sich
am
Leistungen, besten
an
I n f o r m a t i o n , die uns eine und P l u r a l
Kompofür
die
phonologi-
e r s t n o c h eine Die
die
bereitzu-
die v o n der s y n t a k t i s c h e n
Grammatik
Satzes
erbringen
das Wort
Teilwörtern
readjustdie
diese
einem
Bei-
Syntaxanalyse
liefert,
könnte
etwa
so a u s s e h e n :
1)
^SIEßJ N
2)
[SIEB]
PlJ N
Das L e x i k o n nämlich
liefert
/si:b/.
die G r e n z s y m b o l e und die richtige
uns die p h o n o l o g ische S t r u k t u r
Aufgabe wie
Beispiel
der
readjustment-Komponente
S a t z - , W o r t - oder M o r p h e m g r e n z e
syntaktische
In u n s e r e m
N
Information müßte
Pluralendung
/e/
also
a u s z u w e r t e n u n d zu a u s der
erzeugt
Information
werden.
Das
/si:b^/
4)
/si:b+e^/
s t e h t für W o r t g r e n z e ) (+ s t e h t für
Morphemgrenze)
|SIEB|,
ist es
nun,
einzusetzen verarbeiten. 'Plural'
Ergebnis
p h o n o l o g i s c h e S t r u k t u r der b e i d e n W ö r t e r : 3)
von
ist
die die
27 Die
Auslautverhärtungsregel
der
deutschen phonologischen
Gramma-
tik m a c h t d a n n a u s 3) : 5)
Csi:p3
für 4) t r i f f t d i e s e R e g e l n i c h t zu, also: 6) Eine
Q s i : be]]
syntaktische
SAVANT ANGLAIS
d.
h.
"der
wir
haben
englische
schen
durch
Analyse
ART
ADJ
ART
N
einmal
"der
Gelehrte".
die
Liaison
schen Adjektiven tiv
Die
den
französischen
UN
N NP
ADJ NP
gelehrte beiden
(23)
Engländer"
und
Formen werden
zum
im
andern
Französi-
Da die L i a i s o n
folgenden Nomen auftreten
zwar
kann,
im S i n g u l a r u n d e i n e m f o l g e n d e n
(24), e r h a l t e n wir f o l g e n d e p h o n e t i s c h e 9)
Ausdruck
liefern:
unterschieden.
und e i n e m
zwischen einem Nomen
aber
für
w ü r d e uns zwei A n a l y s e n
zwinicht
Adjek-
Repräsentationen:
[^savatjaglel]
10)
Qsava
Die A n w e n d u n g
der
agleU Liaisonsregel
in der
phonologischen
Struk-
tur : 11)
/€en s a v a t a g l e s / =
können
wir
Wörter
entnehmen.
Aufgabe vention
also
der (25)
nur
der
Diese
(6)
syntaktischen Information
readjustment-Komponente. fest,
daß
alle
Funktion
der
bereitzustellen Wir
legen
einzelnen ist
deshalb
nichtphonologischen
wieder
als
Kon-
Informationen
28
(26) jedem Segment eines Wortes zugeordnet werden. Das einfachste Verfahren
ist dabei, diese Informationen genau wie Merkmale
zu behandeln, so daß z. B. jedem Segment von /savat/ das Merkmal C+ADJU
erhält. Dieses Verfahren löst auch die Probleme der Be-
handlung von |-ENT | als Flexionsmorphem der 3. Person Plural bei Verben
(27),
B.:
12)
le P r e s i d e n t
Qla
presidiQ
13)
ils P r e s i d e n t
Cil
presid(8)3
durch die Regeln: —
14)
15) Die
—
/n/ +VERB
L/e/3
H/n/U
phonologische
—
—
/t/
/e/ +VERB
+VERB E/t/J
Struktur
->
eines
2
Satzes
besteht
damit
aus
einer Folge von Segmenten aus dem Lexikon, die um einzelne Merkmale
erweitert
sind, und
sind formal mit Segmenten handelt.
Sie
bestehen
phonologischen
aus Grenzsymbolen. einer
was
durch
Merkmalkombination
über die
C+Wortgrenzel]. Bei CHOMSKY/HALLE Segmentstatus,
Grenzsymbole
identisch und werden auch genauso be-
aus
Merkmalen,
Diese
das
aus
nicht-
sie definiert werden, z. B.
(28) haben Grenzsymbole
Merkmal Q -
SegmentU
keinen
ausgedrückt
wird. Alle anderen Segmente haben das Merkmal Q + SegmentH . In PANAMA sind zwei Wege vorgesehen, die phonologische Struktur aufzubauen. Der erste Weg
ist der Aufbau über das Lexikon,
indem eine Kette von Zeichen der syntaktischen Oberflächenstruktur
durch
eine
Sequenz von Segmenten
setzt wird. Die
zweite Möglichkeit
in Merkmaldarstellung
ist der
er-
zeichenweise Aufbau
über eine Tabelle, in der für jedes Zeichen aus dem Alphabet der syntaktischen
Oberflächenstruktur
korrespondierenden wurde
deshalb
Segments
die
angegeben
möglich,
ist.
Diese
eingeführt, um das phonologische
hend durch eine kontextfreie Grammatik ist
Merkmaldarstellung
da
die
Beziehungen
des
Möglichkeit
Lexikon
weitge-
ersetzen zu können. Dies
zwischen
den
Graphemen
eines
29 Wortes
und
dessen
Das
Lexikon
Die
beiden
versucht, Zeichen die
phonologischer
wird
damit
Verfahren mit
(z.
B.
kein
nigen
die
über
Wörter
regelhaften Für
oder
über
die
des
syntaktischen
von
Zeichenketten
frei
ist,
können
xikon
simuliert in
genommen
werden.
4.4.1
DIE
die
zu
in
tur
bildet
den
lisation
erzeugt.
Grammatik
dem
auch
das
DER GENERATIVEN
werden.
diese
Lexikon
über
in
Zuordvöllig das
Merkmale
Lexikoneinträge
PHONOLOGIE
Da der
nicht
die
Strukturen
Grammatik
der
Sprach-
Leund auf-
UND
REALISIERUNG
für
Diese
die
PHONOLOGIE
beschriebene
Grammatik,
Grammatik
die
ist
phonologische die
eine
Struk-
phonetische
Rea-
kontextabhängige
(29):
Regeltyp:
yl A y 2
die
der
Ergebnissen
entsprechenden
Struktur
Abschnitten
Input
den
kann
über
gesamten
IN D E R G E N E R A T I V E N
vorigen
für
diejevon
der
vorausgesetzt von
wird,
die
um
Wird
noch
wegen
phonologischen
der
indem
COMPUTATIVE
den
den
von
Segment
nur
Ausnahme
Komponente
Input
jedoch
Kette
darstellen.
wesentlich
phonologische
REGELN
Die
ten
eine
Teile
DER FORMALE APPARAT SEINE
Da
die
Da
wird
gewinnen.
Aufbau
enthalten,
bestimmt
werden,
Segmente
4.4
diese
der
damit
als
Zuerst
durchzuführen, zu
muß
Verfahrens
nung
erfolgt
sind.
Ausnahmelexikon.
festgelegten
Weise
die Tabelle
werden.
einem
Lexikon
syntaktische
Komponente
integriert
regelhaft
Lexikonsuche diese
so
Das
Morpheme
PANAMA muß
auf
readjustment-Komponente
PANAMA
mit
eine
gefunden,
Tabelle.
Umsetzung
unabhängigkeit die
Wort)
oft
nachgeordnet.
Grenzsymbole
Struktur
Lexikoneintrag
Segment
zu
einander
durch
einem
phonologische
hauptsächlich sind
einer
Struktur
Elemente
beschreiben,
— >
dieser in
der
yl y
Regeln
y2
(yl,
generativen
y2
...)
Ketten
Phonologie
über
Regeln
Alphabeaber
auf
30 Segemente
bzw. d e r e n
se Regeln überführen
Die
Merkmale
angewendet
in Regeln der
..., sll; s ; s21, s22,
Sil, sl2,
..., sll; s'
Segmente
sind
weiter
M112
M122
Mili
Ml 2 i
Mlj i
Mill
M121
Mlj 1
M'l
M112
M122
Ml j2 ...
7 M'2
Mili
M12i
Mlj i
M' i
mindestens muß,
bestand
d.
h.
ist
die
Ml
Ml j 2
? M2
die
IN
Darstellung
(30),
Regel
— ^
s2j
durch M e r k m a l e ,
so d a ß
wir
i
~M211
~M221
M212
M222
M21i
M22i
...
M2k2
M2ki
M211
M221
M2kl
M212
M222
M2k2
M21i
M22i
M2ki
^Ml,
muß
M2kl
eine
..., echte
Mi^
f
^Ml 1 ,
Änderung
...,
Mi^
im
Merkmals-
immer
redundant
REGELN
von
S e g m e n t e n in M e r k m a l s f o r m
Z. B.
Konsonantisch
+ Coronal + Anterior -
Geschlossen
-
Offen
in
ist:
- Vokalisch +
..., s2j
hervorrufen.
ist es u n n ö t i g ,
zu s p e z i f i z i e r e n .
t
Merkmal
eines S e g m e n t s
4.4.2 R E D U N D A N Z E N Da
"Mlj "
ein
die-
können:
~M12f
...
können wir
Form:
; s21, s22,
explizierbar
Mill"
sein
folgenden
sll, sl2,
noch weiter d i f f e r e n z i e r e n
wobei
werden,
den Regeln die M e r k m a l m a t r i z e n
voll
31
- Vorne - Hinten - Rund - Nasal - Lateral + Dauernd - Stimmhaft + Scharf auch in der folgenden Darstellung: + Coronal + Anterior - Stimmhaft + Scharf noch eindeutig Die
von allen anderen Segmenten unterscheidbar.
Distinktheit
stellung
der
Segmente
(32) bleibt auch
in dieser
(31) Dar-
erhalten, d. h. es gibt kein anderes Segment als /s/,
das diese vier Merkmale mit diesen Spezifikationen enthält. Eine Regel yl A y2
— ^
yl y y2 ist dann auf eine Segmentse-
quenz S = sll ... sli, s, s21 ... s2j anwendbar, wenn yl, y2 jeweils nicht distinkt sind von sll ... sli
bzw. s21 ... s2j, und
A nicht distinkt von s. Die Regelanwendung ersetzt S durch S' = sll ... sli, s', s21 ... s2j, wobei s' alle Merkmale von A enthält und zusätzlich alle Merkmale aus y, die nicht in A enthalten sind. (33) 4.4.3 DIE TECHNISCHE REALISIERUNG DER REGELN Für
die
technische
Realisierung
der
Regeln
ist das
wie wir es für die Darstellung der phonologischen
Verfahren,
Struktur ver-
wendet haben, nicht mehr möglich. Bei der phonologischen
Struk-
tur konnte die direkte binäre Darstellung verwendet werden. Eine Regel besteht jedoch aus Folgen von Segmenten mit unterschiedlichen der
Funktionen Segmente
(Regelinput,
können
sein. Deshalb muß man
auf
-Output,
-kontext).
unterschiedlichste
Weise
zunächst ein neues Verfahren
cherung der Regeln finden.
Die
Merkmale
spezifiziert zur Abspei-
32 Um die der phonologischen Stuktur zugrunde gelegten 63 Merkmale differenzieren Die
Identifikation
zu können benötigen wir der Merkmale
6 Bit
(2**6 = 64) .
kann über den numerischen Wert
der Bitposition erfolgen, den das Merkmal in der
phonologischen
Struktur einnimmt. D. h. wenn das Merkmal CScharf^in der phonologischen
Struktur
wird, erhält
es
auf
der
in der
den sechs Bit wieder
dreizehnten
Regel
binär
Position
den Dezimalwert
spezifiziert
dreizehn, der
in
abgelegt wird. Da bei jedem Merkmal
noch verschiedene Spezifikationen und andere Kennzeichnungen wie z. B. Variable malspeichers Anzahl
der
angebbar
auf
sein müssen, wurde die Länge des Merk-
zwei Bytes, also sechzehn Bit festgelegt. Die
möglichen
Merkmale
pro
beschränkt, da in der Literatur
Regelsegment
wurde
auf
zehn
keine Regel auffindbar war, die
diese Zahl erreicht hätte. Der aufgrund durch
Graphembegriff, der
die
den
relationalen
zeichenweise
wir
eingeführt
haben
(34) , umfaßt
Definition auch komplexe Grapheme. Da
Umsetzung
in die phonologische
Struktur
damit auch komplexe Segmente entstehen können, müssen wir deren Verarbeitung in den Regeln zulassen: 1)
yl y y2
— >
yl y' y2
(35)
mit yG $ * z. B. : 2)
/ent/ (36)
+Verb
Dieses Verfahren reduziert gleichzeitig den Umfang des Regelcorpus. Die Anzahl der Segmente
in Regelinput und -Output wurde
in PANAMA auf sechs Segmente beschränkt. Durch diese Form der Regeln kann eine beliebige Segmentfolge ( 0 - 1 - 6 )
in eine beliebige andere Segmentfolge
( 0 - 1 - 6 )
umgesetzt werden. 3)
sl, s2, ..., si
—•>
sl', s2*, ..., si' (i ^ 6)
33 Wir
legen
nun
fest,
i-te S e g m e n t d e s
daß
das
i-te
Regelinputs
Segment
modifiziert.
des
Regeloutputs
das
Ist im R e g e l o u t p u t
die
A n z a h l der S e g m e n t e kleiner a l s in I n p u t : 4)
sl, s2,
..., si
sj 1
sl', s 2 ' ,
(i * 6; j ^ i) so i m p l i z i e r t d i e s die 5)
sj+1,
Regel:
.. . , si
—
0
(j < i * 6) Ist
im R e g e l i n p u t die
Zahl der S e g m e n t e
k l e i n e r als im R e g e l -
input: 6)
sl, s2, ..., si (i~6;
j
-— ^
..., sj 1
sl', s2',
—i)
so i m p l i z i e r t d i e s die R e g e l : 7)
0
— s i + 1 ,
... , sj
(i < j * 6) d. h. d i e S e g m e n t e w e r d e n h i n t e r d e m i - t e n S e g m e n t Der K o n t e x t e i n e r Inputsegmentfolge Ein
Platzhalter
Regel beschreibt
stehen gibt
muß,
dabei
damit
die
eingefügt.
die U m g e b u n g , eine
Position
Regel der
in der
eine
anwendbar
ist.
Regelinputfolge
in
d i e s e m K o n t e x t a n , z. B.: 8) / s / — 7 > C + S t i m m h a f O /
+Vokalisch
+Vokalisch
-Konsonant.
-Konsonatisch
(Intervokalisches /s/ wird Der
Platzhalter
wird
durch
einen
stimmhaft)
Strich
unten
(Untersteichung)
symbolisiert. Da d i e A n z a h l der riabel weils
Segmente
vor
oder
ist, m u ß e i n e A d r e s s r e c h n u n g das
richtige
Segment
aus
der
nach dem Platzhalter
d u r c h g e f ü h r t w e r d e n , die phonologischen
Struktur
vajezur
34 Verfügung
stellt. Diese Distanz wird
im zehnten Merkmalspeicher
eines jeden Kontextsegments abgespeichert. Da wir die Anzahl der möglichen Merkmale
pro Segment
auf
zehn beschränkt haben
(37) ,
stehen für die Kontextsegmente nur noch neun Merkmale zur Verfügung. Im zehnten Merkmal steht statt der Merkmalsnummer die Entfernung, und die Spezifikation des Merkmals
(+ oder -) zeigt an,
in welcher Richtung vom Platzhalter das Vergleichssegment zu suchen ist. Die oben zitierte Regel wird damit folgendermaßen umformuliert: +Vokalisch 9)
/s/
+Vokalisch -Konsonantisch
>[j-StimmhaftU / -Konsonant
+ 1
- 1
Diese Ergänzung der Kontextsegmente wird vom Regelverarbeitungsprogramm durchgeführt. Für bestimmte Regeln kann es sinnvoll sein, daß der Platzhalter selbst Bestandteil eines Kontextsegmentes
ist.
(38) In die-
sem Fall dürfen als Regelinput keine komplexen Segmente angegeben werden, da damit keine eindeutige
Identifizierung der Posi-
tionen mehr möglich ist. Für den Kontext der Regeln wurden generell zwanzig reserviert. Der Platzhalter nes
Segment, da
er
über
selbst beansprucht dabei kein eige-
die
Distanzmerkmale
Dies bedeutet, daß für jede Regel ä zehn Merkmale tigt also
Segmente
verarbeitet
im Regelspeicher
wird.
32 Segmente
zu je zwei Bytes belegt sind. Jede Regel benö-
640 Bytes. Da z. B. auf der Siemens-Anlage, auf der
PANAMA realisiert
ist, als Kernspeicher
nur 200KB zur Verfügung
stehen, wird deutlich, wie wichtig die optimale Realisierung von Regeldarstellung Ausweichen
auf
und
phonologischer
externe
Verarbeitungszeit
erhöht
Speicher sich
Struktur
wie
dadurch
ist.
Magnetplatte jedoch
Zwar
ist ein
möglich,
beträchtlich,
die da
auf den Regelspeicher permanent zugegriffen werden muß. 4.4.4 KATEGORIALSYMBOLE Kategorialsymbole sich
durch
(39) bezeichnen eine Gruppe von Segmenten, die
teilweise
gleiche
Merkmalsspezifikationen
auszeich-
nen. Sie dienen zur Verkürzung der Regelschreibweise. Die Merk-
35 male
vokalisch
Klassen ein
konsonantisch
und
t e i l e n die S e g m e n t e
in vier
(40):
+ Vokalisch -
Konsonantisch
-
Vokalisch
+
Konsonantisch
= Vokale = V
= reine
Konsonanten
+ Vokalisch +
Konsonantisch
-
Vokalisch
-
Konsonantisch
Diese
Einteilung
da
den
in
nanten bekannt
Liquide
= Gleitlaute
läßt
sich
Regelmerkmalen
abgespeichert ist,
welche
= Konsonanten = C
in d i e s e r
nur
werden
eine
kann,
Form
nicht
Spezifikation und
zu d i e s e m
Merkmalkombination
später
automatisieren, bei
den
Konso-
Zeitpunkt
nicht
zum V e r g l e i c h
an-
steht. Für unser S y s t e m g e l t e n d e s h a l b f o l g e n d e
Konventionen:
+ Vokalisch -
Konsonantisch
-
Vokalisch
+
Konsonantisch nur
= V
= C
Dadurch
werden
erfaßt.
Regeln,
die
die
ziehen,
müssen
deshalb
reinen
sich
auf mit
Konsonanten
den
entsprechenden
für L i q u i d e und G l e i t l a u t e w i e d e r h o l t Als Allkategorie bezeichnen
werden
die
Konsonanten
C
be-
Merkmalsangaben
werden.
die S y m b o l e
jede S e g m e n t f o l g e ,
d u r c h die K a t e g o r i e
die G e s a m t h e i t der
X, Y
und
keine W o r t g r e n z e
Z benutzt.
Sie
enthält.
(41)
36 1)
A
— >
B / C X
ist eine Abkürzung 2)
A
für die
—
B
Regeln:
/ C sl
... si _
(i — 0, und si keine
3)
A
—
/ C sl
... si-1
4)
A
—•>
B
B / C sl
... si-2
5)
A
— >
B / C sl
6)
A
— >
B / C
(X umfaßt auch die Kategorie Im
Regelspeicher
zeichnet, setzt
daß
wird.
das
werden gesamte
In der
— >
X,
auf wird
den
Y,
Z dadurch
Wert
bei einem d e r a r t i g e n
zum E i n f ü g e n und Löschen von
bedeutet, ist.
Für
d. h.
sie
0
— >
daß ist
textbedingung
vor
jeder
erfüllt
Kategorien
die
einen
und
Untergrenze
C
und
variablen
dem
Segment
entfällt Stelle
die
B
ein
Segment
Überprüfung
anwendbar,
an
des
der
A
einzufügen
Regelinputs,
allein
die
Kon-
ist.
4.4.5 L I M I T A N G A B E N BEI Die
wird.
A / _ B
Regel an
Seg-
0 / _ B
immer
diese
ge-
Segmenten.
b e d e u t e t , d a ß in der Umgebung B das Segment A gelöscht 8)
gekenn-
High-Value
angestoßen.
Das 0 - S e g m e n t dient A
Null.)
Symbole
Regelanwendung
ment eine S o n d e r r o u t i n e
7)
die
Segment
enthält
Wortgrenze)
KATEGORIALSYMBOLEN V
können
mit
Limitangaben
Wiederholungsfaktor
des W i e d e r h o l u n g s f a k t o r s
Form von S u b - und S u p e r s k r i p t
versehen
angeben. werden
geschrieben.
(42)
durch
werden,
Die
Ober-
Indices
in
37 1) Dies
C^
bedeutet,
daß
das
Segment
i - m a l und m a x i m a l j - m a l v o r k o m m e n 2)
A
— >
in
dieser
Position
mindestens
kann.
B / _ Ci
ist i d e n t i s c h m i t :
C0
3)
A
4)
A
— >
B / _ C B / _ CC
5)
A
— >
B / _ CCC
b e d e u t e t eine b e l i e b i g e A n z a h l v o n V o r k o m m e n v o n C: 6)
A
— >
wird expandiert 7) 8) 9)
A A A
B / _
zu:
— > — > — >
B / _ B / _ C B / _ CC
Ist kein S u p e r s k r i p t men
Cq
j angegeben, werden mindestens
verlangt. 10)
A
— >
B / _ C2
bedeutet: 11)
A
— >
B / _ CC
12)
A
— >
B / _ CCC
i Vorkom-
38 Für
die
technische
rialsymbolen PANAMA gilt
gelten
verarbeitet
jedoch
die
Realisierung
folgende
ge
Zahl,
damit
C^
T i e f - oder
die
fest
Obergrenze
Hochstellung
reserviert
Mit
in
Das
Programmsystem
Symbolen
jedem
möglich
neun Da
C
Fall
und
einer
V.
beide
festgelegt
auf
Katego-
und
mit
dem
Es
Indices
einstelli-
ist.
muß
CQ
Lochkarte
keine
ist, m ü s s e n I n d i c e s , d u r c h
Komma
d e m S y m b o l s t e h e n : z. B. C l , 3 . V e r a r b e i t e t Die M e r k m a l e
59 u n d
Merkmalnamen
Der W e r t d e s Index w i r d
malspeichers abgelegt. 4.4.6
auf
werden.
Indices wie M e r k m a l e .
eingetragen.
daß
den
bei
Die A n g a b e e r f o l g t a l s g a n z e
geschrieben
getrennt, hinter den die
bei
Einschränkung,
womit
als
Indexangaben
Konventionen:
Indexangaben
angegeben werden müssen.
der
Minimum
60 s i n d bzw.
werdafür
Maximum
im I n t e g e r b e r e i c h d e s
Merk-
(43)
VARIABLEN-SPEZIFIKATIONEN
Hilfe
der
Variablennotation
Regelmäßigkeiten
auf
Wir
an
machen
dies
eine
können
natürliche
einem
Beispiel
bestimmte
Weise
aus
phonologische
dargestellt
dem
werden.
Französischen
deut-
lich : Zwischen
zwei
Wörtern
(an
der
nen folgende Segmentkombinationen C f C
C fi L
C f V
Wortgrenze;
Symbol:
kön-
auftreten: C / G
L / C
L ji L
L f V
L / G
V f C
V / L
V ? V
V / G
G / C
G / L
G ^ V
G f G
(44)
z. B. in f o l g e n d e n f r a n z ö s i s c h e n W ö r t e r n : petit garçon
petit^ livre
petit
enfant
cher g a r ç o n
cher livre
cher
le g a r ç o n
le livre
1 (e) 1
pareil gâchis
p a r e i l livre
v i e i l ami
enfant enfant
petit cher
oiseau oiseau
1 (e)' o i s e a u vieil
oiseau (45)
Die
markierten
Segmente
werden
in der
phonetischen
tion g e t i l g t . D i e s e T i l g u n g l ä ß t s i c h in R e g e l n so
Realisa-
darstellen:
39 1)
K o n s o n a n t e n w e r d e n vor K o n s o n a n t e n u n d
Liquiden
getilgt. 2)
V o k a l e w e r d e n vor V o k a l e n und G l e i t l a u t e n
getilgt.
3)
L i q u i d e und G l e i t l a u t e w e r d e n s e l b s t n i c h t
ge-
tilgt. Legt
man
die
Merkmalsverteilung
dieser
vier
z u g r u n d e , so k a n n d i e s e R e g e l so u m f o r m u l i e r t
5)
-
Konsonantisch
-
Vokalisch
0 /
+ Konsonantisch der
Betrachtung
und
ein
Plus
umgekehrt.
K e r n , der
beiden
regelhaft
vorgegeben
ist,
Regeln
beiden
Buchstaben Merkmals.
kann
durch
Variable,
dargestellt Ihr a k t u e l l e r
werden.
Die
die
? C+
Konsonantisch]
Regeln
fällt
Dort,
in
der
enthalten
wo
auf, daß
eine
Regel
6)
einen
vertritt
der
einen
anderen
ein
Minus
also
einen
kleinen
die
gleichen
(47)
kann. gelöst
griechischen
Spezifikation
eines
W e r t kann e r s t in der R e g e l a n w e n d u n g
Variable
selbst
kann
die
in
die V a r i a b l e n n o t a t i o n durch
wird,
In der V a r i a b l e n n o t a t i o n
wieder
er-
spezifiziert
auszudrücken.
kann m a n die b e i d e n R e g e l n 4) und 5)
zusammenfassen,
Z u s a m m e n h a n g der b e i d e n R e g e l n
die
gleichzeitig
den
inneren
ausdrückt:
• oc V o k a l i s c h
6)
oe K o n s o n a n t i s c h "Französische menten,
Konsonantisch]
ist.
steht
s e i n , um ihren K o m p l e m e n t ä r w e r t in
_ f Q-
9
Die
Problem
Eine
mittelt
werden:
in d i e s e r N o t a t i o n n i c h t d e u t l i c h g e m a c h t w e r d e n
Dieses werden.
—>
dieser
Spezifikationsverteilung Regel
(46)
+ Vokalisch
4)
Bei
Kategorien
die
Vokale getilgt
Konsonantalität
—
&
/ _ t D*Konsonantisch]
und K o n s o n a n t e n werden,
wenn
übereinstimmt".
das
(48)
laubt es, diesen Sachverhalt adäquat In der
technischen Realisierung
zugelassen.
Da es
in der E r f a s s u n g
bilden eine Klasse von folgende Die
Segment
Seg-
in
der
Variablennotation
er-
auszudrücken.
v o n PANAMA s i n d vier der R e g e l n keine
Variable
griechischen
40 Zeichen gibt, werden sie durch die Großbuchstaben A, B, C,D notiert. Für die Verarbeitung der Variablen sind in jedem Merkmalspeicher drei Bit reserviert, in denen für A, B, C, D der binäre Wert 1, 2, 3, 4 abgelegt wird. In der Regelanwendung wird beim ersten Auftreten einer Variablen ein Merkspeicher mit dem aktuellen
Wert
des
Merkmals
aus
der
phonologischen
Struktur
be-
schickt. Beim zweiten und jedem weiteren Auftreten wird dann in Abhängigkeit die
des
Vergleichs-
Merkspeichers bzw.
und
der
Vorzeichenspezifikation
Ersetzungsoperation
durchgeführt.
Da
die
Leerbelegung der Speicher für die phonologische Struktur und die Regeln Null ist, ist zu beachten, daß der komplementäre Wert einer Variablen A als +A angegeben werden muß, was im Gegensatz zur gängigen Konvention steht. 4.4.7 FAKULTATIVE ELEMENTE IN REGELN In phonologischen Regeln werden häufig Klammerstrukturen verwendet. Der Grund für die Verwendung von Klammern kann am besten an einem Beispiel verdeutlicht werden: Im Lateinischen
liegt die Betonung
in Monosyllaben
auf dem
Vokal: 1)
V
—>C+Streß3 / _ C0 ^
('me')
In Polysyllaben befindet er sich auf der Penúltima: 2) Die
V
Betonung
— - > D-StreßH / _ C 0 V C 0 ¥ liegt
auf
der
('noli')
Antepenúltima,
wenn
der
Vokal
Penúltima kurz ist und in offener Silbe steht: +Vokalisch 3)
V
— - > C+Streßl] / _ C Q -Konsonantisch £ C Q V C 0 * -Lang
(£ = Silbengrenze)
('tangere')
der
41
Aufgrund vor
der
der
Konvention,
mit dem
kürzeren
Regelreihenfolge Reihenfolge Wörtern
daß die
Regel
angewendet
mit
werden muß
3) , 2) , 1) . W e r d e n
ohne E i n s c h r ä n k u n g e n der
Betonung
regelmäßig
ein
falsches
zusätzlich
anwendbar
auf
ist. W i r
der
Diese
Regelordnung Die
mengefaßt
werden,
schreibweise 4)
drei
wird
Regeln was
1)
Kontext
(50), l a u t e t Regeln
in
die
dieser
so e r h a l t e n wir oder
immer
müssen deshalb
bei
Antepenúltima
nach
2)
oder
festlegen, daß
durch im
3)
die-
s i n d , d. h. daß immer nur eine
können
auch
die
Penúltima da
drei R e g e l n a n g e w e n d e t w e r d e n d a r f . gedrückt.
aber
angewendet,
Ergebnis,
se R e g e l n d i s j u n k t i v g e o r d n e t
mit dem längeren
der
(51) die
Klammernotation
damit
Sinne
zu einer
der
(52)
einzigen
Adäquatheit
aus-
zusam-
der
Regel-
liegt:
y
— - > C+StreßU/ _
CQ
( ( ^ - K o n s o n a n t i s c h ^ £) C
Die K l a m m e r n b e d e u t e n , d a ß a n d i e s e r S t e l l e nur das
0
V)C0^
angegebe-
ne S e g m e n t bzw. S e g m e n t f o l g e oder d a s N u l l s e g m e n t s t e h e n d a r f . 5)
( A
( B
steht für die
( C ) D ) E )
Ketten:
6)
A B C D E
7)
A B D E
8)
A E
9)
9
in d i e s e r R e i h e n f o l g e Um das
derartige
weitere
Klammerausdrücke
nichtphonologisches
Dieses Merkmal wurde die
Hierarchie
malspeichers Merkmals mern: das
der
(53) ein
Ordnung.
verarbeiten
Merkmal
zu
können,
"Fakultativ"
wurde
eingeführt.
fest auf die P o s i t i o n 61 e i n g e t r a g e n , Klammerstruktur
abgelegt
ermöglicht
Stimmt
gleich
in d i s j u n k t i v e r
eine
Segment
wird.
sehr der
im Die
Integerbereich Einführung
einfache Verarbeitung phonologischen
wobei
des
eines
Merk-
eigenen
dieser
Struktur
Klam-
beim
Ver-
n i c h t m i t d e m R e g e l s e g m e n t ü b e r e i n , so w i r d ü b e r p r ü f t ,
Merkmal
"Fakultativ"
mit
der
richtigen
Hierarchie
ob
belegt
42 ist. Trifft dies
zu, so
chen phonologischen gel nicht ganze
setzt die Weiterverarbeitung
Segment wieder
ein, andernfalls
zutreffend. Diese Art der
Segmente
anwendbar.
Einzelne
Klammernotation Merkmale
beim
glei-
ist die
Re-
ist nur
auf
können
mit
dieser
Kennzeichnung nicht versehen werden. In phonologischen merausdrücken ben
die
Regeln werden noch andere Formen von
verwendet.
Betonung
nicht gespannt
auf
Zum Beispiel
die
Klam-
fällt bei englischen
Penultima,
wenn
der
folgende
VerVokal
ist, und von nicht mehr als einem Konsonanten
ge-
folgt wird, sonst liegt die Betonung auf dem letzten Vokal: 10)
V
(54)
— > C + S t r e ß 3 / _ C Q ( -Gespannt V
Beispiele hierfür sind Im Nomen
'astönish, maintäin, colläpse'.
ist die Betonung
ebenso verteilt, nur folgt
hierbei
noch eine Silbe aus einem ungespannten Vokal mit einer Folge von Null oder mehr Konsonanten 11)
V
—>ClStreß3
('América, aroma, veranda'): / _ C 0 ( -Gespannt
CA)
V -Gespannt
Co.
V
] Regeln der Form A ECBDF.
> B/ C
D / E
F
(55) bedeuten
ECADF
—>
(56)
Um den Zusammenhang
zwischen der Wortklasse N und dem Vorhan-
densein einer Silbe -Gespannt V anzuzeigen, ist es notwendig,eine Möglichkeit tinuierlicher, grund der
fakultativer
Elemente
zur Angabe
einzuführen,
da
konjunktiven Ordnung des zweiten Regelteils
diskon-
sonst
auf-
(57) diese
43 Bedingung
immer
erfüllt
ist.
Als
Notationskonvention
für
diese
Elemente werden spitze Klammern eingeführt. Die Kette: 12)
XI < Y 1 >
hat damit zwei
X2
Xn
Xn+1
Interpretationen:
13)
XI
Yl
X2
14)
XI
X2
...
Y2
...
Xn
Xn
Xn+1
in eckigen Klammern gemeinsam
handen oder nicht vorhanden sein. dieser
Yn
Xn+1
d. h., es müssen die Elemente Mit
Konvention
kann
vor-
(58) die
Regel
11)
-Gespannt
,1
neu
formuliert
werden: 15)
V
— »QstreßD / _ C0
V
-Gespannt V
mit
der
Interpretation,
daß
bei
einem
Nomen
der
in
eckigen
Klammern stehende Teil vorhanden sein muß. Diese Regel gilt in dieser Form auch für Adjektive, die nicht deriviert Adjektive
sind,
z.
verhalten
den
zweiten
man
neben
B.
"solid,
sich
genauso
supreme, wie
Nomen, man
Regelteil auf die Adjektive
der
jedoch
führt
Dieses
Problem
Wortklasse bei
den
können
N
auch
A
wieder
durch
Derivierte
müßte
anwendbar
einsetzt.
nichtderivierten wir
absurd".
Diese
Adjektiven
also
machen,
Erweiterung zu
Fehlern.
Klammerschreibweise
sen; wir ersetzen Teil zwei der Regel 2) durch:
nur
indem
lö-
44
]
-Gespannt V 16)
wir
nun
]
/
Wollen
N
(59)
7) in 6) einsetzen, müssen wir die
Klammern
indizieren und erhalten: 17)
V
-Gespannt
—»D-Streß] / _ C0
c C
1
0
V -Gespannt V
!
Es gilt die Konvention, daß Klammern mit dem gleichen
Index
zusammen expandiert werden müssen. Regel 8) enthält also folgende Expansionen: 18)
V
—->ClStreß]/. . ./
+C (
] ]
-Gespannt V
19)
N
-Gespannt V
• • • /
_
(60)
]
Da auch einzelne Merkmale von dieser Art der betroffen
sein
Merkmalspeicher
können,
muß
diese
A
Eigenschaft
beigegeben werden. Dafür
sind
Fakultativität
jedem
Merkmal
im
im Merkmalspeicher
drei Bit vorgesehen,
in denen der numerische Wert des Index
je-
der
wird.
bis
Klammer
abgelegt
Die Klammerindices
können
damit
maximal sieben laufen. Tritt in der Regelanwendung ein derartig spezifiziertes Merkmal
auf,
so
wird
schengespeichert chen
der und
bei
Klammernhierarchie
entsprechend
Klammer index
überprüft.
jedem das
in
weiteren
Merkmal
als
einem
Merkspeicher
zwi-
Auftreten
dieser
glei-
notwendig
markiert
und
45 4.4.8
NUMERISCHE KATIONEN
Merkmale (61) bei
Skalare
Für
eine
Eine
Tonhöhe,
benötigen Um wurde
Ebene
das
in
System
von
Darstellung
anhaften
kann,
Skalar
der
Merkmalen
in
der
nur
ein
bzw.
tabelle
drei der
die
einer
sich
damit
heitliche tar
(62)
zur
zwei
es
Bit
als
sich
der
zu und
Spezibei
jedem des
Integerbereich
die
der
Merkmal
zwei
Bytes
verwendet.
sind
damit
für
der
das
erhalten.
der
In den
C2StreßH
tion
Merkmale
das
skalaren
implizit
in d e r Raum
in
die
umfangUmsetz-
in
daß
das
jede
Tranmögli-
z. so
gleiche
B.
für
kann
die durch
Ergebnis
in
unterscheidet
Möglichkeit,
erweitertes
der
In d e r
Matrix
sein,
durch
phonologischen
für
Verfahren
anderen ein
man
einheitliche
eines
was
phonoMerkmal
Transkriptionskorrelat
Dieses
CiStreßH,
die
jedes
Verfügung.
gesorgt
der
skalaren
Merkmalspositionen
zur
durch
Vergibt
Merkmale ClStreßH
diese
Werte
phonetischen
erhält. von
muß
notwendige
dafür
wie
für
auch
entsprechende
kaum
diese,
werden,
steht
von
wird,
sechs
beiden
Damit
dann
Da
hat,
Für
folgenden
muß
Verarbeitung
gewonnen
Spezifikationen
inhaltlich
drei
um
offenzuhalten,
Werte
Da
handelt,
reserviert
Darstellungsweise
dieser
anzugeben.
Verfügung
Bit
Zeichenkette
zu
auf
Betonung
Anwendungen
Struktur.
werden.
Umsetzung
Bitkombination
Form
auch
vornehmen
der
ganzzahlige
als
sie
Struktur
skriptionsalphabet che
der
geschieht.
skalaren
für
ist
nur
Bedeu-
ausreichend,
Segmente
Merkmale
restlichen
hingegen
aus
phonetischen
reicheren
AIP-Standard
Plus-Minus-Spezifikation
Bit
Nichtbelegen
Regel von
unbetont).
Wert
dafür
aufgegeben
Merkmaltabelle
Regeln
der
Spezifikationsmöglichkeiten
beide
einen
phonetischen
zunächst
müssen
für
die
ist
Struktur,
Merkmals
die
zwei
annehmen.
angebbar.
logische
Darstellung
oft als
in
Phonologie
Spezifikation
Nebenton,
in
um
wurden
sechs Werte
dem
eingeführt,
Merkmalspeichers
Problematisch
das
mehr
Merkmalen
mit
SPEZIFI-
Spezifikationen
phonetischen
PANAMA
fikation
nach
bilden
Möglichkeit
Verbindung
SKALARE
allerdings
binäre
die
meist
skalaren
langen
sind
eine
Ausnahme die
UND
"low-level"
Transkription
(z. B . H a u p t t o n ,
eine
skalare
weitgehenden
Klassifikation
können.
oder
Spezifikationen
sehr
BINÄRE
MERKMALE
binäre
phonetischen
die
der
DER
können
einer
tung. der
SPEZIFIKATIONEN:
die
ein-
MerkmalinvenBetonung die wie
drei
Kombinabei
einer
46 skalaren
Spezifikation
Wird die
eine
binäre
fall
4.4.9
einheitlich
skalaren
interpretiert
die
nicht
Grundinventar
bereits
eingeführten
etymologische Merkmale
über
und
das
haben
len
der
haben
Ein
kann
Spezialnur
die
erster
akustisch
Linie
gehören
Merkmale
(63),
auf
der
Regel
die
readjustment-Komponente
gemacht,
die
auf
um
keine
Anwendung
bestimmte
wir die
wichtiges
Betrachten
Ebene
Funktion
weite-
von
Ambiguität
zu
eines
die
beiden
Reihen
ä.
Ebe-
eingeführt Diese
Regeln
der
steuern.
syntaktischen
Merkma-
Graphems
nichtphonologisches
wir
u.
mehr.
einzelner
Segmente
bereits
die
phonologischen
der
haben
moti-
dazu
des
in
Aufgabe,
4.3
oder
diejenigen
Flexionsklassenkennzeichnungen
phonetischen
weiteres
Regelmerkmal.
In
wir
oder
Grammatik
Abschnitt
Gebrauch
sen.
so
als
Werteumfang
verstehen
syntaktischen
Merkmale,
werden
phonologischen Im
deren
artikulatorisch
gehören.
Lexikon
auf
Merkmale
werden,
Merkmalen
zum
vierten
ne
angestrebt,
Merkmalen
MERKMALE
nichtphonologischen
Diese
Darstellung
phonetischen
umfaßt.
Merkmale,
ren
von
NICHTPHONOLOGISCHE
Unter
werden.
skalare
Spezifikation
einer
zwei W e r t e
erzielt
aufzulö-
Merkmal von
ist
das
französischen
Wörtern:
1)
arc
2)
blanc
avec
tabac
sac
C-k3
clerc
viaduc
so
können
daraus
sich w i d e r s p r e c h e n d e
3)
/c/
— >
Lkl/ _
?
/c/
— >
tVl/ _
^
nun
eine
die
von
der
Reihe
1)
muß
Anwendung Reihen
der
eine
Wörter
der
Reihe
he
zur
Ausnahme
1)
zwei
4)
Für
beiden
wir
C-0Û
estomac
1)
Regel
Möglichkeit
4)
als zu
Ausnahme erklären
gefunden
auszunehmen.
Regelhaftigkeit
erkennbar
lexikalisiert wird
Regeln
dadurch
Da ist,
in
ableiten:
werden,
sie
keiner
der
müssen
werden.
diese
Die
motiviert,
Rei-
daß
es
47 eine
allgemeine
den meisten Ins wenn ben
Tilgungsregel
Positionen
Lexikon
wir
ein
Da
schen
aber
Segmente
für
noch
die
zur
Konsonanten
Regel
oder
nj
ein
für
in
nur,
Wir
ge-
bestimmte
Re-
bei. nicht
bilden,
bekannt
werden,
haben.
eine
Morphem,
Regel
nicht
Ausnahmeregelung
Verfügung
Ausnahme
eine
angewendet
in
ist,
muß
nichtphonologischen
Einheit
werden
teilt.
Dies
bedeutet, Verb]
aber
der
welche
durch
dessen
phonologiRegeln
Konvention
auf
festge-
daß
Regel
der
Regel
4) e r w e i t e r t
Es
Reihe
Struktur tion
abgeändert In durch
der
mit
setzt
Q+
aber
Regel
Regel
/
Regeln das
ver-
auch
Verbums
das
Merkmal
Beispielreihe voraus,
daß
1)
alle
das Seg-
2 H spezifiziert
sind,
und
die
Segmente
phonologischen
2
alle
positiv
Lexikon
einer
spezifiziert.
oder
die
Diese
Spezifika-
readjustment-
Komponente
(65)
wird
diese
Leerbelegung
den
für
Regeln
selbst
positive
erreicht.
Komplementärwert in
Einheit
zu:
9
über
muß vom Benutzer
Da
das
Spezifizierung diese
Merkmal
geschieht
vorgenommen
allerdings Plus.
nicht
(66)
automatisch Null Die
automatisch,
ist, Merk-
sondern
werden.
GRENZSYMBOLE
Grenzsymbole Merkmale. Ebene
eines
zunächst
alle
PANAMA
malsvergabe
4.4.10
Segmente Segmente
wird
werden.
die
der
alle
— >
nur
lexikalischen
dieser
alle
also
für
kann
Segmente
und
2)
/c/
sind
alle
einer
z. B .
2"2. D i e s
mente
5)
auf
Merkmale
(64)
erhalten,
M e r k m a l [I -
ist
finale
werden:
Alle
E+
eine
ein Wort
Ausnahme
Struktur
welche legt
eine
wir
Merkmal
die
das Merkmal C -
üblicherweise
Segmente
können
eigenes
Segmenten,
gel n darstellen
die
tilgt.
übernehmen
dafür
deshalb
gibt,
zu
werden
(67) finden
Wie und
ähnlich diese haben
behandelt
sind kein
sie
nur
wie auf
phonetisches
nichtphonologische der
phonologischen
Korrelat.
Welche
48 Grenzsymbole geordnet Da nur
in
der
auf
sich
benutzt
wird,
der
und
von
Struktur
zugegriffen
Grenzsymbole
welche
Benutzer
phonologischen
Merkmale
auf
werden
kann
nicht
werden
bezieht,
Merkmalsmatrix PANAMA
diese
auf
kann, über
ihnen
selbst
Zeichen,
muß ihre
zu-
festlegen.
eine
sondern
Regel,
Merkmale
die
anspre-
chen ; z . B. :
1)
— >
B / _
muß umgeschrieben
werden
2)
A
A
—
B
Grenzsymbole von
"normalen" Die
3)
ist
sind
X A Y
ist d a m i t
X
die
schen
sind
sind
die
des
aus die
die
Systems.
und
X
durch
das
fest
(+) B
für
die
frei
Formativgrenze
dies
(68)
vergebbar
Regelcorpus.
versehen
werden,
Zwei
und
Klammern
Wortgrenze
programmtechnischen Domäne
(+) Y
reserviert
runde Die
zwar
ist
haben
eine
die
Gründen
diese
Frage
der
und
mit
betreffen
ausgezeichnete die
bezeichnet kann
syntakti-
werden,
einer
festgelegt.
und
beliebi-
syntaktischen
des Transformationszyklus.
Wortdefinition
sondern
nicht
durchführbar.
durch
Merkmalkombination sind
PANAMA
Y
— >
jedoch
gen
bestimmen
CHOMSKY/HALLE
Grenzsymbole
Umsetztabellen
Klammern,
Auf
X B
in P A N A M A n i c h t
Wortgrenze
fluß,
von
(+ ) Y
die
mern
in
mit:
(+) A
Grenzsymbole
Status
nämlich:
—->
Prinzipiell nur
theoretischen unterscheidbar.
die
wird,
Wortgrenze]
im
Segmenten
äquivalent
4)
zu:
/ _ H+
Konvention,
(+) e i n g e f ü h r t
f
Klam-
(69)
Sie
(70)
Festlegungen aktuellen
keinen
Ein-
Ausgestaltung
49 4.5
REGELORDNUNGEN
Phonologische
Regeln
nearer
Ordnung
riert,
wie
(72)
Regel
ist
der
n
des
Danach
frühere streng Die
sind
der
1)
— >
A
die
Regel ist.
der
n
+
Es
ist
zu
ist
ope-
Eine mit
übereinstimmt.
Regel
nicht
bis
das
Möglichkeit,
durchbrechen,
Auch
Kette
li-
modifiziert
Beschreibung
die
keine
in
determiniert.
determiniert,
gibt
Regeln
der
Regeln
derselben
so 1
werden
also
Regelzyklen
anEnde
die
se-
auf
eine
in
sich
Form
die-
sind
Form:
B / _
Abkürzung
(C)
für
die
2)
A
—->
B / _
C
3)
A
>
B / _
D
Regeln
Regel
gewendet
sind
beiden
D
wurde, die
auch
Regeln:
geordnet, so
ist
größte
wenn
merschreibweise
5)
(C)C
gelten
für d i e die
licherweise
die
eine
der
h.
wenn
andere
mögliche
Kategorialangaben
eine
für
Expansion
weiteren
ausdrücken
lassen
diesen der
kürzeren
Zyklus
Regel
an-
Expansio-
sich
ebenfalls
in
Klam-
(74):
2 C^
4)
d.
wäre.
Indexierte
Damit
muß
werden,
D
disjunktiv
angewendet Dabei
anwendbar
Um
Teilen
zurückzuspringen.
Regeln
gesperrt.
wie
ist
auf
strukturelle
Übereinstimmung,
erreicht
Regel
früherer Regel
ihre oder
"Regeln
geordnet.
eine
Diese
jede
jeder
wenn
Struktur
Anordnung
Regel
(71)
Anwendung
Anwendung
keine
Regelcorpus
quentielle
nen
Die
wobei
die
anwendbar,
Besteht
wendbar.
ser
durch
phonologischen
(73)
geordnet.
angewendet,
sie
wurde."
sind
entspricht:
oder
für
C(C)
diese
Notationsart
die
gleichen
Konventionen
Klammerausdrücke. partielle
Identität
die Notation
von
Regeln
in g e s c h w e i f t e n
auszudrücken,
Klammern
wird
benutzt:
üb-
50 6)
A
-—>B / _ C
7)
A
— > B
/ _ D
wird zusammengefaßt 8)
A
zu:
— > B
/ -
Diese
Regeln
o
sind
konjunktiv
geordnet,
d.
h.
daß
Regel
7)
auch nach der Anwendung von Regel 6) auf den gleichen Kontext im gleichen Zyklus anwendbar Die
Schreibweise
nicht
möglich,
Regel
ersetzt
bleibt.
mit
sondern werden.
geschweiften
muß
durch
Dies
hat
Klammern
ist
die Wiederholung jedoch
keinen
in
der
Einfluß
PANAMA
gesamten auf
die
Regelordnungen oder deren Abarbeitung. Regeln können in "feeding order" oder "bleeding order" ander
stehen.
einer
Regel
(75)
die
Bei
der
feeding
Möglichkeit
der
order
erhöht
Anwendungen
von
die
zuein-
Anwendung
folgenden
Re-
in zu nasalierender
Po-
geln. 9) -
"
O
(N = Nasalkonsonant, C = Konsonant) Diese
Regel
sition
öffnet
steht
und
bildet
Nasalierungsregel, nasaliert.
Regel
/e/ zu /a/, wenn es die
9)
damit
offene
und
die
den
Input
Vokale
in
für
die
allgemeinere
bestimmten
Nasalierungsregel
Positionen
stehen
damit
in
feeding order. Vermindert der
Anwendung
der. der
Das
von
der
(77)
order"
Output einer
folgenden
Ordnungsprinzip
feeding
der".
dagegen
(76)
Regeln,
Regel die
stehen
eines Regelcorpus und
die
sie
in bleeding
ist die
"Minimierung
Möglichkeiten
der
Or-
"Maximierung bleeding
Or-
51 4.6
DER
Der
Transformationszyklus
logische eine der
TRANSFORMATIONSZYKLUS Regeln
in
kleinsten
Struktur
den
erläutert werden
Syntaxbaum
Regel
und
hat
mehr Die
soll
festgelegt
an
einem
erlaubt, als
0
Beispiel
]]
/
des
auf von
Strukdes
Französischen
folgende
Variante
Regel:
a
in N o m e n w e r d e n finale K o n s o n a n t e n g e t i l g t .
eine
Variante,
a b h ä n g t , da n ä m l i c h
C
geht
sind. Die F u n k t i o n
deren
Anwendung
von
der
— >
0
]
/
Variante
Die-
Stilebene
in b e s t i m m t e n S t i l e b e n e n die T i l g u n g
m e n im P l u r a l u n t e r b l e i b t , d. h . , es findet L i a i s o n 1)
phono-
einmal
Ordnung
im F r a n z ö s i s c h e n
] se
das
(78):
— >
Am Satzende
Ordnung
anzuwenden.
finale K o n s o n a n t e n g i l t 1)
Prinzip,
zu d e n g r ö ß t e n E i n h e i t e n der p h o n o l o g i s c h e n
durch
Transformationszyklus Für
ein
festgelegter
phonologische
tur, d i e
ist
bei
No-
statt. b
N Sg
Für finale S e g m e n t e g i l t d i e oc K o n s o n a n t i s c h
2)
- ocVokalisch d. das
h.,
wort-
folgende
oder
-—>
morphemfinale
Segment
A u s der p h o n o l o g i s c h e n 3)
Regel:
in der
0 /
Vf
Segmente
[ptKonsonantisch] werden
Konsonantalität
getilgt,
wenn
übereinstimmt.
(79)
Struktur:
/deS^ kamarada+S^ ägltz+S^ /
(80)
m ü s s e n m i t d i e s e n b e i d e n R e g e l n die s t i l i s t i s c h e n
Varianten
52 4)
Cde
kamarad
5)
Cde
kamaradaz
ableitbar
aglel]
sein.
Wenden erhalten
aglel]
wir
die
Regeln
auf
die
6)
/ deS^
kamarada+S^
/ de
die
1) s o
p.
agle
+S/ /
Regel
2)
^ kamarada+S^ Sgle
? /
Regel
1)
Variante
erhalten
7)
mit
Liaison.
Ti k a m a r a d a + S /
/de
damit
rada
/
ein
vor
ler
können
dem
Regel
falsches
Vokal wir
auf
Wählen
so
wir
Struktur
b
Variante
die
Regel
/ deS^
a
von
Regel
das
Schwa
finale
/z/
erhalten.
funden
werden,
der
Morphemen,
Regel
2)
Regel
1)
zwar Um
Fälle
der
finale sein
Schwa
müßte.
Regelordnung
/
Regel
1)
/ agltz^
/
Regel
2)
getilgt,
doch
bleibt
Problem
Anwendung
Regel
das
/ ägltz^
dieses
die
da
getilgt
a
in
/kama-
Diesen
Feh-
beheben,
in-
"anglais"
das
appliziert:
kamarada
ist
/ ^ /
Änderung
2)
* / de ^ k a m a r a d
Nun
ägle
^ agle
Ergebnis,
alle
durch
1) v o r
8)
zwischen
an,
wir:
*/ de f k a m a r a d s
und
Struktur
aglez+S/ /
/ de / k a m a r a d a + S /
also
phonologische
wir:
1) , R e g e l
zu
in
der
2)
bei
lösen,
a
muß
ein Weg
Reihenfolge
zwischen
ge-
Regel
Wörtern
2)
sicher-
stellt. Eine anglais"
syntaktische könnte
in e t w a
Art
Analyse folgende
N
der
Nominalphase
Struktur
N
"des
camarades
liefern:
N
N
NP
53 die durch einen Strukturbaum dargestellt werden
kann:
10)
NP
Art
DES
Die
Plural
readjustment-Komponente
tur
zur
die
Wortgrenze
gorie
CAMARADES
phonologischen ^
am
auf.
Ende
ANGLAIS
bereitet
Zusätzlich
jeder
des
Pluralmorphems
dann die phonologische
Kette,
statt
die
der
von
Die
oben
wenn
wir
Konstituenten, nersten
durchlauf das
h.
getilgt zur
Regelordnung
jeweils
angewendet werden.
Regelcorpus
kleinsten den
mehr
größeren
Regeln
schen Struktur
1)
können
auf
die
"Das als
ist
Hauptkate-
(81) M i t
der
erhalten
wir
nunmehr
auf d i e
Struktur
2)
die
einmal
Einheit
und
wir
immer
-
und
und der
Bedeutung
daß die
den
jedem von -
von
der
i s t . " (82)
oben angegebenen
jkamarada+S^J |Iglez+S^| J
2.^|deS^
N
phonologi-
ablaufen:
Art
N
phon.
Struktui
A NP
|kamarad3+S^J jigle +S?j J A NP
der
Anwen-
12) Art
in-
Regel-
'Zyklus',
wird
Domäne
determiniert
errei-
kleinsten
zwischen
angewendet
kann der T r a n s f o r m a t i o n s z y k l u s
1.^jdeS^J
daß
A NP
und diese Klammern nach
dung durch die Konstituentenstruktur Mit
Kategorie
festlegen, daß die Regeln d.
einer ist.
N
geforderte
Klammern
Struk-
festlegen,
Struktur:
Art
daß
syntaktische
k ö n n e n wir
wie N oder A dominiert wird, einzusetzen
Einfügung
chen,
die
Plural
R e g e l 2)
54 kamarada |k;
3.
JäglE A NP
N
Art 4. [^deS^
Regel 1) a
kamarada
?
agle +
innere KlamNP
5. |^de f
kamarad
^
J
agle
merntilgung Regel 2)
NP kamarad
/
agle
^J
Regel 1) NP
7.
de f
kamarad
j-
agle
^
innere Klammerntilgung
Wird
in Zeile 3 die Variante b von Regel 2) verwendet, so bleibt
/kamaradaz/
erhalten, womit
die
Form
Mit diesem Transformationszyklus
mit
Liaison
erzeugt
wird.
haben wir die Möglichkeit, bei-
de Varianten der Nominalphrase korrekt abzuleiten. Genau lus
nach diesem Prinzip läuft auch der
Transformationszyk-
in PANAMA ab. Die Domäne des Zyklus wird anhand
rung
festgestellt, die
ja, wie wir
der
Klamme-
im vorigen Abschnitt
festge-
legt haben, genauso wie Segmente dargestellt Grenzsegmente
werden nach dem
werden.
Zyklus getilgt und der
(83) Diese Regeldurch-
lauf beginnt wieder von vorne, solange, bis keine dieser
syntak-
tischen Grenzsegmente mehr gefunden werden. Die indizierte Klammerstruktur verwendbar.
Da
syntaktischen teilt werden
wir
jedoch
Informationen
ist für dieses Verfahren
bereits auf
festgestellt
alle Segmente
haben,
der
(84) , und wir diese Informationen als
gische Merkmale
behandeln wollen
merindices im Zyklus verzichten.
nicht
daß
Struktur
die ver-
nichtphonolo-
(85) , können wir auf die
Klam-
55 4.7
ZUSAMMENFASSUNG
Wir
können nun den Leistungsumfang
des uns zur Verfügung
stehen-
den Systems PANAMA kurz beschreiben. Eine
phonologische
Konventionen arbeitet belle
Zeichen
phemweise sche
etwa
werden.
Grammatik,
in SPE beschrieben Die
für
phonologische
Zeichen
aufgebaut.
Struktur
generative
oder
Dieses
tionszyklus, Die
dessen
phonetische
Struktur Domänen
Struktur
und
phonetische
deren
aus
Alphabet
wird
über
erlaubt uns, die die
ist der
durch
wird
zeichenhafte,
in
eine
verTa-
Input für den über
Zeichen
Syn-
zu simulieren.
Grenzsymbole
wieder
phonologi-
nichtangeschlossene
eine
Transforma-
bestimmt Tabelle
Oberflächenrepräsentation
angebbaren
ihren
über ein Lexikon wort- bzw. mor-
taxanalyse und readjustment-Komponente Die phonologische
sie
wird, kann von PANAMA Struktur
Lexikon
zu manipulieren
wie
oder
werden. in
eine
gebracht,
Zeichenkombinationen
besteht. Die Regeln können mit geringen Einschränkungen Phonologie
üblichen
Art
formatfrei
geschrieben
in der
werden.
in der Die
in-
terne Darstellung
von Regeln und der phonologischen und phoneti-
schen
erfolgt
Strukturen
möglichst
maschinenökonomisch
und optimiert damit die Automatisierung.
(binär)
56 5.
PROGRAMMBESCHREIBUNG
PANAMA
5.1
ALLGEMEINER
ÜBERBLICK
Das
Programmsystem
PANAMA
nente teln
einer
generativen
beschrieben
technische mit
der
sie
in d e n
Syntax
Formate,
Regeln,
Diese
erklärt, ist
ihren
Programmsystem
ist
B.
modular
ingesamt
ca.
aufgebaut
PANAMA
ist
zur
auf
mentiert,
die
stalliert
ist.
am
wurde
einer
Anlage
vom
Rechenzentrum
der
Der
besonders zu
und
Ablauf-
bei
und
demjen-
Programmierzur
FORTRAN
besteht
ein
Typ
der
diese
COBOL-Statements.
bitweisen Abfrage
zusammen
Texteingabe
jeweils
sich
Gegensatz
3000
(LaufZeitoptimierung)
sechstes Modul
da
die
werden.
Bytezugriff im
der
werden
programmiert,
(z.
der
sie v e r a r b e i t e t
einfachen
eignet
und
Lexikonaufbaus,
Komponenten
in d e m
in C O B O L
durch
mit
des
Kapi-
wird
der
der
Kompo-
letzten
Abschnitten
Detaillierung
verarbeitung
als
wie
folgenden
vorgestellt,
PANAMA
gründen
den
Programmsystems
Umsetztabellen.
steinen
In
phonologische
des
igen M o d u l
sprache
Grammatik,
wurde.
die
Realisation
steuerung, der
verarbeitet
Zeichen-
IV
aus Aus
).
fünf
Das Bau-
Effizienz-
Assembler-Unterprogramm von F e l d e r n SIEMENS
4004
Universität
Programmier Zeitaufwand
eingesetzt. 45G
imple-
Regensburg
betrug
ca.
in-
ein
Mann-
einzelnen
Modu-
j ahr.
5.2
DIE EINZELKOMPONENTEN
Die
Funktion
len
werden
Die
Reihenfolge
vom
Benutzer
können
dabei
geachtet
und in
die
der des
werden,
PANAMA
Zusammenhänge
folgenden
durch auch
VON
Aufrufs die
zwischen
Tabelle der
2
einzelnen
Ablaufparameter
mehrmals
aufgerufen
daß die Reihenfolge
den
schematisch
dargestellt.
Programmbausteine festgelegt.
werden.
Es
der A u f r u f e
muß
wird
Die
Module
nur
darauf
sinnvoll
ist.
57
TABELLE 2
5.2.1 G P M O : Das Es
Steuermodul
M o d u l GPMO verarbeitet
A b h ä n g i g k e i t der
ist das die
Wurzelsegment
Steuerungs-
und
(ROOT) d e s
Gesamtsystems.
Ablaufparameter
A b l a u f p a r a m e t e r die e i n z e l n e n
und
Bausteine
ruft auf.
in
58 Input: Lochkartendatei mit F o r m a t der
Parametern.
Parameterkarten:
L 1 29
L' 50
Parametername Als Parameter
Blank
L'80
(1)
Parameterinhalt
sind m ö g l i c h :
Name:
Inhalt:
Funktion:
ABLAUF
REGELVERARBEITUNG
Aufruf des Moduls GPM1
PHON-TS-GENERIERUNG
Aufruf d e s M o d u l s GPM2
T R A N S F O R M A T I O N S Z Y K L U S Aufruf d e s M o d u l s GPM3 LEXIKONAUFBAU
Aufruf d e s
Moduls
GPM4 REGELPROTOKOLL
NEIN JA
(2)
Ausdruck des protokolls
Regel-
in n u m e -
rischer F o r m m i t Regelerklärung WOERTERBUCHER-
NEIN
A u f n a h m e der über
GAENZUNG
JA
Tabelle
phonologischen in d a s ZWISCHENPROTOKOLL
die
erstellten Struktur
Lexikon
NEIN
Protokollierung
JA
Binärdarstellung einzelnen
der der
Regelzyklen
59 Output; Protokoll
der
Parameterkarten
Schnittstellen
GPM1:
zu d e n
übrigen
Regelprotokoll
Programmteilen;
(Parameterübergabe)
Regelspeicher
GPM2:
Lexikon Lexikon-Index-Max
(Größe
Phon-Ts-Satz
(phonologische
Wörterbuchergänzung
GPM3:
des
Lexikons) Struktur)
(Parameterübergäbe)
Phon-Ts-Satz
(phonologische
Struktur)
Regelspeicher Zwischenprotokoll
GPM4:
(Parameterübergäbe)
Lexikon Lexikon-Index-Max
5.2.2 Das
GPMl:
Modul
datei
Regelverarbeitung
GPMl
leistet
eingelesenen
interne reits
(binäre)
in
Abschnitt
und
deren
zeigt.
numerisches
in
wird
den die
Regeln
Protokoll
die
die
Syntax
vorigen
mit
der
für
Die
genaue
können,
ausgedruckt
den Ablauf
in
physikalische
Die
klärung
Regeln
Umsetzung
Darstellung.
Ansätzen
sem
die
und
anschließend
werden.
Dieses
erforderliche wurde
erläutert.
In
Syntax
die
die-
aufge-
Verarbeitung,
als
phonologischen
Er-
Protokoll verfolgen
be-
erklärt
Abspeicherung
an
entsprechenden
im T r a n s f o r m a t i o n s z y k l u s
Lochkarten-
Regeln
vollständige
Verarbeitung
der
Anwendung dieser
Abschnitten
und
eine
über
ist zu
nützlich,
um
können.
Input: Die
phonologischen
Syntax nen. die
dieser
Die
Regel
Regeln
sind
richtet
der sich
Input nach
Eingabe
der
phonologischen
Schreibweise
ist
nicht
an
für den
Regeln
bestimmt
das
Modul
folgenden erfolgt
Spalten
der
GPMl.
Die
Definitioformatfrei: Lochkarte
60 gebunden,
es
können
beliebig
und es können beliebig
viele
Lochkarten
viele Blanks
verwendet
werden
zwischen den einzelen
Ele-
menten der Regeln stehen. Syntax der Regeln: Zur
Definition
tion.
Da
nicht
adäquat
der
jedoch
Regelsyntax
verwenden wir
Backussysteme
sind
für
(3) , müssen
eine
Backus-Nota-
umgebungsabhängige
wir
diese
Notation
Sprachen erweitern:
Elemente in doppelten Klammern sind fakultativ. Der hinter einem Element in einfachen Klammern stehende Index gibt den möglichen Wiederholungsfaktor für dieses Element an. REGEL
::=
REGELINPUT / PFEIL / REGELOUTPUT / ((KONTEXTTRENNER)) / ((REGELKONTEXT)) / REGELENDZEICHEN
Eine Regel
ist eine Anweisung
an das Programm, ein
Segment oder eine (Teil-)Segmentfolge durch ein anderes Segment
oder
eine
andere
(Teil-)Segmentfolge
zu
(Teil-)
(Teil-)
modifizieren,
wenn das Kontextsegment oder die Kontextsegmentfolge mit der Umgebung des Regelinputs übereinstimmt. REGELINPUT
::=
SEGMENT/
((SEGMENTTRENNER / SEGMENT))(0,5)
Der Regelinput besteht aus einem Segment oder einer Segmentfolge von maximal sechs Segmenten, die durch den Segmenttrenner voneinander
abgegrenzt
sind,
und
beschreibt
die
Segmente,
die
durch den Regeloutput modifiziert werden. PFEIL
::=
->
( Gedankenstrich + Größerzeichen)
Der Pfeil besteht aus der Zeichenfolge als
'wird
modifiziert
durch'
(4). Die
'->' und ist zu lesen
Modifizierung
bedeutet,
daß die Merkmale des Inputsegments um die Merkmale des OutputSegments werden.
erweitert,
bzw.
dessen
Spezifikationen
übernommen
61 REGELOUTPUT
::=
SEGMENT /
((SEGMENTTRENNER / SEGMENT))(0,5)
Der R e g e l o u t p u t b e s t e h t aus e i n e m S e g m e n t oder einer folge, die
die
durch
Segmente,
Segmenttrenner
die
sechs Segmente
gabe
Regelinput
ist,
modifizieren.
und Er
::=
?
m u ß auf
jede R e g e l a b s c h l i e ß e n .
Grund
der
maximal
formatfreien
KONTEXTTRENNER
::=
/
Kontexttrenner
Ein-
Ist es n i c h t v o r h a n d e n , e r k e n n t
P r o g r a m m e i n e n F e h l e r und d r u c k t eine F e h l e r m e l d u n g
text. Er
kann
(Doppelkreuz)
Regelendzeichen
Der
beschreibt
umfassen.
REGELENDZEICHEN Das
den
abgegrenzt
Segment-
das
aus.
(Schrägstrich) '/'
trennt
den Regeloutput
vom
Regelkon-
ist nur v o r h a n d e n , w e n n auch der R e g e l k o n t e x t
vorhanden
ist. REGELKONTEXT
::= S E G M E N T /
( ( S E G M E N T T R E N N E R / SEGMENT)) (0,19))
PLATZHALTER/
((KATEGORIALSYMBOLl))(0,19)
((SPITZE-KLAMMER-AUF / / Der
ist o p t i o n a l .
kontextunabhängige
R e g e l n . Der
bung,
Inputsegment
wendbar
der
das
::=
_
gelkontext
an.
Segmentes
angegeben, Steht
er
Regelkontext stehen
muß,
sind
beschreibt
die
damit
Regel
die
Umgean-
(Unterstreichung)
Der P l a t z h a l t e r
der
Regeln ohne Regelkontext
wird.
PLATZHALTER
eines
/
SPITZE-KLAMMER-ZU))(0,7)
( (CENT / PROCENT))
Regelkontext in
/
so
Er
gelspeicher
kann
als e i g e n e s
angegeben darf
in e i n e m
Regelinput
g i b t die P o s i t i o n d e s R e g e l i n p u t s
nur
der
Wird
Regelinput
Segment aus
Segment
werden. mit
mehrere
weiteren
einem' e i n z i g e n
b e l e g t der P l a t z h a l t e r
er
s t e h e n oder als
als
eigenes
Segmente
Teil
Segment umfassen.
Merkmalangaben, Segment
im R e -
so
bestehen.
a u c h bei der A n g a b e als
darf
Im
Re-
eige-
62 nes
Segment
keinen
Segmentspeicherplatz,
sondern
wird
als
Di-
stanzmerkmal jedem Segment als zehntes Merkmal mitgegeben. SEGMENTTRENNER ::=
;
(Strichpunkt)
Der Segmenttrenner steht zwischen den Segmenten im Regelinput -Output und -kontext. SEGMENT
::=
( (SPITZE-KLAMMER-AUF / SPITZE-KLAMMER-ZU)>(0,7) / MERKMAL / ((KOMMA / MERKMAL))(0,9) / ((PLATZHALTER))
KATEGORIALSYMBOLl
::=
X / Y / Z
Die Kategorialsymbole von
Segmenten,
werden
durch
X,Y,Z stehen für eine beliebige Folge
mindestens
aber
für
den Wert High-Value
ein
Segment.
in den ersten
Diese neun
Symbole
Merkmalen
im Regelsegment gekennzeichnet. SPITZE-KLAMMER-AUF
::=
(Größer-Zeichen)
Die spitzen Klammern bezeichnen den Anfang und das Ende von fakultativen Regelelementen. Dabei müssen alle Elemente in Klammern der gleichen Hierarchie
immer zusammen vorhanden oder nicht
vorhanden sein. (5) CENT
::=
PROCENT
$
(Cent-Zeichen)
::=
%
(Procent-Zeichen)
Die Zeichen Cent und Procent geben Anfang und Ende von fakultativen
Segmenten
an.
(6)
Diese
Eigenschaft
wird
als
Merkmal
"Fak2" abgespeichert. KOMMA
::= Das
Segments.
, Komma
(Komma) trennt
die
einzelnen
Merkmale
innerhalb
eines
63 MERKMAL
::=
MERKMALSPEZIFIKATION / MERKMALNAME / KATEGORIALSYMBOL2
MERKMALSPEZIFIKATION
::=
PLUS
/ MINUS
/
NUMERISCHE-SPEZIFI-
KATION / VARIABLE Ein Merkmal, das mit einer Variablen spezifiziert
ist, darf
zusätzlich noch mit einem PLUS vor dieser Variablen spezifiziert sein, das den Komplementärwert dieser Variablen bezeichnet. Dieser
Unterschied
die
Leerbelegung
mit MINUS
zur
üblichen
der
Felder
entspricht.
Eine
Logik Null
liegt
darin
ist, was
nicht weiter
begründet,
einer
daß
Spezifikation
spezifizierte
Variable
entspricht somit einer Spezifikation mit MINUS. MERKMALNAME
::=
xxxx
Jeder Merkmalname besteht aus vier Zeichen, die vom Benutzer festgelegt
werden. Diese Merkmalnamen
turprogramm
des
eingetragen.
Betriebssystems
Dieses
Verfahren
(7)
wurde
werden durch das direkt
in
gewählt,
das
da
Korrek-
Modul
in
der
GPM1 Regel
mit einem festen Inventar von Merkmalnamen gearbeitet wird, und Änderungen
somit
kaum
nötig
werden.
Die
Merkmaltabelle
umfaßt
61 Positionen, so daß mit einem Merkmalinventar von 61 Merkmalen gearbeitet
werden
kann. Der
Zeichenvorrat
für die
Merkmalnamen
umfaßt die Zeichen A bis Z. In den Regeln verwendete Merkmalnamen müssen
in der Merkmaltabelle
vorhanden sein, sonst
erkennt
das Programm einen Fehler und bringt eine Fehlermeldung. KATEGORIALSYMBOL2 PLUS
::=
::=
KLASSENSYMBOL / ((INDEX))
+
Das Zeichen
'+' steht für die positive Spezifikation eines Merk-
mals. MINUS
::=
Das Zeichen mals .
'-' steht für die negative Spezifikation eines Merk-
64 NUMERISCHE-SPEZIFIKATION Die
numerische
::=
1 / 2 / 3
Spezifikation
gibt
einen
skalaren
Wert
der
Merkmale an. (8) VARIABLE
::=
A / B / C / D
Die Variablen stellen eine Leerposition einer Merkmalspezifikation dar, die erst in der aktuellen Regelverarbeitung mit der konkreten
Spezifikation
Auffüllspezifikation nommen
und
PLUS oder MINUS aufgefüllt
wird
aus
der
zwischengespeichert,
phonologischen
wird.
Diese
Struktur
ent-
so daß bei allen weiteren Auf-
treten der gleichen Variabein deren Wert überprüft werden kann. KLASSENSYMBOLE
::=
0 / K / V
Klassensymbole sind eine Abkürzung für ein Segment mit einer bestimmten Merkmalspezifikation
(9). Sie können mit Indices ver-
sehen sein. INDEX
::=
Der
n / KOMMA / n
Index bei einem Klassensymbol
ganzen positiven Zahl solchen
Zahl. Diese
Vorkommen
des durch
ist eine Folge aus einer
(kleiner 9), einem Komma und wieder einer
Zahlen geben das maximale und das minimale das Klassensymbol
beschrieben
Segments
(10) Ist kein Index angegeben, so entspricht dies einer
an.
Index-
angabe 1,1, d. h. genau ein Vorkommen. Regelspeicher: Die Eingabe
Regeln
der
verarbeitet
Regeldatei und
werden
daraus
der
in der
Reihenfolge
Regelspeicher
Dieser Regelspeicher hat folgenden Speicherplan:
ihrer
aufgebaut.
65 Merkmal
Inputsegmente
Outputsegmente
L'2 2 3 4 5 6 1 •
1 2 3 4 5 6
• • •
Kontextsegmente
a
19 . .. .
1 2 3 4
20
1 1 1 1
TABELLE 3 Jede Regel belegt damit sechs Inputsegmente, sechs Outputsegmente
und
aus
zwanzig
zehn
cher
Kontextsegmente.
ä
dieser
zwei
Segmente
Bytes.
Im
angegeben,
erweiterbar. zwei
Bytes,
Der
also
Merkmalspeicher sechzehn
Bit.
umfaßt,
Diese
Bit sind nach folgendem Plan belegt: Byte 1 Bit
besteht
Regelspei-
ist Platz für 90 Regeln vorgesehen, er ist jedoch über das
Korrekturprogramm oben
Jedes
Merkmalspeicherbereichen
Byte 2
15 14 13 12 11 10
9
8
7
6
5
4
3
2
1
0
A Fakulta- Inte-
(Posi-
ger
tion in der Merkmal-
Element
Bereich
tabelle)
Spezifikation (PLUS, MINUS) maschineninternes Vor zeichenfeld
TABELLE 4
Variable Merkmalname
tives
wie
sechzehn
66
Das höchstwertige Bit kann für den Merkmalspeicher
nicht ausge-
nutzt werden, da es vom Rechner selbst als Vorzeichenbit verwendet wird. Im Feld Merkmalname wird die Position des Merkmalnamens aus der Merkmaltabelle tionen, viert.
also Über
abgelegt. Die Merkmaltabelle umfaßt 61 Posi-
werden den
im Merkmalspeicher
numerischen Wert
der
dafür
sechs
Position
Bit
reser-
ist damit
jedes
Merkmal eindeutig bestimmbar. Den Variablen A, B, C, D wird jeweils der numerische Wert 1, 2, 3, 4 zugeordnet. Dieser chenoperation
festgestellt
numerische Wert wird durch eine Re(Subtraktion mit 192 vom
EBCDIC-Wert
der Variablen) und in den drei Bit des Variablenfeldes abgelegt. Eine numerische Spezifikation des Merkmals wird
in zwei Bit
im Integerbereich eingetragen. Der Dezimalwert der Spezifikation wird direkt übernommen. Bei fakultativen Elementen in spitzen Klammern werden bei der Regelverarbeitung die öffnenden und schließenden Klammern mitgezählt und dieser aktuelle Wert dem Merkmal beigegeben. Auf diese Weise tung
kann man die Klammern gleicher
Hierarchie
in der
Auswer-
zusammenführen. Für diesen Wert sind drei Bit im Feld Fa-
kultät (Fakl) reserviert. Die
phonologische
Vorzeichen) steht
Spezifikation
Plus/Minus
(phonologisches
im Bit 14. Ist ein Merkmal mit Plus spezifi-
ziert, wird das Bit auf eins gesetzt, bei Minus bleibt die Leerbelegung Null. Das Abspeichern von Werten und das Setzen einzelner Bits im Merkmalspeicher
erfolgt
zwei
Merkmalspeichers
Bytes
des
Binärzahl
interpretiert
hat.
dieser
Mit
führt
werden.
über
können
werden, die
Dezimalzahl
Der
einfache
können
Abspeicherungs-
eine
Rechenoperationen. auch
als
eine
dezimale
Entsprechung
Rechenoperationen bzw.
Die
einzige
Rechenvorgang
durchgesoll
an
einem Beispiel dargestellt werden: Es soll die Variable B verarbeitet werden. B hat im EBCDIC-Code den Wert 194. Von B wird 192
(= A - 1) abgezogen, um das numerische Äquivalent
erhalten
(siehe oben). Die Variable hat nun den Wert
ser Wert muß ab dem sechsten Bit im Merkmalspeicher
zu B zu '2'. Die-
eingetragen
werden, d. h., es muß auf den Merkmalspeicher der Wert der Variablen multipliziert mit 2**6 aufaddiert werden. 2 * 2**6 = 128
67 und
entspricht
wird
Bit
der
sieben
Binärzahl
auf
eins
ist
aber
gleichzeitig
den
Wert
zwei
lationen
(= B )
1000
0000,
gesetzt.
Bit
zwei
erhält.
des
Auf
im M e r k m a l s p e i c h e r
d.
Bit
h.
im
Merkmalspeicher
sieben
im
Merkmalspeicher
Variablenspeichers,
diese
Weise
werden
der
alle
damit
Manipu-
vorgenommen.
Output: Die
Lochkartendatei
kartenprotokoll) . dabei den.
zusätzlich Das
Format
Outputliste selt
nach
des
abläuft, Wert die
ein
Ausgabe
Anhang
verfolgen
nach
seiner
korrekte
In
und
der
um
den
zu
können.
das
einem Es
In
der
werals
aufgeschlüs-
steht
zweiten
überprüfen
erzeugt
jedes
Zeile
Bedeutung
kann
enthält
-kontext
ersten
(LochJA
Druckformular
Transformationszyklus,
Regelverarbeitung hat
auf
beschrieben.
phonologischen
malaufschlüsselung
VZ
A2
protokolliert
REGELPROTOKOLL
Regelprotokoll
ist
-Output
Darstellung. Merkmals,
wird
Parameter
ausführliches
dieser
im
Regeleingabe den
Regelinput,
zweifacher wert
1
der
Über
Merkmal der
der
Zeile
in
Dezimalnumerisch
ist
dieser
aufgeschlüsselt, zu
können.
Die
um
Merk-
Format:
FAK1 N V A R Merkmalsname
VZ
= phonologische
FAK1
= Klammernhierarchie
N
= Integerbereich
(Spitze
Vorzeichenspezifikation der
fakultativen
der
numerischen
Elemente
Klammern)
VAR
= Variable
Der
Merkmalsname
mit
1,2,3,4 ist
= A, B, C, die
Spezifikation
D
Abkürzung
aus
der
Merkmalta-
belle.
TABELLE
Die
5
Leerbelegung
Die
Tabelle
6
von zeigt
FAK1, als
N
und
VAR
Beispiel
ist N u l l ,
eine
Regel
von VZ in
ist
diesem
sie Pro-
tokollformat.
Schnittstellen: GPMO:
Der
Regelspeicher
wird
an
das
Hauptprogramm
zur
Weiterver-
68 arbeitung
in GPM3
vom Hauptprogramm
übergeben.
Der
Parameter
REGELPROTOKOLL
wird
übernommen.
Das Unterprogramm GPM5 wird zur bitweisen Abfrage von Feldern aufgerufen. Lk-Protokoll der Regel: REGEL-INDEX = 00066 • CORONANTE.-VOIS.-CONT)
-ROND)-V-IC # -> (-CONT.•STRI) / _ ; ( V F E R H A V A N , R O N D J . V . K 1
Regelprotokoll: R E G E L 66 INPUT INPUT INPUT INPUT INPUT INPUT INPUT INPUT INPUT INPUT OUTPUI OUTPUT OUTPUT OUTPUT OUTPUT OUTPUT OUTPUT OUTPUT OUTPUT OUTPUT
TABELLE 6
SEGM 1 16387 •OOOCORO 16388 •000ANTE 13 -OOOVOIS 12 -OOOCONT 0 -000 0 -000 0 -000 0 -000 0 -000 0 -000 16396 •OOOCONT 16398 •OOOSTRI 0 -000 0 -000 0 -000 0 -000 0 -000 0 -000 0 -000 0 -000
SEGM 2 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SEGM
-000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000
0 -000 -000 -000
0 0
-000 -000 -000
3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
SEGM
-000
0
0 0
-000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000
0 0
4
-000 -000
-000
5 0
0 0 0 0 0
-000 -000 -000 -000 -000
0 0 0 0 0 0 0
-000 -000 -000 -oco -000 -000 -000 -000
0
0 0
-000
-000 -000 -oco -000
6 0 0
-000 0 0 0 0 0
-000 -000 -000 -000 -000
0 -000
0 0
SEGM
0
-000
0 -000
SEGM
0 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0
-000 - 0 00 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000 -000
0 0 0 0 0 0 0 0 0 0 0 0
69
TABELLE 6
70
5.2.3 Das Modul GPM2 Das Modul GPM2 erstellt die phonologische Struktur eines Eingabetextes. Der Input ist der Text, der durch eine graphische Kette
repräsentiert
einzelne
wird.
Teilketten
Diese
Kette
zerlegt.
Diese
wird
nach
Grenzsymbolen
Grenzsymbole
sind
in
mit
festgelegt. Eine Teilkette zwischen je zwei Grenzsymbolen nennen wir
ein
Wort.
(11)
Mit
jedem
Wort
wird
eine
Wörterbuchsuche
durchgeführt. Ist das Wort
im Wörterbuch vorhanden, so wird die
phonologische
Wortes
Struktur
des
aus
dem
Lexikon
übernommen.
Bringt die Wörterbuchsuche kein Ergebnis, so wird die phonologische Struktur des Wortes über eine Tabelle aufgebaut. In dieser Tabelle, die über Lochkarten eingelesen wird, ist jedem aus
dem graphischen
Alphabet
eine phonologische
Zeichen
Struktur
zuge-
ordnet, die einem Segment entspricht. Über die Tabelle sind nur Zuordnungen möglich, die ein Zeichen durch ein Segment darstellen, also eine
strenge Eins-zu-eins
Zuordnung.
Ist das
Zeichen
in der Tabelle nicht vorhanden, wird es übergangen. Ist der Aufbau über die Tabelle beendet, kann das Wort durch das Setzen des Parameters
"Wörterbuchergänzung"
in Lexikon
aufgenommen
werden,
um ab diesem Zeitpunkt dort zur Verfügung zu stehen. Dieses Verfahren erleichtert den Lexikonaufbau und beschleunigt die Verarbeitung . Input: Das Modul GPM2 benötigt
zwei
Inputdateien. Die erste Datei
ist
die Umsetztabelle Zeichen - Phonologische Struktur. Die Lochkarten für die Umsetztabelle haben ein festes Format: 61 Binärdarstellung
70
80
Zeichen
Auf jeder Lochkarte wird die Entsprechung zwischen einem Zeichen und dessen phonologischer Repräsentation hergestellt. Dabei sind die Spalten 1 - 6 1 wo
der Karte als Binärmuster
jede Spalte den Wert Null oder Eins annehmen
aufzufassen,
kann. Es ent-
spricht die Nummer der Spalte der Position des Merkmals in der Merkmaltabelle
aus GPM1. So kann die anschauliche Form der Bi-
närdarstellung
auch
hier
beibehalten
werden.
Die
Umsetztabelle
71
umfaßt
insgesamt
jeweils
255
acht Bytes.
darstellung
auf der
net,
die
wobei
Dieser die
Wert
dem
Positionen
Die
Lochkarte
Spalte
wird
in
spricht.
Auf
diese
eins
der
EBCDIC-Wert
ä
zwei
Leerbelegung wird das zu
Weise
in eine D e z i m a l z a h l
an
der
Die
kann
zweite E i n g a b e d a t e i
textes.
Diese
besteht
aus
Blanks.
Alles,
als
Wort
Eingabe
Elementen
die
Position
Umsetzung
Informationen von
was über
den
Wird
dieser
formatfrei. je
zwei
Zwischen
abgespeichert,
über
eine
Die
Direkt-
Aufbau
nicht
Kette
beliebig
vielen
Wörtern
eingehalten,
steht,
dürfen
des
Klammern
Eingabe-
graphische
mit
Aufbau
Diese
ent-
beschleunigt.
Grenzsymbolen
den
syntaktischen stehen.
g r a m m eine F e h l e r m e l d u n g
umgerech-
Zeichens
stark
Eingabealphabets
zwischen
Klammerstrukturen
ziert.
des
h.
Binär-
darstellt.
ist die g r a p h i s c h e K e t t e des
erfolgt
interpretiert.
Bit
repräsentierenden
a d r e s s i e r u n g e r f o l g e n , die die V e r a r b e i t u n g
d.
N u l l . Die
niederwertigste
Tabelle
des
Maschinenwörter,
ist binär
Textes
sind so
noch
in
nicht
gibt
aus und s u c h t d e n n ä c h s t e n
wird
nur
Form indi-
das
Pro-
Wortanfang.
Output: Die U m s e t z t a b e l l e
wird
im K a r t e n f o r m a t p r o t o k o l l i e r t und der
z i m a l w e r t der B i n ä r d a r s t e l l u n g Ebenfalls
mitprotokolliert
schen Kette. gedruckt einzeln
Dabei
und
die
wird
wird
in
ausgedruckten Wörtern
Das E r g e b n i s d i e s e s M o d u l s ihren können.
Diese
korrekten Diese
Aufbau
D e z i m a l w e r t e s für j e d e s
aus
graphi-
Wörter
aufgezeigt.
aus-
Mit
den der
wird.
ist die p h o n o l o g i s c h e S t r u k t u r
Struktur
Ausgabe
die
der
jeweilige Karteninhalt
ist d i e E i n h e i t a n g e g e b e n , m i t
die Wörterbuchsuche durchgeführt Eingabetextes.
die V e r a r b e i t u n g
z u n ä c h s t der
Zerlegung
De-
ausgegeben.
wird
zur K o n t r o l l e a u s g e d r u c k t ,
Tabelle
erfolgt
und
Lexikon
segmentweise
mit
überprüfen der
Angabe
des um zu des
Segment.
Schnittstellen: Das
Lexikon
Parameter
wird
phonologische arbeitung
vom Hauptprogramm
'WOERTERBUCHERGAENZUNG' Struktur
im M o d u l G P M 3
wird
übernommen
und
gegebenenfalls
a n das H a u p t p r o g r a m m
übergeben.
bei
gesetzten
ergänzt. zur
Die
Weiterver-
72 5.2.4 Nach
Das M o d u l G P M 3 der
Verarbeitung
schen Struktur des
der
kann der
Transformationszyklus
mäne für
der
jeweiligen die
Regeln
Zyklus
von
mung
Regelinput
von
links
nach
nutzer
die
rens zu
Ende
eines
tilgt,
also
die
reichs,
und
Zyklus
bereits
alle
formationszyklus Die
binäre
eingelesen
die
Innerhalb und
der
bzw. bei
ausgeführt.
Domäne
jede
Seg-
Übereinstim-
Der
protokolliert,
Do-
Struktur
Ablauf
so
daß
Schritt
des
der
des
Be-
Verfah-
Druckbild
phonetische
die
Zeichen,
stellung »T'
die
und
der
Domäne
ge-
verarbeiteten
Be-
Domäne mehr
begonnen.
möglich
ist der g e s a m t e
wird
die
für
er
muß,
alle
dem
phoneti-
eine
bis
sein
wenige
Verfahren
Zeichen-
von
wer-
werden, an
übliche
hält.
So
des
und
ein lin-
wären
z.
Transkriptionsalphabet
schwierig
auf
die
Zeichenvorrat
weitgehend
für
Tabelle,
Zeichen bzw.
erweitert
sich
ROLSHOVEN
die
ist, Trans-
übereinandergedruckt
Transkriptionsalphabete
einführen mit
das
eine
kann der
wesentlich
werden, der
über
abdruckbare
im O u t p u t
Übereinanderdrucken
EDV-Anlage
Normen
benötigt,
sind,
Struktur
in m a s c h i n e l l
erzeugt
guistische
eben
Domänenangabe
getilgt
dieser
erreicht.
umgesetzt,
der
des
Feststellung
keine
Klammern
den. Durch dieses Druckers
Klammern
Klammern
der
daß
die
b e e n d e t . A n d i e s e m P u n k t h a b e n wir die
wird,
kombinationen
und
in F o r m
zunächst
Segment
angewendet
werden
mit
sche O b e r f l ä c h e n s t r u k t u r
1
(12)
jeden einzelnen
innersten
erneut
festgestellt,
weil
hat,
wird
phonologi-
Prozeß
phonologischen
jedes
-kontext dabei
der
kontrollieren.
Am
Wird
auf
rechts
wird
Möglichkeit
Dafür der
festgelegt.
und
Transformationszyklus
dem Aufbau
phonologische
innerhalb
sequentiell
mentfolge
und
ablaufen.
Regelanwendung
den
werden
B.
Regeln
eigentliche
zu
lesende
Ausnahmen
PANAMA
Ersatzdar-
wie
'£',
darstellbar.
'a' (13)
Input: Als
Input
Struktur
benötigt -
belle erfolgt Umsetztabelle setztabelle folgendes
das M o d u l
GPM3
Transkriptionsalphabet.
die
Umsetztabelle
Ta-
n a c h d e m g l e i c h e n P r i n z i p w i e die V e r a r b e i t u n g
der
Zeichen
Um-
- phonologische
phonetische
Struktur
-
Verarbeitung
phonetische dieser
Format:
Die
Struktur
in G P M 2 .
Die
Transkriptionalphabet
hat
73
61
80
70 71 72 Zeichen
BinärdarStellung
bzw. Zeichenkombination In den
Spalten
ligen Phonems. Die des
Merkmals
Spalte
mit
in
'1'
1 - 6 1
Ab
Spalte
Diese ein
Zeichen
Zeichen
erzeugt
70
der
GPMl.
Spezifikation
kann
Jedes
die bis
mit
Druckerzeichen, zu
immer (z.
Zeichen
als Mehrfachlochung
jewei-
Tabellenposition Die
Belegung
der
' + ', die
drei
im Output
Zeichen
die
diesem
angegeben
Bele-
B.
Grundzeichen
aus
dem
und
Zeichenvorrat
auf Lochkarten
Phonem werden.
übereinandergelegt,
durch die Kombination aus drei verschiedenen
werden
Zeichen).
der
in
des
'-'.
stehen können
werden
entspricht
Merkmaltabelle
entspricht
Es
die Binärdarstellung
Spaltennummer
der
gung mit Null entspricht entsprechen.
steht
zwei des
so
daß
Zeichen
diakritische Druckers
ist
angebbar.
Beispiel: Das
Phonem
Cjzil] kann
dem
Schrägstrich
als
gebildet
Merkmaldarstellung
Zeichenkombination werden.
Diesem
aus
Phonem
klein liegt
'o'
und
folgende
zugrunde:
+ Vokalisch + Vorne + Rund + Dauernd + Stimmhaft Alle
anderen Merkmale
sind
negativ
spezifiziert.
karte der Umsetztabelle hätte demnach den
Loch-
Inhalt:
7 D100001010011000000000...000
o/
1
70
61
(14) Die
71
(Spalte)
Output: Die
Umsetztabelle
wird
als
phonetische
Lochkartenbild
darstellung
Struktur
aufgelistet.
wird darunter
-
Transkriptionsalphabet
Der
Dezimalwert
t o k o l l i e r u n g des A b l a u f s h e r s t e l l e n zu Automatisch
Zyklusverarbeitung.
Dafür
wird
zunächst Zyklus
die
Domäne
verarbeitenden Nummer
des
ment
der
druckt,
aus
zwar
als
des
ein
kurzes
in d i e s e m
Struktur
Segments.
Regeltabelle
in
diesem
Zyklus
zu
Segments
18stellige
Regeln ausgeführt,
der
folgt
jedes
phonologsichen und
Speicherinhalt mehrere
wird
zu
Segments letzten
verarbeitenden Anschließend
Zyklus
als
aktuelles
Dezimalzahl,
Wird
angesprochene
auf
diesem
d.
Segment h.
Segment
(GPMl)
angegeben. Es
zeigt
den
Für
dieses
Zyklus
für
eine
das
TABELLE 7
= 000000000000002193 = 000000000000006562 = 000000000000006665 = 000000000000006434 = 000000000000000013 = = = =
der oder
Regeln
Protokoll
"comment": MAXIMUM = 00054 M I N I M U M = 0 0045 AKT-PHON-TS-SEGMENT REGEL-INDEX = 00057 AKT-PHON-TS-SEGMENT AKT-PHON-TS-SEGMENT R E G E L - I N D E X = 00071 AKT-PHON-TS-SEGMENT REGEL-INDEX = 00017 REGEL-INDEX = 00067 AKT-PHON-TS-SEGMENT REGEL-INDEX = 00072 AKT-PHON-TS-SEGMENT AKT-PHON-TS-SEGMENT AKT-PHON-TS-SEGMENT AKT-PHON-TS-SEGMENT
Seg-
ausge-
direkt
so w i r d der R e g e l - I n d e x d i e s e r
Beispiel.
der
ausgegeben,
erstreckt.
M i n i m u m = N u m m e r des e r s t e n in d i e s e m Zyklus =
Pro-
ausführlich
ausgedruckt wird das Protokoll
wird
auf die sich der a u g e n b l i c k l i c h e
Maximum
Binär-
zur
können.
Der g e s a m t e A b l a u f des T r a n s f o r m a t i o n s z y k l u s mitprotokolliert.
der
a u s g e d r u c k t , u m die B e z i e h u n g
000000000000016384 000000274877906945 OOOOOOOOOOOOOQOCCO
000000000000003000
Wort
75 Der
Zyklus
werden klus
reicht
zwei
als
Segmente
den
die
Parameter
sie
Bei
diesem
und
die
Zur
leichteren
das
Ergebnis
Diese
Struktur
Als
54.
Bei
der
erscheinen
des
Regelausführung
am
JA'
Satzes
Schluß
des
das
Identifikation
der
dieses
Segment
die
aus
(vgl.
nach
Zy-
ist.
Dezimalzahl)
Zahl
im
dazu
jedem
werden,
Zyklus
(als
dieser
Merkmale
angegeben
kann
ausgegeben
Regelausführungen
erscheint
Merkmalaufschlüsselung,
im A n h a n g
jede
bis
'ZWISCHENPROTOKOLL
der
Protokoll
Überschriftzeile
bierte
45
getilgt.
phonologische
wie
eine
Segment
Null-Segmente.
Über Zyklus
von
resultiert.
Binärmuster
wird
die
Outputliste
wird
der
2
A2). Endergebnis
Text
Zeile
des
gesamten
ausgedruckt. bis
zu
Schnelldrucker
Der
dreimal
optisch
Verfahrens
Ausdruck
erfolgt
übereinandergedruckt
die
optimale
transkri-
zeilenweise, wird,
um
Zeichendarstellung
wobei
über zu
den
errei-
chen.
Schnittstellen; Vom
Hauptprogramm
werden
der
Regelspeicher
aus
Feldern
wird
5.2.5
Das Modul
Das
Modul
eintrag eine
das Modul
GPM4
darstellung
die
gehören.
beliebige
phonologische
übernommen.
GPM5
Struktur
Zur
aus
bitweisen
GPM2
und
Abfrage
von
aufgerufen.
GPM4
baut
und
die
GPMl
das
Lexikon
graphische
Damit
kann
auf.
einer
phonologische
Es
Kette,
verarbeitet
die
zu
einem
beliebigen
Struktur
die
graphischen
zugeordnet
Binär-
WörterbuchKette
werden.
Input: Der
Input
für
dem
Format:
GPM4
besteht
aus
einer
Lochkartendatei
61 Binärdarstellung der
Von
phonologischen
Spalte
Struktur
in
1 - 6 1 der
folgen-
80
70 Zeichen
Struktur
steht Form,
mit
die
wie
Binärdarstellung
sie
bereits
für
der
die
phonologischen
Module
GPM2
und
76 GPM3
beschrieben
wurde. Auf
chen d e s E i n g a b e a l p h a b e t s . zu
phonologischer
dingt mehr
vorhanden Segmente
Spalte Die
Struktur sein.
Es
70 s t e h t das g r a p h i s c h e
Zuordnung
ist
von graphischem
willkürlich
kann
also
auch
und die
e n t h a l t e n als die p h o n o l o g i s c h e
muß
Zei-
Zeichen
nicht
unbe-
graphische
Kette
Struktur
und
umge-
kehrt. Die g r a p h i s c h e Kette e i n e s L e x i k o n e i n t r a g e s der
Aneinanderreihung
Blank
sind.
besteht
aus
Die der
Zeichen
Ein Lexikonwort
aus
Spalte
Struktur
Aneinanderreihung
w e i t sie n i c h t leer Spalte 70
aller
phonologische
des
aller
wird gebildet 70, die
aus
ungleich
Wörterbucheintrages
Binärdarstellungen,
so-
sind. w i r d d a b e i d u r c h das W o r t g r e n z z e i c h e n
V'
in
abgeschlossen.
Output: B e i m A u f b a u eines W ö r t e r b u c h e i n t r a g e s putdatei Das
graphische
darstellung folgt an
der
w i r d die L o c h k a r t e der
In-
protokolliert.
die
als
Ausgabe
das
Wort
Zeichen
Dezimalwert der
wird
als
Segment-Zeichen,
ausgegeben.
Lexikonstelle
abgespeichert
des
wurde,
Nach
dem
die
sequentiellen
und
s c h e n Kette des W o r t e s , d a s d e n S u c h b e g r i f f
der
Binär-
Wortende
Lexikons,
gesamten
im L e x i k o n
er-
graphi-
bildet.
Das B e i s p i e l in der T a b e l l e 8 zeigt d e n A u f b a u e i n e s W o r t e s :
10001001000100000000000000000000000000000000000000000oooooo00
c
01000100000110000000000000OOOOOOOOOOOCCO00OOOOOOOOCOOOOOOOOOO SEGMENT-ZEICHEN = A SEGMENT-BINAER = 0000000000000 06178
A
1011000000010100 000000000000000000000c0000000000000c000c00000
s
1011000000010100000000000000000 000000OCOOO0000000000000000000 SEGMENT-ZEICHEN = S SEGMENT-B INAER = 00000000 00 00010253
S
01000100000110000000000000000000000000 000000000000 00000 000000 SEGMENT-ZEICHEN = A SEGMENT-B INAER = 000000000000006178
A
SEGMENT-ZEICHEN = C SEGMENT-B INAER = 00 0000000 0000 02193
SEGMENT-ZEICHEN = S SEGMENT—BINAER = 000000000000010253
77 01001010 000110000000000000000000000000COOOOO0 0000000000000000 SEGMENT-ZEICHEN = I SEGMENT—BINAER = 000000000000006226
I
01000100100110010000000000000000000000COOOOO00000000000OOOOOO SEGMENT-ZEICHEN = E SEGMENT-B INAER = 000000000000039202
E
10110000010110010000000000000000000000000000 000000 0 0000000000 SEGMENT-ZEICHEN = N SEGMENT-BINAER = 000000000000039A37
N
101100000000000100OOOOOO000000000000000000000000000000 0000000 SEGMENT-ZEICHEN = T SEGMENT—BINAER = 000000000000032781
T
00000000000000100000000000 00000000000000000000000000000 000000 SEGMENT-ZEICHEN = # SEGMENT-B INAER = 0000000000 00016384 LEXIKON-INDEX = 00003
#
CASSAIENT# TABELLE 8
Schnittstellen: Das
Lexikon
wird
an
das
Hauptprogramm
zur
Weiterverarbeitung
und ggf. Ergänzung im Modul GPM2 übergeben. 5.2.6
Das Modul GPM5
Das Modul GPM5
ist eine Assemblerhilfsroutine
einer
Bitfolge
eines
Bitverarbei-
von Abfragen dient. Sie stellt den
tung, die zur Beschleunigung Wert
zur
Feldes
mit
angebbarer
Position
und
Länge fest. Das Abfragefeld Doppelwortes
besteht
aus einem
in der
Länge
eines
(= 2 Bytes = 64 Bit). Über diesem Speicher operie-
ren zwei Shiftbefehle: Shiftleft um anschließend
Feld
Shiftright
um
(64 -
(64 - Position - Länge) und
Länge).
Das
Endergebnis
wird
wieder als Doppelwort zurückgegeben. Das Modul GPM5 wird eingesetzt erklärung
des
Regelspeichers
zu
im Modul GPMl, um die Regelerbringen.
Im
Modul
GPM3
hat
es die Aufgabe, die Spezifikation der Merkmale in den Segmenten festzustellen.
78 6.
ANWENDUNG
6.1
VORBEMERKUNG
Die folgenden Abschnitte zeigen die Anwendung des bisher vorgestellten Verfahrens auf die französische Sprache. Das Französische
wurde
als
Anwendungsbereich
deshalb
ausgewählt,
weil
es
von den gängigsten europäischen Sprache über eine der reichsten Phonologien
verfügt. Zunächst wird begründet, warum
sischen eine Anwendung und anschließend Durchführung
im Franzö-
auf die Orthographie durchgeführt
wird,
die gesamte Realisierung vorgestellt. Aus der
ist ausserdem unmittelbar ersichtlich, daß das Sy-
stem PANAMA auch auf andere Sprachen anwendbar ist. 6.2
ANWENDUNGSFALL "FRANZÖSISCHE ORTHOGRAPHIE"
Das Programmsystem Vorbereich
PANAMA
ist sprachunabhängig
der Phonologie
konzipiert. Der
im Rahmen der generativen
Grammatik,
u. a. also die syntaktische Analyse, ist nicht Gegenstand ser
Arbeit.
Da
kein
des Französischen
zur Verfügung
(Inputschnittstelle) die
Anwendung
verwendbares
auf
für die
PANAMA
syntaktisches
die-
Analysesystem
stand
(1) , das man als Vorgabe
hätte
verwenden
orthographische
können,
Struktur
des
wurde
Französi-
schen durchgeführt. Dabei gehen wir von der These aus, daß die französische Orthographie bis zu einem gewissen Grad die phonologische tur
des Französischen
widerspiegelt.
Für
diese These
Struk-
sprechen
folgende Überlegungen: Französisch graphie "Im
bereits
übrigen
tretenen
ist eine historisierende
hält
zu einem die
sehr
heutige
Lautveränderungen
überkommenen
Schreibweise
den
Jahrhundert
14.-16.
frühem
Sprache, deren Ortho-
Zeitpunkt
Orthographie
an fest,
der die
aus sie
hinzugekommenen,
fixiert wurde.
trotz
aller
einge-
dem
Altfranzösischen
nur
mit
einigen
inkonsequent
aus
beibe-
79 haltenen nahme
Buchstabenzuthaten
einer
Anzahl
Hilfszeichen "Für tische
das
genau
sich
das
des
weiter
sich.
zeigt
Das
aus
Gesetze
zuleiten.
Dies
ohne
Wir Die
gibt
dies
französischen, kelt. noch
Dabei
hier
realen darauf
an
zu im
bzw.
sogar
nur
nehmen,
Ansatz
Beispielen einer im
nachfolgenden die
sonanten
in,
nasaliert.
Nasalkonsonant, war.
n) . O h n e
Vor
schließlich
1)
17.
— >
Vokale und
er
der
daneben
C+ N a s a l ]
(Nasalierung
wir
in
/ _
des Vokals
wie-
auch
Jedoch
stark
zeigt
durchführbar
frühen
Stufe
behielten
ihre
die
nachfolgendem
das
ist.
des
zunächst Qualität
Regeln
der
silbenanlau-
Nasalkonsonanten
folgende
wur-
Nasalkon-
verstummte
Entnasalierung
Alt-
entwik-
Silbenstruktur
Jahrhundert
des
erfolgte vorange-
fassen:
N vor
ab-
Sprach-
(5) können
wir
automati-
der
vergröbernd
Altfranzösischen
die
wieder
mit
13. im
Lautge-
zusammenfassen,
auf
gesprochenen
Jahrhundert
Entwicklung
V
12. wenn
einfachen,
im
henden Nasalvokals. Diese
Im
außer
Rücksicht
vor
indem
Nasalkonsonanten
Nasalvokale
alle
von
Lage,
Vulgärlateinischen
und
B.
Schreibung
erläutern:
sehr
die
(z.
es
gibt.
hat
Lautstan-
regelhaft
Prozeß
sehr
daß
Lautwandel
noch
des
Form
der
ziem-
Folgezeit
Zielsetzung
wurden
im A l t f r a n z ö s i s c h e n
im
in
phone-
noch
der
Grammatik
der
mitgesprochen,
bei
sie
vorgestellte
auf
eine
Repräsentation
daß dieser
sich
der
Prinzip
wir
Vorgänge
einigen
haben
den
tend
genau
Der
ist
weitgehend
wir
sind
phonetische
Anwendung,
Nasalvokale
ging
daß
So
Zeit
In
phonetischen
Auf-
gewordener
Schreibung
Weiterentwicklung
phonologischen
die
Verhalten
unsrer
die
dadurch,
die
Rücksicht
wollen
(3)
entspricht
unregelmäßiges Ergebnis
entspricht".
durch
üblich
(2)
frühesten die
können.
einer
hat".
da
diesem
Transkription.
entwicklung der,
zu
der
Entwicklung
Orthographie
andererseits
Jahrhundert
geregelt
durch
sich
beschreiben
der
schen
von
Diese
16.
notwendig,
Lautung
(4)
diese
nicht
der
entfernt.
setzen
und
Altfranzösische
Französische
immer
verbrämt,
den
vereinfacht
Umschrift
lich
seit
Nasalkonsonant)
80
2)
N
— >
0 /
J £ v>
V
_+ NasalJ _ V-C
V-
(Tilgung des Nasalkonsonanten) 3)
V
---> Q- NasalH / _ N
L+ NasalJ (Entnasalierung) Verzichten
wir
auf die Chronologie
und beschreiben den
Prozeß
synchronisch, so können wir die drei Regeln zusammenfassen zu: 4)
ö
V
— - > C+ NasalU / _ N ff
(Nasalierung des Vokals) 5)
N
— > ß /
p
1
L + NasaJj _ (Tilgung des Nasalkonsonanten) Diese Gesetze der Nasalierung in Form der Regeln 4) und 5) sind auch heute noch wirksam, was sich z. B. bei der Übernahme von Fremdwörtern zeigt: engl: Sandwich
>
franz: QsadwitJ*!]
Die Orthographie war von den Prozessen der Nasalierung hend unberührt geblieben 5) den Nasalierungsprozeß
weitge-
(6) , so daß man mit den Regeln 4) und synchronisch
beschreiben
kann, wobei
die Orthographie in diesem Fall genau der phonologischen Struktur entspricht. Ein weiteres Beispiel ist die Monophthongierung von 'au' zu 'o', die eine der letzten großen Veränderungen vom Vulgärlateinischen
zum Altfranzösischen
abgeschlossen
ist.
(7) Aus
wurde altfranzösisch tung. 15.
Durch
die
Jahrhunderts,
Jahrhundert
wurde
darstellt, und einem
im 9.
Jahrhundert
vulgär lateinischen
'paupere1
'povre' in der Schreibung und in der Lau-
etymologisierenden
Bestrebungen
besonders
aber
durch
den
versucht,
die
Herkunft
des
Humanismus
der
Wörter
14.
und
im
16.
aus
dem
81 Lateinischen bei
'povre'
te,
wovon
auch zu d e n
sich
Zusammenhang und
der
in
der
Schreibung
Schreibungen
die
letztere
zwischen
der
Transkription
deutlich
'paovre',
schließlich ist
machen,
was
'pauvre' u. ä. durchgesetzt
neufranzösischen
CpovreU
zu
Schreibung
deshalb
der
führ-
hat.
Als
'pauvre'
Lautwandel
vom
L a t e i n i s c h e n zum A l t f r a n z ö s i s c h e n a n z u s e t z e n m i t 6) Diese
au
Regel
>
gilt
Jahrhundert
ein
o
aber
zugleich
sekundäres
für
'au',
einen
Prozeß,
entstanden
aus
der
im
+
'1',
'a'
16. zu
'o' m a c h t , z. B. afz. Chevals = C t J 4 e v a l s 3 m i t der
Schreibung
'Chevaux'
>Qjevaus3
CjavoI]
—->nfz.
a u s vulgär l a t e i n i s c h e m
'caballos'.
M i t der R e g e l 6) e r f a s s e n wir a l s o s o w o h l d e n L a u t w a n d e l Vulgärlateinisch französischen Lol . Die der,
und
Regel
'au' zu afz.
'au',
entstanden
französische läßt,
zu.
aus
Orthographie
synchron
Diese
'o', als a u c h d e n W a n d e l v o n
betrachtet,
Beispiele
lassen
'al',
zu
spiegelt die
neufranzösischen
beide
fortsetzen
Phonologie
ist j e d o c h auf k e i n e n F a l l nur h i s t o r i s c h e
Phono-
alle
Regeln
Prozesse "entweder
Formulierung
der ist
Grammatiken
einen
Lautwandel
die
Tatsache,
gibt,
nicht
chronischen stehen.
der
oder
Regeln
zurückzuführen es
von
Regeln
werden, sie
widerlegbar,
viele
daß
phonologischen so
(8) Grammatik
stünden
wir
sind d i e s y n c h r o n i s c h e n R e g e l n eine
diachronen
jedoch
schen
einer
zurückgeführt
dem Problem, Behauptung
eine
finden
Könnten
historische
als
wi-
und
s i c h , n e b e n b e i b e m e r k t , a u c h in a n d e r e n S p r a c h e n . logie.
Prozesse
Transkription
sich
von alt-
auch uns
nicht
nicht
falsch."
"da m a n
findet, sind".
auch
die (10)
historisch
angenommenen im
sind
These,
Widerspruch
zu
in
nicht Doch
(9)
vor neue
Diese
synchronidirekt
auf
widerspricht
motivierte solange den
auf
Regeln
die
syn-
historischen
82 6.3
AUTOMATISCHE TRANSKRIPTION VON FRANZÖSISCHEN PHISCHEN
6.3.1 D E F I N T I O N D E R A U S G A N G S - U N D Der
Ausgangspunkt
für
unserer
orthographische
T e x t e . Hier
keiten
das
und
auf,
der
da
in d e m
sind. Wir
Zeichenvorrat für P A N A M A
nur
einige
müssen
also
Transkription
treten einige über
für
einen
und
die
sind
französische
technische
PANAMA Zeichen auf
Schwierig-
Lochkarten
begrenzten
orthographische den Eingabetext
abbilden,
(11)
ZIELALPHABETE
Eingabemedium
Kartenlocher
verfügt,
ORTHOGRA-
TEXTEN
einen
sind,
Zeichenvorrat
nicht
vorhanden
verarbeitbaren
Eingabekonventionen
des
Textes
einhalten.
Im R a h m e n einer
Grammatik:
G ={$,S,R,s}
(12)
k ö n n e n wir unser E i n g a b e a l p h a b e t e x t e n s i o n a l
definieren.
§ = ^A,B,C,D,E,F,G,H,I,J,K,L,M,N,0,P,Q,R,S,T,U,V;W,Y,Z, •J, S o n d e r z e i c h e n ^ Die M e n g e der S o n d e r z e i c h e n Sonder z e i c h e n = m i t der
umfaßt:
(,) , +, ' , 1, 2 , 3 , 4 ,
Bedeutung: ^ = Worttrennungssymbol
(Wortgrenze)
+
= Grenzsymbol
(Morphemgrenze)
()
= K l a m m e r n der s y n t a k t i s c h e n
1
= Apostroph
1
= Accent
grave
2
= Accent
aigu
3
= Accent
circonflex
4
= Cedille
5
= Trema
Struktur
83 Satzzeichen
werden
nungszahlen
müssen
geschriebene" Satz,
oder
Ein
eine
wenn
Satz wenn
er
dieses
über
Form
Wörtern, Wörter tiert,
ignoriert,
Folge dann
zu
müssen
2
Die
Sätzen.
Ein
Paar von
von
Eingabeeinheit Satz
ist
eine
wird
von
Struktur
Klammern
besteht
Zeichen d e f i n i e r e n
Ord"aus-
ist
ein
Kette
von
von $ : PANAMA
akzep-
gehört,
enthält.
Worttrennungszeichen
2.
und
ihre e n t s p r e c h e n d e
und
syntaktischen
ein
Das A u s g a b e a l p h a b e t Als p h o n e t i s c h e
in
werden.
wohlgeformt
einer
mindestens Satzes
von
Lexikon
Zahlen
sind E l e m e n t e aus der P o t e n z m e n g e
ist er
das
gebracht
alleinstehende
d.
Die
Wörter
umgeben
aus den p h o n e t i s c h e n
h.,
sein.
Zeichen.
wir:
=^a,e,e,§,i,9,Q,0,#,u,y,?,ä,f,g,j,w,b,d,f,g,k,l,m,
n,n,p,r,s,S,t,v,z,3,7^ Dieses dem
hat
eine
phabet
Zeichenvorrat eindeutige
der
AIP
Hilfszeichen Laut, die
Alphabet
phonetische
mit
Ringlein
Tilde
Zeichen
des
das
oben
oder
AIP
in
das
festgelegt:
unten die
Alphabetes
ausgewählt,
bedeutet
Nasalierung. geht
aus
erzeugbar
der
(13) Haken
Die
geschlossener Die
folgenden
AIP
£
AIP
a
b
b
e
a a
d
d
O
AvanH / _ C~ LateU
(28)
95
2)
+ Ouve
Voca
- Avan - Arri
+ Ferm + Avan
- Rond
+ Rond
- Ouve —
+ Arri
>
+ Rond
- Nasa (ii)
Grapheme mit dem Anfangsglied E-.
Die Grapheme
der Gruppe E- sind: EAU, EIM, EIN, ENT, EI, EM,
EN,
E
ER,
EU,
+
accent
aigu, E + accent
grave, E
+
accent
circonflex, E + Trema und E. Die Grapheme mit wieder
auslautenden
Nasalkonsonanten
vernachlässigen, wenn sichergestellt
tige Basisvokal erzeugt wird. Bei
EIM
können
ist, daß der
('plein'). Bei
den Segmenten
Nasalierungsposition
/em/ und
den Basisvokal
rich-
und EIN geschieht dies
ohnehin durch die Regeln für die Segmente /ei/, die zu den
wir
wer-
/en/ müssen wir
/a/ erzeugen
in
('mentir, lé-
gende'), außer wenn /i/ vorausgeht. In diesem Fall benötigt die Nasalierungsregel den Basisvokal /e/
('viens').
+ Ouve 3)
- Avan
- Rond
- Arri
—
>
/
+ Ferm
/< \
+ Rond
+ Avan -
Kontextfrei
Rond
\ /
sind die Regeln für die Grapheme
+ Akzente:
4)
+ Ouve
+ Ouve
"+ Voca
p
—
- Avan
- Avan
+ Ferm
- Ouve
- Ar r i
- Arri
+ Avan
+ Arri
+ Rond
- Rond
+ Rond
- Nasa
_
_
_
—
EAU und
E
96
'fr G r a v b
5)
+
Ouve
fr C i r c ]
-
Avan
Ifr Trem]J
-
Arri
+
Rond
finitivendung
Die
ER
u
-
Avan
+
-
Arri
+ Arri
+
Rond
+
Ausnahmen
-
Ouve
('parier')
Cons
Position,
bébé'. z. B . a l s
zu g e s c h l o s s e n e m
In-
C
+ Avan —
dieser
Rond
-
Ouve
Regel
Einsilbler, was durch den
7)
-
>
Ferm zu
Rond
in w o r t f i n a l e r
von Verben + Voca
-
'eau, b e a u , p e r e , b e t e , n o ö l ,
wird
Ouve
v
/
C
angegeben
werden
könnte.
men
z. B .
'amer,
gibt,
- Rond
— >
sind:
Das Graphem
6)
E
+ Avan
c+ A i g u ]
Beispiele dafür
+
—->
Avari-!
wie
'mer,
eher',
usw.
sind
oft
Kontext:
o -
*
Da
es
enfer'
jedoch wurde
dazu
auch wieder
auf
diese
/ent/
und
Ausnah-
Erweiterung
ver-
zichtet. Die
Transkription
Zugehörigkeit Formen
des
des
Verbums
2 transkribiert,
+ Ouve 8)
der
Wortes
+ Voca
-
Avan
+
Ferm
-
Arri
+
Avan
+
Rond
+
Rond
Segmente zu
"avoir"
einer ('eu,
Wortklasse eut,
in d e n a n d e r e n F ä l l e n
£+ A v a n ]
Avan -
Ouve
/eu/
eurent') als
ist
von
der
In
den
/eu/
als
abhängig. wird
97 Die Segmente /ent/ werden als Flexionsendung der dritten Person Plural von Verben ('ils parlent') zu Schwa. / ent / 9)
+ Verb
— >
CO/ _
t
In den anderen Flexionsformen
und Wortklassen wird es als das
Graphem JEN| + | T | interpretiert. Als einfaches Segment wird /e/ zu Cfü,
Schwa oder Null.
In phonetisch geschlossener Silbe erfolgt die Umsetzung
in of-
1
fenes Qf J ('bec, verte, pelle ): + Ouve - Avan
+ Avan
10) - Arri
- Rond
—
>
+ Rond Zu geschlossenem £ § 3 wird es vor einigen Konsonanten wie d,r,z ('chez')
in geschlossener
vor und nach Vokalen
Silbe.
Die
Tilgung
von
/e/
erfolgt
('asseoir, mangea, joue, vie'):
+ Ouve - Avan 11) - Ar r i + Rond
V — >
0 / 1V
In allen anderen Fällen wird /e/ als Schwa transkribiert. Dieses Schwa steht in allen Positionen, in denen es von der Orthographie her möglich ist, ohne die schwierigen Gesetze des e-instable
(29)
zu
beachten.
Bühnenaussprache
des
17.
(Das
Ergebnis
Jahrhunderts!)
entspricht Das
damit
der
Lösungsverfahren
für das e-instable erfordert u.a. eine weitgehende syntaktische Analyse. (30) (iii) Die
Grapheme mit dem Anfangsglied I-.
Grapheme
mit
dem
Anfangsglied
I-
sind:
ILL,
und I. In Nasalierungsposition wird /i/
geöffnet:
IL,
IM,
IN
98
+ Voca - Ferm
+ Ferra 12)
>
+ Avan
+ Ouve
/ _ N
- Rond (z. B. 'pin, Berlin') Die
Segmente
dierenden
/ill/
und
Halbvokal,
/il/ werden
nach
Konsonant
nach Vokal werden
zum
sie
korrespon-
als
/i/
plus
Liquide behandelt: + Voca + Ferm 13) + Avan
[+ Lateü
(C+ Late] )
—->
C- Vocal / V _
- Rond Beispiele dafür sind
'bille, sillon', Ausnahmen
'mille, ville',
usw. Das Einzelsegment ausser
wenn
Muta
cum
/i/ wird Liquida
vor Vokal ('dient,
zu C j l
('dernier'),
tablier')
vorangehen.
Dies wird durch die beiden Regeln beschrieben: + Voca + Ferm 14) + Avan
— >
D- Vocal /
V
- Rond - Voca + Ferm 15) + Avan
+ Cons >
[1+ Vocal / C- Conti
+ Voca
- Rond Diese Regeln sind in den Halbvokal rückgängig
konjunktiv geordnet. Die vorherige Umsetzung auch
gemacht wird
in den Fällen, wo
sie hinterher
wieder
ist notwendig, weil sich die Muta cum
Liquida Bedingung nicht negativ formulieren lässt.
99 (iv)
Grapheme mit dem Anfangsglied 0-.
Die Grapheme mit dem Anfangsglied
0- sind: 0IM, OIN, OEU, OE,
OU, OM, ON, Ol, 0 + Circonflex, und 0. Die geln
Segmente /oeu/ und /oe/ werden durch
in
umgesetzt
/oi/ werden
zu C w a U
('boeuf,
coeur,
kontextfreie
oeil').
Re-
Segmente
('voix'), außer wenn das /i/ in Nasalie-
rungsposition steht, in diesem Fall gehört es zum Graphem
|IN I.
Die Segmente /om/ und /on/ werden von der Nasalierungsregel abgedeckt. Die Transkription von /ou/ ist umgebungsabhängig. Nach Muta cum Liquida und vor Vokal wird es zu [ u ] , vor Vokal alleine zu C.w3 und vor Konsonant ebenfalls zu CuH: —
—
—
+ Ouve
+ Voca
+ Avan
+ Ferm
16} + Rond
+ Avan
Nasa
+ Rond
-
+ Cons + Ferm —
_
>
/
- Ouvel
E Conti
+ VocaJ _ v'
4
- Voca + Ferm - Ouve
Beispiele dafür sind 'trouer, coup, ouest'. Die generelle Realisierung von /o/ ist das offene C9 D ('globe,
col').
Konsonanten
Es
wird
geschlossen
im
Auslaut,
('echo, mot') und vor /s/ + Vokal
vor
auslautendem
('rose'):
+ Ouve + Avan 17) + Rond
l(K) t —>
C- Ouv^] / \/s/ V
- Nasa (v)
Grapheme mit dem Anfangsglied U-.
Die Grapheme mit dem Anfangsglied U- sind: UM, UN und U. Für die Nasalierung bei /um/ und /un/ wird der nichtgerundete Basisvokal C Ç H erzeugt, da wir auf die Verwendung von verzichtet haben, /u/ wird zum korrespondierenden Halbvokal C yH vor /i/
('huile') und /e/
('tuer'), wenn /e/ nicht auslautend
('tue'). Sonst lautet die Transkription futur'):
ist
('continuer, cru,
100
+ Voca + Ferm 18) + Avan
—-5> D- Vocal] /
(31)
+ Rond 6.4.2 DER KONSONANTISMUS Bei
den
weniger
konsonantischen
Graphemen
häufig
den
als
bei
sind
Vokalen.
die Das
komplexen
Grapheme
Grapheminventar
des
Konsonantismus lautet: B, CH, CC, C + Cedille, C, D, FF, F, GN, GU, G, H, J, K, LL, L, MM, M, NN, N, PH, PP, P, QU, Q, RR,R,SS, S, TT, T, V, W, X, Y, Z. Für die Degemination der Konsonanten benutzen CHOMSKY/HALLE die elegante Regel: K
—-$> 0 / vor identischem Konsonanten
die sich jedoch
(32)
im Rahmen der üblichen, auch hier verwendeten,
Notationskonventionen
nicht realisieren lässt. Die Degemination
muß deshalb durch die Aufzählung der möglichen Geminaten erfaßt werden. (i)
Das Segment /b/ wird vor /p/ desonorisiert, und damit re-
gressiv auf /p/ assimiliert (ii)
('absolu').
Die Grapheme mit dem Anfangsglied C- lassen sich in einer
Regel zusammenfassen:
+ Ferm + Arri 19) + Cont
—->< + Coro
- Vois
+ Ante
V.
+ Stri_ - Cont
/e/ /
_J/i/ C+ Cedil J
J
101 Die einzelnen Teile dieser
Regel sind
folgendermaßen
zu
inter-
1
pretieren: /ch/ vor Vokal wird zu C S H ('chapeau ), die Doppelkonsonanz
/cc/
wird
vor
1
einfache
Vokalen
('conscience'),
per ) , das kalen
und
mit
(iii)
Das
Vokalen
getilgt
nach
es wird dagegen ('cent,
ça').
vereinfacht
('occu-
/s/ und vor
hellen
zu C s D vor hellen
In
allen
anderen
Vo-
Fällen
('clair, cure').
Segment
eintretender
/c/ wird
Cedille
wird /c/ z u C k H
dunklen
Liaison
/d/
wird
das
auslautend
richtige
Ligem
desonor isiert
um
zu
('grand
bilden
bei
homme: Cgrät^Qitf] ' ) . (iv)
Die Segment /gn/ assimilieren sich zu
Segment /g/ wird vor hellen Vokalen zu C 3 3
('gagner'). Das ('agir'), vor
dunk-
len Vokalen bleibt es erhalten Cgi] ('fagot'), wobei ein nichtauslautendes nachfolgendes /u/ getilgt wird (v)
('guerre').
Das Segment /h/ wird in allen Positionen getilgt.
(vi) Das Segment /p/ wird vor /h/ zum korrespondierenden
Dauer-
laut C f 1 ('phrase') . (vii) Das Graphem über
die
| q | erhält als phonologische Struktur
Umsetztabelle
/k/,
wobei
ein
nachfolgendes
bereits /u/
vor
Vokal zu tilgen ist ('cinq, qualité'). (viii) Einfaches /s/ wird intervokalisch und auslautend siert
('rose').
Die Auslautsonorisierung
chen Liaison nötig (ix)
Das
Graphem
sonorimögli-
('un gros homme: Cf groz^çnû').
Das Segment /t/ wird
in der Graphemfolge
respondierenden Dauerlaut /s/ (x)
ist wegen der
I Y I hat
ITION I zum kor-
('nation'). als
phonologische
Struktur
bereits
ein /i/ und wird wie der Vokal /i/ verarbeitet. 6.4.3 DIE NASALIERUNG Der historische Ablauf des Prozesses der Nasalierung reits aufgezeigt.
(33) Von dieser Entwicklung
wurde
be-
konnten alle
Vo-
kale betroffen sein, doch hat das Französische die [T
y
u ] schon seit langem verloren.
vier Nasalvokalen dessen ebenfalls
Nasalvokale
(34) Von den verbleibenden
ist die Opposition zwischen C f ] u n d [ u n t e r fast völlig
aufgegeben worden, so daß man für
das heutige Französisch ein Nasalvokalsystem mit den drei Vokalen Lf
a
g ] annehmen kann.
1 02 Die bar:
Nasalierungsbedingungen
Folgt
einem sein, wird
einem
weiteren d.
h.
der
Vokal
ein
Konsonanten
die
Vokal
sind
(dieser und
der
muß
eindeutig
im A u s l a u t
darf
Degeminationsregel nasaliert
synchron
Nasalkonsonant
kein
angeb-
oder
vor
Nasalkonsonant
vorher
ablaufen),
nachfolgende
so
Nasalkonsonant
getilgt.
20) V
—->
21) N
— >
Q+ N a s a l ] / _
N
V 0
/ C+ Nasall]
Der V o k a l s e l b s t w i r d
/V /u/
22)
—
/y/
geöffnet:
»
—
»
—
»
/?/ /?/
Die Q u a l i t ä t s a n p a s s u n g mus
vorweggenommen,
regel ansetzen
+ Cons
23) + Ouve
+ Nasa
Nasa
-
Ferm
Die
Regel
son
jedoch
als
Ligem
prozedur
-
23)
entspricht der
benötigt in zwei
auslautend
so d a ß wir n u n als a l l g e m e i n e
im V o k a l i s -
Nasalierungs-
Ferm
darf
den Regeln
Nasalkonsonant wird.
Wir
wir
die
Tilgungsregel
20) nicht
müssen
Fälle a u f t e i l e n :
müssen
nachfolgenden
h a b e n wir b e r e i t s
können:
+ Voca -
der V o k a l e
21). Für die
Liai-
getilgt werden, da
deshalb
die
des
Nasalkonsonanten
Endkonsonanten
p r ä z i s i e r e n daher R e g e l 23) zu 24) u n d 25) :
er
Nasalierungs-
inlautend gilt die Regel
Tilgung für
und
überlassen.
23), der Wir
103 + Voca + Cons
+ Ouve 24) -
Nasa
+ Nasa
Ferm
-
— >
D- Nasa! /
Ferm
+ Voca + Ouve 25) -
Nasa
-
Ferm
+ Cons — >
-
6.4.4 L I A I S O N U N D
ELISION
"Die
die
Elision
vokalischen bung
+ Nasa
c+ Nasali /
nicht
ist
Tilgung
der
Anfangsbuchstaben. immer
markiert;
lierten
die
Liaison
stumm
oder
In der
generativen
dem Ausdruck
te d e n V o r s c h l a g behandeln
elidierte
Konsonant,
der
in
iso-
stummen h des
folgenden Wortes
vor
(...)
(37) (38)
Prozesse
werden
diese
beiden
zusammengefasst.
auch
in einer
Prozesse
SCHANE mach-
Tilgungsregel
zu
E
Ul >
diese
Regel
stattfinden In der
ist, w i r d der
einem
Schrei-
(39):
«evoca
Durch
der
finaler
Phonologie
oiCons
26)
i vor
in
im b e s t i m m t e n F ä l l e n a u s g e s p r o c h e n ,
"linking"
diese
e,
ist
(36)
"Ein
vor
dies n e n n t s i c h L i a i s o n . " unter
a,
Elision
w e n n sie es
gilt:
ist, w i r d
anlautendem Vokal
Endvokale
Die
Vokal mit Apostroph ersetzt". Für
Ferm
von
0 / _ wird
| + jL
C+ AvanU / _
E- LateH
• —
+ Voca
-
Avan
-
Ar r i
-
Rond
+ Ferm + Avan + Rond
—
01: v e
+ Arri + Rond
->
(2)
(3)
'C+ Gravi]
+ Ouve -
Avan
-
Arr i
+ Rond
(1)
Rond
+ Ouve
—
R3
Zusammenfassung
anschließend
Aufstellung
Liste,
- Ar r i
R2
auf,
+ Ouve
-
in der
Druckerprotokolls
zweiten
deutlich
n u n eine
D- C i r c 3
-
»
+ Avan -
£+
(4)
Rond 1
Tremi
(5)
+ Ouve R4
-
Avan
-
Ar r i
+ Avan [+ A i g u ]
—
->
+ Rond
= -
R5
-
+ Voca
Avan
-
Ar r i
+ Rond — •
—
—
—
+ Ouve
—
Avan
-
Ar r i
-
Rond —
r—
-
Rond
-
Ouve
(6)
—
+ Voca + Ferm + Avan + Rond
—
>
Ouve
+ Arri
(7)
105
R6
+
Ouve
+ Voca
-
Avan
+ Ferm
-
Arri
+ Avan
+
Rond
-
+ Avan —
>
Rond
-
Rond
-
Ouve
+
(8)
Ferm
-
Ouve
+
Avan
/
(9)
C + V e r b ~2
+ Cons + Ante C+ A v a n ]
R7
+ Ouve
+ Voca
-
Avan
+
Ferm
-
Arri
+
Avan
+
Rond
+
Rond
—
/
-
Coro
-
Ferm
(10)
+ Voca
>
+ Cons + -
(11)
Ferm
Ouve
+ Avan I
(12)
J Ouve R8
R9
Avan
+ Voca
-
Ouve
Ar r i
+ Cons
+
Avan
Rond
+ Ferm
-
Rond
+
Ouve
-
Avan
-
Arri
+
Ante!
+
Rond
+
Nasal
+
Verb
—
»
— >
C - Verbi]
(14)
(16)
1 06
- Voca + Avan
(13)
+ Rond ^
(21)
Avan>|( RondJ
[> V o c a U
/ V _
(25,26)
- Rond + Voca
- Fermni
+ Ferm
+ OuveM / _ I + A n t e !
Rl 2 + Avan
—
G- Voca] /
+ Ferm + Avan - Voca
(27)
>
- Rond
RI 3 - Rond
| + NasaJ
— »
c+ voca] /
V
(28)
E
Cont
+ Cons
- Worb
+ Voca
(29)
107
+ Ouve + Arri RI 4 + Rond -
C+ Circ]
—->
(30)
OuveH
Nasa - Ferm + Ouve
+ Ouve
+ Voca
+ Arri
+ Ferm
RI 5 + Rond
+ Avan
- Nasa
+ Rond
/
- Voca + Ferm
(32)
- Ouve + Ouve
+ Ouve
/ + Voca \
+ Arri
- Avan
+ Ferm
RI 6 + Rond
- Arri
+ Avan
- Nasa
+ Rond
+ Rond y
+ Ouve
—
- Arri
»
(34,35)
+ Voca - Voca
+ Avan
+ Cons
+ Ferm
+ Ferm
+ Nasa
- Ouve
- Rond
+ Arri RI 7 + Rond
+ Avan
->
- Nasa + Ouve
+ Voca
+ Arri
+ Avan
RI 8 + Rond
+ Ferm
- Nasa
- Rond
—
>
- Voca
- Ferm
+ Ferm
+ Ouve
- Ouve
- Avan ( K )
—
*
(36)
(37)
(39,40)
+ Ouve + Ar r i RI 9 + Rond -
—
Nasa
+ Coro __:$> Q . o u v e G /
+ Ante -
Vois
+ Stri
V
(38)
1 08
- Ferm + Ouve
+ Nasa
- Rond
+ AnteJ
K
(41)
+ Ferm + Arri - Cont
V
(42)
- Vois + Voca + Ferm R20 + Avan
Voca —
Ferm
>
+ Rond
Avan
_
(43)
Rond C- VocaH /
1
Ouve Avan Ar r i
(44)
Rond - Coro
Coro
+ Ante
Ante
R21 - Cont
Vois
--> C- VoisU /
(45)
Stri
+ Vois + Coro + Ante R22 - Cont
— >
C" Vois3 /
_
f
(46)
+ Vois + Coro + Ante R23 - Vois + Stri
— >
D- Vo
isl / {_ / j
(47) (48)
109 + Coro - Arri
+ Cons
+ Stri
+ OuveJ
(49)
+ Ouve -
Avan
-
Arr i
-
Rond
+ Feriti
+ Ouve
+ Arri
+ Arr i
+ Cont
+ Rond
- Vois
-
(50,51)
Nasa
+ Voca + Ferm
ß
+ Avan + Rond
+ Feriti + Arri
+ Ouve
R24 + Cont -
.
Vois
-
Avan
+ Coro
-
Ar r i
+ Ante
+ Rond
(52)
- Vois + Stri
+ Voca + Ferm + Avan
+ Ouve - Avan - Ar r i + Rond + Coro
+ Voca
+ Ante
+ Ferm
+ Stri
+ Avan -
Rond
B- Cedi] E- Conti
-
Rond
(53)
110 + Ferm + Arri R25 -
- Arri
+ Ante
Cont
+ Nasa
+ Vois
+ Coro
—
»
+ Nasa
(58)
+ Cont + Ouve
+ Ferm + Arri R26 -
Cont
—
>
+ Coro
-
- Ar r i
- Ar r i
Avan
+ Cont
+ Rond
(60)
+ Stri
+ Vois
+ Voca + Ferm + Avan —
—
R27
+ Voca
+ Ar r i
+ Ferm
Cont
+ Avan
+ Vois
+ Rond
-
—
+ Ante
+ Arri
-
-
—
>
(61)
>
+ Ferm R28 + C o r o
Rond
—
Ferm
-r
(59)
Ferm
+ Cont
Cont
+ Stri
Vois_
+ Vois -
(62)
Arri
+ Cons R29 + C o n t
- >
0
(63) -
R 3 0 [ + LateQ
C+ L a t e ]
—->
Voca
-
Cons
-
Coro
-
+ Voca
Ante
+ Avan
+ Ferm
+ Ferm
+ Avan
-
-
Late
Rond
(64)
111 -
Coro
+ Cont + Stri i /
+ Ante R31 -
Cont
—
>
1
- Vois
_
+ Coro
+ Cont
+ Ante R32 - V o i s -
—
+ Stri
>
/
-
Cont
+ Cons + Cont
(65)
—
+ Vo c a + Ferm + Avan -
V
K
(66)
Rond
+ Voca + Ouve
+ Cons
+ Cons
R33 -
Nasa
+ Nasa
-
Ferm
-
—
D
-
Nasal] /
_
(67)
- Nasa
Ferm
+ Voca + Ouve R34 -
Nasa
-
Ferm
+ Cons — c +
Nasal /
-
+ Cons
+ Cons
R35 + A n t e
+ Ante
- Vois
- Vois
+ Voca
+ Nasa
— >
i r vocal
(68)
Ferm
C + Consll
(69)
>
D- Vocal
(70)
>
C- VocaH
(71)
+
R3 6 + C o n sD | l + C o n s I - voca il H
Voca J
R37 + N a s ail 1+ N a s a I oc C o n s R38 -oc Auf
den
Voca
—
/
>
_
f &
(72)
ConsU
Avan folgenden
o u t p u t der
Seiten
steht
dieses
Regelcorpus
In der m a s c h i n e l l v e r a r b e i t b a r e n F o r m u m f a s s t d a s 72
Regeln.
als
Drucker-
Regelverarbeitung. Diese
Zahl
liegt
wesentlich
unter
der
Regelcorpus Regelanzahl
112 von zeichenorientierten Systemen, so daß man auch daraus Vorteile für merkmalorientierte Systeme ableiten kann. (44)
REGEL-INDEX = 00001 (•OUVE.-AVAN.-ARRI,-ROND,-NASA);(+VOCA,+FERM,+AVAN,-ROND) -> (-MVAN)/_;(-LATE): REGEL-INDEX = 00002 (•OUVE,-AVAN,-ARRI,-ROND,-NASA);(V.+FERM,•AVAN.+ROND) -> (-OUVE,•ARRI,•ROND) » REGEL-INDEX = 00003 (•OUVE.-AVAN,-ARRI,+ROND); (+GRAV) -> C+AVAN,-R0ND) « REGEI.-INDEX = 00004 ( + OUVE,-AVAN,-ARRI, +RCND);(•CIRC) REGEL-INDEX = 00005 (•OUVE,-AVAN,-ARRI,•ROND); (•TREM) REGEL-INDEX = 00006
('"OUVE,-AVAN,-ARRI, + ROND
-> ( + AVAN,-ROND ) » -> (+AVAN,-ROND,-OUVE) 9
) ; (-»A I G U )
REGEL-INDEX = 00007 (•OUVE.-AVAN,-ARRI,*ROND); (•OUVE,-AVAN,-ARRI,-ROND,-NASA);(V,+FERM,+AVAN,+RONC) -> (-OUVE,+ARRI) * REGEL-INDEX = 0000S {•OUVE.-AVAN,-ARRI,•ROND); (V.+FERM,+AVAN,-ROND) -> (•AVAN,-OUVE,-ROND)
»
REGEL-INDEX = 00009 (•OUVE,-AVAN,-ARRI,+ROND,+VERB);(+VOCA,+FERH.+AVAN.+ROND) -> (•FERM.-OUVE,+AVAN,—VERB)
H
REGEL-INDEX = 00010 (•OUVE,-AVAN,-ARRI,+R0ND); (V,+FERM,+AVAN,•ROHD) -> (•AVAN) /_;(•CONS,-CORO,•ANTE,-FERM) * REGEL-INDEX = 00011 OUVE,-AVAN,-ARRI,+R0ND); (V,+FERH,+AVAN,+ROND) -> (•AVAN) /_;(+VOCA,+CONS,+FERH,+ARRI) » REGEL-INDEX = 00012 (•OUVE,-AVAN,-ARRI,+R0ND); (V,+FERM,+AVAN,+R0ND) -> (-OUVE,•A VA N ) H
U 3 REGEL-INDEX = 00013 (+0UVE,-AVAN,-ARRI,*ROND)->
(•AVAN,-ROND)/_;(-VOCA,+AVAN,+ROND)
REGEL-INOEX = 000T4 (+0UVE.-AVAN , - A R R I , + R0ND); < + VOCA,-»CONS, + A R R I , + FERM) / _ ; C + UORB ) REGEL-INDEX
=
»
->
(+AVAN,-ROND)
(•ANTE,+NASA) ; (-V0CA) =
( - 0 U V E , + A VAN,-RCHD)
->
00015
(•OUVE,-AVAN,-ARRI,+R0ND)
REGEL-INOEX
V
/
C-VERB)
»
(
..EGEL-INDEX = 00017 (+0UVE.-AVAN,-ARRI.•ROND)->
(-RCND)/_;(+ANTE,+NASA);(-VOCA,-NASA)
REGEL-INDEX = 00018 (+OUVE,-AVAN,-ARRI,*RONO)->
0
/
(-CONS)
;_;
(+W0RB)
HEGEL-INDEX = 00019 (•OUVE,-AVAN,-ARRI,+ROND)
->
0
REGEL-INDEX = 00020 (•OUVE,-AVAN,-ARRI,+ROND)
->
(-OUVE,+AVAN,-ROND)
/
_
;
(-CO NS ,+V0C A )
(K,•CORONANTE,-NASA,-LATE); REGEL-INDEX
=
=
=
«
/_; ( + UCRB)
#
->
(+AVAN,-ROND)/_;K;
(-VOCA);
->
(+AVAN , - R C N D ) / _ ; K; K
(+WORB)
«
00022
/"OUVE,"AVAN,-ARRI,+ROND> REGEL-INDEX
«
00021
{•OUVE,-AVAN,-ARRI,+ROND) REGEL-INDEX
H
#
00023
( • O U V E , - A V A N , - A R R I , -»ROND)
REGEL-INDEX = 00024 ' • V O C A . + F E R M , + AVAN , - R O N D ) ; ( • C I R O
->
»
( - F ER M , - AV AN , + 0 U V E )
/
( - V O C A , • AR R I , • RON D )
REGEL-INDEX = 00025 ( + V O C A , + A V A N , + F E R M , - R O N D ) ; ( • LA T E ) ; ( • LA T E ) ->
(-VOCA)
REGEL-INDEX
=
/
(+V0CA)
;_«
00026
( + V 0 C A , + A V A N , • F E R M , — R 0 N D ) ; ( • LAT E ) ->
(-VOCA)
REGEL-INDEX
=
/
(+V0CA)
;_#
00027
(•VOCA,+FERM,+AVAN,-ROND)
->
(-FERM,+01VE)
/
_;
( + NA S A , + A N T E ) ; ( - V 0 C A , - N A S A )
REGEL-INDEX = 00028 (+VOCA,+AVAN,+FERM,-ROND) ->
(-VOC A)
REGEL-INDEX = 00029 ( - V O C A , + A V A N , + F E R M , — ROND) REGEL-INDEX
=
->
/
_
;
(+V0CA)
(-C0NS,-WORB)
/
( - C Oh T , - WO RB )
00030
(•OUVE,+ARRI,+ROND,-NASA);(+CIRC)
->
tf
(-OUVE)»
;
( + C0N S, + V0CA )
;
_
H
P
114 ^..EGEL-INDEX
=
00031
( + O U V E , + A R R I , + R O N D , - N A S A ) ; ( • V O C A , + FERM, + AVAN, + ROND) /
(-CONT.-WORB)
REGEL-INDEX
=
;
( + VO CA , + C O N S )
;
_
C-CONS,+VOCA)
C+AVAN.-ARRI)
=
( + F ERI',-OUVE )
#
;(V,+FERM,+«VAN,+RCND)
->
->
(+AVAN.-ARRI)
#
00036
(•OUVE.+ARRI, +ROND,-NASA)
->
(-VOCA,•FERM,-OUVE)/_;(+VOCA,+FERM,+AVAN,-RONO)
# =
00037
(•OUVE.+ARRI.•RONO.-NASA);(+VOCA,+FERM,+AVAN,-ROND) (-FERM,+OUVE,-AVAN) REGEL-INDEX = 00038 (+OUVE,+ARRI,+ROND,-NASA)
->
(-OUVE)
REGEL-INDEX = 0 0 0 3 9 ( + O U V E , + A R R I , + ROND,— N A S A )
->
(IC,-NASA) REGEL-INDEX = 00040 (•OUVE,+ARRI,+ROND,-NASA)
->
(+WORB) =
;
(-FERM,+CUVE,-ROND)/_;( + NASA.+ANTE);(-VOCA,-NASA)
0
(•CORO,+ANTE,-VOIS,»STRI)
"»EGEL-INDEX
->
»
"»EGEL-INDEX = 0 0 0 3 5 \'OUVE,+ARRI,+ROND,-NASA);(+OUVE,-AVAN,-ARRI,+ROND)
REGEL-INDEX
(-VOCA,+FERM,-OUVE)/_;
»
(•OUVE. + ARRI , + R O N D , - N A S A ) ; ( + O U V E , - A V A N , - A R R I , + R O N D )
REGEL-INDEX
->
00032
R E G E L - I N O EX = 0 0 0 3 3 ( + OUVE, + A R R I , + R O N D , - N A S A ) ; ( • V O C A , + F E R M , + A V A N , + R O N D ) RE6EL-INOEX = 00034
; R O N D , - N A S A ) ; ( * V O C A , * F E R M , + A V A N , + RON 0 )
REGEL-INDEX
->
-> ;
->
_
;
(-CONS)
(-VOCA)
/
C
/
( + F E R M , • A RR I , - C O N T .
H
_;
P
(•VOCA,+FERM,»AVAN,-ROND)
0 0044
C+VOCA,*FERM,+AVAN,*ROND)
->
—ARRI,+ROND);X REGEL-INDEX = 00045 (-CORO,»ANTE,-CONT.+VOIS)
->
(-VOCA)/_;(+0UVE,-AVAN,
H
(-VOIS)
/
_ ; ( • CORO , + A N T E , - VO I S , + S T R I )
»
115 REGEL-INDEX = 00046
(-V0IS)
/ _
;
(+W0RB)
«
^ KEGEL-INDEX = 00047 (•CORO,+ANTE,-VOIS,*STRI)
-> C + V O I S )
/V;_;V
#
R E G E L - I N D E X = 00048 (•CORO,+ANTE,-VOIS,+STRI)
-> ( + V O I S )
/ _
(+WORB)
REGEL-INDEX = 00049 (•FERM,+ARRI,«CONT,-VOIS)
-> < «CORO , - A R R I , -»STR I ) / _ ; 0 / _ ; ( + F E RM, • ARR I , *C ON T , - VO I S ) ; ( + 0U VE , - A VAN ,
-ARRI,«ROND) REGEL-INDEX = 00051 0 / _ ; ( + F E R M , + A R R I , + C O N T , - V O I S ) ; ( + V , • F E R M , + A V A N , n -> 0 / ( + C O R O , + A N T E , - V O I S , * S T R I )
(+OUVE,-AVAN,-ARRI,*ROND) R E G E L - I N D E X = 00053 C+FERH.*ARRI,*CONT,-VOIS)
R E G E L - I N D E X - 00055 FERH,+ARRI,+CONT,-VOIS>
->
R E G E L - I N D E X = 00056 (•FE^il. +ARRI. + CONT.-VCIS)
f
;
( +CEDI)
-> ( - C 0 N T )
->
->
(•CORO,•ANTE , - F E R H , - A R R I , + S T R I )
»
R E G E L - I N D E X = 00060 FERM,+ARRI,-CONT,+VOIS)
->
->
(-ARRI,+NASA,+CONT)
(+C0R0,-ARRI,+CONT,+STRI)
(•VOCA,+FERM,+AVAN,-ROND) C
/_;
»
R E G E L - I N D E X = 00058 (•FERH,*ARRI,-CONT,+VOIS);(+CORO,+NASA,+ANTE) R E G E L - I N D E X = 00059 (•FERM,+ARRI,-CONT,+VOIS)
/_;
( +C0R0,+ANTE,-FERM,-ARRI,+STR I )
(+VOCA,+FERM,+AVAN,-ROND)
R E G E L - I N D E X = 00057 (•FERH,+ARRI,+CONT,-VOIS)
#
-> ( + C O R O , » A N T E , - F E R M , - A R R I , « S T R I )
(+OUVE.-AVAN,-ARRI,•ROND) (
»
-> 0 / ( + C O R O , + A N T E , - V O I S ,+ STR I > ;
(+VOCA,+FERM,+AVAN,-ROND) R E G E L - I N D E X = 00054
( • F ER f )
»
*
#
116 REGEL-INDEX = 00062 ( + F E R M . + A R R I , + C O RO , - C O N T , - V O I S ) REGEL-INDEX (K,+OUVE) ->
= 0
00063 n
REGEL-INDEX
=
00064
(•LATE);(+LATE)
->
->
( + A N T E , - F E R * , • CO N T , • S T R I , * V C I S , - A R R I )
( - V O C A , - C O N S , - CORO,-ANT E, + FER M , + A V A N , - L A T E ) / ( V , • F E R l " , + A VAN, - RON D > ; _
»
REGEL-INDEX = 00065 (-CORO,•ANTE.-CONT,-VOIS)
->
(+CONT,+STRI)/_;
REGEL-INDEX = 00066 (•CORO,+ANTE,-VOIS,-CONT)
->
(+CONT,+STRI)
( + F ER M , » O U V E )
->
(+NASA)
REGEL-INDEX = 00068 (V, +OUVE,-NASA,-FERM)
_;
< K , + N A S A , - F E RM )
->
(+NASA)
/
I EGEL-INDEX = 0 0 0 6 9 ( • C O N S , « A N T E , - V O I S ) ; ( • C O N S , • A N T E , - V O I S)
->
( • V O C A , • C O N S)
V
REGEL-INDEX = 00071 ( + NASA,-VOCA);(+NASA,-VOCA)
->
(+NASA,-VOCA)
U
REGEL-INDEX = 00072 (ACONS.+AVOCA.-AVAN) ->
_
=
00073
/
;
( + WORB)
/
_;(K,-NASA) ;
;
(ACONS)
tt
P
(+WORB)
- > ( • C O N S , + A NT E , - V O I S )
REGEL-INDEX = 00070 ( + VOCA, + CONS); ( • V O C A , • C O N S )
0
«
/ _ ; ( V , + F E R M , + A V A N , - PON D ) ; V ; % »
REGEL-INDEX = 0 0 0 6 7 (V,+OUVE,-NASA,-FERM);(K,+NASA,-FERM)
REGEL-INDEX
»
#
#
117 6.6
ERGEBNISSE für die A n w e n d u n g
Als Beispieltext
läuterten Regelkorpus ratur v e r w e n d e t "Tu
wurde
bien
Comment,
on
toujours
t'offre
regarde
qui
toi,
troué, crie
passion
ces
la des
le
une
bon j o u r n a l de P a r i s , point
Textstück
aus der
er-
Lite-
(45):
sera
Mais
von PANAMA m i t d e m e b e n
ein kurzes
même,
place
malheureux
faim.
de
pauvre
Gringoire!
chroniqueur
dans
e t tu as l ' a p l o m b de refuser
chausses
garçon!
Regarde
en d é r o u t e ,
Voilà
belles
mon
rimes!
cette
pourtant
où
Voilà
que
ce
ce
pour-
face
t'a
un
... maigre
conduit
t'ont
la
valu
dix
ans de loyaux s e r v i c e s d a n s les p a g e s du sire A p o l l o
...
E s t - c e que tu n'as pas h o n t e , à la fin? Fais
toi
queur! ton
Tu
donc
gagneras
couvert
jours
de
Non?
chez
de
Tu
ne
avec
veux
jusqu'au
de
bout
res.
Il
les
ses de
Tu
neuve
prétends
tu
à
ta
aus
perdait
toutes leur
rester
libre
un p e u
dem
à
l'hil'on
de
la
même
aves ses façon:
für
Modul
la p e u r
die GPM2
chèv-
un
beau
c o r d e , s ' e n a l l a i e n t dans
paraît-il,
wurde
les
barrette
et la h a u t le loup les m a n g e a i t . Ni les
Originaltext
auras
te m o n t r e r
libre.
leur m a î t r e , ni
R i c h t l inien
chroni-
Tu v e r r a s ce que
du loup,
des c h è v r e s
v o u l a n t à tout prix le g r a n d air et la
den
toi
rose,
... Eh b i e n , écoute
j a m a i s eu de bonheur
tenait. C'étaient,
Dieser
la
pourras
plume
...
à
fais
n'avait
matin, elles cassaient montagne,
tu
de M. S e g u i n .
g a g n e à v o u l o i r vivre M. S e g u i n
écus
et
une
pas?
la c h è v r e
imbécile!
beaux
Brébant,
première
ta g u i s e stoire
chroniquer,
reitet. Der a u f b e r e i t e t e T e x t folgt als
cares-
rien ne les
re-
indépendantes,
libérté."
Verarbeitung (46)
la
in P A N A M A
präcodiert
und
Druckerprotokoll:
nach
aufbe-
118 (ff»TU*»*»SERAS»»#»BI E N « » # » T O U J O U R S # » 0 # L E » # * » M E 3 M E # # » 0 M O N # » * * P A U V R ? * « WORTSPEICHER1 = TU* WORTSPEICHER1 = SERAS* WORTSPEICHER1 = BIEN« WORTSPEICHER1 = TOUJOURS« U O R T S P E I C HE R1 = LE» U O R T S P E IC HER1 = M E 3 H E » WORTSPEICHER1 = MON» WORTSPEICHER1 = PAUVRE» **GRINGOIRE**) WORTSPEIC HER1
=
GRINGOIRE*
(»»COMMENT*») WORTSPEICHER1
=
COMMENT*