263 63 11MB
German Pages 263 [264] Year 1997
Sprache und Information Beiträge zur philologischen und linguistischen Datenverarbeitung, Informatik und Informationswissenschaft Herausgegeben von István Bátori, Walther von Hahn, Rainer Kuhlen, Winfried Lenders, Wolfgang Putschke, Harald Zimmermann Band 35
Martina Keil
Wort für Wort Repräsentation und Verarbeitung verbaler Phraseologismen (Phraseo-Lex)
Max Niemeyer Verlag Tübingen 1997
Für Rosemarie, Marion und Hilda
CIP-Titelaufnahme der Deutschen Bibliothek Keil, Martina: Wort für Wort : Repräsentation und Verarbeitung verbaler Phraseologismen (Praseo-Lex) / Martina Keil. - Tübingen : Niemeyer, 1997 (Sprache und Information ; Bd. 35) ISBN 3-484-31935-6 © Max Niemeyer Verlag GmbH & Co. KG, Tübingen 1997 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherang und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbeständigem Papier. Druck: Weihert-Dnick GmbH, Darmstadt Einband: Hugo Nadele, Nehren
Inhaltsverzeichnis Vorwort 1 Einleitung
IX 1
1.1 Die Besonderheiten von Phraseologismen
2
1.2 Phraseologismen & Computer
4
1.3 Phraseologie oder Idiomatik?
6
1.4 Ziel der Arbeit
7
2 Phraseologismen und Idiome: Abgrenzung, Klassifikation, Begriffe und Eigenschaften 2.1 Abgrenzung und Klassifikation 2.1.1 Das Zentrum-Peripherie-Modell von Fleischer 2.1.2 Die semantischen Gruppierungen von Burger 2.1.3 Gegenstand der vorliegenden Arbeit 2.2 Stabilitätsphänomene 2.2.1 Lexikalische Substitution 2.2.2 Unikale Komponenten 2.2.3 Syntaktische Anomalien 2.2.3.1 Anomalien an der syntaktischen Oberfläche 2.2.4 Bewertung der phraseologischen Besonderheiten 2.3 Zusammenfassung 3 Phraseologismen in klassischen generativen Grammatiktheorien
11 11 11 15 18 18 18 19 21 21 28 29 31
3.1 Phrasenstrukturgrammatiken
31
3.2 Idiome, Pseudo-Idiome und phraseologische Einheiten
34
3.3 Zur Behandlung von Idiomen innerhalb der TG
39
3.3.1 Transformationelle Defektivität 3.3.1.1 Fräsers Frozenness-Hierarchie 3.3.1.2 Die Markierung durch ein einziges Merkmal 3.3.2 Idiomatizität als Anomalie der TG
46 46 47 49
VI
3.3.3 Die Bedeutung von Idiomen 3.3.4 Automatische Feste-Syntagmen Analyse
51 52
3.4 Idiome in späteren generativen Argumentationen
54
3.4.1 Idiome als Argument für Transformationen 3.4.2 Der referentielle Status von Phraseologismen 3.4.3 Quasi-Argumente ohne referentielle Funktion 3.5 Zusammenfassung 4 Allgemeine Aspekte der phraseographischen Beschreibung: Valenz und Variabilität 4.1 Zur Valenz von Phraseologismen 4.1.1 Der Begriff der Valenz 4.1.2 Valenz verbaler Phraseologismen 4.1.3 Valenz und Nennform in Wörterbüchern 4.2 Variabilität von Phraseologismen 4.2.1 Lexikographisch erfaßbare Variabilität 4.2.2 Regelbasierte Variabilität 4.2.2.1 Flexionsformen als reguläre grammatische Formveränderungen 4.2.2.2 Modifikationen 4.2.2.3 Kreativ-wortspielerische Modifikation 4.2.2.4 Metakommentare 4.2.2.5 Systematische Modifikation 4.2.3 Zusammenfassende Betrachtimg der Variabilität 4.3 Zusammenfassung 5 Semantische Aspekte Idiomatizität, Bedeutungsstruktur und Paraphrasierung
54 54 55 55
57 57 57 59 63 67 68 71 72 72 73 76 77 78 79
81
5.1 Idiomatizität, Nicht-Kompositionalität, Motiviertheit
81
5.2 Bedeutungsstrukturierung
85
5.2.1 5.2.2 5.2.3 5.2.4 5.2.5
Systematische Modifikationen als Ausgangspunkt Kompositionalität und Semantische Autonomie Burgers kompositioneile Gliederung der übertragenen Bedeutung . . . Referenz von figurativen Phraseologismen Semantische Autonomie als graduelle Eigenschaft
85 87 92 94 95
νπ 5.2.6 Möglichkeiten zur Identifizierung des referentiellen Potentials 5.2.7 Exkurs: Mittel der Textanalyse 5.3 Paraphrasierungsvorschläge 5.3.1 Möglichkeiten der Bedeutungsangabe von Phraseologismen 5.3.2 Textanalyse als Mittel zur Paraphrasenfindung 5.3.2.1 Der Bock 5.3.2.2 Bären aufbinden 5.3.2.3 Den Vogel abschießen 5.3.2.4 Der Korb 5.3.2.5 Die Katze aus dem Sack lassen 5.3.2.6 Steine im Weg 5.3.2.7 Mit Kanonen auf/nach Spatzen schießen 5.3.2.8 Ein Dorn im Auge 5.3.2.9 Den Zahn ziehen 5.3.2.10 Blech reden und leeres Stroh dreschen 5.3.2.11 Staub aufwirbeln 5.3.2.12 Exkurs: Lexikalisierungstendenzen des Fettnäpfchens 5.4 Zusammenfassung
6 Perspektiven für Phraseologismen in der Computerlinguistik 6.1 Modellierung semantischen Wissens
97 98 99 100 105 105 110 113 115 116 117 118 119 120 121 122 122 124
127 127
6.2 Aspekte der computerlinguistischen Modellierung von Phraseologismen . . . 130 6.2.1 6.2.2 6.2.3 6.2.4
Idiome als partielle Funktionen in der GPSG Repräsentation von Idiomen als Datenstrukturen Quasi-Inferenzsystem Weitere Arbeiten zur Computerlinguistik und Idiomatik
6.3 Phraseologismen und Diskursrepräsentationstheorie
131 132 133 136 137
6.3.1 Der Aufbau der Diskursrepräsentationsstruktur 138 6.3.2 Repräsentation von Phraseologismen in der DRT 142 6.3.2.1 Repräsentation systematischer Modifikationen 142 6.3.2.2 Repräsentation satzübergreifender anaphorischer Verweise .. 147 6.3.3 Konstruktion von Diskursrepräsentationstrukturen aus Phrasenstrukturbäumen mit Hilfe von λ-DRT 151 6.4 Darstellung komplexer phraseologischer Szenen
157
6.5 Zusammenfassimg
158
vm 7 Phraseo-Lex - eine Lexikondatenbank zur systematischen Repräsentation von Phraseologismen
161
7.1 Motivation
161
7.2 Softwareprojekte im Umfeld der Phraseologie
164
7.2.1 Die Idiom-Datei
164
7.2.2 Phrase-Manager
167
7.3 Die Zielsetzung von Phraseo-Lex
170
7.4 Spezifikation eines phraseologischen Lexikoneintrags
171
7.4.1 7.4.2 7.4.3 7.4.4 7.4.5
Das Lemma und die Basislexeme Die Grobstruktur des phraseologischen Lexikoneintrags Die syntaktische Beschreibungsebene Die semantische Beschreibungsebene Die pragmatische Beschreibungsebene
171 172 173 176 181
7.5 Struktur des Systems Phraseo-Lex
184
7.6 Erfassung von Lexikoneinträgen in Phraseo-Lex
186
7.7 Anwendungsmöglichkeiten von Phraseo-Lex
200
7.7.1 Nutzung der Such- und Auswertefunktionalität von Phraseo-Lex ...201 7.7.2 Phraseo-Lex als idiomatisches Zusatzlexikon im Sprachverarbeitungsprozeß 204 7.7.2.1 Merkmalstrukturen 204 7.7.2.2 Das Grammatikregelsystem PATR II 205 7.7.2.3 Der Chart-Parser 206 7.7.2.4 Das Parsen von übertragen-kompositionellen Phraseologismen 209 7.8 Zusammenfassung und Ausblick
212
8 Schlußbemerkung
213
Anhang
215
A.l Beispiele für phraseologische Einträge in Phraseo-Lex
215
A.2 Phraseo-Lex im WWW
234
Literatur
235
Phraseologismen-Index
241
Index
249
IX
Vorwort Die vorliegende interdisziplinäre Forschungsarbeit wurde im Rahmen meiner Tätigkeit als wissenschaftliche Assistentin unter dem Titel "Modell zur Repräsentation verbaler Phraseologismen - Konzept und Implementierung eines Werkzeugs zum Einsatz in der Phraseologieforschung, Phraseographie und maschinellen Sprachverarbeitung (Phraseo/Lex)" an der Philosophischen und der Technischen Fakultät der Friedrich-Alexander-Universität Erlangen-Nürnberg erstellt. Da sich die Veröffentlichung der Studie etwas verzögerte, war es mir möglich, Ergebnisse von Forschungarbeiten, die erst im Anschluß an die oben genannte Studie in enger Zusammenarbeit mit meiner Kollegin Ingrid Fischer entstanden sind, zu berücksichtigen. Diese Arbeiten finden sich insbesondere in Abschnitt 6.3.3 und 7.7.2. Während der Erstellung dieser Forschungsarbeit waren mir eine Reihe von Menschen eine große Stütze, bei denen ich mich an dieser Stelle bedanken möchte: Während meines Studiums zum Magister Artium, aber auch auf dem Weg zur Promotion und bei der Erstellung dieser Forschungsarbeit war ich durch die Kombination der Fachgebiete Linguistik und Informatik oft gezwungen, unkonventionelle Wege einzuschlagen. Auf diesen unkonventionellen Wegen wurde ich insbesondere von zwei Menschen unterstützt, denen ich nicht nur deshalb zu großem Dank verpflichtet bin: Prof. Dr. H.H. Munske und Prof. Dr. H.J. Schneider! Herr Prof. Schneider wagte es 1991, gegen alle bürokratischen Hürden mich, eine Geisteswissenschaftlerin mit Nebenfach Informatik, auf eine Assistentenstelle am Lehrstuhl für Programmiersprachen an der Technischen Fakultät einzustellen. Damit gab er mir die Chance, mich noch wesentlich intensiver mit dem Gebiet der Informatik zu beschäftigen, als es mir im Studium möglich war, und gleichzeitig meine Forschungsarbeit finanziell abzusichern. Dafür möchte ich mich bei ihm recht herzlich bedanken. Ich habe Herrn Schneider stets als meinen Förderer betrachtet. Er unterstützte und ermutigte mich insbesondere dann, wenn ich wieder einmal an einer bürokratischen Hürde oder an einem Tiefpunkt meiner Arbeit angelangt war. Mein Doktorvater Herr Prof. Munske, Ordinarius des Lehrstuhls für Germanistische Linguistik und deutsche Mundartkunde, erweckte schon im Studium in mir das Interesse für die Phraseologie. Ganz besonders dankbar bin ich ihm, daß er im Hinblick auf meinen interdisziplinären Themenwunsch keine Berührungsängste mit der Technik bzw. Informatik zeigte. Er war während der ganzen Zeit ein ideenreicher Betreuer und wertvoller Diskussionspartner. Mein herzlicher Dank gilt außerdem allen Kolleginnen und Kollegen am Lehrstuhl für Programmiersprachen zum einen für die "Schließung fachlicher Lücken" insbesondere in der Anfangszeit am Lehrstuhl, zum anderen für die angenehme Arbeitsatmosphäre, für ihre Diskussionsbereitschaft und ihre Bereitschaft zu konstruktiver Kritik. Ganz besonderes herzlich möchte ich mich in diesem Zusammenhang bei Dr. Christian Jacob für unermüdliche Diskussionen und zahlreiche Anregungen und bei Dipl.-Inf. Ingrid Fischer für die enge Zusammenarbeit in computerlinguistischen Fragestellungen
χ bedanken. Ihr danke ich ebenso wie Claudia Wolfinger, Dr. Marion Mast und Dr. Mark Minas für die kritische Durchsicht der Arbeit. Die teilweise umfangreichen Implementierungsarbeiten wurden im Rahmen von Magister-, Diplom- und Studienarbeiten an der Universität Erlangen-Nürnberg vorgenommen. Für ihre dabei gezeigte Einsatzbereitschaft möchte ich mich u. a. bei Ricarda Dormeyer, Doris Seifert, Peter Balzer, Jens Krüger, Anja Löser und Ottmar Siegert bedanken. Ganz besonders aber danke ich Bernd, der mich durch alle Höhen und Tiefen begleitete, mich ermutigte und mir über jede Krise hinweghalf. Bei meinen Überlegtingen zu Phraseologismen ziehe ich eine Vielzahl von Beispielen heran, die auf reales Textmaterial zurückgehen. Diese habe ich vor allem mit der Hilfe des Mannheimer Computersystems zur Speicherung von Textkorpora C O S M A S (Corpus Storage, Maintenance and Access System) des Instituts für Deutsche Sprache (IDS) recherchieren können. Für die kostenlose Nutzung des Systems bedanke ich mich recht herzlich beim IDS. Außerdem danke ich dem Falter-Verlag für die freundliche Genehmigimg zum Abdruck ihrer Zeitungsseiten aus der Wiener Stadtzeitung.
Taufkirchen bei München, im August 1997
Martina Keil
1 Einleitung (1) (2) (3) (4)
Marion hat bei ihrer Chefin einen Stein im Brett. Nächstes Jahr müssen wir den Gürtel enger schnallen, meinen einige Politiker. Claudia hat ihrem Konkurrenten ein Schnippchen geschlagen. Ingrid hat wieder einmal mit Kanonen auf Spatzen geschossen.
(5) (6)
Marion hat bei ihrer Chefin einen Pfeil im Herz. Nächstes Jahr müssen wir die Schnürsenkel schneller binden, meinen einige Politiker. Claudia muß als nächste den weißen Wandhäng finden. Ingrid hat wieder einmal Mücken mit Felsen erschlagen.
(7) (8)
Betrachtet m a n die beiden obigen Gruppen an Beispielsätzen, stellt sich die Frage, w a r u m die erste Gruppe akzeptabler ist als die zweite. Sind denn nicht alle acht Sätze in ihrer Bedeutung irgendwie seltsam? Woher kommt es, daß m a n - wenn m a n jemandem sympathisch ist - bei diesem einen Stein im Brett haben kann, u n d nicht einen Pfeil im Herz? Warum fordern Politiker die Bevölkerung dazu auf, den Gürtel enger zu schnallen, aber nicht die Schnürsenkel schneller zu binden? Warum fragt m a n sich nach dem Lesen der obigen Sätze zwar, was ein weißer Wandhäng ist, aber nicht w a s ein Schnippchen ist? Ist es nicht im Grunde dasselbe, ob Ingrid mit Kanonen auf Spatzen schießt oder Mücken mit Felsen erschlägt? Die Antwort auf diese Fragen liegt darin begründet, daß die Sätze in (l)-(4) im Gegensatz zu denen in (5)-(8) typische Redewendungen des Deutschen aufweisen, die im Bereich der Linguistik als Phraseologismen bzw. Idiome bezeichnet werden. Dabei handelt es sich u m mehrgliedrige Wortgruppen, die als vorgefertigte Konstrukte im Sprachgebrauch des Deutschen etabliert sind. Die Eigenschaften dieses sprachlichen Phänomens sind vielfältig. Ihrer Systematisierung auf einem computerlinguistischen Hintergrund näher zu rücken, wird im Rahmen dieser Arbeit beabsichtigt. In den vorliegenden Betrachtungen des sprachlichen Phänomens Phraseologismus werden Erkenntnisse aus verschiedenen Disziplinen wie der Linguistik, Computerlinguistik u n d Informatik einbezogen. Gleichzeitig ist beabsichtigt, die Ergebnisse dieser Arbeit Lesern u n d Leserinnen aus diesen Disziplinen zugänglich zu machen. Dies erfordert in vielen Fällen die Erläuterung grundlegender Prinzipien u n d Terminologien. In den folgenden Abschnitten dieser Einleitung wird zunächst ein grober Überblick über grundlegende Eigenschaften des phraseologischen Sprachgebrauchs in Abgrenzung z u m nicht-phraseologischen gegeben und anschließend der computerlinguistische Hintergrund aufgezeigt. Bevor das Ziel der Arbeit genauer definiert u n d ein Überblick über die zu behandelnden Themenbereiche gegeben wird, wird der Zugang zu d e m ausgewählten Forschungsgegenstand von zwei Richtungen aus - der europäischen Phraseologie- und der amerikanischen Idiomatikforschung - beleuchtet.
2
1.1 Die Besonderheiten von Phraseologismen An den oben genannten Beispielen (1) bis (4) lassen sich einige wesentliche Charaktereigenschaften von Phraseologismen aufzeigen, die ich im folgenden stichpunktartig benennen möchte. Phraseologismen fallen nicht auf Im gewöhnlichen Sprachgebrauch fallen Phraseologismen wie in (1) bis (4) den Sprachverwendern kaum auf, da sie sie als etwas durchaus Regelhaftes empfinden. Man geht mit ihnen so selbstverständlich um, wie mit der übrigen Sprache auch. Häufig treten für den Laien phraseologische Konstrukte erst im Kontakt mit einer Fremdsprache deutlich zu tage, wo er sich damit konfrontiert sieht, daß es sprachliche Phänomene gibt, die nicht unbedingt "wörtlich gemeint" sind und er sich scheut, sie Wort für Wort zu übersetzen. Phraseologismen sind vorgeformte Sprachkonstrukte Phraseologismen stellen für den Sprachverwender über die Wortebene hinausgehende "vorgeformte" sprachliche Einheiten dar, die ihm seine Muttersprache als komplexes Konstrukt zur Verfügung stellt. Sie müssen nicht erst Wort für Wort zusammengesetzt werden. Vielmehr greift der Sprachverwender als Ganzes auf diese vorgefertigten Sprachstrukturen zu. Phraseologismen haben eine besondere Bedeutung Allerdings bemerkt auch der Laie - bei einigen Phraseologismen eher, bei anderen erst im Falle einer Übersetzung -, daß diese vorgefertigten Sprachkonstrukte eine besondere Art der Bedeutung aufweisen, die nicht unbedingt auf die zugrunde liegenden Einzelwörter, im folgenden auch Lexeme genannt, zurückgeführt werden kann, wie es im gewöhnlichen Sprachgebrauch üblich ist. So haben beispielsweise in (1), die Bedeutungen der einzelnen Elemente Stein und Brett im Grunde nichts mit der Bedeutung "jmdm. sympathisch sein" zu tun, die durch die gesamte Konstruktion ausgedrückt wird. Phraseologismen sind also nicht immer "wörtlich" gemeint! Viele Phraseologismen haben eine bildliche Bedeutung Wenn die Bedeutung nicht "wörtlich" gemeint ist, ist sie dann "bildlich" gemeint? Man könnte annehmen, es liege bei den Beispielen (l)-(4) ein Vergleich zwischen der wörtlichen und der bildlichen Bedeutungsebene vor. So wie der Satz "sein Chef ist ein Fuchs" im Grunde bedeutet "sein Chef ist schlau wie ein Fuchs", könnte man vermuten, daß die Bedeutung in Beispiel (1) so etwas ist wie "Marion ist ihrer Chefin sympathisch wie ein Stein im Brett". Doch diese Art der übertragenen Bedeutung liegt zumindest in diesem Fall - nicht zugrunde, obwohl dennoch in irgendeiner Weise ein Bild im Spiel ist.
3 Phraseologismen können mehrdeutig sein Neben der phraseologischen Bedeutung weisen einige Phraseologismen gleichzeitig eine wörtliche Bedeutung auf, deren Verwendung im Sprachgebrauch durchaus sinnvoll und üblich ist. Als Beispiel dafür kann die in Satz (2) verwendete Wortverbindung den Gürtel enger schnallen betrachtet werden. Obwohl der Kontext in (2) die phraseologische Lesart nahelegt, kann diese Wendung auch im wörtlichen Sinne sinnvoll eingesetzt werden. Die wörtliche Bedeutung wird im folgenden als literale Bedeutung bezeichnet, in Abgrenzung dazu wird die phraseologische Bedeutung - hier "sich sparsamer verhalten" - aufgrund ihres bildlichen Charakters alsfigurativ bezeichnet. Phraseologismen sind fest Phraseologismen zeichnen sich zudem durch ein gewisses Maß an Festigkeit aus. Schwieriger als bei freien Wortverbindungen gestaltet sich der Austausch oder die Veränderung einzelner Komponenten des Phraseologismus. So kann man beispielsweise in Satz (1) das Wort Stein nicht einfach durch das Wort Kiesel ersetzen, ohne daß dies wesentliche Konsequenzen für die phraseologische Bedeutung nach sich zieht. Obwohl eine semantische Nähe zwischen den Begiffen Stein und Kiesel besteht, geht die Bedeutving "jmdm. sympathisch sein" weitgehend verloren. Auch eine Umformimg des Satzes (2) zu "der Gürtel wurde von ihm enger geschnallt" führt zu einem weitgehenden Verlust der phraseologischen Bedeutung. Phraseologismen weisen ungewöhnliche Wörter und Wortkombinationen auf Ebenso wie das ungewöhnliche Wort Schnippchen in Satz (3) finden sich auch in anderen Phraseologismen nicht frei vorkommende Wörter wie Kerbholz, Laufpaß, Hintertreffen usw. Neben solchen einmaligen Elementen auf Wortebene treten in Phraseologismen auch ungewöhnliche syntaktische Konstruktionen auf, die als Ergebnis freier syntaktischer Kombinationen nicht vorkommen. Beispiele dafür sind Konstruktionen wie etwas ist nicht ganz ohne oder sich einen hinter die Binde kippen. Solche Phraseologismen sind nicht mehrdeutig. Phraseologismen fördern die Kreativität von Sprachverwendern Aufgrund ihrer figurativen Bedeutimg und aufgrund der vielfältigen Möglichkeiten zur Bildung von Mehrdeutigkeiten, verleiten Phraseologismen den Sprachverwender in einem besonders hohen Maße zu Wort - und Sprachspielen, da sich vielfältige Möglichkeiten zum Anknüpfen an den unterschiedlichen literalen und figurativen Bedeutungsebenen anbieten. So ist in Satz (4) beispielsweise möglich, anstatt mit Kanonen auf Spatzen mit schwerem Kaliber auf Spatzen zu schießen. Solcher Art kreativer Gebrauch von Phraseologismen findet sich insbesondere in Textsorten wie Zeitungs- und Werbetexten.
4
1.2 Phraseologismen & Computer Im Rahmen der Untersuchung von Phraseologismen und deren Eigenschaften kann der Aspekt "Computer" in zweifacher Hinsicht eine Rolle spielen. Zum einen ist er als potentielles Werkzeug zu betrachten, das eine computergestützte Erfassimg und Speicherung phraseologischer Informationen erlaubt, zum anderen ist die maschinelle Verarbeitimg natürlichsprachlicher Phänomene - unter anderem auch phraseologischer Sprachkonstrukte - ein Ziel der Computerlinguistik und der sprachorientierten Künstlichen Intelligenz. Beide Aspekte werden in der vorliegenden Untersuchung von Phraseologismen berücksichtigt, wobei zu letzterem Aspekt im folgenden einige einführende Bemerkungen erfolgen sollen. Ein grundsätzliches Erfordernis im Hinblick auf die Verwendung eines Computers im Bereich der maschinellen Verarbeitung natürlicher Sprache ist "eine vollständige und explizite Formalisierung sämtlicher den Sprachprozessen zugrundeliegenden Informationen" (vgl. Habel 1985:442). Dieser Forderung nachzukommen, erweist sich als äußerst schwierige Aufgabe. Menschliche Kommunikationspartner verfügen in Ergänzung zu ihrem Sprachwissen im engeren Sinne über Sach- und Situationswissen, das sogenannte enzyklopädische Wissen oder Weltwissen. Dadurch werden Menschen in die Lage versetzt, über die syntaktischen, semantischen und pragmatischen Gegebenheiten hinaus weitere Zusammenhänge herzustellen und Schlußfolgerungen zu ziehen. Wie hoch die Kooperationsbereitschaft eines Lesers ist, soll das folgende kurze Textbeispiel1 vor Augen führen: "Von dem Augenblick an, in dem ich das Buch in die Hand nahm, bis ich es wieder hinlegte, habe ich mich vor lachen nicht halten können."
Erst bei Vervollständigung des Textes stellt der Leser überrascht fest, welche Schlußfolgerung er gezogen hat: "Von dem Augenblick an, in dem ich das Buch in die Hand nahm, bis ich es wieder hinlegte, habe ich mich vor lachen nicht halten können. Eines Tages möchte ich es lesen." (Groucho Marx)
Das im Text nicht explizit genannte Lesen des Buches wird einfach vorausgesetzt. Der nützliche Mechanismus des "Lückenschließens", der dem menschlichen Kommunikationspartner zu eigen ist, wird in diesem Text zum Zwecke der Verdeutlichung bewußt durchbrochen, wodurch der überraschende Effekt entsteht.
1
Dieser Text ist dem Buch "Ein Himmel voller Zahlen. Auf den Spuren mathematischer Wahrheit" von John D. Barrow, Heilberg 1994 entnommen.
5 Gewöhnlich ist dem Menschen dieser Mechanismus in der täglichen Kommunikation aus Gründen der sprachlichen Ökonomie sehr dienlich. Er ist damit nicht gezwungen, in allen Situationen sämtliches Wissen explizit zu machen, sondern kann sich bereits Bekanntes oder Offensichtliches zu nutze machen. Umgekehrt bedeutet das aber für den Prozeß der maschinellen Verarbeitung von Sprache, daß neben sprachlichem Wissen auch außersprachliches Wissen - wie ontologisches Wissen und Wissen aus Erfahrung und Erinnerung - verstärkt in die maschinellen Verarbeitungsprozesse eingeht. Die sprachorientierte Künstliche Intelligenz verfolgt den Ansatz, Wissen zu strukturieren, was zur Bildung verschiedener Klassen von Wissen führt wie • episodisches Wissen:
Der gegenwärtige Bundeskanzler heißt Helmut Kohl.
• lexikalisches Wissen:
"Weißes Pferd" heißt im Deutschen Schimmel.
• enzyklopädisches Wissen:
Pferde sind Tiere/Säugetiere/Huftiere.
Diese Wissensklassen sind allerdings zum einen nicht unumstritten, zum anderen nicht disjunkt, da eine durchschnittsfreie Einteilung von einem Phänomen wie Wissen aufgrund von Überschneidungen auf vielen Gebieten nicht möglich ist. Auch die Frage, welche Art von Wissen in einem speziellen Fall zur Anwendung kommt, läßt sich häufig nur durch die Kombination verschiedener Wissenstypen beantworten. Insbesondere die Modellierung des enzyklopädischen und episodischen Wissens gestaltet sich in vielen Bereichen der maschinellen Verarbeitimg natürlicher Sprache als äußerst schwierig, so daß im Bereich der Computerlinguistik der Ansatz verfolgt wird, sich zunächst einmal mit Phänomenen zu befassen, die weitgehend auf der Basis sprachlichen Wissens lexikalischer, syntaktischer, semantischer und pragmatischer Art begrenzt sind. Im Hinblick auf Phraseologismen ist zu untersuchen, welche phraseologischen Eigenschaften in diesen Bereich fallen und welche auf der Basis des gegenwärtigen Stands der Forschung ausgeschlossen werden müssen. Beschränkt man sich auf die Modellierung solcher sprachlicher Phänomene, die weitgehend auf Sprachwissen beruhen, setzt dies eine "wohldefinierte Beziehung zwischen Ausdrücken der natürlichen Sprache und deren Bedeutungen" voraus (Habel 1985, 445). Eine formale Bedeutungsrepräsentation beschreibt die Bedeutung eines natürlichsprachlichen Ausdrucks in einem für den Computer interpretierbaren Format. Hierbei kann auf unterschiedliche Bedeutungsrepräsentationssprachen und -formalismen zurückgegriffen werden, auf deren Grundlage ein Computer logische Schlüsse, Inferenzen, ziehen kann. Da die Bedeutungsrepräsentation letztlich auf einem Inventar an sprachlichen Elementen beruht, scheint offensichtlich, daß insbesondere Phänomene des nicht wörtlichen Sprachgebrauchs in diesem Zusammenhang ein großes Problem darstellen. Eine Repräsentation des Beispielsatzes (9) als pseudo-logische Formel, scheint unangemessen. Ebenso zeigt die Kombination aus wörtlichem und nicht-wörtlichem Sprachgebrauch in (10) die bestehenden Schwierigkeiten auf: (9)
Klaus erzählte einen Witz. Der ganze Tisch lachte. erzählen(Klaus, Witz). lachen(ganzer_Tisch).
6 (10) Der Chef legt für seine Mitarbeiter seine Hand ins Feuer. Anfrage: Hat er eine Verbrennung erlitten? Nein. Anfrage: Bürgt er für seine Mitarbeiter? Ja. Während im Rahmen dieser Arbeit vor allem der Aspekt der Bedeutungsrepräsentation von Phraseologismen im Vordergrund steht, spielt bei der syntaktischen Analyse mit Hilfe von Parser-Programmen, also Programmen zur maschinellen Analyse von Sätzen durch Zerlegen, vor allem die Frage nach der Identifikation solcher mehrgliedriger Elemente eine Rolle. Dieses Problem würde sich auf einen einfachen Mustervergleich reduzieren, wenn Phraseologismen nur eine einzige Erscheinungsform hätten. Da die meisten Phraseologismen allerdings einen gewissen Grad an Flexibilität aufweisen, reicht ein einfacher Mustererkennungsalgorithmus nicht aus. Daher ist auch in diesem Bereich die Aufdeckung bestimmter regelhaft modellierbarer Zusammenhänge erforderlich.
1.3 Phraseologie oder Idiomatik? Der Untersuchung der hier diskutierten Phänomene wird in zwei linguistischen Forschungsrichtungen nachgegangen. Bis heute besteht nämlich weder ein Konsens über die Bezeichnung noch über eine klare Abgrenzung oder eine interne Klassifikation des linguistischen Gebiets, das in der osteuropäischen und russischen Forschung als Phraseologie, in der westeuropäischen und amerikanischen Forschung überwiegend als Idiomatik bezeichnet wird. Während im Bereich der Phraseologie der Wortgruppencharakter und die Festigkeit als vorrangige Eigenschaften des Forschungsgegenstandes betrachtet werden, stellt der Bereich der Idiomatik den Aspekt des semantisch "Ungewöhnlichen", semantisch "Abweichenden" bzw. semantisch "Nicht-Ableitbaren" in den Vordergrund. Es ist daher nicht überraschend, daß sprachliche Konstrukte wie ins Gras beißen, jmdm. einen Bären aufbinden, den Vogel abschießen ebenso wie die in den Beispielen (1)(4) aufgezeigten Wendungen unbestritten sowohl zu dem Kernbereich der Phraseologie als auch zu dem der Idiomatik zählen. Die Randbereiche beider Gebiete werden aber von sehr unterschiedlichen Phänomenen besetzt. So fallen in die Untersuchungen der Phraseologie beispielsweise Funktionsverbgefüge wie in Fahrt kommen und unter Kontrolle sein bzw. Nominationsstereotype wie offenes Feuer, öffentliche Meinung, Wort fiir Wort, Tag und Nacht, die sich weniger durch semantische Besonderheit, dafür aber durch ihre Festigkeit auszeichnen. Extreme Positionen im Bereich der Idiomatik besetzen diejenigen Idiomforscher, die der Meinving sind, selbst einfache Lexeme, die nicht wie Kuckuck, zwitschern oder zischen der Lautmalerei unterliegen, seien schon Idiome, da hier das grundlegende Prinzip der semantischen Ableitbarkeit der Bedeutimg aus den Elementen nicht gegeben ist. In diesen Extremfällen wird quasi die Meinung vertreten, die gesamte Sprache sei idiomatisch. Veröffentlichungen von Forschungsergebnissen in englischer Sprache auf der einen Seite tond russischer Sprache auf der anderen Seite trugen lange Zeit kaum dazu bei, daß wesentliche Elemente der einen in die andere Forschungsrichtung übernommen wurden. Deutschland besitzt allerdings in dieser Forschungslandschaft dadurch einen Sonderstatus, daß von westdeutschen Wissenschaftlern die englische Literatur
7 und von ostdeutschen Sprachforschern die russische Literatur rezipiert wurde. Dies wird bereits bei Burger (1973) deutlich, der die Idiomatik als Teildisziplin der Phraseologieforschung betrachtet wissen will. In der Computerlinguistik, in der man sich vor allem auf Ergebnisse generativer Grammatiktheorien stützt, erfolgte im Hinblick auf den Forschungsgegenstand dieser Arbeit lange Zeit eine Konzentration auf den Bereich der Idiomatik.
1.4 Ziel der Arbeit Wie sich bereits gezeigt hat, weisen die hier zur Untersuchung anstehenden Phänomene, Phraseologismen bzw. Idiome, die verschiedenartigsten Dimensionen auf. Sie werden mit den unterschiedlichsten Fragestellungen und auf unterschiedlichstem theoretischen Hintergrund untersucht. In der vorliegenden Arbeit wird nun der Versuch unternommen, sich diesem heterogenen Forschungsgebiet aus der Perspektive der maschinellen Verarbeitung natürlicher Sprache zu nähern und die Systematisierung eines Teilausschnitts dieses Phänomenbereichs voranzutreiben. Die in den verschiedenen Forschungsrichtungen gewonnenen Erkenntnisse über Phraseologismen bzw. Idiome und deren idiosynkratische Eigenschaften werden im Hinblick auf eine formale Repräsentation von Phraseologismen analysiert. Dabei wird versucht, das computerlinguistisch Machbare vom derzeitig Nicht-Machbaren abzugrenzen. Insbesondere bildet die Annäherung an eine angemessene Bedeutungsrepräsentation einen Schwerpunkt der Untersuchungen. Dabei beschränken sich die Überlegungen auf die Gruppe der figurativen verbalen Phraseologismen. In der jüngeren phraseologischen Literatur wird verschiedentlich auf einen möglichen Einsatz des Computers zur Durchführung lexikographischer bzw. phraseographischer Arbeiten und speziell deren Vorarbeiten hingewiesen (vgl. Dobrovol'skij 1989, Wotjak 1992, Dobrovol'skij 1993, Durco 1994): "Aber die moderne Theorie der Phraseologie fand sich trotz all ihrer Leistungen nicht bereit, eine brauchbare computerorientierte Beschreibung ihres Objektes zu liefern, die die Automatisierung der wichtigsten phraseographischen Operationen ermöglichen würde. " (Dobrovol'skij 1989:526):
Im Anschluß an die linguistischen Untersuchungen sollen daher die Ergebnisse in ein Konzept zur Beschreibung der spezifischen Eigenschaften von Phraseologismen einfließen, das prototypisch in ein phraseologisches Lexikondatenbanksystem - PhraseoLex - umgesetzt wird. Dieses Werkzeug soll zum einen die in dieser Arbeit gewonnenen Erkenntnisse bündeln und gleichzeitig der weiteren Erforschung verbaler Phraseologismen dienen. Im folgenden möchte ich einen Überblick über die verschiedenen Kapitel der Arbeit geben. Während ich in Kapitel 2 und 3 die grundsätzliche Problematik anhand der einschlägigen Literatur referiere, fließen meine eigenen Überlegungen insbesondere in die Kapitel 4 bis 7 ein. Am Ende eines jeden Kapitels befindet sich eine Zusammenfassung der wichtigsten Ergebnisse und in den jeweiligen Fällen eine Übersicht über die für eine systematische Erfassung relevanten Elemente.
8 Kapitel 2 In Kapitel 2 soll ein Eindruck über Grenzen und Ausprägungen phraseologischer Phänomene vermittelt werden. Klassifikationsmöglichkeiten von Phraseologismen und Idiomen werden anhand zweier bestehender Modelle aufgezeigt, die gleichzeitig zur Abgrenzung u n d Einordnung des in dieser Arbeit hauptsächlich im Fokus stehenden Forschungsgegenstandes dienen. In einem zweiten Abschnitt werden die verschiedenen Beschränkungen u n d lexikalischen und syntaktischen Besonderheiten, die als Stabilitätsphänomene von Phraseologismen zu betrachten sind, vorgestellt. Kapitel 3 Kapitel 3 zeigt die frühe Vorgehensweise bezüglich der Behandlung von Idiomen im Rahmen der transformationellen Grammatiktheorie auf, die zum Teil bis heute für einige computerlinguistische Ansätze der Idiomverarbeitung Gültigkeit besitzt. In den Anfängen der generativen Grammatiktheorien wurden Idiome als ein rein syntaktisches Problem betrachtet und daher überwiegend unter syntaktischen Fragestellungen aufgegriffen. Kapitel 4 In Kapitel 4 befasse ich mich mit den Aspekten Valenz und Variabilität von Phraseologismen, die beide unter anderem im Rahmen der Wörterbuchschreibung bzw. phraseographischen Beschreibung von Phraseologismen eine Rolle spielen. Mit der Frage der Valenz verbunden ist die Frage nach Lexikalisierung und Nennform der Phraseologismen in Wörterbüchern. Im Hinblick auf die Variabilität - als Gegenpol zur Stabilität - wird zwischen lexikographisch-erfaßbaren und nicht mehr lexikographisch-erfaßbaren phraseologischen Variabilitätsphänomenen unterschieden. Kapitel 5 Einen zentralen Punkt dieser Arbeit stellen die Überlegungen zu den spezifischen semantischen Eigenschaften von Phraseologismen in Kapitel 5 dar. Hier setze ich mich mit Wechselwirkungen zwischen Modifikationsmöglichkeiten und Bedeutungsstrukturierung von Phraseologismen auseinander. In diesem Zusammenhang gehe ich auf Überlegungen zur "Kompositionalität" von Phraseologismen ein, die in der amerikanischen Linguistik zu einer veränderten Haltung gegenüber der Bedeutungsstruktur von Idiomen geführt haben. Diese möchte ich mit dem Begriff der semantischen Autonomie phraseologischer Komponenten zusammenbringen. Auf der Basis dieser Überlegungen nehme ich eine semantische Klassifikation verbaler Phraseologismen vor und befasse mich mit der Frage einer angemessenen Bedeutungsrepräsentation von Phraseologismen durch Paraphrasierung.
9 Kapitel 6 In Kapitel 6 diskutiere ich Möglichkeiten der Bedeutungsrepräsentation von Phraseologismen in der Computerlinguistik. In diesem Rahmen werden drei neuere Ansätze zur formaltheoretischen und computerlinguistischen Behandlung der phraseologischen Bedeutungsstruktur aufgezeigt. Welche Perspektiven sich für die maschinelle Repräsentation und Verarbeitung von Phraseologismen im Rahmen der Computerlinguistik eröffnen, wenn die in Kapitel 5 vorgeschlagene Methode zur Paraphrasierung als Grundlage der formalen Bedeutungsrepräsentation herangezogen wird, wird in Kapitel 6 anhand der Diskursrepräsentationstheorie veranschaulicht. Kapitel 7 In Kapitel 7 werden die zuvor erfolgten Überlegtingen in einem Konzept zur systematischen Erfassung verbaler Phraseologismen zusammengefaßt und in dem Lexikondatenbanksystem Phraseo-Lex realisiert. Im Anschluß daran werden die Anwendungsmöglichkeiten von Phraseo-Lex in der traditionellen Linguistik vorgestellt und die Einsatzmöglichkeiten als phraseologisches Lexikon im Rahmen der maschinellen Sprachverarbeitung aufgezeigt.
Als Gedankenanstoß möchte ich abschließend zu dieser Einleitung den kritischen Lesern und Leserinnen folgendes Zitat Weinreichs mit auf den Weg geben: "Die phraseologischen Phänomene sind so verschiedenartig, daß kein einziges Beispiel allein alle Probleme illustrieren kann. Wir müssen uns deshalb davor hüten, von einzelnen Beispielen aus zu verallgemeinern; aber wir müssen irgendwo beginnen." (Weinreich 1972:446)
2 Phraseologismen und Idiome: Abgrenzung, Klassifikation, Begriffe und Eigenschaften Der Bereich des Phraseologischen ist nicht überall eindeutig abgrenzbar. Je nach zugrunde liegenden Kriterien werden bestimmte Phänomene hinzugezählt oder ausgegrenzt. Während vor allem die ehemalige sowjetische Linguistik außerordentlich differenzierte Systeme zur Beschreibung und Klassifizierung des phraseologischen Phänomenbereichs entwickelte, hat sich die amerikanische Linguistik bei ihrer Definition von Idiomen hauptsächlich auf das Merkmal Idiomatizität gestützt. Im folgenden möchte ich einen Überblick über den Bereich phraseologischer Phänomene geben, indem diese zunächst von freien Wortverbindungen abgegrenzt werden und unterschiedliche Möglichkeiten der internen Klassifikation aufgezeigt werden. Dazu ziehe ich zwei Ansätze heran, die für die deutsche Forschungslandschaft prägend sind: zum einen die Klassifikation von Fleischer (1982), zum anderen die Arbeiten von Burger (1973 und z.T. 1982). Der Teilbereich von Phraseologismen, der in der vorliegenden Arbeit im Mittelpunkt der Betrachtungen steht, wird anhand dieser beiden Ansätze abgegrenzt. Im zweiten Teil des Kapitels werden die verschiedenen semantisch-syntaktischen Stabilitätsphänomene, die die Verwendungsmöglichkeiten phraseologischer Ausdrücke gegenüber nichtphraseologischem Sprachgebrauch beschränken, anhand von Beispielen vorgestellt.
2.1 Abgrenzung und Klassifikation Während Fleischers Modell einen guten Überblick über die Vielfalt der phraseologischen Phänomene und deren Grenzfälle bietet, wird in Burgers Arbeiten das Verhältnis zwischen dem in der amerikanischen und westeuropäischen Literatur üblicheren Begriff Idiom und dem in der russischen und osteuropäischen Literatur üblicheren Begriff Phraseologismus erhellt. Deutlicher als Fleischer bezieht Burger bei seinen semantischen Betrachtungen des Phänomenbereichs Stellung zu den Begriffen Metaphorik und Figuriertheit von Phraseologismen. 2.1.1
Das Zentrum-Peripherie-Modell von Fleischer
Zum Zwecke der Abgrenzung gegenüber freien Wortverbindungen und für eine erste interne Klassifikation soll hier zunächst Fleischers Definition und Klassifikation von Phraseologismen anhand eines Zentrum-Peripherie-Modells aufgezeigt werden. Grundsätzlich können Phraseologismen von freien Wortverbindungen wie analytisch zusammengesetzten Verbformen wie geärgert worden sein, reflexive Verben wie sich waschen, Verben, die eine Präpositionalphrase regieren, wie warten auf jmdn., freien Nominalgruppen wie der Baum und adverbialen Superlative wie am gründlichsten abgegrenzt werden. Wird zudem festgelegt, "daß ein Phraseologismus eine Wortverbindung ist, die mindestens ein autosemantisches Wort enthält, also nicht aus Dienstoder Hilfswörtem besteht" (Fleischer 1982:35), zählen auch korrelative Konjunktio-
12
nen wie entweder - oder, einerseits - andererseits und Circumpositionen wie von - an, um herum nicht zu den Phraseologismen. Die weiterführende klare Abgrenzung von Phraseologismen zu freien Wortverbindungen erweist sich für Fleischer als etwas schwieriger, weswegen er ein Zentrum-Peripherie-Modell anwendet. In Abb. 1. habe ich versucht, die Abgrenzung und Strukturierung des phraseologischen Phänomenbereichs in Anlehnung an Fleischer graphisch umzusetzen.1 Die Grenzlinien zwischen den Phänomengruppen sind nicht als fest zu verstehen, sondern implizieren fließende Übergänge. Die oben genannten freien Wortverbindungen liegen außerhalb des Modells. Den phraseologischen Bestand des Kernbereichs bildet eine Gruppe phraseologischer Phänomene, die als Phraseolexeme bezeichnet werden. Diese grenzt Fleischer durch folgende Definition ab: "Das Zentrum wird gebildet von Wortverbindungen mit wenigstens e i n e m Autosemantikon, die alle drei Hauptmerkmale aufweisen: Idiomatizität (vollständig oder teilweise); Stabilität [...]; Legalisierung. Dazu tritt als syntaktisches Strukturmerkmal: nicht festgeprägte Sätze." (Fleischer 1982:72).
Zunächst werden die von Fleischer in seiner Definition genannten Kriterien Idiomatizität, Stabilität und Lexikalisierung kurz vorgestellt, dann die in die Peripherie des phraseologischen Sprachgebrauchs zählenden Phänomene aufgezeigt und kurz auf die syntaktisch-semantische Strukturierung des Zentrums eingegangen. Die Kriterien Fleischer verwendet zur Abgrenzimg des Kernbereichs drei in der Literatur häufig genannte Merkmale von Phraseologismen: Das Kriterium der Idiomatizität bezeichnet die Eigenschaft, daß keine reguläre semantische Beziehung zwischen der Bedeutung der Komponenten eines sprachlichen Ausdrucks und der Gesamtbedeutung des Ausdrucks besteht. Fleischer ermittelt den Idiomatizitätsgrad - wie vor allem auch in den amerikanischen generativen Ansätzen üblich - durch den Vergleich der wendungsinternen und wendungsexternen Bedeutung der Komponenten, die den Phraseologismus konstituieren. Geht keine der Komponenten in ihrer wörtlichen Bedeutung in die Gesamtbedeutimg ein, dann bezeichnet Fleischer den Phraseologismus als vollidiomatisch, während Phraseologismen, bei denen zumindest eine Komponente in wörtlicher Bedeutung in die Gesamtbedeutung eingeht, als teilidiomatisch klassifiziert werden. Ein Beispiel für einen vollidiomatischen Phraseologismus ist demnach bei jemandem einen Stein im Brett haben in der Gesamtbedeutung "bei jemandem sehr beliebt sein"; ein Beispiel für einen teilidiomatischen Phraseologismus dagegen ist einen Streit wm Zaun brechen mit der Bedeutimg "einen Streit anfangen". Innerhalb der generativen Literatur hat der 1
Diese Graphik ist an Fleischers Ausführungen (1982) angelehnt, allerdings trifft dieser in verschiedenen Punkten differenziertere Aussagen als hier für einen groben Überblick über phraseologische Phänomene und Grenzfälle nötig.
13 Begriff der Idiomatizität als definitorisches Kriterium einen besonders hohen Stellenwert, worauf in Kapitel 3 ausführlich eingegangen wird. Als zweites Kennzeichen phraseologischer Phänomene nennt Fleischer in seiner Definition die außergewöhnliche Stabilität, die in der englischsprachigen Literatur mit dem Begriff der "Frozenness" bezeichnet wird. Unter den Begriff Stabilität faßt man zum einen die Eigenschaft, daß die Veränderung der syntaktischen Struktur oder des lexikalischen Komponentenbestandes zum Verlust der phraseologischen Bedeutung einer Wortgruppe führt, d.h. der ursprüngliche Phraseologismus in der modifizierten Form nur noch wörtlich oder überhaupt nicht verstanden werden kann. Zum anderen werden damit die verschiedenen in Phraseologismen auftretenden syntaktischen und lexikalischen Anomalien bezeichnet, auf die ich in Abschnitt 2.2 noch genauer zurückkomme. Als letztes Abgrenzungskriterium führt Fleischer die Lexikalisierung von Phraseologismen an, womit im allgemeinen Phraseologismen als Elemente des Sprachsystems charakterisiert werden. Mit der Lexikalisierung phraseologischer Wortgruppen ist der Standpunkt verbunden, daß Phraseologismen nicht wie freie Wortverbindungen nach Strukturmustern der Sprache produziert, sondern als lexikalische Einheiten reproduziert werden. Die Peripherie Während Fleischer Sprichwörter wie "was lange währt, wird endlich gut" und sprichwortähnliche Phänome wie Geflügeltes Wort, Sagwort, Maxime etc. nicht mehr in die Peripherie der Phraseologismen zählt, fordern andere Autoren "Sprichwörter nicht aus der Phraseologieforschung zu verbannen, sondern sie als besondere Gruppe fixierter lexikalischer Kollokationen zu reintegrieren" (Munske 1993:487; vgl. auch Burger 1973, Burger et al. 1982). Den Sprichwörtern und sprichwortähnlichen Phänomenen ist gemeinsam, daß sie einen festen Komponentenbestand besitzen, für sich eigene Mikrotexte darstellen und daher keine formalen Möglichkeiten des Kontextanschlusses vorsehen (vgl. Fleischer 1982:80f; Häusermann 1977:113). Satzwertige kommunikative Formeln, deren explizite oder implizite Satzstruktur zwar auch nicht sehr variabel ist, wie in den festgeprägten Sätzen "da liegt der Hund begraben", "so siehst Du aus" oder "Schwamm drüber", "Nicht, daß ich wüßte" etc., weisen allerdings häufig pronominale oder andere satzverflechtende Elemente auf. Da diese einen direkten Textanschluß ermöglichen, ordnet Fleischer kommunikative Formeln in die Peripherie seines Modells ein. Auch in den Randbereich phraseologischer Phänomene zählt Fleischer zwei Gruppen sprachlicher Ausdrücke, die er unter dem Begriff Phraseoschablonen zusammenfaßt. Dazu gehören zum einen idiomatische Konstruktionschemata. Sie stellen syntaktische Modelle dar, die durch unterschiedliches lexikalisches Material aufgefüllt werden können wie beispielsweise "X ist X" in "Urlaub ist Urlaub", "sicher ist sicher", "geschenkt ist geschenkt", "hin ist hin" oder "das ist zum + Infinitiv" wie in "das ist zum Davonlaufen/Heulen/Mäusemelken/Verrücktwerden/..." usw. Zum anderen betrachtet Fleischer den großen Phänomenbereich der Funktionsverbgefüge wie beispielsweise in Bewegung bringen/geraten/kommen/sein/setzen, in Fahrt kommen/sein, in Beziehung stehen etc. aufgrund ihrer verallgemeinerbaren syntaktischen Struktur als einen Spezialfall der Phraseoschablonen: Sie bestehen aus einer Nominal- bzw. Präposi-
14
korrelative Konjunktione
zusammengesetzte Verbformen
\
(^^íjmpositioñerr} \
idiomatische
/^RTraseoschablonen
K o n s t r u k t i 'o n Sprichwörter ^..--— ^ schemata/ G e f l ü g e l t e W ö r t e r \ y y A
Funktionsverbgefüge
.
\\ kommu-\\
'
Verbale
Adjektivische \ nikativeU >' . ,
okka- \
adverbialer Superlativ
sionelle > PL
Adverbiale
Peripherie
Λ Formeln u - *
Phraseblexeme
k
Maxime
\\
\\
Kernbereich
Substantivische^
^
/ /
Nominationsstereotype
^
f "^onymische ^ y Wortgruppen ^
Termini
ι
x-"""Artikel V
Substantiv
Abb. 1. Abgrenzung und Klassifikation von Phraseologismen in Anlehnung an Fleischer (1982)
tionalgruppe und einem Funktionsverb, d.h. einem Verb, das im Kontext dieses Gefüges seine lexikalische Bedeutung weitgehend aufgibt und eine eher grammatische Funktion übernimmt. Ihre eigentliche Leistung besteht darin, eine Aktionsart auszudrücken. Als okkasionelle Phraseologismen bezeichnet Fleischer einerseits gelegentliche, nicht-lexikalisierte, individuelle oder textgebundene Variationen von Phraseologismen wie beispielsweise die Abwandlung ägyptische/spanische Dörfer ausgehend von böhmische Dörfer, andererseits Wortverbindungen, die ein für Phraseologismen charakteristisches syntaktisches Strukturmodell aufweisen, aber mit ungewöhnlichem lexikalischen Material gefüllt sind wie beispielsweise riechen wie eine tote Maus unterm Vertiko etc. (vgl. Fleischer 1982:70) Problematisch erscheint Fleischer die Differenzierung zwischen substantivischen Phraseologismen, onymischen Wortgruppen, also Eigennamen mit Wortgruppencharakter und Termini. Letztere beiden Gruppen zählen nur in den alleräußersten Randbereich der benennenden, substantivischen Phraseologismen. Onyme wie Schwarzes Meer, Die Grünen, Die Zeit und Neues Deutschland (Zeitungsbezeichnungen), Golf von Aden, etc. benennen Einzelobjekte identifizierend, womit keine Klassenbildung verbunden ist. Die Termini zeichnen sich dadurch aus, daß sie einen klar definierten Stel-
15 lenwert innerhalb des Systems eines fachspezifischen Wortschatzes besitzen wie spezifisches Gewicht, gleichschenkliges Dreieck, generative Grammatik etc. (vgl. Fleischer 1982:74f) Eine große Gruppe zumeist substantivischer bzw. adverbialer Phraseologismen sind die Nominationsstereotype. Dabei handelt es sich um Wortverbindungen, die eine hohe Stabilität aufweisen und deren Komponenten einander in höchstem Maße determinieren. Die Semantik von Nominationsstereotypen ist weniger gekennzeichnet durch Idiomatizität als durch Bedeutungsspezifizierung und Stabilität in der syntaktischen Anordnung wie offenes Feuer, werdende Mutter, öffentliche Meinung bzw. Mann und Frau, Freud und Leid, Wind und Wetter, lesen und schreiben etc. Fleischer bezeichnet sie daher auch als nicht-idiomatische Phraseologismen (vgl. Fleischer 1982:63) Das Zentrum Den Kernbereich der Phraseologismen bilden die Phraseolexeme, die sich unter Berücksichtigung der Wortart der beteiligten Komponenten und der möglichen Rolle als Satzglied in • adjektivische Phraseolexeme wie frisch gebacken, dünn gesät, schief gewickelt, • adverbiale Phraseolexeme wie auf gut Glück, um Haaresbreite, durch die Bank, • nominale Phraseolexeme wie der Stein des Anstoßes, die bessere Hälfte, ein Silberstreifen am Horizont, und • verbale Phraseolexeme wie jmdm. eine Bären aufbinden, Lunte riechen, Stein und Bein schwören untergliedern lassen. Fehlt eines oder fehlen mehrere der genannten Merkmale Idiomatizität, Stabilität bzw. Lexikalisierung, rückt die betreffende Wortverbindung aus dem Zentrum in Richtung Peripherie. Im Hinblick auf die Semantik von Phraseologismen unterscheidet Fleischer drei Idiomatizitätsgrade: vollidiomatisch, teilidiomatisch und nichtidiomatisch, wobei er die voll- und teilidiomatischen Phraseologismen zum Zentrum, die nicht-idiomatischen wie Nominationsstereotype, zur Peripherie des Gebiets zählt. 2.1.2
Die semantischen Gruppierungen von Burger
Was Burgers Betrachtungen von Phraseologismen sowohl 1973 als auch 1982 betrifft, nimmt er in semantischer Hinsicht differenzierter als Fleischer Stellung zu dem an die Phraseologie angrenzenden Gebiet der Metaphorik und dem Kriterium der Motiviertheit. Burger ist ebenso wie Fleischer der Auffassung, daß es innerhalb des Phraseologischen fließende Übergänge zwischen festeren und weniger festen Verbindungen gibt. "Phraseologisch sind solche Wortketten, deren Zustandekommen nicht oder nicht nur aufgrund von syntaktischen und semantischen Regeln erklärbar ist, oder: phraseologisch sind alle 'idiosynkratischen' Wortketten" (Burger 1973:3).
16 Später hält Burger folgenden minimalen Konsens, den er in Veröffentlichungen zu Phraseologismen gefunden hat, fest: "Phraseologisch ist eine Verbindung von zwei oder mehr Wörtern dann, wenn (1) die Wörter eine durch die syntaktischen und semantischen Regularitäten der Verknüpfung nicht vollerklärbare Einheit bilden, und wenn (2) die Wortverbindung in der Sprachgemeinschaft wie ein Lexem gebräuchlich ist." (Burger et al. 1982:1)
Bereits 1973 nimmt Burger eine an der Inhaltsseite der Phraseologismen orientierte Betrachtung des phraseologischen Phänomenbereichs vor, die er allerdings nicht als Klassifikation, sondern als semantische Deutung verstanden wissen will. Ausgangspunkt der semantischen Betrachtungen Burgers ist der "Normalfall" der Bedeutungsbildung durch einen regulären, semantischen Kompositionsprozeß, der eine Vereinigung semantischer Merkmalkomplexe - im Sinne von Kapitel 1 - darstellt. Diese Art der Bedeutungsbildung bezeichnet Burger daher als regulär-kompositionell (vgl. Burger 1973:llf). In diesem Sinne ist nach Burger auch die Selektion einer konventionalisierten übertragenen Bedeutung eines Lexems als normaler semantischer Prozeß in einer bestimmten Konstruktion zu verstehen, da die übertragene Bedeutung in diesem Fall ins Lexikon gehört und nach gewöhnlichen semantischen Regeln selektiert wird. Ein Beispiel dafür ist der Gebrauch des Verbs kochen in der Bedeutung "wütend sein". Diesen lexikalisierten, übertragenen Gebrauch eines Lexems bezeichnet Burger als figurativ und grenzt diesen deutlich von der Metapher ab, die ein Lexem oder eine Lexemkette ist, die erst aus dem Kontext heraus entsteht (vgl. Burger 1973:13). Sie gehört aufgrund ihres ephemeren Charakters nicht ins Lexikon und wird nicht erlernt. Der von Burger aufgezeigte figurative Gebrauch eines Lexems wird aufgrund der zugrunde liegenden Konventionalisierung auch als konventionelle Metapher bezeichnet. Die nicht konventionalisierte Metapher wird dagegen auch kreative Metapher genannt (vgl. Kallmeyer 1986:174ff). Die bisher genannten Möglichkeiten der Bedeutungsbildung - also die regulär kompositioneile Bedeutungsbildung bei einfachen Wortverbindungen, bei konventionellen Metaphern und bei kreativen Metaphern, stehen für Burger außerhalb phraseologischer Betrachtungen. Burgers "semantische Deutung" des phraseologischen Bereichs wird in Abb. 2. graphisch umgesetzt. Innerhalb des Bereichs der phraseologischen Phänomene differenziert Burger zwischen der Gruppe der idiomatisch-phraseologischen Wortverbindungen, "deren Gesamtbedeutung nicht regulär interpretierbar ist", und der Gruppe der "nur"phraseologischen Wortverbindungen, die "an der Grenze der semantischen Regularitäten" anzusiedeln sind (vgl. Burger 1973: lOff). Die Idiomatik kann demnach als Teildisziplin der Phraseologie und Idiome als Teilgruppe der Phraseologismen betrachtet werden. Die Gruppe der nicht-idiomatischen Phraseologismen ist in etwa vergleichbar mit der Gruppe der Nominationsstereotype von Fleischer. Am Beispiel kalter Krieg erläutert Burger, daß man bei der Bedeutungsbildung in einen Grenzbereich der semantischen Regularitäten gelangt. In diesem Fall wird eine nicht vorhersagbare Bedeutung des Lexems kalt durch Kombination mit dem Lexem Krieg, das seine auch sonst übliche Bedeutung aufweist, selektiert (vgl. Burger 1973:14).
17
nicht-lexikalisiert
f V
kreative Metaphern
lexikalisiert
N. )
nicht-idiomatische
Phraseologismen Idiome
im weiteren Sinne
konventionelle Metaphern
Idiome
nicht-nachvollziehbare bildliche Übertragung
nachvollziehbare bildliche Übertragung idiomatische Phraseologismen
Abb. 2. Semantiche Einteilung des phraseologischen Bereichs von Burger 1973
Die Gruppe der idiomatischen Phraseologismen unterteilt Burger in die Idiome im weiteren Sinne einerseits und die Idiome im engeren Sinne andererseits, wobei Burger als Differenzierungskriterium die Nachvollziehbarkeit der übertragenen Bedeutung wählt. Während bei den Idiomen im weiteren Sinne wie beispielsweise sich in die Nesseln setzen, sich ins gemachte Bett legen, bei Wasser und Brot, mit Müh' und Not, etc. die Übertragung auf eine figurative Ebene noch im gewissen Sinne nachvollziehbar ist, ist die Gesamtbedeutung bei Idiomen im engeren Sinne, wozu Burger zum Beispiel das Idiom einen Narren an jemanden gefressen haben zählt, in keinster Weise aus den einzelnen Komponenten erschließbar (vgl. Burger 1973:18). Zur Charakterisierung der Nachvollziehbarkeit bzw. Verstehbarkeit der phraseologischen Gesamtbedeutung aus der Bedeutimg der Elemente, führt Burger den Begriff der Motiviertheit in die Literatur ein. Ist die Gesamtbedeutung einer Wortverbindung nicht aus den Komponenten verstehbar bzw. ableitbar wie bei den Idiomen im engeren Sinne, werden sie als unmotivierte Wortverbindungen bezeichnet. Idiome im weiteren Sinne werden von Burger als abgeschwächt motivierte Wortverbindungen betrachtet und völlig motivierte Wortverbindungen sind nicht idiomatisch. Der Grad der Motiviertheit verhält sich demnach umgekehrt proportional zum Idiomatizitätzgrad: "Je schwächer motiviert eine Wortkette ist, umso stärker idiomatisch ist sie" (Burger 1973:26). Auf die genannten semantischen Aspekte gehe ich sowohl in Kapitel 3 als auch in Kapitel 5 noch differenzierter ein.
18 2.1.3
Gegenstand der vorliegenden Arbeit
Nachdem stellvertretend für eine Vielzahl weiterer Ansätze anhand der Arbeiten von Burger und Fleischer eine Übersicht über den Bereich phraseologischer Phänomene gegeben wurde, möchte ich nun den Gegenstandsbereich der vorliegenden Arbeit anhand der vorgestellten Modelle definieren. Im Sinne Fleischers beschränke ich mich auf teil- und vollidiomatische verbale Phraseolexeme wie einen Streit vom Zaun brechen oder jmdm. einen Bären aufbinden und festgeprägte prädikative Konstruktionen der Ari jmdm. raucht der Kopf. Im Sinne Burgers befasse ich mich mit Idiomen im weiteren und engeren Sinne. Der hier behandelte Gegenstandsbereich wird in Abb. 1. und Abb. 2. jeweils grau hervorgehoben. Im folgenden werde ich für diesen Bereich sowohl die Begriffe (verbaler) Phraseologismus bzw. (verbales) Phraseolexem als auch (verbales) Idiom synonym verwenden. Im Zusammenhang mit den generativen Ansätzen in Kapitel 3 und Kapitel 5 verwende ich auch den Begriff polylexikalisches Idiom in diesem Sinne und beziehe mich bis auf explizit genannte Ausnahmen mit diesem Begriff auf den Bereich der verbalen Phraseologismen.
2.2 Stabilitätsphänomene Ein zentrales Kennzeichen des phraseologischen Sprachgebrauchs ist die außergewöhnliche Stabilität von Phraseologismen, eine Erscheinung, die sich in der Festigkeit der syntaktischen Struktur, des lexikalischen Komponentenbestandes und der Bedeutung des Phraseologismus manifestiert. Die Festigkeit zeigt sich insbesondere darin, daß die Veränderung der syntaktischen Struktur oder des lexikalischen Komponentenbestandes mit Einschränkungen zum Verlust der phraseologischen Lesart einer Wortgruppe führt und der ursprüngliche Phraseologismus in der modifizierten Form nur noch wörtlich oder überhaupt nicht verstanden werden kann. Als weitere Aspekte der Stabilität werden die unikalen Komponenten, Anomalien in der syntaktischen Oberfläche und transformationeile Defektivität betrachtet. Im folgenden sollen die wesentlichsten syntaktischen Restriktionen, denen die verschiedenen Phraseologismen unterliegen, im Überblick aufgezeigt werden. Ebenso wie Burger setze ich bei den folgenden Grammatikalitätsbetrachtungen voraus, daß die Phraseologismen in stilistisch nicht markierten Kontexten verwendet sind. "Sobald Idiome mit bestimmten stilistischen Intentionen [...] eingesetzt werden, lassen sich grundsätzlich sämtliche Restriktionen funktionaler und transformationeller Art durchbrechen" hält Burger (1973:75) fest. Hierauf komme ich in Kapitel 4.2.2.3 genauer zurück. 2.2.1
Lexikalische Substitution
Ein wesentlicher Aspekt der Festigkeit von Phraseologismen zeigt sich darin, daß in vielen Fällen der Austausch einer zum festen Bestandteil des Phraseologismus gehörenden Konstituente durch eine semantisch verwandte zur Auflösung der phraseologischen Lesart und zum wörtlichen Verstehen der Wortverbindung führt. In einigen Fällen ergibt sich ein absurder Inhalt.
19 Im nicht-phraseologischen Sprachgebrauch ändert sich bei der Substitution eines lexikalisches Elementes gewöhnlich die Bedeutung des Gesamtsatzes um die Bedeutung des substituierten Elementes. In den Sätzen ( l l a ) - ( l l d ) können beispielsweise die Komponenten Auto und Motorrad bzw. haben und stellen ausgetauscht werden, ohne daß sich für die anderen Elemente des Satzes daraus eine semantische Konsequenz ergibt. (IIa) (IIb) (11c) (lld)
Ute hat bei ihren Eltern ein Auto in der Garage. Ute hat bei ihren Eltern ein Motorrad in der Garage. Ute stellt bei ihren Eltern ein Auto in die Garage, Ute hat bei ihren Eltern das Auto in der Garage.
In dem Phraseologismus "bei jmdm. einen Stein im Brett haben" hat der Austausch des lexikalischen Materials tiefgreifendere Konsequenzen für die Gesamtbedeutimg der Wendung, wie die folgenden Beispiele zeigen. (12a) (12b) (12c) (12d)
Ute hat bei ihrer Chefin einen Stein im Brett. *Ute hat bei ihrer Chefin einen Kiesel im Brett *Ute xoirft bei ihrer Chefin einen Stein ins Brett. *Ute hat bei ihrer Chefin den Stein im Brett.
Fleischer bezeichnet diese Eigenschaft von Phraseologismen als lexikalisch-semantische Stabilität. Nicht nur die lexikalischen Wörter, sondern auch die grammatischen Wörter wie beispielsweise Artikel sind bei einigen Phraseologismen von der eingeschränkten Substituierbarkeit betroffen. 2.2.2
Unikale Komponenten
Als einen weiteren Aspekt der Stabilität können die in einigen Phraseologismen auftretenden lexikalischen und morphologisch-flexivischen Anomalien gewertet werden. Bei der Anomalie auf lexikalischer Ebene handelt es sich um das Auftreten phraseologisch-gebundener Wörter, deren Formative außerhalb von Phraseologismen nicht bzw. nicht mehr vorkommen (vgl. Dobrovol'skij 1978), wie in den Beispielen (13M15). (13) Monika gibt Klaus den Laufpaß. (14) Wir liegen schon lange auf der Lauer. (15) Ich werde ihm wieder mal ein Schnippchen schlagen. Der Begriff morphologisch-flexivische Anomalie deutet daraufhin, daß innerhalb von Phraseologismen Komponenten auftreten können, die im innerphraseologischen Kontext in einer ungewöhnlichen Wortform erscheinen. In diesem Fall ist also im Gegensatz zur lexikalischen Anomalie nicht das Auftreten eines bestimmten Wortes, sondern das Vorkommen einer bestimmten Wortform - wie in (16)-(17) an den Phraseologismus gebunden.
2
Der Asteriskus (*) deutet an, daß die betreffende Wendung im Beispielsatz nicht mehr phraseologisch, d.h. unter Beibehaltung der phraseologischen Lesart - interpretiert werden kann.
20 (16) Er sollte darum nicht so viel Aufhebens machen. (17) Ein Pensionär hat den Himmel auf Erden. Fleischer faßt die in Phraseologismen auftretenden Wörter und Wortformen, die selbst eine lexikalische Anomalie darstellen oder die eine morphologisch-flexivische Anomalie aufweisen, unter dem Begriff unikale Komponente zusammen, mit dem auch im folgenden dieses Phänomen bezeichnet werden soll. In der englischsprachigen Literatur findet sich für das gleiche Phänomen der Begriff " cranberry-morph". In bezug auf den Begriff der Unikalität sind allerdings zwei Bemerkungen zu machen. Zum einen bezieht sich die Unikalität phraseologisch-gebundener Formative nicht auf einen einzigen phraseologischen Kontext, da es durchaus möglich ist, daß ein und dieselbe unikale Komponente in unterschiedlichen phraseologischen Kontexten auftritt wie beispielsweise bei in die Irre gehen/locken/fiihren. Zum anderen ist es der Fall, daß einige phraseologisch-gebundene Konstituenten entgegen ihrer Charakterisierung als "unikal" und "nur im Verband des Phraseologismus vorkommend", durchaus eine formale Entsprechung im freien Gebrauch haben. Allerdings stellen die phraseologisch-gebundenen Konstituenten mit Entsprechungen zu frei vorkommenden Wörtern dann entweder phraseologisch-gebundene Homonyme, phraseologischgebundene Polyseme oder unterschiedliche Arten von Entlehnungen aus anderen speziellen Bereichen der Sprache dar, deren Kenntnis ein ganz besonderes Wissen erfordert. Zur Erläuterung der letzten beiden Punkte seien hier die folgenden Beispiele angegeben: (18a) (18b) (18c) (18d) (18e)
Ich werde ihm die Hucke voll hauen. Der kriegt die Hucke voll. Sie hat mir die Hucke voll gelogen. Er lachte sich die Hucke voll. Wir werden uns die Hucke voll saufen.
Die Wendungen (18a)-(18e) schließen nach Drosdowski (1992) alle an Hucke im Sinne von "Rücken, Buckel" an - wie es sich beispielsweise im Kompositum Huckepack wiederfindet -, das aber in diesem Sinne nicht mehr frei verwendet wird. Zur Wendung in (18e) ist man in Drosdowski (1992) nicht ganz sicher und erwägt, daß die Verwendung von Hucke hier entweder auch an Hucke im Sinne von "Rücken, Buckel" anschließt oder im Sinne von "Tragkorb, Kiepe" und das meint "so viel trinken, daß man sich nur mit Mühe erheben kann und schwer daran zu tragen hat" (vgl. Drosdowski 1992:353). Drei Gegebenheiten werden an diesem Beispiel deutlich. Erstens, es erfordert Spezialwissen, die Bedeutung der Komponente Hucke zu erläutern, zweitens, die Komponente Hucke kommt im obigen Sinne nicht frei vor, drittens, sie tritt in verschiedenen phraseologischen Kontexten auf.3 Phraseologisch-gebundene Konstituenten lassen sich unter den verschiedensten Aspekten klassifizieren. Die Möglichkeiten reichen von der Beschreibung ihrer Etymologie über morphologische Kriterien bis hin zu ihrer Bedeutung für den phraseologischen Kontext (vgl. Dobrovol'skij 1989, Feyaerts 1990). Die Vorstellung dieser Klassifikationen führt allerdings für die Ziele der vorliegenden Arbeit zu weit. 3
Mir ist zudem ein - scheinbar regional beschränktes - umgangsprachliches Homonym von Hucke in der Bedeutung von "kleine Wohnung" bekannt. Trotzdem kann dieses Lexem als phraseologisch-gebundenes Wort gelten.
21 2.2.3
Syntaktische
Anomalien
Unter den Begriff syntaktische Anomalien möchte ich mit Fleischer sowohl die von Burger als "Oberflächenanomalien" bezeichneten ungewöhnlichen Konstruktionen an der syntaktischen Oberflächenstruktur einiger Phraseologismen verstehen, als auch die große Gruppe eingeschränkter Umformungsmöglichkeiten, die vor allem in der generativen Literatur häufig diskutiert wurden und deren Bezeichnung als transformationelle Defektivität auf Weinreich zurückgeht. 2.2.3.1
Anomalien an der syntaktischen Oberfläche
Die syntaktisch-anomalen Konstruktionen an der syntaktischen Oberfläche sind an einzelne Phraseologismen gebunden. Syntaktisch-anomal sind diese Phraseologismen deshalb, weil ihre Komponenten in einer ungewöhnlichen Kombinatorik erscheinen, die in nicht-phraseologischen Wortverbindungen nicht frei produziert werden, wie die Beispiele (19)-(27) zeigen. In der generativen Literatur werden diese Oberflächenanomalien auch als kategorielle Anomalien bezeichnet. Ebenso wie bei den unikalen Komponenten handelt es sich in diesem Fall um offensichtliche Anomalien, die bereits an der syntaktischen Oberfläche des Phraseologismus erkennbar sind und somit unmittelbar auf den idiomatischen Charakter der Wortgruppe hindeuten (vgl. Burger 1973:75). (19) (20) (21) (22) (23) (24) (25) (26) (27)
Mit unserem neuen Mitarbeiter ist nicht gut Kirschen essen. Er wird mich Lügen strafen. Die Sache steht noch auf des Messers Schneide. Die Klausur war gar nicht so ganz ohne. Nach der Betriebsfeier hatte der neue Mitarbeiter einen in der Krone. Wenn er nach Hause kommt, kriegt er eins aufs Dach. Sie haben Lunte gerochen und werden die Verschwörung aufdecken. Er war immer auf Draht und konnte alle Frage der Kunden beantworten. Er will sich beim Chef lieb Kind machen.
Bei den Anomalien handelt es sich zum Teil um ältere Konstruktionen, die im nichtphraseologischen Sprachgebrauch nicht mehr üblich sind, aber - wie es bei einigen unikalen Komponenten auch der Fall ist - im festen Verband der Phraseologismen bewahrt worden sind (vgl. Fleischer 1982:52). Zu den Anomalien an der syntaktischen Oberfläche zählen beispielsweise Rektionsanomalien (19)/(20), veraltete Genitivkonstruktionen (21), Anomalien im Gebrauch von Präpositionen (22) und Pronomina (23)/(24), Anomalien bei der Verwendung von Artikeln (25)/(26) und unflektierter Adjektivgebrauch (27). Es bleibt noch festzuhalten, daß Phraseologismen mit Oberflächenanomalien nur eine kleine Gruppe aller phraseologischen Ausdrücke ausmachen, während die meisten Phraseologismen an der Oberfläche wohlgeformt sind. Problematisch für die maschinelle Verarbeitung von Sprache ist im Zusammenhang mit diesen Konstruktionen, daß die zugrunde liegenden Regeln nicht aus den gewöhnlichen Regeln zur Konstruktion der syntaktischen Struktur abgeleitet werden können, die Strukturabhängigkeiten teilweise nicht erkennbar sind. Es stellt sich die Frage, wie diese Konstituenten im Lexikon abgebildet werden können und welche
22 Art von Strukturbaum den kategoriell defektiven Phraseologismen zuzuweisen ist. Es steht fest, daß die idiosynkratischen Eigenschaften von Phraseologismen bei einer formalen Erfassung im Lexikon berücksichtigt werden müssen. Darauf komme ich sowohl im folgenden Kapitel 3 als auch in Kapitel 7 zurück. Transformationelle Defekte Neben den aufgeführten offensichtlichen Oberflächenanomalien, welche nur eine kleine Gruppe von Phraseologismen aufweisen, bilden die Phraseologismen mit verschiedenen Arten transformationeller Defektivität die umfangreichste Gruppe von Anomalien. Diese Anomalien werden erst dann offensichtlich, wenn grammatische Umformungen, die zur Isolierung oder Fokussierung einer Komponente des Phraseologismus führen, wie beispielsweise Passiv-, Relativsatz-, und Fragesatztransformationen, auf Phraseologismen angewandt werden. Diese Strukturveränderungen können dazu führen, daß die phraseologische Lesart einer Wendimg nicht länger aufrecht erhalten bleibt. Vor allem die generative Literatur widmet sich der Beschreibung der transformationellen Beschränkungen von Phraseologismen, worauf ich in Kapitel 3 zurückkommen werde. Wie Burger richtig kritisiert, ist aber Chomskys syntaktisches Standardmodell nicht dazu geeignet, Begründungen für die verschiedenen transformationeilen Defekte eines Phraseologismus zu liefern, was sich Burger ansatzweise zu eigen macht. Seine Ausführungen richten sich auf die Frage, inwiefern sich transformationeile Defekte als Reflexe semantischer Gegebenheiten erklären lassen. Ich möchte im folgenden einen Überblick über die eingeschränkten Umformungsmöglichkeiten bei Phraseologismen geben. Eine ausführliche Erläuterung der Phänomene für das Deutsche findet sich u. a. in Burger (1973) und Fleischer (1982).
Passivtransformation Im Hinblick auf die Passivierbarkeit von Phraseologismen hat Burger folgende Regularitäten festgehalten: Phraseologismen, die ein Verb enthalten, das im freien Gebrauch nicht passivierbar ist, sind selbst nicht passivierbar (28). In den Fällen, in denen das Verb grundsätzlich passivierbar ist und das Akkusativobjekt nicht fester Bestandteil des Phraseologismus ist, ist die Passivtransformation meist möglich (29), allerdings nicht immer üblich (30). Eindeutig scheint die Passivierung von Phraseologismen zu sein, bei denen die Komponente im Akkusativ - obwohl sie fest zum Phraseologismus gehört - im wörtlichen Sinne zu verstehen ist (31). (28) (29) (30) (31)
*Von mir wurde bei ihr ein Stein im Brett gehabt. Die Gewerkschaft wurde über den Tisch gezogen. ?Von Steffi wurde Klaus auf die Palme gebracht. Der Streit wurde von einem Betrunkenen vom Zaun gebrochen.
Unterschiedlich scheinen sich in bezug auf Passivierbarkeit solche Phraseologismen zu verhalten, deren Akkusativobjekt fester Bestandteil des Phraseologismus ist und in die phraseologische Gesamtbedeutimg nicht im wörtlichen Sinne eingeht (32)-(35b).
23 (32) Mir wurde von Otto die Suppe versalzen. (33) ?Von Otto wurde der Vogel abgeschossen. (34) *Der Löffel wurde von ihm letzte Woche abgegeben. Burger führt die Beispiele (32) und (33) an, wobei er (33) als ungrammatikalisch kennzeichnet. Es sind allerdings durchaus stilistisch nicht-markierte Kontexte vorstellbar, in denen dieser Satz als grammatikalisch empfunden wird. Satz (34) dagegen dient als Beispiel, das aufgrund der Passivierung nicht mit der phraseologischen Lesart verbunden wird. Burger vermutet, daß "semantische Gründe für die Beschränkungen verantwortlich sind. Welches diese Gründe im einzelnen sind, ist momentan noch nicht erforscht" (vgl. Burger 1973:82). Eine Erläuterung liefert Burger für die häufiger mögliche Bildung des unpersönlichen Passivs mit Hilfe des Pronomen es. Bei dieser Art der Passivierung wird vermieden, daß die Konstituenten des Phraseologismus, die insgesamt die Bedeutung bilden, auseinandergerissen werden, wie im folgenden Beispiel gezeigt: (35a) Es wurde endlich Fraktur geredet. (35b) *Fraktur ist diesmal nicht geredet worden. Laut Burger widerspricht die Passivierung in (35b) der Unteilbarkeit der Bedeutung des Phraseologismus, da sich die unteilbare Gesamtbedeutung eines Phraseologismus nicht im Sinne der funktionalen Satzperspektive in alte und neue Information aufspalten läßt. Dieser Zusammenhang würde auch erklären, warum Passivierung eines Phraseologismus mit einem Akkusativobjekt, das nicht Bestandteil des Phraseologismus ist, wie in (29)-(31) unproblematisch ist. Fleischer führt als Gegenbeispiel zu Burgers Beispielsatz in (33) den Satz (36) an: (36) Der Vogel wurde diesmal von Otto abgeschossen. Burgers Erläuterung im Hinblick auf die "Unteilbarkeit der Bedeutimg des Idioms" kann hier zwar nicht als Erklärung gelten, aber Fleischer macht gar nicht erst einen Erklärungsversuch. Für ihn sind die Beschränkungen "letztlich eine Konsequenz der Idiomatizität", wobei er davon ausgeht, daß Transformationsbeschränkungen von Phraseologismen "noch gründlicher Untersuchung" bedürfen, "damit die Gesetzmässigkeiten aufgedeckt werden können" (vgl. Fleischer 1982:54).
Relativsatztransformation Einen entscheidenden Eingriff in die Struktur des Phraseologismus stellt neben der Umformimg zum Passiv die Abtrennung eines Nominalteils einer Verbalphrase durch eine Relativsatzkonstruktion dar. In Burger 1973 wird angenommen, daß eine solche Abtrennung wie (37)-(39) nur in stilistisch markierten Kontexten vorkomme. (37) *Der Leim, auf den er ihr gegangen ist, spielt nun keine Rolle mehr. (38) *das Ohr, über das er mich gehauen hat (39) *der Ast, den er sich gelacht hat Fleischer bringt die beiden folgenden Beispiele in die Diskussion und stellt daran fest, daß - wenn die Konstruktion ein nichtphraseologisches Homonym hat, also auch im
24 literalen Sinn verstehbar ist - "der phraseologische Charakter durch den Einschub des Relativsatzes nicht aufgehoben" wird (vgl. Fleischer 1982:55) (40) Du hast gestern einen Bock geschossen, der nicht so leicht vergessen wird. (41) Der Korb, den sie mir gegeben hat, macht mir keine weiteren Probleme. Damit trifft Fleischer zwar eine Feststellung, eine Erklärung für dieses Verhalten liefert er allerdings nicht. Burger hält 1982 nicht länger daran fest, daß Relativsatzkonstruktionen nur in stilistisch markierten Kontexten auftreten können und zieht dies nur noch für die Fälle in Betracht, in denen die Elemente des Phraseologismus keinerlei (auch nicht nachvollziehbar metaphorische) Eigenbedeutung haben. Er erläutert weiter, daß durch Abtrennung der phraseologische Sinn vor allem dann nicht zerstört wird, "wenn der Nominalteil eine gewisse semantische Autonomie hat, wenn er z.B. als Metapher auch in anderen Kontexten gelegentlich anzutreffen ist" (Burger et al. 1982:77). Betrachtet man allerdings die Beispiele (40) und (41), ist festzustellen, daß es sich weder bei Bock noch bei Korb um eine frei vorkommende Metapher handelt. Es stellt sich demnach die Frage, welche andere Art der (metaphorisch nicht nachvollziehbaren) semantischen Autonomie Burger meint. Auf diese Problematik komme ich in Kapitel 5 ausführlich zurück. Fragesatztransformation Umformungen zu Fragesatztypen, die nicht zur Fokussierung einer Komponente des Phraseologismus führen, sind im Grunde auf alle Phraseologismen anwendbar wie in (42)-(44). Die Umformung zu Entscheidungsfragen sind im allgemeinen möglich, allerdings müssen hier bestimmte kommunikative Formeln ausgenommen werden, ebenso wie Phraseologismen, die in ihrer Verwendung auf die erste Person Singular wie bei ich fresse einen Besen (, wenn ...) in (45) beschränkt sind. (42) (43) (44) (45)
Wer hat bei ihm einen Stein im Brett? Warum hat sie bei ihm einen Stein im Brett? Hat sie bei ihm einen Stein im Brett? 'Hast Du einen Besen gefressen?
Fragesatztransformationen, die zur Isolierung bzw. Fokussierung eines Bestandteils des Phraseologismus führen, sind häufig problematisch, da sie zur Auflösung der phraseologischen Lesart oder zur Absurdität führen wie in (46)-(48). Dies gilt auch für den Fall, wenn eine Komponente, die fester Bestandteil des Phraseologismus ist, erfragt und damit als Antwort erwartet wird wie in (48). (46) * Welchen Stein hat sie bei ihrem Lehrer im Brett? (47) *Von welchem Zaun hat sie einen Streit gebrochen? (48) *Was habt ihr ihm aufgebunden? - Einen Bären. Daß die Isolierung einer Konstituente in einigen Fällen doch möglich ist, zeigen die folgenden Beispiele: (49) Was für einen Bären hat sie dir diesmal aufgebunden ? (50) In welches Fettnäpfchen ist er nun schon wieder getreten?
25 Ebenso wie für die Umformung zum Passiv- bzw. Relativsatz besteht auch hier ein Erklärungsbedarf.
Nominalisierung Nominalisierung von verbalen Phraseologismen ist in bezug auf das Englische innerhalb der generativen Literatur diskutiert worden. Im Hinblick auf die Nominalisierung des verbalen Idioms kick the bucket werden die Nominalisierungsarten "Sam's kicking of the bucket" und "Sam's kicking the bucket" unterschieden. Nach Chafe gibt es zur ersten Konstruktion nur eine wörtliche Lesart, während bei letzterer Konstruktion auch die idiomatische Lesart möglich ist, was sich dadurch erklären läßt, daß bei der ersten Konstruktion ein Verb nominalisiert wird, das allein keine Bedeutung trägt, während im zweiten Fall der Verbalkomplex, der als Gesamtheit die idiomatische Bedeutung trägt, nominalisiert wird (vgl. Chafe 1968:122f.). Für das Deutsche hält Burger nur die Nominalisierung im Fall einwertiger Verben für unproblematisch wie beipielsweisejmd. hungert zu Hungern. Die Nominalisierung komplexerer Verbalkonstruktionen kann auf verschiedene Weise erfolgen wie Beispiel (51) zeigt. Die Nominalsierung verbaler Phraseologismen führt dagegen zu fragwürdigen Konstruktionen wie in (52) und (53). Von allen aufgeführten Varianten erscheint das Flinte-ins-Korn-werfen noch am akzeptabelsten. (51) Ute baut ein Haus: der Bau des Hauses durch Ute das Bauen des Hauses durch Ute der Hausbau durch Ute (52) Tom wirft die Flinte ins Korn: *Ein Wurf der Flinte ins Korn wird sich nachteilig auswirken. •Das Werfen der Flinte ins Korn wird sich nachteilig auswirken. ?Das Flinte-ins-Korn-Werfen wird sich nachteilig auswirken. (53) Klaus hat einen Bock geschossen. * der Bockschuß von Klaus * das Bockschießen von Klaus * der Schuß des Bockes durch Klaus * das Schießen des Bockes durch Klaus Da auch bei nicht-idiomatischen, mehrwertigen Verben die Arten der Nominalisierung nicht überall gleich akzeptabel sind, wie Beispiel (54) zeigt, betrachtet Burger die mögliche bzw. nicht mögliche Nominalisierung nicht als brauchbares Indiz für Idiomatizität für das Deutsche. (54) Das Mädchen liebt Musik: die Liebe des Mädchens zur Musik (Verbalabstraktum) *das Lieben der Musik durch das Mädchen *das die-Musik-lieben des Mädchens Obwohl auch bei freien Wortverbindungen nicht jede Art der Nominalisierung möglich bzw. üblich ist, liegt bei verbalen Phraseologismen eine noch weitgehendere Ein-
26 schränkung vor. Daher stellt Fleischer "die Forderung nach speziellen semantischen Bedingungen" (vgl. Fleischer 1982:58f).
Imperativsatz Die Bildung des Imperativ von Phraseologismen ist grundsätzlich nicht möglich bei Phraseologismen mit syntaktischer Anomalie wie in (55)-(56) sowie bei Phraseologismen, die funktional auf die 1. Person Singular eingeschränkt sind wie in (57) (vgl. Burger 1973:79f). (55) *Bekomme eins aufs Dach! (56) *Friß einen Narren an ihm!
(57) *Friß einen Besen!
(Valenzabweichung)
(Phraseologismus mit 1. Person Singular)
Auf pragmatische Gründe ist zurückzuführen, daß einige Phraseologismen zwar nicht sinnvoll in eine positive Variante des Imperativs, also in einen Befehl, umgeformt werden können, dafür aber als negativer Imperativ und damit als Warnung einen Sinn ergeben wie in (58a)-(59c). (58a) (58b) (59a) (59b) (59c)
*Mal den Teufel an die Wand! Mal den Teufel nicht an die Wand! *Schieb die Entscheidung auf die lange Bank! Schieb die Entscheidung ruhig auf die lange Bank! (ironisch) Schieb die Entscheidung nicht auf die lange Bank!
In der Bilanz seiner Betrachtungen zum Imperativ hält Burger fest, daß sich Phraseologismen hinsichtlich des Imperativs genau so verhalten, "wie es ihre Gesamtbedeutung erwarten ließe" (vgl. Burger 1973:80). Die Zulässigkeit des Imperativs hängt nicht von der spezifischen Struktur des Phraseologismus, sondern von allgemeinen semantischen Regularitäten ab.
Negation
Im Hinblick auf Negation sind zwei Betrachtungsweisen zu unterscheiden: Phraseologismen mit und Phraseologismen ohne lexikalisierter Negationskonstituente. Laut Fleischer sind grundsätzlich alle Phraseologismen negierbar, wobei allerdings unterschiedliche Konstituenten zur Negation herangezogen werden müssen. Obwohl sich feststellen läßt, daß Phraseologismen mit bestimmtem Artikel tendenziell zur Negierung mit nicht (60), solche mit unbestimmtem und Nullartikel zur Negierung durch kein (61)/(62) und Phraseologismen mit Präpositionalphrasen auch zur Negierung mit nicht (63) neigen, lassen sich diese Aussagen nicht grundsätzlich verallgemeinern, wie die Beispiele (64)-(66) zeigen (vgl. Fleischer 1982:95). (60) (61) (62) (63)
Sie setzt ihr (nicht) den Stuhl vor die Tür. Dir werde ich (feinen Bären aufbinden. Heute könnte ich (keine) Bäume ausreißen. Sie wird (nicht) ins Gras beißen.
27 (64) Er will (nichts Farbe bekennen. (65) Er ist (nicht) mit einem blauen Auge davon gekommen. (66) *Er ist mit keinem blauen Auge davon gekommen. In einigen Fällen sind auch beide Negationskonstituenten möglich wie in jmdm. nicht/keinen reinen Wein einschenken. Fleischer fordert auch im Hinblick auf Negation weitere Untersuchungen, die den "Bedingungszusammenhang" betreffen (vgl. Fleischer 1982:94). Von diesen Fällen sind die Phraseologismen zu unterscheiden, die eine obligatorische Negationskonstituente als festen Bestandteil des Phraseologismus aufweisen wie nicht alle Tassen im Schrank haben bzw. kein Blatt vor den Mund nehmen. Ein Wegfall der Negationskonstituente führt zu einem "pointierten Effekt", der eine Art "Widerruf" der originären Bedeutung des Phraseologismus darstellt, "eine emphatische Umkehrung der phraseologischen Bedeutung" (vgl. Burger et al. 1982:79).
Modifikation durch Hinzufügung sprachlichen Materials Dadurch daß Phraseologismen einen mehr oder minder festen Verband bilden, stellt sich die Frage, inwieweit es möglich ist, sie durch Hinzufügung sprachlichen Materials zu attributieren. Grundsätzlich lassen sich Phraseologismen extern modifizieren, d.h. verbale Phraseologismen können als Gesamtkomplex durch adverbiale Elemente attributiert werden wie in (67)-(69), "wobei die semantische Kompatibilität nicht immer mit der des freien Verbs - wie in (69) - übereinstimmen muß" (vgl. Fleischer 1982:57). Damit gelten in bezug auf die Gesamtbedeutung des Phraseologismus dieselben semantischen Regularitäten wie für einfache Verben. (67) Er hat beim Autorennen ins Gras gebissen. (68) Die Sache stand lange auf des Messers Schneide. (69) ?Tacitus hat genüßlich ins Gras gebissen. Im Gegensatz zu einer solchen externen Modifikation ist die interne Modifikation, also die Modifikation einer Komponente, die fester Bestandteil des Phraseologismus ist, eingeschränkt. Obwohl die Differenzierung zwischen interner und externer Modifikation nicht immer ganz unproblematisch ist - die Umformung zu einem Relativsatz, die oben gezeigt wird, kann beispielsweise sowohl als interne als auch als externe Modifikation betrachtet werden - ist die Attributierung von Nominalphrasen innerhalb verbaler Phraseologismen durch Adjektiv- und Genitivattribute bzw. deren Quantifizierung durchaus als interne Modifikation anzusehen. Expansion durch Adjektivattribut Eine mögliche Adjektivattributierung einer Nominalphrase des Phraseologismus ist zu unterscheiden von solchen Phraseologismen, deren Adjektivattribut obligatorischer Bestandteil der Nominalphrase ist wie in (vgl. Fleischer 1982:57). (70) Er mußte in den sauren Apfel beißen. (71) Sie wird ihr blaues Wunder erleben. (72) Er ist auf dem falschen Dampfer.
28 Adjektivattributierung kann zur literalen Lesart führen wie (73)-(75a) zeigen, was teilweise auf semantischer Seite einen absurden Sachverhalt nach sich zieht. In einigen Fällen bleibt allerdings die idiomatische Lesart erhalten wie (75b) zeigt, oder es werden sowohl literale als auch idiomatische Lesart gleichzeitig aktiviert, wie im Rahmen des Wort- und Sprachspiels gezeigt wird. (73) (74) (75a) (75b)
*Ich werde mich ein halbes Stündchen aufs rechte Ohr hauen. *Er hat ins feuchte Gras gebissen. *Er hat einen jungen Bock geschossen. Er hat einen großen Bock geschossen.
Expansion durch
Genitivattribute
Die Expansion einer Nominalphrase, die fester Bestandteil des Phraseologismus ist, durch Genitivattribute führt häufiger als bei Attributierung durch Adjektive zur literalen Lesart bzw. zur Absurdität wie in (75c)-(75e). In einigen Fällen scheint jedoch auch bei Hinzufügung eines Genitivattributs die idiomatische Lesart erhalten zu bleiben, wie (75f) zeigt. (75c) (75d) (75e) (75f)
*Er hat das Handtuch der Universität geworfen. *Er hat ins Gras der Grünflächen des Universitätsgeländes gebissen. 'Claudia hat den/einen Bock des Herzogs von Kent geschossen. Claudia hat den Bock des Tages geschossen.
Quantifizierung
Auch die Quantifizierung einer wendungsinterne Komponente führt in einigen Fällen zur Auflösung der phraseologischen Lesart wie in (76)-(78), in anderen Fällen zu deren Beibehaltung wie (79)-(81). (76) (77) (78) (79) (80) (81)
*Sie setzte ihr die Stühle vor die Tür. *Sie setzte ihr den Stuhl vor die Türen. *Er wirft die Handtücher. Er hat im Laufe seines Lebens schon einige Böcke geschossen. Den Studenten rauchte während der Klausur der Kopf. Den Studenten rauchten die Köpfe.
Der Frage, unter welchen Bedingungen Quantifizierung möglich ist, werde ich in Kapitel 5 nachgehen. 2.2.4 Bewertung der phraseologischen Besonderheiten
Wie sich gezeigt hat, ist das syntaktische Verhalten verbaler Phraseologismen bezüglich ihrer Eigenheiten nicht einheitlich. Nicht alle verbalen Phraseologismen weisen syntaktische Anomalien auf, zeichnen sich durch eine unikale Komponente aus oder verhalten sich bezüglich ihrer Transformations- und Modifikationsmöglichkeiten einheitlich wie an den verschiedenen Beispielen gezeigt wurde. Nicht alle Phraseologismen sind demnach gleich stabil.
29 Es ist mehrfach die Beschreibung dieses Phänomenbereichs und seiner eigentümlichen Eigenschaften versucht worden (vgl. u.a. Rothkegel 1973, Wotjak 1992). Inzwischen wird aber auch die Forderung nach Erklärung der unterschiedlichen Stabiltätsgrade laut, als Beispiel dafür sei folgendes Zitat gegeben: "Die unterschiedlichen Transformationsmöglichkeiten verschiedener Arten von Phraseologismen bedürfen allerdings noch gründlicherer Untersuchung, damit Gesetzmäßigkeiten aufgedeckt werden können. [...] Letzten Endes sind die Transformationsbeschränkungen eine Konsequenz der Idiomatizität (d.h. der semantischen Stabilität) sowie der lexikalischen und syntaktischen Stabilität der Phraseologismen." (Fleischer 1982:1)
Ich werde in Kapitel 4.2 noch zeigen, daß Stabilität mit einem gewissen Maß an Variabilität einhergeht. Vor allem im Rahmen des Wort- bzw. Sprachspiels gibt es kaum eine Veränderimg eines Phraseologismus, die in irgendeinem Kontext nicht möglich u n d sinnvoll ist. Selbst die Gruppe der äußerst stabilen Idiome im engeren Sinne können nicht von Modifikationen ausgenommen werden. Der semantische Effekt besteht in solchen Fällen darin, daß Modifikation einerseits Mehrdeutigkeit, andererseits Informationsüberlagerung und Informationsverdichtung bedeuten kann. Sprachspiel erzeugt meistens eine stilistische Markierung, so daß dieses auch als auffälliger Gebrauch bezeichnet wird. Insbesondere bei der maschinellen Verarbeitung natürlicher Sprache m u ß eine Reduzierung auf einen formal beschreibbaren Rahmen erfolgen. Wie in Kapitel 4 gezeigt wird, m u ß daher eine Ausgliederung des kreativ-wortspielerischen Gebrauchs von Phraseologismen erfolgen.
2.3 Zusammenfassung Ziel dieses Kapitels war es im wesentlichen, den Phänomenbereich der Phraseologismen vorzustellen und den in der vorliegenden Arbeit zugrunde liegenden Gegenstand festzulegen. Die Abgrenzimg des Phraseologischen nach außen ebenso wie die Vorstellung verschiedener phraseologischer Phänomene erfolgte anhand des Zentrum-Peripherie-Modells von Fleischer. Dabei wurden die in der Literatur üblichen allgemeinen Abgrenzungskriterien • Idiomatizität, • Stabilität, • Lexikalisierung und Reproduzierbarkeit vorgestellt. Die Klassifikation des Kernbereichs des Modells, also der Phraseolexeme, erfolgte auf der Grundlage syntaktischer Kriterien. Die in der Literatur üblichen semantischen Klassifikationskriterien wurden kurz anhand Burgers Einteilungen von 1973 und 1982 dargestellt. Dabei kamen
30 • Kompositionalität, • Motivierbarkeit und • Lexikalisierung zur Sprache. Die Idiome wurden - wie weitgehend in der Literatur üblich - als Teilgruppe der Phraseologismen betrachtet. Die Rolle des Begriffs der Idiomatizität innerhalb der generativen Literatur wird zum einen im folgenden Kapitel 3 erörtert, zum andern erfolgt eine kritische Auseinandersetzung mit dem Idiomatizitätsbegriff in Verbindung mit den Begriffen Kompositionalität und Motivierbarkeit in den ausführlichen semantischen Betrachtungen in Kapitel 5. Zuletzt ist eine ausführliche Betrachtung der phraseologischen Stabilitätsphänomene erfolgt, zu denen • eingeschränkte lexikalische Substituierbarkeit, • unikale Komponenten, • Anomalien an der syntaktischen Oberfläche und • transformationelle Defekte zählen. Die Erläuterung der Zulässigkeit und Nicht-Zulässigkeit verschiedener syntaktischer Operationen ist noch nicht endgültig geklärt. Im Rahmen der semantischen Betrachtungen in Kapitel 5 werden Erklärungsmöglichkeiten aufgezeigt.
3 Phraseologismen in klassischen generativen Grammatiktheorien Im vorliegenden Kapitel wird auf die Behandlung von Phraseologismen - im weiteren als Idiome bezeichnet - aus der Perspektive früher generativer Grammatiktheorien eingegangen. Diese Theorien haben zum einen den bereits in Kapitel 2 vorgestellten Begriff des Idioms bzw. der Idiomatizität stark geprägt und können zum anderen aus heutiger Sicht als die Anfänge der maschinellen Sprachverarbeitung betrachtet werden. Konzepte der generativen Grammatik, wie beispielsweise die Bereitstellung von Beschreibungsmitteln formaler und natürlicher Sprachen durch die Chomsky-Hierarchie, haben nicht nur die theoretische Linguistik und die heutige Computerlinguistik beeinflußt, sondern sind aktuelle Elemente der modernen Beschreibung formaler Sprachen (ζ. B. Programmiersprachen) im Bereich der Informatik. Gegen Ende der ersten und zu Anfang der zweiten Phase der Entwicklung der generativen Transformationsgrammatik (TG) sind verschiedene Aufsätze zur Behandlung von Idiomen im generativen Rahmen erschienen, wobei vor allem die Idiome im engeren Sinne im Mittelpunkt des Interesses standen. Einige Ergebnisse der Aufsätze von Katz und Postal (1963), Weinreich (1966), Fraser (1970), Katz (1973) und in Abgrenzung dazu Chafe (1968) sind bis heute in der Diskussion und fließen zum Teil auch in neuere Arbeiten zur formalen Repräsentation von Idiomen im Bereich der maschinellen Verarbeitung natürlicher Sprache ein. Da zudem einige grundsätzliche Probleme der formalen Repräsentation von Idiomen anhand der generativen Diskussion deutlich werden, möchte ich im folgenden die wesentlichen Züge dieser Idiomtheorien darlegen. Zuvor soll aber die Definition des Begriffs Idiom, die diesen Theorien zugrunde lag, vorgestellt und der Versuch Weinreichs aufgezeigt werden, die gängige Auffassung und Klassifikation von Idiomen formal darzustellen. Diese frühen generativen Idiomtheorien flössen teilweise in Rothkegels automatische Analyse fester Syntagmen ein, deren Funktionsweise kurz aufgezeigt wird. Abschließend erfolgt ein kurzer Überblick über den Status von Idiomen in späteren generativen Theorien.
3.1
Phrasenstrukturgrammatiken
Die Diskussion verschiedenster Struktureigenschaften von Sprache hat zu generativen Grammatikmodellen geführt, denen gemeinsam ist, daß sie alle über ein Phrasenstrukturregelsystem sowie über ein weiteres Regelsystem verfügen, daß Phänomene wie Inversion, Umwandlung in Passivsatz, Fragesatz usw. abbilden kann. Zu diesen generativen Theorien zählen u.a. Netzwerkgrammatiken wie Augmented Transition Networks (ATN), Transformationsgrammatiken wie die Syntactic Structures (SS), Standardtheorie (ST), die Erweiterte Standardtheorie (EST), die Rektions- und Bindungstheorie (GB) sowie Unifikationsgrammatiken wie u.a. Generalized Phrase Structure Grammar (GPSG), Head-Driven Phrase Structure Grammar (HPSG), Lexical-Functional Grammar (LFG) usw. Ziel all dieser Grammatiktheorien ist es, die notwendigen Struktureigenschaften natürlicher Sprachen zu erkennen und abzubilden. Diese bis heute in der Computerlinguistik wesentlichen und immer noch aktuellen Konzepte haben ihren Ursprung genommen in der Entwicklung der generativen Transformationsgrammatik
32 (TG) ausgehend von Chomsky (1957), deren wesentliche Kernelemente im folgenden kurz vorgestellt werden. Chomskys Ideen in der ersten Phase der Transformationsgrammatik sind syntaktischer Art. dieser Phase der TG kann von kontextfreien Phrasenstrukturregeln einerseits und obligatorischen Transformationen, die morphologische Prozesse wie beispielsweise Kongruenz regulieren, andererseits eine endliche Menge von einfachen bejahenden, aktiven Aussagesätzen, den sogenannten Kernsätzen, erzeugt werden. Diese bilden die Grundlage für die Anwendung fakultativer Transformationen, zu denen alle bedeutungsverändernden Transformationen wie Negation, Passiv usw. zählen. Auf diese Weise können prinzipiell mit Hilfe endlicher Mittel unendlich viele abgeleitete Sätze gebildet werden. In der zweiten Phase der Transformationsgrammatik ab 1965 wird die urspünglich syntaktische Theorie im Sinne einer umfassenden Sprachtheorie revidiert und erweitert. Die Idee der Unterscheidung von Kernsätzen und abgeleiteten Sätzen wird aufgegeben und durch Tiefen- und Oberflächenstrukturen ersetzt. Die Grammatik besteht nun aus einer generativen syntaktischen Komponente sowie den interpretativen semantischen und phonologischen Komponenten. In den Zeitraum der Entwicklung dieser beiden Phasen der Transformationgrammatik fiel die Veröffentlichung einer Reihe grundlegender Ideen zur Repräsentation von Idiomen innerhalb der generativen Grammatik. Die in diesen Arbeiten aufgeworfenen Fragestellungen sind zum Teil bis heute für den Bereich der Verarbeitung natürlicher Sprache relevant; die vorgeschlagenen Lösungsmechanismen werden auch heute noch im Bereich der Computerlinguistik diskutiert. Im folgenden wird der Versuch unternommen, das Problem der formalen Repräsentation von Idiomen in den Vordergund zu rücken und weniger die spezifischen Charakteristika der Transformationsgrammatik zu beleuchten. Die Gesetzmäßigkeiten einer natürlichen Sprache lassen sich nicht - wie man zunächst einmal naiv annehmen könnte - über lineare Abfolgen von Wörtern formulieren. Eine strukturunabhängige Regel, die lautet "das zweite Wort in einem Aussagesatz des Deutschen ist das flektierte Verb", besitzt keine Allgemeingültigkeit. Faßt man allerdings bestimmte Wörter zu Wortgruppen zusammen und bildet somit eine Phrase bzw. Konstituente, läßt sich die allgemeingültige Regel formulieren: "Die zweite Konstituente in einem Aussagesatz des Deutschen ist das flektierte Verb". Dieses Strukturprinzip setzt sich auf der phrasalen Ebene fort, indem nicht nur Sätze als Ganzes eine interne Struktur aufweisen, sondern auch die Phrasen selbst eine identifizierbare syntaktische Struktur besitzen, innerhalb derer neben lexikalischen Kategorien weitere syntaktische Phrasen auftreten können. Natürliche Sprachen scheinen somit auf zwei Ebenen organisiert zu sein: Auf der lexikalischen Ebene, also der Ebene der Wörter, die von Chomsky mit den traditionellen Kategorien wie Nomina (N), intransitive (IV) und transitive Verben (TV), Hilfsverben (AUXiliary), Artikel (DETerminer) belegt werden, und auf der phrasalen Ebene, wo Beschreibungseinheiten wie Nominalphrasen (NP), Verbalphrasen (VP), Präpositionalphrasen (PP) usw. eine entscheidende Rolle spielen. Strukturabhängigkeiten von sprachlichen Ausdrücken werden ausgehend von Chomsky durch kontextfreie Phrasenstrukturregeln spezifiziert:
33 S^NP VP S ΝΡ AUX VP VP^IV VP —> TV ΝΡ NP Det Ν NP Det Ν PP Ρ Ρ Ρ ΝΡ Eine solche Grammatik spezifiziert nun noch keine konkreten Sätze, sondern nur abstrakte Strukturen. Um tatsächliche Sätze zu generieren, ist es notwendig, die generierte Kette präterminaler Symbole, wie beispielsweise "Det Ν TV Det N", durch konkrete Lexeme zu ersetzen. Dazu werden lexikalische Einsetzungsregeln, auch kurz als Lexikonregeln bezeichnet, benötigt. Ν —» Studentin, Student, Buch V liest, schreibt Det —> ein, einer, eine, der, die, das Damit wäre aus der präterminalen Kette "Det Ν TV Det N" bespielsweise der Satz "Die Studentin liest ein Buch" ableitbar. Die Strukturbeziehung innerhalb eines Satzes oder einer Phrase wird in der generativen Theorie durch die in Abb. 3. gezeigten graphischen Mittel des Baumdiagramms oder der indizierte Klammerstrukturen verdeutlicht.
[sfNpbet die]ÌN Studentin]][yp[w liest [Np[Det ein][N Buch]]] Abb. 3. Phrasenstruktur als Baum und indizierte KJammerstruktur
Ab der zweiten Phase der TG können die Phrasenstrukturregeln einen Rekursionsmechanismus enthalten. Dies bedeutet, daß die Anwendung der Regeln zu Schleifen führen kann, da die Regeln so konstruiert sein können, daß sie theoretisch endlos auf
34 schon zuvor aufgerufene Regeln zugreifen. Betrachtet man die letzten beiden Regeln der oben aufgeführten Beispielgrammatik, so zeigt sich, daß eine Nominalphrase aus einem Artikel, einem Nomen und einer Präpositionalphrase bestehen kann, wobei letztere sich aus einer Präposition und einer Nominalphrase zusammensetzt, die wiederum aus einem Artikel, einem Nomen und einer Präpositionalphrase usw. bestehen kann. Aus der rekursiven Eigenschaft natürlichsprachlicher Grammatiken folgt auf der einen Seite, daß die Länge eines Satzes prinzipiell nicht beschränkt ist, auf der anderen Seite, daß die Anzahl der in einer Sprache möglichen Sätze unbegrenzt groß ist. Es können demnach Sprachstrukturen generiert werden, wie sie in Satz (82) beispielhaft gezeigt werden: (82) In der Schweiz an der Uni vor der Tür an der Mensa über der Klinge... hängt ein großes, blaues, unleserliches... Schild. Zusammenfassend sei hier die formale Definition einer kontextfreien ChomskyGrammatik gegeben: Eine kontextfreie Chomsky-Grammatik ist ein Viertupel G = (Ν,Τ,Ρ,S), wobei • Ν die Menge der nichtterminalen Symbole bezeichnet, • Τ die Menge der terminalen Symbole bezeichnet, • Ρ eine endliche Menge von Produktionen der Forma a e Ν und β e (Τ u Ν)* ist und
β mit
• S Β Ν das ausgezeichnete nichtterminale Startsymbol ist. Wie bereits oben erwähnt, wird in der zweiten Phase die ursprünglich syntaktische Theorie zu einer allgemeinen Grammatiktheorie erweitert, in die auch Phonologie und Semantik einbezogen sind. Grundlage der Syntax ist die durch rekursive, kontextfreie Phrasenstrukturregeln und Lexikonregeln erzeugte Tiefenstruktur, die als abstrakte zugrunde liegende Strukturebene alle semantisch relevanten Informationen enthält und die Ausgangsebene für die semantische Interpretation von Sätzen ist. Bedeutungsneutrale Transformationen wie Tilgung oder Umstellung überführen die durch Phrasenstrukturregeln erzeugten Strukturbäume der Tiefenstruktur in abgeleitete Strukturbäume der Oberflächenstruktur. Transformationsregeln unterscheiden sich von Phrasenstrukturregeln dadurch, daß ihr Operationsbereich Phrasenstrukturbäume sind, die sie verändern. Die Oberflächenstrukturen bilden schließlich die Basis für die phonologisch-phonemische Repräsentation.
3.2 Idiome, Pseudo-Idiome und phraseologische Einheiten Bevor ich die ersten Versuche einer formalen Behandlung von idiomatischen Phraseologismen innerhalb der generativen Grammatiktheorie zusammenfassend erläutern möchte, soll im folgenden der Begriff des Idioms bzw. der Idiomatizität innerhalb der generativen Grammatikansätze noch einmal näher betrachtet werden, da die damalige Auffassung bis in die heutige Forschung auf den Begriff der Idiomatik Einfluß hat. Innerhalb der generativen Grammatiktheorie war und ist man auf der Suche nach einer Eigenschaft, die allen und nur Idiomen zukommt und die in Begrifflichkeiten ei-
35 ner formalen Struktur von Grammatiken gefaßt werden kann. D.h. man versucht teilweise bis heute, das Phänomen Idiom zu "grammatikalisieren" und formalisierbar zu machen bzw. Idiome als Indiz für gewisse Sprachstrukturen heranzuziehen. Als Resultat generativ-grammatischer Betrachtungen von Idiomen wird wiederholt festgehalten, daß Idiome eine Ausnahme der "normalen" sprachlichen Strukturen darstellen. So stellt Katz seinem Aufsatz zwei Hauptbedingungen der generativen Grammatiktheorien voran, die Vollständigkeitsbedingung1 und die Kompositionalitätsbedingung2 und betrachtet Idiome als eine Ausnahme von diesen Bedingungen: "Idioms are the 'exceptions that prove the rule': they do not get their meaning from the meaning of their syntactic parts. If an idiom is treated as if it were compositional, false predictions are made about its semantic properties and relations." (Katz 1973:358)
Auch Fraser geht davon aus, daß die Bedeutung eines Idioms nicht durch eine gewöhnliche kompositioneile Funktion zusammengesetzt wird: "I shall regard an idiom as a constituent or series of constituents for which the semantic interpretation is not a compositional function of the formatives of which it is composed." (Fraser 1970:22)
Den hier vorgestellten Idiom-Definitionen ist gemeinsam, daß sie sich nicht nur auf polylexikalische Einheiten, die hier phrasale Idiome genannt werden, beziehen, sondern auch lexikalische Einheiten in den Bereich der Idiomatik miteinbeziehen. Während Katz zwischen lexikalischen Idiomen wie den polymorphemischen Einheiten tele+phone und photo+graph und phrasalen Idiomen wie kick+the+bucket unterscheidet, weist Fraser darauf hin, daß seine Definition sogar auf monomorphemische Einheiten 3 wie sing, throw und book zutrifft. Da lexikalische Idiome - ganz anders als die polylexikalischen Idiome - für generative Grammatikansätze kein grundsätzliches Problem darstellen, da sie ebenso wie jede andere lexikalische Einheit aus dem Lexikon in die Grammatik eingefügt werden können, widmen sich auch die Generativisten überwiegend den polylexikalischen Idiomen. Weinreich unternimmt 1965 den Versuch, "mit einem gewissen Maß von formaler Repräsentation die gängige Auffassung von einem Idiom als einem komplexen Ausdruck darzustellen, dessen Bedeutung nicht von den Bedeutungen seiner Elemente abgeleitet werden kann" (Weinreich 1972:417)4. Der Versuch einer formalen Repräsentation bezieht sich sowohl auf lexikalische als auch auf polylexikalische Idiome und soll im folgenden vorgestellt werden. 1
2
3
Die Vollständigkeitsbedingung besagt, daß eine generative Grammatik jeder Konstituente eines Satzes sowie dem Satz selbst eine Menge von Bedeutungen (semantische Repräsentationen) zuweisen muß. Die Kompositionalitätsbedingung legt fest, daß für jede komplexe Konstituente eines Satzes, deren Bedeutung nicht-idiomatisch ist, die Menge der semantischen Repräsentationen, die dieser Konstituente zugewiesen wird, durch eine Funktion aus der Menge der semantischen Repräsentationen der Subkonstituenten und ihrer grammatischen Beziehungen gebildet wird. Die von der Vollständigkeitsbedingung geforderte Abbildung ist demnach nicht willkürlich, sondern soll die Beziehung zwischen der syntaktischen Struktur eines Satzes und der konzeptuellen Struktur der Sinneinheiten widerspiegeln. Damit folgt Fraser Hockett, der 1958 dieselbe Auffassung vertritt:"!·..] If we are to be consistent in our use of the definition, we are forced also to grant every morpheme idiomatic status, save when it is occuring as a constituent of a larger idiom, since a morpheme has no structure from which its meaning could be deduced."(Hockett 1958:172)
36 Morpheme als kleinste bedeutungstragende Einheiten der Sprache werden in Weinreichs Formalisierungsansatz durch Buchstabenpaare wie - und | symbolisiert, wobei die Großbuchstaben für eine Phonemfolge und die Kiembuchstaben für ihre Bedeutung stehen. In der folgenden Formel ergibt die Konstruktion von ^ und | eine Sequenz der Phoneme A und B, dargestellt durch das +-Zeichen über dem waagerechten Strich. Für die Bedeutungsbildung von a und b kann kaum dasselbe +-Zeichen verwendet werden, da die Bedeutung einer Kette von Morphemen kaum eine bloße Folge von Bedeutungsimpulsen ist, sondern die Gesamtbedeutimg einer Morphemkette eher durch eine Funktion der Einzelbedeutungen und deren grammatischen Beziehungen untereinander zustande kommt: A+B_ a b
A+B f¡(a, b)
(literale Konstruktion)
Auf ein Beispiel bezogen bedeutet das, daß die Phonemfolge - hier graphematisch ausgedrückt - Äpfel mit der Bedeutung Äpfel, und die Phonemfolge stehlen mit der Bedeutung stehlen zur Phonemfolge Äpfel stehlen und damit über die kompositioneile Funktion zur Bedeutimg Äpfel stehlen wird. Hier liegt nach Rotkegel eine symmetrische Relation der gegenseitigen Determination vor (vgl. Rothkegel 1973:24f).
Mit der folgenden Formel versucht Weinreich eine idiomatische Konstruktion wiederzugeben, ohne zu spezifizieren, auf welche besondere Weise sich die idiomatische Bedeutung χ von irgendeiner zu erwartenden Funktion der Bedeutungen c und d unterscheiden kann. C+ D _ C+ D c d χ
C+D f(c,d)
(idiomatische Konstruktion)
Im wesentlichen kann sich nach Weinreichs Auffassung die idiomatische Bedeutimg χ eines komplexen Ausdrucks von seiner literalen Bedeutung durch die folgenden beiden Möglichkeiten5 unterscheiden:
4
Weinreichs Aufsatz "Problems in the Analysis of Idioms" wurde 1965 in englischer Sprache veröffentlicht und erschien mit dem Titel "Probleme bei der Analyse von Idioms" 1972 in deutscher Übersetzung in Ferenc Kiefer (Hrsg.): "Semantik und generative Grammatik Π". Ich zitiere nach der deutschen Übersetzung.
37 1) Eine Komponente der resultierenden Gesamtbedeutung y ist verschieden von der zu erwartenden Komponente a: A+B χ
A+B
= 77—Π f ( y , b)
.
.
'Ày*a)
Als Beispiele hierfür kann das Idiom Bauklötze staunen oder einen Streit vom Zaun brechen betrachtet werden. Während das Verb staunen bzw. das Nomen Streit weitgehend in ihrem wörtlichen Sinn Anteil an der Gesamtbedeutung haben, ist dies für das Objekt Bauklötze bzw. die Komponenten vom Zaun und brechen nicht der Fall. In wörtlicher Lesart ergeben sich in diesen Beispielen absurde Bedeutungen. Von Rothkegel, die sich in ihrer semantischen Klassifikation weitgehend auf Weinreich stützt, wird diese Art von Idiomen später als endozentrisch determiniert bezeichnet, da die reguläre Bedeutung einer Komponente in die Gesamtkonstruktion eingeht, während die anderen Komponenten umgedeutet werden. Rothkegel erläutert diese Art der Determination an dem Beispiel blinder Passagier. Sie versteht die zugrunde liegende Relation als komplette Inklusion, da ae A ausschließlich Kontextpartner von be Β ist, d.h. das Lexem blind (A) in der Bedeutung "reiseunberechtigt" (a) ausschließlich Kontextpartner des Lexems Passagier (B) mit der Bedeutung "Passagier" (b) sein kann und daher die Bedeutung der Lexeme blinder Passagier (AB), die laut Rothkegel "reiseunberechtigter Passagier" (ab) ist, eine Teilklasse von Passagier Β ist (vgl. Rothkegel 1973:25f).
B(b) ^ A B ( a b ) ^
Abb. 5. Endozentrische Determination nach Rothkegel
2) Keine von beiden Komponenten liefert den erwarteten Beitrag von A und B: A+B
A+B f(y,z)
\(y*a,z*b)
Ein Beispiel für diese Art von Idiomen ist Staub aufwirbeln, dessen Bedeutung mit "Unruhe schaffen" umschrieben werden kann. Rothkegel bezeichnet diese Art von Bedeutungsbildung bei Idiomen als exozentrisch determiniert, da der referentielle Bezugspunkt außerhalb der Lexikonbedeutung beider Komponenten liegt. In diesem Fall 5
Weinreich deutet noch kurz eine dritte Möglichkeit "um der Vollständigkeit willen" an. Diese ist jedoch für die Literatur nicht so wesentlich wie die beiden hier gezeigten und wird von ihm nur knapp erläutert (vgl. Weinreich 1972:442). Daher entfällt auch in den oben aufgeführten Gleichungen der Index i bei f¡, die in Weinreichs Version der Gleichungen enthalten ist und der nur im Zusammenhang mit der dritten Möglichkeit eine Rolle spielt.
38 determiniert A ausschließlich Β und Β auschließlich A. Es entsteht eine neue Klasse C, was sie an den Beispielen kalte Ente und Kohldampf schieben erläutert, wobei ersteres eine Bezeichnung für eine Unterart von "Bowle" ist und letzteres "Hunger haben" bedeutet:
Abb. 6. Exozentrische Determination nach Rothkegel
Den Unterschied zwischen einer erwarteten, wörtlichen Bedeutung a und einer zustandegekommenen, phraseologischen Bedeutung y versucht Weinreich über eine sogenannte Komponentenanalyse explizit zu machen. Er geht davon aus, daß die Gesamtbedeutung durch mehrere Unterbedeutungen zustande kommt. Der Unterschied zwischen den erwarteten und den zustande gekommenen Konstituenten kann sich in der Unterdrückung, Hinzufügung oder Ersetzung einer oder mehrerer Bedeutungskomponenten festmachen, was Weinreich formal mit den folgenden Gleichungen ausdrückt. Schon bei Rothkegel wird allerdings dieses Verfahren hinsichtlich der a = /,(otj, a2, a 3 ) y =
/,(α,,α2)
y = f i ( a v α2, α3, α 4 ) y = /iCotj, α5, α 6 ) Anwendbarkeit auf Beispiele kritisiert, da allein die Festlegung der Merkmale eines Element wie blind in blinder Passagier "schwerfallen dürfte" (vgl. Rothkegel 1973:27f). Idiomatizität stellt sich bei Weinreich als extremes Beispiel von kontextueller semantischer Spezialisierung heraus. Daraus leitet Weinreich folgende terminologische Festlegungen ab: Eine phraseologische Einheit ist ein Ausdruck, in dem wenigstens eine Konstituente polysem ist und in dem eine Wahl einer Unterbedeutung durch den wörtlichen Kontext determiniert ist. Ein Idiom ist eine phraseologische Einheit, die wenigstens zwei polyseme Konstituenten umfaßt und in der eine reziproke kontextuelle Wahl von Unterbedeutungen stattfindet. Freie Konstruktionen sind Ausdrücke, die keine phraseologische Einheiten sind. Dabei bezieht Weinreich den Begriff phraseologische Einheit nur auf Phrasen, die mehrdeutig sind. Ausdrücke mit unikalen Komponenten oder Anomalien an der syntaktischen Oberfläche betrachtet er nicht als idiomatisch, sondern bezeichnet sie wie Makkai als Pseudo-Idiome, da ihnen das wesentliche Charakteristikum der Mehrdeutigkeit fehlt.
39
3.3 Zur Behandlung von Idiomen innerhalb der TG Zur Behandlung von Idiomen in der generativen Grammtiktheorie wurden verschiedene Ansätze vorgeschlagen und diskutiert. Die erste Möglichkeit besteht darin, das polylexikalische Idiom als ein einziges Mehrwortlexem zu betrachten, dem weder eine interne syntaktische noch eine semantische Struktur zugewiesen wird. Das Mehrwortlexem wird in diesem Fall nicht von der syntaktischen Basis durch Phrasenstrukturregeln generiert, sondern als ein komplexes Formativ in den Phrasenstrukturbaum eingesetzt. So können die Idiome den Vogel abschieß- oder das Handtuch werf- als Mehrwortlexem und damit im Lexikon als intransitives Verb betrachtet werden. Der Lexikoneintrag für das Mehrwortlexem den Vogel abschieß- könnte in diesem Fall folgendermaßen aussehen: den Vogel abschießen [phonologische Umschrift] [+V, + belebt , NP] "das Herausragendste tun" Die erste Zeile des Eintrags gibt den Eintrag mit seiner phonologischen Umschrift an. In der zweiten Zeile erfolgt die syntaktische Charakterisierung des Idioms als Verb durch [+V], das als Subjekt ein belebtes Nomen verlangt - angedeutet durch [+ belebt ] - und keine folgende Objektnominalphrase zuläßt, was durch [- _NP] gekennzeichnet wird. Der Unterstrich steht für die Position des Idioms im Hinblick auf die beschriebene Charakterisierung. 6 Damit wird in dieser Repräsentation das gesamte Idiom als intransitives Verb ohne Zuordnung einer syntaktischen Struktur behandelt. In der dritten Zeile werden mit Hilfe einer Paraphrase die semantischen Merkmale des Idioms angedeutet. Eine semantisch vergleichbare Paraphrase könnte laut Weinreich auch mit irgendeinem Ein-Wort-Synonym - falls in der Sprache vorhanden - wiedergegeben werden. Die Einsetzung eines solchen Mehrwortlexems in den Strukturbaum erfolgt - wie in Abb. 7. gezeigt - als komplexes Symbol.
Abb. 7. Einsetzung als komplexes Symbol in den Phrasenstrukturbaum
Vorteile der Behandlung polylexikalischer Idiome als komplexe Lautfolgen im Lexikon sehen die Generativisten darin, daß lexikalische und nicht-lexikalische Idiome gleich behandelt werden. Die kompositionelle Lesart ist dadurch ausgeschlossen, daß 6
Diese Markierung besitzt im Grunde nur Gültigkeit für Sprachen mit relativ fester Wortstellung wie beispielsweise das Englische.
40 auf diese Weise keine interne syntaktische Struktur übertragen wird und damit richtige Voraussagen über unzulässige Modifikationen wie Erweiterung durch Adjektive oder Passivtransformation und andere transformationeile Defekte gemacht werden, da der gesamte Ausdruck als nicht analysierbares intransitives Verb behandelt wird. Die Nachteile dieser Vorgehensweie hält Weinreich allerdings für gravierender (vgl. Weinreich 1972:447): Bei dieser Art der Darstellung bleibt unberücksichtigt, daß es sich bei der Mehrheit der Idiome um syntaktisch wohlgeformte Wortgruppen handelt, die sich in ihrer phonologischen, morphologischen und syntaktischen Struktur von nicht-phraseologischen Konstituenten nicht unterscheiden. Die Repräsentation der Idiome als komplexe Lautfolgen führt dazu, daß Redundanzregeln in diesen Bereichen aufgegeben werden müssen, obwohl die Regelmäßigkeiten und Unregelmäßigkeiten immer dieselben wie bei den homophonen Verben in nicht-idiomatischen Ausdrücken sind, d.h, werden Idiome als unanalysierte Einheiten aufgeführt, dann wird das Lexikon mit redundanten Spezifizierungen überhäuft. Zudem müßte dem Formativ eine syntaktische Pseudostruktur zugewiesen werden, damit Tempus- und Modusmarkierungen an der Komponente abschieß- vorgenommen werden können. Solche Markierungen müßten im Lexikon aufgenommen werden, um den morphologischen Zusammenhang zwischen dem freien Verb abschießen und der Komponente abschieß- des Formative den Vogel abschieß- sichtbar zu machen. Als noch problematischer kritisiert Burger dieses Vorgehen im Hinblick auf das Deutsche, da dieses Modell keine Umstellung der Komponenten innerhalb des Formative ermöglicht, und nicht alle Wortstellungsmöglichkeiten syntaktisch korrekt abgeleitet werden (vgl. Burger 1973:63f.). So sind beispielsweise folgende einfache Satzstrukturen für das Deutsche syntaktisch korrekt: • Nebensatzstellung:
(weil) Det - Ν - V
• Aussagesatzstellung:
Det - Ν - V
• Entscheidungsfrage:
V - Det- Ν
Werden nun die V-Knoten durch ein komplexes Formativ wie den Vogel abschieß- ersetzt, ergeben sich nach durchgeführter morphologischer Transformationen folgende Ketten: (82a) (weil) das Mädchen den Vogel abschießt (82b) * das Mädchen den Vogel abschießt (82c) * den Vogel abschießt das Mädchen? Um solche grammatischen Oberflächenstrukturen zu blockieren, müßten die für jede Satzstellung erforderlichen Umstellungen der Idiomkomponenten als Merkmal des Idioms ins Lexikon aufgenommen werden. Dies führt allerdings zu einer unnötigen Aufblähimg des Lexikons, da es sich bei diesen Eigenschaften um allgemeine Regularitäten handelt, wie sie sich bei freien Ketten aus der Basisstruktur ergeben. Weinreich zeigt noch eine zweite Verfahrensmöglichkeit auf, die er aber aufgrund ihrer Unzulänglichkeit im semantischen Bereich nicht detailliert erläutert. Sie soll hier kurz mit Hilfe des Beipiels das Handtuch werfen, das in etwa durch "entmutigt aufgeben" paraphrasiert werden kann, angedeutet werden. Bei diesem Verfahren enthält
41 das Lexikon das Idiom nicht als komplexe Lautfolge, sondern als in unterschiedliche Kategorien aufgesplittete Konstituenten mit Angaben zur Phonologie und Flexionsklasse sowie einschränkenden Angaben zum Kontextpartner, zu transformationeilen Defekten und zur semantischen Teilbedeutung:
werf- [phonologischen Umschrift] [+V, + NP, Flexionsklasse] "aufgeben" [-TNominalisiereung, +belebt—, +— DAS HANDTUCH, "durch die Luft fliegen lassen"
Handtuch [phonologischen Umschrift] [+N, +2ählbar, -belebt,...] S "entmutigt" [WERF"aufgeben","Gegenstand zum Abtocknen"
Plural,-Adjektiv
]
Passiv]
>
Zwar macht diese Art der Repräsentation einerseits die phonologischen und grammatischen Nachteile wett, indem die im Lexikon befindlichen Redundanzregeln im Bereich der Phonologie und der Flexionsklassenzugehörigkeit ausgenutzt werden, sie weist aber andererseits im semantischen Bereich weitreichende Unzulänglichkeiten auf. Als äußerst negativ kritisiert Weinreich die völlig willkürliche Segmentierung der Paraphrase "entmutigt aufgeben". Dieser Ausduck ist in einem hohen Maße idiomatisch, und die semantisch willkürliche Segmentierung bezeichnet Weinreich als die "hohen Kosten der Idiomatizität". Beide Verfahren sind seiner Meinung nach von unerträglichen Nachteilen gekennzeichnet. Katz hält aus denselben Gründen wie Weinreich die bisher aufgezeigten Möglichkeiten zur Behandlung von Idiomen für nicht adäquat und fordert daher einen Kompromiß: "The obvious compromise, then, is to develop a treatment on which these idioms receive as so much syntactic structure as is required to permit both the relevent transformational development and the assignment of the proper phonological representation and yet not so much structure that inappropriate transformational developement can be defined for them." (Katz 1973:361)
42 Diese Vorgehensweise wurde von Katz und Postal (1963) als Alternative vorgeschlagen.7 Dem Idiom soll demnach die interne syntaktische Struktur zugeordnet werden, die der syntaktischen Analyse im freien Gebrauch entspricht, was sich für die meisten Idiome als unproblematisch erweist, da sie kategoriell wohlgeformt sind. Das Lexikon wird bei diesem Ansatz aufgeteilt in einen Teil, der die lexikalischen Formative wie Hand, Fuß, der, die etc. und deren phonologischen, morphologischen und semantischen Merkmale enthält, und einen zweiten Teil, der die Idiome wie das Handtuch werf- aufzählt. Transformationelle Defekte werden zusammen mit anderen syntaktischen Merkmalen der lexikalischen Eintragungen markiert, so daß unerlaubte Transformationen blockiert und obligatorische angewandt werden. Weinreich greift 1966 den Gedanken der Aufteilung des Lexikons von Katz und Postal auf und macht den Vorschlag, zusätzlich zum Lexikon eine Idiomliste einzuführen, da Veränderungen der transformationeilen Grammatiktheorie - nämlich die Einführung der lexikalischen Regel - eine stärkere Trennung des idiomatischen und nicht-idiomatischen Materials erforderlich machen.8 Die Idiomliste soll als Einträge eine Kette von Lexemen enthalten, deren Länge von zwei Lexemen bis zum Satz reichen kann. Jedem Eintrag wird ein Strukturbaum, eine Bedeutungsbeschreibung und zusätzlich Merkmale über obligatorische Operationen [+Plural ] und nicht zulässige Transformationen wie Passiv [- Passiv] oder Nominalisierungstransformationen [-TNominalisierung] zugeordnet: VP
/
NP
Det
\
Ν
das [+belebt
y xverf-
Handtuch ,
Passiv; - T N o m i n a l i s i e r u n g ]
"entmutigt aufgeben" Abb. 8. Inhalt eines komplexen Lexikoneintrags in Weinreichs Idiomliste
Die Strukturierung der Idiomliste nach Reihenfolge der Einträge, Art des Zugriffs usw. ist für Weinreich zunächst zweitrangig.
7
8
Das Verfahren wird von Katz und Postal (1963) nur informell vorgeschlagen, dann aber von Weinreich aufgegriffen, der dessen technische Details genauer entwickelte. Den Unterschied zwischen seinem und Katz' und Postals Verfahren nennt Weinreich selbst "nicht mehr als terminologischer Art" (Weinreich 1972,474). In Katz' und Postals Behandlung ist das Lexikon selbst in einen Teil für lexikalische Einheiten und einen für Phrasen und Idiome aufgespalten. Jedoch motivierten die Einführung der Lexikonregel von Chomsky (1965) und die Möglichkeit, daß idiomatische Bedeutungen nach der Operation der Lexikonregel zugewiesen würden, eine schärfere Trennung von nicht-idiomatischen und idiomatischen Speicherverfahren.
43 Wie er die Idiomliste in eine linguistische Theorie einbettet, zeigt Weinreich mit Hilfe des Diagramm in Abb. 9. auf, das er zudem mit einer optionalen IdiomOergleichsregel ausstattet, die über einer terminalen Kette von Wörtern operiert. Sie vergleicht
Zur transformationeilen Komponente und den semantischen Prozessen
1. Präterminale Ketten 2. Lexikoneinträge 3. Terminale Ketten
4. Idiome 5. Nichtidiomatische terminale Ketten 6. Idiomatische terminale Ketten
Abb. 9. Idiome in Weinrichs linguistischer Theorie (entnommen: Weinreich 1972:451)
die Kette von Wörtern mit der Idiomliste. Findet die Idiomvergleichsregel in der Liste einen Eintrag, der identisch ist mit der ganzen oder einem Teil der terminalen Kette, dann löscht sie die semantischen Merkmale des verglichenen Fragments der terminalen Kette und substituiert die semantischen Merkmale und transformationellen Anweisungen, die für den entsprechenden Eintrag in der Idiomliste spezifiziert sind. Als optional bezeichnet Weinreich die Idiomvergleichsregel deshalb, weil viele idiomatische Ausdrücke homophone nicht-idiomatische Gegenstücke besitzen. Die Funktionsweise möchte ich anhand der deutschen Beispielsätze in (83)-(86) nach Weinreich erläutern (vgl. Weinreich 1972:451f). Angenommen in 3 liegen folgende terminale Ketten von Wörtern vor, die zuvor durch die kategorielle Komponente und das Lexikon erzeugt worden sind: (83) (84) (85) (86)
Kanzler Kohl warf das Geschirrtuch. Kanzler Kohl warf das Handtuch. Die Waschmaschine warf das Handtuch. Die Waschmaschine gab entmutigt auf.
Für die Sätze (83) und (86) findet die Idiomvergleichsregel keinen Eintrag in der Idiomliste. Für (85) wird zwar ein Eintrag für den Verbalphrasenteil gefunden - nämlich das Handtuch werf- - allerdings spezifiziert der Lexikoneintrag dafür in der Idiomliste ein belebtes Subjekt. Diese Bedingung ist hier aber nicht erfüllt. Für (84) wird allerdings ein Eintrag in der Idiomliste gefunden, der auch die kontextuellen Bedingungen erfüllt. Nun kann die Regel die semantischen Merkmale des ursprünglichen Satzes durch jene ersetzen, die die Paraphrase "entmutigt aufgeben" ergeben. Tritt die Regel nicht in Aktion bleiben die ursprünglich erzeugten semantischen Merkmale erhalten.
44 Vorteil dieses Vorgehens ist, daß alle phonologischen, syntaktischen und morphophonemischen Informationen bewahrt bleiben, da die Phraseologismen auf der Grundlage ihrer Konstituenten gespeichert werden, und erst durch Vergleichsoperationen mit der Idiomliste bei Übereinstimmung die Semantik ersetzt wird. Zudem trägt die hier schematisch dargestellte Lösung dem Phänomen der Mehrdeutigkeit Rechnung, und auf semantischer Seite wird "jede Erwartung auf syntaktischen Isomorphismus zwischen einem idiomatischen Ausdruck und seiner Paraphrase" ausgeschaltet. (vgl. Weinreich 1972:452) Negativ an seinem Vorgehen bewertet Weinreich selbst zum einen, daß bei der Analyse zwar transformationeile Defekte von Idiomen berücksichtigt, kategorielle Defekte aber strikt vernachlässigt werden (vgl. Weinreich 1972:452). Zum anderen bleibt die Strukturierung der Idiomliste völlig offen. Die Aussicht auf eine ungeordnete Idiomliste und endlose Vergleichsoperationen hält Weinreich letztlich für keine "besonders ansprechende Vorstellung" (Weinreich 1972:452). Seines Erachtens müßte ein sinnvolles Ordnungskriterium gefunden werden, um diesem letzten Nachteil Abhilfe zu schaffen. Er macht daher den Vorschlag, das Lexikon als Index zu benutzen. Dazu wird jedes Lemma der Idiomliste durch ein Symbol im Lexikon und in der terminalen Kette ausgezeichnet, das die Suche nach der Idiomvergleichsregel aktiviert. Ist bei einem einfachen Lexikoneintrag kein solches Symbol vorhanden, bedeutet dies, daß es sich um ein Lexem handelt, das in keinem Idiom vorkommt, und die Idiomvergleichsregel nicht ausgelöst werden muß. Problematisch ist allerdings, daß die Mehrzahl der im Sprachgebrauch auftretenden Wörter auch in Idiomen vorkommen können, was die Anzahl der Vergleichsoperationen nicht wesentlich verringert (vgl. Weinreich 1972:452f). Im Hinblick auf die ungeordnete Idiomliste möchte ich anmerken, daß es sich dabei letztlich um eine technische Frage handelt. Beim Menschen spielen hier Assoziationen und Schlüsselwörter oder Kombinationen aus Schlüsselwörtern eine Rolle, über die der Zugriff auf das Lexikon erfolgt, wie kognitionswissenschaftliche Untersuchungen belegen (vgl. u.a. Tabossi/Zardon 1993). Kritik an Weinreichs Vorschlag äußert auch Burger. Die Plausibilität seines Modells hinge davon ab, "wie genau die Selektionsbeschränkungen in der syntaktischen Komponente spezifiziert sind"(Burger 1973:67). Er stellt die Frage, wieweit bereits durch die syntaktische Basis und die Lexikonregel terminale Ketten verhindert werden, die später als Input für die Idiomvergleichsregel erscheinen müßten. Als Beispiel gibt Burger an, daß die terminale Kette für einen Satz wie Otto schiebt seine Entschlüsse auf die lange Bank durch die Lexikonregel gar nicht zugelassen würde, wenn in den komplexen Symbolen des Strukturbaumes bereits die Selektionsbeschränkung [X auf die lange Bank schieben, mit X = [- abstrakt]] eingeführt würde (vgl. Burger 1973:67). Weinreich schlägt vor, zwei Klassen von Ausdrücken, die er schon aufgrund der fehlenden Mehrdeutigkeit nicht als Idiome betrachtet, nicht in die Idiomliste aufzunehmen, sondern durch komplexe Einträge im Lexikon zu repräsentieren (vgl. Weinreich 1972:460). Die erste Klasse sind Ausdrücke, die kategoriell nicht wohlgeformt sind, wie beispielsweise im Deutschen nicht ganz ohne sein, mit jemandem ist nicht gut Kirschen essen, etc. Diese können nicht durch die gewöhnlichen Phrasenstrukturregeln erzeugt werden. Die zweite Klasse von Ausdrücken, die Weinreich als komplexe Einträge im Lexikon repräsentieren würde, sind Binominale, bei denen beide Konstituenten unikale Komponenten wie gang und gäbe, Lug und Trug, etc. sind.
45
//w
Ν
VP
Part I
nicht
Adv I
ganz
Präp I
ohne
I
NP
V I
sein
I ""
N
Konj
Ν
Lug
und
Trug
I
I
I
Abb. 10. Komplexe Lexikoneinträge für kategoriell nicht-wohlgeformte Ausdficke und Binominale mit unikalen Komponenten
Auch sie könnten ohne Redundanz im Lexikon aufgeführt werden, da es keinen einfachen Eintrag gibt, in dem die Information wiederholt wird. Weinreich ist daher der Auffassung, daß für die Beschreibung einer Sprache sowohl komplexe Lexikoneinträge als auch eine Idiomliste je nach Zweck verwendet werden sollten (vgl. Weinreich 1972:461). Weinreich ist sich bewußt, daß er solchen Ausdrücken nicht gerecht wird, die dem Sprecher sehr vertraut vorkommen. Dazu scheint er sowohl Nominationsstereotype als auch Sprichwörter und ähnliches sprachliches Material zu zählen, die für ihn nicht in die Kategorie Idiom fallen und "nichts Idiomatisches bzw. Phraseologisches an sich [haben]. Sie sind nur stabil und vertraut" (Weinreich 1972:463). Um auch solchen sprachlichen Ausdrücken gerecht zu werden, schlägt Weinreich eine letzte Ergänzimg seines Systems vor: Diese Einträge müßten in die Idiomliste aufgenommen werden. Jeder Eintrag in der Idiomliste sollte durch Vertrautheitsbewertungen erweitert werden und müßte Angaben über die Vertrautheit bestimmter transformationeller Versionen enthalten. Nur die eigentlichen Idiome erhalten zudem Bedeutungsspezi-
Zur phonologischen Komponente und den semantischen Prozessen 1. Präterminale Ketten
4. Abgeleiteter Strukturbaum
2. Mopheme, nicht-analysierbare Komplexe, nicht-wohlgeformte Phrasen, zweifach einmalige Binominale
5. Vertrautheitsbewertungen für analysierbare komplexe Wörter und Klischees, idiomatische Bedeutungen
3. Terminale Ketten
6. Nichtidiomatische und idiomatische Ketten mit Vertrautheitsbewertungen
Abb. 11. Weinreichs linguistische Theorie mit Berücksichtigung der Vertrautheitsbedingungen (entnommen: Weinreich 1972:466)
46 fizierungen, die nur-vertrauten Ausdrücke nicht. Die Idiomvergleichsregel wird in ihrer Funktion modifiziert; ihre allgemeine Funktion bleibt, erzeugte terminale Ketten zu vergleichen, nur in diesem Fall unter Einbeziehung der unterschiedlichen Vertrautheitsbewertungen (Weinreich 1972:463).
3.3.2 Transformationelle Defektivität Im folgenden sollen noch zwei Vorschläge vorgestellt werden, die sich damit befassen, wie man innerhalb der generativen Grammatik der Eigenschaft von Idiomen, transformationell defektiv zu sein, Rechnung tragen kann. Für ein Grammatikmodell, das mit Transformationen arbeitet, ist eine adäquate Beschreibung dieser Erscheinung wesentlich. 3.3.1.1 Fräsers Frozenness-Hierarchie Während die Literatur mit einer Fülle von Einzelbeobachtungen im Hinblick auf die Anwendbarkeit bzw. Nicht-Anwendbarkeit bestimmter syntaktischer Operationen auf Idiome aufwartet, versucht Fraser (1970) als erster für das Englische eine Systematik in diesen Bereich zu bringen. Der Begriff der Frozenness, der Eingefrorenheit, worunter die Stabilität von Idiomen zu verstehen ist, spielt für Faser in diesem Zusammenhang eine große Rolle. Fraser versucht in seinem Ansatz durch eine Frozeness-Hierarchie von Idiomen, den verschiedenen Graden von Stabilität unterschiedlicher Idiome Rechnung zu tragen. Grundlegend für die Frage der Stabilität ist die Zulässigkeit bzw. Unzulässigkeit der Anwendung bestimmter syntaktischer Operationen auf Idiome. Die Frage nach der Rolle von Transformationen will Fraser zurückstellen im Hinblick auf die Frage, welche Typen von Operationen auf bestimmte Idiome nicht anwendbar sind (vgl. Fraser 1970:37): • Adjunktion von nicht-idiomatischen Konstituenten an ein Idiom • Einfügung von Konstituenten in ein Idiom • Vertauschung zweier aufeinanderfolgender Konstituenten eines Idioms • Herausnehmen von Idiomkonstituenten auf eine Position außerhalb des Idioms • Umformung eines Idioms in eine andere Konstituentenstruktur. Diese Operationen sind auf Phrasenstrukturbäumen definiert und werden bei Transformationen für die Überführung von der Tiefen- in die Oberflächenstruktur verwendet. Fraser schlägt vor, Idiome dadurch zu charakterisieren, daß sie mit einer Menge von Merkmalen ausgezeichnet werden, die angeben, welche Operationen erlaubt sind und welche nicht. Dabei stellt er für englische Idiome folgende Frozen«ess-Hierarchie auf (vgl. Fraser 1970:39):
47 •
L6 - unbeschränkt
•
L5 - Umformung
•
L4 - Herausnehmen
•
L3 - Vertauschung
•
LI - Einfügung
•
LI - Adjunktion
•
LO - vollständig eingefroren
Die Hierarchie zeichnet sich dadurch aus, daß, wenn ein Idiom einer Ebene angehört, es gleichzeitig auch alle Operationen der niedrigeren Ebenen erlaubt. Auf der Ebene L6 treten keine Idiome auf, da alle Idiome Beschränkungen aufweisen. Ist eine Idiom mit L5 gekennzeichnet, bedeutet dies, daß alle gekennzeichneten Operationen auf das Idiom anwendbar sind, während mit LO gekennzeichnete Idiome keine der Operationen erlauben. Welche Operationen auf ein Idiom anwendbar sind, ist sprecherabhängig, wobei jedoch grundsätzlich die hierarchische Gliederung der Idiomebenen laut Fraser erhalten bleibt (vgl. Fraser 1970:41). Obwohl diese Stabilitätshierarchie die Möglichkeit bietet, transformationeile Einschränkungen von Idiomen als generelle Eigenschaft zu beschreiben, wurde sie mehrfach dahingehend kritisiert (vgl. Burger 1973, Katz 1973), daß sie keine Begründung vorsieht, warum bestimmte Transformationen die Idiomatizität stärker beeinträchtigen als andere, d.h. warum welche Defekte bei welchen Idiomen auftreten. Auf das Deutsche als Sprache mit relativ freier Wortstellung ist die Skala von Fraser nicht übertragbar, denn bei LI, L2, L3 und L4 handelt es sich im Grunde um Wortstellungsmöglichkeiten, die im Deutschen grundsätzlich weniger beschränkt sind als im Englischen. Mir ist keine Hierarchie transformationeller Defekte für deutsche Idiome in dieser oder ähnlicher Form bekannt. Rothkegel bezieht allerdings bei ihrer Beschreibung fester Syntagmen einzelne Markierungen ein wie [± disk] für zulässige und nichtzulässige diskontinuierliche Anordnung, wie [- perm], wenn Permutation von Idiomkonstituenten ausgeschlossen ist und [+ Attr] für mögliche Attributierung des Gesamtausdrucks (vgl. Rothkegel 1973:103f). 3.3.1.2 Die Markierung durch ein einziges Merkmal Katz paßt in einem Aufsatz 1973 seine mit Postal gemeinsam aufgestellten Theorien von 1963 an die inzwischen vorgegangenen Veränderungen im Bereich der transformationeilen Grammatiktheorien an. In diesem Zusammenhang macht auch Katz einen Vorschlag zur Behandlung transformationeller Defekte. Er ist der Ansicht, daß innerhalb eines polylexikalischen Idioms mehr Struktur gegenüber einer transformationellen Veränderung verschlossen als offen ist (vgl. Katz 1973:362). Da Katz bei Fraser keine Regularitäten im Hinblick auf Anwendbarkeit oder Nichtanwendbarkeit transformationeller Operationen auf die Subkonstituente eines Idioms erkennen kann, schlägt er vor, diese Eigenschaften wie andere idiosynkratische Eigenschaften von lexikalischen Einheiten zu behandeln, nämlich durch Einführung eines neuen
48 syntaktischen Merkmals [± Idiom] (vgl. Katz 1973:363). Der komplexe Lexikoneintrag für ein Idiom - der sich nach Katz und Postal - wie oben erwähnt - in einem separaten Teil des Lexikons, der Idiomliste, befindet - muß nach Katz erweitert werden u n d hat das folgende Format: ί Xl[],X2[]
ΧηΠ )
[
]
wobei Xj, 1 < i < n , das i-te Lexem des Idioms ist, und die Klammern rechts von X¡ die Merkmalspezifikation, die für das Lexem X¿ gefordert ist, einschließlich der Merkmale [+ Idiom] imd [- Idiom] enthalten. Die erweiterten Klammern unter X¿[ ], X i+1 [ ],..., Xi+k[ L k
u=x bekommen(u,w)
6.3.2.2 Repräsentation satzübergreifender anaphorischer Verweise In Kapitel 5 habe ich bereits auf die satzübergreifenden Aspekte des phraseologischen Sprachgebrauchs aufmerksam gemacht. Literaturbeispiel (L 24) zeigt noch einmal die explizite Wiederaufnahme einer phraseologischen Konstituente, wobei bei dieser Form der Wiederaufnahme von einer vorliegenden Referenzidentität zwischen wiederaufzunehmenden sprachlichen Ausdruck (Bezugsausdruck) und dem wiederaufnehmenden Ausdruck auszugehen ist (vgl. Brinker 1985:28). Beide Ausdrücke verweisen auf das gleiche außersprachliche Objekt. (L 24) "Programmbedingt schießen Computer beim Rechnen häufig kleine, manchmal aber auch kapitale Böcke. Da kaum einer diese Fehler bemerkt, kann es zu fatalen Fehlschlüssen kommen. [...]".
Welcher Natur die hier bestehende explizite Wiederaufnahmerelation zwischen Bock und Fehler ist, möchte ich offen lassen. Grundsätzlich kann bei einer Relation der expliziten Wiederaufnahme zwischen dem wiederaufzunehmenden und dem wiederaufnehmenden sprachlichen Ausdruck entweder eine Relation der Supemymie/Hyponomie bestehen, d.h. der Bezugsausdruck weist mehr Bedeutungsmerkmale auf als der wiederaufnehmende Ausdruck, oder die sprachlichen Ausdrücke sind synonym (Briefträger-Postbote). Bei der hier gezeigten Beziehung zwischen den Begriffen könnte von einer quasi-synonymischen Wiederaufnahmerelation ausgegangen werden.
148 Grundsätzlich stellen sich bei der maschinellen Anaphernresolution eine Reihe formaler und praktischer Probleme, auf die ich hier nicht eingehe. Überlegungen und Strategien zur maschinellen Resolution satzübergreifender Anaphern finden sich unter anderem in Carbonell und Brown (1988) und Kasper et al. (1992). Für die folgenden Überlegungen wird ein adäquater Mechanismus für die Anaphernresolution ebenso wie funktionsfähige Verarbeitungsstrategien für die problematische Behandlung definiter Nominalphrasen vorausgesetzt. Mir geht es hier im wesentlichen darum zu verdeutlichen, welche Möglichkeiten sich daran anschließend für die Verarbeitung von Phraseologismen bieten. In (179a)-(179b) habe ich einen mit (L 24) vergleichbaren Beispielsatz konstruiert, der auf die wesentliche Struktur der Wiederaufnahmerelation reduziert ist. (179a) Jan schießt einen großen Bock. (179b) Er bedauert diesen/ ¡seinen] Fehler. Mit Hilfe der in Kapitel 5 geforderten Kodierung des Referentenpotentials semantisch autonomer Komponenten von Phraseologismen im Lexikon wird die prinzipielle Möglichkeit der Repräsentation einer solchen Textkonstruktion in einer DRS geschaffen. In (DRS 195a) wird die Repräsentation der logischen Formen des Satzes (179a) gezeigt. xy ζ ν jan(x)
xy
fehler(y)
(DRS 179a)
jan(x)
(DRS 179a+b)
groß(y)
fehler(y)
machen(x,y)
groß(y)
ζ=χ
machen(x,y)
fehler(v) bedauern(z.v) v=y
Die resultierende DRS enthält zwei Diskursreferenten χ und y und verschiedene Bedingungen über diesen Parametern. Bei schrittweiser Einfügung des Satzes (179b) werden zunächst zwei weitere Diskursparameter ζ für das Pronomen er und v, über dem die Bedingung fehler gilt, eingefügt. Zudem besteht zwischen den Diskursreferenten ζ und ν die Relation bedauern. Durch die Verbalisierung der semantisch autonomen Komponente Bock durch "Fehler" im Lexikon wird die ursprünglich problematische Wiederaufnahmerelation zwischen Bock und Fehler auf eine Wiederaufnahmerelation durch eine definite Nominalphrase reduziert, die äquivalent ist zu einer Wiederaufnahmerelation der Form: (180) Jan macht einen Fehler. Er bedauert diesen/den / seinen Fehler. Während mir die Verbalisierung des Referentenpotentials der semantisch autonomen Komponente Bock durch die Konstituente "Fehler" unproblematisch erscheint, sind
149 die Verbalisierungsmöglichkeiten der Komponente Bär in jmdm. einen Bären aufbinden vielfältiger, da das Konzept, auf das referiert wird, breiter ist und mehrere Bedeutungsnuancen aufweisen kann, dessen Verbalisierung beispielsweise die Begriffe Lügengeschichte/Lügenmärchen/Lüge/Unwahrheit sind. Letztendlich kann auch durch diese Begriffe eine Wiederaufnahme der semantisch autonomen Komponente Bär erfolgen. Die Kodierung der bestehenden konzeptuellen Verbindungen zwischen diesen Begriffen ist im Bereich der maschinellen Sprachverarbeitung beispielsweise durch semantische Netze möglich. Mein Vorschlag geht dahin, semantisch autonome Komponenten mit Angabe des zugehörigen Kotextes als sprachliche Ausdrucksformen bestimmter Konzepte in konzeptuelle semantische Netze zu integrieren. Auf diese Weise könnten prinzipiell auch auf Oberbegriff/Unterbegriff beruhende semantische Beziehlingen kodiert werden und damit die Verarbeitung expliziter Wiederaufnahmerelationen zwischen "Bär - Lügengeschichte", "Bär - Lüge", "Bär - Unwahrheit" ermöglichen. Ich möchte abschließend zwei weitere Beispiele anführen, die eine satzübergreifende Anapher im Format einer DRS zeigen. Wie schon in den vorangegangenen Beispielen wird auch in Satz (181) eine satzübergreifende Bezugnahme zwischen Korb und Absage angenommen. (181) Mark schickt Siemens eine ausgezeichnete Bewerbung. Er bekommt einen Korb. Die unerwartete Absage, die er erhält, wirbelt [im Kollegenkreis] viel Staub auf. xyzvust mark(x) siemens(y) bewerbung(z) ausgezeichnet(z) schicken(x,y,z)
(DRS 181)
ν=χ absage(u) bekommen(v,u) absage(s) unerwartet(s) erhaltenes) s=u t=V=X
ζ aufregung(z)
150 In der DRS werden die Bedingungen absage und bekommen, die über den Diskursreferenten u gelten, und die Bedingungen absage, unerwartet und erhalten, die über dem Diskursreferenten s gelten, durch die Gleichung s = u miteinander identifiziert. In den Sätzen (182a) und (182b) wird die Wiederaufnahmerelation durch die Semantik des Artikelwortes jeder bestimmt, mit dem die alle Exemplare einschließende Gesamtheit bezeichnet wird, wobei ein Bezug auf jedes einzelne Exemplar im Singular erfolgt. In diesem Fall wird eine andere Repräsentation des Artikelworts einige erforderlich als die bisher gezeigte Schreibweise in Form einer Duplex-Bedingung. (182a) Anna bindet Klaus einige Bären auf. (182b) Er glaubt ihr jede
Lügengeschichte.
xy anna(x) (DRS 182a)
klaus(y)
ζ Z = Σ z:
lügengeschichte(z) erzählen(x,y,z)
einige(IZI)
Die Darstellung des Diskursreferenten der Konstituente einige Bären erfolgt hier als die Menge Z, die sich aus der Summe der einzelnen ζ ergibt, wobei über jedem einzelnen ζ die Bedingung lügengeschichte und die Relation erzählen(x,y,z) gilt. Der Anzahl von Z, die gekennzeichnet ist durch die Betragsschreibimg IZI, wird insgesamt das Attribut einige zugeschrieben.7 In (DRS 182a+b) wird die resultierende DRS nach Einfügung des Satzes (182b) gezeigt, in die zunächst zwei weitere Diskursparameter u und w für die Pronomen er und ihr eingefügt worden sind. Die Semantik von [jede Lügengeschichte glauben] wird als die Duplex-Bedingung dargestellt: Für die Konstituente jede Lügengeschichte wird ein Diskursparameter ν eingefügt, über dem die Bedingung lügengeschichte gilt und Relation glauben(u,w,z) gilt. Der semantische Bezug zur Konstituente Bären aus dem vorangegangenen Satz (182a) wird auf semantischer Ebene durch Enthalten-sein-Relation ν e Ζ ausgedrückt. Damit gilt informell über den Diskursparameter ν, daß jede Lügengeschichte v, die Klaus Anna glaubt, zur Menge der Diskursparameter Ζ gehört, über die gesagt wird, daß es einige sind. Durch die Kodierung der semantisch autonomen Konstituenten und deren Referentenpotential im Lexikon wird auch eine solche Wiederaufnahmerelation prinzipiell möglich.
7
Ein vergleichbare Vorgehensweise bei der Darstellung der Quantoren findet sich bei Kamp und Reyle. Diese wird als Alternative zu ihrem ersten Vorschlag der Duplex-Bedingung eingeführt. Die genaue Motivation der unterschiedlichen Darstellungen findet sich bei Kamp/Reyle (1993:452ff).
151
xyuwZ anna(x) klaus(y)
ζ (DRS 182a+b)
Z
^ ~ ^ "
lûgengeschichte(z) erzählen(x,y,z)
einige(IZI) u= y w= χ
6.3.3 Konstruktion von Diskursrepräsentationstrukturen aus Phrasenstrukturbäumen mit Hilfe von λ-DRT Im folgenden möchte ich erläutern, wie sich die gezeigten semantischen Repräsentationen übertragen-kompositioneller Phraseologismen mit Hilfe einer Verbindung von λ-Kalkül und Diskursrepräsentationsstrukturen konstruieren lassen. Im Gegensatz zum Ansatz von Kamp und Reyle (1993) werden die Diskursrepräsentationsstrukturen nicht top-down aus Phrasenstrukturbäumen gewonnen, sondern bottom-up mit Hilfe einer Version des λ-Kalkül konstruiert. Ansätze dieser Art finden sich bei Bos et al. (1994), Asher (1993) und Reyle (1987). Durch die Verbindung von λ-Kalkül und Diskursrepräsentationstheorie werden zwei Arten der Abstraktion möglich: zum einen kann über eine vollständige DRS abstrahiert werden wie beispielsweise bei Artikeln, zum anderen kann die Abstraktion nur über einen einzelnen Diskursreferenten erfolgen wie bei Nomen und Verben. Wird über eine vollständige DRS abstrahiert, wird auch von einer partiellen DRS gesprochen. Bei Abstraktion über einen einzelnen Diskursreferenten liegt dagegen eine prädikative DRS vor (vgl. Asher 1993): (1) Partielle DRS:
(2) Prädikative DRS:
X R XS
λζ + R(r) + S(r)
Fehler(z)
Grundlage des λ-DRT-Formalismus ist obige Datenstruktur, die neben der eigentlichen DRS noch eine Liste der semantischen Objekte mitführt, über die abstrahiert
152 wird, die sogenannte λ-Liste. In dieser Liste wird die Abstraktion über eine DRS formal durch das Einsetzen von Großbuchstaben gekennzeichnet. Die Vereinigung der verschiedenen DRSen wird durch das +-Symbol markiert. Zentrale Operation in der λ-DRT ist die funktionale Komposition (vgl. Pinkal/Lerner 1991). ¿ire Funktionsweise wird an der Verbindung der beiden oben aufgezeigten DRSen für den Artikel einen mit dem Nomen Fehler aufgezeigt. Die Datenstruktur für einen bildet den Funktor, die Datenstruktur des Nomens Fehler das Argument: xy
XR XS + R(r) + S(r)
Funktor
Fehler(y)
Argument
Die λ-Liste wird immer von links nach rechts abgearbeitet. Das XR gibt an, daß das erste - und in diesem Fall einzige - Element hinter dem komplexen Funktor als Argument des Ausdrucks zu betrachten ist und an der Stelle R im Ausdruck eingesetzt wird. Gleichzeitig mit der Einsetzoperation wird λ R aus der λ-Liste gestrichen, da es seine Funktion erfüllt hat. Es ergibt sich folgender Ausdruck: XS r
+
xy
Fehler(y)
(r) + S(r)
Nun kann der Ausdruck zwischen den beiden +-Symbolen als Funktor und Argument betrachtet werden. Das λ y gibt an, daß r an die Stelle von y in den Audruck eingesetzt werden kann. Daraus folgt: XS Fehler(r)
+ S(r)
Über das +-Symbol werden die beiden DRSen miteinander vereinigt, d.h., die Inhalte der beiden DRSen ebenso wie deren λ-Listen werden in einer DRS und einer λ-Liste zusammengefaßt. Da die λ-Liste der DRS von Fehler in diesem Fall leer ist, ist nur der zusammengefaßte Inhalt der DRS sichtbares Ergebnis der Vereinigung. Es entsteht das folgende Ergebnis:
+ S(r)
Die λ-DRS der Akkusativnominalphrase einen Fehler kann nun auf die gleiche Weise durch funktionale Komposition mit weiteren DRSen vollständig gesättigt werden. Auf die Darstellung soll an dieser Stelle allerdings verzichtet werden.
153 Vielmehr stellt sich nun die Frage, wie die in den vorangegangenen Abschnitten dieses Kapitels gezeigten DRSen, die phraseologische Bedeutungen von Sätzen repräsentieren, mit Hilfe der funktionalen Komposition aus Phrasenstrukturbäumen gewonnen werden können. Dies soll im folgenden erläutert werden, jedoch zunächst ohne genauere Betrachtung des Sprachverarbeitungsprozesses, zudem vorab nur soviel anzumerken sei: Werden Phraseologismen in einem Lexikon als komplexe syntaktisch strukturierte Wortgruppen repräsentiert - wie es in Kapitel 7 für das System Phraseo-Lex der Fall ist - muß der Zugriff beim Verarbeitungsprozeß von der Wortebene her möglich sein. Wie dieser Zugriff über lexikalische Indizierung des Lemmas durch die Basislexeme, d. h. durch alle am Phraseologismus partizipierenden lexikalischen Wörter, erreicht werden kann, wird in Kapitel 7 erläutert. Weitere Überlegungen zur Verarbeitung von Phraseologismen finden sich in Abschnitt 7.7.2. Ausgangspunkt der Betrachtungen zur Konstruktion von λ-DRSen aus Phrasenstrukturbäumen bildet das Ergebnis der rein syntaktischen Analyse eines Satzes. Hier wird der in Abschnitt 6.3.2.2 gezeigte Satz „Jan schießt einen großen Bock" als Beispiel herangezogen:
Nun werden die Blätter des Phrasenstrukturbaums durch die semantischen Repräsentationen der einzelnen Lexeme, die in Form von λ-DRSen kodiert sind, ersetzt (vgl. Fischer/Keil 1996c). Diese Repräsentationen sind dem semantischen Lexikon zu entnehmen. Für Lexeme, die als Komponenten eines übertragen-kompositionellen Phraseologismus identifiziert werden können, die also semantisch-autonom sind, ist zusätzlich die Repräsentation der übertragenen Bedeutung nachzuschlagen. Für das Lexem schießen ist demnach neben der λ-DRS von „schießen" in literalem Sinne auch die λ-DRS von „machen" einzusetzen, ebenso ist für Bock neben der λ-DRS für „Bock" im literalen Sinne auch die λ-DRS für „Fehler" im Kontext von „einen Fehler machen" einzusetzen. Darüber hinaus wäre für Bock prinzipiell auch die Einsetzung der Bedeutung „Lust" im Sinne von Bock haben und „Ungeeigneter" im Sinne von den Bock zum Gärtner machen möglich. Die zusätzliche Aktivierung einer phraseologischen Bedeutung wird allerdings erst bei Anwesenheit aller anderen phraseologischen Komponenten ausgelöst.
154 Die Informationen zur übertragenen Bedeutung phraseologischer oder auch nicht phraseologischer Natur können entweder ebenfalls im semantischen Lexikon verzeichnet sein oder können einem speziellen phraseologischem Lexikon entnommen werden. Das phraseologische Lexikon kann im Verarbeitungsprozeß dabei entweder standardmäßig oder erst nach explizitem Verweis durch das semantische Lexikon konsultiert werden. Wörtliche und übertragene Bedeutung können parallel oder auch nacheinander konstruiert werden. Wichtig ist, daß beide Analysen als Ergebnis aus dem semantischen Verarbeitungsprozeß hervorgehen. Ebenso wie beim menschlichen Verarbeitungsprozeß kann auch bei der maschinellen Analyse erst nachgeordnet aufgrund von Diskurs- und Kontextwissen entschieden werden, welche Analyse ausscheidet. Die Kodierung der verschiedenen semantischen Bedeutungen der Lexeme des Beispielsatzes als λ-DRSen zeigt die Tabelle in Abb. 35.
Lexem :
Literale Repräsentation: XQ
Jan:
Bock:
Xy
X Jan(x)
λΤ λζ
schießen:
einen:
+Q(x)
λy
Bock(y)
groß:
λ ν λw
Phraseologische und übertragene Bedeutungen:
gross(z)
Xy
Fehler(y)
Lust(y)
Xy
Ungeeigneter(y)
+T(z)
schiessen(w,v)
λν
Xvt
machen(w,v)
XR X.S I I I r l +R(r) +S (r)
Abb. 35. Repräsentation der Bedeutungen der Beispiellexeme als A-DKSen
In den weiteren Erläuterungen verfolge ich nur die Konstruktion der phraseologischen Bedeutung des Beispielsatzes. Das bedeutet, daß für solche Lexeme, die als Komponenten eines übertragen-kompositionellen Phraseologismus identifiziert werden können, die Kodierung der phraseologischen Bedeutung in dem Fall eingesetzt wird, wenn alle zur Bildving des Phraseologismus benötigten Basislexeme im Satz vorhanden sind. Für die übrigen Lexeme wird die literale Repräsentation eingesetzt.
155 Nach Ersetzen der Lexeme durch λ-DRSen ergibt sich der folgende Phrasenstrukturbaum:
XQ χ
Jan(x)
+Q(x)
λνλνν
machen(w,v)
Xy XRASI—Ι λΤλζ Fehler(y) gross(z) +T(z) r +R(r)+S(r)
Nach Anwendung der funktionalen Komposition wird die λ-DRS, die die literale Bedeutung des Adjektivs groß repräsentiert, mit der λ-DRS, die übertragene Bedeutung des Nomens Bock, nämlich die Bedeutung "Fehler", repräsentiert, verbunden:
NP
PN
λΟ χ Jan (χ)
, +Q(x)
λνλνν
machen(w,v)
XFttSrn M
+R(r)+S(r)
In Verbindung mit dem unbestimmten Artikel einen ergibt sich das folgende semantische Repräsentation, in dem die Nominiphrase, die das Akkusativobjekt des Beispielsatzes darstellt, schon vollständig durch funktionale Komposition gebildet wurde:
156
S
Nun kann die komplexe semantische Repräsentation der Akkusativnominalphrase einen großen Bock mit der λ-DRS, die die phraseologische Bedeutung des Verbs schießt repräsentiert, nämlich "machen", kombiniert werden. Dabei bildet die komplexe λDRS für die Akkusativnominalphrase den Funktor, da nur sie über eine DRS abstrahiert, und die einfache DRS bildet das Argument. Es entsteht die λ-DRS für die gesamte Verbalphrase schießt einen großen Bock. S NP
VP
Abschließend wird mit Hilfe der funktionalen Komposition die λ-DRS der Subjektnominalphrase, die den Eigennamen Jan repräsentiert, mit der λ-DRS der komplexen Verbalphrase verbunden. Im Gegensatz zu einem Nomen ist die λ-DRS eines Eigennames so kodiert, daß sie ihren Diskursreferenten mitbringt, während ein Nomen seinen Diskursreferenten erst durch den Artikel erhält, den das Nomen zur Bildung einer vollständigen Nominalphrase unbedingt benötigt. Die Nominalphrase bestehend aus dem Eigennamen Jan bildet den Funktor und die komplexe Verbalphrase bildet das Argument. Als Ergebnisrepräsentation des Beispielsatzes ist nun - nach mehrfacher Anwendung funktionaler Komposition - die (DRS 179a) entstanden. In ihr spiegelt sich die
157 Tatsache wider, daß inmitten einer phraseologischen Nominalphrase einen Bock ein literal gemeintes Adjektiv groß tritt, das im Resultat adäquat semantisch repräsentiert wird. χr jan(x) ( D R S 179a)
fehler(r) groß(r) machen(x,r)
6.4 Darstellung komplexer phraseologischer Szenen Eine weitere Möglichkeit zur computerlinguistischen Modellierung der Bedeutung figurativer Phraseologismen, die im folgenden kurz skizziert werden soll, sehe ich im Bereich der Kl-orientierten Wissensrepräsentation. So erscheint es m. E. lohnenswert, Phraseologismen als Verbalisierung abstrakter Konzepte in schemaorientierte Wissensrepräsentationsansätze einzubeziehen, d.h. mit Hilfe von Scripts bzw. Framedarstellungen zu modellieren. In den Analysen in Kapitel 5 hat sich gezeigt, daß mit Phraseologismen wie den Bock zum Gärtner machen, die Katze aus dem Sack lassen, ins Fettnäpfchen treten, mit Kanonen auf Spatzen schießen oder jmdm. Steine in Weg legen auf komplexe Sachverhalte referiert wird. In den Phraseologismen ist jeweils ein Inventar an beteiligten Personen oder Gegenständen auffindbar, welches in abstrakten Szenen vorspezifiziert werden kann. Dabei ist zusätzlich zu berücksichtigen, daß mit einer Äußerung in Form eines Phraseologismus Wertungen durch den Produzenten über bestimmte Sachverhalte erfolgen. Betrachtet man als Beispiel den Phraseologismus den Bock zum Gärtner machen, dann zählen zu den beteiligten Rollen ein Agent, der eine bestimmte Handlung vornimmt, eine Person, die von der Handlung betroffen ist und eine Funktion oder ein Amt, mit dem die von der Handlung betroffene Person betraut wird. Zudem gibt es eine Person, die den Phraseologismus verwendet, und dadurch eine Wertung über die Person, die mit dem Amt betraut ist, vornimmt, indem die Person als ungeeignet attributiert wird und eventuell Gründe dafür angegeben werden. Beispiel (L 30) könnte mit Hilfe eines solchen Frames erfaßt werden. In Abb. 36. wird der phraseologische Frame durch die verschiedenen Rollen instanziiert.
158
(L 30)
"Käme Kohls Kandidat, Waldemar Schreckenberger, der wegen politischer und administrativer Pannen im Kanzleramt als Chef dieses Amtes aufs Abstellgleis gestellt wurde, an die Spitze des Rechnungshofs, so würde, meint der Abgeordnete Esters, 'der Bock zum Gärtner gemacht'" (Die Zeit, 29.03.1985).
Bock-zum-Gärtner-machen: Wertende Person: Abgeordneter Esters Agent: offen Amt: Chef des Rechnungshofs Person: Waldemar Schreckenberger, Kohls Kandidat Bock -> ungeeignet Grund: politische und administrative Pannen im Kanzleramt
Abb. 36. Spezifizierte Szenen, die bereits durch (L 30) instanziiert ist
Untersuchungen in diese Richtung könnten auch interessante Aufschlüsse über phraseologische Bedeutungen für die Linguistik bringen, da hier komplexe Handlungszusammenhänge und Ariwendungssituationen von Phraseologismen deutlich werden, die unter diesem Aspekt gewöhnlich nicht im Fokus phraseologischer Untersuchungen stehen. In solche Untersuchungen können auch nicht-kompositionelle Phraseologismen einbezogen werden.
6.5 Zusammenfassung Sowohl in die theoretische Linguistik als auch in die Computerlinguistik finden mittlerweile differenzierte Auffassungen hinsichtlich der Semantik von Phraseologismen Eingang. • Es wird eine Einteilung entlang des prototypisch nicht-analysierbaren Idioms kick the bucket und des analysierbaren Idioms spill the beans vorgenommen. • Dabei wird versucht, Phraseologismen mit strukturierter Bedeutung als partielle Funktionen oder mit Hilfe von Merkmalstrukturen zu behandeln. • Die Überlegungen innerhalb der computerlinguistischen Literatur erfolgen mit dem Ziel, die Flexibilität von Phraseologismen - wie beispielsweise die Modifikationen wendungsinterner Komponenten - modellierbar zu machen.
159 • Es wurde gezeigt, daß die Paraphrasen, die nach dem in Kapitel 5 aufgezeigten Mechanismus gebildet werden, als Grundlage für eine formale Bedeutungsrepräsentation dienen können. • Diese Bedeutungsrepräsentation ermöglicht zum einen die computerlinguistische Modellierung systematischer Modifikationen und weist zum anderen die prinzipielle Möglichkeit der Behandlung satzübergreifender Aspekte von Phraseologismen auf, wie anhand der Diskursrepräsentationstheorie illustriert wurde. • Darüber hinaus wurde ein Mechanismus vorgestellt, der ermöglicht, aus dem Ergebnis der syntaktischen Analyse, dem Phrasenstrukturbaum, unter zu Hilfenahme der λ-DRT die phraseologische Bedeutimg eines Satzes als Diskursrepräsentationsstruktur zu konstruieren. Dazu ist die Kodierung der phraseologischen Bedeutung im Lexikon notwendig. • Aus diesem Grund sollten Paraphrasen in der geforderten Form im Lexikon kodiert werden oder in eine formale Repräsentation umgesetzt und im Lexikon abgelegt werden. • Die Untersuchung von Phraseologismen im Hinblick auf schemaorientierte Verarbeitungsmöglichkeiten erscheint sowohl für die Linguistik als auch für die Computerlinguistik lohnenswert. Phraseologismen könnten als vorspezifizierte abstrakte Szenen betrachtet werden.
7 Phraseo-Lex - eine Lexikondatenbank zur systematischen Repräsentation von Phraseologismen In den vorangegangenen Kapiteln ist deutlich geworden, daß es sich bei verbalen Phraseologismen um ein sehr vielschichtiges Phänomen handelt, dessen Beschreibung auf dem Hintergrund verschiedenster theoretischer Fragestellungen erfolgen kann. Es wurde ein Überblick über die unterschiedlichen Beschreibungsebenen von Phraseologismen gegeben und versucht, diese hinsichtlich einer computerlinguistischen, formalen Modellierung zum einen und einer allgemein phraseographischen Beschreibung zum anderen zu präzisieren. Im vorliegenden Kapitel wird nun ein Konzept erarbeitet, das die hier aufgezeigten Überlegungen in einem Kriterienkatalog geordnet zusammenfaßt. Dieser soll als Grundlage für eine Systematisierung verbaler Phraseologismen hinsichtlich der hier vorgestellten Aspekte dienen. Dieses Konzept erfährt eine Umsetzung in ein Softwaresystem - der phraseologischen Lexikondatenbank Phraseo-Lex. Zunächst gehe ich auf die Motivation zur Entwicklung eines solchen Systems ein und stelle anschließend zwei parallel zu dieser Arbeit existierende Softwareprojekte aus dem Umfeld der Phraseologieforschung vor, die jeweils Teilziele der im Rahmen dieser Arbeit entwickelten Software realisieren. Die Zielsetzung von Phraseo-Lex wird im Anschluß daran dargelegt und das Konzept eines phraseologischen Lexikoneintrags, das sich aus den Überlegungen der Kapitel 2 bis 6 ergibt, entworfen. Daran schließt sich die Präsentation der Grobstruktur des Systems an. Es wird gezeigt, wie mit Hilfe der Bedienoberfläche von Phraseo-Lex systematisch ein phraseologischer Eintrag in der Datenbank erfaßt werden kann. Abschließend werden die vom System vorgesehenen Auswertungsmöglichkeiten für bereits erfaßte Phraseologismen vorgestellt und der Einsatz von Phraseo-Lex als phraseologisches Zusatzlexikon in der maschinellen Sprachverarbeitung an einem Beispiel demonstriert.
7.1 Motivation Computergestützte
Untersuchungen in der Linguistik
Der Einsatz des Computers bei der Erstellung linguistischer Datenbasen zum einen, zur Bearbeitung verschiedenster linguistischer Problemstellvingen zum anderen, findet in den unterschiedlichsten Teildisziplinen der Linguistik - wie beispielsweise der Dialektologie, Stilanalyse, Untersuchungen der vergleichenden und historischen Linguistik, Untersuchimg der Echtheit und Datierung von Texten - zunehmend Verbreitung. 1 Insbesondere im Bereich der Lexikographie erweist sich der Computer als ein nützliches Werkzeug.
1
Einen Überblick über verschiedene computergestützte Untersuchungen im linguistischen Anwendungsbereich bietet Baton et al.(1989:481ff)·
162 Es ist offensichtlich, daß auch und gerade in einem solch vielschichtigen Bereich wie der Phraseologie computergestützte Untersuchungen zum Zwecke der Systematisierung lohnenswert sind. Gefordert ist der Computereinsatz in der Phraseologieforschung allgemein, aber insbesondere im Bereich der Phraseographie - also der Entwicklung phraseologischer Wörterbücher - bei der Durchführung phraseographischer Arbeiten einschließlich deren theoretischer Vorüberlegungen (vgl. auch: Dobrovol'skij 1989:527; Dobrovol'skij 1993:53; Durco 1994:28). So können beispielsweise große, gut strukturierte Datenbasen als Grundlage für die Entwicklung phraseologischer Wörterbücher unterschiedlicher Dimension (großer/kleiner, mit/ohne Beispiele, mündlicher/schriftlicher Sprachgebrauch) und unterschiedlicher Klientel (Muttersprachler/Nichtmuttersprachler) dienen und damit zur Erleichterung phraseographischer Arbeit beitragen. Vorteile des
Computereinsatzes
Die Vorteile des Computereinsatzes im Bereich der Lexikographie sind vielfältig. Zu den Vorteilen einer computergestützten Erfassung und Speicherung von phraseologischen Informationen gegenüber konventionellen Methoden zählen sowohl die höhere Volumenkapazität, als auch die vielfältige Art des Zugangs zu den in einem Computersystem gespeicherten Informationen. Die Kombination dieser beiden Aspekte hat zur Folge, daß man aufgrund einer gefilterten Zugangsmöglichkeit zu den Daten zum einen nicht länger an eine lineare Darstellungsweise gebunden ist, zum anderen nicht mehr auf eine knappe, anwendungsorientierte Darstellung beschränkt ist, da hier im allgemeinen die Möglichkeit besteht, den Detaillierungsgrad der interessierenden Informationen selbst zu bestimmen. So stellt beispielsweise für ein Computersystem auch der von Barz (1992) für konventionelle Wörterbücher geforderte Umgang mit Varianten kein Problem dar. Die in gewöhnlichen Wörterbüchern übliche alphabetische Anordnung führt dazu, daß Phraseologismen, deren lexikalische Wörter mit unterschiedlichen Buchstaben beginnen, an unterschiedlichen Stellen im Wörterbuch aufgeführt sind. Dies gilt natürlich auch für Varianten eines Phraseologismus, die sich semantisch verwandt oder sogar identisch sind. Dazu meint Barz: "Im Sinne einer relativ vollständigen Erfassung aller Arten von Varianten, besonders auch semantisch identischer Substitutionsvarianten, ist es jedoch [...] informativer, das alphabetische Anordnungsprinzip zugunsten der Zusammenstellung der Kovarianten zu durchbrechen [...]" (Barz 1992:42f)."
Erfordernisse zur computergestützten
Erfassung von
Phraseologismen
Um die genannten Vorteile des Computereinsatzes im Bereich der Phraseologieforschung und Phraseographie nutzen zu können, müssen zunächst die entsprechenden Grundlagen geschaffen werden. Dazu muß die Phraseologie der Anforderung nachkommen, eine "brauchbare computerorientierte Beschreibung ihres Objekts" zur Verfügung zu stellen (Dobrovol'skij 1989:526). In diesem Zusammenhang stellt Dobrovol'skij die Überlegung an, inwieweit überhaupt theoretische Vorarbeiten Voraussetzung für eine computergestützte Erfassung von Phraseologismen sind und ob nicht zunächst einmal phraseologische Nachschlagewerke ohne "hohe Theorie" verwirklicht werden könnten, indem man "einfach die bestehenden phraseologischen
163 Wörterbücher nehmen und alle darin kodifizierten Phraseologismen eingeben" könnte, "um ein Generalverzeichnis zu bekommen". Hierzu ist zu bemerken, daß schon die Ausführungen zu den Nennformen von Phraseologismen in Abschnitt 4.1.3, insbesondere aber die Betrachtungen zur Bedeutungsangabe von Phraseologismen in den Kapiteln 5.2 und 5.3 gezeigt haben, daß hier prinzipielle Festlegungen zur angemessenen phraseographischen Behandlung dieser Phänomene erforderlich sind. Und gleichermaßen kommt auch Dobrovol'skij hinsichtlich seiner Überlegung zur Erstellung eines theorielosen Nachschlagewerks zu dem Schluß, daß "selbst diese primitive Aufgabe [..] nicht ohne weiteres erfüllbar" ist, "weil alle Einträge zunächst einer strengen Unifizierung bedürfen", was zeigt, daß "selbst scheinbar triviale Probleme ohne Entwicklung entsprechender theoretischer Grundlagen nicht gelöst werden können" (1989:526). Letztendlich führen seine Überlegungen zur folgenden Auffassung: "Die primäre Aufgabe der computergestützten Phraseographie besteht u. E. nicht in der Übertragung der bereits kodifizierten Informationen in maschinenlesbare Formen, sondern in der Schaffung prinzipiell neuer Arten von Nachschlagewerken, die ohne Computereinsatz überhaupt nicht denkbar sind." (Dobrovol'skij 1989:527)
In diesem Zusammenhang weist er auf "die Zweckmäßigkeit einer fundierten theoretischen Basis" hin und macht gleichzeitig auf die Gefahr der Selbsteinschränkung aufmerksam. "Wir wissen nie im voraus, welche theoretischen Erkenntnisse über das Objekt für den potentiellen Benutzer von Interesse sein können und welche nicht, zumal der potentielle Benutzerkreis in diesem Fall verschiedene Schulen und Richtungen mit einschließt." (Dobrovol'skij 1989:527)
Anregungen zu einer Implementierung Auf eine mögliche Eignung ihres Ansatzes zu einem "modular-integrativen Beschreibungsmodell" für verbale Phraseolexeme zu einer computerbasierten Umsetzung macht Wotjak in einer Randbemerkung aufmerksam (1992:88): "Alle Stufen [des Modells, M.K.] sind - insbesondere bei Computerimplementierung - simultan wie auch einzeln abrufbar, so daß sich problemlos ermitteln lassen müßte,
• wie das PL [Phraseolexem, M.K.] als Valenzträger intern strukturiert ist, • welche Stelligkeit und welche davon abgeleitete Wertigkeit vorliegt,
[...] • welche diatopischen, diastratischen und diaphasischen Besonderheiten vorliegen."
Ihr Modell orientiert sich überwiegend an valenztheoretischen Überlegungen, auf die bereits in Abschnitt 4.1.2 eingegangen wurde, geht aber in einigen Vorschlägen - wie beispielsweise der hier genannten diasystematischen Markierimg - darüber hinaus. Ihre Überlegungen werden m. W. bisher nicht in eine konkrete Implementation einbezogen. Verifikationsinstrument Letztendlich dient die Erfassimg verbaler Phraseologismen als ein "wirksames Verifikationsinstrument theoretischer Ideen" (Dobrovol'skij 1989:527). Damit kann die
164 computerorientierte Bestandsaufnahme zur Überprüfung theoretischer Überlegungen dienen, die nicht mehr nur an einem Ausschnitt des Datenbestandes, sondern an einem großen Korpus verifiziert werden können. So wird beispielsweise die von Nunberg et al. geforderte systematische Überprüfung ihrer theoretischen Überlegungen hinsichtlich der syntaktischen Flexibilität bestimmter Idiome mit Hilfe eines solchen phraseologischen Werkzeugs möglich: "We predict that the syntactic flexibility of a particular idiom will ultimately be explained in terms of the compatibility of its semantics with the semantics and pragmatics of various constructions. Testing this prediction systematically is a non-trivial project, one that may be undertaken with a number of methods [...]. " (Nunberg et al. 1994:40).
Wie sich hier gezeigt hat, werden in der jüngeren Literatur verschiedene richtungsweisende Vorschläge im Hinblick auf die computergestützte Phraseologieforschung und Phraseographie gemacht.
7.2 Softwareprojekte im Umfeld der Phraseologie Bevor ich dazu übergehe, das im Rahmen dieser Arbeit entwickelte System PhraseoLex vorzustellen, möchte ich auf zwei Softwareentwicklungen im Zusammenhang mit phraseologischen Daten eingehen, die parallel zu dem hier vorgestellten System entstanden sind. In der russischen Phraseologieforschimg werden im Bereich der Implementierung phraseologischen Datenbasen eine Reihe von Erfahrungen gesammelt (vgl. Dobrovol'skij 1993:51). Ein Ergebnis aus diesen Erkenntnissen ist eine Idiom-Datei des Deutschen von Dobrovol'skij, auf die ich in Abschnitt 7.2.1 eingehen werde. Ein vornehmlich an den Zielen der Computerlinguistik orientiertes Teilsystem ist das Phrase Manager - Modul, das als Komponente des Word Manager Gesamtsystems zur Spezifikation von Lexikonwissen entwickelt wurde. Dieses Softwaresystem wird in Abschnitt 7.2.2 vorgestellt. 7.2.1 Die Idiom-Datei Mit dem Erstellen einer großen phraseologischen Datenbasis verfolgt Dobrovol'skij (1993) - anknüpfend an seine theoretischen Überlegungen von 1989 - das Ziel, "eine möglichst vollständige Informationsquelle über Idiome der jeweiligen Sprache" zur Verfügung zu stellen. Für das Deutsche hat Dobrovol'skij eine Idiom-Datei erstellt, die zirka 1000 Idiome enthält. Diese Datenbasis ist nicht auf die Aufnahme von verbalen Phraseologismen beschränkt: auch substantivische und adjektivische Phraseologismen wie weißer Fleck, schwerer Brocken,flachwie ein Bügelbrett usw. sind in ihr enthalten. Zu jedem Idiom erfolgt mit Hilfe der in Abb. 38. gezeigten Eingabemaske die Aufnahme von phraseologischen Informationen in die Datenbank.
165
Stichwort 1: Flinte Stichwort 2: Korn Stichwort 3: werfen Stichwort 4: Idiom-AF: die Flinte ins Korn werfen Idiom-NF: jmd. hat die Flinte ins Korn geworfen Fequenz: a Deskriptor 1: Resignation Deskriptor 2: Magn Deskriptor 3: Anti-Bon Deskriptor 4: Intens Deskriptor 5: η abwert Bearbeitet: j Beleg: Und ... ich meine ... ich bin auch dafür, daß einer sich nicht leichtfertig ... jetzt von seinem Amt entfernt... und die Flinte ins Korn wirft. (Pro und Contra. Der Zölibat. Diskussion. ARD, 26.3.1970). Abb. 37. Beispiel eines Idioms aus Dobrovol'skijs Idiom-Datei (Abbildung entnommen: Dobrovol'skij 1993)
Auf das Inventar der Eingabemaske möchte ich kurz am Beispiel des verbalen Phraseologismus die Flinte ins Korn werfen eingehen. Stichwort 1 bis 4 Zu jedem zu erfassenden Phraseologismus können bis zu vier Stichwörter angegeben werden, wobei Stichwort 1 "die Grundkonstituente des Idioms repräsentiert, unter denen das Idiom normalerweise im Wörterbuch erscheint" (1993:54). Stichwort 2 bis Stichwort 4 dienen der Erfassung weiterer Konstituenten des Idioms, wobei die Reihenfolge eine Gewichtung darstellt. Die Funktion der Stichwortfelder sieht Dobrovol'skij aber nicht allein in solchen formalen Möglichkeiten wie die automatische Alphabetisierung des Korpus, sondern vor allem in inhaltlichen Möglichkeiten wie die Ermittlung des semantischen Beitrags einzelner Konstituenten zur phraseologischen Gesamtbedeutung und die Ermittlung deren Symbolfunktion (1993:59). Nennform versus Aussageform Als Idiom-Nennform erfaßt Dobrovol'skij diejenige Form, "die mit dem Lemma in konventionellen Wörterbüchern weitgehend übereinstimmt" (1993:54). Aber gerade die Art der Nennformbildung von Idiomen, die aus dem Anspruch der lexikographischen Universalität resultiert, hält Dobrovol'skij für das "Hauptdilemma der Phraseographie": er ist der Auffassung, daß die konventionelle phraseologische Nennform in ihrer Allgemeinheit zwar alle möglichen textuellen Realisationen des Idioms abdeckt, dabei aber in einigen Fällen "sehr befremdend" anmutet, während die benutzerfreundliche Aussageform, die Dobrovol'skij als "die psychologisch reale" bezeichnet, selten imstande ist, alle denkbaren Realisierungsnuancen zu vertreten. In seiner Idiom-Datei tritt er diesem Dilemma durch eine Formverdopplung entgegen,
166 indem zusätzlich zur Idiom-Nennform die Aufnahme einer Idiom-Aussageform erfolgt, in der das Idiom in seiner typischen Verwendungsweise aufgeführt ist. So wird beispielsweise bei dem Phraseologismus die Flinte ins Korn werfen die perfektive Form als prototypisches Aussagemuster gewählt. In anderen Fällen wird der Nutzen dieser Form deutlicher: so erfaßt Dobrovol'skij bei dem Phraseologismus in die Falle gehen die Idiom-Aussageformen "jmd. geht in die Falle" und "Ab in die Falle!". Frequenz Der Frequenzparameter dient als Hinweis auf die "starke mentale" Präsenz oder die "nur bedingte" mentale Präsenz des jeweiligen Idioms, wobei die Grenze zwischen diesen beiden Kategorien vage ist. Der Parameter kann alternativ den Wert "a" für aktiv oder "p" für passiv annehmen. Dobrovol'skij ist sich bewußt, daß in diesem Zusammenhang kein Anspruch auf absolute Objektivität gegeben ist, da es sich hierbei um einen individuumbasierten Begriff handelt (1993:61). Deskriptor 1 bis 5 Zur Angabe der Idiombedeutung verwendet Dobrovol'skij fünf Eingabefelder für Deskriptoren. In den Deskriptoren 1 bis 3 werden knappe Angaben zum assertiven Teil der Idiombedeutung festgehalten. In Dobrovol'skij (1993) wird kein Überblick über das Inventar der von ihm bei Erstellung der Idiom-Datei verwendeten Metasprache gegeben, es erfolgt allerdings ein Verweis darauf, "daß einzelne Deskriptoren keine Seme im Sinne der Komponentenanalyse sind, sondern eher Begriffe der konzeptuellen Basisebene (Rosch 1978) darstellen, die gestatten, durch gezielte Recherchen konkrete Idiome mit entsprechenden konzeptuellen Sphären ("target domains" nach Lakoff1987) in Beziehung zu setzen" (Dobrovol'skij 1993:62).
Zur Angabe der assertiven Bedeutung des Beispielidioms die Flinte ins Korn werfen werden als Deskriptoren Resignation, Magn und Anti-Bon verwendet, wobei der erste Deskriptor den Bedeutungsfcer« als "Resignation" bezeichnet, der zweite Deskriptor das "starke Ausmaß" der Resignation kennzeichnet und der dritte Deskriptor auf die Komponente des allgemeinen Weltwissens "Resignation ist schlecht" hindeuten soll. Deskriptor 4 dient zur Charakterisierung des illokutiven Charakters des Idioms, der damit als fester Bestandteil der Idiombedeutung beschrieben wird. So ist der Verwendung des Phraseologismus anstelle des Verbs resignieren eine zusätzliche emotive Verstärkung inhärent; die illokutive Funktion liegt in der Intensivierung der entsprechenden Äußerung. Deskriptor 5 ermöglicht die weitere Angabe pragmatischer Charakterzüge wie beispielsweise stilistische Vermerke und emotive Angaben. In diesem Fall repräsentieren die Angaben η abwert den Wert "stilistisch neutral, abwertend". Bearbeitet In diesem technischen Hilfsparameter wird der Arbeitsstand des jeweiligen Eintrags mit "j" oder "n" festgehalten.
167 Belege Hierbei handelt es sich um ein Eingabefeld, daß es ermöglicht, Belegmaterial zu jedem einzelnen Eintrag zu speichern, wobei Dobrovol'skij Korpora gesprochener Sprache für die wichtigste Quelle phraseologischer Untersuchungen hält. Insbesondere Dobrovol'skijs theoretische Überlegungen zur computergestützten Phraseographie sind als äußerst positiv zu würdigen. Die Umsetzung als Idiomdatei ist zwar in vielen Punkten noch erweiterbar, weist aber auch sehr vielversprechende Eigenschaften auf. Zu den vorteilhaften Eigenschaften zählt insbesondere die Möglichkeit eines systematischen Zugangs über die Inhaltsseite der Phraseologismen ebenso wie die Erfassving von Textbelegen. Diese sind aber nicht auf Belege gesprochener Sprache zu begrenzen, wie die Ausführungen in Abschnitt 5.3.2 gezeigt haben. Eine Kennzeichnung der syntaktischen Funktion des jeweiligen Phraseologismus, also der Funktion des Phraseologismus als verbales, nominales, adjektivisches oder adverbiales Satzglied, fehlt hingegen in Dobrovol'skijs Datenbasis. Zu den unvorteilhaften Eigenheiten der Struktur der Eingabemaske ist überdies die konstante Anzahl an Stichwortfeldern und Eingabefeldern für Deskriptoren zu rechnen: So halte ich es beispielsweise für sinnvoll, einen Phraseologismus wie nicht alle Tassen im Schrank haben Vinter den fünf bedeutungstragenden Komponenten alle, Tassen, Schrank, nicht und haben zu verzeichnen. Daß jede noch so komplexe Idiombedeutung mit fünf Deskriptoren beschrieben werden kann, halte ich zudem für fragwürdig. Darüber hinaus läßt die allein auf Deskriptoren beruhende Bedeutungsangabe keinen Schluß auf eine etwaige Bedeutungsstrukturierung zu, sondern behandelt die Bedeutung als Komplex. 7.2.2
Phrase-Manager
Innerhalb eines komplexeren Softwaresystems stellt die eigenständige Komponente Phrase Manager eine Spezifikationsumgebung für die syntaktischen Eigenschaften idiomatischer Ausdrücke dar, die letztlich zu deren Identifikation im Text dient. Phrase Manager bildet zusammen mit Word Manager ein System zur Identifizierung der in einem Eingabesatz auftretenden flektierten Wörter, der Textwörter, und deren Abbildung auf Grundformen (vgl. Pedrazzini 1994, Pedrazzini/ten Hacken 1994). In diesem Anwendungskontext stellen Phrase Manager und Word Manager auf der einen Seite ein Datenbanksystem auf der anderen Seite eine Wissensspezifikationsumgebung u.a. für polylexikalische Elemente dar. Während die Komponente Word Manager die morphologische Analyse vornimmt, ist die hier vorrangig interessierende Komponente Phrase Manager für die Analyseschritte zuständig, in denen die Abbildung von Textwörtern zu Lexikoneinträgen nicht 1:1 ist. Anhand der Abb. 38. möchte ich kurz den anvisierten Analysevorgang erläutern. Ausgangspunkt der Analyse ist die Eingabe eines Textsatzes, der in Textwörter separiert ist. Die Komponente Clitics erkennt Textwörter, die aus mehr als einem Element bestehen - wie beispielsweise im Fall einer Infinitivkonstruktion mit zu im in auf-zusuchen. Die meisten Eingabewörter werden von dieser Komponente nicht berührt. Word Manager analysiert die resultierende Liste lexikalischer Wortformen morphologisch, wobei das Resultat für jede Wortform zum einen die Grundform ist, zum anderen die Liste der Merkmale, die die Position im Flexionsparadigma bestimmen. Im Falle mehrerer Möglichkeiten werden alle weitergegeben.
168
Phrase Manager t
Clitics
Per. Infi.
Idioms
v
Output
Input Word Manager
Abb. 38. Analyse mit einer Phrase Manager und einer Word Manager Datenbasis (Abbildung entnommen: Pedrazzini/ten Hacken 1994)
Die Analyse von Mehrworteinheiten in der Komponente Phrase Manager erfolgt in zwei Schritten: die Komponente Perlnfl ("periphrastic inflection") erkennt periphrastische Konjugationen wie beispielsweise die Tempora Futur, Plusquamperfekt usw., die aus zwei oder mehr Textwörtern zusammengesetzt sind, im Grunde aber eine Wortform eines Einzelwortlexems darstellen. In dieser Komponente wird die Wortkombination hatte genommen beispielsweise als Plusquamperfekt des Lexems nehmen analysiert. Daran schließt sich die Analyse der Komponente Idioms an, die Mehrwortlexeme in der Weise analysiert, daß beispielsweise die Form hatte genommen als eine Form des Verbs nehmen in dem Ausdruck hatte zur Kenntnis genommen erkannt wird. Die Komponente Idioms überprüft in diesem Fall, ob alle spezifizierten Bedingungen für ein bestimmtes Mehrwortlexem zutreffen. Wenn dies der Fall ist, liefert sie neben der wörtlichen auch die idiomatische Analyse als Ergebnis zurück, in dem einfach das entsprechende Lemma des Mehrwortausdrucks zusammen mit den übrigen Analyseergebnissen ausgegeben wird. Die Ausgabe von Phrase Manager bilden demnach die analysierten Textwörter, deren Grundformen und Kombinationsvorschläge dieser Elemente. Phrase Manager selbst stellt die Regeln, auf denen der Analysevorgang der unterschiedlichen Teilkomponenten Clitics, Perlnfl und Idioms beruht, nicht von sich aus zur Verfügung, sondern ist als Werkzeug zur Spezifizierung dieser Regeln zu verstehen. Die Entwicklung einer Phrase-Manager Datenbasis erfolgt in drei Schritten: • Generierung einer neuen leeren Datenbasis durch den Linguisten • Generierung einer Regelbasis durch den Linguisten • Generierung einer lexikalischen Datenbasis durch den Lexikographen auf Basis der vom Linguisten erzeugten Regeln. Während der Komplex Word Manager ebenso wie die Komponenten Clitics und Perlnfl in diesem Zusammenhang nicht weiter interessieren, sollen die Spezifikationsmöglichkeiten der Komponente Idioms genauer betrachtet werden. Innerhalb der Idzoms-Komponente können Idiomklassen definiert werden, wobei vom System keine Vorgaben gemacht werden, welche Art polylexikalischer Sprachkonstrukte als Idiom zu betrachten sind und welche nicht. Diese Festlegung bleibt
169 letztlich dem Linguisten überlassen, der über seine Regeldefinitionen bestimmt, welche mehrgliedrigen Elemente Phrase Manager als Grundform erkennt. Damit ermöglicht das System prinzipiell, alle sprachlichen Elemente als idiomatisch zu betrachten, die von einem Sprecher auswendig gelernt werden müssen. Phrase Manager ist nicht mit einem Parser ausgestattet, sondern die syntaktische Struktur der idiomatischen Ausdrücke wird direkt durch den Linguisten spezifiziert. Der Syntaxbaum des zu spezifizierenden Elements wird in kanonischer Form angegeben. Zur Spezifikation von Abweichungen von der eingetragenen Lemmastruktur sind drei Regeltypen vorgesehen: • Hinsichtlich ihrer Flexion können die im Lemma auftretenden Elemente dahingehend spezifiziert werden, ob sie in allen Formen des Flexionsparadigmas auftreten können oder ob sie auf bestimmte Erscheinungsformen beschränkt sind. • Wortstellungsvariationen können als Operationen auf Baumstrukturen beschrieben werden. Dazu ist von Phrase Manager der Regeltyp Transformationen vorgesehen. • Mit Hilfe des Regeltyps Modifikation kann in Phrase Manager für jedes Element des Lemmas spezifiziert werden, ob es durch Einfügung eines anderen Elementes modifiziert werden bzw. ob es durch eine beschränkte Menge anderer Elemente ersetzt werden kann. Im Hinblick auf den letzten Regeltyp wird demnach nicht zwischen den hier in Abschnitt 4.2 unterschiedenen Varianten und Modifikationen differenziert. Eine Idiomklasse ist definiert durch einen gemeinsamen Strukturbaum und Transformationsregeln, die allen Elementen gemeinsam sind. Pedrazzini und ten Hacken haben festgestellt, daß die Anzahl der Idiomklassen äußerst stark ansteigt, wenn die Forderung aufgestellt wird, daß alle Elemente einer Idiomklasse die gleichen Modifikationsmöglichkeiten besitzen sollten. Aus diesem Grund wird zwischen globalen und individuellen Modifikationen unterschieden, wobei es dem Linguisten überlassen ist, diese Unterscheidung sinnvoll einzusetzen. Nach Erstellung der Regelbasis durch den Linguisten ist es Aufgabe des Lexikographen, einzelne Lexikoneinträge gemäß der festgelegten Regeln zu spezifizieren. Er hat dabei zu entscheiden, ob es sich bei einer Wortgruppe um ein mehrgliedriges Element handelt oder um eine freie Wortverbindung. Wenn ein Mehrwortlexem vorliegt, stellen sich für den Lexikographen folgende Fragen: Welche Elemente gehören fest zum Lemma? Zu welcher Idiomklasse gehört das Mehrwortlexem, d.h. welche syntaktische Struktur weist es auf, welche Transformationen und welche globalen Modifikationen sind zulässig? Welche Flexionsformen können auftreten und welche weiteren individuellen Modifikationen und Ersetzungen sind möglich? Erst nach expliziter Spezifikation des linguistischen Regelinventars und nach Erstellung einer auf dieser Grundlage basierenden Datenbasis ist Phrase Manager für den oben beschriebenen Analysevorgang einsatzfähig. Das System kann in der aufgezeigten Funktionalität - die mit der in Abschnitt 3.3.4 erläuterten FS-Analyse von Rothkegel zwar verwandt, aber wesentlich allgemeiner gestaltet ist - von anderen Programmsystemen genutzt werden.
170 Abschließend bleibt festhalten, daß mit Phrase Manager ein System zur Spezifikation und Repräsentation der syntaktischen Eigenschaften von Mehrwortlexemen zur Verfügung steht. Die Spezifikation semantischer und pragmatischer Aspekte von Mehrwortlexemen ist aufgrund der oben beschriebenen Zielsetzung von Phrase Manager - nämlich der Identifikation von Mehrworteinheiten im Text - nicht vorgesehen. Nachdem nun mit Dobrovol'kijs Idiom-Datei ein Softwaresystem aus dem Bereich der Phraseologieforschung und mit Phrase Manager ein System aus dem Bereich der maschinellen Sprachverarbeitung vorgestellt wurde, möchte ich im folgenden auf das im Rahmen dieser Arbeit entwickelte Lexikondatenbanksystem eingehen.
7.3 Die Zielsetzung von Phraseo-Lex Ein "Nachschlagewerk" prinzipiell neuer Art im Sinne Dobrovol'skijs (siehe Abschnitt 7.1), das "ohne Computereinsatz überhaupt nicht denkbar" wäre, stellt das im Rahmen dieser Arbeit entwickelte Lexikondatenbanksystem Phraseo-Lex schon aus dem Grund dar, daß es in seiner Zielsetzung unterschiedliche Benutzergruppen vereint: für den Phraseologieforscher dient Phraseo-Lex als Werkzeug zur Erfassung und Erforschung verbaler Phraseologismen, dem Wörterbuchschreiber dient es als phraseographische Informationsquelle und im Bereich der maschinellen Sprachverarbeitung steht es als maschinelles Zusatzlexikon - im Sinne der Idiomliste Weinreichs - in Ergänzung zum einfachen Lexikon zur Verfügung. Dem traditionellen Linguisten soll Phraseo-Lex in erster Linie als Werkzeug dienen, daß eine computergestützte Erfassung verbaler Phraseologismen ermöglicht. Anhand des von Phraseo-Lex bereitgestellten Kriterienkatalogs, der aus den Überlegungen in den vorangegangenen Kapiteln resultiert und speziell auf die Eigenschaften von Phraseologismen ausgerichtet ist, erfolgt eine systematische Erfassung des Phraseologismus bei Aufnahme in die Datenbank. Im Sinne Wotjaks, die als traditionelle Linguistin ihren theoretischen Ansatz zur systematischen Beschreibung verbaler Phraseologismen "als eine Art Überwörterbuch im Vorfeld unmittelbar praktischer Anwendungen" betrachtet wissen will, ist auch Phraseo-Lex zu verstehen, nämlich "als ein einheitlicher Filter, den eine jede Einheit zu durchlaufen hat" (1992:88). Ist eine phraseologische Datenbasis einmal erstellt, ergeben sich für Phraseo-Lex Phraseo-Lex weitere Verwendungsmöglichkeiten: Zum einen können auf der Basis der in der Datenbank abgelegten Phraseologismen anschließend inhaltliche und formale Vergleiche der vorliegenden Daten vorgenommen werden und vermutete Zusammenhänge zwischen den unterschiedlichen phraseologischen Informationen überprüft werden. Zum anderen kann Phraseo-Lex im Bereich der Computerlinguistik als Ergänzung der maschinellen Lexika verschiedener Grammatiksysteme eingesetzt werden. Dabei ist allerdings davon auszugehen, daß nicht alle im Rahmen einer traditionell-linguistischen Erfassung abgelegten Informationen auch für den computerlinguistischen Einsatz interessant sind. Daher können aus den in Phraseo-Lex repräsentierten Informationen über eine programmiersprachliche Schnittstelle die für den computerlinguistischen Einsatz relevanten Daten extrahiert werden.
171 Im folgenden möchte ich nun zunächst die linguistischen Kriterien zusammenstellen, die in die Entwicklung von Phraseo-Lex eingeflossen sind. Nachdem dann die Grobstruktur des Systems vorgestellt wurde, wird die Erfassung phraseologischer Lexikoneinträge mit Hilfe des Systems erläutert. Anschließend wird die vom System vorgesehene Auswertungsfunktionalität, die auf bereits erfaßten phraseologischen Einträgen operiert, aufgezeigt und beispielhaft der Einsatz von Phraseo-Lex in der maschinellen Sprachverarbeitimg gezeigt.
7.4 Spezifikation eines phraseologischen Lexikoneintrags In den Kapiteln 2 bis 5 habe ich die unterschiedlichen Aspekte von Phraseologismen beleuchtet. Im folgenden wird ein phraseologischer Lexikoneintrag, wie er anschließend auch in Phraseo-Lex umgesetzt wird, spezifiziert. Während einige Kriterien auf Basis der hier erarbeiteten Ergebnisse auf eine vorgegebene Auswahl von Werten beschränkt sind, besteht bei anderen die Möglichkeit einer Erweiterung der möglichen Werte durch Benutzer und Benutzerinnen. 7.4.1 Das Lemma und die Basislexeme An die Spitze des phraseologischen Lexikoneintrags möchte ich - wie auch in konventionellen Wörterbüchern üblich - das Lemma stellen, das gewöhnlich identisch mit der internalisierten Nennform des Sprachverwenders ist. In Kapitel 4.1.3 ist allerdings bereits erörtert worden, daß die traditionelle Nennform Mängel aufweist, die daraus resultieren, daß die Subjektposition bei einem großen Teil verbaler Phraseologismen nicht lexikalisiert ist, obwohl sich dieser fehlende Aktant als notwendige Bedingung für den richtigen Sprachgebrauch erweist. Daß die in der Valenztheorie sonst üblichen Satzmodelle zwar diesen Nachteil wettmachen, dafür aber den Nachteil nach sich ziehen, daß das Verb des Phraseologismus in flektierter Form im Wörterbuch aufgeführt ist, so daß Partikelverben wie aufbinden, heimzahlen usw. in aufgetrennter Form angegeben werden müssen, wurde bereits in Kapitel 4.1.3 diskutiert. Da die flektierte Form des Verbs aus diesem Grund für Phraseo-Lex als nicht angemessen erachtet wird, habe ich für die Lemmastruktur eine Kombination aus traditioneller Nennform und Satzmodell gewählt. 2 Dazu werden zunächst die hier vorrangig behandelten verbalen Phraseologismen auf syntaktischer Ebene in die beiden Klassen VPL1 (Verbaler PhraseoLogismus) und VPL2 unterteilt. Unter VPL1 werden verbale Phraseologismen mit wendungsexternem Subjekt zusammengefaßt. Für das Lemma in Phraseo-Lex wird bei Phraseologismen des Typs VPL1 die traditionelle Nennform durch jmd., etwas oder jmd./etivas für das Subjekt ergänzt, wie die Beispiele (183)-(185) zeigen. Als VPL2 werden die festen prädikativen Konstruktionen klassifiziert, die sich durch ein wendungsinternes Subjekt und eine feste prädikative Struktur auszeichnen und wie in (186)-(187) als Lemma in die Datenbank aufgenommen werden.
2
Die Datenbasen Dobrovol'skij gehen diesem Nachteil durch gleichzeitige Einführung von Idiom-Nennform und Idiom-Aussageform - wie in Abschnitt 7.2.1 dargestellt - aus dem Weg.
172 (183) VPLl: (jmd./etwas) jmdm. Steine in den Weg legen( S t e i n (184) VPLl: (jmd.) jmdm. einen Bären aufbinden ( B ä r
aufb
Weg
legen)
inden)
(185) VPLl: (etwas) jmdm. die Sprache verschlagen (Sprache, verschlagen) (186) VPL2: jmdm. raucht der Kopf (Kopf, rauchen) (187) VPL2: bei jmdm./etwas ist Hopfen und Malz verloren (Hopfen, Malz, verloren, sein)
Um auch von lexikalischer Ebene aus einen Zugriff auf die phraseologischen Lexikoneinträge zu ermöglichen, werden alle Lemmata zusätzlich durch die Menge der an der gesamten Wendung partizipierenden Basislexeme indiziert, was ebenso aus den oben gezeigten Beispielen (183)-(187) hervorgeht. Damit ist es unter anderem für einen Parser möglich, von Lexemebene aus die verschiedenen Einträge abzurufen, wenn eine Vorverarbeitung der Textwörter durch ein System wie beispielsweise Word Manager erfolgt ist. Als Basislexeme eines phraseologischen Lemmas schlage ich vor, alle an der Nennform partizipierenden lexikalischen Wörter, also Nomen, Verben, Adjektive und Adverbien in ihrer Grundform, d.h. Verben unflektiert im Infinitiv bzw. Substantive im Nominativ Singular anzugeben. Damit übernehmen die Basislexeme ebenso wie das Lemma die Funktion von Schlüsselwörtern. Während jedoch einem Basislexem - wie beispielsweise Bock - mehrere phraseologische Lexikoneinträge zugeordnet sein können, repräsentiert das Lemma den eindeutigen Schlüssel eines phraseologischen Datenbankeintrags. 7.4.2 Die Grobstruktur des phraseologischen Lexikoneintrags Die bisherigen Ausführungen legen eine hierarchische Strukturierung des phraseologischen Lexikoneintrags nahe, an dessen Spitze das oben spezifizierte Lemma und die zugeordneten Basislexeme als dominierende Elemente stehen. Als primäre Beschreibungsebenen in Phraseo-Lex möchte ich die klassische Gliederimg in Syntax, Semantik und Pragmatik vornehmen. Dies führt zu der in Abb. 39. gezeigten baumförmigen Grobstruktur des phraseologischen Lexikoneintrags.
Paraphrase Syntaktischer Typ Semantischer Typ
[Syntax^
Pragmatik
Abb. 39. : Grobstruktur eines phraseologischen Lexikoneintrags
173 Die im weiteren zu erläuternden Elemente syntaktischer und semantischer Typ ebenso wie die Paraphrase als zentrales Element der Bedeutungsdarstellung nehmen im Konzept eine wichtige Position ein und werden daher allen übrigen Beschreibungselementen vorangestellt. 7.4.3 Die syntaktische Beschreibungsebene Nach den Ausführungen in Kapitel 2,3 und 4 gehen folgende wesentlichen Elemente in die syntaktische Beschreibungsebene des phraseologischen Eintrags ein. Ein Überblick über die gesamte syntaktische Beschreibungsebene findet sich in Abb. 40.
Abb. 40. Beschreibungseinheiten auf der syntaktischen Ebene
Syntaktischer Typ Die aufgezeigte Klassifikation der Phraseologismen in VPL1 und VPL2 ist als syntaktische Klassifikation des Eintrags - hier auch als syntaktischer Typ bezeichnet - zu betrachten. Hiermit wird die syntaktische Grundstruktur des Phraseologismus festgelegt, denn im Hinblick auf eine phrasenstrukturelle Markierung handelt es sich bei einem Phraseologismus des Typs VPL1 aufgrund des wendungsexternen Subjekts um einen Verbalphrasenknoten und bei einem Phraseologismus des Typs VPL2 aufgrund des wendungsinternen Subjekts um einen Satzknoten. Damit nehmen diese Phrasenstrukturknoten in der in Kapitel 3.1 gezeigten Phrasenstrukturgrammatik unterschiedliche Positionen ein: nämlich VP —> VPL1 und S —» VPL2. Spezifikation des Syntaxbaumes Die Spezifizierung der internen syntaktischen Struktur eines als VPL1 bzw. als VPL2 klassifizierten Phraseologismus erfolgt durch Angabe des Phrasenstrukturbaums, der das zentrale Element der syntaktischen Beschreibungsebene bildet. Dieser legt - wie in Abschnitt 3.1 und 4.1.1 beschrieben wurde - die Konstituentenstruktur des Phraseologismus fest, wie beispielhaft in Abb. 41. und Abb. 42. gezeigt wird.
174 VPL1 [+idiom, +inf, ... NP_akk mdiom, +mod, ...1
S [+idiom, +inf,...] '
. ! , „ , I!,,,,.,·,,
Det
aufbinden
[ +id¡om,...] einen
Bären
Abb. 41. Beispiel eines VPLl-Phrasenstrukturbaums mit Merkmalslisten
Die Phrasenstrukturknoten können durch benutzerdefinierbare Attribute ergänzt werden. Vorbild für solche benutzerdefinierbaren Merkmale zur Beschreibung von spezifischen syntaktischen Eigenschaften der entsprechenden Konstituente können das von Katz definierte Merkmal [+ idiom], die von Fraser definierten Merkmale der Frozenness-Hierarchie oder Weinreichs Merkmale [- pass] bzw. [ - Τ Ν Ο Π ^ Ι ^ Π ^ ] sein (vgl. Kapitel 3.3.2). Es können grundsätzlich beliebige Kennzeichnungen wie beispielsweise [+ mod] für modifizierbar, [+ ex] für austauschbar oder [!] für syntaktisch anomale Konstruktionen bzw. [+ inf] für eine Konstruktion im Infinitiv usw. festgelegt werden.
VP [•idiom,...] I
NP_nom
[+idiom, +quant,
der
Nfcl [+idiom,...l J
ff·*?' 1 [+idiom, -inf...] I
KoDf
raucht
I
NP_dat M
—
Abb. 42. Beispiel eines VPL2-Phrasenstrukturbaums mit Merkmalslisten
Zu der in Kapitel 4.1.3 geforderten Markierimg im Hinblick darauf, ob ein im Lemma auftretendes Pronomen wie etwas oder jemanden eine Variable darstellt, die im Sprachgebrauch meistens durch eine konkrete Nominalphrase ersetzt wird, oder ob es sich dabei um einen weitgehend festen Bestandteil des Phraseologismus handelt, wie in den Fällen etwas auf dem Kerbholz haben oder nach etwas ausehen zu vermuten ist, möchte ich folgende Konvention einführen: Ein in der Nennform variabel auftretendes Pronomen wie in jmdm. einen Bären aufbinden bzw. der Kopf raucht jmdm. wird nicht in die Spezifizierung des Phrasenstrukturbaumes aufgenommen, sondern lediglich
175 als Phrasenknoten - hier NP_akk bzw. NP_nom - markiert, während ein zum festen Bestandteil des Phraseologismus zählendes Pronomen bis auf Wortebene spezifiziert wird. Valenz- bzw.
Abhängigkeitsstruktur
Bei Einhaltung der genannten Konvention brauchen Art und Anzahl der wendungsinternen und wendungsexternen Valenzen eines Phraseologismus nicht explizit kodiert werden. In Kapitel 4.1.1 wurden die Zusammenhänge und Unterschiede zwischen der Phrasenstruktur und der Valenzstruktur erörtert. Bei Definition des Phrasenstrukturbaums gemäß der zuvor genannten Konventionen ist die beim jeweiligen Phraseologismus vorliegende Aktantenstruktur implizit durch die Spezifizierung der syntaktischen Struktur kodiert und kann daher automatisch abgeleitet und damit explizit gemacht werden. Während schon durch die Definition als VPL1 und VPL2 der Status des Subjekts - also NP_nom - als wendungsinterne oder wendungsexterne Valenz festgelegt wird, kann die übrige Valenzstruktur daraus abgeleitet werden, welche Knoten bis auf Wortebene spezifiziert werden und welche als syntaktisch spezifizierte Phrasenknoten in der internen syntaktischen Struktur des Phraseologismus angegeben sind. Fakultative Valenzen können nur dann erfaßt werden, wenn (sie ins Lemma aufgenommen und) in der syntaktischen Struktur spezifiziert werden. Sie können beispielsweise über ein benutzerdefinierbares syntaktisches Merkmal im Phrasenstrukturbaum als fakultative Valenzstellen gekennzeichnet und damit von obligatorischen Valenzen unterschieden werden. Stabilitätsphänomene Informationen zu den in Kapitel 2.2 beschriebenen Stabilitätsphänomenen, zu denen transformationeile Defekte, syntaktische Oberflächenanomalien und unikale Komponenten zählen, werden - wie in Abb. 43. gezeigt - systematisch in drei Untergruppen erfaßt. Die Umformungsoperationen zum Passiv, Relativsatz (Abtrennung), Imperativsatz sowie Nominalisierung und Satznegation können als zulässig, nicht-zulässig oder unentscheidbar klassifiziert werden. Angaben zur Umformung in einen Fragesatz der Form "was für ein ...", Angaben zur Konstituentennegation, zur Expansion durch Attribute und zur Quantifizierung einer Konstituente werden - da sie sich auf unterschiedliche Konstituenten des Phraseologsimus beziehen können - durch Zuordnung der jeweiligen Konstituente bzw. Konstituenten als zulässig bzw. als unzulässig definiert.Die in einem Phraseologismus auftretenden syntaktischen Anomalien werden als vorhanden erfaßt und eventuelle unikale Komponenten3 als solche gekennzeichnet. 3
Im Hinblick auf die maschinelle Verarbeitung natürlicher Sprache ist darauf hinzuweisen, daß dadurch, daß unikale Komponenten in ihrem Auftreten auf Phraseologismen beschränkt sind, ihr Kontext im höchsten Maße vorhersagbar und fest ist. Daher können sie bei der maschinellen Verarbeitung natürlicher Sprache zum einen als Indikator dienen, ob ein Phraseologismus vorliegt oder nicht, zum anderen können sie in den meisten Fällen als eindeutiges Schlüsselwort im Lexikon fungieren, was zu einer Verkürzung der Suche im Lexikon führt.
176
Stabilität 1
Syntaktische Anomalien |
-
Passivtransformation Relativsatztransformation Imperativsatz Nominalisierung Satznegation Fragesatztransformation Konstituentennegation Expansion durch Attribute Quantifizierung
• Pronomen ohne pronominale Fkt. • Vorrangesteliter Genitivgebrauch • Fehlen des Artikels - Nomen mit Genitivmorphem - Unflektierter Adjektivgebrauch - Anomalie bei Präpositionen • Obligatorische Negationskonstituente • Valenzabweichung
Unikale Komponeten |
Angabe der unikalen Komponente(n)
1
Abb. 43. Stabilitätsphänomene
Varianten Zu jedem durch das Lemma definierten phraseologischen Eintrag können strukturelle und lexikalische Varianten des Phraseologismus vermerkt werden. In Abschnitt 4.2.1 wurde ein äußerst enger Variantenbegriff definiert, der fordert, daß zwischen Variante und Lemma keine semantisch-konnotativen Unterschiede vorliegen. Damit ist es möglich, die Varianten als Nebenlemmata zu betrachten, für die im Prinzip dieselben phraseographischen Eintragungen gelten wie für das jeweilige Hauptlemma. Allerdings wird unterschieden zwischen lexikalischen Varianten wie sich eine Hintertür/ ein Hintertürchen offenhalten/offenlassen und strukturellen Varianten wie jmdn. aufs/auf das Abstellgleis schieben bzw. die Nase voll haben und die Nase gestrichen voll haben. Während für erstere der gesamte phraseographische Eintrag des Hauptlemmas gültig ist, weichen letztere in ihrer syntaktischen Struktur vom spezifizierten Phrasenstrukturbaum mindestens in einem Punkt ab. Mit Festlegung der Varianten wird die sonst übliche Anordnung in Wörterbüchern durchbrochen, und kovariante Formen ohne Bedeutungsunterschied werden an einer Stelle zusammengestellt. 7.4.4 Die semantische Beschreibungsebene In die semantische Beschreibungsebene eines phraseologischen Eintrags gehen insbesondere die Überlegungen aus den Kapiteln 4 und 5 ein, zum Teil aber auch einige ergänzende Überlegungen dazu. Ein Überblick über die gesamte semantische Beschreibungsebene findet sich in Abb. 44.
177
Semantik
Klassifikation!
Paraphrase
I Struktur I
^rtgke^jj
Modifikation
Synonyme & Antonyme
Grobklassifikation Motivierbarkeit Mehrdeutigkeit
(komponentennahe) Hauptparaphrase Uste weiterer Paraphrasen
Referentenpotential semantisch autonomer Komponenten
Semantische Bestimmung der Valenzstellen Merkmalslisten
Modifikationsmöglichkeiten: Adjektivattribute Genitivattribute
phraseologische Synonyme phraseologische Antonyme
Abb. 44. Beschreibungseinheiten auf der semantischen Ebene
Semantische Klassifikation Die semantische Klassifikation erfolgt im Hinblick auf die Zugehörigkeit zu einer der semantischen Grobklassen nicht-kompositioneller, teil-kompositioneller und übertragenkompositioneller Phraseologismen, deren genaue Spezifikation in Kapitel 5.3.1 erfolgt ist. Die Grobklasse wird hier auch als semantischer Typ bezeichnet. Im Hinblick auf Motivierbarkeit kann ein Phraseologismus wie in Kapitel 5.1 erörtert nach unmotivierbar, teilmotivierbar, metaphorisch motivierbar und direkt motivierbar untergliedert werden.4 Die Motivierbarkeit bildet - wie bereits in Kapitel 5.1 erörtert ein sehr individuelles Kriterium bei Erfassung eines Lexikoneintrags. Zudem kann zu jedem Lexikoneintrag angegeben werden, ob er semantisch mehrdeutig ist oder nicht. Paraphrasierung Die Bedeutungsangabe eines Phraseologismus erfolgt auf der Basis einer zentralen Paraphrase, die ich hier als Hauptparaphrase bezeichnen möchte. Die Bildung der möglichst komponentennahen - Hauptparaphrase sollte auf der Grundlage der in Kapitel 5.3.1 erarbeiteten Ergebnisse erfolgen, d.h. das referentielle Potential vorhandener semantisch autonomer Komponenten sollte bei der Paraphrasierung angemessen berücksichtigt werden. Neben der speziell ausgezeichneten Hauptparaphrase können alle weiteren Paraphrasen inklusive Bedeutungsnuancen erfaßt werden, wobei diese keinen Bildungsbeschränkungen unterliegen. 4
Gegenwärtig wird - auf Anregung von Munske [persönliche Notizen] - geprüft, inwieweit es sinnvoll ist, bei den metaphorisch motivierbaren Phraseologismen, Angaben zum Bildspenderbereich der Metapher in Phraseo-Lex onomasiologisch zu erfassen. Als Angaben zu somatischen Phraseologismen könnten allgemein Markierungen wie "menschlicher Körperteil", "menschliche Geste" verzeichnet sein und spezieller: Hand als Zeichen der "Versöhnung", Hand als Zeichen des "Nehmens" usw. Kennzeichnungen dieser Art sind sprach- und kulturvergleichend von Interesse.
178
Semantische
Struktur
Mit der Paraphrasierung allein erfolgt noch keine Bedeutungsstrukturierung für den Fall eines iibertragen-kompositionellen bzw. teilkompositionellen Phraseologismus. Eine Möglichkeit der Strukturierung eines verbalen Phraseologismus auf semantischer Ebene besteht - wie in Kapitel 4 bereits erwähnt - in der Zuordnung semantischer Rollen zu den bereits syntaktisch spezifizierten wendungsexternen Valenzen. Darüber hinaus können die im Lemma auftretenden wendungsinternen Valenzen durch Zuweisung bzw. Nicht-Zuweisung einer semantischen Rolle als semantisch autonom bzw. nicht semantisch autonom gekennzeichnet werden. Dieses Vorgehen ist möglich, weil semantisch autonome Komponenten - wie in Kapitel 5 und 6 deutlich wurde - den Status von Argumenten besitzen, während die Konstituenten eines nicht-kompositionellen Phraseologismus keine Argumente (Quasi-Argumente) darstellen. Wird eine wendungsinterne Konstituente durch Zuweisimg einer semantischen Rolle als semantisch autonom deklariert, besteht die Möglichkeit, der Komponente des Lemmas explizit das jeweilige Referentenpotential zuzuordnen. Diesen gesamten Vorgang bezeichne ich als Strukturzuweisung. Als Beispiele dafür werden die beiden übertragen-kompositionellen Phraseologismen (jmd.) jmdm. einen Bären aufbinden und (jmd.) den Bock zum Gärtner machen in Abb. 45. und Abb. 47. gezeigt sowie in Abb. 46. ein Beispiel für den nicht-kompositionellen Phraseologismus die Flinte ins Korn werfen angegeben. Lemma:
Rolle:
Referenten:
NP_nom:
jmd.
Agens
|md.
NP_dat:
jmdm.
Adressat
jmdm.
NP_akk:
Bären
Patiens
Lügengeschichte, Lüge, Lügenmärchen
Abb. 45. Strukturzuweisung bei einem übertragen-kompositionellen Phraseologismus mit Angabe einer Menge von Verbalisierungen des Referenten
Bei der Zuweisung des Referentenpotentials ist beliebig wählbar, ob eine Menge von Verbalisierungen des Referentenpotentials wie in Abb. 45. oder lediglich das in der Hauptparaphrase verwendete sprachliche Material wie in Abb. 47. zugeordnet wird. Die Bestimmung der semantischen Rollen orientiert sich an der figurativen Bedeutung der semantisch autonomen Komponenten und nicht an der literalen! Es wurde in Kapitel 4 darauf verwiesen, daß es kein allgemeingültig festgelegtes Inventar semantischer Rollen gibt. Daher ist in Phraseo-Lex neben der Zuweisung einer semantischen Rolle aus einem Inventar weitgehend akzeptierter Rollen wie beispielsweise Agens, Patiens, Instrument, Adressat, Ort usw., die Zuweisung einer unspezifischen semantischen Rolle möglich, wie in Abb. 47. durch "Rolle" im Gegensatz zu "keine Rolle" in Abb. 46. gezeigt wird. Insbesondere die semantischen Rollen semantisch autonomer Komponenten sind noch genauer zu untersuchen.
179 Lemma:
Referenten: Agens: Paraphrase
jmd.
keine Rolle keine Rolle
Abb. 46. Strukturzuweisung bei einem nicht-kompositíonellen Phraseologismus
Rolle:
Lemma:
Paraphrase
Referenten:
Agens:
jmd.
Rolle:
ungeeignete Person
Rolle:
zu übernehmende Funktion
Abb. 47. Strukturzuweisung durch unspezifische Rollen
Zum Zweck der maschinellen Sprachverarbeitung ist die Kodierung der Bedeutungsstruktur als Menge logischer Formeln vorgesehen, wie sie beispielhaft in Abb. 48. gezeigt wird. Zunächst wird aus dem Lemma automatisch eine logische Formel abgeleitet, die die Stelligkeit der phraseologischen Gesamtstruktur aus wendungsinterner und wendungsexterner Valenz aufweist. Wenn für eine Konstituente des Lemmas keine Rolle definiert wird, geht diese Konstituente als Quasi-Argument in die automatisch generierte Formel ein. Zu dieser Formel hat eine formale Kodierung der Bedeutung des Phraseologismus zu erfolgen, zu der einerseits das sprachliches Material aus der Hauptparaphrase, also das Prädikat, das auf die geltende Relation referiert, und die Konstituenten, die die Referenzträger der Relation bezeichnen, und die Konstituenten genutzt werden sollte. Zum anderen können aber auch darüber hinaus geltende Restriktionen kodiert werden können: Lemma:
Automatisch:
Festzulegen:
(jmd.) Blech reden: (jmd.) ins Gras beißen: (jmd ) jmdm. einen Bären aufbinden: (jmd. ) einen Bock schießen: (jmd) die Flinte ins Korn werfen: (jmd) einen Streit vom Zaun brechen
reden(_,_) beißen(_, ins Gras) aufbinden(_,_,_) schießen(_,_) werfen(_, die Flinte, ins Korn) brechen(_,_,vom Zaun)
(reden(X,Y) blödsinn(Y)) /sterben(X)) {erzählen(X, Y,Z) lügengeschichtef Y)j {machen(X, Y)fehler(Y)) (aufgeben(X)) (beginnen(X,Y) streit(Y) = M, unbedingtM) j
Abb. 48. Kodierung der semantischen Struktur des Phraseologismus in ein logisches, masehineninterpretierbares Format
180 Semantische
Wertigkeit
Nähere semantische Spezifikationen der Valenzstellen - zusätzlich zur Angabe einer semantischen Rolle - sind in der semantischen Wertigkeit möglich. Hier können benutzerdefinierbare semantische Merkmale jeglicher Art erfaßt werden. Vorstellbar sind hier semantische Spezifizierungen der wendungsexternen und wendungsinternen Konstituenten als [+ abstrakt], [+ institutionell]. Hier können aber auch - wie in Abschnitt 4.1.3 gefordert - ganz spezifische Merkmale wie beispielsweise [+ Uhr] oder [+ weiblich] definiert werden, die den wendungsexternen Subjektnominalphrasen der Phraseologismen (etwas) nach dem Mond gehen bzw. (jmd.) die Hosen anhaben zugeordnet werden können. Modifikation Eigentlich nicht mehr lexikographisch erfaßbar sind Modifikationen semantisch autonomer Komponenten im Hinblick auf Adjektiv- und Genitivattribute. Sie fallen in den Bereich der systematischen Modifikationen. So schreibt beispielsweise auch Burger: "Gar nicht in einen Lexikonartikel gehören m. E. Angaben zu dem, was wir (Burger et al., 1982, 68ff) 'Modifikationen' genannt haben. [...] Was hier möglich,was unmöglich ist, ist nur sehr beschränkt prognostizierbar und deshalb kein Gegenstand der Lexikographie" (1989:598). In Kapitel 5 wurden aber bereits einige Wechselwirkungen zwischen den Modifikationsmöglichkeiten und der Bedeutungsstrukturierung von Phraseologismen aufgezeigt. 5 Um zu einer regelbasierten Beschreibung solcher Phänomene zu gelangen, halte ich zum gegenwärtigen Zeitpunkt die Erfassung solcher Modifikationsmöglichkeiten durch explizite Angabe der Modifikationselemente zu jeder semantisch autonomen Komponente im Rahmen einer systematischen Erfassung phraseologischer Eigenschaften für sinnvoll. Nur so sind m. E. weitere systematische Zusammenhänge analysierbar. In diesen Punkt geht die Erfassung der Phraseologismen allerdings über eine rein lexikographische bzw. phraseographische hinaus. Synonyme & Antonyme Schließlich können auf semantischer Ebene Verweise auf phraseologische Synonyme und phraseologische Antonyme erfolgen, wie sie in Kapitel 4.2.1 von Varianten abgegrenzt wurden. Als phraseologische Synonyme habe ich zum einen Phraseologismen mit Formgemeinsamkeiten, die sich aber in Konnotationen unterscheiden, wie den Mund halten/die Schnauze halten betrachtet. Zum anderen zählen Phraseologismen ohne Formgemeinsamkeiten, die aus völlig unterschiedlichen figurativen Bereichen hervorgehen, wie jmdm. einen Bären aufbinden/jmdn. auf die Schippe nehmen zu den Synonymen. Gleiches gilt für phraseologische Antonyme, zu denen sowohl phraseologische Gegensatzpaare wie aufs richtige Pferd setzen/aufs falsche Pferd setzen als auch jmdm. einen Bären aufbinden/jmdm. reinen Wein einschenken zu zählen sind. 6
5
Siehe beispielsweise die Überlegungen zu den Vogel abschießen, in dem bei der Konstituente den Vogel ein zugrundeliegender Superlativ als Referent angenommen wurde, der m. E. eine Quantifizierung der Konstituente verhindert. Genaueres siehe Abschnitt 5.3.2.3.
181 7.4.5
Die pragmatische Beschreibungsebene
Die hohe Ausdrucksstärke von Phraseologismen, die diese insbesondere von ihren nicht-phraseologischen Umschreibungen unterscheidet, legt neben einer Beschreibung auf syntaktischer und semantischer Ebene auch eine Beschreibung auf der Ebene der Pragmatik nahe. Palm, die sich mit der Beschreibung von "Konnotationen sozialer, emotionaler, regionaler und historischer Art" befaßt, hält eine Differenzierung der denotativen und konnotativen Bedeutungskomponenten für "durchaus machbar" (1992:104)7 Mit dem Begriff Konnotation beziehe ich mich in diesem Zusammenhang wie Palm auf solche Bedeutungskomponenten, die in der Bedeutungsstruktur eines Phraseologismus enthalten sind, weniger auf Konnotationen als Performanzerscheinungen, die während des Gebrauchs von Phraseologismen auftreten. Auf der pragmatischen Beschreibungsebene in Phraseo-Lex können aus diesem Grund Informationen zu den in Abb. 49. dargestellten Bereichen für jeden phraseologischen Eintrag erfaßt werden. Pragmatik
Konnotationen
ergänzbare Liste: wertneutral scherzhaft ironisch verhüllend drohend
Diasystematik
Verwendungssituation
Beispiele
Diatopische Info |
Diastratische Info I
Diaphasische Info
ergänzbare Liste: bayerisch fränkisch sächsisch schwäbisch westfälisch
ergänzbare Liste:
ergänzbare Liste:
ergänzbare Liste:
ergänzbare Liste:
Gaunersprache Jugendsprache Seemannsprache Studentensprache Kindersprache
normalsprachlich bildungssprachlich gehoben umgangssprachlich salopp
unspezifisch Streit Diskussion polltische Rede
in Textkorpora auftretende Belegbeispiele
Abb. 49. Beschreibungseinheiten auf der pragmatischen Ebene
6
Gegenwärtig wird eine Erweiterung der semantischen Beschreibungsebene durch eine zusätzliche Komponente ins Auge gefaßt, die - auf allgemeinere Weise als die Paraphrase - in Form von inhaltssignalisierenden Stichwörtern die Bedeutung der Redewendung andeuten. Phraseologismen wie jmdm. den Kopf waschen, jmdm. eine Standpauke halten, jmdm. die Leviten lesen usw. können beispielsweise mit einem Stichwort bzw. Bedeutungssignal wie "Tadel" gekennzeichnet werden. Das Inventar an Bedeutungssignalen ist vom Benutzer festzulegen und sollte erweiterbar sein. Diese Komponente kann als onomasiologischer Index genutzt werden und stellt hinsichtlich einzelner oder einer Menge zuvor definierter Bedeutungssignale synonymische Phraseologismen automatisch zusammen. Dies ist vergleichbar mit dem Deskriptor 1 bis 3 bei Dobrovol'skij, wird im Gegensatz zu ihm hier aber lediglich als zusätzliche Bedeutungsangabe bzw. als zusätzlichen Bedeutungszugang genutzt werden.
7
Der Versuch einer konnotativen und denotativen Semanalyse wird in Palm (1992) an einer beschränkten Anzahl verbaler Phraseologismen unternommen.
182 Allgemeine
Konnotationen
Insbesondere beim Versuch der Paraphrasierung von Phraseologismen wird deutlich, daß einem nichtphraseologischen Synonym häufig konnotative Aspekte emotionaler oder allgemeiner Art fehlen. Daraus erklärt sich m. E., warum linguistische Laien wie ich festgestellt habe - bei Aufforderung zur Bedeutungserläuterung eines Phraseologismus häufig anstatt auf eine Paraphrase auf einen anderen Phraseologismus zurückgreifen. Ein Phraseologismus wie sich nicht gerade mit Ruhm bekleckern kann beispielsweise als "ironisch" und "wertend", ein Phraseologismus wie sich nicht entblöden, etwas zu tun als "abwertend" gekennzeichnet werden. Viele Phraseologismen weisen auch einen Aspekt der "Verhüllung" auf, um damit bestimmte Begriffe zu vermeiden bzw. unausgesprochen zu lassen, aber mitverstanden zu wissen: Beispiele dafür sind sich auf seine vier Buchstaben setzen zur Vermeidung des Wortes Popo, guter Hoffnung sein anstatt schwanger sein und viele Phraseologismen, die mit Tod oder Sterben in Verbindung stehen wie seine letzte Reise antreten, jmdn. zur letzten Ruhe betten, jmdn. zur letzten Ruhe geleiten. Das Beschreibungsinventar zur Kennzeichnung emotionaler und allgemeiner phraseologischer Konnotationen in Phraseo-Lex ist frei definierbar. Diasystematische
Angaben
Diasystematische Angaben zur landschaftlichen Einordnung, stilistischen und schichtspezifischen Markiertheit eines phraseologischen Lexikoneintrags werden getrennt voneinander erfaßt. Auch hier ist in allen diasystematischen Bereichen das Beschreibungsinventar vom Benutzer frei definierbar. Diatopische Angaben Es besteht die Möglichkeit, ein Inventar an diatopischen Kennzeichnungen wie süddeutsch, bayerisch, westfälisch oder auch einfach allgemein landschaftlich festzulegen, mit dem eine landschaftliche Einordnung von Phraseologismen, die auf bestimmte Lokaldialekte beschränkt sind, vorgenommen werden kann. Beispiele für solche in ihrem Auftreten regional beschränkten Phraseologismen sind über die Schnur hauen für "übermütig werden", auf die Rolle gehen für "ausgehen und etwas besonderes unternehmen", sich ein Gewerbe suchen "unter einem Vorwand eine Beschäftigung in der Nähe anderer suchen, um etwas zu erfahren" (vgl. Drosdowski 1992). Diaphasische Angaben Darüber hinaus lassen sich Phraseologismen insbesondere im Hinblick auf den Sprachstil unterscheiden. So sind im Duden-Redewendungen beispielsweise alle Phraseologismen mit den Lexemen Schnauze, Scheiße, Arsch wie zum Beispiel in jmdm. die Schnauze polieren, jmdm. in den Arsch kriechen, sich in den Arsch beißen, jmdm. steht die Scheiße bis zum Hals als "derb" markiert, während die Phraseologismen sich Asche aufs Haupt streuen, Atem holen, jmdn. zu Rate ziehen, jmdn. zur letzten Ruhe geleiten als "gehoben" und Phraseologismen wie den Rubikon überschreiten, in medias res gehen als "bildungssprachlich" gekennzeichnet werden. Des weiteren erhalten Phraseologismen
183 wie einen Schuß machen im Sinne von "kräftig wachsen", bei jmdm. war schon der Sandmann im Sinne von "jmd. ist müde" die Kennzeichnung "familiär" und die Phraseologismen wie mit jmdm. Rücksprache halten/nehmen und jmdn. namhaft machen werden im Duden-Redewendungen als "Papierdeutsch" bezeichnet. Die häufigste Markierung für Phraseologismen scheint allerdings die Kennzeichnung "umgangsprachlich" zu sein. Diastratische Angaben Ein Inventar diastratischer Markierungen dient zur Kennzeichnung von Phraseologismen, die aus Sprachsystemen bestimmter Subkulturen hervorgehen, wie beispielsweise "Fachsprachen, die eine Berufsgruppe aus bestimmten Bezeichnungsnotwendigkeiten entwickelt" oder "Sondersprachen, die Subkulturen (Gauner, Soldaten, Seemänner, Schüler, Studenten) von vorneherein zur Stärkung der inneren Kohäsion und der Abgrenzung nach außen nutzen" (Schlieben-Lange 1991:89f). Ein Phraseologismus der Gaunersprache ist beispielsweise jmdn. auf den Schub bringen in der Bedeutung "jmdn. zwangsweise abschieben" (vgl. Drosdowski 1992:639). Zahlreich sind die Beispiele für Phraseologismen der Jugendsprache, von denen viele Wendungen insbesondere "die Höhe des Intelligenzquotienten eines Gesprächspartners" betreffen (Müller-Thurau 1985:146) wie beispielsweise einen an der Waffel/Klatsche haben, einen Schatten haben, einen Schuß haben, ein Schoß raus haben, ein Rad ab haben usw. Aber auch Phraseologismen aus anderen Themenbereichen wie die Haßkappe aufsetzen für "wütend werden", eine Show abziehen für "sich aufspielen", eine/die Fliege machen " für verschwinden/abhauen", auf dem Schlauch stehen für "begriffsstutzig sein/nichts verstehen" zählen zur Jugendsprache. Verwendungssituation Als weiteres besteht die Möglichkeit, für bestimmte phraseologische Einträge Situationen und Kontexte wie politische Diskussionen, Streit, Sportreportagen usw. zu spezifizieren, in denen bestimmte Phraseologismen vorrangig verwendet werden. So findet sich beispielsweise im Duden-Redewendungen eine Eingrenzung der Verwendungssituation beim Phraseologismus die Hosen runterlassen auf Skatspiel, der in diesem Zusammenhang "bei einem [Null-]ouvert-Spiel die Karten auflegen" bedeutet; im Bereich des Sports finden sich Phraseologismen wie jmdn. auf die Reise schicken "jmdm. [beim Fußball] eine weite Vorlage geben", jmdn. vom Platz stellen in der Bedeutung "jmdn. nicht mehr mitspielen lassen", jmdn. auf die Plätze verweisen in der Bedeutung "besser abschneiden als andere", auf der Gewinnerstaße sein "im Begriff sein, zu gewinnen" (vgl. u.a. Drosdowski 1992). Beispiele Insbesondere in Kapitel 4 und 5 ist deutlich geworden, daß die Zusammenstellung von Verwendungsweisen von Phraseologismen in realistischen Textbelegen eine geeignete Grundlage theoretischer Überlegungen darstellt. Daher können in PhraseoLex zu jedem phraseologischen Eintrag, realistische Textbeispiele erfaßt werden, auf
184 deren Basis die Überlegungen zu Paraphrasierung, Modifikationsmöglichkeiten usw. erfolgen können. Dazu kann für jeden einzelnen Phraseologismus ein kleines Textkorpus angelegt werden. Letztendlich kann unter anderem aus diesem Grund ein phraseologischer Eintrag nie als "vollständig" betrachtet werden.
7.5 Struktur des Systems Phraseo-Lex Da das System Phraseo-Lex - wie in Abschnitt 7.3 bereits erläutert wurde - zum einen für die Zielgruppe der Computerlinguisten, zum anderen für traditionelle Linguisten entwickelt wurde, ist es sinnvoll, eine Strukturierung in verschiedene Moduln vorzunehmen. Die Interessen der beiden Zielgruppen beziehen sich auf verschiedene Ebenen des Phraseo-Lex-Systems. Während für den traditionellen Linguisten insbesondere eine komfortable und einfach zu erlernende Schnittstelle zum Programm wünschenswert ist, ist der Computerlinguist zudem an einer definierten Softwareschnittstelle interessiert. Um diese Anforderungen zu erfüllen, ist eine Gliederung des Systems Phraseo-Lex in zwei eigenständige Komponenten erforderlich, siehe Abb. 50.
((
Datenbankkern
SCHEME/PROLOG Abb. 50. Grobstruktur des Systems
Phraseo-Lex
185 Das zentrale Element von Phraseo-Lex bildet dabei der Datenbankkern, der die gesamte Funktionalität des Systems realisiert. Die zweite Komponente ist durch eine interaktive graphische Bedienoberfläche gegeben, mit der die Funktionen des Datenbankkerns dem menschlichen Benutzer zur Verfügung gestellt werden. Insbesondere erfolgt über diese Bedienoberfläche die systematische Erfassung der phraseologischen Lexikoneinträge, wie in Abschnitt 7.6 beispielhaft gezeigt wird. Der Datenbankkern ist dabei als die universelle Komponente des Systems zu verstehen, die auch in andere Programmsysteme eingegliedert werden kann - beispielsweise als ein Zusatzlexikon, mit dem das gewöhnliche Lexikon eines sprachverarbeitenden Systems ergänzt wird. Der Datenbankkern beinhaltet alle notwendigen Funktionen zur Verwaltung und Pflege des Datenbestandes. Dazu werden Operationen zum Neueintragen, Modifizieren und Löschen von phraseologischen Einträgen sowie zum gezielten Suchen nach einer Vielzahl von Kriterien und deren Kombinationen über eine auch von anderen Softwaresystemen verwendbare Programmschnittstelle zur Verfügung gestellt. Die vom Kern bereitgestellten Suchfunktionen bilden die Basis für Auswertungen des Datenbestandes. Ein fremdes Programmsystem ersetzt quasi das Bedienoberflächenmodul und greift auf die Programmschnittstelle des Kerns zu - wie in Abb. 51. gezeigt.
( (
Datenbankkern
SCHEME/PROLOG
Abb. 51. Das System Phraseo-Lex mit Grammatiksystem
Phraseo-Gramm
186 Um dem fremdem System eine homogene Schnittstelle zur Verfügung zu stellen, liegen sowohl eine vollständige Implementierung des Kerns in PROLOG als auch im LISP-Dialekt Scheme vor - den beiden Programmiersprachen, die im Bereich der maschinellen Sprachverarbeitung wohl am verbreitesten sind. Auf eine Beschreibung der programmiersprachlichen Schnittstellen wird in Rahmen dieser Arbeit verzichtet. Diese kann der Implementierungsarbeit von Dormeyer (1994) entnommen werden. Die Implementierungen sind im überwiegenden Maße so realisiert, daß Struktur und Namenskonventionen der Programmodule in beiden Versionen gleich sind. Um die computerlinguistische Verwendungsfähigkeit von Phraseo-Lex zu überprüfen, wurde die Beispielimplementation eines Grammatikregelsystems - PhraseoGramm - von Löser (1994) realisiert. Sie basiert auf der Definite Clause Grammar (DCG) der Programmiersprache PROLOG und dient als Testkomponente zum Parsen einfacher Sätze des Deutschen mit und ohne Phraseologismen. Ein Weiterentwicklung von Phraseo-Gramm erfolgte von Balzer (1995). Darüber hinaus wurde Phraseo-Lex in einen bereits implementierten Chart-Parser integriert, womit die Eignung von Phraseo-Lex als idiomatisches Zusatzlexikon im maschinllen Sprachverarbeitungsprozeß verifiziert werden soll. Eine genaue Beschreibung dessen erfolgt in Abschnitt 7.7.2.
7.6 Erfassimg von Lexikoneinträgen in Phraseo-Lex Im folgenden möchte ich die Erfassung eines Lexikoneintrags anhand der Bedienoberfläche erläutern. Ausgangspunkt für das Arbeiten mit der Oberfläche ist das in Abb. 52. gezeigte Intro-Fenster. Von hier aus ist es gegenwärtig möglich, die Datenba-
Abb. 52. Das Introfenster von Phraseo-Lex
sis zur Bearbeitung der Lexikoneinträge zu öffnen bzw. das System wieder zu verlassen. Zudem ist bereits eine Möglichkeit zum Aktivieren des Suchvorganges8 vorgesehen, der in Abschnitt 7.7 erläutert wird. Nach dem Öffnen der Datenbank gelangt man zu dem in Abb. 53. gezeigten Fenster, über das die Spezifikation eines neuen Lexikoneintrags sowie das Löschen, Anzeigen und Ändern von bestehenden Einträgen erfolgt. Im Falle Löschen, Anzeigen
187
Abb. 53. Übersicht über phraseologische Lexikoneinträge
oder Ändern wird die Festlegung des betreffenden Eintrags durch Auswahl aus einer Liste bereits eingetragener Lemmata vorgenommen. Sollen Änderungen an den Einträgen vorgenommen werden oder ein Neueintrag erfolgen, erscheint das sogenannte Phraseo-Kurzinfo-Fenster (siehe Abb. 55. unten), das einen kurzen Überblick über die wesentlichen Informationen des Lexikoneintrags erlaubt.
Hierarchischer Aufbau der Bedienoberfläche In Analogie zur in 7.4.3 Abb. 39. gezeigten Grobstruktur des phraseologischen Lexikoneintrags ist auch der strukturelle Aufbau der Bedienoberfläche hierarchisch konzipiert, wie aus Abb. 54. ersichtlich wird. Die grau 9 hervorgehobenen Knopfleisten signalisieren, daß es von der jeweiligen Ebene aus möglich ist, weitere Informationen über den phraseologischen Lexikoneintrag zu spezifizieren bzw. abzurufen. Das Phraseo-Kurzinfo-Fenster repräsentiert die Wurzel der Hierarchie, in dem das Lemma als eindeutiges Schlüsselelement des Eintrags, die Paraphrase, der syntaktische und semantische Typ sowie die Basislexeme angezeigt werden. Das Phraseo-Kurzinfo-Fenster ist Integrationspunkt der zentralen Information eines Lexikoneintrags, von dem aus 8
9
Das Startfenster eröffnet zusätzlich die Möglichkeit, sich eine erweiterbare Liste von Metakommentaren, die im Kontext von Phraseologismen auftreten, anzeigen zu lassen. Diese Liste kann unabhängig von den Lexikoneinträgen erweitert und gelöscht werden. Zudem ist es möglich, sich die Liste aller unikalen Komponenten anzeigen zu lassen, die in den bereits eingetragenen Phraseologismen enthalten und als solche beim Erfassen des Lexikoneintrags markiert worden sind. Im Orginal sind diese Knopfleisten blau.
auf die syntaktische, semantische und pragmatische Beschreibungsebene zugegriffen werden kann. Diese vier zentralen Komponenten, Phraseo-Kurzinfo, Syntax, Semantik und Pragmatik sind in ihrem Aufbau ähnlich gestaltet. Phraseo-Kurzinfo
Der Eingabedialog zum Phraseo-Kurzinfo-Fenster Beim Eintragen und Ändern eines Lexikoneintrags erscheint zusätzlich zum PhraseoKurzinfo-Fenster ein Eingabedialog, der zur Spezifikation der im Phraseo-KurzinfoFenster anzuzeigenden Informationen dient. Dieser wurde notwendig, um Abhängigkeiten zwischen Erscheinungsform und Reihenfolgebeziehungen im Phraseo-KurzinfoFenster zu vermeiden. Über den Eingabedialog wird zunächst die Nennform des zu spezifizierenden Eintrags festgelegt. Der syntaktische Typ VPL1 oder VPL2 ist wie bereits in Abschnitt 7.4.1 erwähnt für die Zusammensetzung des Lemmas von Bedeutung, da abhängig von ihm, das Lemma aus der Nennform und - falls vorhanden - dem wendungsexternen Subjekt aufgebaut wird. Wird der Phraseologismus als VPL1 klassifiziert, muß
die Art des wendungsexternen Subjekts aus den Möglichkeiten jemand, etwas bzw. jemand/etwas ausgewählt werden. Bei der Klassifikation des Eintrags als VPL2 entfällt dieser Schritt.
Phnttstw-Lex
gH
1
Phraseo-Kurdnfo
ijPMi.i . jed». einen Β«eren aufbinden Pcffe^vaBu:
jad·, eine Luegengeechichte erzeehten
t
Hare I
Verb 1 £-»inF,»Idiom)
aufbinden\I
Γ. -o ru hi'isckn'n
leinenf
Beeren i
T.tjú'ij^tii
m x z z i z
Afebruck i
Abb. 56. Zentrales Fenster der syntaktischen Beschreibungsebene
Der Phrasenstrukturbaum ist so definiert, daß es jederzeit einen aktuellen Knoten gibt, der invertiert dargestellt wird und den Bezugspunkt bzgl. des Einfügens, Löschens und Kopierens von Knoten bildet. Um die Fehlerquellen beim Erstellen des Baumes gering zu halten, ist auf den Knoten ein grobes Regelsystem definiert, daß bestimmte Knoten je nach aktuellem Knoten als nicht-selektierbar vordefiniert und damit die Auswahl bestimmter Knoten je nach Art des Bezugsknotens verbietet. Beispielsweise ist es nicht möglich, an einen VPLl-Knoten einen NP_nom-Knoten anzuhängen, da VPL1 kein wendungsinternes Subjekt enthält. An Wortartenknoten kann ausschließlich, ein lexikalisches Element angefügt werden, da Wortartenknoten keine weiteren Phrasen oder Wortarten dominieren können. Die Angabe eines einzelnen lexikalischen Elementes erfolgt über einen kurzen Eingabedialog, der die Beschriftung der Blattelemente im Baum definiert. 10
Ein Pop-up-Menü ist ein zunächst nicht sichtbares Menu, das erst durch Betätigung einer Maustaste in einem speziellen Bereich des Fensters erscheint.
192 Über den optionalen Menüpunkt Eigenschaften des in Abb. 56. gezeigten Pop-upMenüs öffnet sich der Dialog in Abb. 57. Mit diesem wird zum einen die Zuordnung nmä
w
FT~
î S
Merkmale »Idiom •Inf •mod +quant
1
Loschen .
I 1 Abbruch 1
!
Liste erweitern j j I _.. 1
Merkmale eintragen j ;j _
¡1
Abb. 57. Dialog für die Zuordnung syntaktischer Merkmale
benutzerdefinierbarer Merkmale zu Phrasen- und Wortartenknoten im Strukturbaum möglich. Zum anderen dient der Dialog zur Festlegung des Merkmalinventars. Als Alternative zur anschaulichen Baumdarstellung kann die syntaktische Struktur des Phraseologismus auch in Form einer Listendarstellung angezeigt werden, die der indizierten Klammerstruktur ("labelled brackets") aus Kapitel 3.1 entspricht.
Listendarxlellung
Anzahl der freien Valenzen:
VPLl
wrawhrngeextem: wrauhmgefartem:
F
J NP nom. NP dat NPakk
j OK|
OK
Abb. 58. Baunidarstellung als indizierte Klammerstruktur (links) Monitor zur Anzeige von Anzahl und Art der Valenzen (rechts)
Diese Schreibweise wird automatisch aus dem Phrasenstrukturbaum generiert und in einem nicht direkt veränderbaren Fenster - einem sogenannten Monitorfenster - angezeigt. Ebenso wie die Darstellung der indizierten Klammerstruktur erfolgen auch Angaben zur syntaktischen Valenz in einem Fenster, das lediglich als Monitor dient. Da sich - wie bereits in der Spezifikation erörtert - sowohl Anzahl als auch Art der wendungsinternen und wendungsexternen Valenzstellen automatisch aus dem Phrasen-
193 Strukturbaum ergeben, brauchen hier keine expliziten Angaben gemacht werden. Neben diesen beiden Monitorfenstern Valenz und Liste sind vom Hauptfenster der syntaktischen Beschreibungsebene die beiden weiteren syntaktische Beschreibungsebenen Stabilität und Varianten zu erreichen. Die Parameter zum Stabilitätsverhalten eines Phraseologismus werden innerhalb des in Abb. 59. gezeigten Fensters festgelegt. Dieses ist gemäß der Spezifikation in 7.4.3 in die drei Bereiche transformationeile Defekte, syntaktische Anomalien und unikale Komponente gegliedert. Die Attributwerte zu den verschiedenen Operationen der transformationellen Defekte werden entweder durch ein Optionenmenü spezifiziert, das die Werte möglich, nicht möglich und unentscheidbar anbietet oder erfolgen durch Angabe einer oder mehrerer Komponenten, auf die sich die jeweilige Operation beziehen kann.
Syntaktische Stabilität:
¡T
Syntaktische Anomalien
Transformatione!!« Defekte
Passlvtransforwtfon
«osi ich
i»leti«a«trwisfonwUoii
söglich
Imperaiivsatz
«Sài ich
Noainahsierunä
nicht möglich
Satznegation
HÖglich
Fragesatztransfor nation
Schnlppchari
Konstituentainesation
Schntppctoi
Expansion durch St tributi
Schnippchmi
anuesenci J Prvraœn
olire prononinale Funktion
J Vm-areertellt« Genitivattribut J fehl«! ties frtlkeìs J Noesi Mt Genitlvnorphe» J Unflektierter MjektiYgebrauch ΛfinoMhebei Präpositionen J Obligatorische Ne-aationskonstituente Ψ Valeniabueichunâ
Ûuantifizierune linikale Komponente
anwesend
ja
Γ
Ein%cn[ Létdtai j
Schnippchen
JEll Abb. 59. Bedienoberfläche zum Erfassen der syntaktischen Stabilitätsphänomene
Innerhalb der vorgegebenen Liste möglicher syntaktischer Anomalien kann das Vorliegen einer solchen beim phraseologischen Lexikoneintrag markiert werden. Im Lemma enthaltene unikale Komponenten müssen vom Benutzer explizit angegeben
194 werden. Sie werden beim Abspeichern des Gesamtlexikoneintrags in eine globale Liste eingetragen, mit deren Hilfe man sich einen Überblick über alle in der Datenbank befindlichen unikalen Komponenten verschaffen kann. Die strukturellen und lexikalischen Varianten eines phraseologischen Lexikoneintrags werden mit Hilfe des in Abb. 60. gezeigten Fensters erfaßt. Die jeweilige Nennform der kovarianten Formen ist dort einzugeben.
Varianten Nennform:
sich eine Hintertuer offenhalten
Strukturelle
Löschen j
Einfügen i
LexBu&K&e sich eine Hintertuer offenlassen sich ein Hintertuerchen offenlassen
j si eli ein Hintertuerchen offenhalter}
"
Ή
OK j
Abb. 60. Oberflächenelement zur Erfassung der Varianten
Erfassung der Attributwerte auf der semantischen Beschreibungsebene Die Charakterisierung der semantischen Eigenschaften eines phraseologischen Lexikoneintrages erfolgt in dem in Abb. 61. gezeigten Fenster, in das das Lemma, die Paraphrase und der semantische Typ aus dem Phraseo-Kurzinfo-Fenster übernommen werden. Als Äquivalent zum Phrasenstrukturbaum auf syntaktischer Beschreibungsebene bildet auf semantischer Ebene - wie in der Spezifikation festgelegt - die Strukturzuweisung die zentrale semantische Repräsentation. Zur Spezifikation der semantischen Struktur werden die syntaktischen Spezifizierungen der Valenzstellen im Phrasenstrukturbaum zusammen mit der jeweilig zugeordneten Konstituente des
195 Lemmas automatisch aus der syntaktischen Ebene übernommen. Aus diesem Grund sollte - wie bereits erwähnt - die syntaktische Ebene vor der semantischen Ebene bearbeitet werden. Für jede wendungsexterne Konstituente ist zu entscheiden, welche semantische Rolle ihr zukommt und mit welchem Pronomen sie in der Paraphrase erscheint. Für die wendungsinternen Konstituenten des Lemmas ist zu entscheiden, ob sie semantisch autonom sind. Die Festlegung, daß eine wendungsinterne Konstituente nicht semantisch autonom ist, erfolgt durch die Zuweisung keine Rolle aus dem Optionenmenü. In diesem Fall wird kein Textfeld zur Festlegung des Referentenpotentials eröffnet. Ist die wendungsinterne Komponente semantisch autonom, wird dies durch die Zuweisung einer Rolle aus dem Optionenmenü gekennzeichnet. Daraufhin erscheint ein Textfeld, in dem das Referentenpotential der Konstituente festgelegt werden kann. Ist die semantische Rolle einer semantisch autonomen Komponente oder einer wendungsexternen Konstituente nicht eindeutig festlegbar, kann aus dem Optionenmenü der Menüpunkt Rolle selektiert werden: Hiermit wird die Konstituente als sematisch relevant spezifiziert und die Möglichkeit der Eingabe des Referentenpotentials ermöglicht; die semantische Rolle ist damit jedoch als unspezifisch definiert.
Sein antik
fíuxtseo-Lex
Lemma:
ΐ jrod..! I jmd». einen Baerer. aufbinden
Paraphrase:
j jmdi». eine Luegengeschichte erzaehlen
semantiechcr Typ: uebertragen-komposstioneB Semantiche Repräsentation Rollen NPjwnn: 4«d. NP_dat: N'Pakk: einen Baeren aufbinden« ,_> Uüfe i
->
Agens Ö
Klassifikation
Wertet*
Refer eut cneibtxibiun^ Ijrad.
Adressat -J ! Ijndx.
! i! Sl
Modifikation Paraphraaerungen Synonyme Sc Antonyme
£ine Luegengeschichte erzaehlen luegengeschictlteíZÍ ; AMttudi
.2Ξ]
Abb. 61. Zentrales Fenster zur semantischen Beschreibungsebene
Unterhalb der Zuordnung der Lemmakonstituenten zu den Paraphrasenkonstituenten wird automatisch aus dem Verb des Lemmas und dessen Gesamtstelligkeit eine logische Formel gebildet. Wählt man bei der Rollenzuweisung keine Rolle aus und klassifiziert damit eine wendungsinterne Konstituente als nicht semantisch autonom,
erscheint diese automatisch als (Quasi-)Argument in der logischen Formel. Vom Benutzer hat in diesem Zusammenhang eine computerinterpretierbare Festlegung der Bedeutungsstruktur des Phraseologismus mit Hilfe einer Menge logischer Formeln auf der Basis des sprachlichen Materials der Hauptparaphrase in Form zu erfolgen. Vom zentralen Fenster der semantischen Beschreibungsebene können die weiteren Dialoge zur Spezifikation von semantischen Informationen wie Klassifikation, Semantische Wertigkeit, Modifikationsmöglichkeiten, weitere Paraphrasierungen und Synonyme und Antonyme erreicht werden. In die semantische Klassifikation wird der semantische Typ eines phraseologischen Lexikoneintrags übernommen. Zudem sind die Parameter zur Motiviertheit und zur Mehrdeutigkeit eines Phraseologismus aus den vorgegebenen Werten der Optionenmenüs zu spezifizieren.
Klassifikation: Nennform:
j jmdm. einen Baeren aufbinden
sementischer Typ :
u**b«Hrt* »igen - kompo sManeB
Motiviertheit
n i c h t motivierbar
Mehrdeutigkeit:
reehrd«uti9
-1 |
n i c h t mehrdeutig OK
Abbruch j
J
Abb. 62. Klassifikationsfenster
Zusätzlich zur Hauptparaphrase können in dem in Abb. 63. gezeigten Dialogfenster weitere Paraphrasen ohne Bildungsrestriktionen eingegeben werden.
weiter« Paraphrasen Nennform:
I jmdm. e i n e n Baeren aufbinden
Lä«dun
Einfügen I
OK|
Abbruch
Abb. 63. Der Paraphrasen-Dialog
197 Desweiteren besteht mit Hilfe des Fensters Semantische Wertigkeit die Möglichkeit, jede semantische Rolle mit benutzerdefinierbaren semantischen Merkmalen auszuzeichnen. Die in der semantischen Repräsentation festgelegten Rollen werden automatisch in die in Abb. 64. (links) gezeigten Listen übernommen, die nach wendungsextern und wendungsintern differenziert sind. Die Zuordnung der gewünschten Merkmale zu den Rollen gestaltet sich derart, daß zunächst entsprechende Kriterien in der Merkmalsliste ausgewählt werden müssen. Die Zuweisung erfolgt bei Selektion der Rollen. Mit Hilfe des Synonyme & Antonyme-Fensters in Abb. 64 (rechts) können phraseologische Synonyme und Antonyme eines Lexikoneintrags eingegeben bzw. angesehen werden. Dabei können mehrere Synonyme bzw. Antonyme angegeben werden. m semantische Wertigkeit Nennform;
Synonyme und Antonyme
j jmdm. einen Baeren aufbinden Nennform:
| jmdfo. einen Eaeren aufbinden
vanAdigsexter»;
Synonyme
figensi +be 1 ebt,+i nst i t ut i one 11, -*-mens Empfänger < +be1ebt,+i nst i tut i onel1,*
n . auf d i e Schippe nehmen judri. auf den Ars nehmen jmdm. zu« Narren halten
Pat i erat •••abstrakt, +geaeussertes > ! Hl
I jndn. hinters Licht fuehrer!
Merkmale
Astonyme
•abstrakt •aktion •belebt •eigenschaft
•geaeussertes +institutionell
•mensch •Prozess Lüsche» AMmicK I
Liste erweitern
Losdien i
okJ
ÍM&gen
Abbruch
Abb. 64. Das Fenster zur Eingabe der semantischen Wertigkeit (links) Das Fenster zur Eingabe der Synonyme und Antonyme (rechts)
198 Der Dialog Modifikation in Abb. 65. dient zur Sammlung möglicher Modifikationselemente einzelner semantisch autonomer Komponenten eines Phraseologismus. Dabei wird zwischen Modifizierungen durch Adjektivattribute und Genitivattribute unterschieden. -JModifikation Nennform:
J jmdm. einer. Beeren aufbinden
Semantisch autonom·,
j Baeren Genitivattribute
AtÇektive
Zeitangabe
gross wunderschoen unglaublich schoeri
Loschen 1
Lösehen ΐ
Einfügen |
Semantìsch autonom: Cerätivattrflnrte
Adjektive
r
1
Löschen [
KM«l«en
Löschen i
Abbruch
Abb. 65. Modifikationsmöglichkeiten von semantisch autonomen Komponenten des Phraseologismus
Erfassung von Attributwerten zur pragmatischen Beschreibungsebene Neben den zentralen Fenstern der syntaktischen und semantischen Beschreibungsebene kann ausgehend vom Phraseo-Kurzinfo-Fenster das Pragmatik-Fenster erreicht werden, in dem es im Unterschied zu den ersteren beiden keine zentrale pragmatische Repräsentation gibt. Das in Abb. 66. gezeigte Pragmatik-Fenster dient lediglich als Verteiler zu den sechs pragmatischen Teilkomponenten, in denen zum einen Konnotationen, Verivendungssituationen, diaphasische, diastratische und diatopische Informationen zu dem jeweiligen phraseologischen Eintrag festgelegt werden können, zum anderen eine Sammlung von Belegbeispielen angelegt werden kann.
Die fünf Dialoge zur Erfassung von Konnotationen, Verwendungssituationen und den diasystematischen Informationen besitzen alle den gleichen Aufbau und die gleiche Funktionalität. Als Beispiel wird in Abb. 67. der Dialog zur Erfassung von Konnotationen dargestellt. "
τ:
I Phixtseo-Lrx
^ τ
.
Pragmatik
Lranna: J sich nicht gerade n i t Ruhm bekleckern
^^ 1 D ì a s y s t m a t ì s c h c Information;
Dtqßtaatahe WorMMtrm j Diasttatiwto Information Malopistäie Information
Abb. 66. Das Pragmatik-Fenster
Koimotationen sssgewâhlte Information ironisch herablassend wertend
Λ
mónche Information Λ
herablassend ironisch irritiert
I 1
scherzhaft verachtend verhuellend warnend wertend wertneutral Löschen
Löschen
j
• J / U s t e erweitern!
Abbruch
Abb. 67. Dialog zur Erfassung von Konnotationen
Eine Sammlung von Textbelegen kann mit Hilfe des in Abb. 68. gezeigten Dialogfensters erfolgen, in das die zu erfassenden Beispieltexte interaktiv eingegeben werden können.
Beispiele "Haider w i l l s t e n Luegeri! (Titelblatt
B a e r a n a u f b i n d e n ' So n i c h e ' IS Luegen in einem H e f t " Falter,
Stadtzeitung
Wien,
Seine
3(3.9
-
schoen6.10.94)
"Haiders d i c k s t e Baerei). W a h l k a m p f . L u e g e n . H a l b - und U n w a h r h e i t e n , Falschinform a t i o n e n : J o e r q H a i d e r g e h t b e i s e i n e n Wah1 k ä m p f a u f t r i t t e n n i c h t g e r a d e z i m p e r l i c h m i t F a k t e n um. E i n e Zusammenstellung der d i c k s t e n Baeren, d i e d e r FPOe-Chef d e n W a e h l e r n i n d e n v e r g a n g e n e n Wochen a u f g e b u n d e n h a t . " ( F a l t e r , S t a d t z e i t u n g Wien, 30.9 - 6 . 1 0 . 9 4 , S.8) " V i e l l e i c h t w i l l s i e uns auch n u r e i n e n B a e r e n a u f b i n d e n und i s t q u i e t s c h v e r g n u e g t b e i i h r e r F r e u n d i n ? " ( M a n n h e i m e r M o r g e n . 1 . 2 . 6 6 , S. 4 4 ) " I c h h a b e den v e r d a c h t , d a s s mein S c h w a g e r uns Baeren a u f b i n d e t . " (Mannheimer Morgen, 1 . 2 . 8 6 , "Wer ihnen wohl den (Mannheimer Morgen,
Baeren aufgebunden 16.7.87, S.28)
einen S.44)
hat?"
" D e r Mann m e r k t b a l d , m i t wem e r e s z u t u n h a t , und l u e g t m i t . A l l e n , d i e es a n g e h t , b i n d e t d e r E u l e n s p i e g e l e i n e n , wunderschoenen Baeren a u f . " (Neues D e u t s c h l a n d , 2 9 . 1 2 . 1 9 4 9 , S. 6 ) ]
Abb. 68. Das Fenster zur Erfassung eines kleinen Korpus an Beispielen
Im Vorangegangenen wurden die wesentlichen Elemente zur Eingabe eines phraseologischen Lexikoneintrags mittels der Bedienoberfläche beschrieben. Eine detailliertere Beschreibung der interaktiven Bedienung des Systems findet sich in der Implementierungsarbeit von Seifert (1994).
7.7 Anwendungsmöglichkeiten von Phraseo-Lex Im folgenden werden die beiden wesentlichen Anwendungen von Phraseo-Lex vorgestellt, die - neben der systematischen Erfassung von Phraseologismen - die Zielrichtung bei der Entwicklung dieses Werkzeugs vorgaben: zum einen die Such- und Auswertungsfunktionalität für die traditionelle Linguistik, zum anderen die Funktion als phraseologisches Zusatzlexikon in der maschinellen Sprachverarbeitung.
201 7.7.1 Nutzung der Such- und Auswertefunktionalität von
Phraseo-Lex
Um Abhängigkeiten zwischen Attributen zu ergründen, stellt der Datenbankkern von Phraseo-Lex eine allgemeine Suchfunktion zur Auswertung einer bestehenden phraseologischen Datenbasis zur Verfügung, die sämtliche Lexikoneinträge durchläuft und diejenigen herausfiltert, die allen vorgegebenen Anforderungen entsprechen. In diesem Zusammenhang besteht die Möglichkeit, ebenso einzelne Kriterien wie eine ganze Reihe von Kriterien anzugeben, die ein Lexikoneintrag erfüllen muß. Die Suchkriterien werden durch Angabe einer Menge von Attribut-Wert-Paaren definiert. Damit wird eine gezielte Zusammenstellung phraseologischer Datenbankeinträge möglich, was beispielsweise für die Auswertung der erfaßten Daten bezüglich eventuell bestehender Kausalzusammenhänge hilfreich sein kann. Die zur Suche verwendbaren Attribute sind alle in Abschnitt 7.4 aufgeführten Elemente eines phraseologischen Lexikoneintrags mit Ausnahme des Phrasenstrukturbaums und der Textbeispiele. Da diese beiden Attributwerte bereits die Nennform eines Eintrags enthalten, ist es wenig sinnvoll, diese als Kriterien für Suchanfragen einzusetzen. Es sind Suchanfragen möglich wie beispielsweise: Stelle alle Lexikoneinträge zusammen,... • ..., die eine wendungsinterne Komponente NP_akk besitzen und nicht passivierbar sind! • ..., in denen eine beliebige Komponente mit "groß" oder "viel" modifiziert werden kann! • ..., die eine obligatorische Negationskonstituente besitzen! Das Suchmuster zu einem Attribut wird über eine Operation und eine Menge von Teilwerten definiert. Dabei sind folgende Operationen möglich: • und:
Suche nach allen Einträgen, die alle angegebenen Teilwerte enthalten.
• oder:
Suche nach allen Einträgen, die mindestens einen der angegebenen Teilwerte enthalten.
• nicht:
Suche nach allen Einträgen, die den angegebenen Teilwert nicht enthalten.
• genau:
Suche nach allen Einträgen, die genau die angegebenen Teilwerte enthalten und keine weiteren.
• nicht leer:
Suche nach allen Einträgen, deren entsprechendes Attributfeld nicht leer ist.
Diese Operationen ermöglichen Datenbankanfragen mit Attributwertpaaren wie beispielsweise:
202 •
(Syntaktische Anomalie - nichtleer):
Mit diesem Paar werden alle Einträge, die syntaktische Anomalien aufweisen, identifiziert. •
(Basislexeme - oder[Auge, Bock, Kopf]):
Damit wird nach allen Einträgen gesucht, die eines der Basislexeme Auge, Bock oder Kopf enthalten. Wie sich letztere Suchanfrage auf der graphischen Bedienoberfläche realisieren läßt, zeigt Abb. 69.
Bitti Attribuwem «unrathlen Anfrage:
Keuj
¿ô^jbenj Attrîbutwcrte
Suchkriterien
Kurz info
Haart
Hals Hand H «zea Hintextuei Huele Kanone
Basislejcem* Syntaktisch« Typ Stmaatisclitr Typ H«Bj>tjiar«j>ii8se
Syntax Fme.Vadtn2f.ri ^ ¡tóeme Yrimen
Sache:
Start
Verknüpfungen
1
Ρ
ODER I :-i"i ^ I •¿•¿-κτ ) NICHT íSÉtí
Katze Kerbholz
j
Korb
Γ
Kragen Kram
OKj Abb. 69. Beispiel einer Suchanfrage in
Phraseo-Lex
Das Ergebnis der Suchanfrage zeigt Abb. 70. Die Suchoperation liefert als Resultat die Anzahl der gefundenen Einträge - hier 6 - sowie eine Liste der Lemmata dieser Einträge, mit deren Hilfe die vollständigen Einträge abgerufen werden können.
203
Ergebnis der Datenbanksuche (jmd.) einen Bock »chieisen (jmd.) jmdm. etwas vorÄugen halten (jmd.) den Bock, zum G seltner machen (Jmd.) jmdm, etwas anden Kopf werfen (jmd.) ein Auge auf jmdn/etwas werfen jmdm. raucht der Kopf
Assalti der getuiuieneal.tmm«t». 6
[Hilfe"!
Anzeigen) ABttemf Löschen}
Hl
Abb. 70. Phraseologismen, die als Ergebnis aus beispielhafter Suchanfrage resultieren
Eine Sonderstellung nehmen die Suchanfragen zu den Attributen semantische Struktur, semantische Wertigkeit und Modifikationen ein. Für solche Anfragen können die folgenden zusätzlichen Operationen angegeben werden: • Zuordnung:
Hierbei handelt es sich um eine Operation, die ausschließlich bei Fragen nach der Zusammensetzung der semantischen Struktur zur Anwendung kommt. Damit sind beispielsweise Fragen an die Datenbank möglich wie "suche alle Einträge mit einem Agent" bzw. "suche alle Einträge mit dem Referentenpotential Fehler".
• enthalt:
Mit dieser Operation kann nach Einträgen gesucht werden, zu denen eine gegebene Modifikationsmöglichkeit einer semantisch autonomen Komponente spezifiziert wurde.
Um komplexere Suchanfragen zu gestalten, ist es möglich, mehrere der zuvor gezeigten Suchwertpaare in einer einzigen Anfrage zu kombinieren, was einer Konjunktion der einzelnen Paare entspricht. Das Ergebnis ist in diesem Fall die Schnittmenge der Einzelsuchergebnisse. Neben der einfachen Suche auf der Datenbank ist es außerdem möglich, auf einen bereits durch eine vorherige Suche eingeschränkten Bereich der Datenbank, nach weiteren Kriterien zu suchen. Zusätzlich zur phraseologischen Datenbasis werden zwei weitere Arten spezifischer phraseologischer Informationen verwaltet. Zum einen besteht die Möglichkeit, metakommentierende sprachliche Elemente wie sprichwörtlich, im übertragenen Sinne, im
204 wahrsten Sinne des Wortes usw., die häufig im Kontext von Phraseologismen auftreten,unabhängig von den phraseologischen Lexikoneinträgen - zu sammeln. Zum anderen werden automatisch alle unikalen Komponenten in eine gesonderte Liste eingetragen, die jederzeit eingesehen werden kann. 7.7.2 Phraseo-Lex
als idiomatisches Zusatzlexikon im Sprachverarbeitungsprozeß
Der Scheme- bzw. Prolog-Datenbankkern von Phraseo-Lex wurde - wie bereits oben erwähnt - verschiedentlich auf seine computerlinguistische Verwendungsfähigkeit überprüft (vgl. Balzer 1995, Krüger 1995, Löser 1994). Beispielhaft dafür werde ich im folgenden die Integration von Phraseo-Lex in ein Chart-Parsing-System von Fischer, Geistert und Görz (1996) darstellen. Da ohne eine Kenntnis des Chart-Parsing-Systems die Darstellung der Integration von Phraseo-Lex in dieses System, nicht möglich ist, erfolgt zunächst ein kurzer Überblick über das verwendete System, dessen Verarbeitungsmechanismen und Datenstrukturen. 7.7.2.1
Merkmalstrukturen
Der verwendete Chart-Parser arbeitet auf dem in vielen Grammatiktheorien (HPSG, LFG, PATR Π) verwendeten Konzept der Merkmalstrukturen. Merkmalstrukturen sind Attribut-Wert-Paare wie sie auch Stock et al. (1993) in Abschnitt 6.2.2 verwenden. Einer Menge von Attributen werden Werte zugeordnet, wobei jedem Attribut höchstens ein Wert zugewiesen wird. Eine Merkmalstruktur kann demnach als partielle Funktion aus einer Menge von Attribute in eine Menge von Werten verstanden werden. Merkmalstrukturen dienen im Bereich der Linguistik dazu, grammatisches Wissen phonologischer, syntaktischer, semantischer und pragmatischer Art zu speichern. Da die den Attributen zugeordneten Werte nicht nur atomar, sondern auch selbst wieder Merkmalstrukturen sein können, können Merkmalstrukturen einen beliebiegen Grad an Komplexität annehmen. Als Pfad wird bei ineinander verschachtelten Merkmalstrukturen eine Folge von Attributen bezeichnet, die zu einem Wert führt, wie die Pfadnotationen rechts neben der Merkmalstruktur aufzeigen.
Klammernotation der Merkmalstruktur:
stem:
C =
agrm:
Pfadnotation der Merkmalstruktur:
C ( stem ) - Bock
Bock case:
nominative
gender:
mase
number:
singular
C ( agrm case) = nominative C ( agrm gender ) = mase C ( agrm number ) = singular
205 7.7.2.2 Das Grammatikregelsystem PATR II Das dem Chart-Parser zugrunde liegende Grammatikregelsystem stellt eine Erweiterung des PATR-II-Formalismus von Shieber (1986) dar. Shiebers Formalismus beruht auf der Grundlage der in Abschnitt 3.1 beschriebenen kontextfreien Phrasenstrukturgrammatiken von Chomsky. In PATR-II sind die kontextfreien Grammatiken um Merkmalstrukturen erweitert. Mittels Gleichungen können verschiedene Pfade der Merkmalstrukturen miteinander in Beziehung gesetzt werden. Daher besteht eine PATR-II-Produktion aus zwei Teilen: zum einen aus einem Regelteil, der festlegt, aus welchen Komponenten ein größerer Bestandteil zusammengesetzt ist; zum anderen einem Regelteil, der beschreibt, wie die zu den einzelnen Bestandteilen gehörenden Merkmalstrukturen miteinander in Beziehung stehen. S^NP
VP
(NP cat) = (VP cat) = (Scat) = (NP head agr) = (S head) =
np ψ s (VP head agr) (VP head)
Der zugrunde liegende Auswertungsmeachanismen über Merkmalstrukturen ist die Unifikation. Als Unifikation zweier Strukturen wird die einfachste Struktur bezeichnet, die beide Strukturen umfaßt. Gekennzeichnet wird die Unifikation durch das ekkige Vereinigungssymbol (u)· Im folgenden Beispiel ist die Struktur C Resultat der Unifikation der Strukturen A und B. Die Unifikation dieser Strukturen gelingt, da der in beiden Stukturen auftretende identische Pfad - hier (agrm case) - zu demselben bzw. zu einem vereinbaren Wert führt, wie hier nominative. Alle sich in beiden Strukturen unterscheidenden, aber nicht widersprechenden Pfade werden mit ihren zugehörigen Werten in die Ergebnisstruktur aufgenommen.
A=
stem: agrm:
Bock case:
U
nominative J
stem:
c =
agrm:
Β =
agrm:
Bock case:
nominative
gender:
mase
number:
singular
case:
nominative
gender:
mase
number:
singular
206 Andererseits ist es möglich, daß keine Struktur gefunden werden kann, die die beiden zu unifizierenden Strukturen umfaßt, da sich ihre Werte widersprechen und daher nicht übereinbringen lassen. In diesem Fall schlägt die Unifikation fehl. Eine solche Unvereinbarkeit tritt in den Beispielen Β und D auf. Während der Pfad (agrm case) in beiden Strukturen vereinbar ist, sind die Pfade (agrm gender) wegen der sich widersprechenden Werte mase und fem und (agrm number) wegen der widersprüchlichen Werte singular und plural unvereinbar.
Β =
agrm:
case:
nominative
gender:
mase
number:
singular
U
D=
agrm:
case:
nominative
gender:
fem
number:
plural
4
7.7.2.3 Der Chart-Parser Der verwendete Chart Parser wird ausführlich in Görz (1988), Bröker (1990) und Fischer et. al. (1996) beschrieben. Hier sollen kurz die wichtigsten Elemente des Chartparsers aufgezeigt werden. Ein detaillierte Einführung in die Chartanalyse bieten unter anderem Gazdar und Mellish (1989). Die zentrale Idee des Chartparsing ist, beim Zerlegen eines Satzes auf der Basis einer Grammatik bereits erfolgreich erkannte Teilstrukturen des Satzes, sogenannte wohlgeformte Teilstrukturen, als Zwischenergebnis in einer Tabelle zu speichern. Dies hat zum einen den Vorteil, daß Anteile struktureller Mehrdeutigkeiten nur einmal gespeichert werden, zum anderen erlaubt es im Fehlerfall einen effizienten Rücksetzvorgang, das Backtracking. Solche Tabellen mit wohlgeformten Teilstrukturen werden meist als gerichtete azyklische Graphen dargestellt. Der folgende Phrasenstrukturbaum wird in Abb. 72. als Chart dargestellt.
Abb. 71. E r g e b n i s d e r syntaktischen Analyse des Beispielsatzes
207 Die Kanten des Graphen sind im allgemeinen mit den Kategoriesymbolenen gekennzeichnet, die den Teilstrukturen zuzuordnen sind, die von der Kante überspannt werden. Die Kanten des hier verwendeten Parsers sind darüber hinaus durch Merkmalstrukturen und λ-Diskursrepräsentationsstrukturen markiert. Aus Gründen der Darstellung wurde in den Abbildungen hier darauf verzichtet. S
Jan
schießt
einen
großen
Bock
Abb. 72. Chart mit inaktiven Kanten
Im ersten Schritt des Analyseprozesses wird die Chart initialisiert. Die Wörter des zu analysierenden Satzes werden als Kanten in die Chart eingetragen. Auf der Basis des Lexikons kann jedem Wort seine Kategorie und seine Merkmalstruktur zugewiesen werden. Für jede Startregel wird eine regelinitialisierende Kante, eine sogenannte leere Kante, eingetragen. Diese enthält als Markierung die Kategorie, die abzuleiten versucht wird, und eine Liste von Elementen, die zur Ableitung gefunden werden müssen. Beim Chart-Parsing wird grundsätzlich zwischen aktiven und inaktiven Kanten unterschieden. Inaktive Kanten kennzeichnen bereits vollständig analysierte Teilstrukturen des Satzes. Noch nicht vollständig konstruierte Strukturen werden von aktiven Kanten überspannt. Neben ihrer Kategorie und Merkmalstruktur enthält eine aktive Kante auch Informationen darüber, welche Elemente noch zur Vervollständigung der Struktur fehlen. Die Verarbeitung des zu analysierenden Satzes kann Top Down oder Bottom up erfolgen. Bei der Bottom-up-Analyse werden von den Komponenten des Satzes ausgehend Regeln gesucht, die eine Zusammenfassung von Komponenten zu größeren Phrasen ermöglichen. Der hier verwendete Chart Parser arbeitet dagegen top-down. Von einer Startregel ausgehend werden Teilphrasen gesucht, die immer weiter verfeinert werden. Auf das obige Beispiel angewendet bedeutet dies, daß nach Initialisierung der Chart in einem ersten Verarbeitungsschritt eine leere Kante - hier S - in die Chart eingefügt. Diese Kante muß zur Vervollständigung noch Kanten der Kategorie NP und VP überspannen. In einem zweiten Schritt kann dann eine leere Kante für NP eingesetzt werden. NP ist die Kategorie der Kante, die zuerst von der neu eingeführ-
208 ten S-Kante überspannt werden muß. Diese Zusammenhänge werden der zugrundeliegenden Grammatik entnommen. Werden beide Regeln eingesetzt, entsteht die folgende Chart: S[NP VP]
Abb. 73. Chart mit inaktiven Kanten
Ziel des weiteren Verarbeitungsprozesses ist es nun, aufgrund der in der Grammatik kodierten Zusammenhänge, die S-Kante so auszuweiten, daß sie den gesamten Satz überspannt. Dabei werden die aktiven Kanten mit der Fundamentalregel ausgedehnt. Diese besagt, daß eine neue Kante eingesetzt werden kann, wenn das Ende einer aktiven Kante und der Anfang einer inaktiven Kante in einem Punkt zusammentreffen und dabei die Kategorie der inaktiven Kante mit der nächsten gesuchten Kategorie der aktiven Kante zusammentreffen und gleichzeitig die Gleichungen der zugehörigen Regel auf die Merkmalstrukturen der Kanten anwendbar sind. S[VP]
Abb. 74. Chart mit inaktiver S-Kante
Als semantischer Formalismus liegt dem Parsing-System der in Kapitel 6 beschriebene λ-DRT-Ansatz von Pinkal zugrunde. Während allerdings die im Abschnitt 6.3.3 gezeigte Darstellung von einem sequentiellen Vorgehen bei der syntaktischen und semantischen Analyse ausgeht, analysiert der hier vorgestellte Chart Parser die Syntax und Semantik des zu parsenden Satzes parallel. Jede Kante in der Chart ist daher
209 durch ein Kategoriesymbol und zwei Merkmalstrukturen markiert: Eine Merkmalstruktur kodiert die syntaktische Information, eine zweite kodiert die semantische Information, da die λ-DRSen intern selbst wiederum als Merkmalstrukturen kodiert sind. 7.7.2.4 Das Parseti von iibertragen-kompositionellen Phraseologismen Das Parsen übertragen-kompositioneller Phraseologismen erfolgt mittels des ChartParsers auf der Basis der zuvor dargestellten Datenstrukturen und Mechanismen. Dabei wird in folgenden Schritten vorgegangen (vgl. Fischer/Keil 1996b): Während der Initialisierung der Chart wird kontrolliert, ob mögliche Phraseologismenkomponenten im zu analysierenden Satz vorhanden sind. Dazu wird vor dem Einfügen einer Kante in die Chart für jedes Wort des zu parsenden Satzes geprüft, ob es sich um das Basislexem eines oder mehrerer Phraseologismen handelt oder nicht. Wenn ein Lexem als Komponente eines übertragen-kompositionellen Phraseologismus erkannt wird, wird neben der Kante für die literale Bedeutung eine weitere Kante für die phraseologische Bedeutung eingefügt. Die für den Parsing-Prozeß benötigten Informationen für das Auffinden von Basislexemen ebenso wie die syntaktische und semantische Information zur Markierung der Kante werden Phraseo-Lex entnommen. Dabei greift der Parser aus der gesamten Information zu einem phraseologischen Eintrag nur auf Lemma, Basislexeme, Phrasenstrukturbaum, semantische Struktur und logische Formel zu:
Lemma: (jmd.) einen Bock schiessen Basislexeme: Bock, schiessen Phrasenstrukturbaum:
(vpli (np-akk (det einen (n Bock)) (v schiessen)
Semantische Struktur: Subj.: X Akk.-Obj.: einen Bock Präd.: schiessen Logische Formeln:
Subj.: Akk.-Obj.: Verb:
X einen Fehler machen
x,y machen(x,y), Fehler(y)
Abb. 75. Für den Parsing-Prozeß benötige Informationen aus Phraseo-Lex
Die Aktivierung einer phraseologischen Bedeutung erfolgt über erkannte Basislexeme. Die Informationen zu einem phraseologischen Eintrag werden durch ein Schnittstellenmodul aus Phraseo-Lex extrahiert und anschließend in syntaktische und semantische Merkmalstrukturen umgewandelt. Die syntaktische Merkmalstruktur ei-
210 ner Phraseologismenkomponente enthält Informationen über die interne Struktur und über die zur Vervollständigung benötigten Komponenten des Phraseologismus. Die beiden folgenden Merkmalstrukturen zeigen die Kodierung der syntaktischen Information der Phraseologismenkomponenten Bock und schießen. Dabei sind die Merkmalstrukturen auf die wesentliche Information reduziert, um die benötigte phraseologische Information deutlicher hervortreten zu lassen:
agrm:
stem:
number: singular person:
agrm:
three
schiessen_vpll3 stem:
stem: bock_vpll3 head: val: rest:
case:
nominative
number:
singular
person:
three
gender:
mase
bock_vpU3
agrm: [^case: accusativej vpl:
nil
j^verb:
schiessen_vpll3j
Die beiden Merkmale val (für Valenz) bei verbalen Komponenten bzw. vpl (für verbaler Phraseologismus) bei nicht-verbalen Komponenten enthalten die Kontextkomponenten eines Lexems, mit denen das Lexem in Kombination den Phraseologismus bildet. Diese Attribute liefern die notwendige Information zum Auffinden der fehlenden Phraseologismenanteile im Satz. Im Falle der verbalen Komponente enthält das Merkmal Valenz mehr Information als sonst üblich, da neben der Kasusspezifikation auch der Stamm der fehlenden Phraseologismenkomponente zusätzlich festgehalten wird. Bei nicht-verbalen Komponenten werden die fehlenden Kontextkomponenten unter Angabe ihrer Kategorie im Merkmal vpl vermerkt. Jeder Teil des Phraseologismus ist darüber hinaus durch eine spezielle Endung markiert - hier durch die Endung vpl_13 -, die die verschiedenen Komponenten des Phraseologismus als zusammengehörig kennzeichnet. Dies trägt der bereits oben erwähnten Tatsache Rechnung, daß ein Lexem in verschiedenen Phraseologismen auftreten kann, deren Bedeutung während des Parsingprozesses nicht miteinander vermischt werden sollte. So sollten zum Beispiel die beiden Bedeutungen von Bock in den Bock zum Gärtner machen ("einen Ungeeigneten mit einer Aufgabe betrauen") und einen Bock schießen ("einen Fehler machen") nicht zu den Bedeutungen "einen Ungeeigneten machen" oder "einen Fehler mit einer Aufgabe betrauen" kombiniert werden. Aus dem Eintrag in Phraseo-Lex wird neben der syntaktischen Information auch die semantische Information, also die λ-DRS für die phraseologischen Bedeutungen der Lexeme, gebildet. Diese werden aus der semantischen Struktur und der logischen Formel aus Phraseo-Lex konstruiert: Xy
Fehler(y)
λν Xw
machen(w,v)
211 Diese λ-DRSen werden innerhalb des Parsing-System als Merkmalstrukturen kodiert.11 Es ist offensichtlich, daß die Information, die Phraseo-Lex zu einem phraseologischen Eintrag enthält, zunächst durch das Schnittstellenmodul aufgebrochen werden muß, um sie dann auf alle Basislexeme zu verteilen. Dies geschieht allerdings nur einmal zu Beginn des Parsingvorganges: beim Initialisieren der Chart wird die phraseologische Information über alle phraseologischen Kanten verteilt. Jede phraseologische Kante der Chart ist markiert durch ein Kategoriesymbol, eine syntaktische Merkmalstruktur und eine λ-DRS, die den wörtlichen Referenten der Phraseologismenkomponente repräsentiert und selbst als semantische Merkmalstruktur kodiert ist. Die Grammatik ist durch spezielle Grammatikregeln erweitert worden, die die phraseologischen Kanten in der Chart bearbeiten können (vgl. Krüger 1995). In diesen Regeln wird überprüft, ob ein kompletter Phraseologismus konstruiert werden kann. Zusätzliche Gleichungen über die phraseologische Information in den speziellen Merkmalen val und vpl sichern die Überprüfung. Die folgende Regel verbindet ein Objekt und eine Verbalphrase eines Satzes miteinander, indem sie überprüft, ob sowohl Verb als auch Nomen Teile desselben Phraseologismus sind: VP
ΝΡ ((V val head agrm) = (V val head stem) = (NP vpl verb) = (VP val) = (VPobjhead) = (VP stem) -
(NP agrm) (NP stem) (VP stem) (NP val rest) NP (V stem))
(compose ΝΡ V) Außer der Hinzufügung von Grammatikregeln müssen keine weiteren Änderungen zum Standardverfahren vorgenommen werden - weder beim Chart-Parser noch an der fundamentalen Regel. Resultat des Parsingprozesses sind die phraseologische und die nicht-phraseologische Analyse des Satzes. Während jedoch die syntaktischen Ergebnisstrukturen identisch sind, unterscheiden sich die semantischen Ergebnisstrukturen erheblich: eine DRS repräsentiert die literale Lesart, die andere DRS die übertragene. Diese Technik erlaubt Sätze zu analysieren, in denen eine semantisch-autonome Komponente und ihr Modifikator adäquat repräsentiert sind. Der Referent der semantisch-autonomen Komponente dient hier als Anker für die adjektivische Modifikation. Dieser Ansatz bietet auch die Grundlage für die Modellierung der oben vorgestellten satzübergreifender Anaphern.
11
Eine genauere Beschreibung der Kodierung von λ -DRSen als Merkmalstrukturen findet sich Fischer (1993).
212
( D R S 179a)
χr
χr
jan(x)
jan(x)
fehler(r)
bock(r)
groß(r)
groß(r)
machen(x,r)
schiessen(x,r)
7.8 Zusammenfassung und Ausblick Basierend auf den Überlegungen aus den Kapiteln 2 bis 5 wurde ein Konzept für einen phraseologischen Lexikoneintrag erstellt, das in der konkreten Implementierung des Systems Phraseo-Lex realisiert wurde. Die Eingabe eines phraseologischen Lexikoneintrags in das System wurde anhand der verschiedenen Elemente der Bedienoberfläche vorgestellt. Daran anschließend wurden die Funktionen zur Auswertung der Datenbasis kurz skizziert. Die erfolgreiche Einsatz des Systems als Zusatzlexikon im Rahmen der maschinellen Sprachverarbeitung konnte unter anderem anhand der Integration von PhraseoLex in ein Chart-Parsing System gezeigt werden (vgl. dazu auch Fischer/Keil 1996a, 1996b, 1996c). Dazu werden Information zu dem phraseologischen Eintrag extrahiert, durch ein Schnittstellenmodul aufgebrochen und auf die verschiedenen Komponenten des Phraseologismus verteilt. In diesem Zusammenhang steht die Überlegung an, inwieweit Phraseo-Lex zukünftig als Lexikongenerator eingesetzt werden kann. Es wird untersucht, inwieweit es möglich und sinnvoll ist, die mit Hilfe von PhraseoLex gesammelte phraseologische Information im Vorfeld des Parsing-Prozesses automatisch in die Simplex-Lexikoneinträge der Basislexeme fließen zu lassen. Gegenwärtig wird ein umfassender Bestand phraseologischer Einträge erstellt, der einer ständigen Ergänzung unterliegt. In diesem Zusammenhang erweist sich die Bedienoberfläche als komfortabel. Die Erfahrung zeigt jedoch, daß sich die Festlegung spezieller Kriterien häufig schwierig gestaltet, da sie nur auf der Basis gezielter Textuntersuchungen möglich ist. Dies gilt insbesondere für die "möglich/unentscheidbar/nicht-möglich"-Entscheidungen im Stabiltätsfenster. Ein erheblicher Aufwand besteht daher in der Recherche nach Textbelegen. Werden bestimmte Inventare - beispielsweise für die syntaktischen Merkmale im Phrasenstrukturbaum, für die semantische Wertigkeit oder für die Beschreibungskategorien auf der Ebene der Pragmatik - erweitert, ist darauf zu achten, daß die bestehenden Lexikoneinträge auf die neuen Merkmale hin zu überprüfen sind, da sonst Inkonsistenzen in der Datenbank auftreten könnten. Ebenso wie jeder einzelne phraseologische Eintrag des Systems unterliegt auch das Werkzeug selbst, die Auswahl, Anordnung und Repräsentation der zugrunde liegenden Beschreibungskriterien einer ständigen Überprüfung, die zu Verbesserungen und Erweiterungen führen soll.
8 Schlußbemerkung Ziel der vorliegenden Arbeit war es, das sprachliche Phänomen verbaler Phraseologismus aus verschiedensten Perspektiven zu beleuchten und zu systematisieren. Dabei wurden sowohl allgemein linguistische Aspekte wie Valenz, Synonymie und Antonymie thematisiert, als auch die charakteristischen Eigenschaften von Phraseologismen, zu denen insbesondere die unterschiedlichen Stabilitätsphänomene zählen, untersucht. Da die Betrachtungen unter anderem auf computerlinguistischem Hintergrund erfolgten, galt ein Hauptaugenmerk der Abgrenzung computerlinguistisch modellierbarer Phänomene von solchen, die zum gegenwärtigen Zeitpunkt aufgrund derzeitig fehlender Formalisierungsmöglichkeiten nicht computerlinguistisch modellierbar sind. Wären Phraseologismen völlig stabile sprachliche Phänomene, dann wäre die computerlinguistische Modellierung ihrer Mehrgliedrigkeit kein Problem. Aber gerade durch ihre Variabilität ergeben sich viele noch ungelöste Probleme. Daher galt dem Variabilitätsaspekt als Gegenpol zur Stabilität besondere Aufmerksamkeit. Hier wurde zwischen lexikographisch erfaßbaren und regelbasierten Veränderungen unterschieden. Letztendlich nur durch explizite Aufzählung zu modellieren - und daher als lexikographisch erfaßbar zu betrachten - sind phraseologische Varianten, Synonyme und Antonyme. Zu den regelhaft modellierbaren Veränderungen dagegen zählen Flexionsformen des Verbs, die sich dann als regelhaft angeben lassen, wenn dem Phraseologismus eine interne syntaktische Struktur zugewiesen wird - dieser Aspekt wurde schon früh in generativen Grammatikansätzen erkannt. Weit entfernt ist man vor allem von der computerlinguistischen Modellierung der häufig auftretenden kreativ-wortspielerischen Modifikationen von Phraseologismen, die aufgrund ihrer vielfältigen Assoziationsmöglichkeiten eine enorme Komplexität aufweisen. Der Abstraktheitsgrad der hier zugrunde liegenden Regeln überschreitet die derzeitigen Modellierungsmöglichkeiten aufgrund des zur Interpretation benötigten erheblichen Anteils an Weltwissen. An den kreativ-wortspielerischen Sprachgebrauch schließen sich metakommentierende Modifikationen an, mit denen auf die unterschiedlichen Bedeutungsebenen eines Phraseologismus Bezug genommen wird. Ein zentrales Anliegen dieser Arbeit war es, den Mechanismen ein Stück näher zu rücken, die der Zulässigkeit und Nicht-Zulässigkeit solcher Umformungsmöglichkeiten von Phraseologismen zugrunde liegen, die unter den Begriff transformationeller Defekt fallen. Hier werden zunehmend Wechselwirkungen zwischen Bedeutungsstruktur des Phraseologismus und zulässigen syntaktischen Strukturveränderungen angenommen. In diesem Zusammenhang habe ich den Aspekt der semantischen Autonomie betont, der wendungsinternen Komponenten eines Phraseologismus zukommt. Mein Vorschlag geht dahin, eine explizite Kennzeichnung semantisch autonomer Komponenten und deren referentiellem Potential im Lexikon vorzunehmen. Anhand von realem Sprachmaterial wurde für eine Gruppe von Phraseologismen versucht, die zugrunde liegende Bedeutungsstruktur in der Paraphrase abzubilden. Es wurde gezeigt, daß auf der Basis einer solchen Paraphrase eine formale Bedeutungsrepräsentation gebildet werden kann, die die Option eröffnet, systematische Modifikationen von Phraseologismen im Bereich der Computerlinguistik regelhaft modellierbar zu machen. Auf Perspektiven, die sich daraus ergeben, wurde mit Hilfe der Diskursrepräsentationstheorie aufmerksam gemacht.
214 Die Abbildung der Bedeutungsstruktur in der Paraphrase kann m. E. auch im Fremdsprachenunterricht gewinnbringend eingesetzt werden, da hiermit ein Mittel zur Erhöhung der Merkfähigkeit zur Verfügung gestellt wird. Je nach Kontext kann eine Beziehung zwischen Bär und "Lügengeschichte" im Kontext von aufbinden, zwischen Bock und "Fehler" im Kontext von schießen und zwischen Korb und "Absage" im Kontext von halten, kriegen, bekommen, kassieren, geben usw. hergestellt werden. Zur Aufdeckung weiterer Zusammenhänge in diesem Bereich ist allerdings noch ein großes, aber lohnendes Stück Forschungsarbeit zu leisten. Unter anderem zu diesem Zweck wurde das System Phraseo-Lex entwickelt, in das die im Rahmen dieser Arbeit erfolgten Überlegungen eingeflossen sind. Es ermöglicht als Werkzeug für den traditionellen Linguisten zunächst die systematische Erfassung von phraseologischen Daten und bietet anschließend die Möglichkeit einer systematischen Zusammenschau der Daten einzelner Einträge, die der Phraseograph bzw. Lexikograph für seine Zwecke - eine angemessene Wörterbuchschreibung - nutzen kann. In seiner prototypischen Realisierung kann Phraseo-Lex als erster Schritt in Richtung computergestützte phraseographische Werkzeuge betrachtet werden. Im Bereich der Computerlinguistik besteht die Möglichkeit, Phraseo-Lex als Zusatzlexikon zu einfachen maschinellen Lexika einzusetzen, wobei sowohl über das Lemma als auch über die einzelnen lexikalischen Elemente der Zugriff zu den systematisch repräsentierten Daten möglich ist. Mit Zuversicht im Hinblick darauf, daß diesem ersten Schritt weitere Schritte folgen werden, möchte ich meine Ausführungen mit einem letzten Textbeleg ohne weitere Kommentierung abschließen: "Zum Schluß hat man zunächst nicht mehr Klarheit als vorher, nur lauter Baumparaphrasen im Kopf, vor deren Reichhaltigkeit man den sprichwörtlichen Wald fast aus den Augen verliert." 1 (Mannheimer Morgen, 30.9.1985)
1
Der Zeitungstext, dem diese Passage entnommen wurde, berichtet unter dem Titel "Freund und Bruder, Form und Zeichen" von einer "Riesenausstellung" des Heidelberger Kunstvereins zum Thema "Der Baum" (Mannheimer Morgen 1985,30.985, S. 32).
Anhang A.l Beispiele für phraseologische Einträge in Phraseo-Lex Im folgenden möchte ich beispielhaft aufzeigen, wie die Angaben zu phraseologischen Einträgen in Phraseo-Lex gestaltet sein können. Dazu ziehe ich die folgenden Beispiele heran: • VPL1: jmdm. kein Haar krümmen [können] • VPL1: einen an der Waffel haben • VPL1: einen Streit vom Zaun brechen • VPL1: Bauklötze staunen • VPL1: einen Bock schießen • VPL2: jmdm. rutscht das Herz in die Hose Zuvor sei noch einmal darauf hingewiesen, daß ein lexikalischer Eintrag nie vollständig ist, da Kategorien wie Synonyme, Antonyme, Modifikationen, weitere Paraphrasen, Beispiele usw. offene Kategorien sind. Einige Attribute sind theorieabhängig wie beispielsweise die Kodierung der syntaktischen Struktur des Baumes. Die Kodierung kann beliebig strukturiert werden und - ausgenommen der Startknoten VPL1 oder VPL2 - mit beliebigen Beschriftungen versehen werden. Ebenso kann die computerlinguistische Kodierung der logischen Formel unterschiedlichste Formen annehmen. Bei der Untergliederung von Varianten, Synonymen und Antonymen orientiere ich mich an den Ausführungen von Kapitel 4 - auch hier können abweichende Einteilungen vorgenommen werden. Es bleibt zudem den Benutzerinnen und Benutzern von Phraseo-Lex überlassen, ob sie als Basislexeme des Phraseologismus nicht alle Tassen im Schrank haben (alle, Tasse, Schrank, nicht), (alle, Tasse, Schrank, nicht, haben) oder (alle, Tasse, im, Schrank, nicht, haben) kodieren. Die hier zur Kennzeichnung der semantischen Valenz verwendeten Rollen wie Träger physischer Prozesse (THS), Träger psychischer Prozesse (TPS), Zustandsträger (ZT) stammen aus dem bei Heibig angegebenen Rolleninventar (vgl. Heibig 1987:635). Hier kann auch ein anderes Inventar verwendet werden.
216 I. LEMMA : (jmd.) jmdm. kein Haar krümmen KURZINFO: Nennform: Paraphrase: Syntaktischer Typ: Semantíscher Typ: Basislexeme:
jmdm. kein Haar krümmen können jmdm. nichts zuleide tun können VPL1 nicht kompositionell kein, Haar, krümmen
SYNTAX: PHRASENSTRUKTURBAUM: VPL1. NP dat
NP akk Det I kein
Ν I Haar
krümmen
[vPLl[NP_dat]
[NP_akk bet *«"][Ν Haar]] [v krümmen]]
VALENZ: Anzahl der freien Valenz: Wendungsinterne Valenz: Wendungsexterne Valenz:
NP_akk, NP_dat NP_nom
STABILITÄT Passivierung: Imperativsatz: Nominalisierung: Satznegation:
möglich möglich nicht möglich möglich
Relativsatz: Fragesatz: Konstituentennegation: Expansion durch Attribute: Quantifizierung:
kein Haar kein einziges Haar
217
SYNTAKTISCHE ANOMALIE:
obligatorische Negationskonstituente
UNDCALE KOMPONENTE:
nein
VARIANTEN Lexikalische:
Strukturelle:
jmdm. kein Härchen krümmen niemandem ein Härchen krümmen niemandem ein Haar krümmen jmdm. kein Haar krümmen können jmdm. kein Härchen krümmen können niemandem ein Haar krümmen können niemandem ein Härchen krümmen können
SEMANTIK SEMANTISCHE STRUKTUR: NP_nom jmd. NP_dat jmdm. NP_akk kein Haar
AGENS TPH (Träger physischer Prozesse) keine Rolle
->weh-tun(X,Y) krümmen(_,_,kein Haar) ->zuleide-tun(X,Y)
KLASSIFIKATION:
nichtkompositionell metaphorisch motiviert mehrdeutig
WEITERE PARAPHRASEN:
niemandem etwas zuleide tun jemanden nicht verletzen
SEMANTISCHE WERTIGKEIT:
AGENS (+belebt, +mensch) TPH (+belebt)
MODIFIKATION:
Haar, kein, kein einziges, überhaupt kein
SYNONYME: ANTONYME:
218 PRAGMATIK KONNOTATION:
warnend
VERWENDUNGSSITUATION:
tinspezifisch Warnung
DIAPHASISCHE INFORMATION:
umgangssprachlich
DIASTRATISCHE INFORMATION:
unspezifisch
DIATOPISCHE INFORMATION:
überregional
BEISPIELE: (L 105)"Wenn Sie dem Girl auch nur ein Haar krümmen ..." begann ich , aber der Blonde fiel mir barsch ins Wort. [...] möglicherweise werden sie June kein Haar krümmen, sie wollen nur erreichen, daß wir sie für die Feinde der Forsters halten." (G-man Jerry Cotton - ein Teenager soll sterben, S. 27) (L106) "Wilhelm redete ihm zu und versicherte, daß er ihn gegen jedermann schießen werde, daß ihm niemand ein Haar krümmen, viel weniger ohne seinen Willen abschneiden solle." (Wilhelm Meisters Lehrjahre, Hamburger Ausgabe, Band 7) (L 107) "Blues ist Berufsjäger, ein 'white hunter', der im Auftrag irgendeiner SafariFirma reiche Deutsche und Amerikaner begleitet und aufpaßt, daß ihnen beim Löwen- und Elefantenschießen kein Haar gekrümmt wird." (....)
219
II. LEMMA : (jmd.) einen an der Waffel haben KURZINFO: Nennform:
einen an der Waffel haben
Paraphrase:
nicht recht bei Verstand sein
Syntaktischer Typ:
VPL1
Semanti scher Typ:
nicht kompositioneil
Basislexeme:
Waffel, haben
SYNTAX: PHRASENSTRUKTURBAUM:
VPL1 NP_akk 1
Pronomend) 1
PP_an χ
p
I
V
\
Npdat
X
\
I der
I Waffel
tvPLl [NP_akktPronomen einen] [pp_antp «"][NP_dat [öet der\ [ N Waffel]]] [v haben] VALENZ: Anzahl der freien Valenz:
1
Wendungsinterne Valenz:
NP_akk, PP_an
Wendungsexterne Valenz:
NP_nom
STABILITÄT Passivierung:
nicht möglich
Imperativsatz:
nicht möglich
Nominalisierung:
nicht möglich
Satznegation:
nicht möglich
Relativsatz: Fragesatz:
I
220 Konstituentennegation:
einen
Expansion durch Attribute: Quantifizierung:
SYNTAKTISCHE ANOMALIE:
Anomalie im Pronomengebrauch
UNIKALE KOMPONENTE:
nein
VARIANTEN Lexikalische:
einen an der Klatsche haben
Strukturelle: SEMANTIK SEMANTISCHE STRUKTUR: NP_nom
jmd.
ZT (Zustandsträger)
NP_akk
einen
keine Rolle
PP_an
an der Waffel
keine Rolle
haben(_, einen, an der Waffel)
blöd(X) dumm(X)
KLASSIFIKATION:
nicht kompositioneil nicht motiviert nicht mehrdeutig
WEITERE PARAPHRASEN:
dumm sein blöd sein
SEMANTISCHE WERTIGKEIT:
AGENS(+belebt, +mensch)
MODIFIKATION: SYNONYME:
nicht ganz richtig im Kopf sein nicht ganz richtig ticken im Kopf einen Sprung in der Schüssel haben nicht alle Tassen im Schrank haben nicht ganz dicht sein
221 ANTONYME: PRAGMATIK ΚΟΝΝΟΤΑΉΟΝ:
wertend
VERWENDUNGSSITUAnON:
Streitgespräch
DIAPHASISCHE INFORMATION:
umgangssprachlich
DIASTRATISCHE INFORMATION:
Jugendsprache
DIATOPISCHE INFORMATION:
überregional
BEISPIELE: (L108) "Bei dem Wetter Freiübungen auf dem Schulhof - der Pauker muß doch echt einen an der Waffel haben!" (entnommen: Drosdowski 1992) (L109) "Denn so große Stars, wie Sie einer sind, haben doch meistens einen an der Waffel (Hörzu, 1985,158; entnommen: Drosdowski 1992)
222 III. LEMMA : (jmd.) einen Streit vom Zaun brechen KURZINFO: Nennform: Paraphrase: Syntaktischer Typ: Semantischer Typ: Basislexeme:
einen Streit vom Zaun brechen einen Streit unbedingt beginnen VPL1 teilkompositionell Streit, Zaun, brechen
SYNTAX STRUKTURBAUM: VPL1 NP akk Det I einen tvPLi[NP_akk [Det einen][N Streit]] [pp .vom [p+Det ü0WIHn ZflMfl]] [v brechen]] VALENZ: Anzahl freier Valenzen: Wendungsinterne Valenz: Wendungsexterne Valenz:
1 NP_akk, PP_vom NP_nom
STABILITÄT: Passivierung: Imperativsatz: Nominalisierung: Satznegation:
möglich nicht möglich nicht möglich möglich
Relativsatz: Fragesatz: Konstituentennegation:
Streit Streit Streit
223 Expansion durch Attribute: Quantifizierung:
Streit Streit
SYNTAKTISCHE ANOMALIE:
nein
UNUCALE KOMPONENTE:
nein
VARIANTEN Lexikalische: Strukturelle:
—
SEMANTIK STRUKTURZUWEISUNG: NP_nom jmd. NP_akk einen Streit PP_vom
vom Zaun
brechen(_,_,vom_Zaun)
AGENS PATIENS keine beginnen(X,Y), streit(Y) = M; unbedingt(M)
KLASSIFIKATION:
teilkompositionell nicht mehrdeutig teilmotiviert
WEITERE PARAPHRASEN:
grundlos einen Streit anzetteln einen Streit beginnen
SEMANTISCHE WERTIGKEIT:
AGENS(+belebt, +mensch) PATIENS(+abstrakt)
MODIFIKATION: Streit:
alle Adjektive, mit denen "Streit" modifiziert werden kann, wie "lächerlich", "aussichtslos", "handfest",...
224 SYNONYME: ANTONYME:
das Kriegsbeil begraben
PRAGMATIK KONNOTATION
wertend kritisch
VERWENDUNGSSITUATION:
unspezifisch
DIAPHASISCHE INFORMATION:
normalsprachlich
DIASTRATISCHE INFORMATION:
unspezifisch
DIATOPISCHE INFORMATION:
überregional
BEISPIELE (L 110) "Und warum sollen wir einen Streit mit dem Präsidenten vom Zaun brechen, wo wir doch selber mit dem Kommunismus nichts im Sinn haben?" (Der Spiegel 93, S.120, Unsere Haltung bleibt hart) (L111) "Das ist doch Wahnsinn", klagt der Gewerkschafter, "deswegen so einen Konflikt vom Zaun zu brechen" (Spiegel 93, S.104, Andere Quellen) (L112) "Solange sich die Deutschen streiten, denken sie wenigstens nicht daran, mit ihrem Nachbarn im Westen Streit vom Zaun zu brechen." (Stern 1987, S. 26, Politik)
225 IV. LEMMA : (jmd.) Bauklötze staunen KVRaNFQ; Nennform: Paraphrase: Syntaktischer Typ: Semantischer Typ: Basislexeme:
Bauklötze staunen sehr staunen VPL1 teilkompositionell Bauklotz, staunen
SYNTAX: PHRASENSTRUKTURBAUM VPL1 NP_akk X Det
X Ν
0
Bauklötze
staunen
[vpli [NP_akk bet^N Bauklötze]] [v staunen]] VALENZ Anzahl freier Valenzen: Wendungsinterne Valenz: Wendungsexterne Valenz:
NP_akk NP_nom
STABILITÄT Passivierung: Imperativsatz: Nominalisierung: Satznegation:
nicht möglich nicht möglich nicht möglich nicht möglich
Relativsatz: Fragesatz: Konstituentennegation: Expansion durch Attribute: Quantifizierung:
Bauklötze
226 SYNTAKTISCHE ANOMALIE:
Valenzabweichung
UNUCALE KOMPONENTE:
nein
VARIANTEN Lexikalische: Strukturelle: SEMANTIK STRUKTURZUWEISUNG NP_nom jmd. NP_akk
Bauklötze
staunen(_,Bauklötze)
AGENS keine intensiv(staunen(X)),
SEMANTISCHE KLASSIFIKATION:
teilkompositionell teilmotiviert nicht mehrdeutig
WEITERE PARAPHRASEN:
sehr überrascht sein sehr erstaunt sein
SEMANTISCHE WERTIGKEIT:
Agens(+belebt, +mensch)
MODIFIKATION:
Bauklötze: riesen
SYNONYME: ANTONYME:
von den Ohren sein
PRAGMATIK ΚΟΝΝΟΤΑΉΟΝ:
wertend kritisch
VERWENDUNGSSITUATION
unspezifisch
DIAPHASISCHE INFORMATION
umgangssprachlich
227 DIASTRATISCHE INFORMATION:
—
DIATOPISCHE INFORMATION: BEISPIELE (L113) ""Und Dein Bruder Klaus wird Bauklötze staunen, wenn er hört, was wir erlebt haben." (Y. Uhi, Um Mitternacht im blauen Schloss, Trivialroman, S. 10.) (L114) "Über das, was die in Biologie machen, staune ich nur Bauklötze" (Die Zeit. 30.01,1987, S. 65)
228 V. L E M M A : (jmd.) einen Bock schießen KURZINFO: Nennform:
einen Bock schießen
Paraphrase:
einen Fehler machen
Syntaktischer Typ:
VPL1
Semantischer Typ:
übertragen kompositionell
Basislexeme:
Bock, schießen
SYNTAX: PHRASENSTRUKTURBAUM: VPL1 NP_akk Det einen
Ν I Bock
V I schießen
fvPLl [NP_akk bet el '" c "][N [v schießen]] VALENZ: Anzahl freier Valenzen:
1
Wendungsinterne Valenz:
NP_akk
Wendungsexterne Valenz:
NP nom
STABILITÄT: Passivierung:
möglich
Imperativsatz:
nicht möglich
Nominalisierung:
nicht möglich
Satznegation:
nicht möglich
Relativsatz:
Bock
Fragesatz:
Bock
Konstituentennegation:
Bock
Bock
ìì
229 Expansion durch Attribute:
Bock
Quantifizierung:
Bock
SYNTAKTISCHE ANOMALIE:
nein
UNIKALE KOMPONENTE:
nein
VARIANTEN Lexikalische: Strukturelle:
SEMANTIK SEMANTISCHE STRUKTUR: NPnom
jmd.
AGENS
NP_akk
einen Bock
PATIENS
schießen(_,_,einen Bock)
einen Fehler
machen(X,Y) fehler(Y)
KLASSIFIKATION:
übertragen kompositionell nicht motiviert mehrdeutig
WEITERE PARAPHRASEN:
einen Fehler begehen
SEMANTISCHE WERTIGKEIT
Agens(+belebt, +mensch) Patiens(+abstrakt)
MODIFIKATION:
Bock: groß, unglaublich, kapital, klein
SYNONYME:
ins Fettnäpfchen treten
ANTONYME: PRAGMATIK KONNOTATION:
wertend kritisch
230 VERWENDUNGSSITUATON:
unspezifisch
DIAPHASISCHE INFORMATION:
umgangssprachlich
DIASTRATISCHE INFORMATION:
unspezifisch
DIATOPISCHE INFORMATION:
überregional
BEISPIELE: (L 115) "An den Pranger mit dem Jägermeister Harry Tisch - die Genossen haben manchen Bock geschossen ! "(Montagsdemonstration, aus: Leipziger Demontagebuch, 27.11.89, S. 128-129, Sprechchöre) (L116) "Da werden kapitale wohnungspolitische Böcke geschossen!" (Äußerung des Moderators Friedrich Küppersbusch in der Fernsehsendung ΖΑΚ vom 30.10.94) (L117) "Er hat den Bock des Tages geschossen!" (Äußerung einer Moderatorin im Nürnberger Lokalsender N1 über ihren Moderatorkollegen, 26.09.94) (L118) "Programmbedingt schießen Computer beim Rechnen häufig kleine, manchmal aber auch kapitale Böcke. Da kaum einer diese Fehler bemerkt, kann es zu fatalen Fehlschlüssen kommen. [...] Kleine Billigcomputer hingegen, die wegen ihrer Leistung und vor allem wegen des gewaltigen Programmangebots besonders bei Jugendlichen beliebt sind, verrechnen sich bei unserer simplen Aufgabe nicht - dafür schießen sie beim Rechnen andere Böcke." (Die Zeit, 28.11.1986) (L119) "Da hätten Sie aber einen Bock geschossen und wären der Sachlage nicht gerecht geworden und dem ollen Behrens auch nicht" (Thomas Mann, "Der Zauberberg", 1924, S. 869; entnommen Drosdowski 1992)
231 VI. LEMMA: jmdm. rutscht das Herz in die Hose KURZINFO: Nennform: Paraphrase: Syntaktischer Typ: Semantischer Typ: Basislexeme:
jmdm. rutscht das Herz in die Hose jmd. bekommt Angst VPL2 nicht-kompositionell rutschen, Herz, Hose
SYNTAX STRUKTURBAUM: VPL2 NP_nom Det I das
I Herz
rutscht
.nom bet ¿«sHn Herz\] [vptv rutscht]^ dat J [ppjJp i"][NP_akk [Det diei [n Hose]]] VALENZ: Anzahl freier Valenzen: Wendungsinterne Valenz: Wendungsexterne Valenz:
NPnom, PP_in NP dat
STABILITÄT: Passivierung: Imperativsatz: Nominalisierung: Satznegation:
nicht möglich nicht möglich nicht möglich möglich
Relativsatz:
Hose
232 Fragesatz: Konstituentennegation: Expansion durch Attribute: Quantifizierung:
—
SYNTAKTISCHE ANOMALIE:
nein
UNDCALE KOMPONENTE:
nein
VARIANTEN jmdm. fällt das Herz in die Hose jmdm. sinkt das Herz in die Hose jmdm. rutscht das Herz in die Hosen SEMANTIK STRUKTURZUWEISUNG: NP_nom Herz NP_dat jmdm. PP_in in die Hose
rutschen(_,Herz,Hose)
KLASSIFIKATION:
keine Rolle TPS (Träger psychischer Prozesse) keine Rolle angst-bekommen(X) beginnen(sich-fürchten(X)) nicht kompositionell mehrdeutig metaphorisch motiviert
WEITERE PARAPHRASEN:
jmd. bekommt Panik jmdm. wird es mulmig der Mut sinkt bei jmdm. jmd. wird weniger mutig
SEMANTICHE WERTIGKEIT:
TPS (+belebt, +mensch)
MODIFIKATION: SYNONYME: ANTONYME:
weiche Knie bekommen
233 PRAGMATIK ΚΟΝΝΟΤΑΉΟΝ:
wertneutral
VERWENDUNGSSITUATION:
unspezifisch
DIAPHASISCHE INFORMATION:
umgangssprachlich
DIASTRATISCHE INFORMATION:
unspezifisch
DIATOPISCHE INFORMATION:
überregional
BEISPIELE: "Wenn ich an die Führerscheinprüfung denke, rutscht mir gleich das Herz in die Hose." (entnommen: Drosdowski 1992:327) "[...] als wir in Jaffa anlangten [...], sank mir das Herz in die Hose." (Hilsenrath, Nazi 326; entnommen: Drosdowski 92:327)
234
A.2 Phraseo-Leχ im WWW Aktuelle Informationen, über das Internet beziehbare Quelldateien und Veröffentlichungen zu Phraseo-Lex finden sich unter: http: //www2.informatik.uni-erlangen.de/IMMD-II/Research/Activities/CL Adresse der Autorin: Martina Keil c/o Lehrstuhl für Programmiersprachen sowie ihre Compiler Institut für Mathematische Maschinen und Datenverarbeitung (IMMD) H Friedrich-Alexander-Universität Erlangen-Nürnberg 91058 Erlangen e-mail: [email protected]
Literatur Abeille, Anne, Yves Schabes (1990): Non Compositional Discontinuos Constituents in Tree Adjoining Grammar. In: Proceedings of the International Symposium on Discontinuous Constituenty. - Tilburg. Asher, N. (1993): Reference to Abstract Objects in Discourse. Kluwer Academic Press. Barz, Irmhild (1992): Phraseologische Varianten: Begriff und Probleme. - In: Csaba Földes (Hg.): Deutsche Phraseologie in Sprachsystem und Sprachverwendung. - Wien (Österreich): Praesens, 25-48. Balzer, Peter (1995): Implementierung eines Grammatikregelsystems zur Analyse modifizierter verbaler Phraseologismen und deren Lesarten. Studienarbeit im Fach Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg im Mai 1995. Batori, Istvan S.; Winfried Lenders; Wolfgang Putschke (1995): Computational Linguistics. Computerlinguistik. Ein internationales Handbuch zur computergestützen Sprachforschung und ihrer Anwendungen 4. - Berlin. Bos, J., E. Mastenbroek, S. McGlashan, S. Millies, M. Pinkal(1994): A Compositional DRS-based Formalsim for NLP Applications. - In: Proceedings of International Workshop of Computational Semantics. - Tilburg (Niederlande). Brinker, Klaus (1985): Linguistische Textanalyse. Eine Einführung in Grundbegriffe und Methoden. - Berlin: Erich Schmidt. (= Grundlagen der Germanistik) Bresnan, Joan (1982): The mental representation of grammatical relations. - Massachusetts: ΜΓΓ Press. Brundage, Jennifer, Maren Kresse, Ulrike Schwall, Angelika StorTer (1992): Multiword Lexemes: A Monolingual and Contrastive Typology for NLP and MT. IWBS-Bericht 232 (IBM). - Heidelberg. Bröker, Norbert (1990): Erweiterung eines Systems zur kontextfreien Strukturanalyse natürlicher Sprachen um einen Unifikationsformalismus. Studienarbeit im Fach Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg 1990. Burger, Harald (1973): Idiomatik des Deutschen. Unter Mitarbeit von Harals Jaschke. - Tübingen: Niemeyer. (1989): Phraseologismen im allgemeinen einsprachigen Wörterbuch. - In: Franz Josef Hausmann (Hgg.): Wörterbücher. Dictionaries. Handbücher zur Sprach- und Literaturwissenschaft 5. - Berlin:593-599. Burger, Harald, Annelies Buhofer, Ambras Sialm (1982): Handbuch der Phraseologie. - Berlin/New York: de Gruyter. Bußmann, Hadumod (1990): Lexikon der Sprachwissenschaft. - Stuttgart: Kroner. Carboneil, G. Jaime; Ralph D. Brown (1988): Anaphora Resolution: A Multi-Strategy Approach. - In: Proceedings of COLING '88. Chafe, Wallace L (1967): Idiomaticity as an Anomaly in the Chomskyan Paradigm. - In: Foundation of Language 4, 109-127. Chomsky, Noam (1981): Lectures on government and binding. Studies in generative grammar. - Dordrecht: Cinnaminson. Cemyseva, Irina (1989): Strukturtypologische Phraseologieforschung in der sowjetischen Germanistik. - In: Gertrud Greciano (Hg.): Europhras 88. Phraseologie Contrastive 12.-16. Mai, Klingenthal-Strasbourg/Frankreich. Strasbourg, 489-467. Dik, Simon C. (1989): Idioms in a computational funktional grammar. - In: M. Everaert and E.-J. van der Linden (Hgg.): Proceedings of the First Tilburg Workshop on Idioms. Tilburg (Niederlande), 41-56. Dobrovol'skij, Dimitrij (1978): Phraseologisch gebundene lexikalische Elemente der deutschen Gegenwartssprache. Ein Beitrag zur Theorie der Phraseologie und Beschreibung des phraseologischen Bestandes. - Leipzig. - (1988): Phraseologie als Objekt der Universalienlinguistik. - Leipzig: Enzyklopädie. (1989): Linguistische Grundlagen zur computergestützten Phraseographie. - In: Zeitschrift für Germanistische Linguistik 10, 528-536. (1993): Datenbank deutscher Idiome. Aufbauprinzipien und Einsatzmöglichkeiten. - In: Csaba Földes (Hg.): Germanistik und Deutschlehrerausbildung. Festschrift zum hundertsten Jahrestag der Gründung des Lehrstuhls für deutsche Sprache und Literatur an der Pädagogischen Hochschule Szeged.- Szeged/Wien: Praesens, 51-67. (1995): Kognitive Aspekte der Idiom-Semantik. Studien zum Thesaurus deutscher Idiome. - Tübingen: Narr (= Eurogermanistik 8. Europäische Studien zur deutschen Sprache). Dormeyer, Ricarda (1994): Konzeption geeigneter Datenstrukturen und Funktionen für die Lexikondatenbank Phraseo-Lex. Diplomarbeit im Fach Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg im Juli 1994. Drosdowski, Günther, Werner Stolze-Stubenrecht (1992): Redewendungen und sprichwörtliche Redensarten. DUDEN Band 11.- Mannheim: Dudenverlag
236 Diirco, Peter (1994): Probleme der allgemeinen und kontrastiven Phraseologie. - Heidelberg. Engelke, Sabine (1994): Eine Untersuchung zur syntaktischen Variabilität und internen Modifizierbarkeit von somatischen verbalen Phraseolexemen. Magisterarbeit am Seminar für Sprachwissenschaften der Eberhard Karls Universität Tübingen im April 1994. Erbach, Gregor (1992): Head-driven Lexical Representation of Idioms in HPSG. - In: M. Everaert and E.-J. van der Linden, A. Schenk, R. Schreuder (Hgg.): Proceedings of IDIOMS (Volume 1). - Tilburg (Niederlande), 11-24. Erbach, Gregor, Brigitte Krenn (1993): Idioms and Support-Verb Constructions in HPSG. Technischer Bericht der Computerlinguistik an der Universität des Saarlandes (CLAUS-Report) Nr. 28. - Saarbrücken. Fellbaum, Christiane (1993): Determiner in English Idioms. - In: Christina Cacciari, Patrizia Tabossi (Hgg.): Idioms. Processing, Structure, and Interpretation. - Hillsdale, New Jersey: Lawrence Erlbaum Associates, 249270. Fillmore Charles J. (1968): The case for case. - In: Emmon Bach, Robert Harms (Hgg.): Universale in Linguistic Theory. -New York: Holt, Rinehart & Winston, 1-88. Fischer, Ingrid (1993): Die kompositionelle Bildung von Diskursrepräsentationsstrukturen über einer Chart. Diplomarbeit im Fach Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg im November 1993. - (1994): Die kompositioneile Bildung von Diskursrepräsentationsstrukturen über einer Chart. - In: Harald Trost (Hg.): Tagungsband zur KONVENS '94. - Wien (Österreich), 419-422. Fischer, Ingrid, Bernd Geistert, Günter Görz (1995): Chart-based Incremental Semantics Construction with Anaphora Resolution using λ-DRT.- In: Proceedings of the fourth International Workshop on Parsing Technologies. - Prag und Karlsbad, 87-88. Fischer, Ingrid; Martina Keil (1996a): Representing Phraseologisms with Discourse Representation Theory. - In: A. S. Narin'yani (Hg.): Proceedings of Dialogue'96. International Workshop in Puschino (Russia) May 4 - 9 1996. - Moskau (Russland), 282-286. (1996b): Parsing decomposable Idioms. - In: J. Tsujii (Hg.): Proceedings of the 16 th International Conferenece on Computational Linguistics in Copenhagen. - Kopenhagen (Dänemark), 388-393. (1996c): Von großen Böcken und jeder Menge Staub. Zur maschinellen Verarbeitung modifizierter Idiome mit semantisch-autonomen Komponenten. - In: Dafydd Gibbon (Hg.): Natural language Processing and Speech Technology. Results of the 3rd KONVENS Conference in Bielefeld. - Berlin, New York: Mouton de Gruyter, 200-211. Fix, U. (1974-1976): Zum Verhältnis von Syntax und Semantik im Wortgruppenlexem. - In: Beiträge zur Geschichte der deutschen Literatur und Sprache. - Halle/Saale. Fleischer, Wolfgang (1982): Phraseologie der deutschen Gegenwartssprache. - Leipzig: Bibliographisches Institut. Fraser, Bruce (1970): Idioms in transformational grammar. - In: Foundation of Language 6, 22-42. Gazdar, Gerald, Chris Mellish (1989): Natural language processing in Lisp. An introduction to computational linguistics. - Addison Wesley. Geeraerts, Dirk (1992): Specialisation and reinterpretation in Idioms. - In: M. Everaert and E.-J. van der Linden, A. Schenk, R. Schreuder (Hgg.): Proceedings of IDIOMS (Volume 1). - Tilburg (Niederlande), 39-52. Görz, Günther (1988): Ein Verarbeitungsmodell zum maschinellen Verstehen gesprochener und geschriebener Sprache. - Addison-Wesley. Görz, Günther (1989): Verarbeitung natürlicher Sprache. - In: Kai von Luck (Hg.): Künstliche Intelligenz. Tagungsband zur KIFS-89, Günne 11-19. März 1989. - Berlin, Heidelberg, 22- 51. Greciano, Gertrud (1987): Idiom und sprachspielerische Textkonstitution. - In: Jarmo Korhonen (Hg.): Beiträge zur allgemeinen und Germanistischen Phraseologieforschung. Internationales Symposium in Oulu 13.-15. Juni 1986. - Oulu/Finnland:Veröffentlichung des Germanistischen Instituts 7, 193-206. Habel, Christopher (1985): Das Lexikon in der Künstlichen Intelligenz. - In: Christoph Schwarze, Dieter Wunderlich (Hgg.): Handbuch der Lexikologie. - Königstein. Häusermann, Jiirg (1977): Phraseologie. Hautprobleme der deutschen Phraseologie auf der Basis sowjetischer Forschungsergebnisse. - Tübingen: Niemeyer. Heinmann, Wolfgang; Dieter Viehweger (1991): Textlinguistik. Eine Einführung. - Tübingen: Niemeyer. Heibig, Gerhard; W. Schenkel (1983): Wörterbuch zur Valenz und Distribution deutscher Verben. - Leipzig. Heibig, Gerhard; Joachim Buscha (1987): Deutsche Grammatik. Ein Handbuch für den Ausländerunterricht. Leipzig: Enzyklopädie.
237 Hessky, Regina (1988): Verbale Phraseologismen: valenzkonform oder nicht? - In: Valenzen im Kontrast. Ulrich Engel zum 60. Geburtstag. - Heidelberg, 139-149. Jackendoff, Ray (1972): Semantic Interpretation in Generative Grammar. - Cambridge, London. Kallmeyer, Werner; Wolfgang Klein; Reinhard Meyer-Herrmann; Klaus Netzer; Hans-Jürgen Siebert (1986): Lektürekolleg zur Textlinguistik. Band 1. Einführung. 4. Auflage. - Königstein/Taunus: Athenäum. Kamp, Hans; Uwe Reyle (1993): From Discoursce to Logic. Introduction to Modeltheoretic Semantics of Natural Language, Formal Logic and Discourse Representation Theory. - Dordrecht (Niederlande). Katz, Jerrold (1973): Compositionality, idiomaticity, and lexical substitution. - In: S.R Anderson, P. Kiparsky (Hgg.): A festschrift (sic!) for Morris Halle. - New York, 357-376. Kasper Walter, Marc Moens, Henk Zeevat (1992): Anaphora Resolution. - In: G. Bes (Hg.): The Construction of a Natural Language and Graphics Interface. Results and Perspectives from the ACORD Project. Forschungsbericht ESPRIT. - Heidelberg. Keil, Martina (1994): Systematische Repräsentation verbaler Phraseologismen und deren Eigenschaften im Lexikon. - In: Harald Trost (Hg.): Tagungsband zur KONVENS '94. - Wien (Österreich): Informatik Xpress 6, 181-190. Kolde (1979): Zur Valenz fester verbaler Syntagmen. In: Standard und Dialekt. Studien zur gesprochenen und geschriebenen Gegenwartssprache. Festschrift für H. Rupp zum 60. Geburtstag. - Bern, München. Koller, Werner (1977): Redensarten. Linguistische Analysen, Vorkommensanalysen, Sprachspiel. - Tübingen: Niemeyer (= Reihe Germanistische Linguistik). Korhonen, Jarmo (1988): Valenz und kontrastive Phraseologie. Am Beispiel deutscher und finnischer Verbidiome. - In: Valenzen im Kontrast. Ulrich Engel zum 60. Geburtstag. - Heidelberg, 200-217. (1992a): Idiome als Lexikoneinheiten. Eine Auswahl von Beschreibungsproblemen. - In: Jarmo Korhonen (Hg.): Phraseologie und Wortbildung - Aspekte der Lexikonerweiterung. - Tübingen: Niemeyer (= Linguistische Arbeiten 248) 1-20. (1992b): Morphosyntaktische Variabilität von Verbidiomen. - In: Csaba Földes (Hrsg): Deutsche Phraseologie in Sprachsystem und Sprachverwendung. - Wien (Österreich): Praesens, 49-88. Krüger, Jens (1995): Parsing verbaler Phraseologismen durch eine mit "Phraseo-Lex" kombinierte Chart. Studienarbeit im Fach Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg im August 1995. Lehmann, Egbert (1989): Wissensrepräsentation. - In: Kai von Luck (Hg.): Künstiche Intelligenz. Tagungsband zur KIFS-89, Günne 11-19. März 1989. - Berlin, Heiidelberg, 52-77. Link, Godehard (1991): Formale Methoden der Semantik. - In: Armin von Stechow und Dieter Wunderlich (Hgg.): Semantik. Ein internationales Handbuch zeitgenössischer Forschung. - Berlin, New York, 835-860. Löser, Anja (1994): Entwicklung und Implementierung des Grammatikregelsystems Phraseo-Gramm zur Verarbeitung verbaler Phraseologismen. Studienarbeit im Fach Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg im Oktober 1994. Lyons, John (1980): Semantik. Band 1.- München: Beck (= Beck'sche Elementarbücher). Munske, Horst Haider (1993): Wie entstehen Phraseologismen?. - In: Klaus J. Mattheier et al. (Hgg.): Vielfalt des Deutschen. Festschrift für Werner Besch. - Frankfurt, 481-516. Müller-Thurau, Claus Peter (1985): Lexikon der Jugendssprache. - Düsseldorf, Wien: Goldmann. Nunberg, Geoffrey D. (1978): The pragmatics of Reference. Dissertation der Stadtuniversität von New York. Reproduziert durch den Idiana University Linguistics Club. - Bloomington. Nunberg, Geoffrey D, Ivan. A. Sag, Thomas Wasow (1994): Idioms. Technischer Bericht der Stanford Universität, 14 Januar 1994. Palm, Christine (1992): "Umgekehrt wird ein Schuh draus". Idiomatizität und Konnotation im Phrasem. - In: Csaba Földes (Hg.): Deutsche Phraseologie in Sprachsystem und Sprachverwendung. - Wien (Österreich): Praesens, 89-106. Pedrazzini, Sandro (1994): Phrase Manager: A System for Phrasal and Idiomatic Dictionaries. - Hildesheim: Olms. Pedrazzini, Sandro; Pius ten Hacken (1994): Phrase Manager. - In: Harald Trost (Hg.): Tagungsband zur KONVENS '94. - Wien (Österreich), 435-438. Pinkal, Manfred (1989): Neuere Semantikmodelle für die Verarbeitung natürlicher Sprache. - In: Kai von Luck (Hg.): Künstiche Intelligenz.Tagungsband zur KIFS-89, Günne 11-19. März 1989. - Berlin, Heidelberg, 202223. Pulman, Stephen G. (1993): The Recognition and Interpretation of Idioms. - In: Christina Cacciari, Patrizia Tabossi (Hgg.): Idioms. Processing, Structure, and Interpretation. - Hillsdale, New Jersey: Lawrence Erlbaum
238 Associates, 249-270. Reyle, Uwe (1987): Zeit und Aspekt bei der Verarbeitung natürlicher Sprache. - Dissertation am Institut für Linguistik der Universität Stuttgart. Röhrich, Lutz (1973): Lexikon der sprichwörtlichen Redensarten. 2 Bände. - Freiburg, Basel, Wien. Rothkegel, Annely (1973): Feste Syntagmen. Grundlagen, Strukturbeschreibung und automatische Analyse. Tübingen. - (1989): Polylexikalität: Verb-Nomen-Verbindungen und ihre Behandlung in EUROTRA. EUROTRA-D Working Papers No. 17. - Saarbrücken. Schemann, Hans (1989): Das phraseologische Wörterbuch. - In: Franz Josef Hausmann, Oskar Reichmann, Herbert Ernst Wiegand, Ladislav Zgusta (Hgg.): Wörterbücher. Dictionaries, Dictionnaires. Ein internationales Handbuch zur Lexikographie 5. 1019-1028. - Berlin/New York: de Gruyter 1989. Schenk, Andre (1989): The formation of idiomatic structure. - In: M. Everaert and E.-J. van der Linden (Hgg.): Proceedings of the First Tilburg Workshop on Idioms. - Tilburg (Niederlande), 145-157. Schenk, Andre (1992): The syntactic behavior of Idioms. - In: M. Everaert and E.-J. van der Linden, A. Schenk, R. Schreuder (Hgg.): Proceedings of IDIOMS (Volume 1 ). - Tilburg (Niederlande), 97-110. Schlieben-Lange, Brigitte (1991): Soziolinguistik. Eine Einführung. Dritte, überarbeitete und erweiterte Auflage. - Stuttgart, Berlin, Köln. Schubert, Klau (1989)s: Idioms in a translation grammar. - In: M. Everaert and E.-J. van der Linden (Hgg.): Proceedings of the First Tilburg Workshop on Idioms. - Tilburg (Niederlande), 145-157. Seifert, Doris (1994): Konzeption und Implementierung einer zentralen Steuerung zu Phraseo-Lex. Diplomarbeit im Fach Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg im Juli 1994. Shaer, Benjamin (1992): Idioms and Reference. - In: M. Everaert and E.-J. van der Linden, A. Schenk, R. Schreuder (Hgg.): Proceedings of IDIOMS (Volume 1). - Tilburg (Niederlande), 157-170. Shieber, Stuart M. (1986): An Introduction to Unification-Based Approaches to Grammar. Chicago: Chicago University Press (= CSLI Lecture Notes No. 4). Siegert, Ottmar (1995): Datenbankeinsatz im Rahmen von Phraseo-Lex. Diplomarbeit im Fach Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg im Oktober 1995. Starosta, St. (1978): The one per cent solution. - In: W. Abraham (Hg.): Valence, Semantic Case, and Grammatical Relations. - Amsterdam. Sternkopf, Jochen (1987): Ein Ansatz zur Modellierung phraseologischer Einheiten. - In: Deutsch als Fremdsprache 4/87. - Leipzig, 207-211. - (1990): Phraseologismen mit obligatorischer Negationskonstituente. - In: Deutsch als Fremdsprache 5/90. Leipzig, 293-295. (1992a): Bedeutungsschichten in phraseologischen Einheiten. - In: Deutsch als Fremdsprache 2/92. - Leipzig, 95-99. (1992b): Valenz in der Phraseologie? Ein Diskussionsbeitrag. - In: Deutsch als Fremdsprache 4/92. - Leipzig, 221-224. Stock, Oliviero (1989): Parsing wih flexibility, dynamic strategies, an idioms in mind. - In: Computational Linguistics, 15,1/1989. Stock, Oliviero; Jon Slack; Andrew Ortony (1993): Building Castles in the Air. Some Computational and Theoretical Issues in Idiom Comprehension. - In: Christina Cacciari, Patrizia Tabossi (Hgg.): Idioms. Processing, Structure, and Interpretation. - Hillsdale, New Jersey: Lawrence Erlbaum Associates, 229-247. Tabossi, Patrizia; Francesco Zardon (1993): The Activation of Idiomatic Meaning in Spoken Language Comprehension. - In: Christina Cacciari, Patrizia Tabossi (Hgg.): Idioms. Processing, Structure, and Interpretation. Hillsdale, New Jersey, 145-162. Torzova, M. V. (1983): Zur Valenz von Phraseologismen. - In: Deutsch als Fremdsprache 5/83. - Leipzig, 283287. van der Linden, Erik-Jan (1989): Idioms and Flexible Categorial Grammer. - In: M. Everaert and E.-J. van der Linden (Hgg.): Proceedings of the First Tilburg Workshop on Idioms. Tilburg (Niederlande), 127-143. (1992): Idioms in a Categorial Grammer. - Utrecht (Niederlande): OTS Dissertationsreihe. Verstraten, Linda: Idioms in Dutch dictionaries. - In: M. Everaert und E.-J. van der Linden (Hgg.): Proceedings of the First Tilburg Workshop on Idioms. - Tilburg (Niederlande) 1989, 171-188. von Polenz, Peter (1985): Deutsche Satzsemantik. Grundbegriffe des Zwischen-den-Zeilen-Lesens. - Berlin, New York. Wasow, T.; Ivan A. Sag; G. Nunberg (1982): Idioms: An Interim Report. - In: S. Hattori, I. Kazuko (Hgg.): Pro-
239 ceedings of the XŒIth international congress of linguists.- Tokio, 102 -IIS. Weinreich, Uriel (1972): Probleme bei der Analyse von Idioms. - In: Ferenc Kiefer (Hg.): Semantik und generative Grammatik. Bd 2. - Frankfurt/Main, 415-474. Welke, Klaus M (1988): Einfuhrung in die Valenz und Kasusutheorie. - Leipzig:Bibliographisches Institut. Wotjak, Barbara(1986): Zu einer integrativen Mehrebenenbeschreibung von Phraseologismen. - In: Deutsch als Fremdsprache 3/86. - Leipzig, 321-331. (1989): Ansatz eines modular-integrativen Beschreibungsmodells für verbale Phraseoloexeme (PL). - In: Gertrud Greciano (Hg.): Europhras 88. Phraseologie Contrastive 12.-16. Mai, Klingenthal-Strasbourg/Frankreich. - Strasbourg, 489-467. - (1992): Phraseolexeme in System und Text. - Tübingen: Niemeyer (= Reihe Germanische Linguistik).
Phraseologismen-Index
A jmdn. aufs Abstellgleis schieben in den sauren Apfel beißen jmdm. auf den Arm nehmen jmdn. jmdm./etwas in die Anne treiben sich in den Arsch beißen jmdn. in den Arsch kriechen sich Asche aufs Haupt streuen sich einen Ast lachen Atem holen nicht viel Aufhebens machen von etwas ein Auge für etwas haben mit einem blauen Auge davonkommen 7 jmdm. etwas vor Augen halten die Augen offenhalten nach etwas aussehen
...68,176 27 69,71,188 63 182 182 182
23 182 20 103 26 178 103 ...65,182
Β etwas nicht auf die lange Bank schieben jmdm. einen Bären aufbinden Bauklötze staunen Bäume ausreißen mit etwas hinterm Berg halten einen Besen fressen sich ins gemachte Bett legen sich einen hinter die Binde kippen kein Blatt vor den Mund nehmen Blech reden etwas durch die Blume sagen Bock haben den Bock zum Gärtner machen einen Bock schießen sich auf seine vier Buchstaben setzen . .
26,44 . . 6,15,18,24,26,61,65,85ff, 94ff, 103, HOff, 126, 142ff, 147ff, 172, 174, 178f, 180ff, 186ff, 191,196 37,95,102,104,119,126,178 26 68 24,26,72 17 3 26 102,121,126,145f, 179 70 105,107f . 24,76,95,103,105,108f, 157f, 178f, 178 .25, 28, 40, 78, 82f, 85ff, 94ff, 103, 105ff, 111,133,147ff, 153ff, 179 182
242
D eins aufs Dach bekommen auf dem falschen Dampfer sein Dank sagen jmdm. ein Dorn im Auge sein auf Draht sein drauf und dran sein
21,26 27 83 119ff 21 61
E sich nicht entblöden, etwas zu tun
182
F in die Falle gehen Farbe bekennen Federn lassen ins Fettnäpfchen treten die Fetzen jmdm. Feuer unterm Hintern machen jmdn. um den kleinen Finger wickeln nicht vom Fleck kommen eine/die Fliege machen keiner Fliege etwas zu leide tun können die Flinte ins Korn werfen Fraktur reden die Fresse halten
fliegen
166 27 69 24,58, 74,76,96,106,122f, 157 77 69 94 104 182 77 25,102,165f, 178f, 179 23 70
G gang und gäbe sein etwas ist gehüpft/gehupft wie gesprungen in/im Geld schwimmen das Geld zum Fenster hinaus werfen die erste Geige spielen ein anderes Gesicht bekommen sich ein Gewerbe suchen auf der Gewinnerstraße sein jmdn. aufs Glatteis führen sich aufs Glatteis begeben auf Granit beißen ins Gras beißen sich in Grund und Boden schämen den Gürtel enger schnallen
44 69 102 102 73 103 182 183 103 103 58,77 6,26,28,88,95,179 102 1,3
243 H Haare auf den Zähnen haben jmdm. kein Haar/Härchen krümmen sich jmdm. an den Hals werfen etwas gegen jmdn. in der Hand/den Händen haben für jmdn. die Hand ins Feuer legen seine Hand/seine Hände im Spiel haben das Handtuch werfen die Haßkappe aufsetzen auf Herz und Nieren prüfen den Himmel auf Erden haben sich eine Hintertür/ ein Hintertürchen offenhalten/offenlassen guter Hoffnung sein bei jmdm. ist Hopfen und Malz verloren die Hose/Hosen anhaben die Hosen runterlassen die Hucke vollkriegen sich die Hucke vollachen jmdm. die Hucke vollhauen jmdm. die Hucke voll lügen sich die Hucke voll saufen etwas unter einen Hut bringen
102 69 66 65 6,88 69 28,39,41ff, 48ff, 102 183 83,102 20 70,176,178,185 182 172 66,180 183 20 20 20 20 20 63
I in die Irre gehen/locken/führen
20
Κ mit Kanonen auf/nach Spatzen schießen die Katze aus dem Sack lassen etwas auf dem Kerbholz haben sich bei jmdm. lieb Kind machen mit jmdm. ist nicht gut Kirschen essen einen an der Klatsche haben jmdm. ein Klotz am Bein sein Kohldampf schieben/haben auf heißen/glühenden Kohlen sitzen jmdm. raucht der Kopf jmdm. einen Korb geben einen Korb bekommen jmdm platzt der Kragen jmdm. etwas aus dem Kreuz leiern einen in der Krone haben
1,3,118,157 74,103,116f, 133,157,178 65f, 174,178 21 21,44,178 183 118 37,96 95,102 28,61,64,172,174,178 24,40,85ff, 115f, 144,214 115f,148f, 214 77 61 21
244
L eine Lanze brechen für etwas auf der Lauer liegen jmdm. den Laufpaß geben die beleidigte Leberwurst spielen über Leichen gehen jmdm. auf den Leim gehen jmdn. hinters Licht führen jmdm. geht ein Licht auf den Löffel abgeben jmdn. Lügen strafen sich nicht lumpen lassen sich die Lunge aus dem Hals husten Lunte riechen
106 19 19,73,76 70 77 23 71,188 178 23,82,95,101 21 104 102 15,21
M etwas aus sich machen jmdm. im Magen liegen das Maul halten in medias res gehen auf des Messers Schneide stehen nach dem Mond gehen in den Mond gucken aus einer Mücke einen Elefanten machen den Mund halten
65 64 70 21,27 66,180 103 70,180
Ν den Nagel auf den Kopf treffen etwas an den Nagel hängen jmdn. namhaft machen einen Narren an jmdm. gefressen haben jmdn. zum Narren halten die Nase gestrichen voll haben sich in die Nesseln setzen sich ins warme Nest setzen
93,102 101 183 .17,26,62,83,88,95,101,126 188 69,176 17 92f
O nicht ganz ohne sein sich aufs Ohr hauen jmdn. übers Ohr hauen jmdm. in den Ohren liegen noch nicht trocken hinter den Ohren sein
3,22,44 23,28 102 58 104
245 Ρ jmdn. auf die Palme bringen aufs falsche/richtige Pferd setzen jmdn. vom Platz stellen jmdn. auf die Plätze verweisen
22,60 69,71,180 183 183
R das fünfte Rad am Wagen sein ein Rad ab haben jmdn. zu Rate ziehen seine letzte Reise antreten jmdn. auf die Reise schicken in die Röhre gucken auf die Rolle gehen den Rubikon überschreiten mit jmdm. Rücksprache halten/nehmen jmdn. zur letzten Ruhe geleiten jmdn. zur letzten Ruhe betten sich nicht gerade mit Ruhm bekleckern
83 183 182 183 183 69 182 182 183 182 182 182,189
S bei jmdm. war schon der Sandmann einen Schatten haben jmdm. steht die Scheiße bis zum Hals jmdn. auf die Schippe nehmen auf dem Schlauch stehen den Schnabel halten die Schnauze halten jmdm. die Schnauze polieren sich freuen, wie ein Schneekönig jmdm. ein Schnippchen schlagen jmdn. auf den Schub bringen über die Schnur hauen ein Schoß raus haben jmdm. etwas in die Schuhe schieben einen Schuß haben einen Schuß machen eine Show abziehen jmdm. die Sprache verschlagen Staub aufwirbeln Stein und Bein schwören
183 183 182 69,180 183 70 70,180 182 102 1,19,184 183 182 183 61 174 183 183 63,172 38,102,122,145f, 178 15
246 bei jmdm. einen Stein im Brett haben einen Stein auf jmdn. werfen den Stein ins Rollen bringen jmdm. Steine in den Weg legen jmdm. Steine aus dem Weg räumen einen Streit vom Zaun brechen leeres Stroh dreschen mit dem/gegen den Strom schwimmen jmdm. den Stuhl vor die Tür setzen jmdm. die Suppe versalzen
1,2,3,13,19,22,24 118 118 65,95,117f, 126,157,172 117f 13,18,22,24,37,88,102 1121 71 26,28,88,95,102,120f, 126 23
Τ nicht alle Tassen im Schrank haben den Tatsachen ins Gesicht sehen nicht den Teufel an die Wand malen jmdn. über den Tisch ziehen mit der Tür ins Haus fallen
26 102 26 22 70
V den Vogel abschießen
6, 23,39f, 61, 78,85ff, 103,113f
W einen an der Waffel haben jmdm. reinen Wein einschenken in ein Wespennest greifen sein blaues Wunder erleben
183 26,180,188 103 27
Ζ jmdm. den Zahn ziehen sich an etwas die Zähne ausbeißen bis an die Zähne bewaffnet sein sich etwas zuschulden kommen lassen
120f 61 102 65
247
Fermdsprachliche Idiome Englisch: build castles in the air hit the sack hit the hay kick the bucket leave no stone unturned let the cat out of the bag pull strings put the cat among the pigeons pop the question spill the beans
133 132 132 25,35,51,132,134,136,158 85f 54,134 85 134 94 54,94,131ff, 136,158
Niederländisch: met spek Schieten een bok Schieten .
.85f 85f
Index A
c
Abhängigkeitsstruktur 58, 175 Abtrennung 23,97 Aktanten fakultative 58 obligatorische 58 Alphabetisierung automatische 165 Ambiguierung 77,96,98 Anaphernresolution 139, 148 Angabe freie 58 Ankerfunktion 137, 142 Anomalien 67 kategorielle 21 lexikalische 19 morphologisch-flexivische 19 syntaktische 28, 175 Antonyme 78, 180,197 phraseologische 68,70 Attributierung 28 aufspaltbar 94 Aufspaltung 91 Aussagenlogik 127 automatische Analyse 53
Chomsky-Grammatik Circumposition Computerlinguistik
Β Backtracking 206 Basislexeme 153, 172 Bedeutung figurative 3,92 Uterale 3 phraseologische 3 wörtliche 3 Bedeutungsangabe 177 Deskriptoren 166 Bedeutungsebenenswitching . . . . 77, 96 Bedeutungskomplex 82 Bedeutungsrepräsentation 5 Bedeutungsstruktur 178 Bedeutungsstrukturierung . 85,131, 167 Bedienoberfläche 185,186, 187
34 12 4, 31, 127
D Datenbasis 168 phraseologische 164, 170 Denotation 54 Dependenzstruktur 58 Deskriptoren 166 Diskursreferent 138 Diskursrepräsentationsstruktur .. 138 Diskursrepräsentationstheorie 130, 137 Diskursuniversum 138 DRS, partielle 151 DRS, prädikative 151 E Einbettimg 141 emotive Angaben 166 endozentrisch determiniert 37 Ergänzungsbedürftigkeit 58 exozentrisch determiniert 37 Expansion durch Adjektivattribut .. 27 Expansion durch Genitivattribute .. 28
F figurativ 3, 16 Flexibilität 132 syntaktische 164 Fokussierung durch Demonstrativpronomen .. 97 durch Fragesatzumformung . . . . 97 Fragesatztransformation 24 Frames 76,129, 157 freie Wortverbindungen 11 Frequenz 166 Frozenness 13 Frozenness-Hierarchie 46, 174 funktionale Komposition 152
250
Funktionsverbgefiige
13,52
G Generative Semantik
49
H Hauptparaphrase 177 Homonym, nichtphraseologisches . . . 23 I Idiom 1, 34 Idiomatik 6 Idiomatische Konstruktionschemata 13 Idiomatizität 12, 34, 38,49, 81 Idiomatizitätsgrad 12,81 Idiom-Aussageform 166 Idiom-Datei 164 Idiome analysierbare 132 im engeren Sinne 17,29 im weiteren Sinne 17 lexikalische 35 nicht-analysierbare 132 phrasale 35 polylexikalische 18 Idiomliste 42,45, 170 Idiom-Nennform 165 Idiomregeln 134 Imperativsatz 26 Inferenz 5 Inferenzsystem 133 Intensionale Logik 129 Introspektion 97 Isomorphiebeziehung 103 Isomorphismus 44,51,82,88 Isotopie 99 Isotopieebene 99 Κ Klammerstruktur indizierte 33 kommunikative Formeln 13,61 Kompetenzbegriff 97 Komponente semantisch autonome 96 unikale 19,28, 67,78,175, 193
Kompositionalität 87 Konnotation 69, 90,98, 181 Konstituente 32 phraseologisch-gebundene 20 Konstituenten semantisch autonome 88 Kontiguitätsbeziehungen 99 Konventionalisierungsprozeß 87 Koreferenz 99 kreative Modifikation 72 Künstliche Intelligenz sprachorientierte 4
L Lambda-DRT 151 Lambda-Kalkül 151 Lambda-Liste 152 Lemma 63, 134, 165, 171,188 Lemmatisierung 53 lexikalische Substitution 18 Lexikalisierung 13, 96 Lexikographie 161 Lexikon 44, 53, 83,143, 150, 185 Lexikondatenbanksystem 170 Lexikoneintrag 39,43, 186 komplexer 39,45,48 phraseologischer 171 Lexikonregeln 33, 34 LISP 186 logische Formel 179, 196 M Markierung diaphasische diastratische diasystematische diatopische stilistische maschinelle Inferenzen Mehrdeutigkeit Merkmalstruktur Merkmalstrukturen Metakommentar Metapher konventionelle kreative Metaphorik
182 183 182 182 29 74 3, 29, 196 204 204 72,76, 79 16, 24 16,92 16 15
251
Modifikation 27,29,72,76,79,91,135,198 externe 27 interne 27 systematische 77, 85 Modifikationen 67, 180 kreative 79,98 systematische 79, 96, 142 zulässige 97 Modifikationsmöglichkeiten 93 Modifizierung durch Adjektivattribute 97 durch Genitivattribute 97 Motivation 83 Motivierbarkeit 83, 177 Motiviertheit 15, 17, 52, 81, 83, 196 Ν
20
Negation 26 Negationskonstituente lexikalisierte 26 obligatorische 27 Nennform 63, 64,190 traditionelle 171 Netze semantische 76, 129 Nicht-Kompositionalität 81 nicht-kompositionelle Funktion . . . . 81 Nominalisierung 25 Nominationsstereotype 15,45,52 O Oberflächenanomalien onymische Wortgruppen Opakheit
Phrasenstrukturbaum .. 34,58,70, 173 Phrasenstrukturgrammatik . . . 58, 173 Phrasenstrukturregeln 34,52 kontextfreie 32 Phraseographie 162, 165 computergestützte 164 Phraseolexem 12, 15, 18 adjektivisches 15 adverbiales 15 nominales 15 verbales 15 Phraseologie 6 Phraseologieforschung 162 computergestützte 164 phraseologische Einheit 38 phraseologisch-gebundene Formative .
21, 78,175 14 84
Ρ Paraphrase . 39,44, 90, 101, 143, 190, 195 bedeutungsgleiche 90 komponentennahe 103, 105 Paraphrasierung 90, 101,177 partielle Funktionen 131 Passivierbarkeit 22,97 Passivtransformation 22 PATR 205 PATR-II 205 Phrase 32 Phrasenstruktur 175
Phraseologismen 1,11,18 adjektivische 164 analysierbar 87 direkt motivierbare 83 kompositioneil 87 metaphorisch motivierbare 83 nicht-idiomatische 15 okkasionelle 14 somatische 69 substantivische 164 teilkompositionelle 102, 142 teilmotivierbare 83 übertragen-kompositionell . 103, 142 unmotivierbare 83 vollidiomatisch 12 Phraseologismus 11 Phraseoschablonen 13 Prädikatenlogik 127 Primärmotivation 84 PROLOG 186 Pseudo-Idiome 38
Q Quantifizierbarkeit Quantifizierung Quasi-Argument
97 28 55, 63, 178, 179
R Redewendungen Referent
1 99
252
Referentenabbildung 133 Referentenpotential 150,178,195 referentiell dekomponierbar 95,96 Referentielle Dekombinierbarkeit .. 95 Referenz 54, 94 Referenzidentität 99 Referenzpotential 96, 103,177 Identifizierung 97 Referenzträger 99,179 Reflexe syntaktische 93 regulär-kompositionell 16 Relativsatztransfonnation 23 Relativsatzumformung 97 Remotivierung 84 volksetymologische 84 Resemantisierung 96,98 Rolle keine 195 Rollenzuweisung 195
S Sachwissen 4,75 Satzbaupläne 58 Satzmodelle 58, 171 Scheme 186 Schlüsselwörter 44 Scripts 76, 129, 157 semantisch autonom 88,195 Semantische Autonomie 24,87,88,95,96 Semantische Klassifikation . . . 177, 196 semantische Merkmale 39 semantische Rolle 59, 180,195 semantische Typ 196 Semantische Wertigkeit 180 semantischer Kasus 59 Situationstheorie 130 Situationswissen 4 sprachlichen Kompetenz 97 Sprachspiel 3,29,72,74,76, 85, 98 Sprachverarbeitung maschinelle 4,29,67, 127,170 Sprichwörter 13,45 Stabilität 13,29, 67 Stabilitätsphänomene 18,175 Stichwörter 165 Strukturzuweisun 178 Substitution
der Artikelwörter lexikalische Synonym Synonyme phraseologische Syntaxbaum
97 18,67,68,78 180,197 78 68,70 173
Τ Teilbedeutung identifizierbare 89,91 literale 95 metaphorisch-motivierbare 95 nicht-motivierbare 96 teilidiomatisch 12 Textanalyse 98, 105 Textbeispiele 183 Textbelege 167, 183, 200 Textkohärenz 98, 137 Textkonstitution 98 Textverflechtungen 96 Tiefenkasus 59 Transformationelle Defekte 22,78 Transformationelle Defektivität 21,46, 67 Transformationen 34 Transformationsgrammatik 32 Transparenz 84 Typ semantischer 173, 177 syntaktischer 173, 190 V Valenz 57,175 fakultative 175 konstruktionsexterne 60 konstruktionsinterne 60 obligatorische 175 qualitative 58 quantitative 58 wendungsexterne 60, 175,178 wendungsinterne 60,175 Valenzgrammatik 58 Valenzstruktur 175 Valenztheorie 171 Variabilität 29,67 lexikalische 68 lexikographisch erfaßbare . . . 67,68
253 morphosyntaktische 68 regelbasierte 71 regelgeleitete 67 Variante 67,68,78,162, 176 lexikalische 70, 194 morphosyntaktische 70 strukturelle 70, 194 Verifikationsinstrument 163 Vertrautheitsbewertung 45 Verweisung anaphorisch 99, 147 kataphorisch 99 Verwendungssituation 183 VPL1 171, 173, 175, 188 VPL2 171,173,175,188 W Weltwissen 4,99 Wiederaufnahme 137 explizite 99,106, 147 implizite 99 Wissen assoziatives 75 außersprachliches 5,78 enzyklopädisches 4 episodisches 5 lexikalische 75 ontologisches 5 semantisches 127 sprachliches 4, 5 Wissensspezifikationsumgebung .. 167 Wörterbuch 63, 162 maschinelles 63 Wörterbücher phraseologische 162 Wortspiel 3,29,72,74,76, 85,98 Ζ Zentrum-Peripherie-Modells Zusatzlexikon maschinelles
11 185 170