161 0 6MB
German Pages 167 [172] Year 2005
Linguistische Arbeiten
499
Herausgegeben von Hans Altmann, Peter Blumenthal, Klaus von Heusinger, Ingo Plag, Beatrice Primus und Richard Wiese
Achim Stein
Semantische Repräsentation italienischer Verben Automatische Disambiguierung mit Konzepthierarchien
Max Niemeyer Verlag Tübingen 2005
Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar. ISBN 3-484-30499-5
ISSN 0344-6727
© M a x Niemeyer Verlag, Tübingen 2005 Ein Unternehmen der K. G. Saur Verlag G m b H , München http://www.niemeyer.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung a u ß e r h a l b der engen Grenzen des Urheberrechtsgesetzes ist ohne Z u s t i m m u n g des Verlages unzulässig und strafbar. D a s gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbeständigem Papier. Druck: L a u p p & Göbel G m b H , Nehren Einband: Nädele Verlags und Industriebuchbinderei, Nehren
Inhalt
1
Einleitung
2
Lexikalische Semantik 2.1 Einführung 2.2 Wortbedeutung als Ergebnis von Dekomposition 2.2.1 Strukturelle Semantik 2.2.2 Kognitiv motivierte Beschreibungen 2.3 Wortbedeutung als Einheit 2.4 Wortbedeutung als generativer Mechanismus
5 5 7 7 9 13 16
3
Ontologien und lexikalische Semantik 3.1 Begriff und Typologie 3.2 Ontologische Ansätze 3.2.1 Generalized Upper Model 3.2.2 Mikrokosmos 3.2.3 Cyc 3.2.4 WordNet 3.3 Ontologische Prinzipien 3.4 Von der Theorie zum Modell 3.4.1 Rekapitulation der semantischen Ansätze 3.4.2 Konsequenzen für das semantische Modell
23 23 26 26 27 30 32 35 38 38 41
4
Eine Prozesshierarchie für Verbbedeutungen 4.1 Identitätskriterien für Prozesse 4.2 Der Aufbau der Prozesshierarchie 4.2.1 Strukturierung 4.2.2 Prozessnamen 4.2.3 Feinheit der Differenzierung 4.3 Die Domänen der Prozesshierarchie 4.3.1 Allgemeine und Domänen-übergreifende Merkmale 4.3.2 Die materielle Domäne 4.3.2.1 Zur Trennung von Vorgängen und Handlungen
45 45 50 50 55 57 61 62 64 64
4.3.3
4.3.4
4.3.5
1
4.3.2.2
HANDELN
66
4.3.2.3
PASSIEREN
71
Die relationale Domäne
71
4.3.3.1
POTENZIELLERWECHSEL
71
4.3.3.2
MENSCHLICHEEIGENSCHAFT
72
Die mentale Domäne
73
4.3.4.1
MENTALHANDELN
73
4.3.4.2
MENTALPASSIEREN
74
4.3.4.3
MENTALERZUSTAND
74
Die verbale Domäne
75
VI
4.4
4.3.5.1
INHALTSBEZOGEN
75
4.3.5.2
HÖRERBEZOGEN
76
4.3.5.3
WEISEVERBAL
77
4.3.5.4
VERBALHANDELN
77
Vorläufige Bewertung der Prozesshierarchie
77
5
Semantische Relationen in der Prozesshierarchie 5.1 Italienische Verbdaten 5.2 Abstraktionsmethoden 5.3 Polysemie und Grundbedeutung 5.4 Synonymie
83 83 85 87 94
6
Automatische Disambiguierung 99 6.1 Zielsetzung 99 6.2 Das Disambiguierungssystem SIC 100 6.2.1 Die SIC-Objekthierarchie 100 6.2.2 Argumentstrukturen als Verknüpfungen zwischen den Hierarchien . . 101 6.2.3 Semantische Analyse 103 6.3 Diskussion der Ergebnisse 107 6.4 Ausblick 112
7
Dokumentation der Daten und Programme 7.1 IV: Ein Werkzeug für Hierarchien 7.1.1 Die linguistischen Daten von IV 7.1.2 Implementierung der Syntax-Semantik-Schnittstelle 7.1.3 Funktionen von IV 7.1.3.1 Umgebung, Aufruf, Optionen 7.1.3.2 Konfiguration, Eingabe, Ausgabefunktionen 7.1.3.3 Ausgabe der Lesarten 7.1.3.4 Lokalisierung von Prozessen 7.1.3.5 Syntaktische Argumente in Prozessdomänen 7.1.3.6 Synonymie-Berechnung 7.1.3.7 Polysemie-Suche 7.1.3.8 Verb-Suche und Sublemma-Suche 7.2 SIC: Automatische Disambiguierung 7.2.1 Sprachdaten 7.2.1.1 Das Verblexikon 7.2.1.2 Das Substantivlexikon 7.2.1.3 Das Flexionslexikon 7.2.1.4 Die Eingabedatei 7.2.2 Hierarchiedaten 7.2.2.1 Prozesse 7.2.2.2 Objekte 7.2.2.3 Objektgruppen 7.2.2.4 Polysemieregeln 7.2.3 Programmdaten
115 115 115 116 117 118 118 118 118 119 135 135 136 137 137 137 137 138 138 138 138 140 140 141 141
VII
7.3
7.2.3.1 Java-Klassen 7.2.3.2 Programm-Ablauf 7.2.4 Benutzeroberfläche Sprach- und Programmdaten
141 142 143 144
8
Zusammenfassung und Ausblick
147
9
Literaturverzeichnis
151
Abbildungsverzeichnis
2.1
Domänen und Relationen bei Dölling 1994,50
12
3.1 3.2 3.3 3.4 3.5
Prozesstypen nach Matthiessen (1992) Ein Ausschnitt aus der Hierarchie des „Generalized Upper Model" Die Top-Ontologie von EuroWordNet Multiple IstEin-Relationen Universale Entitäten nach Guarino 1998
27 28 33 36 37
4.1 4.2 4.3
54 59 60
4.8
Lesartbaum für aprire Konkrete und kollokative Bedeutungen von aprire Zuordnung von Konzepten bei tagliare Parallelitäten in den Domänen R E L A T I O N A L , P A S S I E R E N und H A N D E L N Umfang der Domänen der Prozesshierarchie Teildomänen unter M E N T A L H A N D E L N und K O G N I T I V H A N D E L N Teildomänen unter V E R B A L und I N H A L T S B E Z O G E N Mehrdimensionale Hierarchien
5.1 5.2
Polysemie und Frequenz Globale und lokale Polysemie
6.1 6.2 6.3
SIC: Objekte, Objektgruppen, Objektpolysemie SIC: Analyse-Beispiel SIC: Argumentimplikation bei sekundärer Analyse
102 103 106
7.1 7.2 7.3 7.4
Grafische Schnittstelle zwischen Prozesshierarchie und Verb Wörterbuch . . . Syntaktische Informationen für Teildomänen Der Ablauf einer Analyse in SIC Die Benutzeroberfläche von SIC
117 120 143 144
4.4
4.5 4.6 4.7
.
.
63
64 73 75
78 84 90
1
Einleitung
Im Gegensatz zu anderen Wissenschaften, in denen empirische und theoretische Arbeiten eng miteinander verknüpft sind, besteht in der Linguistik und speziell der Semantik eine beinahe unüberbrückbare Kluft zwischen den Forderungen der Theorien und den Möglichkeiten empirisch angelegter Untersuchungen. Ziel dieser Arbeit ist, einen Beitrag zur Überbrückung dieser Kluft zu leisten, indem ein theoretisch fundiertes Modell als Grundlage für die Verknüpfung von semantischen und syntaktischen Untersuchungen entwickelt wird. In verschiedenen Anwendungen auf den italienischen Verbwortschatz wird der Nutzen dieses Modells für die linguistische Theoriebildung, aber auch für praktische Anwendungen wie die automatische Disambiguierung gezeigt. Dabei wurde besonderer Wert auf Konsistenz, Überprüfbarkeit und Wiederverwendbarkeit der Forschungsergebnisse gelegt. Der Forschungsbeitrag liegt in den Bereichen der theoretischen Linguistik, der angewandten Linguistik und der Erstellung lexikalischer Ressourcen. 1. In den Bereich der theoretischen Linguistik fällt die Entwicklung eines Modells der semantischen Repräsentation von Verben. Die Unterziele bei der Ausarbeitung einer Prozesstypologie bestehen darin, einen brauchbaren Kompromiss zwischen theoretischer Fundierung und praktischer Verwendbarkeit zu finden, die Phänomene verbaler Mehrdeutigkeit adäquat darzustellen und eine geeignete Schnittstelle zur syntaktischen Ebene aufzubauen. Hierfür werden Prinzipien der ontologischen Beschreibung angewendet: Konzepte werden als semantische Typen in einer Hierarchie repräsentiert, und die Lesarten der untersuchten Wörter werden diesen Konzepten zugeordnet. Für Verbbedeutungen wird eine Prozesshierarchie gebildet, für die im Rahmen der Evaluierung untersuchten Substantive eine Objekthierarchie. 2. In den Bereich der angewandten Linguistik fällt der empirische Teil der Arbeit: Ein repräsentativer Teil des italienischen Verbwortschatzes (die 1.000 häufigsten Verben nach der IBM-Frequenzliste VELI 1989) wird semantisch exhaustiv analysiert, indem zwischen den Konstruktionen der Verben (aus dem Wörterbuch von Blumenthal & Rovere 1998) und den Konzepten der Prozesshierarchie über 12.000 Verbindungen hergestellt werden. Diese Art der konzeptuellen Strukturierung erlaubt die systematische Auswertung des semantischen Verhaltens der analysierten Verben unter gleichzeitiger Berücksichtigung der syntaktischen Struktur. Die Ergebnisse dieser Auswertung machen konzeptgebundene Generalisierungen über die semantischen und syntaktischen Variationsmöglichkeiten von Verben möglich. Das übergeordnete Prinzip der Analyse ist die objektorientierte Beschreibung einer breiten Datengrundlage, im Gegensatz zu den komplexen semantischen Theorien, die häufig auf spärlichen Daten aufbauen. 3. In den Bereich der Erstellung lexikalischer Ressourcen fallt die Formalisierung sowohl der theoretischen Grundlagen als auch der empirischen Ergebnisse: Die semantische Repräsentation (Prozess- und Objekthierarchien) und die im empirischen Teil erstellten Daten (syntaktisch-semantische Relationen) wurden komplett implementiert, und zwar in einer
2 Form, die die Wiederverwertbarkeit der Daten sicherstellt und den Ausgangspunkt für weiterführende Forschungen bilden kann. Zur Evaluierung der semantischen Beschreibung wurde außerdem der Prototyp eines Disambiguierungsprogramms erstellt. In Kapitel 2 werden an ausgewählten Arbeiten die Grundzüge der lexikalischen Semantik und die wichtigsten für den Bereich der Verbsemantik relevanten Fragestellungen dargestellt. Einen Schwerpunkt bildet die Auseinandersetzung mit aktuellen Ansätzen zur Repräsentation von Mehrdeutigkeit und ihren praktischen Umsetzungen. Kapitel 3 enthält eine Einführung in das Thema Ontologien aus informationstheoretischer und linguistischer Sicht, eine Präsentation einiger ontologischer Projekte von linguistischer Relevanz und die Diskussion formaler Kriterien zum Aufbau solcher Hierarchien. Schließlich werden aus den diskutierten semantischen und ontologischen Ansätzen die Prinzipien für die semantische Beschreibung der italienischen Verben abgeleitet und ein Modell zur Repräsentation dieser Beschreibung entwickelt. In Kapitel 4 wird beschrieben, wie das Modell in eine semantische Repräsentation umgesetzt wird. In Abschnitt 4.1 wird die Problematik der Entwicklung formaler Kriterien für Ereignisontologien behandelt. In Abschnitt 4.2 wird eine Konzepthierarchie (kurz: „Prozesshierarchie") vorgestellt, deren Knoten Verblesarten repräsentieren, die durch Analyse der 1000 frequentesten italienischen Verben definiert wurden. Weiterhin werden die Vorgehensweise und die Kriterien für die Herstellung der über 12.000 semantisch-syntaktischen Relationen zwischen den Verben und den Knoten der Hierarchie erläutert. In Abschnitt 4.3 werden die Domänen der Hierarchie mit ihren wichtigsten Teildomänen vorgestellt. Abschnitt 4.4 resümiert die Möglichkeiten und Probleme der hierarchischen Repräsentation. In Kapitel 5 wird die Datenbasis vorgestellt, die sich aus der Verbanalyse ergeben hat und gezeigt, wie die Prozesshierarchie als Mittel zur Definition unterschiedlicher Konzepte von Polysemie, zur Berechnung von Grundbedeutungen und für eine graduelle Darstellung semantischer Nähe zwischen Verben einsetzbar ist. In Kapitel 6 wird untersucht, ob die semantische Repräsentation konsistent genug ist, um in sprachverarbeitenden Anwendungen eingesetzt zu werden. Hierfür wurde ein System zur Evaluierung der Verbbeschreibung (SIC, für „Semantic Interpretation in Context") entwickelt, das als Teilmodul eines automatischen Disambiguierungssystems konzipiert ist. Zur Formalisierung der kontextuellen Selektionsbeschränkungen wird die Verbbeschreibung durch eine Objekthierarchie ergänzt, die bei der Analyse von über 1.000 italienischen Substantiven aufgebaut wurde. SIC liefert für italienische Eingabesätze semantische Analysen, in denen eine oder mehrere Lesarten des Verbs selektiert werden, und disambiguiert über 90% der korpusextrahierten Beispielsätze für die knapp 700 Lesarten von 30 ausgewählten italienischen Verben. In SIC sind traditionelle linguistische Konzepte wie das Valenzmodell oder die semantische Spezifikation von Argumenten mittels Objektklassen in auf Hierarchien operierende Methoden umgesetzt. In Kap. 7 sind die beiden Programme /V und SIC sowie die verfügbaren Ressourcen ausführlich beschrieben. Außerdem wird an einigen Beispielen der Wert des semantischen Modells für lexikalische Analysen aufgezeigt. Exemplarische Untersuchungen veranschaulichen, wie die Kombination von feiner Lesartdifferenzierung und hierarchischer Repräsentation einerseits für rein semantische Fragestellungen (Synonymie, Polysemie) und andererseits für syntaktisch-semantische Untersuchungen (Zusammenhänge zwischen Domänen der Hierarchie und Argumentrealisierung oder Alternationstypen) nutzbar ist.
3 Alle in dieser Arbeit beschriebenen Strukturen, Methoden und Analysen sind implementiert und können plattformunabhängig in einer Java-Umgebung überprüft werden. Alle erstellten Module sind in zwei Programmen zusammengefasst: IV für die semantische Repräsentation italienischer Verben und die Schnittstelle zwischen Semantik und Syntax, SIC für die automatische Disambiguierung. Der Band ist eine überarbeitete Fassung meiner 1999 an der Universität zu Köln eingereichten Habilitationsschrift. Für Kritik und Anregungen danke ich vor allem Peter Blumenthal, außerdem den Kölner Gutachtern Beatrice Primus, Andreas Kablitz und Jürgen Rolshoven. Matthias Pfisterer danke ich für Unterstützung bei der Implementierung, Jeanette Pohlit und Thomas Stichler für die Durchsicht des Manuskripts.
2
Lexikalische Semantik
2.1
Einführung
Der Begriff „lexikalische Semantik" steht für eine Ausrichtung der Semantik, in der die Wortbedeutung wieder in den Mittelpunkt des Interesses gerückt ist. Sie setzt sich sowohl von der von logischen Prinzipien geprägten Satzsemantik als auch von der traditionellen Wortsemantik mit ihren eher theoretisch ausgerichteten Schwerpunkten ab. Der Forschungsbereich ist hauptsächlich durch seine Anwendungsbezogenheit gekennzeichnet. Er ist das Produkt der in den achtziger Jahren einsetzenden Tendenz, lexikalische Einheiten zunehmend mit Informationen aus anderen Ebenen der linguistischen Beschreibung, besonders der Syntax, anzureichern. Erst mit diesen syntagmatischen Informationen war die Möglichkeit gegeben, formale Analysemechanismen aufzustellen, mit denen Mehrdeutigkeit als Ergebnis kompositionaler semantischer Prozesse im Lexikon darstellbar ist. Klassifizierungen von Arbeiten zur Wortbedeutung operieren meistens mit dem Kriterium, ob unter den Bedeutungen einer Form eine als ausgezeichnet angesehen wird, und wenn ja, wie diese dargestellt wird. Die Annahme einer Grundbedeutung, von der andere Lesarten abgeleitet sind, reicht von der historischen Linguistik des 19. Jahrhunderts Uber strukturalistisch geprägte Arbeiten (z.B. Martin 1972), die Psychomechanik Guillaumes (signifie de puissance vs. signifie d'effet) und kognitive Arbeiten (Bierwisch 1983) bis zu neueren Prototyptheorien (z.B. Kleiber 1999) und aktuellen Ansätzen der maschinellen Sprachverarbeitung (z.B. Raskin & Nirenburg 1995). Am extremsten ist die Grundbedeutungsidee wohl bei Wierzbicka umgesetzt, die für Wörter im Lexikon nur Kernbedeutungen ansetzt und jegliche semantische Verfeinerung in sprachexternen Komponenten ansiedelt (Weltwissen, KI; vgl. z.B. Wierzbicka 1989). Zu dieser Grundbedeutungsidee gibt es unterschiedlich extreme Gegenpositionen. Während Fillmore in seiner Theorie der frame semantics Grundbedeutungen als völlig ungeeigneten Ausgangspunkt semantischer Beschreibung hinstellt (Fillmore 1982), werden die Lesarten polysemer Formen in anderen Arbeiten als Produkt von Selektionen aus einer Menge gleichberechtigter Bedeutungen oder Bedeutungskomponenten angenommen. Dazu gehört etwa Rastiers (1987) Unterscheidung zwischen aktuellen und virtuellen Semen oder Bartsch (1994), die in ihrer Kritik an Searles (1992) Theorie der literal meanings die Bedeutung eines Worts ähnlich wie Rastier nicht als Schnittmenge aller seinen Lesarten gemeinsamen Komponenten, sondern als ihre Summe ansieht (vgl. hierzu die Analyse von engl, push in Kap. 4.1). Schließlich kann die Kernbedeutung als Abstraktion aller möglichen Lesarten auch als eine Art schematische Form dargestellt werden, in der die Interaktion mit Elementen des Kontexte spezifiziert ist. Die Vor- und Nachteile dieser prinzipiellen Entscheidung für oder gegen Grundbedeutungen sind bekannt: Für die Auswahl einer Grundbedeutung gibt es häufig keine semantischen Kriterien; bei den alternativen Ansätzen ergibt sich vor allem bei hochgradiger Polysemie eine zu allgemeine Kernbedeutung bzw. schematische Form, die das Problem auf die Ebene der kontextuellen Regeln verschiebt. Das Valenzkonzept der strukturellen Linguistik ist in die lexikalische Semantik unter dem Begriff der Argumentstruktur eingegangen (vgl. z.B. Grimshaw 1990). Sie entspricht dem
6 quantitativen Valenzbegriff und ordnet jedem Prädikat eine bestimmte Anzahl von Argumenten zu. Dem qualitativen Valenzbegriff entspricht das Modell der thematischen Rollen, die die Relation zwischen dem Prädikat und seinem Argument ausdrücken. Das Rolleninventar ist je nach Ansatz unterschiedlich. Die Verbindung zwischen Semantik und Syntax besteht in zweierlei Hinsicht. Erstens darf eine thematische Rolle höchstens einmal in der Argumentstruktur eines Verbs realisiert sein, und zweitens sind die Argumente über ihre Rollen in eine Hierarchie eingeordnet, deren Extreme von Agens einerseits und Thema und Patiens andererseits gebildet werden, und die die Reihenfolge der Besetzung der syntaktischen Positionen definiert (Talmy 1988b; Grimshaw 1990; Kunze 1991). Thematische Rollen können in Komponenten zerlegt und durch prototypische Merkmalsbündel ausgedrückt werden (Cruse 1986; Dowty 1988; Dowty 1991): Cruse zerlegt z.B. Agent in die Merkmale [+volitional, +agentive, +effective, +initiative], Dowty sieht Rollen als ein durch unterschiedlich prominente Merkmale definiertes Kontinuum, in dem z.B. auch der Patiens agentive Merkmale haben kann (vgl. hierzu die ausführlichen Diskussionen in Primus (1999: Kap. 3) und Engelberg (2000: Kap. 4)). Selektionsrestriktionen waren in der strukturellen Linguistik meist empirisch definiert und spiegelten das Primat der Syntax über die Semantik wider. Auf dem Umweg über Ansätze aus dem ontologischen Bereich (vgl. Kap. 3) und der künstlichen Intelligenz sind sie in die lexikalische Semantik eingegangen. Dort treten sie als Elemente von prinzipienbasierten Ansätzen, meist hierarchischen Subsumptions-Systemen, auf, die die fundamentalen Probleme der Merkmaldefinition, Merkmalgranularität und Merkmalrelevanz nicht lösen, aber die Zuweisungen von Merkmalen erleichtern. Für diese syntaktisch determinierte Definition von Selektionsrestriktionen stehen die Arbeiten des LADL und des L L I 1 , nach deren Prinzipien auch die Arbeiten zur italienischen Lexikon-Grammatik vorgehen.2 Nach umfangreicher Aufarbeitung des französischen Wortschatzes hinsichtlich der syntaktischen Distribution der Lexeme in den 70er und 80er Jahren gehen die ersten semantischen Klassifikationen größeren Umfangs auf die Theorie der Objektklassen von Gross (1994) zurück. Der französische Nominalwortschatz wurde mit acht Grobklassen und teilweise mit untergeordneten feineren Klassen kategorisiert. Allerdings sind die Relationen zwischen den Klassen nicht spezifiziert, und eine relationale, z.B. hierarchische Anordnung lehnt Gross explizit ab und beruft sich dabei auf die Kategorien des Übersetzungssystems Systran. Damit hat er die Position des LADL gegenüber der Anwendung von Typhierarchien maßgeblich geprägt: In der Einführung des vier Jahre später erschienenen Themenbands (Le Pesant & Mathieu-Colas 1998b) wird eine abstrakte Definition von Objektklassen abgelehnt. Sie seien nur definiert „par relation avec les pr6dicats qui leur sont spdcifiques" (Le Pesant & MathieuColas 1998a: 12) und nicht als Hierarchie darstellbar: Les arbres sdmantiques [ . . . ] prennent comme point de dfyart un systöme logique coruju a priori ou une classification «naturelle» du monde, ils n'ont pas de prioccupation grammatical. (Le Pesant & Mathieu-Colas 1998a: 15)
1
2
Laboratoire pour l'Automatisation et la Documentation Linguistique und Laboratoire de Linguistique Informatique, Paris XIII. Vgl. z.B. die zahlreichen Arbeiten zur Klassifizierung französischer Verben (Gross 1968; Boons et al. 1976b; Boons et al. 1976a; Boons et al. 1992) vgl. z.B. Elia et al. 1981, Elia 1984, D'Agostino 1989, D'Agostino 1995, De Mauro & Lo Cascio 1997
7 Die Verfasser lehnen eine schematische (Baum-)Darstellung ab, die sich nur auf intrinsische Merkmale oder die Extension gründet und multiple Vererbung ausschließt. Stattdessen befürworten sie eine kontextbezogene Klassifizierung der Klassen über syntaktisch-semantische Ähnlichkeiten zwischen Lexemen. Als Beispiel nennen sie die Klasse der Getränke, die neben den für Nahrungsmittel typischen Prädikaten (boire, simter) auch mit den Prädikaten kompatibel sind, die Flüssigkeiten subkategorisieren (couler, renverser). Neben den erwähnten traditionellen Motiven begründen die Autoren ihre Ablehnung hierarchisierender Methoden weiterhin damit, dass adäquate linguistische Beschreibung nur in Systemen mit multipler Vererbung möglich sei (ebd. 16), die schwer handhabbar seien. Mit dieser Position unterschätzen sie die informationstechnischen Möglichkeiten, negieren das Potenzial der Ableitung von Struktur aus Bedeutung und ignorieren wichtige Arbeiten der Linguistik und der aktuellen Ontologieforschung (vgl. Abschnitt 3.3). Dieser Auffassung steht unsere Arbeitshypothese entgegen, dass hierarchische Strukturen, sofern sie nach geeigneten Prinzipien aufgebaut werden, effiziente Repräsentationen linguistischen und besonders semantischen Wissens sein können. Der folgende Uberblick nennt wichtige Beiträge und Entwicklungen, die zum heutigen Forschungsstand in der lexikalischen Semantik gehören und wesentliche Prinzipien zu unserer Verbuntersuchung beisteuern. Eine vollständige Darstellung des Forschungsstands der lexikalischen Semantik ist in diesem Rahmen nicht möglich (vgl. aber die breiter angelegte Arbeit von Engelberg 2000). Auswahl und Darstellung der Ansätze erfolgen daher im Hinblick auf den Beitrag, den sie zur Lösung des Problems lexikalischer Mehrdeutigkeit leisten, und inwieweit sie speziell verbale Mehrdeutigkeit berücksichtigen oder auf sie anwendbar sind. Die bekannten oder bereits hinreichend rezipierten strukturalistisch (Abschnitt 2.2.1) und kognitiv (Abschnitt 2.2.2) orientierten Ansätze werden undiskutiert und möglichst kurz dargestellt, neuere und besonders für die Polysemieforschung relevante Arbeiten ausführlicher. Die wesentlichen Fragen sind dabei, wie Wortbedeutungen und die Beziehungen zwischen ihnen dargestellt werden, wie die Mehrdeutigkeit lexikalischer Formen erklärt wird, und welche Rolle der Einfluss des Kontexts auf die Wortbedeutung spielt. Eine abschließende Bewertung dieser Theorien wird in Kapitel 3.4 vorgenommen.
2.2
Wortbedeutung als Ergebnis von Dekomposition
2.2.1
Strukturelle Semantik
Le tout vaut par ses parties, les parties valent aussi en vertu de leur place dans le tout, et voilä pourquoi le rapport syntagmatique de la partie au tout est aussi important que celui des parties entre elles. (Saussure 1969: 177)
Seit Saussures Bemerkungen zum syntagmatischen Wert des Zeichens geht die Semantik von der Unterscheidung zwischen den abstrakten und stabilen Bedeutungen des Sprachsystems und ihren im Kontext beobachteten und durch den Kontext teilweise determinierten Realisierungen aus. Da die Systembedeutung nicht a priori vorhanden ist, muss sie aus den beobachteten Bedeutungen konstruiert werden. Dies führt nach der traditionellen Methode der Beibehaltung gemeinsamer Seme zu präzisen, semantisch armen Systembedeutungen oder
8 nach prototypischen Prinzipien zu semantisch reicheren, aber schwer definierbaren Systembedeutungen (vgl. Kleiber 1999). Dekomposition ist die Analysemethode der strukturellen Semantik. Sie beschreibt das Verhältnis zwischen Bedeutungen ausgehend von einer Grundbedeutung als Veränderung, Hinzufügen oder Entfernen von Semen. Das Kontinuum an Bedeutungen in der parole wird also auf diskrete Einheiten in der langue abgebildet, und dieses Prinzip schlägt sich auch in den Definitionen der meisten Wörterbücher nieder (z.B. Petit Robert oder Zingarelli). Martin hat in einer Reihe von Arbeiten (1972; 1979; 1994) die Prinzipien strukturalistischer Semanalyse auf lexikalische Mehrdeutigkeit angewendet und zu einer umfassenden Typologie von Mehrdeutigkeitsphänomenen ausgearbeitet (für zusammenfassende Darstellungen vgl. Victorri & Fuchs 1996: 47f und für die Anwendung auf Verben Stein 1999: 115ff). Wesentlich für die Behandlung von Verben ist seine in Martin (1979) vorgenommene Unterscheidung zwischen zwei Polysemietypen für Prädikate: „polysdmie externe" und „polys€mie interne". Externe Polysemie ist semantische Mehrdeutigkeit der Argumente des Prädikats, wohingegen interne Polysemie die Bedeutungsstruktur des Prädikats selbst betrifft. Martins Beispiel cambrioler quelqu'un ist ein Fall von Argument-Reinterpretation('den Ort, wo jemand lebt') und entspricht damit den im Zusammenhang mit dem Generativen Lexikon diskutierten Fällen von Metonymie, die in bedeutungsaufzählenden Lexika zusätzliche Selektionsregeln erfordern oder im Generativen Lexikon die Zuordnung eines Konzepts (z.B. 'Haus' oder 'Wohnung') zu einem Argument seines telischen Funktionswerts ('wohnen in') (vgl. type coercion in Abschnitt 2.4). Das Beispiel weist damit auf das von Martin selbst erkannte Problem der Trennung von Prädikat- und Argumentsemantik hin: Der Nachweis, dass die Verbbedeutung in Fällen externer Polysemie konstant bleibt, ist schwer zu erbringen. Die Überprüfung einiger Beispiele für externe Polysemie anhand unserer Prozesshierarchie ergab in der Tat einen widersprüchlichen Befund. Einerseits würden in einem Beispiel wie le liquide coule vs le sable coule (das Martin selbst nicht ganz überzeugend findet) beide Lesarten zum gleichen Subtyp von Bewegungsverben gehören; andererseits würden sich die Lesarten von apprendre (laut Martin eine „assez bonne illustration" von externer Polysemie) sogar hinsichtlich der übergeordneten Prozesstypen unterscheiden: apprendre la danse ä qn wäre ein affizierender, auf Personen gerichteter Prozess, während apprendre la nouvelle ä qn als verbaler Prozess eingeordnet wäre. Trotz detaillierter Analyse sind externe und interne Polysemie bei Martin letztlich nicht präziser definiert als constructional polysemy und sense extension bei Copestake & Briscoe (vgl. S. 18). Folgerichtig schließt Martin von der Anwendung seiner Prinzipien auf die automatische Disambiguierung (Martin 1994) wesentliche Bereiche aus: den Kontext, die generischen Lesarten und die Präsuppositionen. Gleichzeitig stellt er das Generative Lexikon überpauschalisierend (trotz unserer Kritik an diesem Ansatz in Abschnitt 3.4) als einen Ansatz hin, der nicht mehr als die im traditionellen Lexikon mit Extension, Analogie oder Metonymie markierten Einträge zu leisten vermag. Die Polysemietypen bleiben in diesem Beitrag im Wesentlichen unverändert, wenn auch unter anderem Namen und mit Referenz auf andere Arbeiten (z.B. von Fuchs und Victorri): disjonction, indetermination, surditermination und neutralisation. Der Schwerpunkt der Arbeit liegt dann auf der Disambiguierung und der systematischen lexikografischen Anordnung von Lesarten, für die verschiedene gängige syntaktische und semantische Prinzipien aufgezählt und ausführlich auf das Verb remettre angewendet werden, wohingegen die uns interessierende Generalisierbarkeit von Prinzipien nur gestreift wird.
9 Martins Typologie findet sich (allerdings ohne explizite Referenz) fast unverändert in der Theorie von Rastier wieder, der sich mit der traditionellen strukturellen Semantik ebenso auseinandergesetzt hat wie mit KI-basierten Theorien (Rastier 1987; Rastier 1991). Die kontextuelle Varianz des Semems gliedert Rastier (1991: 150) in (i) „non-instanciation d'un ou de plusieurs attributs", (ii) „creation d'attributs", (iii) „d616tion d'attributs" und (iv) „cr6ation d'attributs, combinde ä la d616tion d'autres attributs", wobei mit „attributs" die Merkmale (Attribut-Wert-Paare) eines Semems gemeint sind. Martins interne Polysemie beschränkt Rastier auf Typ (i): Nur er „laisse intacte la structure du sch6ma", und im Bereich der kontextuellen semantischen Analyse sieht er die Syntax als sekundäre, von der Semantik determinierte Ebene: On peut considirer en effet le lexique et la syntaxe comme deux paliers de structuration du signifii linguistique, paliers dont l'autonomie est toute relative, comme en tßmoigne notamment l'histoire des langues (cf. les intdgrations, «grammaticalisations», etc.). On ne s'dtonnera done pas si nous affirmons que des composants sdmantiques diterminent des valences syntaxiques.(Rastier 1991: 139)
Aus dieser Einstellung entwickelt Rastier seine Kritik an den Ansätzen, die entweder zu einer distributionalistisch geprägten „linguistique (pseudo-formelle)" des signifiant tendieren3 oder, wie viele KI-beeinflusste Ansätze, das signifie als atomare, unzerlegbare Einheit betrachten und nur eine simplistische Bedeutungsanalyse liefern. Prinzipiell seien zwar die Analysemethoden der strukturellen Semantik und die Repräsentationsmethoden der KI (in Netzen und Graphen) nicht inkompatibel, tatsächlich weisen KI-Ansätze aber verglichen mit linguistischen Analysen deutliche Beschränkungen auf: Nach Rastier stellen sie nur eng umrissene semantische Bereiche dar, benutzen zu invariable Repräsentationsformalismen, unterscheiden nicht zwischen Typen und ihren Okkurrenzen und lassen die virtuellen oder konnotativen Komponenten (vgl. die „sömes afffirents" in Rastier 1987) außer Acht. Der Kontext ist für ihn untrennbarer Bestandteil der Wortbedeutung (1991: 154): Er definiert die Gesamtheit der Instruktionen, mit denen ein Semem und seine Komponenten definiert werden können.
2.2.2
Kognitiv motivierte Beschreibungen
Neben strukturalistischen Prinzipien, die teils unter anderen Bezeichnungen, teils in weiterentwickelter Form aufgenommen wurden, sind kognitive und sprachpsychologische Ansätze eine zweite Quelle der lexikalischen Semantik. Seit den 70er Jahren haben Modelle der mentalen Strukturierung des Wissens (Collins & Quillian 1972), der Wahrnehmung und der Sprachproduktion (vgl. die prozedurale Semantik von Miller & Johnson-Laird 1976) einen deutlichen Niederschlag in der semantischen Beschreibung gefunden. Ein grundlegendes Prinzip der kognitiven Linguistik besteht darin, aus der Analyse sprachlicher Elemente die ihnen zu Grunde liegende konzeptuelle Organisation abzuleiten. Ähnlich wie bei den universalgrammatisch orientierten Arbeiten geschieht dies häufig übereinzelsprachlich und mündet in eine Organisation der festgestellten Kategorien, die mitunter Prinzipien der in Kapitel 3 dargestellten ontologischen Wissenskategorisierung aufweist: Talmys Konzept „Plexity" entspringt z.B. der Ausdehnung des Pluralitätskonzepts vom Objekt- auf den Aktionsbereich und folgt damit ontologischen Ansätzen, die Eigenschaften physikalischer Objekte auf Prozesse anwenden (vgl. hierzu Abschnitt 3.1 und konkret das in Abschnitt 3.2.1 zitierte Konzept 3
Vgl. hierzu auch die Kritik an den auf Harris zurückgehenden Methoden des LADL in Stein (1991).
10 „generalized"-possession des „Upper Model")· Wir beschränken uns hier auf die Darstellung der Arbeiten, die für unsere semantische Beschreibung relevant sind. Der am systematischsten ausgearbeitete kognitiv orientierte Beitrag zur lexikalischen Semantik sind Jackendoffs lexikalisch-konzeptuelle Strukturen (LCS: lexical conceptual structures, Jackendoff 1983; Jackendoff 1990). Jackendoff geht davon aus, dass sein Modell der Bedeutungsrepräsentation nicht nur einzelsprachlich semantisch, sondern auch Ubereinzelsprachlich kognitiv motiviert ist. Ansätze, die in dieser oder ähnlicher Form syntaktische Struktur direkt mit konzeptueller Interpretation verknüpfen, sind in den 80er Jahren ein fester Bestandteil linguistischer Forschung geworden, und eine Reihe von Vertretern der kognitiven Linguistik gehen ähnliche Wege (Pinker 1989; Goldberg 1994; Langacker 1991; Talmy 1988a; Wierzbicka 1988). Die Motivation von Jackendoffs Ansatz ist, einen expliziten Zusammenhang zwischen der semantischen Repräsentation eines Verbs und seinem Kontext herzustellen: This account of the syntax-semantics correspondence gives a principled account of the level of „argument structure" [... ] — a level of linguistic representation that lists the arguments of a verb, with or without their 0-roles. Such a list can now be simply constructed from the set of indices in the conceptual structure of the verb, and there is one index per syntactically expressed argument [... ] In short, „argument structure" can be thought of as an abbreviation for the part of conceptual structure that is „visible" to the syntax. (Jackendoff 1983: 404f) Jackendoffs LCS beruhen auf Relationen zwischen Prädikaten (oder Funktionen) und ihren Argumenten. Argumente sind indizierte Einheiten, die mit Primitiven kombiniert werden. Indizes repräsentieren konzeptuelle Einheiten, z.B. „Object", „State", „Place", „Property". Primitive repräsentieren eindeutig definierte semantische Eigenschaften, z.B. GO, FROM, TO, und können spezifiziert werden, z.B. GO zu GO Poss . Syntaktische Konstituenten entsprechen zwar nach dem Prinzip der canonical syntactic realization (CSR) einer konzeptuellen Repräsentation, konzeptuelle Repräsentationen können aber Elemente enthalten, die syntaktisch nicht „sichtbar" sind. Sie können außerdem auf unterschiedlichen Ebenen semantisch instantiiert sein: vollständig wie bei impliziten Argumenten, teilweise wie bei Objektklassen ([MONEY]) oder Selektionsbeschränkungen ([object LIQUID]) oder gar nicht ([ 0 b j e c t ])· Als Beispiel zitieren wir in (1) die Repräsentation von engl, buy nach Jackendoff (1990: 61). Die Indizes i, j, k verbinden die Argumente mit Positionen im Subkategorisierungsrahmen. (1)
buy: V NPj [GOp0SS([ ]j, [ FROM [ ]ic TO [ ]i ]), EXCH [ GO Poss ([MONEY], [ FROM [ ], TO [ ]* ]) ]]
Jackendoffs LCS nehmen somit eine Zwischenposition zwischen konkreten syntaktischen Klassifizierungen wie den französischen Verbklassen des LADL (Gross 1968; Boons et al. 1976b; Boons et al. 1976a; Boons et al. 1992) oder den englischen Verbklassen von Levin (1993) und abstrakten Kategorisierungen wie den Prozesshierarchien im „Generalized Upper Model" oder in Mikrokosmos ein (vgl. Kapitel 3.2). Sie erlauben sowohl die Darstellung feiner lexikalischer Oppositionen als auch Generalisierungen Uber ihre Komponenten. Der
11 Schwerpunkt der Theorie liegt auf Fragen der semantischen Repräsentation. Die Mehrdeutigkeit von Wortformen wird nicht explizit abgehandelt, und die Notwendigkeit einer abstrakteren, ontologischen Ebene wird zwar gesehen (z.B. im Zusammenhang mit den thematischen Rollen), findet aber keinen konkreten Niederschlag in der Theorie. Allerdings bietet der Ansatz durch seine ausgearbeitete Syntax-Semantik-Schnittstelle geeignete Ansatzpunkte für Anwendungen in diesem Bereich. So zeigen Dorr & Olsen (1997), wie aspektuell mehrdeutigen Verben im Kontext vereindeutigende lexikalische Aspektmerkmale zugewiesen werden können, und dass die möglichen Aspektmerkmale aus anderen Komponenten der LCS ableitbar sind (gemäß der Analyse von Levin 1993). Weiterhin zeigen Dorr et al. (1994), dass die Komponenten der LCS als Kriterium zur Aufstellung von ontologischen Strukturen dienen können, in denen die Relationen zwischen Lexikoneinträgen (Wortbedeutungen) darstellbar sind. Die starren semantischen Repräsentationen erhalten so eine dynamische Komponente, die u. a. den Einsatz der oben genannten syntaktisch nicht sichtbaren Komponenten der LCS zur Darstellung inhärenter Objekte und zur Handhabung sogenannter translation mismatches (wie bei engl, know für franz. connaitre oder savoir) möglich macht. Selbst für ein Modell der semantischen Repräsentation, das nicht mit Zerlegung in semantische Primitive arbeitet, ist Jackendoffs Theorie von Bedeutung: Zunächst ist der Argumentbegriff weit gefasst und erleichtert, wie im Beispiel gezeigt, die Handhabung fakultativer oder inhärenter Argumente. Sodann ist die Aufstellung des Beschreibungsinventars empirisch motiviert und vermeidet die üblichen Probleme der Komponentenanalyse: Die semantische Zerlegung geschieht auf der Basis eines ausgearbeiteten Klassifikationssystems, dessen Primitive nicht a priori postuliert (Schänk 1975; Schänk & Abelson 1977), sondern vielmehr das Produkt umfassender lexikalischer Analysen sind. Für extensive Lexikonbeschreibungen ist aber die Anzahl von Kategorien (weniger als vierzig in Jackendoff 1990) zu gering, selbst wenn sie durch die im Gegensatz zu Modellen mit geschlossenen Primitivklassen (vgl. Wierzbickas Primitive oder Hegers Noematik) relativ undoktrinäre Handhabung der Kategorien kompensiert wird. Und schließlich sorgt die kanonische syntaktische Realisierung für eine enge Verbindung zur syntaktischen Ebene. Ein weiterer kognitiv geprägter Ansatz ist das vielfach als „Zwei-Ebenen-Semantik" bezeichnete Modell. Gemäß dem modularistischen Ansatz in der kognitiven Semantik trennt es eine sprachgebundene, lexikonbasierte und komponentielle semantische Form (SF) von einer sprachunabhängigen, intermodal zugänglichen und kombinatorischen konzeptuellen Struktur (CS) (zu den Grundlagen vgl. Bierwisch & Lang 1987 und Folgearbeiten, resümierend Lang 1994). Lexikoneinträge bestehen in diesem Modell aus einer phonetischen Form, einer grammatischen Form, einer semantischen Form und einer Argumentstruktur. Verglichen mit Jackendoffs LCS ist in der Zwei-Ebenen-Semantik das Inventar von formalen (C, C, —»,«-» usw.) und substanziellen (MAX, CAIJS, BECOME usw.) Komponenten strikter definiert. Dagegen ist die Zuordnung von SF und CS ein problematischer Punkt, den Lang selbst als „höchst unklar" bezeichnet (1994:29), weil die Abbildungsfunktionen nicht hinreichend generell sind. Wir konzentrieren uns auf die Darstellung einer für unsere Belange interessanten Umsetzung im Rahmen der Zwei-Ebenen-Semantik, die sich mit dem Verhältnis von semantischen Selektionsbeschränkungen zu ontologischen Sortenrestriktionen beschäftigt und explizit, wenn auch auf Substantive beschränkt, auf das Problem argumentaler Polysemie eingeht: Dölling verknüpft lexikalische Substantivbeschreibungen mit einem ontologischen Ansatz, in dem er sprachliche Ausdrücke je nach den Entitäten, auf die sich diese Ausdrücke bezie-
12 hen, in bestimmte semantische Sorten unterscheidet (Dölling 1992; Dölling 1993). Selektion regelt die grammatische Wohlgeformtheit von Strukturen, Sorten sind für die Einteilung von Entitäten einer Ontotogie zuständig, und Sortenrestriktionen regeln somit die begriffliche Wohlgeformtheit von Ausdrücken. Sie sind im Gegensatz zu den Selektionsbeschränkungen nicht an eine bestimmte Sprache gebunden. Der Vorteil dieses Ansatzes liegt darin, dass er von der Ebene der lexikalischen Bedeutungen abstrahiert: Die Beziehungen zwischen Bedeutungen bei Polysemiebeziehungen bzw. zwischen Denotaten bei Metonymiebeziehungen gelten nicht nur für einzelne Ausdrücke, sondern für bestimmte Ausdrucksklassen (Dölling 1994:44) und sind in der Ontologie als sprachunabhängige Sortenverschiebungen dargestellt. Entität
physisches Objekt ..·-·' Instanz von dimensioniertes Objekt
Ding
Stoff
Konfiguration .·'
^.Konstitution^ ' X l · ' _ Konstitution Person-·.
soziales Objekt
Gruppe Α assoziiert
Institution
mit/.·'
Konstitution ----'"' ..···' Lokation von
Abbildung 2.1: Domänen und Relationen bei Dölling 1994, 50
Döllings besonderes Interesse gilt dem Verhältnis zwischen Individual- und Massenausdrücken und zwischen Arten und Instanzen von ihnen: In seiner Ontologie sind die Entitäten in Arten (K) und Objekte (O) unterteilt (vgl. Abbildung 2.1). Orthogonal zu dieser Strukturierung werden die Mengen der Pluralentitäten ('U) und Singularentitäten (°U) unterschieden. Die Relationen zwischen den Domänen sind durch etikettierte gestrichelte Linien dargestellt. Darunter sind auch generische Implikationen, die ausdrücken, dass die betreffende Beziehung „nicht notwendigerweise, aber normalerweise besteht" (Dölling 1994: 51). Dies gilt etwa für die Beziehung ISx —>norm 3y[Ty & y L O C / s x], die besagt, dass eine Institutionsinstanz (IS) normalerweise in einer Dinginstanz (T) lokalisiert ist. Obwohl derartige formalisierbare Beziehungen zwischen Wortbedeutungen bestehen, wird in diesem Polysemiemodell (im Gegensatz zur Unterscheidung zwischen einer abstrakten Kernlesart und abgeleiteten Lesarten nach Bierwisch 1983) keine der Bedeutungen als von anderen abgeleitet betrachtet. Beispiel (2) verdeutlicht Döllings Prinzip an der semantischen Repräsentation von Die Bank versammelte sich (Dölling 1994: 57): Eine semantische Sorte kann spezifiziert oder verschoben werden, und beide Möglichkeiten werden hier kombiniert. Bank wird zunächst
13 von einer Art zu einem Institutionsobjekt spezifiziert und kann dann zu einer Pluralität von Personen verschoben werden. Diese Operationen werden mit speziellen A-Abstrakta ausgeführt (vergleichbar den Typenverschiebungen des Generativen Lexikons, s. Abschnitt 2.4). 4 (2)
a.
versammelte sich:
(Ax:*PSx)[SICH_VERSAMMELNx]
die Bank:
T S x ] , wo für das Prädikat eine sortale Selektionsbeschränkung auf konzeptueller Ebene definiert wird ( T S = Pluralentität von Personen). Bei Dölling besteht also eine Korrespondenz zwischen beiden Beschränkungstypen, die durchaus kritikabel ist. So vermutet etwa Lang (1994: 29), „daß die meisten Verben und Adjektive bezüglich der Sorte ihres Arguments nicht exakt eine Wahl treffen, sondern eine Auswahl aus [den Pluralindividuen]" und folgert daraus, dass man nicht ohne Weiteres eine Korrespondenz von lexikalischen Kategorien und Sorten annehmen kann, sondern dass vielmehr eine Teilmengenbeziehung Sortenrestriktionen c Selektionsbeschränkungen besteht (zu den Grenzen sortaler Selektionsrestriktionen vgl. die Diskussion des Systems SIC in Kap. 6). Die kognitiv geprägten Arbeiten nehmen unterschiedliche Positionen auf einer Skala zwischen traditionellen strukturalistischen und ontologisch beeinflussten Ansätzen ein: Die Bausteine der lexikalischen Beschreibung sind vielfach rein strukturalistisch (Bedeutungszerlegung in Komponenten), auch wenn ihnen bisweilen ein kognitiver Status zugesprochen wird (z.B. der von Primitiven). Die Verknüpfung strukturalistisch-kognitiver und ontologischer Prinzipien ist erst in den letzten Jahren erfolgt, etwa im oben erwähnten Ausbau von Jackendoffs LCS zu einem System lexikalischer Selektion im Rahmen eines MÜ-Projekts von Dorr et al. (1994) oder in den genannten Arbeiten zur Zwei-Ebenen-Semantik.
2.3
Wortbedeutung als Einheit
Die Anwendung strukturalistischer Prinzipien auf die Analyse von Wortbedeutung hat über geraume Zeit die in der historischen Linguistik (Darmesteter 1887; Breal 1897; Erdmann 1900) angewendete, intuitiv-ganzheitliche Bedeutungsanalyse in den Hintergrund treten lassen. Durch die Anwendung kognitiver Prinzipien hat diese aber in den 80er Jahren eine Renaissance erlebt (vgl. zu diesem Zusammenhang Kleiber 1999). Die hier vorgenommene Differenzierung zwischen komponentieller und ganzheitlicher Bedeutungsanalyse ist keine wissenschaftstheoretische, sondern dient vor allem der Übersichtlichkeit: Natürlich spielen auch in manchen der im Folgenden genannten Arbeiten bestimmte Teilaspekte von Bedeutungen 4
Der verallgemeinernde Deskriptionsoperator =MENSCHENGRUPPE C. RATANNEHMEN: nl=RAT;n=MENSCH disambiguiert:
consiglio=RAT
Für die Interpretation von consiglio als Sprechaktnomen bietet SIC eine eindeutige Lösung (c) an, für die Interpretation als Institution zwei Lösungen, von denen (b) als plausibler bewertet wird, weil für (a) eine Polysemieregel nötig ist.
109 Ebenso werden in (16) wegen des polysemen Arguments radici zwei Lösungen gefunden, da mangels einer tiefergehenden NP-Analyse die disambiguierende Funktion des Adjektivs storico oder der Präpositionalphrase del partito nicht ausgenutzt werden kann: (16)
Per concludere il professoren tornöv alle radici aN3 storiche del paitito. a. »ZURÜCKKOMMENZU: aN3,avv=KONKRETUM; n=LEBEWESEN
disambiguiert: radici=WURZEL b. ZURÜCKKOMMENAUF: aN3,SuN3=ABSTRAKTUM; n=MENSCH disambiguiert: RADICI=URSPRUNG
Dies gilt auch für das direkte Objekt in (17), wo das relative Attribut studio disambiguieren und damit zumindest die nicht erwünschten Lesarten (b) aussondern könnte. Die dann verbleibende Ambiguität zwischen (a) und (c) ist genau die in Abbildung 4.2 (S. 59) dargestellte und könnte nur über weitere strukturelle Merkmale wie z.B. den indefiniten Artikel geleistet werden. (17)
II professoren ha apertov uno studionl dove si fa psicoterapia. a.
FUNKTIONSBEREITMACHEN: nl=JURISTISCHESSCHRIFTOBJEKT,ÖFFENTLICHESGEBÄUDE,WEGOBJEKT, MECHANISMUS,GERÄT 4 , n=MENSCH disambiguiert: si« ] berechnet einen Wert S, der ausdrückt, inwieweit sich die Lesarten der beiden Verben überschneiden. Die Berechnung erfolgt auf der in der Konfigurationsdatei spezifizierten Ebene nach Formel (50). Dort sind L\ und L2 die Anzahl der unterschiedlichen Lesarten des ersten bzw. zweiten Verbs und Lid die gemeinsamen Lesarten. (50) S =
Li 2 " Li • L2
Der Befehl s y n a l l führt diese Berechnung für alle Verbpaare durch (vgl. die Ergebnisse in Kap. 5.4).
7.1.3.7
Polysemie-Suche
Der Befehl p o l y p a a r e [ < v e r b > ] gibt für ein Verb (bei fehlendem Argument für alle Verben) alle Kombinationen seiner Lesarten aus. Die Berechnung erfolgt auf der in der Konfigurationsdatei mit dem Parameter p o l y P a a r E b e n e spezifizierten Ebene, die relativ zum oberen Knoten, relativ zum Lesartknoten oder absolut mit dem Attribut l e v in der Prozesshierarchie spezifiziert sein kann. Außerdem kann ein Parameter polyMaxEbene die maximale Teildomäne spezifizieren, in der lokal begrenzte Polysemie berechnet wird. In diesem Fall werden nicht die Lesartpaare ausgegeben, sondern nur der erste gemeinsame Mutterknoten jedes Lesartpaars.
136 7.1.3.8
Verb-Suche und Sublemma-Suche
In den Sublemma-bezogenen Anfragen lassen sich semantische Eigenschaften durch Bedingungen abfragen, die auf der Ebene der Prozesshierarchie operieren. Sie sind beliebig mit Bedingungen über Informationstypen des Verbwörterbuchs kombinierbar. Jede Bedingung vergleicht einen Informationstyp (v = Valenz, ο = Prozess, f = Frequenz) mit einem Ausdruck. Für die Art des Vergleichs sind folgende Operatoren möglich: (51) Syntax für Bedingugen: Informationstypen: ν=Valenz, ο = Prozess Operatoren: = ist gleich Zeichenkette _ enthält Zeichenkette : ist gleich regulärer Ausdruck . enthält regulären Ausdruck _< ist subsumiert von Knoten & und (Konjunktion von Bedingungen) @ nicht (Negation von Operatoren) Mit < P a s s i e r e n wird die gesamte Teildomäne unter PASSIEREN angesprochen. Bedingungen sind beliebig kombinierbar und werden nacheinander abgearbeitet. Jede Bedingung arbeitet mit dem Ergebnis der vorhergehenden. So lassen sich z.B. Positionen in der Prozesshierarchie und syntaktische Realisierungsmöglichkeiten in einer Anfrage verknüpfen. Die Anfrage (52) sucht alle Sublemmata, die Knoten unter dem Prozess PASSIEREN zugeordnet sind und zu deren Valenz ein direktes Objekt gehört: (52) sublemma [ [ . . . z.B. IV> sublemma o = < P a s s i e r e n v_Nl
]]
Für die Suche nach Verben werden zwei der für die Suche nach Sublemmata verwendeten Bedingungen mit & kombiniert. Jede dieser Bedingungen muss für mindestens ein Sublemma das Verbs erfüllt sein. Diese Funktion ist z.B. nützlich, um die Lexeme zu ermitteln, die an bestimmten Polysemietypen (Lesartpaaren) oder Alternationstypen partizipieren. (53) v e r b [ [ . . . & [ [ . . .
]] ]]
z.B. IV> verb v_si@Nl o_n; n; n; n; n; n;
aw; a w a w , nl, aN3 , daN3 , perN3 si; aN3 aN3,conN3,inN3 nl; conN3 conN3 nl
}
7.2.1.2
Das Substantivlexikon
Hier müssen alle Wörter aufgeführt sein, die im Eingabesatz als Argumente identifiziert sind. Neben Substantiven wurden auch Adverben und substantivisch verwendete Verben aufgenommen. Nach dem Wort folgt der Name des Knotens, mit dem es in der Objekthierarchie verknüpft ist. Bei polysemen Wörtern ist eine Komma-getrennte Liste von Knoten möglich. Am Ende steht ein Code für die Wortart (l=Nomen, 2=Verb,...).
138 (55)
... valore wert 1 Venezia Stadt 1 f i l m filmWerk,filmVorführung 1 punti punktSatzzeichen,punktlnhalt radici wurzel,ursprung 1 stato Staat,zustand 1 vie weg,möglichkeit 1 molto v i e l , l a n g e , i n d e f i n i t
1
5
7.2.1.3 Das Flexionslexikon Hier müssen die Flexionsformen der analysierten Verben stehen (in Zukunft auch der übrigen flektierenden Formen). Format: Form - morphologischer Code - Lemma. (56)
abbandono V E R : * : p r e s : 1 : * : s g abbandonare abbandoni V E R : * : p r e s : 2 : * : s g abbandonare abbandona V E R : * : p r e s : 3 : * : s g abbandonare abbandoniamo V E R : * : p r e s : 1 : * : p l abbandonare
7.2.1.4
Die Eingabedatei
Die Eingabedatei muss einen Satz pro Zeile enthalten. Bei der manuellen syntaktischen Indizierung sind die grammatischen Funktionen mit _ an die Formen zu hängen. Wunschlesarten können nach Eingabesätzen hinter = angegeben werden (durch Kommata getrennt). SIC vergleicht sie bei der Ausgabe mit dem Analyseergebnis und gibt Diskrepanzen an. Dadurch können leicht die Rückwirkungen von Veränderungen an den Hierarchien überprüft werden. Debugging-Optionen können nach Eingabesätzen und Wunschlesarten hinter \ eingegeben werden (durch Kommata getrennt, z.B. \ t r a c e m , t r a c e f für Ausgabe der benutzten Methoden und feines Trace). (57)
Ε un ragionamento_n che non torna_v. = R i c h t i g S e i n I I tuo d i s c o r s o _ n non mi_n2 torna_v. =FürRichtigHalten Per Gianni_n έ d i f f i c i l e f a r _ f a r e t o r n a r e _ v i c o n t i _ n l . = K o r r i g i e r e n I I v e s t i t o _ n torna_v b e n e _ a w . =Passen U n ' o c c a s i o n e _ n come q u e s t a non t o r n e r ä _ v mai p i ü . =WiederEintreten La forza_n g l i _ n 2 torna_v a poco a poco. =WiederErlangen
7.2.2 7.2.2.1
Hierarchiedaten Prozesse
Jeder Datensatz definiert einen Knoten der Prozesshierarchie, beginnt mit @ und enthält den Namen des Knotens, den Namen seines Mutterknotens, eine Paraphrase (fakultativ) und seine
139 Argumente. Jedes Argument des Prozesses ist durch eine Objektreferenz oder eine Kommagetrennte Liste von Objektreferenzen definiert. Eine Objektreferenz ist ein Objekt der Objekthierarchie (vgl. 7.2.2.2), eine Objektgruppe (vgl. 7.2.2.3) oder ein Attribut-Wert-Paar (vgl. 7.2.2.2). Für unspezifizierte Attribute und Werte ist der Platzhalter e g a l möglich. Knoten ohne Argumente sind abstrakte Knoten, die nur zur Strukturierung der Hierarchie dienen (z.B. M a t e r i e l l ) . UP bedeutet, dass diese Argumentposition vom Mutterknoten geerbt wird. Mit a d . . . sind Objektklassen der Adjunkte markiert. Adjunkte werden immer vererbt. Ab Version 2.1 können Argumentspezifikationen mit + kombiniert werden, z.B. schließt bei 'Zuhören' mensch+ l e b e n d i g : j a tote Philosophen aus. Mit Asterisk vor dem Argument (z.B. *mensch) wird die Anwendung von Polysemieregeln für dieses Argument unterbunden. Das Argument darf dann nur direkt erreicht werden. (58)
node isa def argl arg2
AbtrennenAn Abtrennen Α trennt etwas an Ort-B ab UP unbelebtesKonkretumG
0 node isa def argl arg2 advon
Abtrennen Integritätverletzen Α trennt Β ab UP abtrennObjektG,teilVon:egal nichtMenschKonkretumG
node isa def argl adcoag adbene @
Affizieren Materiell Agens handelt an etwas mensch mensch mensch
node isa def argl arg2
AlsAnfangHaben OrdnungsEigenschaft Β ist am Anfang von A unbelebtesKonkretumG unbelebtesKonkretumG
Fakultativ können weitere Informationen als Attribut-Wertpaare an Knoten spezifiziert werden: l e v (level) definiert eine Abstraktionsebene (vgl. Abschnitt 5.2). Argument ist eine natürliche Zahl >100. c a u s , r e s , f a k t , f i n , v o r , n o t usw. definieren logische (kausale, finale usw.) Relationen zwischen Knoten. Argument ist ein anderer Knoten der Prozesshierarchie. m e t a definiert eine Metakategorie. Metakategorien fassen semantisch zusammengehörige Konzepte in unterschiedlichen Teildomänen zusammen. Argument ist ein frei definier-
140 barerer Name, der zur leichteren Unterscheidung von anderen Prozessnamen mit m beginnt.
7.2.2.2
Objekte
Jeder Datensatz definiert einen Knoten der Objekthierarchie, beginnt mit @ und enthält genau 4 Felder: Den Namen des Knotens, den Namen seines Mutterknotens (beim obersten Knoten NULL), seine Definition (fakultativ) und die Liste seiner Attribut-Wert-Paare (fakultativ). Attribut-Wert-Paare werden vererbt. (59)
β wegobj ekt lokales_obj ekt Lokales Objekt, das begehbar ist und zu einem Ziel führt weite:begrenzt @
7.2.2.3
Objektgruppen
Jeder Datensatz definiert eine Objektgruppe, beginnt mit @ und enthält genau 4 Felder: Den Namen der Gruppe, die Liste der Mitglieder-Knoten, die Liste der ausgeschlossenen Knoten, die Definition der Gruppe (fakultativ) und ein Beispiel (fakultativ). Die in Feldern 2 und 3 genannten Knoten schließen ihre Subknoten ein. (60) @ bes i t zObj ektG konkretum mensch, Verkehrsmittel, Zeichenobjekt Objekt, das man besitzen kann @ erlebnisobj ektG Urteilsobjekt, zeit, zustand Objekt, das man erleben kann @ fliessSubstanzG flüssigkeit, gassubstanz Substanz oder Masse, die fliessen kann Inhaltverlieren @ informationsquelleG mensch, darstellObjekt, Schriftartefakt Objekt, von dem man etwas erfahren kann
141 7.2.2.4
Polysemieregeln
Jeder Datensatz definiert eine Objektgruppe, beginnt mit @ und enthält 4 Felder: Den Namen der Regel, den Ursprungsknoten, die Definition oder Paraphrase, den Zielknoten und ein Beispiel (fakultativ). (61) @ gruppe_mensch sozialesObjekt ist eine soziale Gruppe von mensch 1'organizzazione trova che...
θ behälter_inhalt flasche enthält getränk bere una bottiglia @ maschine_mensch maschine kann handeln wie ein mensch il robot sa ... @
7.2.3
Programmdaten
Das Zusammenspiel der hier aufgelisteten und kurz kommentierten Javaklassen ist im Ablaufdiagramm 7.3 auf S. 143 dargestellt.
7.2.3.1
Java-Klassen
Ausgabe hat Variablen und Methoden zur Speicherung des Analyse-Ergebnisses. Für jeden Eingabesatz legt die Klasse EingabeLeserein Ausgabe-Objekt an. EingabeLeser liest die Datei mit den zu analysierenden Sätzen ein. Aus jedem Satz extrahiert sie die syntaktische Information und holt aus dem Verblexikon alle möglichen Verblesarten. Für jeden Satz instantiiert sie einen SubkatPruefer und ruft die Methode pruefSubkat auf. FlexionsLexikon liest die Verbflexionen ein. Die Datei mit den Flexionen wurde mit dem Skript itflex und dem Grundform-Wörterbuch für die Wortarten-Annotation generiert (zum Part of Speech-Tagger vgl. Stein & Schmid 1995). Gruppe spezifiziert eine Objektgruppe als Menge von Knoten der Objekthierarchie.
142 Lesart spezifiziert die mit einer Verblesart verbundenen Informationen. Ein Objekt dieser Klasse wird durch ein Verb mit seinen syntaktischen Argumenten instantiiert. Lexikon liest das Lexikon für eine Sprache ein. Im Lexikon miissen alle Wörter stehen, die im Eingabesatz als Argumente des Verbs markiert sind. LexikonEintrag spezifiziert einen SIC-Lexikoneintrag. Nomen ist abgeleitet von LexikonEintrag und spezifiziert einen Eintrag für Substantive. Objekt spezifiziert einen Knoten der Objekthierarchie. ObjektHierarchie Ubernimmt den Aufbau einer Hierarchie von Objektklassen und den Zugriff auf sie. Die Hierarchie besteht aus Objekten, Objektgruppen und gerichteten Beziehungen zwischen Objekten. Prozess spezifiziert einen Knoten der Prozesshierarchie. ProzessHierarchie Ubernimmt den Aufbau einer Hierarchie von Objektklassen und den Zugriff auf sie. Regpoly spezifiziert eine Polysemie-Regel für Argumente des Verbs. Eine solche Regel ist eine gerichtete, etikettierte Beziehung zwischen zwei Knoten der Objekthierarchie. SIC startet das Programm (vgl. 7.2.3.2) SubkatPruefer überprüft für eine Lesart, ob die Argumente der Eingabe mit denen der Lesart kompatibel sind. VerbLexikon liest die Datei mit dem Verblexikon ein.
7.2.3.2
Programm-Ablauf
1. Die Klasse SIC instantiiert Objekte für die Datentypen: Objekthierarchie, Objektgruppen, reguläre Polysemie, Prozesshierarchie, Lexikon, Verblexikon, Flexionslexikon. Dabei werden die Daten aus den Daten-Dateien eingelesen. Die Klasse SIC instantiiert ein Objekt der Klasse EingabeLeser. 2. Der EingabeLeser liest die Datei mit den zu analysierenden Sätzen ein. Aus jedem Satz extrahiert sie die syntaktische Information und holt aus dem Verblexikon alle möglichen Verblesarten. Für jeden Satz instantiiert sie einen SubkatPruefer und ruft die Methode pruefSubkat auf. 3. Der SubkatPruefer überprüft für eine Lesart, ob die Argumente der Eingabe mit denen der Lesart kompatibel sind. Er prüft (1.) die Zahl der Argumente, (2.) die syntaktische Kompatibilität und (3.) die semantische Kompatibilität. 4. Klasse ObjektHierarchie enthält die Methoden für die Überprüfung semantischer Kompatibilität. Geprüft werden IstEin-Beziehungen, Mitgliedschaft in Objektgruppen und Zugang zu den zwischen Knoten der Objekthierarchie definierten Polysemiebeziehungen.
143 Prozesse # ·
Objekte
•/ Χ ·
: tnl^nltfK! irblesarte ι
• /Κ
·
Eingabe
•
•Α\ · ·
·
Abbildung 7.3: Der Ablauf einer Analyse in SIC
5. Der EingabeLeser hat für jeden Satz eine Instanz der Klasse Ausgabe angelegt. Diese Instanz sammelt für den Eingabesatz die für die Ausgabe relevanten Ergebnisse. 6. Die Klasse Ausgabe gibt die Ergebnisse an die Klasse SIC zurück. Bei mehrdeutigen Ergebnissen werden die gefundenen Lesarten erneut bewertet (vgl. die sekundäre Analyse in Abschnitt 6.2.3). Die entsprechenden Methoden berücksichtigen bisher (a) die Spezifizität der Objektklassen und (b) die Zahl der für eine Lösung benutzten Polysemieregeln. 7. Die Klasse SIC formatiert die Ausgabe und schreibt ein Protokoll.
7.2.4
Benutzeroberfläche
Für SIC wurde eine Benutzeroberfläche konzipiert, die die Erstellung der Lexikoneinträge, die Ausführung der Analyse und die Auswertung der Ergebnisse vereinfacht. Den Kern bildet der frei verfügbare Editor GNU Emacs mit einem speziell für SIC in Emacs-Lisp definierten Modus. Er überwacht die Konsistenz von Lexikoneinträgen und bietet die wichtigsten
144
SIC-Dok JtM-eok SIC a3 08-Sep-89 5:48:40 PM Lese Objakt-Hierirchie 3.3.. 1153 Objekte gelesen Lese Obiekt-Gruppen. 33 Gruppen gelesen. Lese Polysemie-Regeln. 10 Polysemteregeln gelesen Lese Prozess-Hterarchle 3.3. 780 Prozesse gelesen. Lese Italienisches Lexikon 3.3. lOSi Ledkoneintrige gelesen Lese Helenisches Vertlesdkon 20_ 693 Lesarten gelesen. setze Optionen: [loop, pnntargs, adj,zeigAnatyse, Protokoll,a n {Buff Buffers Flloa Teole Edit Hule Ι SIC Help . Lee« Elngabedatel 3SIC: Analyse BsTsi SIC: Koapiliere Buffer (C-c C-w> \loop.printergs.adj.ielgfinalyse. 1) La nave„ vedev II capttanon, SIC: Kospiliere alle Quellen Lexikon (C-c C-l) ••SIC vergleicht hier C-c C-o) ••Optionen; tracef für ObjektklaDieses Objekt -> Objekthierarchie < Verblexikon V Α stellt fest, ob Β erwartungsgemäß ist KontroHe ••Eeece-Llap-He*roe benutze deeProzess -> Prozesshlerarchie (C-c C-p» Diesen {m-kontroflObjektG, n-iebev/esen) ·· Cossent 2. Α sieht 8. SehenDing aaAchi· Stein. Juli 1998 Fill Indent Line (m-konkretum: n-lebewesen} ββββββββββββββββββββββββι (T«> 3. Α stellt sich Β vor. SlchVorsttlen Indent Expression (H-C-q> {ni-Objekt n-mensch} Cgwseint (λα Heu»ο» (C-c C-c> i 3 von 30 Lesarten selektiert ••·ββ·»·Βββββββ·βββ··βββι SICempfiehlt -Kontroleren": nptierte ObjektkJassen »"vedere anoch ιυ tun: Eigenschaften: 11 professore.n vedere.ν lontano.nl 3) U pro(essoren vedev l'artlcolon. aOueeto problesa lo vedreeo plu tardi. (PF> - eich befassen alt aKon scoraggiartl. tl faccio vedere io cose si fa. (CA) - zeigen • SYNTAX: vedere [η, η l) • SEMANTIK L 11 capitano ι. Α stellt fest ob Β erwartungsgemäß Ist KIIoantprofeeeore ronave le vede vede la nave =Sehon01ng.SlchVorstellen.Kontrollieren {ni -kontroHObjektG. n-lebewesen} II profeasore vede l'articolo =SehenOine.SichVorstellen.tControllieren Ii profeasore vede 1'appllcazione =SehenVorgang.SlchVorstellen Ζ. Α sieht Β SehenDing II profeeeore vede la televlsione =5ehsn0ine.SichVoretellen.Ferneren {m-konkretum; n-lebewesen} 3. Α stellt sich Β vor. Sichvorstellen abeeuchen, Besichtigen {m »Objekt n-mensch} Ii prof— 'uchVorst.l 3 von 30 Lesäten selektiert SIC empfiehlt "Kontrolieren": implizierte ObjektkJassenII profeE Staeera Gianni andri ι • Seal« •-SehenDing.SlchVorstelien.ftisehen rtderflin bell.tto 'li if.Vüt.l. 1 1 «ι.'» 4) II professoren vede, l"applkazlonen· Vewl β -SehenDlne.SlchVoratellen. Beeicht, igen • SYNTAX: vedere [η, η i] II profeasore =5ehenQlne.SlchVora teilen. Treffen • SEMANTIK ÄH5F ι. Α stellt sich Β vor. SlchVorstelen
Abbildung 7.4: Die Benutzeroberfläche von SIC
Funktionen in einem Auswahlmenü an. Die eigentliche semantische Analyse läuft ebenfalls in einem Emacs-Fenster ab. Das Analyseergebnis von SIC, alle bei der Analyse verwendeten Hierarchien und die Dokumentation der Klassen werden über Filter so aufbereitet, dass sie in jedem HTML-Browser konsultiert werden können. Abbildung 7.4 zeigt rechts den Emacs im SIC-Modus mit der zu analysierenden Eingabedatei und geöffnetem Funktionsmenü, links den HTML-Browser mit dem Analyseergebnis.
7.3
Sprach- und Programmdaten
Über die WWW-Seiten des Autors5 können folgende Daten eingesehen werden: 1. Die Prozesshierarchie, wie in Abbildung 7.1 (S. 117) dargestellt, als grafisches Interface zum Wörterbuch der italienischen Verben. Diese Option ist gut geeignet, um sich einen 5
http://www.uni-stuttgart.de/lingrom/stein unter „Forschung - Ressourcen". Auch die JavaQuelldaten für die Programme SIC und IV sind für nicht kommerzielle Zwecke frei verfügbar und können über den Autor bezogen werden.
145 Überblick über die Prozesshierarchie zu verschaffen. Aus urheberrechtlichen Gründen können die Wörterbuchartikel nicht angezeigt werden, lediglich für jedes Konzept die Liste der mit ihm verbundenen Konstruktionen. 2. Die Ergebnisse der Disambiguierung mit dem System SIC (vgl. Kapitel 6): Es erscheint das linke Fenster von Abbildung 7.4 (S. 144). Von dort können über Verweise die disambiguierten Sätze, die Objekthierarchie, die Objektgruppen und -attribute sowie die Prozesshierarchie aufgerufen werden (die Prozesshierarchie ist hier weniger übersichtlich dargestellt als in Version (1.) und sie deckt nur die in der Evaluierung disambiguierten Verben ab). Zwei weitere Verweise auf der gleichen Seite führen zur Dokumentation der für die Programme IV und SIC erstellten Klassen.
8
Zusammenfassung und Ausblick
Vor der Zusammenfassung der Ergebnisse seien einige Punkte angesprochen, die in der Arbeit aufgrund ihrer Ausrichtung auf ein konkretes praktisches Ziel nur am Rande behandelt werden konnten. Der problematischste Punkt ergibt sich aus der Tatsache, dass empirische Untersuchungen ab einem gewissen Umfang nicht ohne ein solides theoretisches Gerüst durchführbar sind. Dieses Gerüst ist durch die Anwendung ontologischer Prinzipien auf die hierarchische Repräsentation von Verbbedeutungen entstanden. Dadurch ist die Problematik der Abgrenzung von Sprache und Welt und, in methodischer Hinsicht, von Onomasiologie und Ontologie in ihrem ganzen Umfang deutlich geworden. Dass der Aufbau von Ontologien in den letzten Jahren verstärkt betrieben worden ist, und solche Systeme über das Bestreben der Künstlichen Intelligenz, Grundlagen der Informationsrepräsentation zu finden, auch in die Sprachverarbeitung Eingang gefunden haben, hat das Interesse an den philosophischen Grundlagen der Ontologien, also an einer a priori existierenden Natur der Dinge, in diesen Bereichen verstärkt. Dennoch wurden ontologische und transzendentalphilosophische Fragen hier bewusst beiseite gelassen, auch wenn sich dafür zahlreiche Anknüpfungspunkte anboten. Einen Beitrag zur theoretischen Ontologiediskussion zu leisten, war weder beabsichtigt noch im Rahmen des bearbeiteten Themas möglich. Ontologien für die Verarbeitung natürlicher Sprache sind vor allem Werkzeuge und als solche weniger nach ihrer theoretischen Fundierung als nach ihrem praktischen Nutzen zu beurteilen. Daher wurde für die hier durchgeführten konzeptuellen Klassifizierungen auch bewusst der Begriff „ H i e r a r c h i e " dem in anderen Projekten beliebten Terminus „Ontologie" vorgezogen. Diese Hierarchien erheben nicht den Anspruch, mit Kategorien der Welt (oder des Weltwissens - dieser Unterschied ist hier nicht relevant) zu operieren, sondern sie sind lediglich eine Art, die Bedeutung natürlichsprachlicher Ausdrücke zu repräsentieren. Ihre Struktur ist durch sprachliche Eigenschaften motiviert, und Sprachanalyse ist das entscheidende Kriterium für ihre Bewertung. Die Konzepte der Hierarchien sind keine apriorischen Kategorien, sondern das Ergebnis der semasiologischen Analyse von Okkurrenzen. Die nicht lexikalisierten Kategorien auf den höheren Ebenen der Hierarchien sind das Ergebnis einer Klassenbildung, die sich auf bekannte linguistische Typologien stützt. Damit inspirieren sich die Hierarchien am ehesten noch an dem von Brentano oder Hartmann (im Gegensatz zu Heidegger) vorgeschlagenen Typ von Ontologie, nämlich einem durch ständige Berücksichtigung einzelwissenschaftlicher Resultate von unten herauf aufgebauten System (vgl. z.B. Stegmüller 1969: XLVI). Dennoch können der methodischen Vorgehensweise eine Reihe von Vorhaltungen gemacht werden. Wir gehen in diesem Zusammenhang nur auf die fundamentale Kritik von Weisgerber (1964) an der Bedeutungslehre und der onomasiologischen Methode ein. Prinzipiell hat sie zwar heute noch Bestand, aber sie steht und fällt mit dem Anspruch dieser „Pseudowissenschaft" (ebd., 91) und ihrer Umsetzung. Für das Gebiet der Etymologie, auf das Weisgerber sich (neben der Lexikografie) bezog, mag sie berechtigt sein. Es dürfte aber klar geworden sein, dass für die hier durchgeführten semantischen Analysen keine traditionelle Bedeutungslehre nötig war, sondern lediglich empirische Analyse und Klassenbildung. Tatsächlich lassen sich eine Reihe von Parallelen zwischen dem hier verfolgten Ansatz und Weisgerbers eigenen Maximen und Analysen aufzeigen. Es sei nur auf seine Analyse zu veranstalten verwiesen (Weisgerber 1962: 199ff), in der er die Kollokationspartner dieses Verbs untersucht. Eine
148 erste Parallele besteht in seinem Versuch, abstrakte Kategorien zu bilden, um die Kollokationsbasen von veranstalten zu erfassen: Er subsumiert sie schließlich unter einer Kategorie „Geschehen, die als durch menschliche Absicht herbeigeführt gesehen werden", deren Lexikalisierungen generell mit stattfinden kompatibel sind (im Gegensatz zu Ereignissen wie z.B. Erdbeben). Methodisch steht diese Einzelanalyse dem von uns systematisch verfolgten Ansatz der Definition von Prozessen mit Selektionsrestriktionen in Form von hierarchisch definierten Objektklassen relativ nahe. Die zweite Parallele ist Weisgerbers Auffassung von Wortbedeutung, die er an gleicher Stelle deutlich macht: [... ] wenn halten ein vollgültiges Glied des Wortfeldes stattfinden machen ist, dann ist dieses halten = „das Stattfinden von lebensentscheidenden Akten sichern" als ein selbständiges Wort anzuerkennen; es mag die Lautform mit anderen Wörtern halten teilen (etwa intransitivem halten in der Knopf, die Stütze hält oder transitivem mit der Hand stützen: einen Teller halten u. ä.), aber es handelt sich dann um Homonyme, also um Wörter von inhaltlicher Selbständigkeit, wenn auch gleicher Lautung, und nicht um verschiedene „Bedeutungen" „desselben" Wortes. Die Selbständigkeit dieser verschiedenen Wörter halten ist nicht nur durch verschiedene Wortfelder gesichert, sondern auch daran erkennbar, daß sie verschieden konstruiert werden und bei näherem Zusehen sogar heute noch als verschiedene Reduktionsformen verschiedener Komposita erkennbar sind: halten1 steht in der Nähe von einhalten, halten2 in der von festhalten usw. (Weisgerber 1962: 209) Dies entspricht genau der homonymischen Auffassung, die den hier durchgeführten Analysen italienischer Verben zu Grunde liegt und am Beispiel von WordNet in Abschnitt 3.2.4 eingeführt wurde. In Ansätzen finden sich solche Überlegungen zur Behandlung von Mehrdeutigkeit übrigens auch bei Hallig & Wartburg (1963), die im semasiologischen Teil ihrer Arbeit ebenfalls vor dem Problem stehen, welche Bedeutung sie einem Begriff zuordnen sollen, letztlich aber bei einer ganzheitlichen Bedeutungsauffassung bleiben („primär ist die Bedeutung als Ganzes"; ebd., 59) und „okkasionelle" Bedeutungen praktisch nicht berücksichtigen. Schließlich besteht eine dritte Parallele zwischen Weisgerbers Feststellung, „daß das Aufstellen eines catalogus mundi eine unlösbare Aufgabe ist" (Weisgerber 1962: 194), und der oben angesprochenen Vorgehensweise beim Aufbau der Hierarchien „von unten h e r a u f , d. h. von der semasiologischen Analyse ausgehend. In diesem Sinne sind die in den Hierarchien repräsentierten Konzepte nicht außersprachlich, sondern nur möglichst übereinzelsprachlich. Die Konsequenz dieser Vorgehens weise ist, dass Konzepte auf den unteren Ebenen als Ergebnisse lexikalischer Analyse notwendigerweise sehr sprachnah sind. Wir fassen die Arbeit kurz zusammen (für einen Überblick über die einzelnen Abschnitte vgl. die Zusammenfassung in der Einleitung): Die Diskussion ausgewählter semantischer Arbeiten in Kap. 2 hat nicht nur gezeigt, dass selbst über die gängigen semantischen Konzepte wie „Grundbedeutung" keine Einigkeit besteht, sondern auch, dass theoretische Annahmen auf verschwindend geringer Materialbasis formuliert werden. Eines der Hauptanliegen dieser Arbeit war, eine solche Basis durch die semantisch möglichst exhaustive Beschreibung von tausend italienischen Verben zu liefern. Für diese Beschreibung wurde das in Abschnitt 3.4.2 definierte Modell entwickelt. Dieses Modell wurde maßgeblich von den Zielen Wiederverwendbarkeit und Evaluierbarkeit der Analyseergebnisse geprägt. Seinen Kern bildet eine Konzepthierarchie, deren Knoten die Lesarten der Verben (,.Prozesse") bilden. Die Bedeutungsanalyse bestand in der Unterscheidung der Verblesarten, ihrer Definition und ihrer Einordnung in die hierarchische Repräsentation. Die Prinzipien und Probleme beim Aufbau dieser Prozesshierarchie wurden in Kap. 4 ausführlich diskutiert. Der bei groß angelegten empirischen Arbeiten bestehenden Gefahr, dass die angewendeten Prinzipien ein Eigenleben
149 entwickeln, das die Ergebnisse der Arbeit nur in sehr eingeschränktem Rahmen wiederverwendbar macht, wurde in zweierlei Hinsicht entgegengewirkt. Der erste Weg führte zurück zur linguistischen Theorie: In Kapitel 5 wurde aufgezeigt, wie die Kombination aus semantisch detaillierter Beschreibung und hierarchischer Bedeutungsrepräsentation dafür eingesetzt werden kann, linguistische Konzepte wie „Grundbedeutung" oder „Synonymie" mit Hilfe von Methoden, die auf der semantischen Repräsentation operieren, auszudrücken. Der zweite Weg führte weiter in die Praxis und bestand in der Umsetzung der Analyseergebnisse in ein Anwendungssystem: In Kap. 6 wurde das System SIC vorgestellt, das die Verben in knapp tausend italienischen Beispielsätzen disambiguierte. Kennzeichnend für dieses System ist, dass die semantischen Merkmale der Argumentstrukturen als Eigenschaften von Prozessen, also auf der Hierarchieebene, definiert wurden, wohingegen das einzelsprachliche Lexikon nur die syntaktischen Merkmale enthält. Diese Anlage entsprach dem Bestreben, das Konzept der Objektklassen, für die ebenfalls eine Hierarchie entwickelt wurde, möglichst übereinzelsprachlich umzusetzen. Beide Wege konnten zwar nur kurz beschritten werden, aber die Ergebnisse waren eine Bestätigung des methodischen Ansatzes: Auch formbezogene linguistische Konzepte wie Grundbedeutung konnten in der Prozesshierarchie als Abstraktionen über die Menge aller Lesarten eines Verbs ausgedrückt werden, und in mehr als 90% der Eingabesätze konnte SIC das Verb eindeutig interpretieren. Die Arbeit hat sich auf die Darstellung der theoretischen und praktischen Aspekte beschränkt, die aus linguistischer Sicht relevant sind. Die gemessen am zeitlichen Aufwand umfangreichsten Arbeiten, nämlich die semantische Analyse selbst und die Entwicklung der Programme zum Aufbau der semantischen Repräsentation, zur Verwaltung der Sprachdaten und zur Evaluierung der semantischen Analyse liegen in elektronischer Form vor und sind in Kap. 7 dokumentiert. Zum einen gestatten diese Daten die Überprüfung jedes definierten Konzepts und jeder der über 12.000 Zuordnungen zwischen Verbkonstruktionen und Konzepten, zum anderen sind sie die praktische Umsetzung der Forderung nach Wiederverwendbarkeit. Insgesamt hat sich die systematische Trennung von übereinzelsprachlich-konzeptuellen und einzelsprachlich-lexikalischen Daten, kombiniert mit dem Prinzip, ausgehend von konkreten, kontextuell definierten Bedeutungen zu abstrahieren anstatt ausgehend von unterspezifizierten Bedeutungen zu konkretisieren, als ein geeigneter Weg für die Repräsentation und Verarbeitung einer größeren Zahl polysemer Verben erwiesen. Die Möglichkeiten zur Generalisierung, die das entwickelte Modell der semantischen Repräsentation bietet, lassen annehmen, dass die Synergieeffekte, die sich im Verlauf der Verbanalyse eingestellt haben, die Ausdehnung der Methode auf größere Wortschatzbereiche und ihre Übertragung auf andere Sprachen erleichtern werden. Um das eingangs genannte Ziel, die Kluft zwischen semantischer Theorie und empirischer Analyse zu überwinden, wird aber auf der sprachlichen Ebene weitaus mehr als die Beschreibung eines Wortschatzfragments nötig sein und auf der konzeptuellen Ebene weitaus mehr als die hier definierten Eigenschaften und Relationen.
9
Literaturverzeichnis
Albertazzi, Liliana (1996): "Formal and Material Ontology". In: Roberto Poli & Peter Simons, (ed.): Formal Ontology. Dordrecht etc.: Kluwer, 199-232. Apresjan, Jurij D. (1974): "Regular Polysemy". Linguistics, 142,5-32. Asher, Nicholas (1993): Reference to Abstract Objects in Discourse. Dordrecht etc.: Kluwer. Asher, Nicholas; Pustejovsky, James (1998): "The Metaphysics of Words". Bach, Emmon (1986a): "The Algebra of Events". Linguistics and Philosophy, 9,5-16. Bach, Emmon (1986b): "Natural Language Metaphysics". In: Ruth Barcan Marcus et al., (ed.): Logic, Methodology and Philosophy of Science, Vol. VII. Amsterdam: Elsevier, 573-595. Bailey, David R. (1997): When Push Comes to Shove: A Computational Model of the Role of Motor Control in the Acquisition of Action Verbs. University of California, Berkeley: PhD thesis. Bally, Charles (1919): Precis de stylistique franqaise. Paris: Klincksieck. Bartsch, Renate (1994): 'The Myth of Literal Meaning". Technischer Bericht, University of Amsterdam, ILLC, Department of Philosophie. Bateman, John (1992): "The theoretical status of ontologies in natural language processing". In: Susanne Preuß & Birte Schmitz, (ed.): Text Representation and Domain Modelling — ideas from linguistics and AI, KIT-Report 97, 50-99, Berlin. Technische Universität Berlin. Bateman, John, Fabris, Giovanni; Magnini, Bernardo (1995): 'The Generalized Upper Model Knowledge Base". In: Michael Wooldridge & Nick Jennings, (ed.): Intelligent agents: Proceedings of the ECAI-94 Workshop on Agent Theories, Architectures, and Languages, Amsterdam, the Netherlands, August 8-9, 1994, Berlin, New York: Springer. Beale, Stephen et al. (1998): "Constraints in Computational Semantics". In: Proceedings of COLING-98. Belletti, Adriana; Rizzi, Luigi (1981): "The Syntax of 'Ne': Theoretical Implications". The Linguistic Review, 1, 117-154. Belletti, Adriana; Rizzi, Luigi (1988): "The Case of Unaccusatives". Linguistic Inquiry, 19, 1-34. Benoist, Jocelyn (1997): Phenomenologie, semantique, ontologie. Paris: PUF. Bierwisch, Manfred (1983): "Semantische und konzeptuelle Repräsentation lexikalischer Einheiten". In: Rudolf Ruzicka & Wolfgang Mötsch, (ed.): Untersuchungen zur Semantik. Berlin: Akademie Verlag, 61-99. Bierwisch, Manfred; Lang, Ewald, (ed.) (1987): Grammatische und konzeptuelle Aspekte von Dimensionsadjektiven. Berlin: Akademie Verlag. Blumenthal, Peter (1998): "Das indirekte Objekt im italienischen Valenzlexikon". In: Wolfgang Dahmen et al., (ed.): Neuere Beschreibungsmethoden der Syntax romanischer Sprachen. Tübingen: Narr, 3-27. Blumenthal, Peter; Rovere, Giovanni (1998): Wörterbuch der italienischen Verben. Konstruktionen, Bedeutungen, Übersetzungen. Stuttgart: Ernst Klett Verlag.
152 Boons, Jean-Paul, Guillet, Alain; Leclere, Christian (1976a): La structure des phrases simples enfrangais: classes de constructions transitives. Paris: Universite de Paris 7 (= Rapport de Recherches du LADL no. 6). Boons, Jean-Paul, Guillet, Alain; Leclere, Christian (1976b): La structure des phrases simples enfrangais. Vol. I: constructions intransitives. Genf, Paris: Droz (= Langue & Cultures 8). Boons, Jean-Paul, Guillet, Alain; Leclere, Christian (1992): La structure des phrases simples en frangais. Constructions transitives locales. Genf, Paris: Droz (= Langue & Cultures 26). Bromberg, M., Kekenbosch, C.; Friemel, E. (1998): "La cat6gorisation des predications". Langages, 132,9-27. Brunot, Ferdinand (1922): La pensee et le langage. Paris. Breal, Michel (1897): Essai de semantique. Science des significations. Paris: Hachette. Buitelaar, Paul (1998): CoreLex: Systematic Polysemy and Underspecification. PhD Thesis: Brandeis University. Burzio, Luigi (1981): Intransitive Verbs and Italian Auxiliaries. Cambrige Mass. Burzio, Luigi (1986): Italian Syntax. A Government-Binding Approach. Dordrecht: Reidel. Cadiot, Pierre (1994): "Reprösentations d'objets et semantique lexicale: qu'est-ce qu'une boite?". French Language Studies, 4,1-23. Cadiot, Pierre; Nemo, Fran9oise (1997): "Pour une semiogenese du nom". Languefrangaise, 113,24-45. Calzolari, Nicoletta; Briscoe, Ted (1995): "Aquilex I and II. Acquisition of lexical knowledge from machine-readable dictionairies and text corpora". Cahiers de Lexicologie, 67, 9 5 114. Casati, Roberto; Varzi, Achille, (ed.) (1996): Events. Aldershots: Dartmouth. Chisholm, Roderick (1970): "Events and Propositions". Noüs, 4,15-24. Chisholm, Roderick (1996): "A Realistic Theory of Categories". Nous, 4, 15-24. Chomsky, Noam (1957): Syntactic Structures. Den Haag. Clark, Ε. V.; Clark, Η. H. (1979): "When Nouns surface as Vers". Language, 55, 767-811. Cocchiarella, Nino B. (1991): "Ontology II: formal ontology". In: Hans Burkhardt & Β. Smith, (ed.): Handbook of metaphysics and ontology, 2 Bde. München: Philosophia, 640-647. Collins, A. M.; Quillian, M. R. (1972): "How to Make a Language User". In: Tulving & Donaldson, (ed.): Organization of Memory. New York: Academic Press, 309-351. Comrie, Bernard (1976): Aspect. An introduction to the study of verbal aspect and related problems. Cambridge: University Press. Copestake, Ann; Briscoe, Ted (1995): "Semi-productive Polysemy and Sense Extension". Journal of Semantics, 12,15-67. Cruse, D. Allan (1973): "Some Thoughts on Agentivity". Journal of Linguistics, 9,1. Cruse, D. Allan (1986): Lexical Semantics. Cambridge (= Cambridge Textbooks in Linguistics). Culioli, Antoine (1990): Pour une linguistique de l'enonciation. Operations et representations. Paris: Ophrys. D'Agostino, Emilio (1989): L'elaborazione di un Lessico-Grammatica. Salerno: ILUS. D'Agostino, Emilio, (ed.) (1995): Tra sintassi e semantica: descrizioni e metodi di elaborazione automatica della lingua d'uso. Napoli: Edizioni Scientifiche Italiane.
153 Darmesteter, Ars£ne (1887): La vie des mots etudiee dans leurs significations. Paris: Delagrave. Davidson, Donald (1967): "The Logical Form of Action Sentences". In: Nicholas Rescher, (ed.): The Logic of Decision and Action. Pittsburgh: University of Pittsburgh Press, 8195. Davidson, Donald (1970): "Events as Particulars". Nous, 4,25-32. De Mauro, Tullio; Lo Cascio, Vincenzo, (ed.) (1997): Lessico e grammatica: teorie linguistiche e applicazioni lessicografiche. Atti del Convegno lnterannuale delta Societä di Linguistica Italiana, Madrid 21-25 febbraio 1995. Roman: Bulzoni. De Vogü£, Sarah; Paillard, Denis (1997): "Identite lexicale et heterog6ndite de la variation cotextuelle: le cas de suivre". In: Claude Guimier, (ed.): Co-texte et calcul du sens. Caen: Presses universitäres de Caen, 41-61. Dejnozka, Jan (1996): The Ontology of the Analytic Tradition and Its Origins. Realism and Identity in Frege, Russell, Wittgenstein, and Quine. Lanham, Maryland: Rowman & Littlefield. Descles, Jean-Pierre et al. (1998a): "Semantique cognitive de Taction: 1. contexte theorique". Langages, 132, 2 8 ^ 7 . Descl6s, Jean-Pierre et al. (1998b): "Semantique cognitive de Taction: 2. etude experimentale de la categorisation des verbes d'action". Langages, 132,48-68. Devoto, Giacomo; Oli, Gian Carlo (1992): Nuovo vocabolario illustrate delta lingua italiana. Milano: Felice Le Monnier. DISC (1997): Dizionario Italiano Sabatini Coletti. Firenze: Giunti. Dixon, Robert M. (1994): Ergativity. Cambrige Mass.: University Press. Dorr, Bonnie (1995): "A lexical-semantic solution to the divergence problem in machine translation". In: Patrick Saint-Dizier & Evelyne Viegas, (ed.): Computational Lexical Semantics. Cambridge: Cambridge University Press, 367-395. Dorr, Bonnie et al. (1994): "Concept-Based Lexical Selection". In: Proceedings of the AAAI94 fall symposium on Knowledge Representation for Natural Language Processing in Implemented Systems, New Orleans, LA. AAAI. Dorr, Bonnie; Olsen, Mari Broman (1997): "Deriving Verbal and Compositional Lexical Aspect for NLP Applications". In: Association for Computational Linguistics, (ed.): Proceedings of the 35th Annual Meeting of theAssociation for Computational Linguistics. San Francisco: Morgan Kaufmann Publishers, 151-158. Dowty, David (1988): "On the semantic content of the notion 'thematic role'". In: G. Chierchia, B. Partee, & R. Turner, (ed.): Property Theory, Type Theory, and Semantics. Dordrecht: Reidel. Dowty, David (1991): "Thematic Proto-Roles and Argument Selection". Language, 67,547619. Dölling, Johannes (1992): "Flexible Interpretation durch Sortenverschiebung". In: Ilse Zimmermann & Anatoli Strigin, (ed.): Fügungspotenzen. Berlin: Akademie Verlag, 23-62. Dölling, Johannes (1993): "Commonsense ontology and semantics of natural language". Sprachtypologie und Universalienforschung, 46, 133-141. Dölling, Johannes (1994): "Sortale Selektionsbeschränkungen und systematische Bedeutungsvariation". In: Monika Schwarz, (ed.): Kognitive Semantik / Cognitive Semantics. Ergebnisse, Probleme, Perspektiven. Tübingen: Narr, 41-59.
154 Egg, Markus (1994): "Zur Repräsentation extrem polysemer Lexeme". In: Monika Schwarz, (ed.): Kognitive Semantik/Cognitive Semantics. Ergebnisse, Probleme, Perspektiven. Tübingen: Narr, 163-177. Elia, Annibale (1984): Le verbe Italien. Les completives dans les phrases ά un complement. Fasano, Paris: Schena-Nizet. Elia, Annibale et al. (1981): Lessico e strutture sintattiche. Introduzione alia sintassi del vocabolario italiano. Napoli: Linguori. Engelberg, Stefan (2000): Verben, Ereignisse und das Lexikon. Tübingen: Niemeyer. Erdmann, Karl O. (1900): Die Bedeutung des Wortes. Aufsätze aus dem Grenzgebiet der Sprachpsychologie und Logik. Leipzig: Avenarius. Fellbaum, Christiane (1990): "English Verbs as a Semantic Net". International Journal of Lexicography, 3,278-301. Fellbaum, Christiane, (ed.) (second printing 1 9 9 9 ) . WordNet: An Electronic Lexical Database. Cambrige Mass.: ΜΓΓ Press. Fillmore, Charles (1968): ' T h e Case for Case". In: Emmon Bach & Robert T. Harms, (ed.): Universals in Linguistic Theory. New York: Holt Linehart Winston, 1-90. Fillmore, Charles (1970): "The Grammar of 'Hitting' and 'Breaking'". In: R. Jacobs & P. Rosenbaum, (ed.): Readings in English Transformational Grammar. Waltham, Mass.: Ginn, 120-133. Fillmore, Charles (1982): "Frame Semantics". In: Linguistic Society of Korea, (ed.): Linguistics in the morning calm. Seoul International Conference on Linguistics, SICOL, Han'guk-Ono-hakhoe. Seoul: Hanshin, 111-138. Fillmore, Charles, Johnson, Christopher; Petruck, Miriam (2000): "Background to Framenet". International Journal of Lexicography, 16,3,235-250. Flaux, Nelly et al., (ed.) (1996): Les noms abstraits. Histoire et theories. Presses universitäres du Septentrion. Fodor, Jerry (1970): "Three Reasons for Not Deriving 'Kill' from 'Cause to Die'". Linguistic Inquiry, 1,429-438. Fran$ois, Jacques (1989): Changement, causation, action. Trois categories semantiques fondamentales du lexique verbal franqais et allemand. Geneve: Droz. Fran?ois, Jacques (1990): "Classement s&nantique des predications et mdthode psycholinguistique d'analyse propositionnelle". Langages, 100,13-32. Frawley, William (1992): Linguistic Semantics. Hillsdale, N.J.: Erlbaum. Gale, William, Church, Kenneth; Yarowsky, David (1993): "A Method for Disambiguating Word Senses in a Large Corpus". Computers and the Humanities, 26,415-439. Gangemi, Aldo, Guarino, Nicola; Oltramari, Alessandro (2001): "Conceptual Analysis of Lexical Taxonomies. The Case of WordNet Top-Level". In: 2nd International Conference on Formal Ontology in Information Systems, FOIS 2001, Ogunquit, Maine, USA, October 17-19, 2001, Proceedings. ACM, 2001,285-296, New York: ACM Press. Gayral, Fran^oise (1998): "Creativite du sens en contexte et hypothes de compositionnalite". traitement automatique des langues, 39,1,67-98. Geeraerts, Dirk (1993): "Vagueness's Puzzle, Polysemy's Vagueness". Cognitive Linguistics, 4,223-272. Gibbon, Dafydd (2002): "Compositionality in the Inheritance Lexicon". In: Leila Behrens & Dietmar Zaefferer, (ed.): The Lexicon in Focus. Competition and Convergence in Current Lexicology. Frankfurt a.M.: Peter Lang, 145-185.
155 Gill, Kathleen (1993): "On the Metaphysical Distinction Between Processes and Events". Canadian Journal of Philosphy, 23, 365-384. Godard, Daniele; Jayez, Jacques (1993): "Towards a proper treatment of coercion phenomena". In: Proceedings of the 6th Conference of the European Chapter of the Association for Computational Linguistics. Utrecht: OTS Utrecht, 168-177. Goldberg, Adele (1994): Constructions: A Construction Grammar Approach to Argument Structure. Chicago: University of Chicago Press. Gosselin, Laurent (1996): "Le traitement de la polysemie contextuelle dans le calcul s&nantique". Intellectica, 22,93-117. Gosselin, Laurent; Francois, Jacques (1991): "Les types de proems; des verbes aux prddications". Travaux de Linguistique et de Philologie, 29, 19-86. Grimshaw, Jane (1990): Argument Structure. Cambrige Mass.: MIT (= Linguistic Inquiry Monographs 18). Gross, Gaston (1994): "Classes d'objets et description des verbes". Langages, 115, septembre 1994,15-30. Gross, Maurice (1968): Grammaire transformationnelle du franqais I: Syntaxe du verbe. Paris: Larousse. Gruber, J. (1976): Lexical Structures in Syntax and Semantics. New York: North Holland. Gruber, T.R. (1992): "Ontolingua: a Mechanism to Support Portable Ontologies". Technischer Bericht, Stanford University. Guarino, Nicola (1998): "Some Ontological Principles for Designing Upper Level Lexical Resources". In: Antonio Rubio, Natividad Gallardo, Rosa Castro, & Antonio Tejada, (ed.): Proceedings of the First International Conference on Language Resources and Evaluation, Granada, 28-30 May 1998,527-534, Paris: ELRA. Guarino, Nicola; Welty, Christopher (2001): "Identity and Subsumption". In: R. Green, C.A. Bean, & S. Hyon Myaeng, (ed.): The Semantics of Relationships: An Interdisciplinary Perspective. Dordrecht etc.: Kluwer Academic Publishers, 111-126. Guarino, Nicola; Welty, Christopher (2004): "An Overview of OntoClean". In: S. Staab & R. Studer, (ed.): Handbook on Ontologies. Berlin: Springer, 151-159. Guillaume, Gustave ( 2 1964): Langage et science du langage. Paris: Nizet. Guillen, Rocio, Helmreich, Stephen; Wilson, Lori (1996): Evaluation of the Mikrokosmos System. New Mexico: Computing Research Laboratory (= Memoranda in Computer and Cognitive Science 300). Halliday, Michael A. K. (1985): An Introduction to Functional Grammar. London etc.: Edward Arnold. Hallig, Rudolf; Wartburg, Walther von ( 2 1963): Begriffssystem als Grundlage für die Lexikographie. Versuch eines Ordnungsschemas. Berlin: Akademie-Verlag. Hausmann, Franz Josef (1984): "Wortschatzlernen ist Kollokationslernen. Zum Lehren und Lernen französischer Wortverbindungen". Praxis des neusprachlichen Unterrichts, 31, 395—406. Hopper, Paul (1985): "Causes and affects". In: William H. et al. Eilfort, (ed.): Papers from the parasession on causatives and agentivity at the 21st Regional Meeting. Chicago: CLS, 67-88. Husserl, Edmund (1900-01): Logische Untersuchungen. Tubingen: Niemeyer. Ingarden, Roman (1964): Der Streit um die Existenz der Welt, Band 1. Tübingen: Niemeyer.
156 Jackendoff, Ray (1972): Semantic Interpretation in Generative Grammar. Cambridge Massachusetts: MIT. Jackendoff, Ray (1983): Semantics and Cognition. Cambrige Mass.: MIT Press. Jackendoff, Ray (1990): Semantic Structures. Cambrige Mass.: MIT Press. Jackendoff, Ray (1992): "Babe Ruth homered his way into the hearts of America". In: Tim Stowell & Eric Wehrli, (ed.): Syntax and the Lexicon. New York: Academic Press, 155— 178. Kamp, Hans (1979): "Some Remarks on the Logic of Change, Part I". In: Christian Rohrer, (ed.): Time, Tense, and Quantifiers. Tübingen: Niemeyer, 135-179. Kenny, Anthony (1963): Action, Emotion and Will. London: Routledge & Kegan. Kilgarriff, Adam (1995): "Inheriting polysemy". In: Patrick Saint-Dizier & Evelyne Viegas, (ed.): Computational Lexical Semantics. Cambridge: Cambridge University Press, 319335. Kleemeier, Ulrike (1997): Gottlob Frege. Kontext-Prinzip und Ontologie. Freiburg & München: Karl Alber. Kleiber, Georges ( 2 1999): La semantique du prototype. Categories et sens lexical. Paris: PUF. Knight, Κ.; Luk, S. (1994): "Building a Large Knowledge Base for Machine Translation". In: Proceedings of the American Association of Artificial Intelligence Conference (AAAI-94), Seattle. Krifka, Manfred (1998): "The origins of telicity". In: Susan Rothstein, (ed.): Events and Grammar. Dordrecht: Kluwer, 197-235. Kunze, Jürgen (1991): Kasusrelationen und semantische Emphase. Berlin: Akademie Verlag (= studia grammatica 32). Lakoff, George (1970): "A note on vagueness and ambiguity". Linguistic Inquiry, 1, 357359. Lang, Ewald (1991): "The LILOG ontology from a linguistic point of view". In: O. Herzog & C.-R. Rollinger, (ed.): Text understanding in LILOG: integrating computational linguistics and artificial inteligence. Berlin: Springer, 464-481. Lang, Ewald (1994): "Semantische vs. konzeptuelle Struktur: Unterscheidung und Überschneidung". In: Monika Schwarz, (ed.): Kognitive Semantik / Cognitive Semantics. Ergebnisse, Probleme, Perspektiven. Tübingen: Narr, 25-40. Langacker, Ron (1991): Foundations of Cognitive Grammar. Volume II: Descriptive Application. Stanford: Stanford University Press. Le Pesant, Denis; Mathieu-Colas (1998a): "Introduction aux classes d'objets". Langages, 131,6-33. Le Pesant, Denis; Mathieu-Colas, Michel, (ed.) (1998b): Les classes d'objets. Paris: Larousse (= Langages; no. 131, sept. 1998). Lehmann, Christian (1991): "Predicate classes and participation". In: H. Seiler & W. Premper, (ed.): Partizipation. Das sprachliche Erfassen von Sachverhalten. Tübingen: Narr, 183-239. Lenat, Doug; Guha, R.V. (1988): "The world according to CYC". Technischer Bericht, Austin, Texas, Microelectronics and Computer Technology Corporation. Levin, Beth (1993): English Verb Classes and Alternations. A Preliminary Investigation. Chicago: University of Chicago Press. Levin, Beth; Rappaport, Malka (1995): Unaccusativity: At the Syntax-Lexical Semantics Interface. Cambrige Mass.: MIT Press.
157 Lowe, Ernest J. (2002): A Survey of Metaphysics. Oxford: Oxford University Press. Lyons, John (1977): Semantics. Cambridge: Cambridge University Press. Magnini, Bernardo (1994): "Specification of Upper Model". Technischer Bericht, Generating Instructional Text. LRE Project 062-09. Mahesh, Kavi (1996): Ontology Development for Machine Translation: Ideology and Methodology. New Mexico: Computing Research Laboratory (= Memoranda in Computer and Cognitive Science 292). Mahesh, Kavi et al. (1996): An Assessment ofCyc for Natural Language Processing. New Mexico: Computing Research Laboratory (= Memoranda in Computer and Cognitive Science 302). Martin, Robert (1972): "Esquisse d'une analyse formelle de la polysemie". Travaux de Linguistique et de Littirature, 10, 125-136. Martin, Robert (1979): "La polysemie verbale. Esquisse d'une typologie formelle". Travaux de Linguistique et de Litterature, 17,251-261. Martin, Robert (1994): "Dictionnaire informatise et traitement automatique de la polys6mie". In: Evelyne Martin, (ed.): Les textes etl'informatique. Paris: Didier Erudition, 77-114. Matthiessen, Christian (1992): Lexicogrammatical Cartography: English Systems. University of Sydney: Preliminary Version of Matthiessen (1995). Matthiessen, Christian (1995): Lexicogrammatical Cartography: English Systems. Tokyo: International Language Science Publishers. Melis, Ludo (1991): "Les tours pronominaux en fransais moderne: diathese rdcessive ou couplage des marques pronominales?". In: Peter Koch & Thomas Krefeld, (ed.): Connexiones Romanicae. Dependenz und Valenz in den romanischen Sprachen. Tübingen: Niemeyer, 309-327. Mel'cuk, Igor Α., (ed.) (1979): Studies in Dependency Syntax. Ann Arbor (= Linguistica Extranea, Studia 2). Mel'iuk, Igor A. et al. (1984ff): Dictionnaire explicatifet combinatoire du franqais contemporain. Recherches lexico-semantiques, 4 Vol. 1984/88/92/99. Montreal. Mikrokosmos (1997): The Mikrokosmos Ontology. Las Cruces: Computing Research Laboratory, New Mexico State University. Miller, G. Α.; Johnson-Laird, P. Ν. (1976): Language and Perception. Cambrige Mass.: The Belknap Press. Miller, George et al. (1993): "Five Papers on WordNet". Technischer Bericht, Princeton University. Mourelatos, Alexander P.D. (1978): "Events, Proceses, and States". Linguistics and Philosophy, 2,415-434. Norvig, Peter; Lakoff, George (1987): 'Taking: A study in lexical network theory". In: Proceedings of the 13th Annual Meeting of the Berkeley Linguistics Society, 185-206. Nunberg, Geoffrey (1979): "The Non-uniqueness of Semantic Solutions: Polysemy". Linguistics and Philosophy, 3, 143-184. Oesterreicher, Wulf (1992): "SE im Spanischen. Pseudoreflexivität, Diathese und Prototypikalität von semantischen Rollen". Romanistisches Jahrbuch, 43,237-260. Parsons, Terence (1990): Events in the Semantics of English. A Study in Subatomic Semantics. Cambridge, Mass.: MIT Press.
158 Perlmutter, David (1978): "Impersonal Passives and the Unaccusative Hypothesis". In: Proceedings of the Fourth Annual Meeting of the Berkeley Linguistics Society, 157-189. University of California, Berkeley Linguistics Society. Picoche, Jacqueline (1986): Structures semantiques du lexique frangais. Paris: Nathan. Pinker, Steven (1989): Learnability and Cognition. The Acquisition of Argument Structure. Cambrige Mass.: MIT Press. Ploux, Sabine (1997): "Modelisation et traitement informatique de la synonymie". Linguisticae Investigations, 21, 1-28. Ploux, Sabine; Victorri, Bernard (1998): "Construction d'espaces sdmantiques ä Γ aide de dictionnaires de synonymes", traitement automatique des langues, 39,1,161-182. Poli, Roberto (1993): "Husserl's Conception of Formal Ontology". History and Philosophy of Logic, 14, 1-14. Poli, Roberto; Simons, Peter, (ed.) (1996): Formal Ontology. Dordrecht etc.: Kluwer. Primus, Beatrice (1999): Cases and Thematic Roles: ergative, accusative and active. Tübingen: Niemeyer (= Linguistische Arbeiten; 393). Pustejovsky, James (1991): 'The Generative Lexicon". Computational Linguistics, 17,409441. Pustejovsky, James (1994): "Semantic typing and degrees of polymorphism". In: Carlos Martin-Vide, (ed.): Current issues in mathematical linguistics. Amsterdam: NorthHolland, 221-238. Pustejovsky, James (1995): The Generative Lexicon. A Theory of Computational Lexical Semantics. Cambrige Mass.: MIT Press. Pustejovsky, James (1998a): "Generativity and Explanation in Semantics: A Reply to Fodor and Lepore". Linguistic Inquiry, 29,289-311. Pustejovsky, James (1998b): "Lexical Semantics and Formal Ontologies". In: Nicola Guarino, (ed.): Formal Ontology in Information Systems. Proceedings ofFOIS '98, June 6-8 1998, Trento, Italy, 328-336, Amsterdam: IOS Press. Pustejovsky, James; Busa, Federica (1995): "Unaccusativity and Event Composition". In: Marco Bertinetto et al., (ed.): Temporal Reference, Aspect and Actionality, 1: Semantic and Syntactic Perspectives. Torino: Rosenberg & Seiler, 159-177. Quine, Willard Van Orman (1960): Word and Object. Cambrige Mass.: MIT Press. Raskin, Victor; Nirenburg, Sergei (1995): Lexical Semantics of Adjectives. New Mexico: Computing Research Laboratory (= Memoranda in Computer and Cognitive Science 288).
Rastier, Francois (1987): Semantique interpretative. Paris: Presses universitäres de France. Rastier, Fransois (1991): Semantique et recherches cognitives. Paris: Presses universitäres de France. Renzi, Lorenzo; Salvi, Giampaolo, (ed.) (1991): Grande grammatica italiana di consultazione. II: I sintagmi verbale, aggettivale, avverbiale. La subordinazione. Bologna: il Mulino. Rodriguez, Horacio et al. (1998): "The Top-Down Strategy for Building EuroWordNet: Vocabulary Coverage, Base Concepts and Top Ontology". Computers and the Humanities, 32, 117-152. Rosen, Carol (1984): 'The Interface between Semantic Roles and Initial Grammatical Relations". In: David Perlmutter & Carol Rosen, (ed.): Studies in Relational Grammar 2. Chicago: University of Chicago Press, 38-77.
159 Saint-Dizier, Patrick (1999): "Verb Semantic Classes in French". In: Patrick SaintDizier, (ed.): Predicative Forms in Natural Language and in Lexical Knowledge Bases. Dordrecht: Kluwer, 139-170. Saussure, Ferdinand de ( 5 1969): Cours de linguistique generale. Paris: Payot (= publid par Charles Bally et Albert Sechehaye avec la collaboration de Albert Riedlinger). Schänk, Roger C. (1975): Conceptual Information Processing. Amsterdam: North Holland. Schank, Roger C.; Abelson, Robert (1977): Scripts, Plans, Goals, and Understanding. Hillsdale NJ.: Lawrence Erlbaum. Schwarze, Christoph ( 2 1994): Grammatik der italienischen Sprache. Tübingen: Niemeyer. Searle, John R. (1992): The rediscovery of the mind. Cambrige Mass.: MIT Press. Shaumyan, S.K. (1987): A Semiotic Theory of Language. Bloomington: Indiana University Press. Siskind, Jeffrey Mark (1997): "Visual Event Perception". In: Katsushi Ikeuchi, (ed.): Symbol Visual Learning. New York: Oxford University Press. Sluga, Hans, (ed.) (1993): The Philosophy of Frege. Volume 3: Meaning and Ontology in Frege's Philosophy. New York & London: Garland. Stegmüller, Wolfgang ( 4 1969): Hauptströmungen der Gegenwartsphilosophie. Stuttgart: Kröner. Stein, Achim (1991): "Rez. zu G. Gross: Les constructions converses du fransais, Genf 1989". Zeitschrift für französische Sprache und Literatur, 101,294-296. Stein, Achim (1996): "Argumentstruktur italienischer Verben. Einbettung in eine semantische Repräsentation". In: Peter Blumenthal, Giovanni Rovere, & Christoph Schwarze, (ed.): Lexikalische Analyse romanischer Sprachen. Methodische Neuansätze. Tübingen: Niemeyer, 135-147. Stein, Achim (1999): "Describing Verb Semantics in a Type Hierarchy. Disambiguation of Italian Verbs". In: Patrick Saint-Dizier, (ed.): Predicative Forms in Natural Language and in Lexical Knowledge Bases. Dordrecht: Kluwer, 111-137. Stein, Achim; Schmid, Helmut (1995): "Etiquetage morphologique de textes frar^ais avec un arbre de ddcisions". traitement automatique des langues, Volume 36, Num6ro 1-2: Traitements probabilistes et corpus, 23-35. Steiner, Erich, Eckert, Ursula, Roth, Birgit; Winter-Thielen, Jutta (1988): 'The development of the EUROTRA-D system of Semantic Relations". In: Erich Steiner et al., (ed.): From syntax to semantics. Insights from machine translation. London: Pinter, 40-104. Steward, Helen (1997): The Ontology of Mind. Events, Processes and States. Oxford: Clarendon Press. Strawson, Peter F. (1959): Individuals: An Essay in Descriptive Metaphysics. London: Methuan University Press. Talmy, Leonard (1985): "Lexicalization patterns: Semantic structure in lexical forms". In: T. Shopen, (ed.): Language typology and syntactic description. Vol. 3: Grammatical categories and the lexicon. New York: Cambridge University Press. Talmy, Leonard (1988a): "Force dynamics in language and cognition". Cognitive Science, 12,49-100. Talmy, Leonard (1988b): "The Relation of Grammar to Cognition". In: B. Rudzka-Ostyn, (ed.): Topics in Cognitive Linguistics. Amsterdam: Benjamins. Talmy, Leonard (2000): Toward a Cognitive Semantics. Vol. I: Concept Structuring Systems. Cambridge: ΜΓΓ Press.
160 Van de Velde, Daniele (1996): Le spectre nominal: des noms de matieres aux noms d'abstractions. Leuven: Peeters. Van Valin, Robert; La Polla, Randy (1997): Syntax. Structure, meaning and function. Cambridge: University Press. VanValin, R.D. Jr. (1990): "Semantic Parameters of Split Intransitivity". Language, 66,221. VELI (1989): Vocabolario elettronico della lingua italiana. IBM Italia. Vendler, Zeno (1957): "Verbs and Times". Philosophical Review, 66,143-160. Victorri, Bernard; Fuchs, Catherine (1996): La polysemie. Construction dynamique du sens. Paris: Hermes. Vossen, Piek, (ed.) (1998a): EuroWordNet: A multilingual database with lexical semantic networks. Dordrecht, Boston, London: Kluwer Academic Publishers (= Double Special Issue of Computers and the Humanities, Vol. 32, Nos. 2-3). Vossen, Piek (1998b): "Introduction to EuroWordNet". Computers and the Humanities, 32, 73-89. V6ronis, Jean; Ide, Nancy (1995): "Large neural networks for the resolution of lexical ambiguity". In: Patrick Saint-Dizier & Evelyne Viegas, (ed.): Computational Lexical Semantics. Cambridge: Cambridge University Press, 251-269. Weisgerber, Leo (31962): Von den Kräften der deutschen Sprache, Bd. 1: Grundzüge der inhaltbezogenen Grammatik. Düsseldorf: Schwann. Weisgerber, Leo (1964): Zur Grundlegung der ganzheitlichen Sprachauffassung. Aufsätze 1925-1933. Düsseldorf: Schwann. Wierzbicka, Anna (1988): The Semantics of Grammar. Amsterdam & Philadelphia: Benjamins. Wierzbicka, Anna (1989): Semantics, Culture and Cognition. Oxford: University Press. Wilks, Yorick; Fass, Dan (21992): "Preference semantics". In: Stuart C. Shapiro, (ed.): Encyclopedia of Artificial Intelligence. New York: Wiley, 1182-1194. WordNet (1998): WordNet Release 1.6. Princeton: Princeton University.