163 24 15MB
German Pages 340 [344] Year 1980
de Gruyter Studienbuch Grundlagen der Kommunikation Herausgegeben von Roland Posner
Manfred Wettler
Sprache Gedächtnis Verstehen
w DE
G "Walter de Gruyter · Berlin · New York 1980
CIP-Kurztitelaujnahme
der Deutschen
Bibliothek
Wettler, Manfred: Sprache, Gedächtnis, Verstehen / Manfred Wettler. — Berlin, New Y o r k : de G r u y t e r , 1980. (De-Gruyter-Studienbuch : Grundlagen d. Kommunikation) ISBN 3-11-007971-2
© Copyright 1980 für alle deutschsprachigen Rechte by Walter de G r u y t e r & Co., vormals G . J . Göschen'sche Verlagshandlung — J . Guttentag, Verlagsbuchhandlung — Georg R e i m e r — Karl J . T r ü b n e r — Veit & Comp., Berlin 30. Printed in Germany Alle Rechte des Nachdrucks, der photomechanischen Wiedergabe, der Herstellung von Photokopien — auch auszugsweise — vorbehalten. Satz: münchener fotoprint G m b H . , München; D r u c k : Saladruck, B e r l i n ; Bindearbeiten: Lüderitz & Bauer, Berlin
VORWORT Die vorliegende Schrift kann in zwei Teile gegliedert werden: In den Kapiteln eins bis sechs werden frühere Arbeiten dargestellt, die sich mit der formalen Repräsentation begrifflichen Wissens, dem Verstehen und der Produktion von sprachlichen Äußerungen beschäftigen. Die Kapitel sieben bis zehn beschreiben eigene Ansätze zu diesen Problembereichen. Ein ausführliches Eingehen auf die früheren Arbeiten anderer Autoren ist darum notwendig, weil bislang kein Lehrbuch existiert, in welchem das geschilderte interdisziplinäre Gebiet zusammenfassend dargestellt wird. Dieses Gebiet wird von manchen Autoren „kognitive Wissenschaft", von anderen „Computersemantik" genannt; das Fehlen einer allgemein anerkannten Bezeichnung sowohl im deutschen als auch im englischen Sprachraum ist ein Zeichen dafür, daß sich hier eine selbständige Disziplin noch nicht herausgebildet hat. J e nach seinem Fachgebiet werden dem Leser die in den ersten sechs Kapiteln geschilderten Arbeiten teilweise schon bekannt sein. So werden Psychologen Kapitel zwei und möglicherweise auch Kapitel drei überschlagen können. Linguisten werden Teile des vierten und des fünften Kapitels schon bekannt sein und Informatiker, die sich mit „künstlicher Intelligenz" befaßt haben, werden bei der Lektüre der Kapitel drei bis sechs jeweils größere Teile auslassen können. Bei der Darstellung eines interdisziplinären Gebietes, welches nicht auf einen bestimmten Kreis von Lesern zugeschnitten ist, sind solche „Weitschweifigkeiten" unvermeidbar. Die Abfassung dieser Schrift, aber auch eine große Zahl der darin referierten Arbeiten anderer Autoren wurden durch die Fondazione Dalle Molle per gli studi linguistici e di communicazione internazionale ermöglicht. Das Ziel dieser Stiftung und des damit zusammenhängenden Centro di Studi della Barbariga ist die Erarbeitung nicht nur von Kenntnissen, sondern auch von brauchbaren Modellen, die eine höhere Selbstverantwortung und Lebensqualität ermöglichen sollen. Dem Präsidenten und Gründer der Stiftung, Herrn Angelo Dalle Molle, und ihrem Sekretär, Herrn Franco Boschetti, danke ich hier dafür, daß sie meinen Mitarbeitern und mir ermöglicht haben, im Institut für semantische und kognitive Studien diese Forschungen durchzuführen. Berlin-Wilmersdorf, im J u n i 1979
Manfred Wettler
INHALTSVERZEICHNIS
Vorwort I.
II.
III.
IV.
V.
V
Einleitung 1. Physiologische versus psychologische Verhaltensbeschreibung 2. Kenntnis der Sprache und Wissen von der Welt 3. Kognitive Psychologie und künstliche Intelligenz 4. Zwei Forschungsstrategien: Computersimulation und experimentalpsychologische Methode 5. Zur Relevanz kognitiver Modelle
8 10
Assoziative Strukturen 1. Lernen und die Struktur des Gedächtnisses 2. Der Assoziationsversuch 3. Assoziative und Ähnlichkeitsnetzwerke 4. Die Bildung von Assoziationen
12 18 24 33
Das semantische Netzwerk von Quillian 1. Fragen-Antwort-Systeme 2. Die Struktur des Quillian'sehen Netzes 3. Suchprozesse in semantischen Netzwerken 4. Die Überprüfung des Quillian'sehen Modelles durch Reaktionszeitexperimente 5. Die Beschreibung von Begriffen durch semantische Merkmale Kasusgrammatik u n d das Modell von Simmons 1. Die Kasusgrammatik 2. Die Struktur des Netzwerkes von Simmons 3. Einführung in die Programmiersprache LISP 4. Die Analyse von Sätzen in ein semantisches Netzwerk 5. Die Generierung von Sätzen aus einem semantischen Netzwerk Lexikalische Dekompositionen und das Modell von Schänk 1. Die Notwendigkeit lexikalischer Dekomposition
1 2 6
37 39 45 53 63 74 83 92 102 114
118
VIII
Inhaltsverzeichnis
2. Die Theorie begrifflicher Abhängigkeiten 3. Die Theorie begrifflicher Abhängigkeiten als psychologisches Gedächtnismodell 4. Die Analyse von Sätzen in eine konzeptuelle Dependenzstruktur 5. Die Generierung von Sätzen aus einer konzeptuellen Dependenzstruktur VI.
VII.
Die Repräsentation komplexer Wissensinhalte 1. Inferenzprozesse in dem System von Rieger 2. Die Repräsentation komplexer Objekte bei Winston 3. Das Frame-Modell von Minsky 4. Frame-Modelle für das Verstehen von Sprache Die Struktur von Rezepten 1. Voraussetzungen u n d Zwischenzustände 2. Handlungen und Zustände 3. Die Syntax von Rezepten und Zustandsbeschreibungen 4. Die Struktur des episodischen Gedächtnisses 5. Analyse von Handlungen und lexikalische Dekomposition 6. Die „normalerweise-hergestellt-für"-Verbindung 7. Die ,,aktant-in"-Verbindung (ai) 8. Die Begründungs-Verbindung (Grund) 9. Ursache und Folge 10. Die „während"-Verbindung
VIII. Die Bedeutung von Rezepten und Retuschen bei Inferenz- u n d Verstehensprozessen 1. Inferenzregeln 2. Wissen über Eisenbahnen 3. Verstehen mit Hilfe von Inferenzregeln 4. Ohne Billet ins Kino gehen IX.
Der inhaltliche Ablauf von Dialogen 1. Die Bedeutsamkeit pragmatischer Faktoren für die sprachliche Kommunikation 2. Methodologische Aspekte 3. motivationale Faktoren und der Beginn von Gesprächen 4. Kontingenzregeln 5. Die Retuschen-Ergänzung
124 135 142 154 165 170 174 176 185 187 189 191 196 200 201 202 205 206
207 220 226 230
235 244 247 253 262
Inhaltsverzeichnis
X.
Die Generierung der Satzoberfläche 1. Topikalisation und Generierung von Nominalphrasen 2. Inferenzprozesse bei der Satzgenerierung 3. Die Bestimmung des gemeinsamen Wissens 4. Semantische Rolle/i und der Gebrauch des Dativs im Deutschen 5. Der Begriff der Zugehörigkeit 6. Die Rolle der Intentionalität beim Gebrauch des Dativs
IX
279 287 292 295 302 304
Literaturverzeichnis
310
Register
324
I. EINLEITUNG
1. Physiologische versus psychologische Verhaltensbeschreibungen
Das Sprechen und Verstehen auch von sehr einfachen Sätzen beruht auf einer Vielzahl von äußerst komplexen Prozessen. Diese lassen sich unter zwei Gesichtspunkten analysieren. Zum einen kann man versuchen, deren materielle Grundlagen zu erforschen. Dabei müßte man bestimmen, auf welche Weise Schallwellen neurale Impulse auslösen, wie diese Impulse im Zentralnervensystem verarbeitet werden, welche biochemischen Veränderungen im Gehirn daraus folgern, und durch welche neuralen Strukturen und Prozesse die Sprechmuskulatur gesteuert wird. Bislang konnten nur kleine Ausschnitte dieser Prozesse bestimmt werden. Trotzdem wird heute kaum mehr bestritten, daß es prinzipiell möglich ist, komplexe Vorgänge wie das Sprechen u n d das Verstehen von Sprache als eine Aufeinanderfolge solcher materieller Prozesse zu beschreiben. Der andere Gesichtspunkt, unter welchem Sprechen und Verstehen analysiert werden kann, soll im weiteren als psychologische Betrachtungsweise bezeichnet werden. Dabei werden die auf das Individuum einwirkenden Reize und sein Verhalten nicht als eine Folge von Licht- oder Schallwellen und von Muskelkontraktionen, sondern auf einer abstrakteren, d. h. von der physikalischen Messung abstrahierten Ebene beschrieben. Sprachliche Ereignisse werden etwa unabhängig davon betrachtet, in welcher Tonlage oder wie schnell die einzelnen Wörter ausgesprochen werden. Häufig abstrahiert man auch vom Medium, welches für die sprachliche Mitteilung benützt wird und betrachtet gesprochene und geschriebene Sprache als gleichwertig. Mit Ausnahme der Psychophysik, in welcher die Wahrnehmung in Abhängigkeit von den physikalischen Eigenschaften der Reize untersucht wird, finden sich solche Abstraktionen in allen Bereichen der Psychologie. Obwohl man von vornherein nie mit Sicherheit weiß, ob eine bestimmte Abstraktion der Reize oder Reaktionen sich als sinnvoll erweisen wird, kann man beim Studium komplexer Verhaltensweisen nicht auf solche Vereinfachungen verzichten. Ein weiterer Unterschied zwischen der psychologischen und der
2
Einleitung
physiologischen Betrachtungsweise besteht darin, daß bei der ersteren das Verhalten nicht in Abhängigkeit von neuralen oder anderen materiellen Prozessen betrachtet wird, sondern von Reizen und von erworbenen und möglicherweise auch angeborenen Verhaltensdispositionen. In der älteren behaviouristischen Psychologie wurden Verhaltensdispositionen als intervenierende Variablen bezeichnet; man betrachtete sie als theoretische Konstrukte, die benötigt werden, um das Verhalten in Abhängigkeit der Reizsituation zu beschreiben. In der neueren psychologischen Forschung wurde eine große Zahl von immer komplexeren Modellen geschaffen, welche solche Verhaltensdispositionen darstellen. Man bezeichnet Strukturen, die für den Vollzug von höheren geistigen Tätigkeiten, wie ζ. B. für das Sprechen, das Verstehen oder das Planen von komplizierten Handlungen benötigt werden, als kognitive Strukturen; die geistigen Prozesse, bei welchen diese Strukturen verwendet werden, bezeichnet man als kognitive Prozesse. Kognitive Psychologie ist die Lehre von diesen Strukturen und Prozessen.
2. Kenntnis der Sprache und Wissen von der Welt Ein kurzes Beispiel soll erläutern, welche Arten von kognitiven Strukturen und Prozessen am Verstehen von zwei relativ einfachen Sätzen beteiligt sind. Die Bäuerin verkaufte die K u h , weil sie Geld brauchte. Die Bäuerin verkaufte die K u h , weil sie keine Milch mehr gab. Die syntaktischen Strukturen dieser beiden Sätze sind weitgehend identisch. Dennoch wird jeder der deutschen Sprache mächtige Leser die beiden Sätze so verstehen, daß durch das Pronomen „ s i e " im ersten Satz die Bäuerin und im zweiten Satz die K u h bezeichnet wird. Diese Leistung basiert auf zwei Arten von kognitiven Strukturen. Zum einen benötigt man Kenntnisse der deutschen Sprache. Man muß beispielsweise wissen, daß das Subjekt ( „ B ä u e r i n " ) in der Regel vor dem direkten Objekt ( „ K u h " ) steht, oder daß das Pronomen „ s i e " sich häufig auf ein im T e x t vorher genanntes weibliches Objekt im Singular oder auf mehrere Objekte bezieht. Diese Art von Kenntnissen benützen wir mit einer großen Selbstverständlichkeit, und es kommt selten vor, daß die Kommunikation zwischen Erwachsenen in der Muttersprache daran scheitert, daß man sprachliche Fehler macht. Die Fähigkeit, neue Sätze zu bilden und zu verstehen, ist ein Hinweis darauf, daß man über ein komplexes S y s t e m von linguistischen Regeln verfügt, welches unabhängig von dem jeweiligen Inhalt Gültigkeit hat. Allerdings ist es in der Regel nicht möglich, diese Re-
Kenntnis der Sprache und Wissen von der Welt
3
geln zu explizieren; selbst in der Linguistik konnte bislang kein vollständiges Regelsystem entwickelt werden, welches die Unterscheidung zwischen sprachlich richtigen und falschen Sätzen erlaubt. Der Tatsache, daß man einerseits zu bestimmten Leistungen ohne Schwierigkeiten in der Lage ist, und daß man andererseits häufig nicht angeben kann, durch welche Kenntnisse und Regeln diese Leistungen ermöglicht werden, begegnet man in den verschiedensten Zweigen der Psychologie; dies ist möglicherweise der wichtigste G r u n d dafür, daß die Psychologie eine relativ junge Wissenschaft ist, und daß der Sinn vieler psychologischer Forschungen für den Außenstehenden nur schwer einsichtig ist: Auch der Laie „weiß" ja, wie man spricht, Auto fährt oder etwas lernt, und so scheint es müßig, diese Prozesse wissenschaftlich zu thematisieren. Die folgenden Kapitel können als Beleg dafür dienen, wie schwierig es ist, die Mechanismen zu bestimmen, welche alltäglichen und selbstverständlich scheinenden Verhaltensweisen zu Grunde liegen. Die Kenntnis der Sprache allein ist jedoch nicht ausreichend, um die beiden oben genannten Beispielsätze zu verstehen: Da die grammatische Struktur der beiden Beispielsätze weitgehend die gleiche ist, müssen für die Bestimmung des jeweils verschiedenen Referenten des Pronomens „sie" weitere Wissensinhalte benützt werden. Dazu gehören etwa die Kenntnisse, daß Menschen Geld besitzen und Tiere nicht, daß eine Kuh ein Tier ist, und daß man Kühe u. a. darum besitzt, weil sie Milch geben. Wissensinhalte dieser Form sollen im weiteren als ,,Wissen von der Welt" oder „Weltwissen" bezeichnet werden. Nun ist es nicht immer ganz leicht, eine klare Grenzlinie zwischen dem Wissen von der Sprache und dem Wissen von der Welt zu ziehen. So könnte man etwa argumentieren, daß das Wissen, daß eine Kuh ein Tier ist, ein Bestandteil der Bedeutung des Wortes „ K u h " sei; damit wäre dieses Wissen Teil der Kenntnis der deutschen Sprache. Dieses Problem kann an folgendem Gedankenexperiment erläutert werden: Der Schüler Hans kennt einerseits das Wort „Ziege"; andererseits hat er noch nie eine Ziege gesehen und weiß auch nicht, daß Ziegen Tiere sind. Im Englischunterricht lernt er, daß „Ziege" mit dem Wort „ g o a t " übersetzt wird, und daß im Englischen Tiere immer dann grammatisch als Neutra betrachtet werden, wenn man nicht weiß, ob es sich um ein männliches oder weibliches Tier handelt. In einer Prüfung muß Hans nun den Satz Im Winter nahm die Frau die Ziege ins Haus, weil sie fror, ins Englische übersetzen. Da er nicht weiß, daß Ziegen warmblütige Tiere sind, nimmt er an, daß es sich dabei um eine Art von Heizgerät handelt. Unter dieser Annahme bezieht sich das Pronomen „sie" auf
4
Einleitung
„die Frau" und die korrekte englische Ubersetzung wäre dann „she". Nun wäre es sicher ungerecht, wenn man Hans wegen dieses Fehlers einen Abzug in seiner Englischzensur gäbe; denn die Tatsache, daß er nichts über Ziegen weiß, hat nichts mit seinen sprachlichen Fähigkeiten, sondern mit seinem Wissen von der Welt zu tun. Anders verhält es sich mit Silke, die schon Ziegen gesehen und mit ihnen gespielt hat. Zugleich ist ihr das Wort „Ziege" bekannt. Sie weiß jedoch nicht, daß dieses Wort zur Bezeichnung der ihr bekannten Tiere dient. Man könnte sagen, daß Silke über einen Begriff dieser Tiergattung verfügt, daß sie andererseits diesem Begriff jedoch kein Wort zuordnen kann. Silke könnte damit den gleichen Übersetzungsfehler wie Hans machen. Bei ihr hätte dies nicht mit dem mangelhaften Wissen von der Welt, sondern mit einer mangelhaften Kenntnis der deutschen Sprache zu tun. In der Einleitung zu Kap. V wird gezeigt werden, daß es prinzipiell nicht möglich ist, sprachliches Wissen von dem Weltwissen klar abzugrenzen, da diese beiden Arten von Kenntnissen voneinander abhängen. An dieser Stelle bedeutsam ist lediglich die Feststellung, daß einfach und selbstverständlich scheinende sprachliche Leistungen nur auf der Grundlage von Wissen von der Welt möglich sind, das mit der jeweiligen Sprache nichts oder nur wenig zu tun hat. Die Kenntnis der Sprache und das Weltwissen sind also zwei Arten von kognitiven Strukturen, die für das Verstehen der oben gegebenen Beispielsätze notwendig sind. Zusätzlich dazu muß man auch noch über ein System von Regeln verfügen, welche angeben, auf welche Weise das Wissen verwendet wird. Wie die Wissensinhalte, so lassen sich auch diese Regeln und die durch sie gesteuerten kognitiven Prozesse aufgliedern in sprachliche Regeln und Prozesse einerseits und in diejenigen Prozesse, die auf dem Weltwissen basieren. Die sprachlichen Regeln steuern etwa die Analyse und die Generierung von Sätzen, und mit Hilfe der Regeln der zweiten Art führen wir Deduktions- und Inferenzprozesse durch, welche zum Beispiel die Integration neuer Inhalte in bestehende Wissenstrukturen ermöglichen. Weiter unten soll gezeigt werden, daß auch diese beiden Arten von Prozessen in enger wechselseitiger Abhängigkeit voneinander stattfinden. Wie schon in der Gestaltpsychologie, so nimmt man auch in der neueren kognitiven Psychologie (ζ. B. Neisser, 1976) an, daß die auf das Subjekt eintreffenden Reize nicht passiv verarbeitet werden; die bestehenden Wissensinhalte spielen vielmehr eine aktive Rolle bei der Auswahl der Reize, welche vom kognitiven System verarbeitet werden, und bei deren Integration in größere Sinnzusammenhänge. Nun stellt sich die Frage, wie diese Strukturen und Prozesse organisiert
Kenntnis der Sprache und Wissen von der Welt
5
sein müssen, und wie sie beschrieben werden können, daß ein möglichst breiter Ausschnitt kognitiver Leistungen erklärt werden kann. Wie im ersten Abschnitt ausgeführt wurde, kann eine solche Beschreibung innerhalb einer psychologischen Theorie unabhängig von neuralen Strukturen geschehen; andererseits ist es jedoch wichtig, daß die Regeln und Wissensinhalte möglichst allgemein formuliert werden, so daß sie flexibel für die Erklärung von verschiedenen Leistungen benützt werden können. So wäre es beispielsweise nicht sinnvoll, Regeln aufzustellen, die lediglich für die sprachliche Analyse von Satzsubjekten angewendet werden; da Subjekte syntaktisch den Genitiv-, Dativ- und Akkusativobjekten verwandt sind, wäre es sinnvoller, allgemeine Regeln zu formulieren, die für die Analyse aller Nominalphrasen verwendet werden können. Ebenso wäre es nicht sinnvoll, als Teil des Weltwissens die Aussage zu formulieren, daß Frauen Geld brauchen, Kühe jedoch nicht. Eine solche Aussage könnte zwar bei der Analyse der ersten beiden Beispielsätze verwendet werden, sie ist jedoch so spezifisch, daß sie kaum beim Verstehen anderer Sätze gebraucht werden kann. Eine breitere Verwendbarkeit haben etwa die Aussagen, daß Menschen Tiere besitzen, und daß man Objekte, die man besitzt, veräußern kann. Solche allgemein formulierten Kenntnisse können allerdings meist erst dann verwendet werden, wenn man sie mit spezifischen Wissensinhalten in Beziehung setzt. In dem obigen Beispiel wäre dies durch die zusätzliche Information möglich, daß Kühe Tiere sind. Die Forderung, daß Wissensinhalte auf einer möglichst allgemeinen Ebene dargestellt werden sollen, kann nur dann erfüllt werden, wenn das W'eltwissen nicht in sprachlicher Form beschrieben wird. Wie in den Kapiteln IV und V ausführlicher gezeigt werden soll, bringt die Darstellung von Wissensinhalten in natürlichsprachlicher Form zwei Nachteile mit sich: Zum einen lassen sich dieselben Inhalte durch verschiedene Sätze repräsentieren. Dies hat zur Folge, daß man entweder jeden Inhalt mehrmals repräsentieren muß, oder aber, daß Regeln dafür angegeben werden müssen, wie die einzelnen Sätze in andere Sätze mit gleicher Bedeutung transformiert werden können. Zum anderen können in sprachlicher Form beschriebene Wissensinhalte lediglich für das Sprechen und Verstehen innerhalb einer bestimmten Sprache verwendet werden. Es ist jedoch wünschenswert und möglich, Weltwissen in einer Form zu repräsentieren, die für das Verstehen verschiedener Sprachen wie auch für andere kognitive Prozesse, ζ. B. das Planen von Handlungen, benützt werden kann.
6
Einleitung
3. Kognitive Psychologie und künstliche Intelligenz D o c h selbst dann, wenn unsere Kenntnis der Sprache und unser Weltwissen auf einer sehr allgemeinen E b e n e beschrieben werden, selbst dann sind diese Beschreibungen so komplex, daß sie kaum mehr überschaubar sind. Schon für eine detaillierte Analyse des Verstehens der oben gegebenen Beispielsätze müssen Hunderte von Regeln und Wissensinhalten formuliert werden, die zueinander in verschiedenen Beziehungen stehen. Es läßt sich daher kaum noch bestimmen, ob ein postuliertes Regelsystem tatsächlich eine bestimmte kognitive Leistung zu erklären in der Lage, und o b es frei von inneren Widersprüchen ist. Aus diesem Grunde ist im letzten J a h r z e h n t immer häufiger versucht worden, kognitive Theorien auf elektronischen Rechenanlagen zu programmieren. Die von der Theorie beschriebenen Regeln und Wissensinhalte werden dabei so transkribiert, daß das zu erklärende Verhalten vom Computer nachvollzogen werden kann. Die Verwendung von Computern als Instrumente zur Überprüfung kognitiver Theorien bringt kein grundsätzlich neues Element in die A r t der Theorienbildung; denn j e d e logisch beschreibbare und in sich widerspruchsfreie Theorie kann prinzipiell auf einem Computer programmiert werden (Turing, 1 9 5 0 ) . Trotzdem läßt sich b e o b a c h t e n , daß durch dieses Instrument gewisse inhaltliche Aspekte der Forschungen beeinflußt werden. S o ist man gezwungen, die postulierten Abläufe und Strukturen bis ins kleinste Detail hinein aufzuschlüsseln. Dies ist sehr mühsam, hat andererseits jedoch den Vorteil, daß alle in der Theorie implizierten Annahmen expliziert werden müssen. Dies ist gerade dann besonders wichtig, wenn selbstverständlich scheinende Prozesse erklärt werden sollen. S o findet man in der älteren Sprachpsychologie kaum Arbeiten darüber, welche Vorgänge beim Verstehen von Sätzen ablaufen; bei der Programmierung dieser Leistung auf einem Computer zeigt sich j e d o c h , daß dabei sehr komplexe Prozesse ablaufen müssen, welche bislang nicht erklärt werden konnten. Ein weiterer Einfluß des Instrumentes Computer auf die Art der psychologischen Theorienbildung rührt daher, daß gewisse theoretische Vorstellungen eleganter und leichter zu programmieren sind als andere. So sind Modelle, in denen unser Wissen als eine Struktur von diskreten Einheiten betrachtet wird, auf den heutigen Computern leichter zu programmieren, als alternative Ansätze, die Begriffe als kontinuierlich ineinander übergehende Entitäten beschreiben. Nun ist es weder außergewöhnlich, noch ist es abzulehnen, daß man bei der Wahl zwischen verschiedenen sonst gleichwertigen Theorien diejenige bevorzugt, die am einfachsten dargestellt werden k a n n :
Kognitive Psychologie und künstliche Intelligenz
7
Üblicherweise wird als Sprache zur Darstellung wissenschaftlicher Theorien eine Fachsprache mit mehr oder weniger klar definierter Terminologie gewählt. Obwohl man Programmiersprachen nicht mit natürlichen Sprachen gleichsetzen darf, sind beides Notationen, man könnte auch sagen: Kodierungen, mit denen kognitive Prozesse dargestellt werden können. Es besteht somit kein Grund zur Annahme, daß der Darstellbarkeit einer Theorie in der Notation „natürliche Sprache" eine größere Wichtigkeit zukommt als in der Notation „Programmiersprache". Welcher der beiden Notationen der Vorzug gegeben werden soll, kann erst dann entschieden werden, wenn zumindest in einer der beiden Notationen brauchbare Theorien kognitiver Prozesse existieren werden. Die Verwendung des Computers als Instrument psychologischer Forschung führte in den letzten Jahren dazu, daß die kognitive Psychologie sich in engem Zusammenhang mit einem anderen Wissenschaftszweig entwickelte, der sog. künstlichen Intelligenz. Die Zielsetzungen dieser beiden Disziplinen lassen sich klar unterscheiden: Während man sich in der kognitiven Psychologie um die Erklärung menschlichen Verhaltens bemüht, ist das Ziel der künstlichen Intelligenz, eines Zweiges der Computerwissenschaft, die Entwicklung intelligenter Maschinen. Dieser Unterschied kann am Beispiel der arithmetischen Fähigkeiten dargestellt werden. Man kann leicht Computerprogramme schreiben, durch die arithmetische Operationen, wie etwa die Multiplikation zweier dreistelliger Zahlen, sehr schnell ausgeführt werden. Für einen in der künstlichen Intelligenz arbeitenden Wissenschaftler wäre es absurd, ein komplizierteres Programm zu schreiben mit dem Ziel, daß die Maschine die gleichen Rechenfehler macht wie der Mensch. Andererseits kann das einfachere Rechenprogramm sicher nicht als psychologisches Modell für die Prozesse betrachtet werden, die im Menschen bei der Durchführung arithmetischer Operationen ablaufen. Der Unterschied zwischen den zwei Ansätzen kann an diesem Beispiel darum so klar gezeigt werden, weil das Problem des Vollzuges arithmetischer Operationen zumindest in einer der beiden Disziplinen, der künstlichen Intelligenz bzw. der Computerwissenschaft, befriedigend gelöst wurde. Bei anderen Problemen, so etwa dem Verstehen von Sprache, sind bislang jedoch weder in der künstlichen Intelligenz, noch in der kognitiven Psychologie brauchbare Modelle entworfen worden. Hier besteht das Ziel auch der psychologischen Forschung zunächst darin, überhaupt einen Ansatz zu entwickeln, mit dem das Verstehen von Sprache erklärt werden kann. Erst wenn ein solcher Ansatz besteht, wird die Frage sinnvoll, ob dieser psychologisch wertvoll ist. Vorher jedoch stellen sich für kognitive Psycholo-
8
Einleitung
gie und künstliche Intelligenz trotz der Verschiedenheit der Zielsetzungen die gleichen Probleme.
4. Zwei Forschungsstrategien: Computersimulation und experimentalpsychologische Methode Die gleiche Forschungsstrategie wie die künstliche Intelligenz haben allerdings nur diejenigen Bereiche der kognitiven Psychologie, in denen die entwickelten theoretischen Vorstellungen durch Computersimulation überprüft werden, und die sich um die Erklärung von komplexen Verhaltensweisen, wie beispielsweise des Verstehens von Sprache, bemühen. Daneben bestehen weiterhin Versuche, eine Theorie der kognitiven Tätigkeiten mit den Methoden der traditionellen Experimentalpsychologie zu erarbeiten. Bei diesem Ansatz bemüht man sich darum, aufgrund einer allgemeinen Theorie Variationen von kontrollier- und meßbaren abhängigen Variablen vorauszusagen. Eine bekannte Theorie dieser Art ist etwa die im folgenden Kapitel dargestellte Assoziationstheorie. Diese macht u. a. die Voraussage, daß beim Auswendiglernen einer Liste von unter sich gleichwertigen Elementen (ζ. B. von sinnlosen Silben) die Reproduktion verbessert wird, wenn die Aufeinanderfolge der Elemente bei verschiedenen Darbietungen gleichbleibt (Foppa, 1963). Solche und ähnliche Voraussagen können experimentell überprüft werden; so lange keine der experimentellen Beobachtungen den von der Theorie ableitbaren Voraussagen widerspricht, gilt die Theorie als experimentell bestätigt. Nun machen solche Theorien Voraussagen nur über einen sehr engen Bereich von Verhaltensweisen, die in der Regel lediglich in Laborexperimenten hergestellt werden können. In bezug auf andere, komplexere Verhaltensweisen, so etwa auf das Umgehen mit sinnvollem sprachlichen Material, macht diese Art von Theorien keine Voraussagen und kann daran auch nicht überprüft werden. Dies wird durch folgende Überlegung zu rechtfertigen versucht: Zunächst nimmt man an, daß komplexes menschliches Verhalten durch eine geringe Anzahl von einfachen Prozessen bestimmt wird. Diese Prozesse seien in außerexperimentellen Situationen darum nur schwer zu beobachten, weil das Verhalten hier durch die nicht kontrollierbare Lerngeschichte des Individuums bestimmt ist; die experimentelle Überprüfung der Theorie sei also nur in einer Situation möglich, in der von der individuellen Lerngeschichte abstrahiert werden kann. Im Gegensatz dazu werden bei den kognitionspsychologischen Arbeiten, welche sich der Computersimulation bedienen, komplexe und außerexperimentell beobachtbare Verhaltensweisen zu erklären
Zwei Forschungsstrategien
9
versucht. Dabei handelt es sich um Leistungen wie das richtige Erkennen der Pronomen in den oben gegebenen Beispielsätzen. Wir wissen sicher, daß diese Leistungen von fast allen Sprechern der deutschen Sprache richtig vollzogen werden, und es wäre deshalb nicht sinnvoll, dies durch ein Experiment zu überprüfen, dessen Ergebnis von vornherein gewiß ist. Nun stellt sich die Frage, welche dieser beiden Arten von Erfahrungen geeigneter sind, als Ausgangsdaten für die Entwicklung eines kognitiven Modelles zu fungieren. Eine sichere und definitive Antwort auf diese Frage wird erst dann möglich sein, wenn mit einem der beiden Ansätze ein brauchbares Modell entwickelt sein wird. Vorher kann man lediglich Vermutungen darüber anstellen, bei denen die Wichtigkeit der möglicherweise relevanten Faktoren gegeneinander abgewogen wird: Bei den experimentell gewonnenen Daten handelt es sich in der Regel um numerische Werte, die statistisch miteinander oder mit theoretischen Erwartungswerten verglichen werden. Im Gegensatz dazu werden die Beobachtungen, welche durch den Computer simuliert werden, normalerweise nicht numerisch ausgedrückt. Eine typische Beschreibung eines beobachtbaren Sachverhaltes ist hier etwa der im zweiten Abschnitt formulierte Satz: ,,. . . wird jeder der deutschen Sprache mächtige Leser die beiden Sätze so verstehen, daß durch das Pronomen ,sie' im ersten Satz die Bäuerin und im zweiten Satz die Kuh bezeichnet wird". Das Fehlen von numerischen Werten führte bei Vertretern des experimentell ausgerichteten Ansatzes zu dem falschen Eindruck, daß bei den um Computersimulation bemühten Arbeiten die theoretische Analyse des Verhaltens im Vordergrund stehe, während der klassische experimentelle Ansatz sich stärker um empirische Voraussagen bemühe (Groner, Keller & Menz, 1977). Diese Auffassung basiert auf der Einstellung, daß experimentell gewonnenen Beobachtungen wissenschaftlich eine größere Dignität zukomme als Alltagserfahrungen. Dies scheint mir aus folgenden Gründen heraus unzutreffend zu sein: In psychologischen Experimenten werden die der Versuchsperson verfügbaren Reize und Informationen so weit eingeschränkt, daß sie neue und im Alltag nicht gebrauchte Strategien zur Problembewältigung aufbauen muß. Zudem führt eine Verminderung der Reize nicht zu einer Vereinfachung der Prozesse, mit denen die Versuchsperson auf diese Reize reagiert. So benötigt eine Versuchsperson zum Erlernen von zehn sinnlosen Silben einen recht hohen zeitlichen Aufwand; der Inhalt auch von längeren sinnvollen Texten kann jedoch schon nach einmaligem Durchlesen korrekt reproduziert werden. Man kann deshalb annehmen, daß die in der außerexperimentellen Situation, d. h. beim Lesen des sinnvollen Textes ablaufenden Prozesse einfacher und leichter zu analy-
10
Einleitung
sieren sind, als die beim experimentellen Lernen von sinnlosen Silben ablaufenden Vorgänge. Die Analyse solcher alltäglicher Leistungen scheint damit für die Entwicklung einer allgemeinen Theorie der kognitiven Fähigkeiten der erfolgversprechendere Ansatz zu sein als das klassische Experimentieren. Daraus darf allerdings nicht gefolgert werden, psychologische Experimente seien in j e d e m Fall sinnlos. Theorien kognitiver Prozesse sollten im idealen Fall nicht nur Alltagserfahrungen, sondern auch experimentell gewonnene Beobachtungen erklären. Die experimentelle Überprüfung einer Theorie wird j e d o c h erst dann lohnend, wenn durch diese Theorie auch Verhaltensweisen erklärt werden können, die außerhalb von Experimenten beobachtbar sind.
5. Zur Relevanz kognitiver Modelle In noch stärkerem Maße als bei anderen Zweigen der Psychologie wird bei der Computersimulation kognitiver Leistungen die Frage nach dem Nutzen der zu entwickelnden Modelle gestellt. Dies liegt zum Teil sicher daran, daß die Vorstellung „intelligenter" Maschinen, welche einen breiten Bereich von bislang dem Menschen vorbehalte nen intellektuellen Leistungen vollziehen können, etwas erregendes hat. Für den einen versprechen diese Entwicklungen die Abschaffung der A r b e i t , für den anderen bedeuten sie die Unterwerfung des Menschen unter eine sinnlos gewordene Technologie. Eine in Vielem überzeugende Darstellung dieses zweiten Aspektes findet sich in Weizenbaum ( 1 9 7 6 ) . Sicher ist, daß die Forschungen im Bereich der künstlichen Intelligenz neue Technologien ermöglichen werden, welche unsere Lebensweise und unsere Gesellschaftsstruktur in vergleichbarem Maße verändern werden, wie die durch die Entwicklung der Dampfmaschine ermöglichte industrielle Revolution. Neben der Entwicklung neuer Technologien erweitert diese Art von kognitiven Modellen unser Verstehen menschlichen Verhaltens. Auch dieser Aspekt weckt häufig negative Vorstellungen. Zum einen wird bestritten, daß sich menschliches Verhalten als ein mechanischer A b l a u f von logisch beschreibbaren und auf einer Maschine nachbildbaren Prozessen erklären lasse. Dieser Einwand betrifft j e d o c h den die Computersimulation benutzenden Ansatz nicht in stärkerem Maße als die anderen Zweige der Psychologie, die empirisch arbeiten, und die sich um eine objektivierbare Überprüfbarkeit der postulierten Gesetze bemühen; denn in beiden Fällen werden Verhaltensabläufe und die sie bedingenden Mechanismen in der F o r m von Kalkülen beschrieben. Die Frage ist also, wie weit eine mit der naturwis-
Zur Relevanz kognitiver Modelle
11
senschaftlichen Methodik arbeitende Psychologie menschliches Verhalten erklären kann. Allein der Erfolg oder Mißerfolg dieser Wissenschaft kann eine Antwort auf diese Frage geben. Zum anderen wird häufig die Befürchtung ausgedrückt, daß Fortschritte in der kognitiven Psychologie zu einer vollständigen Manipulierbarkeit des Menschen führten, von der möglicherweise in einer den Interessen der Betroffenen widersprechenden Weise Gebrauch gemacht würde. Wie Neisser (1976) ausführt, wäre eine solche Manipulierbarkeit selbst dann nicht gegeben, wenn alle Gesetzmäßigkeiten kognitiver Prozesse bis hin zur kleinsten Einzelheit aufgeschlüsselt wären. Zudem müßte man alle individuell spezifischen Kenntnisse und Wissensinhalte der jeweiligen Person kennen; denn auch dadurch wird das Verhalten und die Möglichkeiten zu seiner Veränderung bestimmt. Eine dermaßen genaue Kenntnis einer anderen Person ist jedoch nicht realisierbar. Trotzdem wird eine Erweiterung unserer Kenntnisse der kognitiven Prozesse natürlich nicht ohne Einfluß auf zwischenmenschliche Prozesse außerhalb des Labors bleiben. So können sie etwa dazu beitragen, den Erwerb von neuen Kenntnissen in der Schule oder psychotherapeutische Prozesse zu erleichtern.
II. ASSOZIATIVE STRUKTUREN
1. Lernen u n d die Struktur des Gedächtnisses Wie schon im ersten Abschnitt der Einleitung ausgeführt wurde, werden Begriffe wie „kognitive Struktur", „Begriff", „Wissen", „Gedächtnis" usw. als hypothetische Konstrukte betrachtet, die dazu dienen, sprachliches Verhalten zu erklären. In diesem und in den folgenden Kapiteln soll der Inhalt dieser Konstrukte differenziert und beschrieben, ihre Nützlichkeit für die Erklärung sprachlichen Verhaltens analysiert und ihre im Rahmen dieser Aufgabe beste Verwendung festgelegt werden. Eine solche oder ähnliche Betrachtungsweise findet sich implizit oder explizit in den meisten neueren Arbeiten der experimentellen und kognitiven Psychologie oder der künstlichen Intelligenz. Daraus folgt, daß Begriffe und Bedeutungen nicht meßbar sind, sondern daß sie auf der Grundlage von Verhaltensbeobachtungen erschlossen, bzw. konstruiert werden müssen. Das Verhalten, welches in der experimentellen Psychologie am häufigsten für die Erschließung kognitiver Strukturen benützt wurde, ist das Erlernen von sprachlichem Material. Dabei wird von folgenden allgemeinen Vorstellungen über den Lernprozeß ausgegangen: Beim Erlernen von Wörtern, Sätzen oder Texten handelt es sich nicht darum, Kopien oder Abbilder des dargebotenen Materials ins Gedächtnis zu übertragen. Vielmehr wird das zu lernende Material mit den schon vor dem Experiment im Gedächtnis vorhandenen Inhalten in Beziehung gesetzt. Wenn eine Versuchsperson (abgek. Vp) beispielsweise eine Liste von Wörtern auswendiglernt, dann prägt sie sich nicht die Wörter ein, sondern sie lernt, daß diese ihr schon vorher bekannten Wörter in der zu lernenden Liste vorkommen. Tulving (1972) unterscheidet in diesem Zusammenhang zwischen der episodischen und der semantischen Gedächtniskomponente: Das semantische Gedächtnis enthält alle diejenigen Inhalte, die von den einzelnen Erfahrungen losgelöst sind, und im episodischen Gedächtnis werden die erinnerten Spuren einzelner Ereignisse gespeichert; dazu gehört beispielsweise die Erinnerung, welche Wörter in einem bestimmten Experiment gelernt werden mußten. Auf die Problematik dieser Unterscheidung soll im vierten Abschnitt des Kapitels VII näher eingegangen werden.
Lernen und die Struktur des Gedächtnisses
13
Da also das Erlernen von sprachlichem Material durch Inhalte des semantischen Gedächtnisses mitbestimmt wird, können die in Lernexperimenten beobachteten Leistungen dazu benützt werden, Rückschlüsse über die Struktur des Gedächtnisses zu erhalten. Dabei geben sowohl die Schwierigkeit des Erlernens von Wörtern oder Wortgruppen als auch die Art der Fehler beim Erinnern Hinweise auf die Zusammenhänge zwischen den Repräsentationen der zu lernenden Wörter im Gedächtnis. In den folgenden Ausführungen wird wiederholt auf Lernexperimente mit sprachlichem Material eingegangen, und es ist darum sinnvoll, die wichtigsten der dabei verwendeten Versuchstechniken kurz darzustellen: Die Darbietung des Lernmaterials geschieht entweder akustisch, d. h. durch Vorlesen oder Vorspielen eines Tonbandes, oder visuell. Visuell kann das Material entweder simultan, d. h. der gesamte Inhalt gleichzeitig, oder sukzessiv, d. h. in zeitlicher Aufeinanderfolge, dargeboten werden. Die sukzessive Darbietung hat den Vorteil, daß der Versuchsleiter (abgek. VI) kontrollieren kann, wie viel Zeit die Vp für das Einprägen jedes Elementes maximal aufwendet. In der Regel wird die Zeitspanne, während derer jedes Element bei der sukzessiven Darbietung gezeigt wird, vom VI bestimmt; beim Erlernen von Wortlisten beträgt sie meistens eine oder zwei Sekunden pro Wort. In manchen Versuchen kann die Geschwindigkeit der Darbietung auch von der Vp gesteuert werden; in diesem Fall sagt man, die Darbietung sei „self-paced". Eine früher sehr geläufige Art der Darbietung bildet das sog. Paarlernen. Dabei ist das Lernmaterial in Paaren angeordnet. Bei der Überprüfung wird den Vpn jeweils lediglich das erste Element jedes Paares dargeboten und sie müssen dessen zweites Glied erinnern. In Lernexperimenten können prinzipiell zwei Arten von Leistungen gemessen werden. Zum einen kann das Material unabhängig von den Leistungen der Vpn ein oder mehrere Male dargeboten werden, wobei die Anzahl der Darbietungen vom VI vorher festgelegt wurde. Die gemessene Leistung ist dann die Anzahl der Elemente, die während dieser Durchgänge von den Vpn eingeprägt werden konnten. Zum anderen kann man das Material so häufig darbieten, bis es von der Vp vollständig erinnert wird. In diesem Fall muß das Erinnern der Vp nach jeder Darbietung neu überprüft werden. Dieses zweite Verfahren hat den Nachteil, daß während der Prüfungen vom VI nicht kontrollierbare Lernprozesse stattfinden. Auch bei der Prüfung des Vergessens sind zwei Vorgehen möglich: Zum einen kann man messen, wie viel die Vp zwischen der Prüfung unmittelbar nach dem Lernversuch und der Prüfung nach einem be-
14
Assoziative Strukturen
stimmten Intervall vergessen hat; zum anderen kann man feststellen, wie viele zusätzliche Lerndurchgänge die Vpn nach dem Vergessensintervall benötigt, daß sie die gleiche Leistung wie nach dem Lernversuch erreicht. Der Grad der Einprägung kann durch zwei Methoden überprüft werden: Bei der freien Reproduktion muß die Vp alle Elemente, die sie erinnern kann, wiedergeben. Dabei können vier Variablen bestimmt werden: Die Summe der richtig reproduzierten Elemente, die zur Wiedergabe benötigte Zeit, Abweichungen in der Aufeinanderfolge der erinnerten Elemente bei der Darbietung und bei der Reproduktion und die Art der falsch reproduzierten Wörter, der sog. Intrusionen. Beim Wiedererkennen wird der Vp eine Liste von Elementen, die sog. Prüfliste, vorgelegt, und sie muß angeben, welche Elemente der Prüfliste in der Lernliste vorkamen. Diejenigen Wörter der Prüfliste, die in der Lernliste nicht vorkamen, werden als Füller bezeichnet. Die Reaktionen der Vpn lassen sich dabei in folgende vier Klassen einteilen: 1. Korrektes Wiedererkennen: Ein altes Element wird von der Vp korrekterweise als alt bezeichnet; 2. korrekte Ablehnung: Ein neues Element wird von der Vp korrekterweise als neu bezeichnet; 3. „miss" (engl, für Verpassen): ein altes Element wird von der Vp fälschlicherweise als neu bezeichnet; und 4. „false alarm" (engl, für falscher Alarm): Ein neues Wort wird von der Vp fälschlicherweise als alt bezeichnet. Dieser Versuchsaufbau ermöglicht es n u n , durch Treffer- und Fehleranalysen Rückschlüsse auf die beim Experiment ablaufenden Prozesse zu gewinnen. Eine besondere Bedeutung kommt dabei den false alarms zu: Wenn ein neues Element einem alten Element ähnlich ist, und wenn die false alarms bei diesem neuen Element gleichgroß oder fast gleichgroß sind wie die Treffer bei dem alten Wort, dann kann man vermuten, daß die beiden Wörter im Gedächtnis ähnlich repräsentiert sind. Diese Überlegungen bildeten den Ausgangspunkt eines Experimentes von Baddeley (1964), welches einen wichtigen Hinweis auf die Struktur des sprachlichen Gedächtnisses liefert. Zwei Gruppen von Vpn mußten jeweils die gleiche Liste von Wörter lernen und wurden mit einem Wiedererkennungsversuch geprüft. Die Prüfliste enthielt zwei Arten von Füllerwörtern: Einige von ihnen klangen ähnlich wie die Wörter der Lernliste und die anderen waren denjenigen der Lernliste inhaltlich verwandt. Enthielt beispielsweise die zu lernende Liste das Wort „Tisch",
15
Lernen und die Struktur des Gedächtnisses
dann hätten in der Prüfliste das lautähnliche Wort „Fisch" oder das inhaltsähnliche Wort „Stuhl" stehen können. Bei der ersten Gruppe von Vpn fand die Prüfung unmittelbar nach dem Lernen der ersten Liste statt, bei der zweiten Gruppe von Vpn bestand zwischen der Einprägung und der Vorgabe der Prüfliste ein zeitliches Intervall. Die Analyse der von den Vpn gemachten Fehler ergab folgendes Muster: Die Vpn der ersten Gruppe, die unmittelbar nach der Einprägung geprüft wurden, verwechselten häufig Wörter aus der Lernliste mit ähnlich klingenden Wörtern aus der Prüfliste; enthielt beispielsweise die Lernliste das Wort „Tisch", dann gaben sie an, daß das in der Prüfliste vorkommende Wort „Fisch" dort vorgekommen sei. Andererseits verwechselten die Vpn dieser Gruppe nur selten im Klang verschiedene, jedoch inhaltlich verwandte Wörter. Bei der zweiten Gruppe von Vpn, bei denen zwischen der Einprägung und der Vorgabe der Prüfliste ein zeitliches Intervall eingeschaltet war, waren die Resultate umgekehrt: Während Verwechslungen zwischen ähnlich klingenden Wörtern relativ selten vorkamen, geschah es häufig, daß die Vpn inhaltlich verwandte Wörter konfundierten. Dieser und ähnliche Versuche von Baddeley (1966a, b), sowie eine große Anzahl weiterer Experimente legen es nahe, das Gedächtnis als eine Struktur zu beschreiben, welche aus unterschiedlichen Komponenten zusammengesetzt ist. Eine dieser Komponenten ist das sog. Kurzzeitgedächtnis (abgek. KZG), in welchem für eine Dauer von höchstens wenigen Minuten die akkustischen Eigenschaften der wahrgenommenen Reize gespeichert werden. Eine zweite Komponente ist das sog. Langzeitgedächtnis (abgek. LZG), welches das langfristige Erinnern der bedeutungsmäßigen, inhaltlichen Aspekte der wahrgenommenen Reize ermöglicht. Waugh & Norman (1965), Norman & Rumelhart (1970), Wickeigren (1970), Reitman (1970) und andere Autoren entwickelten eine Reihe von untereinander ζ. T. recht ähnlichen Modellen, in denen die Gliederung des Gedächtnisses und die bei der Speicherung ablaufenden Prozesse formal beschrieben werden. Abb. 1: Das Gedächtnismodell von Atkinson & Shiffrin (1968) memorieren
vergessen
vergessen
16
Assoziative Strukturen
Eines der bekanntesten dieser Modelle, welches von Atkinson & Shiffrin (1968) entwickelt wurde, ist schematisch in Abb. 1 dargestellt. Bei diesem Modell wird angenommen, daß alle visuell dargebotenen Reize, dabei kann es sich um geschriebene Buchstaben oder auch um irgendwelche sichtbaren Objekte handeln, sich zunächst für den Bruchteil einer Sekunde in einem sog. ikonischen Speicher oder Ultrakurzzeitgedächtnis befinden. Dieser Speicher wird häufig auch als Sperling-Gedächtnis bezeichnet, da durch ihn die folgende Beobachtung von Sperling ( 1 9 6 0 ) erklärt werden kann: Den Vpn werden gleichzeitig verschiedene, in einem Schachbrettmuster angeordnete Reize, ζ. B. einzelne Zahlen, während 5 0 Millisekunden dargeboten, Unmittelbar danach zeigt man ihnen einen Reiz, der sich an derselben Position im Gesichtsfeld befindet, wie einer der vorher gezeigten Reize. Die Vpn müssen darauf angeben, ob der zweite Reiz mit demjenigen identisch ist, der bei dem zuerst gezeigten Muster an der entsprechenden Position stand. Es zeigte sich, daß die Vpn zu dieser Leistung imstande sind. Wird diese Aufgabe jedoch nur leicht modifiziert, dann kann die Leistung der Vpn auf das Zufallsniveau abfallen. Wenn beispielsweise das zuerst gezeigte Reizmuster aus Kleinbuchstaben besteht und der darauffolgende Einzelreiz ein Großbuchstabe ist, dann kann die Gleichheit zwischen den Buchstaben nicht festgestellt werden. Auch wenn zwischen der Darbietung des ersten Reizmusters und des Prüfreizes auch nur kurzfristig ein verschiedenes visuelles Muster eingeblendet wird, sind die Vpn zu der geforderten Leistung nicht mehr fähig. Diese Ergebnisse können durch die Annahme eines ikonischen Gedächtnisses erklärt werden, in welchem für eine sehr kurze Zeit die visuellen Eigenschaften der Reize aufbewahrt werden, wobei deren weitergehende Analyse — ζ. B. die Zuordnung von Groß- und Kleinbuchstaben — in diesem Stadium nicht möglich ist. Visuell wahrgenommene Reize werden aus dem ikonischen Gedächtnis und akkustische Reize direkt ins KZG aufgenommen. Man nimmt an, daß im KZG lediglich eine beschränkte Anzahl von Elementen simultan gespeichert werden können, nach Miller ( 1 9 5 6 ) ungefähr sieben, und daß die Elemente nur so lange in diesem Speicher bleiben, als man ihnen bewußte Aufmerksamkeit schenkt. Diese Charakteristika des KZG zeigen sich etwa dann, wenn man eine bislang nicht bekannte Telephonnummer nachgeschaut hat, und diese dann, bis man sie gewählt hat, vor sich hinspricht. Unterbricht man diesen als memorieren bezeichneten Prozeß, dann vergißt man die Nummer sofort. Wenn man versucht, sich mehr Elemente einzuprägen, als im KZG gleichzeitig gespeichert werden können, dann werden nach Atkinson & Shiffrin die im KZG residierenden durch die
Lernen und die Struktur des Gedächtnisses
17
neu eintreffenden Elemente verdrängt. Wie Brown ( 1 9 5 4 ) und Peterson & Peterson ( 1 9 5 9 ) gezeigt haben, kann man alle sich im KZG befindlichen Elemente dadurch löschen, daß man von der Vp eine Tätigkeit fordert, bei der sie laut sprechen muß. Eine solche, in Lernexperimenten häufig benutzte Tätigkeit ist etwa das Rückwärtszählen von dreistelligen Zahlen. In dem Modell von Atkinson & Shiffrin wird postuliert, daß Elemente nur dann ins LZG aufgenommen werden können, wenn sie sich gleichzeitig im KZG befinden. Die Wahrscheinlichkeit, daß ein Element ins LZG transferiert wird, ist dabei proportional zu der Zeitspanne, während derer dieses Element im KZG residiert. Lernt eine Vp also eine Liste von Wörtern auswendig, dann wird die Anzahl der im LZG gespeicherten Wörter unabhängig von der Geschwindigkeit sein, mit der die Wörter bei der Darbietung aufeinanderfolgen; zugleich wird jedoch die Wahrscheinlichkeit, daß ein bestimmtes Wort ins LZG transferiert wird, mit zunehmender Geschwindigkeit der Darbietung linear abnehmen. Wie Underwood ( 1 9 7 0 ) zeigen konnte, ist diese Regel allerdings nicht in allen Fällen gültig. Das oben besprochene Experiment von Baddeley ( 1 9 6 4 ) zeigt, daß es sich beim Übergang eines Elementes vom KZG ins LZG nicht um einen Prozeß handelt, bei dem im LZG eine Kopie der Gedächtnisspur im KZG aufgebaut wird. Die Repräsentation beispielsweise des Wortes „Schimmel" ist im KZG die gleiche, wenn damit ein Schimmelpilz oder ein weißes Pferd bezeichnet wird. Im LZG wird jedoch für jede dieser beiden Bedeutungen eine verschiedene Gedächtnisspur aufgebaut. Andererseits hätten die beiden synonymen Wörter „Pferd" und „Gaul" im LZG gleiche oder ähnliche Repräsentationen. Atkinson & Shiffrin beschrieben die Verarbeitung von Reizen im Gedächtnis als einen gerichteten Prozeß, bei dem der Reiz zunächst vom ikonischen Speicher in, das KZG und darauf ins LZG übertragen wird. Dabei vernachlässigten sie, daß dieser Prozeß in allen seinen Stadien durch Inhalte aus dem LZG giesteuert wird. Dies zeigt sich etwa in dem von Lazarus 8c McCleary (1951), Dixon ( 1 9 5 8 ) , Brown ( 1 9 6 1 ) u . a . beschriebenen Phänomen der sog. Wahrnehmungsabwehr: Bei der kurzfristigen visuellen Vorgabe von Wörtern läßt sich eine minimale Darbietungszeit bestimmen, welche für das richtige Erkennen des Wortes durch die Vp benötigt wird. Diese Zeitspanne ist nun bei sozial tabuisierten Wörtern („ficken", „ F o t z e " usw.) bedeutend höher als bei emotional neutralen Wörtern. Dieses Ergebnis muß so interpretiert werden, daß schon die Aufnahme eines Wortes ins KZG von dem im LZG gespeicherten Wissen über die Bedeutung und soziale Akzeptierbarkeit dieses Wortes mitbestimmt wird. Trotz dieser Einseitigkeit können durch das Modell von Atkinson
Assoziative Strukturen
18
& S h i f f r i n eine g r o ß e Zahl von e x p e r i m e n t e l l e n B e o b a c h t u n g e n sinnv o l l i n t e r p r e t i e r t w e r d e n , u n d es ist h e u t e u n b e s t r i t t e n , d a ß visuelle, p h o n e t i s c h e u n d b e d e u t u n g s m ä ß i g e A t t r i b u t e d e r R e i z e d u r c h verschiedene kognitive Teilsysteme analysiert werden. Z u d e m bestehen a u c h p h y s i o l o g i s c h e H i n w e i s e , d i e e i n e d e r a r t i g e G l i e d e r u n g des G e dächtnisses nahe legen. S o f ü h r t e n B a r o n d e s &c C o h e n ( 1 9 6 6 , 1 9 6 8 ) V e r s u c h e d u r c h , in d e n e n M ä u s e das A u s w e i c h e n v o n e l e k t r i s c h e n S c h l ä g e n l e r n t e n , ind e m sie sich in e i n e m e i n f a c h e n L a b y r i n t h in e i n e b e s t i m m t e R i c h tung bewegten. E i n Teil der Tiere erhielt e n t w e d e r vor oder während o d e r n a c h d e m V e r s u c h S u b s t a n z e n i n j i z i e r t , die d e n A u f b a u v o n E i w e i ß m o l e k ü l e n i m O r g a n i s m u s v e r h i n d e r n . D a b e i z e i g t e s i c h , d a ß das E r l e r n e n d e r V e r m e i d u n g s r e a k t i o n d u r c h diese I n j e k t i o n e n n i c h t b e e i n f l u ß t wurde. G e s c h a h die I n j e k t i o n vor dem V e r s u c h und wurde das B e h a l t e n d e r V e r m e i d u n g s r e a k t i o n l ä n g e r e Z e i t n a c h d e m L e r n v e r s u c h ü b e r p r ü f t , d a n n w a r die L e i s t u n g d e r T i e r e j e d o c h s i g n i f i k a n t s c h w ä c h e r als in e i n e m K o n t r o l l v e r s u c h , in w e l c h e m d e n T i e r e n p h y siologisch neutrale Kochsalzlösung injiziert wurde. Barondes ( 1 9 7 0 ) interpretiert diese Ergebnisse durch die A n n a h m e von zwei G e d ä c h t n i s k o m p o n e n t e n . D i e erste K o m p o n e n t e , das K Z G , w e l c h e s u n m i t t e l b a r n a c h d e m L e r n v e r s u c h g e p r ü f t w i r d , ist v o n d e r B i l d u n g v o n n e u e n E i w e i ß m o l e k ü l e n im G e h i r n u n a b h ä n g i g . B e i d e r z w e i t e n K o m p o n e n t e , d e m L Z G , w i r d die G e d ä c h t n i s s p u r d u r c h E i w e i ß m o l e k ü l e geb i l d e t , die in d e n S y n a p s e n die E r r e g u n g s ü b e r t r a g u n g z w i s c h e n verschiedenen Nervenzellen steuern. Deshalb beeinflußt nach Barondes die U n t e r b i n d u n g der E i w e i ß s y n t h e s e lediglich das langfristige G e d ä c h t n i s u n d n i c h t die L e i s t u n g w ä h r e n d o d e r u n m i t t e l b a r n a c h d e r Einprägung. A l l e r d i n g s u n t e r s c h e i d e t sich d i e d u r c h p h y s i o l o g i s c h e E x p e r i m e n t e g e s c h ä t z t e D a u e r des K Z G e r h e b l i c h v o n der Z e i t s p a n n e des K Z G , die b e i m sprachlichen Lernen b e o b a c h t e t wird. Bei B a r o n d e s & C o h e n ( 1 9 6 7 ) b e w i r k t e die V e r h i n d e r u n g der E i w e i ß s y n t h e s e erst s e c h s S t u n d e n nach dem Lernversuch eine deutliche A b s c h w ä c h u n g der L e i s t u n g . B e i V e r s u c h e n z u m s p r a c h l i c h e n L e r n e n i s t d e r I n h a l t des K Z G schon wenige Sekunden oder höchstens Minuten nach L e m v e r s u c h gelöscht (Wickeigren & N o r m a n , 1 9 6 6 ) . E s erscheint h a l b s i n n v o l l , M o d e l l e wie d a s j e n i g e v o n A t k i n s o n & S h i f f r i n i m n e d e r A u s f ü h r u n g e n im e r s t e n A b s c h n i t t d e r E i n l e i t u n g n i c h t als b i l d n e u r a l e r P r o z e s s e , s o n d e r n als p s y c h o l o g i s c h e K o n s t r u k t e zu stehen, durch welche werden können.
beobachtete
Verhaltensweisen
dem desSinAbver-
interpretiert
Der Assoziationsversuch
19
2. Der Assoziationsversuch In dem im letzten Abschnitt beschriebenen Experiment von Baddeley (1964) war es den Vpn ζ. T. nicht möglich, im LZG gespeicherte Wörter von anderen Wörtern mit verwandten Bedeutungen zu unterscheiden. Das Experiment zeigt jedoch nicht, welche Arten von inhaltlichen Beziehungen zu solchen Verwechslungen führen; der VI hatte beim Erstellen der Lern- und Prüflisten intuitiv bestimmt, bei welchen Wortpaaren es sich um inhaltlich verwandte Wörter handle, und die Resultate des Experimentes zeigten, daß die von ihm postulierten Ähnlichkeiten das Verhalten der Vpn beeinflussen. Ein solches Vorgehen ist jedoch nicht in jedem Fall möglich. Nehmen wir an, in dem beschriebenen Experiment hätten die vom VI bestimmten inhaltlichen Ähnlichkeiten zwischen den Wörtern keinen Einfluß auf das Verhalten beim Wiedererkennen ausgeübt. Ein solches Ergebnis könnte auf zwei verschiedene Ursachen zurückgeführt werden. Zum einen wäre es möglich, daß inhaltlich verwandte Wörter beim Wiedererkennen nicht häufiger verwechselt werden als beliebige Wortpaare. Zum anderen könnte das Fehlen eines solchen Effektes auch dadurch bedingt sein, daß die vom VI als inhaltlich verwandt bestimmten Wörter von den Vpn nicht als einander ähnlich wahrgenommen werden. Daß die vom VI postulierten Ähnlichkeiten zwischen Wörtern nicht unbedingt mit den Einschätzungen der Vpn übereinstimmen müssen, zeigen Experimente zum Erlernen von kategorisierten Wortlisten. Dabei handelt es sich um Listen, deren Elemente in Gruppen von Wörtern mit je einem gemeinsamen Oberbegriff gegliedert werden können. Solche Listen sind leichter zu lernen als Listen von inhaltlich nicht verwandten Wörtern. Zudem tendieren die Vpn dazu, Gruppen von verwandten Wörtern unmittelbar nacheinander zu reproduzieren, auch wenn sie bei der Einprägung nicht aufeinanderfolgten (Bousfield, 1953; Bousfield, Cohen & Whitmarsh, 1958). Wie bei dem Versuch von Baddeley (1964), so wird auch bei diesen Experimenten die Ähnlichkeit zwischen den Wörtern üblicherweise vom VI vor dem Experiment bei der Konstruktion der Lernliste intuitiv bestimmt. Mandler (1966) modifizierte dieses Vorgehen, indem er die zu lernenden Listen von den Vpn selbst in Gruppen von inhaltlich verwandten Wörtern kategorisieren ließ. Bei der darau ff olgenden Reproduktion konnten unmittelbare Aufeinanderfolgen von Wörtern der gleichen Kategorien in noch stärkerem Maße beobachtet werden, als wenn die Kategorien vom VI festgesetzt waren. Zudem erhöhte sich bei dem Vorgehen von Mandler auch die Summe richtig reproduzierter Wörter. In der klinischen Psychologie wurde das Phönomen, daß verschie-
20
Assoziative Strukturen
dene Vpn die Beziehungen zwischen Wörtern unterschiedlich einschätzen, schon viel früher untersucht als in der experimentellen Lernpsychologie. Dabei versuchte man, aufgrund der für das einzelne Subjekt spezifischen Verbindungen zwischen Wörtern Rückschlüsse auf das Denken und Erleben dieses Subjektes zu erhalten. Der zu diesem Zweck von Jung (1906) entwickelte Assoziationsversuch hat folgenden Aufbau: Der Vp wird eine Liste von Wörtern, die sog. Reizwörter, vorgelesen, und sie hat die Aufgabe, nach jedem vorgelesenen Wort spontan ein anderes Wort zu nennen, das ihr in den Sinn kommt. Der VI registriert dabei sowohl das von der Vp geäußerte Wort, die sog. assoziative Antwort, als auch die zwischen dem Vorlesen und der Antwort verstrichene Zeitspanne. In einer Modifikation dieses Versuches, der kontinuierlichen Assoziation, muß die Vp nach jedem dargebotenen Wort nicht eines, sondern eine Sequenz von assoziativen Antworten produzieren. Auf der Grundlage der Beziehungen zwischen den einzelnen Reizen und den dazu geäußerten Antworten gliederte Jung die Assoziationen in sieben Klassen, von denen zwei besonders wichtig sind. Bei den inneren Assoziationen besteht zwischen Reiz und Antwort eine starke inhaltliche Beziehung. Im Gegensatz dazu spielen die Bedeutungen der Wörter bei den äußeren Assoziationen eine untergeordnete Rolle. Ausschlaggebend sind hier das gemeinsame Auftreten von Reiz und Antwort in der Sprache oder von den durch sie bezeichneten Objekten in der Welt. Der Unterscheidung zwischen inneren und äußeren Assoziationen entspricht die schon von Wundt (1883) vorgenommene Unterteilung von internalen und externalen Assoziationen. Erstere basieren nach Wundt auf einem Denkprozeß, während letztere aufgrund wahrgenommener Beziehungen in der Welt entstehen. Tabelle 1 gibt einen Uberblick über die von Jung & Ricklin (1906) aufgestellte Klassifizierung. Diese Einteilung ist in verschiedenen Punkten mangelhaft. Zum einen werden Wortpaare, bei denen die gleiche inhaltliche Beziehung besteht, unter verschiedene Kategorien Tab. 1: Klassifizierung der Assoziationen nach Jung & Ricklin (1906) prozentuale Häufigkeit I.
Innere Assoziationen Koordination zw. Reiz und Antwort Beiordnung Unterordnung Oberordnung Kontrast
Beispiel
19.6 Kirsche — Apfel Baum — Buche Katze — Tier süß — sauer
21
Der Assoziationsversuch Prädikative Beziehung Substantiv und Adjektiv Substantiv und Verb Bestimmung von Ort, Zeit Mittel und Zweck Definitionen od. Erklärungen Kausale Abhängigkeit II.
III.
IV.
Äußere Assoziationen Koexistenz Identität Sprachlich-motorische F o r m e n eingeübte sprachl. Verbindung Sprichwörter und Zitate Wortzusammensetzungen und -Veränderungen vorzeitige Reaktion (die A n t w o r t bezieht sich lediglich auf den ersten Teil des Reizwortes Interjektionen Klangreaktionen Wortergänzung Klang Reim Restgruppe Mittelbare Assoziationen (die Beziehung zw. Reiz und A n t w o r t ist durch ein drittes Wort vermittelt) sinnlose Reaktion fehlende Reaktion Wiederholung des Reizwortes
V.
Egozentrische Reaktion
VI.
Perseveration (die Antwort steht in Beziehung zu einem früher gegebenen Reizwort)
VII.
Wiederholung einer früher gegebenen A n t w o r t
18.7 Schlange — giftig Harz - klebt essen — Mittag Türe — Hauptwort 1.0
16.0 6.3 26.5
Schmerz — Tränen
Schüler — Lehrer großartig — prächtig dunkel — hell Glück — Glas Tisch — Bein dunkelrot — hell
stinken — pfui
1.1 2.2 .8
Wunder — bar rosten — Roastbeef Herz — Schmerz
1.2
weiß — weit
.3 1.5 .1
1.7
tanzen — mag ich nicht Deckel — Kiste
1.2
Ratte — Korb
9.1
eingeordnet. Ein Beispiel hierfür sind etwa die Paare „süß — sauer" und „dunkel — hell"; das erste wird von Jung & Ricklin als innere und das zweite als äußere Assoziation eingestuft. Zum anderen fehlen in dieser Klassifizierung Gesichtspunkte, die sich inzwischen als
22
Assoziative Strukturen
bedeutsam erwiesen haben. Dies betrifft etwa die heute geläufige Unterscheidung zwischen syntagmatischen und paradigmatischen Assoziationen. Bei syntagmatischen Assoziationen nehmen Reiz- und Reaktionswort in der Sprache normalerweise aufeinanderfolgende Positionen ein; Beispiele hierfür sind die Paare „blau — Meer", „Mensch — arbeiten" usw. Bei paradigmatischen Assoziationen nehmen Reiz und Antwort im Satz normalerweise die gleiche Position ein und sind ersetzbar; Beispiele hierfür sind die Paare „Mann — F r a u " , „blau — r o t " , „Ziege — Tier". In der Einteilung von J u n g 8c Ricklin werden in den meisten Kategorien Beispiele sowohl für syntagmatische als auch für paradigmatische Assoziationen aufgeführt. Durch eine Klassifizierung der Assoziationen, wie sie von J u n g & Ricklin, aber auch von anderen Autoren (ζ. B. Mayer 8c Orth, 1901) versucht wurde, können zwei Ziele angestrebt werden. Zum einen können die verschiedenen Kategorien als Abbilder der Zusammenhänge zwischen den Wörtern im L Z G betrachtet werden. Die von J u n g & Ricklin verwendeten syntaktischen und semantischen Kriterien entsprächen in diesem Fall strukturellen Merkmalen des Gedächtnisses. Dieser Anspruch wäre sicherlich überhöht; denn es handelt sich hier j a lediglich u m eine von vielen möglichen Klassifizierungen, deren „Richtigkeit" empirisch nicht abgestützt ist. Z u m anderen kann man eine solche Klassifizierung lediglich als ein S y s t e m betrachten, durch welches die Assoziationen gruppiert werden. Der Wert eines solchen Systemes bestünde in diesem Falle darin, daß die Assoziationen von verschiedenen Personen miteinander verglichen werden können. Dabei zeigt sich, daß eine solche Klassifikation etwa für diagnostische Zwecke nützlich sein kann. So fanden J u n g 8c Ricklin einen Zusammenhang zwischen dem Bildungsstand der V p n und der Verteilung der assoziativen Antworten auf die verschiedenen Kategorien. Es konnte ebenfalls nachgewiesen werden, daß Kinder im Vergleich zu Erwachsenen mehr paradigmatische und weniger syntagmatische Assoziationen produzieren (Ervin, 1961). In der klinischen Psychologie dient der Assoziationsversuch dazu, Rückschlüsse auf den Denkablauf einzelner Vpn zu erhalten. Im Gegensatz dazu wird dieses Experiment in der allgemeinen Psychologie benützt, um die Stärke der Verwandtschaft zwischen Wörtern zu bestimmen. Dies ist beispielsweise bei der Durchführung von Lernexperimenten mit sinnvollem sprachlichen Material wichtig; denn die Ergebnisse solcher Experimente hängen in starkem Maße von den assoziativen Verbindungen zwischen den zu lernenden Wörtern ab (Jenkins 8c Russell, 1 9 5 2 ; J e n k i n s , Mink 8c Rüssel, 1958). Um diesen Faktor beschreiben und kontrollieren zu können, sind für eine große
23
Der Assoziationsversuch
Anzahl von Wörtern sog. Assoziationsnormen erarbeitet worden. Dafür werden, wie in dem Versuch von J u n g & Ricklin, den Vpn eine Reihe von Reizwörtern dargeboten, auf welche sie eine oder mehrere Antworten geben müssen. Die Häufigkeit, mit der eine bestimmte Antwort auf einen Reiz gegeben wird, wird dabei als die Assoziationsstärke zwischen den beiden Wörtern bezeichnet. Wie Thumb & Marbe (1901) gezeigt haben, ist die für die Produktion der assoziativen Antworten benötigte Zeit um so kürzer, je größer die Assoziationsstärke zwischen Reiz und Antwort ist. Die erste größere Untersuchung zur Bestimmung von Assoziationsstärken stammt von Kent & Rosanoff (1910); dabei produzierten insgesamt 1.000 Vpn assoziative Antworten auf 100 Reizwörter. Bei den neueren Arbeiten im englischen Sprachraum werden in der Regel die Assoziationsnormen von Palremo & Jenkins (1964) benützt. Rüssel & Meseck (1959) verglichen die Assoziationen deutscher, französischer und amerikanischer Vpn, denen die gleichen Wörter in der jeweiligen Sprache als Reize vorgegeben wurden. Tabelle 2 zeigt einen Ausschnitt aus den Resultaten dieser Untersuchung. Die Assoziationen in den drei Sprachen sind einander insofern ähnlich, als es sich bei den am häufigsten gegebenen Antworten in der Regel um die gleichen Begriffe handelt. Dies ist ein Hinweis dafür, daß die beim assoziieren ablaufenden Prozesse und die Relationen zwischen Wörtern im LZG nicht nur für eine einzelne Sprache spezifisch sind. Zum anderen zeigt Tabelle 2 einen deutlichen Unterschied zwischen den europäischen und amerikanischen Vpn: Bei den Amerikanern gab ein viel größerer Teil der Vpn die gleiche Erstantwort als bei den Europäern, sie reagierten also homogener auf die dargebotenen Reizwörter. Tabelle 2 zeigt ebenfalls, daß die Assoziationen nicht immer symmetrisch sind. So war die häufigste Erstantwort auf den Reiz ,,Brot" das Wort „essen", die häufigste Erstantwort auf den Reiz „essen" war jedoch das Wort „trinken". Tab. 2: Assoziationsnormen deutscher, französischer und amerikanische Vpn nach Russell & Meseck (1959) Reizwörter Deutsch, Französisch, Englisch Tisch, table, table dunkel, sombre, dark Musik, musique, music Krankheit, maladie, sickness Mann, homme, man tief, pro fond, deep weich, mou, soft Essen, manger, eating
Deutsch 29 Stuhl 4 4 , hell.e 9 Ton, Töne 15 Gesundheit 52 Frau 4 9 hoch 39 hart 23 trinken
Antworten % Französ.
% Englisch
53 45 16 10 66 12 39 39
84 83 18 38 77 32 45 39
chaise clair note.s sante femme creux dur boire
chair light song.s health woman,en shallow hard food
24
Assoziative Strukturen
Reizwörter Deutsch, Französisch, Englisch
% Deutsch
Antworten % Französ.
% Englisch
Berg, montagne, mountain schwarz, noir, black Hand, main, hand kurz, petit, short Stuhl, chaise, chair süß, doux, sweet Brot, pain, bread Frau, femme, woman hart, dur, hard
35 48 20 53 20 39 20 40 42
13 41 25 48 24 11 11 26 30
27 25 26 40 50 44 61 64 67
Tal weiß Fuß lang Tisch sauer essen Mann weich
plaine blanc pied,s grand table dur,e (et)vin homme mou,s
hill,s white foot,(ee) tall table sour butter man(e) soft
Bei den aufgeführten Antworten handelt es sich u m die jeweils häufigste Erstantwort. Die Zahlen bezeichnen die prozentualen Häufigkeiten dieser Antwort.
3. Assoziative und Ähnlichkeitsnetzwerke In Tabelle 2 werden die Assoziationsstärken zwischen jeweils zwei Wörtern, dem Reiz und der Antwort, angegeben. Durch einen von Deese (1962, 1965) veröffentlichten Ansatz ist es nun möglich, assoziative Ähnlichkeiten zwischen ganzen Wortgruppen anzugeben. Die assoziative Ähnlichkeit ergibt sich nach Deese nicht nur aus der gegenseitigen Assoziationsstärke zwischen zwei Wörtern, sondern sie ist auch eine Funktion der Gemeinsamkeiten ihrer assoziativen Antworten. Dies soll an den in Tabelle 3 gezeigten hypothetischen Daten dargestellt werden. Die einzelnen Zahlen bezeichnen die Häufigkeiten, mit denen von 100 Vpn fünf verschiedene Antworten auf vier verschiedene Reize gegeben wurden (bei Vorgabe des Reizes „ F r a u " gaben beispielsweise 10 Vpn die Antwort „Kind"). Die assoziative Ähnlichkeit zweier Wörter ist nun nach Deese die Summe der Intersektionen bei gemeinsamen Antworten und der Häufigkeiten, mit denen das eine der beiden Wörter als Antwort auf das andere Wort gegeben wird. Dabei berechnet sich die Intersektion der gemeinsamen Antworten aus der jeweils geringeren Häufigkeit, mit der eine bestimmte Antwort auf die beiden Reizwörter gegeben wird. Die assoziative Ähnlichkeit zwischen den beiden Wörtern „Mann" und „ F r a u " beträgt also: 25 + 30 + 5 + 5 = 65. Dividiert man diesen Wert durch das geometrische Mittel aller Antworten auf die beiden Reize, dann erhält man den sog. Intersektionskoeffizienten, der bei dem Paar „Mann — F r a u " .65 beträgt. Tabelle 4 zeigt die Intersektionskoeffizienten zwischen den vier Reizwörtern, die auf der Grundlage der in Tabelle 3 gezeigten Werte berechnet wurden.
25
Assoziative und Ähnlichkeitsnetzwerke Tab. 3: Gemeinsame assoziative Antworten auf vier Reizwörter (hypothetische Daten) Reizwort
Mann
Mann Frau Knabe Mädchen
Frau 30
25
20
5
20
Antworten Kind Knabe 5 20 10 25 30 5
Mädchen 5 20
10
Tab. 4: Intersektionskoeffizienten, auf der Grundlage der in Tab. 3 gezeigten Werte berechnet Mann 1.0
Mann Frau Knabe Mädchen
Frau .65 1.0
Knabe .55 .40 1.0
Mädchen .40 .55 .55 1.0
Dieser Ansatz erlaubt es, die assoziativen Ähnlichkeiten zwischen größeren Gruppen von Reizwörtern zu bestimmen. Gegenüber den in Tabelle 2 gezeigten Assoziationsnormen hat dieses Verfahren den Vorteil, daß assoziative Ähnlichkeiten zwischen zwei Wörtern auch dann festgestellt werden können, wenn die beiden Wörter nicht durch direkte Assoziationen miteinander verbunden sind. Tabelle 5 basiert auf einem Experiment von Deese ( 1 9 5 9 ) , in welchem den Vpn 15 inhaltlich verwandte Stimuluswörter vorgelegt wurden. Die einzelnen Zellen bezeichnen dabei die Häufigkeiten, mit denen die einzelnen Reize jedes der 14 anderen Wörter als Reaktion evozierten. Tab. 5: Gemeinsame assoziative Antworten auf 15 Reizwörter nach Deese (1961) 1
1 Motte 2 Insekt 3 Flügel 4 Vogel 5 fliegen 6 gelb 7 Netz 8 hübsch 9 Blumen 10 Käfer 11 Kokon 12 Farbe 13 Magen 14 blau 15 Bienen
4 5 6 7 8 9 10 11 12 13 14 15 - 1 0 - 2 1 0 - - - - 4 - 18 - - 4 8 - - 2 _ _ _ 50 24 - - - - 6 - 3 0 - - - - - - 2 - 1 0 8 - - - 1 8 - - - - _ _ _ _ _ _ _ _ 3 — — 11 — 16 — 2 2 2 — — — — — — — — — — — — — — — _ _ _ _ _ 2 — _ — _ _ — _ — — 2 36 2 4 - - - - 4 16 6 4 - _ _ _ _ 1 0 - - _ _ _ _ _ _ _ _ _ _ _ _ _ _ 2 0 — — — — — — — — — — — — — — — _ _ _ _ _ _ _ _ io — — — 15 — — — — 5 — — — — -
2 2
3 2
26
Assoziative Strukturen
Diese Werte u n d die daraus ableitbaren I n t e r s e k t i o n s k o e f f i z i e n t e n kovariieren n i c h t n u r mit der Erlernbarkeit der e n t s p r e c h e n d e n Wortgruppen s o n d e r n sie entsprechen auch unseren intuitiven Vorstellungen über die inhaltliche V e r w a n d t s c h a f t zwischen Wörtern. Neben d e m von Deese entwickelten I n t e r s e k t i o n s k o e f f i z i e n t e n w u r d e n eine Reihe von anderen Maßen beschrieben, mit denen die assoziative V e r b u n d e n h e i t innerhalb von Wortpaaren oder -gruppen dargestellt w e r d e n kann. Der von Pollio (1963) berechnete Grad der assoziativen V e r b u n d e n h e i t innerhalb einer Wortgruppe steigt proportional mit der Häufigkeit, mit der ein anderes Wort dieser G r u p p e gegeben wird. Garskopf & H o u s t o n (1963) modifizieren die Versuchsa n o r d n u n g von Deese, indem sie die V p n auf die einzelnen Reize kontinuierlich assoziieren ließen. Der von ihnen berechnete Verw a n d t s c h a f t s k o e f f i z i e n t berücksichtigt, an welcher Position innerhalb der Assoziationskette die einzelnen assoziativen A n t w o r t e n auftreten. Kiss ( 1 9 6 7 , 1975) entwickelte ein assoziatives N e t z w e r k von insgesamt 5 5 . 0 0 0 Wörtern, indem er die im Assoziationsversuch gegebenen A n t w o r t e n anderen Vpn als Reize vorgab. Seine Versuche zeigen, daß sich Assoziationen nicht innerhalb eines geschlossenen Wortfeldes b e w e g e n , sondern d a ß sich assoziative K e t t e n zwischen beliebigen Wörtern herstellen lassen. Wie die in Tabelle 2 dargestellten Assoziationsnormen, so beschreiben auch die assoziativen Netzwerke lediglich, wie stark die Verbindungen zwischen den einzelnen Wörtern sind; sie zeigen j e d o c h nicht, welcher A r t diese Relationen sind. Bei den beiden Wortpaaren ,.Mädchen — F r a u " u n d „Mädchen — h ü b s c h " bestehen beispielsweise gleichermaßen h o h e assoziative V e r b i n d u n g e n ; die Beziehung zwischen den beiden Wörtern ist j e d o c h jeweils verschieden. Der von Deese gebrauchte Ausdruck der assoziativen Ähnlichkeit ist deshalb u n z u t r e f f e n d ; denn in Wortpaaren wie „ M ä d c h e n — h ü b s c h " oder „ F a r b e — b l a u " besteht keine Ähnlichkeitsbeziehung. Das einzige, was sich allgemein über assoziativ verbundene Wörter sagen läßt, ist die tautologische Aussage, daß diese Wörter „etwas m i t e i n a n d e r zu tun h a b e n " . Einen direkten Zugang zur Bestimmung der subjektiven Ähnlichkeiten zwischen Wörtern bildet das von Fillenbaum 8c R a p o p o r t (1971) b e n ü t z t e Verfahren, bei dem die V p n die Ähnlichkeiten zwischen Wörtern direkt einstufen m u ß t e n . Dazu b e n ü t z t e n die A u t o r e n zwei V e r f a h r e n : Bei der einen, von R a p o p o r t , Livant 8c B o y d (1966) entwickelten Technik erhalten die V p n eine G r u p p e von Wörtern dargeboten u n d müssen z u n ä c h s t die beiden Wörter miteinander verbinden, die einander am ähnlichsten sind. Darauf müssen sie das nächstähnlichste Wortpaar bestimmen oder das schon verbundene
27
Assoziative und Ähnlichkeitsnetzwerke
Paar mit dem diesem Paar am ähnlichsten Wort verknüpfen. Dieser Prozeß wird so lange fortgesetzt, bis alle vorgegebenen Wörter zu einer einzigen Gruppe verbunden sind. Bei der zweiten Technik erhalten die Vpn alle möglichen Paarkombinationen der einzustufenden Wörter dargeboten, und sie müssen die Paare aufgrund ihrer inneren Ähnlichkeit in einer Rangreihe ordnen. Auf der Grundlage solcher Daten berechneten Filibaum & Rapoport für verschiedene Wortgruppen Ähnlichkeitsmatrizen, die den von Deese entwickelten assoziativen Netzwerken ähnlich sind. Mit Hilfe der von Johnson (1967) entwickelten ,,Clustering"-Technik wurden diese Matrizen zu hierarchischen Strukturen transformiert, in welchen ähnliche Wörter und Wortgruppen zusammengefaßt werden. Tabelle 6 zeigt eine solche Struktur, in der 15 Verwandtschaftsbezeichnungen geordnet sind. Fillenbaum & Rapoport weisen darauf hin, daß diese Struktur die drei Dimensionen abbildet, die von Wallace & Atkins (1960) zur Beschreibung von Verwandtschaftsbeziehungen benützt wurden: Auf der ersten Ebene der Hierarchie werden die Verwandtschaftsbeziehungen in zwei Gruppen gegliedert, die eine enthält lineare (ζ. B. Schwester, Großmutter) und die andere colineare (Onkel) und ablineare (Vetter) Beziehungen. Auf den drei
Tab. 6: Hierarchische Ordnung von Verwandtschaftsbegriffen nach Fillenbaum & Rapoport (1971) männl./ weibl.
Großmutter • Großvater — Enkel Enkelin
auf- vs. absteigende Generation
ein vs. kein zwei GeneGenerations- rationsununterschied terschiede
lineare vs. colineare &: oblineare Beziehungen
Assoziative Strukturen
28
folgenden Ebenen werden die Verwandtschaftsgrade nach der Generationenfolge unterteilt und auf der untersten Ebene nach dem Geschlecht. Neben der Untersuchung von Fillenbaum &: Rapoport wurden eine Reihe von anderen Arbeiten veröffentlicht, in denen Wortfelder aufgrund von Ähnlichkeitsurteilen skaliert werden. So bestimmte Clark (1968) Abhängigkeiten zwischen verschiedenen Präpositionen und in einer in Kap. III näher besprochenen Arbeit analysierte Miller (1972) die Ähnlichkeiten zwischen verschiedenen Bewegungsverben. Henley (1969) bestimmte die Ähnlichkeiten zwischen Tiemamen mit Hilfe der folgenden fünf Methoden: (a) Die Vpn mußten innerhalb einer beschränkten Zeitspanne so viele Tiere wie möglich benennen. Die Ähnlichkeit zwischen zwei Tiernamen ist dabei eine Funktion ihrer Nähe innerhalb der von den Vpn produzierten Sequenzen. (b) Die Vpn mußten in Paaren dargebotene Tiernamen auf ihre Ähnlichkeit beurteilen. (c) Die Vpn erhielten die Tiernamen in Dreierkombinationen dargeboten und mußten jeweils bestimmen, welche zwei von den drei Wörtern einander am ähnlichsten sind. (d) Durch den Assoziationsversuch wurde die assoziative Verbundenheit zwischen den Tiernamen bestimmt. (e) In einem Paarlernexperiment mußten die Vpn Zuordnungen zwischen Zahlen und Tiernamen lernen. Die Ähnlichkeit der Wörter wurde dabei als Funktion der Häufigkeit bestimmt, mit welcher diese Wörter bei der Reproduktion miteinander verwechselt wurden. Tabelle 7 zeigt die Korrelationen zwischen den Ähnlichkeiten, die mittels dieser fünf Methoden berechnet wurden. Mit Ausnahme der durch Paar- und Dreiervergleich gewonnenen Werte sind die Zusammenhänge zwischen den verschiedenen Maßen recht schwach. Dies Tab. 7: Korrelationen zwischen verschiedenen Ähnlichkeitsmaßen nach Henley (1969) b .17
a b c d a b c d e
= = = = =
c .16 .93
d .23 .70 .59
e .01 .08 .07 .04
Nähe der Nennung beim freien Produzieren; Paarvergleich; Dreiervergleich; assoziative Nähe; Verwechslungen beim Paarlernen.
Assoziative und Ähnlichkeitsnetzwerke
29
muß so interpretiert werden, daß die verschiedenen Ähnlichkeitsmaße nur Teilaspekte der zwischen Wörtern bestehenden Beziehungen erfassen. Die von Henley (1969) berechnete Korrelation zwischen assoziativer Nähe und der Verwechselbarkeit der Wörter im Lernexperiment beträgt lediglich .04. Dieser niedrige Wert scheint den Ergebnissen der Lernexperimente zu widersprechen, die in den beiden ersten Abschnitten dieses Kapitels zitiert wurden, und in welchen Zusammenhänge zwischen semantischer Ähnlichkeit einerseits und Erlernbarkeit bzw. Verwechselbarkeit der Wörter im Lernversuch andererseits nachgewiesen wurden. Dieser scheinbare Widerspruch kann dadurch erklärt werden, daß die in den Lernexperimenten beobachteten Abhängigkeiten zwischen Erlernbarkeit und semantischer Verwandtschaft durch inferenzstatische Tests (in der Regel durch t-Test oder Varianzanalyse) nachgewiesen wurden. Dabei können auch schon recht geringe Unterschiede statistisch gesichert werden, die sich in nur schwachen Korrelationskoeffizienten ausdrücken. Horstkotte (1978) verglich die Einflüsse von assoziativen Beziehungen und von subjektiven Ähnlichkeiten auf die Interpretation mehrdeutiger Wörter. Die Vpn erhielten Wortpaare dargeboten, die aus einem eindeutigen und aus einem Wort mit zwei Bedeutungen bestanden, und sie mußten für jedes dieser Paare einen Satz bilden, in welchem diese beiden Wörter vorkamen. Das eindeutige Wort stand jeweils zu einer der beiden Interpretationen des zweideutigen Wortes in einer inhaltlichen Beziehung und es wurde gemessen, wie stark das eindeutige die Interpretation des zweideutigen Wortes bestimmte. Daß die Interpretation mehrdeutiger Wörter und Sätze von dem jeweiligen Kontext mitbestimmt wird, konnte in verschiedenen Versuchen (ζ. B. MacKay, 1966; MacKay & Bever, 1967) nachgewiesen werden. So wird eine Vp bei der Vorgabe des Wortpaares „Sattel — Schimmel" das zweite Wort in der Regel in der Bedeutung von „weißes Pferd" interpretieren; beim Wortpaar „Käse — Schimmel" wird „Schimmel" jedoch als „Schimmelpilz" verstanden werden. Die Verwandtschaft zwischen dem eindeutigen Wort und einer der beiden Interpretationen des zweideutigen Wortes wurde durch zwei Methoden bestimmt: zum einen durch eine Modifikation des Assoziationsversuches und zum anderen durch eine Klassifizierung der Wörter in Gruppen mit ähnlichen Bedeutungen. Horstkotte fand nun, daß die assoziativen Ähnlichkeiten die Interpretationen der mehrdeutigen Wörter in einem stärkeren Maße beeinflußten als die Ähnlichkeiten, die durch den Klassifikationsversuch bestimmt wurden. Sie schließt daraus, daß inhaltliche Beziehungen zwischen Wörtern durch assoziative Ähnlichkeiten besser und vollständiger beschrieben werden als
30
Assoziative Strukturen
durch Ähnlichkeitsmaße, die auf taxonomischen Klassifizierungen basieren. Neben dem Assoziationsversuch und dem Einstufen subjektiver Ähnlichkeiten besteht noch eine dritte Methode, mit der sich inhaltliche Abhängigkeiten zwischen Wörtern empirisch bestimmen lassen. Dabei wird analysiert, in welchem Kontext die einzelnen Wörter normalerweise auftreten. Dieser Ansatz basiert auf der von Harris (1954) vertretenen These, daß Wörter, die normalerweise in gleichem oder ähnlichen Kontext auftreten, auch ähnliche Bedeutungen haben. Ein origineller Versuch, bei dem dieser Ansatz verwendet wurde, bilden die von Guiliano (1963) entwickelten analogen Netzwerke. Dabei handelt es sich um komplizierte, fest verdrahtete elektrische Netze. Jedes Netz bildet einen analysierten Text ab, und jeder Verbindungsknoten zwischen zwei oder mehreren Leitungen entspricht einem Inhaltswort, das in dem Text mindestens einmal vorkommt. Von den einzelnen Knoten führen Verbindungen zu den Knoten für all diejenigen Wörter, die in unmittelbarer Umgebung des entsprechenden Wortes auftreten. Diese Verbindungen enthalten elektrische Widerstände. J e häufiger zwei Wörter im Text unmittelbar aufeinanderfolgen, desto geringer ist der elektrische Widerstand in der Verbindung zwischen den entsprechenden K n o t e n . Schließt man nun einen Knoten an eine Stromquelle an, dann können auch an den anderen Knoten des Netzes elektrische Spannungen beobachtet werden. Die Stärken dieser Spannungen hängen davon ab, wie stark die Widerstände zwischen den entsprechenden Knoten sind. Treten zwei Wörter häufig in unmittelbarer Nachbarschaft auf, dann ist der Spannungsabfall zwischen den entsprechenden Knoten gering. Der Widerstand zwischen zwei Knoten wird ebenfalls gering sein, wenn die beiden Wörter eine ähnliche Distribution haben, d. h. wenn die sie umgebenden Wörter zumindestens teilweise die gleichen sind. Damit können durch solche analogen Netze sowohl syntagmatische als auch paradigmatische Ähnlichkeiten erfaßt werden. Durch serielle und parallele Kombinationen von Verbindungen ist es auch möglich, die Widerstände zwischen zwei Knoten zu messen, die weder direkt miteinander verbunden sind, noch einen gemeinsamen Kontext haben. Die Aussagekraft der von Giuliano entwickelten analogen Netzwerke ist damit den von Deese berechneten assoziativen Ähnlichkeitsmatrizen vergleichbar: Beide Modelle beschreiben inhaltliche Verwandtschaften auch von solchen Wörtern, die keine direkten Beziehungen zueinander aufweisen; sie konfundieren jedoch verschiedene Arten von Beziehungen. Ebenfalls auf der Analyse von Wortdistributionen basiert ein Ansatz von Wettler (1972), der den induktiven Aufbau von strukturier-
Assoziative und Ähnlichkeitsnetzwerke
31
ten Ähnlichkeitsnetzen erlaubt. Das dabei verwendete sprachliche Materiell wurde durch folgendes Experiment gewonnen: Vpn erhielten die Wörter, deren Verwandtschaft bestimmt werden sollte, allein, in Zweier- und in Dreierkombinationen dargeboten. Für jede dargebotene Wortkombination mußten sie einen Satz bilden, in dem alle dargebotenen Wörter enthalten waren. Diese Sätze wurden darauf vom VI so kodiert, daß die syntaktischen Beziehungen zwischen den Wörtern innerhalb des Satzes ersichtlich waren, und deren weitere Verarbeitung durch den Computer möglich wurde. Der darauffolgende Aufbau des Ähnlichkeitsnetzwerkes geschah nach folgendem Algorithmus: Zunächst wurde für jedes in den Sätzen vorkommende Inhaltswort ein sog. Knoten aufgebaut. Dies ist eine Liste all derjenigen Wörter, die zu dem Ursprungswort in einer syntaktischen Beziehung stehen, und der Häufigkeiten, mit denen diese Beziehungen in den Sätzen genannt wurden. Darauf wurden die Knoten mit ähnlichem Inhalt unter einem Knoten höherer Ordnung subsumiert. Dieser „Oberbegriff" enthielt alle den „Unterbegriffen" gemeinsame Elemente. Dem Wort , R ä d c h e n " war in den Sätzen beispielsweise 34 mal und dem Wort „ F r a u " 16 mal das Wort „hübsch" zugeordnet. Der Knoten für den Oberbegriff von „ F r a u " und R ä d chen" enthielt deshalb das Wort „hübsch" mit einer Häufigkeit von 16. Knoten höherer Ordnung konnten mit anderen Knoten zusammen unter noch allgemeineren Knoten subsumiert werden. Waren alle unter einem Knoten höherer Ordnung subsumierten Wörter durch einen Gleichsetzungsnominativ („Ein Mädchen ist ein Mensch") mit demselben Wort verbunden, dann wurde dieses Wort als Namen des Oberbegriffes betrachtet. Damit war es möglich, einem Teil der Knoten höherer Ordnung Namen zuzuordnen. Abbildung 2 zeigt ein nach diesem Algorithmus aufgebautes Netzwerk. In der Abbildung nicht dargestellt sind die Stärken der verschiedenen Relationen, d. h. die Häufigkeiten, mit denen die entsprechenden Wortpaare im Zusammenhang genannt wurden. Auch diejenigen der Knoten höherer Ordnung, für die das Programm keinen Namen fand, können sinnvoll interpretiert werden. Der Oberbegriff für die Verben „pflücken", „begießen" und „pflanzen" umfaßt gärtnerische Tätigkeiten, der Oberbegriff dieses Begriffes umfaßt menschliche Tätigkeiten und dessen Oberbegriff subsumiert Tätigkeiten, die sowohl von Menschen als auch von Tieren vollzogen werden. Von den insgesamt 22 Wörtern, deren gegenseitige Relationen in Abbildung 2 beschrieben sind, wurden in dem Experiment zur Satzbildung lediglich zehn dargeboten. Die psychologische Bedeutsamkeit dieser Struktur wurde durch zwei Arten von Vergleichen überprüft. Zum einen wurden die bei der
32
Assoziative Strukturen
Abb. 2: Auf der Grundlage von Wortdistributionen aufgebautes Netzwerk nach Wettler (1972)
Die Verbindungen ohne Pfeilspitzen bezeichnen Oberbegriffsrelationen. Die Pfeilspitzen bezeichnen die Richtung der verschiedenen beobachteten Beziehungen zwischen den Wörtern (Subjekt -> Verb; Verb direktes Objekt; Verb Präpositionalobjekt; Attribut Kern des Attributes).
Bildung der Sätze gemessenen Latenzzeiten mit der Nähe der dargebotenen Wörter innerhalb der Netzstruktur verglichen. Dabei zeigte sich, daß bei Gruppen von miteinander direkt verbundenen Wörtern (ζ. B. Pflanze, Gras, Blume) die Latenzzeiten geringer sind als bei anderen Wortgruppen (ζ. B. Mann, essen, hübsch). Zudem verringerten sich die Latenzzeiten mit zunehmender Stärke der Relationen zwischen den dargebotenen Wörtern. Diese Resultate entsprechen den Ergebnissen der Experimente von Collins & Quillian (1969, 1970), die im folgenden Kapitel beschrieben sind. Im weiteren wurde die Nähe der Wörter in dem Netzwerk und die Stärke der gegenseitigen Relationen einerseits mit den von Bilodeau (1965) gemessenen Assoziationsstärken zwischen den Wörtern andererseits verglichen. Die Korrelation zwischen den beiden Werten beträgt .71. Im Vergleich mit den von Henley (1969) berechneten und in Tabelle 7 gezeigten Korrelationskoeffizienten ist dieser Wert sehr befriedigend. Bei den in diesem Abschnitt beschriebenen Netzwerken wurden die Verwandtschaften zwischen Wörtern durch drei verschiedene Arten von Messungen bestimmt: Deese (1965) verwendete den klassischen Assoziationsversuch, Fillenbaum & Rapoport (1971) ließen die subjektiven Ähnlichkeiten zwischen Wörtern einstufen und Giuliano (1963) u n d Wettler (1972) analysierten deren sprachliche Umgebung. Die drei Ansätze stimmen darin überein, daß nicht die Art, sondern lediglich die Stärke der Abhängigkeiten zwischen den Wörtern bestimmt wird, und daß die Struktur der Beziehungen induktiv
Die Bildung von Assoziationen
33
gewonnen wurde. Damit ist der Anwendungsbereich dieser Modelle stark eingeschränkt: Wie bei der Kritik an den Netzwerken von Deese ausgeführt wurde, können zwischen Wortpaaren mit einer gleichstarken assoziativen Beziehung die verschiedensten Arten von Abhängigkeiten bestehen. Dasselbe gilt auch für anders gewonnene Ähnlichkeitsmaße. Für die meisten sprachlichen und anderen kognitiven Leistungen ist es jedoch notwendig, nicht nur die Stärke, sondern auch die Art der Beziehungen zwischen den einzelnen Wörtern zu kennen. So zeigt etwa die in Tabelle 6 beschriebene Gliederung der Verwandtschaftsbeziehungen nicht, daß der Satz Der Neffe ist der Sohn des Onkels, richtig, während der Satz Die Tante ist der Sohn des Enkels, falsch ist. Für die Erklärung des Verstehens von Sprache sind diese Modelle deshalb ungeeignet. Sie können sinnvoll lediglich für die Beschreibung von solchen Leistungen verwendet werden, bei denen unspezifische Beziehungen zwischen Wörtern ausschlaggebend sind. Selbst die zitierten Experimente, bei denen der Einfluß der Ähnlichkeiten zwischen Wörtern auf deren Erlernbarkeit überprüft wurde, erfüllen diese Bedingungen jedoch nur unter Einschränkungen.
4. Die Bildung von Assoziationen Das Wort Assoziation wird in der Psychologie in zwei verschiedenen Bedeutungen verwendet und viele Diskussionen über den Assoziationsbegriff rühren daher, daß der jeweilige Gebrauch dieses Wortes von den Autoren nicht angegeben wird. Zum einen wird das Wort im deskriptiven Sinne gebraucht. Dabei versteht man unter Assoziation eine Beziehung zwischen zwei Wörtern, wie sie beispielsweise im Assoziationsversuch gemessen wird. Wird der Begriff der Assoziation in diesem Sinne verstanden, dann meint die Aussage „zwei Wörter sind miteinander assoziiert" nichts anderes als „die zwei Wörter haben etwas miteinander zu t u n " . Der zweite, erklärende Gebrauch dieses Wortes impliziert bestimmte theoretische Vorstellungen über das Erlernen von Assoziationen. Lange Zeit wurde als wichtigstes Prinzip für die Bildung neuer Assoziationen die Kontiguität, d. h. die unmittelbare zeitliche Aufeinanderfolge der Elemente, betrachtet: Werden zwei Ereignisse oder Objekte unmittelbar nacheinander wahrgenommen, dann werden diese Ereignisse oder Objekte im Gedächtnis miteinander verknüpft. Dieses Kontiguitätsprinzip ist nach Mill (1869) auch dafür verantwortlich, daß einander ähnliche Objekte miteinander verknüpft sind; denn ähn-
34
Assoziative Strukturen
liehe Objekte würden häufig gleichzeitig oder unmittelbar nacheinander wahrgenommen. Daß die zeitliche Aufeinanderfolge den einzigen F a k t o r bilde, durch welchen die Verknüpfung von Elementen im Gedächtnis bestimmt wird, gilt inzwischen als widerlegt. Dies zeigt sich beispielsweise in einem Experiment von F o p p a ( 1 9 6 3 ) , in welchem den V p n zwölf verschiedene sinnlose Silben je zwölfmal dargeboten wurden. Bei einer Gruppe von Vpn wurden die zwölf Silben zwölfmal hintereinander in gleichbleibender Reihenfolge dargeboten. Bei den anderen Gruppen wurden die einzelnen Silben in Zweier-, Dreier-, Vierer-, Sechser- und Zwölferketten wiederholt; an Stelle der zwölfmaligen Darbietung der Liste A-B-C-D- . . . erhielten sie also sechsmal die Liste A-A-B-B-C-C . . ., viermal die Liste A-A-A-B-B-B- . . . usw. Nach der Kontiguitätstheorie müßte die Schwierigkeit der Erlernbarkeit der zwölf Silben mit zunehmender Länge von solchen Wiederholungsketten anwachsen, da bei Wiederholungen weniger Übergänge zwischen verschiedenen Wörtern vorkommen und deshalb auch weniger Kontiguitätsassoziationen gestiftet werden können. Tatsächlich unterscheiden sich jedoch die Reproduktionsleistungen zwischen Gruppen mit verschieden langen Wiederholungsketten kaum. In dem Experiment von F o p p a wurden sinnlose Silben als Lernmaterial benützt. Die Verwendung dieses von Ebbinghaus ( 1 8 8 5 ) entwickelten Materials hat den Vorteil, daß die Vpn damit keine im Experiment nicht kontrollierbare Erfahrungen haben, welche das Versuchsergebnis beeinflußen können. Andererseits bildet das Erlernen von sinnlosen Silben eine viel komplexere Aufgabe als das Erlernen von sinnlosen Wörtern oder Sätzen: Bei sinnvollem Material müssen die V p n lernen, schon vorher bekannte Wörter miteinander zu verbinden und in einen Zusammenhang zu bringen. Bei sinnlosem Material müssen sich die Vpn zudem noch die einzelnen, vorher unbekannten Elemente einprägen. Bei Lernversuchen mit sinnlosem Material wird also nicht nur die Bildung neuer assoziativer Verknüpfungen zwischen den Elementen der Lernliste gemessen, sondern auch die Einprägung dieser Elemente selbst. Untersucht man die Bildung von Assoziationen anhand sinnvollen Materiales, dann kann nicht entschieden werden, inwieweit die bei der Reproduktion beobachteten Verknüpfungen zwischen den einzelnen Wörtern durch die Einprägung während des Experimentes bedingt sind, und in welchem Maße dabei präexperimentelle Erfahrungen wirksam sind. Die Bedeutsamkeit solcher präexperimenteller Erfahrungen zeigt sich beispielsweise bei Untersuchungen zur proaktiven Hemmung. Damit bezeichnet man den von Underwood (1957) beschriebenen E f f e k t , daß das Erlernen neuen Materials erschwert
Die Bildung von Assoziationen
35
wird, wenn die Vpn sich unmittelbar vorher anderes Material einprägen mußten. Besonders stark ist dieser Effekt dann, wenn die zu lernenden Listen ähnlich sind, und wenn unmittelbar nach der Darbietung jeder Liste der Inhalt des KZG durch das von Peterson & Peterson ( 1 9 5 9 ) entwickelte Verfahren (siehe Abschnitt 1 dieses Kapitels) gelöscht wird. Wickens ( 1 9 7 0 , 1972) benützte diese Technik und zeigte dabei, daß das Phänomen der proaktiven Hemmung benützt werden kann, um inhaltliche Ähnlichkeiten zwischen Wörtern zu bestimmen. Müssen die Vpn in unmittelbarer Aufeinanderfolge verschiedene Listen von inhaltlich ähnlichen Wörtern lernen, dann verschlechtert sich ihre Reproduktionsleistung von Liste zu Liste, d . h . die proaktive Hemmung steigt an. Bietet der VI darauf eine Wortliste dar, deren Elemente denjenigen der vorhergehenden Liste unähnlich sind, dann verschwindet die proaktive Hemmung weitgehend. J e größer die Unähnlichkeit zwischen zwei aufeinanderfolgenden Listen ist, desto stärker verbessern sie die Leistungen bei der Reproduktion der zweiten Liste. Der Einfluß der inhaltlichen Verwandtschaft zwischen Wörtern auf deren Erlernbarkeit ist also so groß, daß Lernversuche dazu benützt werden können, um Aufschlüsse über eben diese Verwandtschaften zu gewinnen. Bei anderen Versuchsanordnungen werden solche Effekte möglicherweise weniger stark sein; es wird sich jedoch kaum ein experimenteller Aufbau finden lassen, bei dem die präexperimentellen Erfahrungen mit dem Lernmaterial keine Rolle spielen, und dessen Ergebnisse zugleich für außerexperimentelles Verhalten relevante Aussagen ermöglichen. Die Bildung von neuen Assoziationen ist immer eine Integration neuer Relationen in eine bestehende Wissensstruktur (Wettler 1979a, b). Die Gesetze, nach denen dieser Prozeß verläuft, können deshalb erst dann sinnvoll untersucht werden, wenn konkrete Vorstellungen über den Aufbau solcher Wissensstrukturen bestehen. So lange man die Gesetze, nach denen Assoziationen gebildet werden, nicht kennt, muß dieser Begriff im beschreibenden Sinne verstanden werden. Damit können assoziative Beziehungen zwischen Wörtern jedoch nicht mehr als Erklärungen für beobachtetes sprachliches Verhalten benützt werden. So darf etwa die Beobachtung, daß assoziativ miteinander verbundene Wörter besser gelernt werden, nicht dadurch interpretiert werden, daß die assoziativen Beziehungen die Erlernbarkeit bestimmen. Sie sagt lediglich aus, daß zwei beobachtbare Beziehungen zwischen Wörtern, die Erlernbarkeit und die im Assoziationsversuch bestimmte Verbundenheit, kovariieren. Über die Beziehungen zwischen diesen Wörtern im LZG, durch welche diese beiden Verhaltensweisen bestimmt werden, ist damit jedoch noch nichts ausgesagt.
III. DAS SEMANTISCHE NETZWERK VON QUILLIAN
1. Fragen-Antwort-Systeme Wie im letzten Kapitel gezeigt wurde, besteht der hauptsächliche Mangel der assoziativen Netzwerke darin, daß lediglich die Stärke von Verknüpfungen zwischen verschiedenen Wörtern angegeben wird, ohne daß die Art dieser Verknüpfungen näher spezifiziert ist. Dieser Mangel ist in den Modellen der sogenannten semantischen Netzwerke überwunden worden. Wie die assoziativen, so beschreiben auch die semantischen Netzwerke Beziehungen zwischen Wörtern oder zwischen Begriffen und sie können als Modell des im LZG gespeicherten Wissens betrachtet werden. Der grundlegende Unterschied zwischen assoziativen und semantischen Netzwerken resultiert aus den verschiedenen Zielsetzungen, welche die Erarbeitung dieser zwei Arten von Modellen bestimmten, und aus der Verschiedenheit der dabei verwendeten Methoden. Die im letzten Kapitel besprochenen assoziativen Netzwerke wurden induktiv auf der Grundlage von Assoziationsexperimenten, Einstufungen von Ähnlichkeiten und Textanalysen gewonnen und sie dienen dazu, die dabei beobachteten Abhängigkeiten zwischen Wörtern darzustellen. Im Gegensatz dazu wird bei der Erarbeitung von semantischen Netzwerken von der Zielsetzung ausgegangen, daß diese Modelle Teil einer Theorie für die Erklärung von Verstehensleistungen bilden sollen. Als wichtigstes Paradigma, an welchem eine Theorie des Verstehens überprüft werden kann, gilt dabei das Fragen-Antwort-System. In einer Besprechung von FragenAntwort-Systemen, die zwischen 1965 und 1969 veröffentlicht wurden, werden diese von Simmons als Systeme definiert, die Aussagen und Fragen in natürlicher Sprache als Eingangsdaten akzeptieren, diese darauf mit Hilfe von syntaktischen und semantischen Prozessen in eine formale Sprache transformieren, die deduktive und/oder induktive Prozesse durchführen und in natürlicher Sprache Antworten formulieren können (Simmons, 1970, p. 25). Abbildung 3 zeigt die Struktur eines Fragen-Antwort-Systems mit den drei in der Definition von Simmons erwähnten Prozessen: Die Satzanalyse, die dem eingegebenen Satz eine formale Struktur zuordnet; die deduktiven und induktiven Prozesse, durch die beispielsweise die Antwort auf eine eingegebene Frage gefunden werden kann,
Fragen-Antwort-Systeme
37
und der Satzgenerator. Für die Durchführung jedes dieser drei Prozesse müssen dem System eine Reihe von Algorithmen und von Strukturen zur Verfügung stehen. Für die Satzanalyse werden sprachliche Kenntnisse und Wissen von der Welt, sowie Regeln für deren Anwendung gebraucht. Für die Durchführung von deduktiven Prozessen werden hauptsächlich Wissensinhalte über das entsprechende Sachgebiet benötigt. Die Generierung eines Satzes aufgrund einer formalen Tiefenstruktur kann ebenfalls nur mit Hilfe von Wissen über die entsprechende Sprache geleistet werden. In diesem und in folgenden Kapiteln soll gezeigt werden, wie das in Abbildung 3 gezeigte grobe Schema bei der Erarbeitung von Fragen-Antwort-Systemen spezifiziert werden muß, und wie die einzelnen Teile dieses Schemas im Detail strukturiert werden können. Abb.
3: Struktur eines Fragen-Antwort-Systems
Fragen-Antwort-Systeme bilden aus verschiedenen Gründen ein sehr günstiges Paradigma für die Formalisierung von Verstehensleistungen. Zunächst ist man bei der Erarbeitung eines solchen Systemes gezwungen, konkrete Vorstellungen über den gesamten Ablauf und das Zusammenwirken der beim sprachlichen Verstehen ablaufenden Prozesse zu machen. Man kann sich also nicht, wie dies bei der Mehrzahl der psycholinguistischen Modelle der Fall ist, darauf beschränken, einen kleinen Teilbereich der für das Verstehen notwendigen Mechanismen zu untersuchen, ohne dabei den Zusammenhang zwischen den untersuchten und anderen für das Verstehen wichtigen Prozessen herzustellen. Es ist wohl möglich, ein beschränktes Fragen-AntwortSystem zu entwerfen, das lediglich einen äußerts kleinen Teilbereich
38
Das semantische Netzwerk von Quillian
der natürlichen Sprache richtig verarbeitet oder dessen deduktive Fähigkeiten sehr gering sind. Selbst einem solchen System muß jedoch eine — richtige oder falsche — Vorstellung von einem gesamten Ablauf eines Dialoges zu Grunde liegen, und mögliche Einschränkungen oder Inkonsistenzen sind bei der Beobachtung des Verhaltens des Systems sehr leicht ersichtlich. Im Gegensatz zu anderen Paradigmen zur Formalisierung von Verstehensleistungen, so ζ. B. zur automatischen Übersetzung, kann bei Fragen-Antwort-Systemen nur in beschränktem Maße mit ad hoc-Annahmen gearbeitet werden, die in einer spezifischen Situation eine richtige Reaktion produzieren, die jedoch bei veränderter Aufgabenstellung wertlos sind. Wie das folgende Beispiel von Abelson und Reich ( 1 9 6 9 ) zeigt, läßt sich am Verhalten von Frage-Antwort-Systemen leicht abschätzen, in welchem Maße der Verstehungsprozeß formalisiert wurde. Wird einem System der Satz Ich ging in drei Apotheken eingegeben, dann kann es darauf, j e nach der Tiefe des Verstehens, verschieden reagieren. Ein einfaches, hauptsächlich mit syntaktischen Regeln arbeitendes System könnte darauf mit der Frage antworten Wie bist du in die drei Apotheken gegangen?. Ein komplexeres System, welches über Wissensinhalte über Apotheken verfügt, könnte darauf antworten Was für nützliche Dinge hast du in den drei Apotheken gekauft? Ein System, welches zudem noch über Wissen über menschliche Motivationen verfügt, würde etwa folgende Antwort produzieren: Wie kam es, daß du in den ersten beiden Apotheken nicht bekamst, was du wolltest? Diese drei hypothetischen Reaktionen machen deutlich, daß die Güte eines Fragen-Antwort-Systemes unmittelbar davon abhängt, auf welche Wissensbestände bei der Durchführung von Deduktionsprozessen zurückgegriffen werden kann. J e mehr Wissen, sei dies über die Funktion von Apotheken oder über menschliche Motivation, dem System zur Verfügung steht, um so eher wird sein Verhalten an Flexibilität gewinnen und sich demjenigen eines menschlichen Gesprächspartners angleichen. Nun muß hier zumindest erwähnt werden, daß schon vor der Entwicklung von semantischen Netzwerken eine Reihe von Fragen-Antwort-Systemen programmiert worden sind. Diese frühen Systeme lassen sich in zwei grobe Klassen einordnen: Zum einen handelt es sich um Programme, die zwar sehr komplexe logische Deduktionen durchführen können, die andererseits jedoch nur sehr geringe Fähigkeiten zur Analyse natürlicher Sprachen besitzen und häufig nur ein sog. Pseudo-Englisch akzeptieren, d. h. eine geringe Anzahl von Wortmu-
Fragen-Antwort-Systeme
39
stern, bei denen die Funktion der einzelnen Wörter im Satzganzen durch deren Position definiert wird. Einige dieser Systeme sind in Minsky (1968) beschrieben. Das bekannteste aus der zweiten Gruppe von Fragen-Antwort-Systemen ist das von Weizenbaum (1966) entwickelte Programm ELIZA, welches das Verhalten eines Psychotherapeuten der Rodgers-Schule simuliert. Das Verhalten dieses Systemes ist teilweise überraschend natürlich; d . h . seine Antworten sind von denjenigen eines Psychotherapeuten in der gleichen Situation manchmal kaum zu unterscheiden. Solche Leistungen werden bei dieser Art von Systemen mit Hilfe sehr einfacher Mechanismen erreicht: Die einkommenden Sätze werden danach abgesucht, ob sie gewiße Schlüsselwörter enthalten. Diesen Schlüsselwörtern sind einzelne Sätze zugeordnet, welche die Antwort des Systems auf den vorherigen Satz bilden. Wird beispielsweise ein Satz eingegeben, der das Wort „ V a t e r " oder „Mutter" enthält, dann gibt das System die stereotype Antw o r t : „Erzähle mir mehr über i h n " (bzw. „sie"). Enthält ein eingegebener Satz keines der Schlüsselwörter, dann ist die Antwort des Systemes meistens eine Paraphrase dieses Satzes. In dem folgenden kurzen Auszug eines Dialoges mit dem ELIZA-System, der sich in Simmons (1970) findet, sind die dem System eingegebenen Sätze in Normalschrift, die Antworten des Systems in Großbuchstaben geschrieben: Als mein Vater starb, war meine Mutter für lange Zeit krank. ERZÄHLE MIR MEHR ÜBER IHN. Mein Vater war ein Schriftsteller. Er war nett, aber ziemlich zynisch. IST ER DIES AUCH HEUTE? Er ist t o t . Um den Lapsus in der zweitletzten Zeile zu vermeiden, müßte das System u. a. wissen, daß Leute, die gestorben sind, tot sind, und daß tote Leute keine Charaktereigenschaften wie Zynismus haben können. Gute Beschreibungen einer großen Zahl von solchen frühen Fragen-Antwort-Systemen finden sich in Simmons (1965) und Simmons (1970). Da diese Systeme heute höchstens eine gewisse historische Bedeutung haben, soll hier nicht weiter auf sie eingegangen werden.
2. Die Struktur des Quillian'sehen Netzes Das erste für die weitere Entwicklung von Gedächtnismodellen bedeutsame semantische Netzwerk wurde von Quillian (1967, 1968, 1969) entworfen. Obwohl dieses Modell heute als überholt bezeich-
40
Das semantische Netzwerk von Quillian
net werden kann, sind darin einige der grundlegenden Annahmen der neueren Ansätze enthalten, die alle stark von Quillian beeinflußt wurden. Quillian defniert ein semantisches Netzwerk als eine Menge von Knoten, die durch Zeiger (engl, pointer) miteinander verbunden sind. Ein Knoten ist eine Einheit, die einen im LZG enthaltenen Begriff repräsentiert. Die Bedeutung eines Begriffes ist das Gesamt der Knoten, mit denen der zu definierende Knoten durch Zeiger verbunden ist. So gehen beispielsweise von dem Knoten für den Begriff ,,Hund" Zeiger aus, die auf die Knoten für „bellen", „Tier", „Schwanz" usw. weisen. Anderseits führen zum Knoten für den Begriff ,.Schwanz" Zeiger zu den Knoten für ,,Hund", „Kuh", „Körperteil", „wedeln". Die Begriffsbestimmungen in einem semantischen Netzwerk sind also zirkulär: Wenn die Bedeutung eines Begriffes Α durch seine Relation zu einem Begriff Β bestimmt wird, dann ist die Bedeutung des Begriffes Β zugleich durch dessen Relation zum Begriff Α bestimmt. Jeder Knoten fungiert also zugleich als Definiens, d. h. als zu definierendes, und als Definiendum, d. h. als Teil der Definition von anderen Knoten. In diesem Punkt besteht ein grundsätzlicher Unterschied zwischen semantischen Netzwerken einerseits und linguistischen Bedeutungstheorien, wie ζ. B. derjenigen von Katz & Fodor (1963) andererseits. Diese nehmen an, daß einzelnen Wörtern sog. semantische Markierungen zugeordnet sind, welche eine grobe bedeutungsmäßige Klassifizierung der Wörter erlauben. Beispiele solcher semantischer Markierungen sind etwa „menschlich", „belebt", „physikalisches Objekt", „Abstraktum" usw. Obwohl diese semantischen Markierungen durch natürlichsprachliche Wörter bezeichnet werden, kommt ihnen in der Theorie von Katz & Fodor ein anderer Status zu, als den Wörtern, die durch sie bestimmt werden; es sind rein metasprachliche Größen, die für die Bestimmung gebraucht werden, und sind von den durch sie bestimmten Wörtern streng unterschieden. Quillian unterscheidet drei Arten von Verbindungen zwischen Knoten. Die erste Art von Verbindung assoziiert einen Begriff mit seinem Oberbegriff. Durch die zweite Art von Verbindung wird ein Begriff durch ein Adverb oder ein Adjektiv modifiziert. Die dritte Art von Verbindung dient dazu, zwei Wörter durch eine jeweils spezifizierte Relation miteinander in Beziehung zu setzen. Solche Relationen können Verben oder Präpositionen sein. Zusätzlich können in dem Formalismus von Quillian noch additive Relationen (Menschen haben Arme und Beine) und Disjunktionen (Nelken sind rot oder weiß) dargestellt werden. Abbildung 4 zeigt die Definition des Begriffes für „Pflanze" in der von Quillian benützten Notation. Der von „Pflanze"
Die Struktur des Quillian'schen Netzes
41
auf „ S t r u k t u r " ausgehende Zeiger ist eine Oberbegriffsrelation. Der von „ S t r u k t u r " ausgehende Zeiger weist auf die Modifikationen dieses Oberbegriffes. Dabei handelt es sich um vier Modifikationen: Abb. 4: Definition für „Pflanze" nach Quillian (1968) ( Pflanze 3
V
Struktur und
Die Struktur lebt, ist kein Tier, hat Blätter und erhält Nahrung aus der L u f t , dem Wasser oder der Erde. Während die Darstellung der beiden ersten Modifikationen ohne weiteres verständlich sein sollte, muß die Notation bei den beiden anderen Modifikationen näher erläutert werden. Es handelt sich hier u m die letzte der erwähnten drei Typen von Verbindungen, die aus drei Knoten besteht, von denen einer eine Relation spezifiziert. Die beiden anderen Knoten bezeichnet Quillian als Subjekt und Objekt der Relation, wobei man im Auge behalten muß, daß damit nicht das grammatische Subjekt und Objekt gemeint sind. Bei der letzten der vier Modifikationen von „Pflanze" bildet das Verb „erhalten" die Relation und „Pflanze" deren Subjekt; das Objekt dieser Relation ist wiederum eine Relation, die Präposition „von", mit dem Subjekt „Nahrung" und dem Objekt „Luft, Wasser oder Erde". In Abbildung 4 ist das Wort „Pflanze" zweimal aufgeführt, einmal zur Bezeichnung des zu definierenden
42
Das semantische Netzwerk von Quillian
Knotens und einmal zur Bezeichnung des Subjektes der „erhalten"Relation. Tatsächlich existiert jedoch in dem Netzwerk nur ein Knoten für Pflanze, und das Subjekt der ,,erhalten"-Relation ist ein Zeiger auf diesen Knoten. Es bestehen in einem semantischen Netzwerk also nicht nur Verbindungen zwischen verschiedenen Knoten, sondern es ist auch möglich, daß in der Definition eines Knotens auf den zu definierenden Knoten zurückverwiesen wird. In der Relation „mit Blatt" fehlt das Subjektglied. Subjekte oder Objekte von Dreierrelationen können in der Repräsentation immer dann ausgelassen werden, wenn das entsprechende Satzglied nicht spezifiziert ist. Die bisherige Darstellung des semantischen Netzwerkes ist insofern unkorrekt, als alle Knoten als gleichwertig beschrieben wurden. Es ist jedoch notwendig, zwei Arten von Knoten zu unterscheiden: Solche, die Allgemeinbegriffe, und andere, die Individualbegriffe d. h. Instanzen von Allgemeinbegriffen repräsentieren. Erstere werden als Typeoder Primärknoten, letztere als Token- oder Sekundärknoten bezeichnet. Eine Unterteilung der Knoten in Types und Tokens ist u. a. darum notwendig, weil in einem semantischen Netzwerk nicht nur die Definitionen von Begriffen, sondern auch spezifisches Wissen über einzelne Objekte enthalten sein können. Für die Repräsentation beispielsweise des Satzes Der Hund von Hans beißt den Hund von Peter genügt es nicht, wenn in dem semantischen Netzwerk nur ein Knoten für den Begriff ,,Hund" existiert. In diesem Fall müßten sowohl das Subjekt, als auch das Objekt der ,,beißen"-Relation durch denselben Knoten repräsentiert werden. Damit wäre die Repräsentation des obigen Beispielssatzes die gleiche wie die Repräsentation des Satzes Die Hunde von Hans und Peter haben sich gebissen. Diese Schwierigkeit kann umgangen werden, wenn jedes der erwähnten Objekte im semantischen Netzwerk durch einen eigenen Knoten repräsentiert wird. Neben dem Type-Knoten für den Allgemeinbegriff „ H u n d " werden also für die Repräsentation des obigen Satzes noch zusätzlich zwei Token-Knoten benötigt, die den Hund von Peter und den Hund von Hans repräsentieren. Jeder Token ist durch einen speziellen Zeiger mit dem Type des entsprechenden Allgemeinbegriffes verbunden. Während mit einem Type alle diejenigen Attribute assoziiert sind, die für alle Individuen der entsprechenden Kategorie zutreffen, sind mit einem Token nur diejenigen Attribute assoziiert, die lediglich für dieses Individuum und nicht für alle Mitglieder der Klasse zutreffen. So hat beispielsweise der Type-Knoten für ,,Hund" die Attribute „bellt" u n d „hat einen Schwanz". Der Token-Knoten für „Hund von Hans" könnte
Die Struktur des Quillian'schen Netzes
43
andererseits folgende Attribute haben: ,.gehört Hans", „ h i n k t " oder „ist braun-weiß gescheckt". Die gleiche Anordnung der Attribute findet sich auch in der Oberbegriffshierarchie der Type-Knoten: Alle Attribute sind auf der höchstmöglichen Ebene in der Oberbegriffshierarchie, d. h. an einen möglichst allgemeinen Begriff assoziiert. So sind beispielsweise die Types für ,,Kuh", „Säugetier", „Tier", „Lebewesen" durch Oberbegriffsrelationen miteinander verkettet. Dabei hat der Knoten für „Lebewesen" u. a. das Attribut „nimmt Nahrung auf", der Knoten für „Tier" das Attribut „bewegt sich", der Knoten für „Säugetier" das Attribut „Iebendgebährend" usw. Die Information, daß eine Kuh sich bewegt, ist also nicht mit dem Knoten für Kuh assoziiert, sondern sie ist nur dadurch zugänglich, daß man die von den Oberbegriffen von Kuh ausgehenden Relationen analysiert. Der hauptsächliche Vorteil dieser Art von Repräsentation liegt darin, daß Informationen, die verschiedenen miteinander hierarchisch verbundenen Begriffen zukommen, nur einmal gespeichert werden müssen. Deshalb wird Quillians Hypothese, daß Attribute jeweils nur am höchstmöglichen Oberbegriff abgespeichert sind, in der Literatur häufig als „Annahme der maximalen Gedächtnisökonomie" bezeichnet. Nun werden Tokens nicht nur für die Repräsentation nicht-definitorischer Sätze sondern auch innerhalb von Definitionen gebraucht. So ist in Abbildung 5 lediglich der eingekreiste Knoten für den zu definierenden Begriff „Pflanze" ein Type-Knoten. Alle anderen Knoten sind Tokens, die nur in der Definition von Pflanze vorkommen. Quillian bezeichnet eine solche Konfiguration von Tokens, die einen Type definieren, als eine Fläche (engl, plane). Mit Ausnahme der Verbindungen zwischen den Tokens und ihren Types bestehen keine Verbindungen zwischen Knoten innerhalb und solchen außerhalb einer Fläche. Die Unterscheidung zwischen Types und Tokens ist in manchen Fällen nicht unproblematisch. So ist es unklar, ob ζ. B. eine Person über die verschiedenen Lebensalter hinweg durch den gleichen Token repräsentiert werden kann. Soll etwa der Knabe Goethe, der in „Dichtung und Wahrheit" beschrieben wird, durch den gleichen Token repräsentiert werden wie der Autor dieses Werkes? Quillian versuchte, dieses Problem damit zu lösen, daß eine Person durch eine Vielzahl von Knoten repräsentiert werden kann: „Nehmen wir an, man möchte eine neue Einheit kostruieren um J o e Smith als Knaben zu repräsentieren, oder aus dem Blickwinkel seiner Frau, oder John Smith, wenn er verärgert ist. Dies kann dadurch geschehen, daß man für jeden dieser Fälle eine neue Einheit mit einer Oberbegriffsrelation zur früheren JOESMITH-Einheit aufbaut und dieser neuen Einheit alle Attribute zuordnet, die
44
Das semantische Netzwerk von Quillian
für die Beschreibung dieses Begriffes notwendig sind. Man kann weiter annehmen, daß man zusätzlich noch eine weitere Einheit zur Repräsentation v o n J o e Smith im Alter von elf Jahren schaffen möchte, und daß diese Einheit alle Informationen enthalten sollte, welche in der Einheit JOE-SMITH-ALS-KNABE enthalten sind. Dies kann durch die Schaffung einer neuen Einheit geschehen, welche eine Oberbegriffsrelation zu JOE-SMITH-ALS-KNABE hat und der zusätzliche Attribute zugeordnet werden können." (Quillian, 1969, p. 463)
Eine konsequente Durchführung dieses Ansatzes würde allerdings darauf hinauslaufen, daß für jeden neuen Zustand, in welchem eine Person sich befindet, eine neue Einheit geschaffen werden müßte. Ein Knoten wäre damit nicht mehr die begriffliche Repräsentation eines Objektes oder einer Klasse von Objekten, sondern eines Objektes in einem bestimmten Zustand. Soweit es bislang beschrieben wurde, ist das semantische Netzwerk von Quillian insofern sprachunabhängig, als keine Angaben darüber gemacht werden, wie die im Netzwerk enthaltenen Relationen in einzelsprachlichen Sätzen repräsentiert werden können. In den meisten semantischen Netzwerken sind solche Informationen, die den Transfer zwischen sprachlichen Sätzen und der Netzwerkstruktur bet r e f f e n , nicht in der semantischen Repräsentation selbst enthalten, sondern es wird angenommen, daß unabhängig vom Netzwerk Programme bestehen, die für die Analyse und Generierung von Sätzen zuständig sind. In beschränktem Maße repräsentiert jedoch Quillian in seinem Netzwerk auch solche, die Oberflächenstruktur betreffende Informationen. Dazu führt er drei zusätzliche Markierungen ein, die den in den Definitionen enthaltenen Tokens zugeordnet sind. Diese Markierungen bezeichnen Subjekte (S), direkte Objekte (D) u n d attributivische Modifikatoren (M). Der in Abbildung 5 gezeigte Plan für die Definition von „pflanzen" enthält zwei dieser syntaktischen Markierungen, S und D. Diese Definition könnte etwa folgendermaßen paraphrasiert werden: Eine Person bringt ein Objekt (= A), welches Samen, eine Pflanze oder ein anderes Objekt sein kann, in die Erde mit dem Zweck, daß dieses Objekt wächst. Die Markierungen S und D geben an, daß in englischen Sätzen, in denen diese Handlung beschrieben wird, die Person in der Rolle des Subjektes und das Gepflanzte in der Rolle des direkten Objektes stehen. Eine solche undifferenzierte Zuordnung zwischen Knoten im semantischen Netzwerk einerseits und Oberflächenkasus andererseits trifft natürlich nur für eine sehr eingeschränkte Anzahl von Sätzen mit dem Verb „pflanzen" zu, und es können leicht Sätze gefunden werden, in denen andere Zuordnungen bestehen. Dennoch ist es dank dieser grammatischen Markierungen möglich, mit dem System von Quillian in beschränktem Maße in natürlicher Sprache zu kommunizieren.
Suchprozesse in semantischen Netzwerken
45
Abb. 5: Die Definition von „pflanzen" nach Quillian (1968) pflanzen
bringen
=A
3. Suchprozesse in semantischen Netzwerken Auf der Grundlage des beschriebenen Netzwerkes simulierte Quillian zwei Aufgaben, deren Durchführung als Paradigmen sprachlicher Verstehensleistungen gelten kann. Die erste dieser beiden Aufgaben besteht darin, daß dem System jeweils zwei beliebige Wörter eingegeben werden, deren Definitionen im semantischen Netz enthalten sind, und daß das System darauf diese beiden Wörter in einen sinnvollen Zusammenhang bringt. Erhält das System etwa die beiden Wörter „Pflanze" und „Leben" dann produziert es die folgenden beiden Antworten: (1) Pflanze ist eine lebende Struktur. (2) Pflanze ist eine Struktur welche Nahrung erhält aus L u f t . Diese Nahrung ist Ding welches Lebewesen einnehmen muß, um am Leben zu bleiben. Wie dieses Beispiel zeigt, sind die Antwortsätze (auch im englischen Original) grammatisch schlecht. Das Programm für die Generierung der Oberflächensätze ist theoretisch auch uninteressant; denn es kam Quillian nicht darauf an, grammatisch richtige Sätze zu generieren, sondern er wollte Algorithmen für die Simulation von Suchprozessen im semantischen Langzeitgedächtnis entwickeln. Diese Suche hat n u n folgenden Ablauf: Ausgehend von den Type-Knoten, die den beiden eingegebenen Wörtern zugeordnet sind, werden die mit
46
Das semantische Netzwerk von Quillian
ihnen verbundenen Knoten so lange abgesucht, bis ein Knoten gefunden wird, der mit beiden der ursprünglichen Knoten verbunden ist. Zunächst werden dabei alle Knoten abgetastet, die mit den beiden ursprünglichen Types direkt verbunden sind, und jeder der abgetasteten Knoten wird durch eine Markierung gekennzeichnet. Trifft das System dabei auf einen Knoten, der schon markiert ist, dann ist eine Verbindung zwischen den beiden Knoten gefunden worden. So bildet, wie Abbildung 4 zeigt, der Knoten für „Struktur" das Verbindungsglied zwischen „Pflanze" und „Leben". Findet das System jedoch auf diese Weise keinen mit den beiden ursprünglichen Types direkt verbundenen Knoten, dann werden die Verbindungen aller derjenigen Knoten abgesucht, die in der ersten Phase des Suchprozesses markiert worden sind. Wird auch in dieser zweiten Phase keine Verbindung gefunden, dann werden die Relationen abgetastet, die von den in der zweiten Phase markierten Knoten ausgehen, usw. Für die zweite Lösung des oben gegebenen Beispieles wird in der ersten Phase ausgehend von „Pflanze" der Knoten für „ S t r u k t u r " gefunden. In weiteren Schritten werden darauf die Relation „erhalten", die Relation „von" und deren Subjekt ,.Nahrung" markiert (siehe Abb. 4). Daneben wird bei der vom Knoten für „Leb e n " ausgehenden Suche der Weg „ L e b e n " — „bleiben" — „ m u ß " — „Ding" — ) r Nahrung" gefunden. Erst nach all diesen Schritten ist ein Verbindungsweg zwischen „Pflanze" und „Nahrung" gefunden worden, der dann durch das Programm für die Satzgenerierung in einem oder mehreren Sätzen beschrieben wird. Die von Quillian verwendete Suchstrategie, bei der immer diejenigen Knoten zuerst abgetastet werden, die dem Ursprungsknoten am nächsten stehen, wird als „breadth-first" (zuerst in die Breite) — Strategie bezeichnet. Den Gegensatz dazu bildet die „depth-first" (zuerst in die Tiefe) — Strategie, bei der nach jedem abgetasteten Knoten alle mit diesem verbundenen Knoten abgesucht werden. Da diese beiden Begriffe für die künstliche Intelligenz wichtig sind, sollen sie im folgenden anhand eines Beispieles näher erklärt werden. Ein Schatzsucher steht an einer Flußgabelung. Weiter stromaufwärts gabeln sich die beiden Flußarme wieder, weiter oben nochmals usw. Abb. 6 ist eine schematische Darstellung der sich verzweigenden Flüsse, wobei der Schatzsucher an der Gabelung 1 steht. Der Schatzsucher weiß, daß an irgendeiner Gabelung ein Schatz vergraben ist. Er weiß aber nicht an welcher. Eine Möglichkeit, den Schatz zu finden, bestünde darin, daß er zunächst bei den beiden nächstliegenden Gabelungen (Knoten 2 und 3), danach bei den etwas entfernteren (Knoten 4, 5, 6 und 7) und so immer weiter flußaufwärts sucht. Dabei würde er nur dann weiter flußaufwärts ziehen, wenn er alle Gabe-
47
Suchprozesse im semantischen Netzwerk
lungen, die seinem Ursprungsort näher liegen, schon abgesucht hat. Dieses Vorgehen ist eine „breadth-first"-Suche. Sie hat den Nachteil, daß sich der Schatzsucher genau merken muß, an welchen Stellen er schon gegraben hat; denn sonst könnte es ihm passieren, daß er an einigen Stellen mehrmals gräbt, ohne andere Gabelungen je erreicht zu haben. Abb. 6: „Breadth-first" vs. „Depth-first" Suche in einem binären Baum
16 17
18 19
20 21
22 23
24 25
26 27
28 29
30 31
1 Reihenfolge der abgetasteten Knoten bei „breadth-first":
2, 3, 4, 5, 6, 7, 8,9, 10, 11 . . . Reihenfolge der abgetasteten Knoten bei „depth-first":
2,4,8,16,17,9,18,19,5,10,20... Eine andere Methode bestünde darin, daß der Schatzsucher nach folgenden drei Regeln vorgeht: 1. Gehe bei allen Gabelungen nach links. 2. Wenn der Fluß zu Ende ist, dann kehre um. 3. Grabe nur, nach dem du flußaufwärts gegangen bist. Nimmt man an, daß die Knoten 16 bis 31 in Abb. 6 die oberen Ende der Flüsse bezeichnen, dann wird der Schatzsucher den folgenden Weg beschreiten: 1-2-4-8-16-(8)-17-(8)-9-18-(9)-19-(9)-(4)-(2)-5-10. . . Die in Klammern gesetzten Zahlen bezeichnen hierbei die Gabelungen, an denen der Schatzsucher vorbeikommt, ohne zu graben. Diese Stellen kann er, ohne sie vorher markiert zu haben, mit Hilfe von Regel 3 erkennen. Diese zweite Strategie ist ein Beispiel einer „depthfirst" Suche. Die oben gegebenen drei Regeln sind übrigens auch bei drei- und mehrfachen Verzweigungen anwendbar.
48
Das semantische Netzwerk von Quillian
Auch bei Computerprogrammen für die Suche in verzweigten Baumstrukturen können diese beiden Suchstrategien verwendet werden. Die Regeln, nach welchen dabei gesucht wird, müssen hier allerdings andere sein, da beispielsweise Begriffe wie „rechts" und „links" innerhalb eines Programmes nicht verwendet werden können. Nilsson ( 1 9 7 1 ) beschreibt folgende beiden Algorithmen für „breadth-first"und für „deüth-first"-Suche, die in Computerprogrammen verwendet werden können. Der Algorithmus für die „breadth-first"-Suche enthält vier Regeln: 1. Mache eine Liste, die am Anfang der Suche nur die Nummer des Ursprungsknotens (in. Abb. 6 des Knotens 1) enthält. 2. Suche die Knoten, welche unmittelbar oberhalb des vordersten Knoten auf der Liste sind und hänge deren Nummern am Ende der Liste an. 3. Schaue, ob der erste Knoten der Liste die gesuchte Eigenschaft hat und entferne ihn dann von der Liste. 4. Gehe zu Regel 2. Der obere Teil von Tab. 8 zeigt, welche Knoten sich in welcher Reihenfolge auf der Liste befinden: Die in Klammern gesetzte Zeilennummer gibt dabei an, wie häufig die Schritte 2 bis 4 jeweils durchlaufen wurden. Beim ersten Durchlauf wird zunächst die Zahl des Ursprungsknotens (1) auf die Liste gesetzt. Bei der Durchführung von Regel 2 werden daran die Knoten 2 und 3 angehängt. Durch Anwendung von Regel 3 wird darauf der erste Knoten auf die gesuchte Eigenschaft hin überprüft und dann von der Liste entfernt. Am Ende des ersten Durchlaufes enthält die Liste also die Knoten 2 und 3. Im zweiten Durchlauf werden die Knoten 4 und 5 an die Liste angehängt und der Knoten 2 gestrichen. Bei der ersten Hälfte der insgesamt 3 0 Durchläufe wird jeweils ein Knoten von der Liste entfernt und es werden zwei Knoten angehängt. Bei der ,,breadth-first"-Suche in einem binären Baum mit η hierarchischen Ebenen wird die Liste 2 n Elemente lang. Der Baum in Abb. 6 hat vier hierarchische Ebenen und die Liste enthält damit — nach dem 15. Durchlauf — 16 Elemente. Bei der ,,breadth-first"-Suche in einem Baum mit drei Verzweigungen an jedem Knoten und mit insgesamt 10 Hierarchien würde die Liste 3 1 0 = 5 9 0 4 9 Elemente lang werden. Bei der „breadth-first"-Suche wird also jeweils derjenige Knoten, der dem Ursprungsknoten am nächsten ist, abgesucht und von der Liste entfernt, worauf die Liste durch die „Abkömmlinge" dieses Knotens ergänzt wird. Im Gegensatz dazu werden bei der „depthfirst"-Suche jeweils der zuletzt auf die Liste aufgenommenen Knoten expandiert, d. h. dessen ,^Abkömmlinge" werden auf die Liste gesetzt und abgesucht. Dieser Prozeß hat folgenden Algorithmus:
49
Suchprozesse in semantischen Netzwerken
1. Mache eine liste, die am Anfang der Suche nur die Nummer des Ursprungsknotens enthält. 2. Schaue ob der erste Knoten der Liste die gesuchte Eigenschaft hat und entferne ihn dann von der Liste. 3. Suche die Knoten welche unmittelbar oberhalb des Knotens sind, welcher in Schnitt 2 von der Liste entfernt wurde, und setze die Nummern dieser Knoten an den Anfang der Liste. 4. Gehe zu Regel 2. Tab. 8: Listen der bei der „breadth-first" und der „depth-first" Suche gespeicherten Knoten A. (0) (1) (2)
„Breadth-first" 1 2 3 4 5 6 7 8 9
3 4 5 6 7 8 9 10
5 6 7 8 9 10 11
7 8 9 10 11 12
(14) (15) (16)
15 16 17
16 17 18
17 18 19
18 19 20
(28) (29) (30)
29 30 31
30 31
31
(3) (4) (5) (6)
(7) (8)
B. (0) (1)
(2) (3) (4) (5) (6) (7) (8) (9)
(10)
(11) (12)
9 10 11 12 13
11 12 13 14
13 14 15
15 16
29
28 29 30
30 31
(13) (14)
11 22
3 23
(16)
(17) (18)
"3 6 12
7 13
(24) (25) (26) (27) (28) (29) (30)
'7 14 28 29 15 30 31
„Depth-first" 1 2 4 8 16 17 9 18 19 5 10 20 21
3 5 9 17 9 5 19 5 3 11 21 11
3 5 9 5 3 5 3 3 11 3
3 5 3 3
3
3
15 19 15 31
31
50
Das semantische Netzwerk von Quillian
Der untere Teil von Tab. 8 zeigt, welche Knoten sich nach jedem Ablauf der vier Regeln auf der Liste befinden. Da bei dieser Art von Suche jeweils nur ein Ast des Baumes expandiert wird, beträgt die maximale Anzahl von Elementen auf der Liste die Anzahl der hierarchischen Ebenen in dem binären Baum plus eins. Bei dem in Abb. 6 gezeigten Baum sind dies fünf Knoten. Noch deutlicher wird der Unterschied zwischen den beiden Suchmethoden in bezug auf die Größe der benötigten Liste, wenn man größere Bäume vergleicht: Während für die „breadth-first"-Suche durch einen Baum mit zehn hierarchischen Ebenen und drei Verzweigungen an jedem Knoten eine Liste von 59049 Elementen notwendig ist, benötigt man in diesem Fall für die „depth-first"-Suche lediglich eine Liste von 19 Elementen. Bei den in Tab. 8B gezeigten Listen handelt es sich um sogenannte „pushdown"-Listen, eine Struktur, die in der Computerwissenschaft und der künstlichen Intelligenz häufig verwendet wird. Eine „push-down"Liste enthält eine geordnete Menge von irgendwelchen Daten (in unserem Beispiel die Nummern von Knoten), wobei jeweils dasjenige Element, das als letztes in die Liste aufgenommen wurde, auch als erstes von der Liste entfernt wird (,,last-in-first-out"-Regel). Der Ausdruck „push-down" (herunterdrücken) verwendet das Bild von Stapeln von Tabletts oder Tellern, wie sie in manchen Selbstbedienungsrestaurants verwendet werden. Bei solchen, häufig in die Theke versenkbaren Stapeln können oben neue Teller oder Tabletts hinzugefügt werden. Entnimmt man ein Tablett, dann handelt es sich jeweils um das oberste, zuletzt auf den Stapel gelegte. Solche „push-down"Listen werden dann gebraucht, wenn eine hierarchisch geordnete Datenmenge verarbeitet wird, oder wenn hierarchisch geordnete Prozesse ablaufen. Die Liste ermöglicht es, zu jedem Zeitpunkte der Suche anzugeben, an welcher Stelle des Suchprozesses das System aktiv ist. Wie Tab. 8 zeigt, werden bei der „breadth-first"- und bei der ,,depth-first"-Suche gleichviele Schritte benötigt, um die gesamte Datenstruktur abzusuchen. Die Wahrscheinlichkeit, daß nach einer bestimmten Anzahl von Schritten das gesuchte Element gefunden wurde, ist also bei beiden Algorithmen gleichgroß. Deshalb wird, um den geringeren Speicherbedarf beim ,,depth-first"-Algorithmus auszunützen, im Bereich der künstlichen Intelligenz meist diese Suchmethode verwendet (Newell & Simon, 1972). Wenn Quillian trotzdem eine „breadth-first"-Suche verwendet, dann ist dies darum berechtigt, weil die oben angestellten Überlegungen nur unter den folgenden zwei Bedingungen zutreffen, die durch das Netzwerk von Quillian nicht erfüllt werden: Zunächst kann der beschriebene Algorithmus für die „depth-first"-
Suchprozesse im semantischen Netzwerk
51
Suche nur dann sinnvoll verwendet werden, wenn die Daten in einer Baumstruktur organisiert sind. Das Netzwerk von Quillian kann jedoch nicht als Baum dargestellt werden; denn es ist hier möglich, daß die von einem Knoten ausgehenden Verbindungen direkt oder indirekt wieder zu demselben Knoten zurückführen. So ist es beispielsweise denkbar, daß von dem Knoten für „ K u h " folgende Sequenz von miteinander verbundenen Knoten durchschritten wird, die beim Ursprungsknoten endet: „Kuh-essen-Gras-Pflanze-Lebewesen-Tier-Kuh". Damit kann es passieren, daß das System bei der Suche im Netzwerk in eine sog. endlose Schlaufe gerät, d. h. daß es immer den gleichen Zirkel durchführt, der es zum Anfangsort der Suche zurückführt. Um dies zu verhindern, muß das System bei jedem Schritt des Suchprozesses sicher stellen, daß der zuletzt erreichte Knoten während des bisherigen Suchprozesses noch nie auftauchte. Damit braucht man sowohl bei der „breadth-first"- wie auch bei der ,,depth-first"-Suche eine u. U. sehr lange Liste der bereits untersuchten Knoten. Bei den beiden oben beschriebenen Algorithmen wird eine sog. blinde Suche durchgeführt; d. h. der Suchprozeß verläuft in einer einmal festgesetzten fixen Reihenfolge, ohne daß dabei die Art der Daten berücksichtigt wird. Eine solche blinde Suche ist immer dann angebracht, wenn alle Knoten des Baumes in bezug auf die jeweilige Problemstellung als gleichwertig betrachtet werden können. Dies ist jedoch bei der von Quillian beschriebenen Aufgabe nicht der Fall; denn es geht ja nicht darum, in einem Netzwerk einen beliebigen Knoten mit einer bestimmten Eigenschaft zu finden, sondern darum, eine möglichst kurze Verbindung zwischen zwei Knoten aufzuzeigen. Für die Lösung dieser Aufgabe ist eine ,,breadth-first"-Suche darum von Vorteil, weil dabei die kürzeren Verbindungswege zuerst analysiert werden; man ist hier also sicher, daß die zuerst gefundene Verbindung zwischen zwei Knoten zugleich die kürzeste ist. Auch bei einer zweiten Aufgabe, deren Lösung Quillian (1969) auf der Basis seines semantischen Netzwerkes simulierte, verwendete er die ,,breadth-first"-Suche. Das Problem besteht hierbei darin, mit Hilfe des gespeicherten semantischen Wissens die Beziehungen zwischen Wörtern zu finden, die in eingegebenen Sätzen oder Satzfragmenten enthalten sind. Wird dem Programm, von Quillian „Teachable Language Comprehender (TLC)" genannt, beispielsweise der Ausdruck „der Kunde des Anwaltes" eingegeben, dann laufen folgende Prozesse ab: Zunächst wird für jedes der beiden Inhaltswörter „Kunde" und „Anwalt" eine Liste erstellt, die aus Zeigern zu allen Knoten im semantischen Netzwerk besteht, die mögliche Kandidaten für dieses Wort sind. Dies sind sowohl die Type-Knoten all derjenigen Begriffe, die durch dieses
52
Das semantische Netzwerk von Quillian
Wort bezeichnet werden können, als auch alle bekannten Tokens dieser Begriffe. Danach wird für die verschiedenen Knoten auf der Kandidatenliste mit Hilfe der oben beschriebenen ,,breadth-first"-Suche eine Verbindung zwischen zwei Knoten aus verschiedenen Kandidatenlisten gesucht. Im Plan für den Type „Kunde" finden sich Verbindungen zu den Knoten für , p e r s o n " — „beschäftigen" — „Berufstätiger (engl, professional)". Zwischen „Berufstätiger" und „Anwalt" besteht eine Oberbegriffsverbindung, so daß die Begriffe für die beiden eingegebenen Wörter durch eine Kette von vier Relationen miteinander verbunden werden können. Für jeden Knoten dieser Kette wird nun ein neuer Token-Knoten aufgebaut und die nun geschaffenen Knoten werden sowohl mit ihren Types ids auch miteinander verbunden. Die Verbindungen zwischen den neu geschaffenen Tokens sind dabei ein Abbild der Relationen, welche die beiden Types miteinander verketten. Die so aufgebaute Struktur von Tokens ist die semantische Tiefenstruktur des eingegebenen Satzes oder Satzfragmentes. Mit der beschriebenen Methode ist es bis zu einem gewissen Grade möglich, mehrdeutige Ausdrücke zu desambiguieren. Erhielte das System beispielsweise den Satz: „Peter schlug den Partner" dann wird es verschiedene Interpretationen geben, j e nachdem, ob Peter ein Tennisspieler oder ein Einbrecher ist. Unter der Voraussetzung, daß dem semantischen Netzwerk die entsprechenden Informationen eingegeben wurden, könnte im ersten Fall im Plan für „Sportler" gefunden werden, daß Sportler sich in Wettkämpfen zu besiegen versuchen, und daß der Begriff für „besiegen" auch durch das Verb „schlagen" ausgedrückt werden kann. Wie die Beispiele zeigen, spielen bei der Suche im semantischen Netzwerk die Oberbegriffsrelationen eine zentrale Rolle; denn in der Regel werden die Verbindungen zwischen Knoten auf dem Umweg über deren Oberbegriffe gefunden. Wenn das System auf Grund der im Netzwerk gespeicherten Informationen über die Wortbedeutungen eine mögliche semantische Tiefenstruktur des eingegebenen Textes gefunden hat, dann wird mit sog. Form-Tests überprüft, ob der vermutete semantische Zusammenhang zwischen den Wörtern durch die syntaktische Struktur der eingegebenen Wortkette repräsentiert werden kann. Diese Form-Tests sind den Type-Knoten zugeordnet. Ein in dem Knoten für „Kunde" enthaltener Form-Test muß beispielsweise angeben, daß die Relation ,,Kunde-beschäftigen-Berufstätiger" in der Oberflächenstruktur dadurch repräsentiert werden kann, daß der Kunde Subjekt und der Berufstätige nachgestelltes Genitivobjekt ist. Findet das System eine syntaktische Form, die noch nicht unter den Form-Tests gespeichert ist, dann wird die Liste der Form-Tests automatisch um diese Form er-
Die Uberprüfung des Quillian'schen Modells
53
weitert. Der Teachable Language Comprehender ist damit in zwei Punkten „lehrbar": zum einen werden die eingelesenen Texte Teil des semantischen Netzwerkes, und das so aufgebaute Wissen kann bei der Analyse späterer Texte verwendet werden; zum anderen kann das System ihm unbekannte grammatische Formen als solche erkennen und abspeichern. Im Vergleich mit früheren Systemen zur automatischen Spracherkennung kommt beim Teachable Language Comprender nicht der grammatischen Analyse der eingegebenen Wortketten die Priorität zu, sondern der Bestimmung der semantischen Relationen zwischen den Wörtern auf Grund von deren Bedeutungen. Allerdings sind, wie Quillian selbst bemerkt, die verwendeten Mechanismen noch sehr mangelhaft. Wird dem System beispielsweise die Kette „die Frau des Anwaltes" oder „der Feind des Anwaltes" eingegeben, dann wird es auch hier, da Frauen und Feinde Kunden sein können, annehmen, daß die Frau, bzw. der Feind der Kunde des Anwaltes sind. Quillian's Ansatz, Sätze mit Hilfe der Bedeutungen der in ihnen enthaltenen Wörter zu analysieren, wurde jedoch für die späteren Arbeiten auf diesem Gebiet wegweisend.
4. Die Überprüfung des Quillian'schen Modelles durch Reaktionszeitexperimente Quillian postulierte, daß das von ihm beschriebene seman tische Netzwerk als psychologisches Modell für die Struktur des semantischen Langzeitgedächtnisses betrachtet werden kann. Deshalb ist es legitim, dieses Modell mit Hilfe von experimentell gewonnenen Verhaltensmessungen auf seine psychologische Validität zu überprüfen. Dies geschah in einer großen Zahl von Experimenten, die in den letzten Jahren veröffentlicht worden sind. Dabei wurden auf Grund des Quillian'schen Modelles Hypothesen aufgestellt, wie viele Suchschritte im semantischen Netzwerk für das Auffinden bestimmter Inhalte benötigt werden, und diese Hypothesen wurden darauf mit den Reaktionszeiten von Vpn verglichen, die nach diesen Inhalten gefragt wurden. Ein solcher experimenteller Ansatz basiert auf der Annahme daß die für den Vollzug einer Aufgabe benötigte Zeitspanne von der Anzahl der Elemente im Gedächtnis abhängt, die dabei abgesucht werden müssen, eine Annahme, die von Sternberg (1966, 1969) in einer Reihe von Experimenten bestätigt werden konnte. Dabei erhielten die Vpn als Lernlisten Gruppen von Ziffern dargeboten und mußten danach bei einem Wiedererkennungsversuch entscheiden, ob eine be-
54
Das semantische Netzwerk von Quillian
stimmte Ziffer, das Prüfelement, in der vorher gezeigten Gruppe enthalten war· oder nicht. Die Anzahl der Ziffern pro Gruppe variierte in den verschiedenen experimentellen Bedingungen zwischen eins und sechs. Dabei zeigte sich, daß die Zeitspanne, die für das Wiedererkennen einer Ziffer benötigt wurde, mit zunehmender Anzahl von Elementen in der Lernliste linear anstieg. Interessanterweise war dieser Effekt gleichstark, wenn das Prüfelement nicht Teil der Lernliste war, d. h. wenn von den Vpn eine negative Antwort erwartet wurde. Aus diesen Eperimenten können verschiedene Folgerungen gezogen werden. Zunächst zeigen sie, daß beim Vergleich des Prüfelementes mit den Elementen der Lernliste diese nicht simultan, in einer sog. parallelen Suche abgetastet werden, sondern in zeitlicher Sukzession, in einem seriellen Suchprozeß. Die Vergrößerung der Lernlisten um jeweils eine Ziffer verlängerte die Reaktionszeit (RZ) beim Wiedererkennungsversuch um ca. 38 msec, und man kann annehmen, daß dies die Zeitspanne ist, welche für den Vergleich zwischen einem Element der Lernliste und dem Prüfelement benötigt wird. Diese Zeitspanne ist geringer als die für das Aussprechen der Ziffer benötigte Zeit, was darauf schließen läßt, daß es sich beim Abtasten nicht um ein akkustisches memorieren der Lernliste handeln kann. In Anbetracht dieser kurzen Suchzeiten bezeichnet Sternberg die Suche als einen „highspeed scanning process", als einen Prozeß des sehr schnellen Abtastens. Im weiteren lassen die gemessenen RZen darauf schließen, daß beim Wiedererkennungsversuch jeweils alle Elemente der Lernliste abgetastet werden. Ein anderes, und zunächst plausibler scheinendes Vorgehen bestünde darin, daß die Vpn die Lernliste nur so weit abtasten, bis sie darin ein der Prüfliste identisches Element gefunden hätten. Da das Prüfelement ein zufälliges Element aus der Lernliste ist, müßten die Vpn bei dieser Strategie im Durchschnitt die Hälfte der Elemente der Lernliste abtasten, bevor sie auf die dem Prüfelement identische Ziffer stoßen. Ist das Prüfelement jedoch nicht Teil der Lernliste, dann müssen in jedem Fall alle Elemente der Lernliste abgetastet werden, bevor eine negative Antwort gegeben werden kann. Dies hätte zur Folge, daß der durch die Verlängerung der Lernliste bedingte Anstieg der RZen bei negativen Prüfelementen doppelt so hoch wäre wie bei positiven Elementen. Die Ergebnisse von Sternberg falsifizierten jedoch diese Voraussage. Eine detaillierte Analyse der RZen der beschriebenen und weiterer Experimente führte Sternberg zum Postulat der „Additivität der R Z e n " . Dieses Postulat besagt, daß bei Aufgaben, bei denen verschiedene Prozesse durchgeführt werden müssen, die RZ der additiven Summe der für die einzelnen Prozesse benötigten Zeitspannen ent-
Die Uberprüfung des Quillian'schen Modelles
55
spricht. Eine Überprüfung dieses Postulates ermöglicht die sog. Subtraktionsmethode: Wenn eine Aufgabe so modifiziert wird, daß einer der dafür benötigten Teilprozesse wegfällt, dann müßte die RZ der modifizierten Aufgabe derjenigen der ursprünglichen minus der für den wegfallenden Teilprozeß benötigten Zeit entsprechen. Dies bestätigte Sternberg in einem Experiment, in dem er die Erkenntlichkeit des Prüfelementes im Wiedererkennungsversuch systematisch variierte. Dabei zeigte sich, daß eine Verminderung der Erkenntlichkeit die RZen erhöhte, daß dieser Effekt jedoch nicht mit anderen experimentellen Variablen kovariierte. Wenn man annimmt, daß bei der Suche im semantischen Langzeitgedächtnis ähnliche Prozesse ablaufen wie bei den Experimenten von Sternberg, dann kann das Modell von Quillian mittels Reaktionszeitexperimenten überprüft werden: Bei Aufgaben, zu deren Vollzug eine Suche im Langzeitgedächtnis notwendig ist, müßte die RZ in linearer Abhängigkeit von der Zahl der abgesuchten Knoten anwachsen. Collins und Quillian (1969) überprüften dies durch ein Experiment mit folgendem A u f b a u : Die Vpn erhielten Sätze von der Form „Ein Vogel ist ein Tier" oder „Ein Vogel hat Flügel" visuell dargeboten und mußten so schnell wie möglich durch Knopfdruck angeben, ob sie den dargebotenen Satz für wahr oder falsch hielten. Nun läßt sich angeben, wie viele Schritte in einem semantischen Netzwerk gebraucht werden, um eine Verbindung zwischen dem Subjekt und dem Prädikatteil der vorgegebenen Sätze herzustellen. Bei dem Satz „Ein Vogel ist ein Tier" genügt eine Verbindung, die Oberbegriffsrelation, welche die entsprechenden beiden Knoten miteinander verknüpft. Bei dem Satz „Ein Adler kann sich bewegen" werden jedoch drei Verbindungen benötigt: Die Oberbegriffsrelationen zwischen „Adler" und „Vogel" und zwischen „Vogel" und „Tier" und die attributive Relation zwischen „Tier" und „bewegen". Tab. 9 zeigt je ein Beispiel für die in dem Experiment von Collins und Quillian verwendeten zwölf Arten von Stimulussätzen. Diese unterscheiden sich voneinander in bezug auf drei Dimensionen: Die Anzahl hierarchischen Ebenen zwischen dem Subjekt und dem Prädikat, die Art der Relation, die zwischen Subjekt und Prädikat besteht (Oberbegriffs- vs. attributive Relation), und die Wahrheit bzw. Falschheit des Satzes. Entsprechend den oben beschriebenen Überlegungen vermuteten die Autoren, daß die RZen mit zunehmender Anzahl hierarchischer Ebenen zwischen Subjekt und Prädikat anwachsen, und daß bei Oberbegriffssätzen kürzere RZen auftreten als bei attributiven Sätzen. Diese Hypothesen konnten weitgehend bestätigt werden: Mit zunehmender Distanz in der Hierarchie wuchsen die RZen linear an und die Urteile bei attributiven Sätzen waren um
56
Das semantische N e t z w e r k von Quillian
Tab. 9: Stimulussätze in dem Experiment von Collins Sc Quillian ( 1 9 6 9 ) Arten der Relationen
Zw. Subj. und Präd. liegende hierarchische Ebenen Γ
Nur Oberbegriffsrelationen
Oberbegriffsund attributive Relationen
0
-{
1
l
2
1
Γ0 i
1 l
2
Wahre
Sätze
Ein Adler ist ein Adler Ein Adler ist ein Vogel Ein Adler ist ein Tier Ein Adler hat Krallen Ein Adler kann fliegen Ein Adler kann sich bewegen
Falsche
Sätze
Ein Adler ist ein Sperling Ein Adler ist ein Fisch Ein Adler ist eine Pflanze Ein Adler ist gelb Ein Adler hat Schuppen Ein Adler ist flüssig
einen konstanten Betrag langsamer als die Urteile für Oberbegriffssätze. Die einzigen Abweichungen von diesem Muster bilden die RZen für Sätze vom Typ „Ein Adler ist ein Adler" und „Ein Adler ist ein Sperling". Erstere hatten ungewöhnlich kurze und letztere ungewöhnlich lange RZen. Collins Sc Quillian interpretieren die kurzen Zeiten damit, daß bei identischem Subjekts- und Prädikatswort keine Suche im semantischen Netzwerk benötigt wird, sondern daß die Vpn hier lediglich die graphematische Form der beiden Wörter durch eine Art ,,pattern-match" vergleichen. Während die RZen bei wahren Sätzen das Modell von Quillian zu bestätigen scheinen, können die RZen bei falschen Sätzen durch diesen Ansatz nicht ohne weiteres erklärt werden. Auch hier erhöht sich die RZ mit zunehmender Distanz zwischen Subjekt und Prädikat. Nach Quillian fällt jedoch die Vp eine falsch-Entscheidung dann, wenn bei der Suche innerhalb einer bestimmten Anzahl von Ebenen sämtliche Verbindungen erfolglos abgetastet wurden; demnach dürfte die für eine falsch-Entscheidung benötigte Zeit nicht vom vorgegebenen Satztyp abhängen. Ein alternatives Modell, durch welches die RZen sowohl von wahren als auch von falschen Sätzen richtig vorausgesagt werden, bildet der mengentheoretische Ansatz von Landauer und Freedman (1968). Diese beiden Autoren führten einen Versuch mit dem gleichen Aufbau wie Collins & Quillian durch, in dem den Vpn Oberbegriffssätze dargeboten wurden. Unabhängige Variable war hier jedoch nicht die Anzahl der hierarchischen Ebenen, die zwischen Subjekt und Prädikat liegen, sondern die Größe der Klassen, die durch Subjekt und Objekt bezeichnet werden. Die Größe dieser Klassen kann mit zwei verschiedenen Methoden bestimmt werden: Bei der sog. subjektiven Methode wird den Vpn die Klassenbezeichnung — ζ. B. das Wort „Tier"
Die Uberprüfung des Quillian'schen Modelles
57
— vorgegeben und sie müssen innerhalb einer festgesetzten Zeitspanne soviele Instanzen dieser Klasse produzieren wie möglich. Die Anzahl der produzierten Instanzen kann dann als Maß für die Klassengröße verwendet werden. Bei der sog. logischen Methode werden die mengentheoretischen Relationen zwischen den verschiedenen Klassen überprüft. S o bildet ζ. B. die Klasse der Gemüse eine Untermenge der Klasse der Pflanzen und damit handelt es sich bei den Gemüsen um die kleinere der beiden Klassen. Es ist offensichtlich, daß die so gemessenen Größenrelationen zwischen Klassen mit der hierarchischen Distanz in einem Quillianischen Netzwerk kovariieren. Landauer und Freedmann ( 1 9 6 8 ) fanden nun, daß die R Z e n sowohl bei wahren als auch bei falschen Sätzen mit anwachsendem Größenunterschied zwischen der durch das S u b j e k t und der durch das Prädikat bezeichneten Klasse zunahmen. Sie interpretieren dieses Resultat damit, daß die Vpn die Unterkategorien und Instanzen des im Prädikat bezeichneten Oberbegriffes absuchen, bis eine dieser Instanzen dem Subjektwort des Satzes entspricht. Sowohl bei wahren als auch bei falschen Sätzen würde dabei die Anzahl der notwendigen Vergleiche mit zunehmender Kategoriengröße des Oberbegriffes anwachsen. Diese von Landauer und Freedmann gegebene Interpretation wird durch die Resultate eines Experiments von Landauer und Meyer ( 1 9 7 2 ) bestätigt: Auch hier hatten die Vpn die Aufgabe, die Wahrheit bzw. Falschheit von Oberbegriffssätzen zu bestimmen. Dabei wurde anstelle des Subjektswortes eine sinnlose Silbe verwendet (ζ. B. „Ein Peck ist ein V o g e l " ) . Die für die falsch-Entscheidung benötigte Zeit wuchs auch in diesem Experiment mit zunehmender Kategoriengröße des Prädikates an. Landauer 8c Freedmann sehen den Vorteil ihres Ansatzes nicht nur darin, daß die Resultate sowohl von wahren als auch von falschen Oberbegriffssätzen erklärt werden können, sondern auch darin, daß er einfacher ist und weniger Annahmen über die Struktur des LZG enthält. Allerdings können aus dem Modell von Landauer & Freedman weitergehende Voraussagen über die R Z von falschen Sätzen deduziert werden, die experimentell nicht bestätigt wurden. In einem falschen Oberbegriffssatz können drei verschiedene mengentheoretische Beziehungen zwischen Subjekt und Prädikat bestehen: Das S u b j e k t kann Oberbegriff des Prädikates sein (,,AIIe Tiere sind V ö g e l " ) , die Bedeutungen können sich überschneiden („Alle Pflanzen sind Nahrungsmittel") oder sie können disjunktiv sein („Alle Menschen sind Pflanzen"). Nach Landauer 8c Freedman dürften sich die R Z e n bei diesen drei T y p e n von falschen Sätzen nicht unterscheiden. Dies wurde von Meyer ( 1 9 7 0 , 1 9 7 3 , 1 9 7 5 ) in einer R e i h e von E x p e r i m e n t e n überprüft. Wie bei Landauer 8c Freedman, so variierte auch Meyer
58
Das semantische Netzwerk von Quillian
die Größenrelationen zwischen den Subjekt-und Prädikatskategorien. Dabei untersuchte er unabhängig voneinander die Effekte, die durch eine Vergrößerung, bzw. Verkleinerung der Subjektkategorie und die durch eine Vergrößerung, bzw. Verkleinerung der Prädikatskategorie entstanden. Zudem präsentierte er nicht nur Sätze von der Form „Alle S sind P " sondern auch die Satzformen ,.Einige S sind P", „Kein S ist P" und „Einige S sind P". Es lassen sich in den Versuchen von Meyer also folgende vier unabhängige Variablen unterscheiden: 1. Die mengen theoretische Relation zwischen der Subjekt- und Prädikatskategorie: Oberbegriff („Alle Vögel sind Tiere"); Unterbegriff („Alle Tiere sind Vögel"); Überschneidung („Alle Nahrungsmittel sind Pflanzen"); Disjunktion (,,Alle Pflanzen sind Tiere"). 2. Größe der Subjektkategorie: klein („Alle Adler sind Tiere"); groß („Alle Vögel sind Tiere"). 3. Größe der Prädikatskategorie: klein („Alle Adler sind Vögel"); groß („Alle Adler sind Tiere"). 4. Satzform: universal affirmativ („Alle Vögel sind Tiere"); existential affirmativ („Einige Vögel sind Tiere"); universal negativ („Keine Vögel sind Tiere"); existential negativ („Einige Vögel sind keine Tiere"). Tab. 10 zeigt die von Meyer beobachteten Reaktionszeiten. Bei den wahren Sätzen steigt die RZ an, wenn der Größen unterschied zwischen Subjekt- und Prädikatkategorie zunimmt. Dieser Effekt zeigte sich bei allen Satzformen und unabhängig davon, ob der Größenunterschied durch eine Ersetzung des Subjekt- oder Prädikatwortes verändert wurde. Dieses Resultat bestätigt die von Collins & Quillian gefundenen Ergebnisse. Interessanter sind hier die Effekte der anderen unabhängigen Variablen und deren Wechselwirkungen, von deren drei besonders auffällig sind: 1. Bei den affirmativen Sätzen haben die universalen Urteile längere RZen als die existentialen; dieser E f f e k t ist bei disjunktiven Relationen schwächer als bei den anderen mengentheoretischen Verhältnissen. 2. Die Effekte der unabhängigen Variablen auf die RZen zeigen bei affirmativen existentialen und bei negativen universalen Sätzen in die gleiche Richtung. Bei letzteren sind die Effekte jedoch stärker. 3. Bei affirmativen disjunktiven Sätzen hat die Veränderung der Prädikatkategorie einen stärkeren Effekt auf die RZen als die Veränderung der Subjektkategorie. Meyer interpretiert diese von ihm gefundenen recht komplexen und nur schwer überschaubaren Abhängigkeiten damit, daß die Suche im LZG in folgenden zwei Stufen ablaufe: Bei der Darbietung eines Satzes suchen die Vpn zunächst danach, ob sich die beiden Katego-
Die Uberprüfung des Quillian'schen Modelles
59
Tab. 10: Reaktionszeiten in den Experimenten von Meyer Mengenrelation
Subj.- Präd.Größe Größe
UA(70) UA(75) EA(70) EA(73)
Unterbegriff
klein groß
Konst.
1259* 1140*
1309* 1200*
1110* 941*
1088* 1012*
1326 1194
1845 1715
Oberbegriff
klein groß
Konst.
1252 1296
1338 1386
922* 1147*
973* 1109*
1173 1350
1838* 1732*
Überklein schneidung groß
Konst.
1289 1253
1268 1296
1088* 1079*
1080* 1086*
1364 1343
1710* 1700*
Disjunktion
klein groß
Konst.
1150 1160
1206 1242
1092 1122
1160 1177
1302* 1380*
1601* 1630*
Unterbegriff
Konst.
klein groß
1142* 1196*
1189* 1265*
887* 1085*
953* 1084*
1170 1332
1830 1780
Oberbegriff
Konst.
klein groß
1351 1497
1364 1516
1098* 934*
1097* 998*
1389 1254
1785* 2065*
Überklein Konst. schneidung groß
1244 1265
1319 1330
1133* 1134*
1127* 1094*
1384 1367
1711* 1778*
Disjunktion
1124 1182
1223 1302
1105 1142
1150 1205
1314* 1386*
1582* 1743*
Konst.
klein groß
UN(73) EN(75)
UA = Universell affirmativ EA = Existentiell affirmativ UN = Universell negativ EN = Existentiell negativ. Die Zahlen in Klammern bezeichnen das Erscheinungsjahr des entsprechenden Experimentes. Bei den durch * gezeichneten Werten handelt es sich um wahrUrteile, bei den anderen Werten um falsch-Urteile.
rien irgendwie überschneiden. Dies trifft bei allen mit Ausnahme der disjunktiven Sätze zu. Wird eine solche Uberschneidung gefunden, dann sind existentiale affirmative Sätze wahr und universale negative Sätze falsch. Besteht keine Überschneidung, dann sind universal und existential affirmative Sätze feilsch und universal und existential negative Sätze wahr. Bei einer ganzen Reihe von Satztypen kann also schon nach diesem ersten Vergleich entschieden werden, ob sie wahr oder falsch sind. Bei anderen Sätzen reicht jedoch die Information, ob sie disjunktiv sind, nicht aus, um ein wahr-, bzw. falsch-Urteil zu fällen. So sind die drei Sätze „Alle Bäume sind Pflanzen", „Alle Pflanzen sind Bäume" und „Alle Pflanzen sind Nahrungsmittel" alle nicht-disjunktiv. Nur der erste davon ist jedoch wahr. Dies kann von der Vp in einem zwei-
60
Das semantische Netzwerk von Quillian
ten Schritt mit Hilfe einer genaueren Analyse der beiden Begriffe gefunden werden. Bei der Beschreibung dieses zweiten Schrittes macht Meyer die Annahme, daß den einzelnen Begriffen Attribute zugeordnet sind, wobei jeder Begriff sowohl mit den für ihn spezifischen Attributen als auch mit den Attributen seiner Oberbegriffe verbunden ist. Aus dieser, dem Modell von Collins & Quillian widersprechenden Annahme folgert, daß allgemeineren Begriffen weniger Attribute zugeordnet sind als deren spezifischeren Unterbegriffen. Beim zweiten Schritt der Suche wird nun nach Meyer für jedes Attribut des Prädikates danach gesucht, ob auch dem Subjekt dieses Attribut zugeordnet ist. Trifft dies zu, dann sind Sätze von der Form ,,Alle S sind P " wahr und Sätze von der Form „Einige S sind nicht P " falsch. Dieses zwei-Stufen Modell erlaubt eine recht gute Voraussage der in Tab. 10 zusammengefaßten Daten. So erklärt es, daß die RZen bei disjunktiven Sätzen kleiner sind, da bei diesen nur auf der ersten Stufe gesucht werden muß. Auch die Unterschiede zwischen universal affirmativen und existential affirmativen Sätzen und zwischen existential negativen und universal negativen Sätzen können auf diesen Faktor zurückgeführt werden. Die höheren RZen bei negativen Sätzen führt Meyer dabei auf zusätzliche Prozesse zurück, die wegen der komplexeren sprachlichen Oberflächenform notwendig sind. Die Beobachtung, daß bei disjunktiven Sätzen eine Modifikation des Prädikates einen größeren Effekt auf die RZen hat als die Modifikation des Subjektes, erklärt sich daraus, daß in Schritt eins alle Instanzen des Prädikates abgesucht werden. Die Anzahl der abgesuchten Instanzen wächst damit mit zunehmender Allgemeinheit des Prädikates an, ist jedoch von der Kategoriengröße des Subjektes unabhängig. Abbildung 7 zeigt die von Meyer geschilderten Prozesse. Das rein mengentheoretische Modell von Meyer hat nicht nur den Vorteil, daß damit die Unterschiede zwischen den RZen bei Satztypen mit verschiedenen Quantifikationen erklärt werden können. Zudem können auch andere Beobachtungen nur unter der Annahme erklärt werden, daß die RZen bei der Verifikation von Sätzen von der Größe der Kategorien zumindest mitbestimmt werden. Einen recht eindrücklichen Hinweis dafür bilden die Resultate der bereits zitierten Untersuchung von Landauer & Meyer (1972), in der den Vpn Oberbegriffsätze dargeboten wurden, bei denen anstelle des Subjektwortes eine sinnlose Buchstabenfolge stand. Die dabei beobachtete Abhängigkeit der RZen von der Größe der Prädikatskategorie zeigt, daß die Ergebnisse der Versuche nach dem Collins & Quillian-Paradigma nicht ausschließlich durch die Relation zwischen den Subjekt- u n d den Prädikatkategorien determiniert werden. Allerdings gibt dieses Experiment keinen
Die U b e r p r ü f u n g des Quillian'schen Modelles
61
Hinweis darauf, in welcher Weise die Kategoriengröße die R T beeinflußt. Abb. 7: Die B e s t i m m u n g der Richtigkeit von quantifizierten Aussagen nach Meyer ( 1 9 7 0 )
Eine ganze Reihe von anderen Beobachtungen zeigen jedoch, daß in dem Modell von Meyer zu wenig Annahmen über die Struktur der Begriffe und deren gegenseitige Relationen enthalten sind. Die in diesem Modell beschriebene Begriffsstruktur könnte mit einem Sack
62
Das semantische Netzwerk von Quillian
Kartoffeln verglichen werden, wobei die Vpn bei der Verifikation von Oberbegriffssätzen zu bestimmen haben, ob sich eine bestimmte Kartoffel in einem bestimmten Sack befindet oder nicht. Die Länge des Suchens würde sich in diesem Falle proportional zu der Größe des Kartoffelsackes verhalten. Nun läßt sich die Relation zwischen einem Begriff und dessen Oberbegriff jedoch nicht ausschließlich aus der Größe der beiden Kategorien ableiten, denn deren Stärke kann unabhängig von der mengentheoretischen Relation zwischen den beiden Begriffen variieren. Dies zeigte sich etwa in folgenden Versuchen von Wilkins (1971): In einem ersten Experiment wurde den Vpn eine Reihe von Wörtern vorgelegt, und sie hatten die Aufgabe, Instanzen der vorgelegten Begriffe zu nennen. Damit war es möglich, zwei Arten von Oberbegriffsurteilen zu bilden: Sätze von der ersten Art enthielten solche Begriffspaare, bei denen das Subjektwort nach Vorgabe des Oberbegriffes häufig genannt worden war; bei Sätzen vom zweiten Typ war das Subjektwort nach Vorgabe des Oberbegriffes selten genannt worden. Wilkins spricht in diesem Zusammenhang von starker und schwacher Verbundenheit (conjoint frequency) der beiden Begriffe. Diese beiden Arten von Oberbegriffssätzen wurden nun einer anderen Gruppe von Vpn zur Verifikation vorgelegt. Dabei zeigte sich, daß die RZen geringer waren, wenn Sätze mit starker Verbundenheit zwischen Subjekt und Prädikat verifiziert werden mußten, als wenn die Verbundenheit zwischen Subjekt und Prädikat gering war. Ähnliche Resultate zeigten sich auch in einem Experiment von Conrad (1972), in welchem folgende Methode zur Gewinnung des Versuchsmaterials benützt wurde: Die Vpn erhielten einzelne Begriffe vorgegeben und hatten die Aufgabe, diese Begriffe zu definieren. Dabei bildeten die Vpn Sätze mit Oberbegriffs- und attributiven Relationen, wie sie in der zweiten Hälfte von Tabelle 9 beschrieben sind. Die so gebildeten Sätze wurden von Conrad zunächst klassifiziert in solche, die in den Protokollen der Vpn häufig vorkommen, und solche, die selten vorkommen. Bei jeder dieser beiden Gruppen wurden die Sätze noch einmal klassifiziert nach der Anzahl der hierarchischen Ebenen in einem Quillian'sehen Netzwerk, durch welche die Begriffe von den Attributen getrennt sind. Tabelle 11 zeigt diese Klassifikation und gibt je einen Beispielsatz.
Die Beschreibung von Begriffen durch semantische Merkmale
63
Tab. 11: Die Klassifizierung der Sätze in dem Experiment v o n Conrad ( 1 9 7 2 ) Zwischen Subjekt u n d Prädikat liegende hierarchische E b e n e n 0 1 2
Häufig genannte Sätze
Selten genannte Sätze
Ein Tier kann sich bewegen. Ein Vogel kann sich bewegen. Ein Hai kann sich bewegen.
Ein Tier hat Ohren. Ein Fisch hat Augen. Ein Lachs hat einen Mund.
Wie in dem Versuch von Wilkins, so wurden auch diese Sätze einer anderen Gruppe von Vpn zur Verifikation vorgelegt. Verglich man die RZen von Sätzen, die im ersten Versuch gleichhäufig bzw. gleichselten produziert wurden, dann zeigte sich keine Abhängigkeit zwischen RZen und der Anzahl hierarchischer Ebenen zwischen dem Subjekt und dem Prädikat. Andererseits waren die RZen geringer, wenn es sich um Sätze handelte, die im ersten Versuch häufig produziert wurden, als bei Sätzen, die im ersten Versuch selten produziert wurden.
5. Die Beschreibung von Begriffen durch semantische Merkmale Die beiden Experimente von Wilkins und von Conrad zeigen also, daß die RZen beim Verifizieren von Sätzen nicht nur von der Größe der Subjekt- und Objektkategorie und von der Beziehung zwischen Subjekt und Objekt in einem Quillian'schen Netzwerk abhängen. Damit stellt sich die Frage, welche anderen Faktoren zur Erklärung dieser Ergebnisse herangezogen werden müssen. Für Wilkins selbst ist dies unproblematisch; denn er nimmt an, daß die Verbundenheit an sich die kritische Variable darstelle: Die RZ würde von der Verbundenheit zwischen Subjekt- und Objektwort bestimmt werden, und es wäre müßig, die Verbundenheit auf andere Variablen zurückführen zu wollen. Die Verbundenheit wird von Wilkins also nicht nur als beschreibende, sondern auch als erklärende Variable betrachtet; der Begriff der Verbundenheit b e k o m m t damit den gleichen theoretischen Status wie der Begriff der Assoziationsstärke in der Assoziationstheorie. Tatsächlich könnte für die Erklärung der Experimente nach dem Collins & Quillian Paradigma auch die Assoziationstheorie herangezogen werden; denn es konnte gezeigt werden, daß RZen auch von der Assoziationsstärke zwischen Subjekt- und Objektwort
64
Das semantische Netzwerk von Quillian
abhängen (Millward, Rice Sc Corbett, 1975). Am Ende von Kap. 2 wurde jedoch zu zeigen versucht, daß Erklärungen, die auf dem Begriff der Assoziationsstärke basieren, Scheinerklärungen sind. Das gleiche gilt nun auch für den von Wilkins eingeführten Begriff der Verbundenheit; denn wie die Assoziationsstärke, so muß auch die Verbundenheit als Produkt dahinterliegender Strukturen und Prozesse betrachtet werden, und erst die Aufdeckung dieser Faktoren darf als Erklärung der beobachteten Phänomene betrachtet werden. Auch eine genauere Analyse der Umgangssprache zeigt, daß zwischen einem Begriff und dessen Oberbegriff verschiedene Arten von Beziehungen bestehen können, die auf keinen der bislang erwähnten Faktoren zurückführbar sind. So untersuchte Lakoff ( 1 9 7 2 ) , auf welche Weise der Wahrheitsgehalt von Oberbegriffssätzen durch Adverbiale wie „wirklich", „streng genommen" oder „lax gesprochen" be einflußt wird. So klingt etwa der Satz Streng genommen ist ein Pinguin ein Vogel durchaus normal, nicht jedoch der Satz Streng genommen ist eine Krähe ein Vogel. Dies liegt nach Lakoff daran, daß der Pinguin zwar der Definition nach ein Vogel ist, daß ihm im Gegensatz zur Krähe jedoch wichtige Merkmale, die normalerweise mit dem Begriff des Vogels verbunden werden, nicht zukommen. Ein solches wichtiges, aber nicht definitorisches Merkmal ist etwa die Fähigkeit zu fliegen. Hat ein Begriff andererseits eine Reihe von Merkmalen mit einem zweiten Begriff gemeinsam, ist er jedoch seiner Definition nach kein Unterbegriff des zweiten Begriffes, dann kann dieser Zusammenhang durch Adverbiale wie „lax ausgedrückt" oder „cum grano salis" beschrieben werden: Lax ausgedrückt ist ein Wal ein Fisch. Bestehen zwischen einem Begriff und seinem — streng genommen falschen — Oberbegriff lediglich gewisse äußere Ähnlichkeiten, dann wird das Adverb „richtig" gebraucht. Von einer Person, die viel, gerne und gut schwimmt, könnte man beispielsweise sagen: Sie ist ein richtiger Fisch. Aufgrund der Analyse des Gebrauches von solchen einschränkenden Adverbien, die von ihm als „hedges" bezeichnet werden, postulierte Lakoff drei Arten von semantischen Merkmalen: 1. Merkmale, die Teil der Definition des Begriffes sind; ein beispielsweise für den Begriff „Fisch" definitorisches Merkmal ist etwa die Kiemenatmung. 2. Merkmale, die für einen Begriff zwar wichtig sind, jedoch nicht zu dessen Definition gehören; ein solches Merkmal ist, wie schon oben erwähnt wurde, das Merkmal „Fähigkeit zu fliegen" für den Begriff Vogel. 3. Merkmale, die für einen Begriff unwichtig sind und lediglich dessen Erscheinung betreffen; solche Merkmale sind in der Regel die
Die Beschreibung von Begriffen durch semantische Merkmale
65
Farben von Objekten. Die Bedeutung eines Begriffes ist nach L a k o f f das Gesamt aller semantischer Merkmale, sowohl der definitorischen, der wichtigen, als auch der unwichtigen Merkmale. Damit könnte die Frage, ob ein Begriff einem bestimmten Oberbegriff untergeordnet werden kann, nicht mehr in j e d e m Fall mit einem eindeutigen j a oder nein beantwortet werden; es handle sich hier vielmehr um ein „mehr oder weniger". So ist nach L a k o f f ein Sperling in stärkerem Maße ein Vogel als ein Huhn, ein Huhn mehr als ein Pinguin, ein Pinguin mehr als eine Fledermaus und eine Fledermaus mehr als eine Kuh. Es sind also v. a. zwei Annahmen über die Struktur des semantischen Gedächtnisses, in denen sich L a k o f f grundsätzlich von dem Quillian'sehen Modell unterscheidet. Die erste Annahme betrifft die Bedeutungen der Begriffe: Von Quillian wird die Bedeutung eines Begriffes als das G e s a m t der von diesem Begriff ausgehenden Relationen geschildert; für L a k o f f ist die Bedeutung eine Liste von semantischen Merkmalen. Modelle, in denen die Bedeutungen von Begriffen als Merkmalslisten betrachtet werden, haben in der Linguistik und in der Psychologie eine lange Tradition und sie werden auch durch verschiedene experimentelle Ergebnisse gestützt. Beispiele hierfür sind etwa die Wiedererkennungsexperimente von Anisfeld & K n a p p (1968) und von Fillenbaum ( 1 9 6 9 ) . Wie bei dem weiter oben besprochenen Experiment von Baddeley ( 1 9 6 4 ) , so handelte es sich auch bei dem Versuch von Anisfeld & K n a p p (1968) um ein Wiedererkennungsexperiment, in dem die Füllerwörter den vorher dargebotenen Wörtern zum Teil inhaltlich verwandt sind. Im Gegensatz zu Baddeley benützten Anisfeld & Knapp ein als „kontinuierliches Wiedererkennen" bezeichnetes Verfahren: Die V p n erhielten sukzessive eine Liste von 2 0 0 Wörtern dargeboten, die sich zum Teil wiederholten. Bei j e d e m dargebotenen Wort mußten sie entscheiden, o b es in der Liste bereits vorgekommen war. Die einzelnen Wörter konnten in vier Klassen gruppiert werden: (a) Wörter, die schon früher in der Liste vorgekommen waren. (b) Wörter, die zu einem früheren Wort der Liste eine starke assoziative Beziehung haben. (c) Synonyme eines früheren Wortes (d) Neutrale Füller, die zu keinem der früher dargebotenen Wörter eine inhaltliche Beziehung aufwiesen. Es zeigte sich, daß der „false a l a r m " bei den Wörtern der Gruppen (b) und (c) viel höher war als bei Gruppe (d). Bei den Wörtern der G r u p p e (b) erhöhte sich der „false a l a r m " hauptsächlich dann, wenn das neue Wort eine assoziative Antwort auf das frühere Wort bildete. Im umgekehrten Fall, d. h. wenn das frühere Wort eine häufige asso-
66
Das semantische Netzwerk von Quillian
ziative Antwort auf das neue Wort ist, war die Häufigkeit von „false alarm" ähnlich wie bei den neutralen Füllern. Die in diesem Experiment beobachteten Verwechslungen zeigen zunächst lediglich, daß die Spuren von verwandten Wörtern im episodischen Gedächtnis einander ähnlicher sind als die Spuren von unabhängigen Wörtern. Anisfeld & Knapp geben ihren Resultaten im Rahmen der Theorie der semantischen Merkmale jedoch eine weitergehende Interpretation. Da die Bedeutung eines Wortes im semantischen Langzeitgedächtnis als eine Liste von Merkmalen dargestellt sei, könnte das Erlernen dieses Wortes als Aktivierung oder Markierung dieser Merkmale betrachtet werden. Beim Reproduzieren eines gelernten Wortes würde dann von den aktivierten Merkmalen ausgegangen und danach gesucht, welches Wort durch diese aktivierten Merkmale bezeichnet wird. Beim Wiedererkennen würde andererseits danach gesucht, ob die Merkmale des Prüfwortes mit den Merkmalen übereinstimmen, die bei der Einprägung aktiviert wurden. Die Ergebnisse ihres Experimentes erklären Anisfeld und Knapp nun folgendermaßen: Bei zueinander synonymen Wörtern oder bei Wortpaaren, die miteinander assoziativ verbunden sind, wird in der Regel ein großer Teil der semantischen Merkmale beiden Wörtern gemeinsam sein. Wenn demnach einer Vp, die ein bestimmtes Wort gelernt hat, ein Synonym dieses Wortes als Prüfelement vorgelegt wird, dann wird sich die Menge der Merkmale, die bei der Einprägung aktiviert wurden, mit der Menge der Merkmale des Prüfelementes überschneiden. Dadurch werden das gelernte und das Prüfwort miteinander verwechselbar. Besteht andererseits keine Ähnlichkeit zwischen dem gelernten und dem Prüfwort, dann sind die Gemeinsamkeiten der semantischen Merkmale und damit die Verwechselbarkeit zwischen den beiden Wörtern geringer. Dies ist allerdings nur eine Möglichkeit zur Interpretation der Ergebnisse von Anisfeld & Knapp, die beispielsweise auch im Rahmen eines assoziationstheoretischen Modelles beschrieben werden können (Underwood, 1965). Eine stärkere empirische Bestätigung der oben gegebenen Interpretation würde voraussetzen, daß man die semantischen Merkmale bei den Wörtern der Lernliste und bei den Prüfwörtern systematisch variieren könnte. In einem Experiment mit einem ähnlichen Versuchsaufbau wie Anisfeld & Knapp versuchte Fillenbaum ( 1 9 6 9 ) eine solche systematische Variation der semantischen Merkmale zu erreichen. Dazu wurden den Vpn nicht nur Synonyme, sondern auch Antonyme (Gegenteile) von vorher dargebotenen Wörtern angeboten. Fillenbaum ging dabei von der Annahme aus, daß sich ein Begriff von seinem Gegenteil nur in einem semantischen Merkmal unterscheide; ein hoher „false alarm" von Antonymen zu Wörtern der Lernliste
Die Beschreibung von Begriffen durch semantische Merkmale
67
würde demnach bedeuten, daß die Menge der gemeinsamen semantischen Merkmale für das Wiedererkennen eine wichtige Variable darstelle. Der Versuch zeigte, daß nicht nur Synonyme sondern auch Antonyme einen viel stärkeren „false alarm" produzieren als neutrale Füllerwörter. Da in dem Versuch von Fillenbaum die Assoziationsstärken zwischen den Wörtern der Lernliste einerseits und den drei Arten von Füllern andererseits gleichstark waren, könnten die Ergebnisse mit einem assoziationstheoretischen Modell nicht erklärt werden. Sie bilden also ein starkes Indiz für die Annahme, daß Wörter als Komplex von seman tischen Merkmalen gespeichert werden. Ein weiterer empirischer Versuch zur Bestimmung semantischer Merkmale bildet eine von Miller (1972) veröffentlichte Arbeit über Verbbedeutungen. In einem ersten Schritt analysierte der Autor mehr oder weniger intuitiv die Bedeutungskomponenten von insgesamt 217 Bewegungsverben. Dabei bestimmte er elf semantische Merkmale, mit deren Hilfe sich die Bedeutungsunterschiede zwischen Tab. 12: Die semantischen Merkmale von Bewegungsverben nach Miller (19 72) Bewegung des Agens vs. Bewegung eines anderen Objektes
Er bewegt sich Er bewegt etwas
Kausativ vs. Nicht-Kausativ
Er geht Er fällt
Permissiv
Er läßt ihn eintreten
Propellent
Er stößt ihn
Direktional vs. Nicht-Direktional
Er fliegt Er fällt
Medium
Er fliegt Er schwimmt Er geht
Instrument
Er geht Er fährt
Inchoativ (das Resultat der Bewegung wird durch ein Adjektiv beschrieben)
Er füllt das Glas
Bewegungswechsel
Er beschleunigt das A u t o
Deiktik (Beziehung z u m Sprecher)
Er ging in die Wohnung Er kam in die Wohnung
Geschwindigkeit
Er schlenderte Er rannte
68
Das semantische Netzwerk von Quillian
den analysierten Verben beschreiben lassen. Tabelle 12 enthält eine Aufzählung dieser Merkmale, wobei jeweils ein Beispielsatz gegeben wird, bei dem das entsprechende semantische Merkmal vorhanden ist, bzw. zwei Beispielsätze, die sich in bezug auf dieses Merkmal unterscheiden. Nach Miller lassen sich für alle Bewegungsverben Paraphrasen bilden, indem dem Wort „bewegen" die Werte in bezug auf diese elf Merkmale hinzugefügt werden. So könnte der Satz „Er rennt" paraphrasiert werden als Er verursacht (kausativ) mit eigener Kraft (Propellent), daß er sich selbst (Bewegung des Agens) schnell (Geschwindigkeit) auf der Erde (Medium) bewegt, indem er die Beine benützt (Instrument). Verschiedene Teilmengen der analysierten 217 Verben wurden darauf auf Kärtchen geschrieben und Vpn in einem Sortierungsversuch dargeboten; ihre Aufgabe bestand darin, die einzelnen Kärtchen nach der bedeutungsmäßigen Ähnlichkeit der Verben in eine beliebige Anzahl von Häufchen zu ordnen. Eine statistische Auswertung dieses Versuches ergab, daß die von den Vpn bestimmte Ordnung zumindest teilweise mit dem Vorhandensein der elf semantischen Merkmale übereinstimmt. Miller nimmt nun an, daß durch Verben bezeichnete Handlungen im LZG als komplexe Strukturen gespeichert sind, die aus dem Begriff für eine primitive Aktion (ζ. B. „bewegen") und aus einer Reihe von zusätzlichen semantischen Merkmalen bestehen. Die Generierung von Wörtern könnte dann als eine Art „clustering" betrachtet werden, bei dem der Sprecher diese Strukturen durch einzelne Wörter ersetzt. Wie in Kapitel V bei der Besprechung des unabhängig von Miller's Arbeit entworfenen Satzgenerators von Goldman ( 1 9 7 3 ) gezeigt werden soll, entspricht der Prozeß der Wortfindung in diesem System dem von Miller angenommenen „clustering" einer komplexen Struktur zu einem einzelnen Wort. Die zweite Annahme, in der sich Lakoff grundsätzlich von dem Modell von Quillian unterscheidet, betrifft die Unterteilung der semantischen Merkmale in definitorische, wichtige und unwichtige Merkmale. Im Gegensatz dazu sind die Relationen im semantischen Netzwerk von Quillian ungewichtet: Entweder es besteht eine Verbindung zwischen einem Begriff und seinem Oberbegriff oder es besteht keine. Die oben zitierten Ergebnisse von Wilkins und von Conrad zeigten jedoch, daß diese Annahme ein vergröbertes Bild der Beziehungen im LZG bildet. Durch die Unterscheidung zwischen semantischen Merkmalen verschiedener Wichtigkeit können nicht nur diese Ergebnisse erklärt werden, sondern sie ermöglicht auch einen theoretischen Zugang zum Phänomen der Charakterizität: Wenn et-
Die Beschreibung von Begriffen durch semantische Merkmale
69
wa ein Schäferhund von den meisten Leuten als „typischerer" Hund bezeichnet wird als ein Pekinese, oder wenn ein Hund als typischeres Tier bezeichnet wird als ein Seeigel, dann kann dies damit erklärt werden, daß die wichtigen Merkmale für den Begriff Hund beim Schäferhund stärker ausgeprägt sind als beim Pekinesen. Eleanor Rosch ( 1 9 7 3 , 1976) machte den Begriff der Charakterizität zum Gegenstand einer Reihe von Versuchen. Dabei fand sie u. a. in einem Versuch nach dem Collins & Quillian Paradigma, daß als „typisch" eingestufte Instanzen einer Kategorie von den Vpn schneller als solche erkannt wurden als die „untypischen" Instanzen. Die beiden geschilderten Annahmen von Lakoff, d. h. die Repräsentation von Begriffen durch Merkmalslisten und die Ungleichwichtigkeit dieser Merkmale, finden sich in dem folgenden von Rips, Shoben und Smith entwickelten formalen Modell, das ebenfalls das Verhalten der Vpn bei der Satzverifikation erklären soll (Rips, Shoben &c Smith, 1 9 7 3 ; Smith, Rips & Shoben, 1974, Smith, Shoben & Rips, 1974). Die semantischen Merkmale sind in diesem Modell allerdings normalerweise nicht in diskrete Kategorien gegliedert, sondern es ist ihnen ein kontinuierlich schwankender Wert zugeordnet, der angibt, wie wichtig das entsprechende Merkmal für die Definition des Begriffes ist. In Situationen wie bei der Satzverifikation, in denen eine exakte Analyse der Bedeutung notwendig ist, werden die Merkmale in zwei Mengen kategorisiert: Die eine enthält die für die Definition notwendigen, die sog. definitorischen Merkmale, und die andere Menge diejenigen Merkmale, die für den Begriff lediglich charakteristisch sind. Wie bei dem Modell von Meyer, so verläuft auch nach Rips, Shoben und Smith der Prozeß der Satzverifikation in zwei Phasen: In der ersten Phase werden alle, sowohl die definitorischen, als auch die charakteristischen Merkmale miteinander verglichen. Ist die Ähnlichkeit über bzw. unter einem bestimmten Grenzwert, dann wird ein wahr-, bzw. ein falsch-Urteil gefällt. Ist die Ähnlichkeit zwischen den beiden Grenzwerten, dann läuft die zweite Phase ab. Hierbei werden lediglich die Listen der definitorischen Merkmale der beiden Begriffe miteinander verglichen. Entsprechen sich die beiden Listen, dann wird ein wahr-, entsprechen sie sich nicht, dann wird ein falsch-Urteil gefällt. Abb. 8 ist ein Flußdiagramm dieser Prozesse. Die zweite Suchphase wird in dem Modell nur dann durchgeführt, wenn sich die beiden Wörter weder sehr ähnlich noch sehr unähnlich sind. Damit kann die Beobachtung erklärt werden, daß die RZen bei wahren Sätzen dann am kleinsten sind, wenn sich Subjekt und Prädikat ähneln, und daß sie bei falschen Sätzen mit zunehmender Ähnlichkeit zwischen Subjekt und Prädikat anwachsen.
70
Das s e m a n t i s c h e N e t z w e r k von Quillian
Eine weitere Überprüfung des Modelles von Rips, Shoben & Smith ist mit einem von Schaeffer Sc Wallace (1969) konzipierten Versuchsplan möglich. Dabei erhalten die Vpn vier Kategoriennamen und für jeden Versuchsdurchgang zwei neue Testwörter dargeboten. Sie müssen dabei angeben, ob die beiden Testwörter unter die gleiche der vier Kategorien subsumiert werden können oder nicht. Abhängige Variable ist auch bei diesem Versuch die für das Urteil benötigte RZ. Abb. 8: Das z w e i - S t u f e n Modell der S a t z v e r i f i k a t i o n n a c h S m i t h , S h o b e n & Rips ( 1 9 7 4 )
Rips, Shoben &: Smith (1973) führten ein Experiment mit diesem Versuchsplan durch; dabei analysierten sie die RZen bei solchen Paaren von Testwörtern, bei denen jedes der beiden Testwörter unter eine der vier Kategorien subsumiert werden kann, wobei diese Kategorien bei den beiden Testwörtern jedoch verschieden sind. Wenn man annimmt, daß die Vpn bei diesem Versuch für jedes der beiden Testwörter den gleichen Prozeß durchführen wie bei der Verifikation eines Oberbegriffssatzes, dann lassen sich mit Hilfe des Modelles von
Die Beschreibung von Begriffen d u r c h s e m a n t i s c h e M e r k m a l e
71
Rips, Shoben und Smith folgende Voraussagen über die RZen machen: Beim ersten der beiden Testwörter endet die Suche damit, daß dessen richtige Kategorie gefunden wird; diese Suche ist um so kürzer, je ähnlicher das Testwort der Kategorie ist. Beim zweiten der beiden Testwörter wird danach gesucht, ob es ein Unterbegriff der Kategorie des ersten Testwortes ist. Diese Suche, die mit einem falsch-Urteil endet, dauert um so länger, je ähnlicher das zweite Testwort dieser Kategorie ist. Dies soll an folgendem konstruierten Beispiel verdeutlicht werden: Die vorgegebenen vier Kategoriennamen seien „Werkzeug", „Vogel", „Nahrungsmittel" und „Säugetier" und die Testwörter seien „Sperling" und „Hammer". In diesem Beispiel wäre die RZ kurz, da das erste Testwort („Sperling") ein typisches Beispiel seiner Kategorie („Vogel") ist, während das zweite Testwort mit der Kategorie keine Gemeinsamkeiten besitzt. Im Gegensatz dazu hätte das Testwortpaar „Pinguin Fledermaus" eine hohe RZ, da ein Pinguin ein untypischer Vogel ist und Fledermaus mit der Kategorie „Vogel" eine Reihe von Gemeinsamkeiten aufweist. Diese recht spezifische und keineswegs selbstverständliche Voraussage konnte von Rips, Shoben & Smith (1973) experimentell bestätigt werden. Das auf den Vergleichen von semantischen Merkmalen basierende Modell von Rips, Shoben und Smith erlaubt also die Voraussage einer recht großen Anzahl von Daten, die mit dem Collins & Quillian Paradigma und davon abgeleiteten Versuchsplänen gewonnen wurden. Andererseits bleibt dieses Modell so lange unbefriedigend, als nicht näher expliziert wird, welche Vorstellung man sich von den postulierten semantischen Merkmalen machen kann. Zu diesem Zweck führten Rips, Shoben und Smith zusätzliche Untersuchungen durch, in denen die Vpn die subjektive Ähnlichkeit der Wörter aus den Experimenten zur Satzverifikation bestimmten. Durch eine multidimensionale Skalierung der subjektiven Ähnlichkeiten zwischen Vögeln und Säugern konnten darauf zwei Faktoren bestimmt werden, auf welchen die Ähnlichkeitsurteile abgebildet werden können. Diese beiden Faktoren entsprechen den beiden bipolaren Eigenschaften „wild" vs. „zahm" und „groß" vs. „klein". Wie zu erwarten ist, lassen sich aufgrund der Werte, die die Wörter auf diesen beiden Dimensionen einnehmen, bis zu einem gewissen Maße die RZen beim Collins & Quillian-Experiment voraussagen. Wie schon in Kap. II zu zeigen versucht wurde, bleiben solche, auf Ähnlichkeitsmaßen basierende Ansätze jedoch unbefriedigend; denn abgesehen von methodologischen Problemen — kann damit der Unterschiedlichkeit der verschiedenen Relationen, welche zwischen zwei Begriffen bestehen können, genau so wenig Rechnung getragen werden wie bei den assoziativen Netzwerken.
72
Das semantische Netzwerk von Quillian
Eine andere theoretische Betrachtung der semantischen Merkmale findet sich in dem Modell von Glass, Holyoak und Ο'Dell (Glass & Holyoak, 1 9 7 4 ; Glass, Holyoak & O'Dell, 1 9 7 4 ; Holyoak & Glass, 1975). Dieses Modell, welches ebenfalls für die Interpretation der RZen bei Experimenten zur Satzverifikation entwickelt wurde, entspricht demjenigen von Rips et al. in einer Reihe von Annahmen. Der wichtigste Unterschied zwischen den beiden Modellen besteht darin, daß Glass et al. sog. generische Merkmale annehmen, denen in ihrem Modell eine zentrale Bedeutung zukommt. Ein solches generisches Merkmal sei etwa die Eigenschaft „vogelartig", die u. a. dem Begriff „Kanarienvogel" zugeordnet wäre. Dem Merkmal „vogelartig" sind dann weitere Merkmale wie „gefiedert", „tierisch" usw. beigeordnet, die allen Vögeln gemeinsam seien. Bei der Verifikation von Oberbegriffssätzen müßten dann die Vpn nicht eine große Zahl von semantischen Merkmalen miteinander vergleichen. Vielmehr würde schon die Feststellung, daß Subjekt und Prädikat mit dem gleichen generischen Merkmal verbunden sind, dazu ausreichen, die Richtigkeit des vorgegebenen Satzes zu bestimmen. In diesem Punkte entspricht das Modell von Glass et al. demjenigen von Collins und Quillian; denn es besteht kein prinzipieller Unterschied darilj, ob die Begriffe für Kanarienvogel und für Vogel durch eine Oberbegriffsrelation miteinander verbunden sind, oder ob diese Verbindung via die Eigenschaft „vogelartig" gefunden wird. In beiden Fällen muß die Information, daß ein Kanarienvogel Federn hat, auf dem Umweg über den Begriff Vogel gefunden werden. Den Modellen, die für die Interpretation der Experimente nach dem Collins & Quillian-Paradigma entwickelt wurden, ist auf den vorhergehenden Seiten ein recht breiter Platz eingeräumt worden. Dies ist dadurch gerechtfertigt, weil diesen Versuchen in der experimentellpsychologischen Literatur der letzten J a h r e starke Aufmerksamkeit geschenkt wurde. Zudem bilden die besprochenen Arbeiten ein gutes Beispiel, wie durch experimentelle Resultate neue theoretische Ansätze und wie durch theoretische Ansätze neue Experimente angeregt werden können. Andererseits glaube ich nicht, daß diese Art von Arbeiten einen wichtigen Beitrag zu unserer Kenntnis über das semantische LZG geliefert hat oder in Zukunft liefern wird. Dies liegt m. E. daran, daß die allgemeine Frage nach der Struktur des semantischen LZG und nach den darin ablaufenden Suchprozessen bei diesem Ansatz immer mehr in den Hintergrund trat und das Interesse der Forschung sich auf die korrekten Voraussagen der RZen beschränkte. Bischof ( 1 9 7 6 ) unterscheidet in diesem Zusammenhang zwischen aufgabenorientiertem und problemorientiertem Vorgehen. Beim problemorientierten Vorgehen steht eine theoretische Fragestellung im
Die Beschreibung von Begriffen durch semantische Merkmale
73
Zentrum des Interesses, und die Arbeitsweise und die zu verwendenden Methoden werden in Abhängigkeit von diesem Problem bestimmt. Beim aufgabenorientierten Vorgehen wird von einem experimentellen Paradigma ausgegangen und die Arbeiten konzentrieren sich auf die Erklärung der Ergebnisse, die mit diesem experimentellen Paradigma gewonnen wurden. Dieser Ansatz, bei dem die Erklärung eines experimentellen Paradigmas zum Selbstzweck wird, ist in der experimentellen Psychologie häufig anzutreffen, und so werden etwa Modelle für das Lernen von Wortlisten oder für das Paarlernen entwickelt (Postman, 1975). Man könnte dieses Vorgehen damit begründen, daß eine globale Theorie am sinnvollsten so erarbeitet werden kann, daß man zunächst eine Reihe von Minitheorien mit einem begrenzten Deckungsbereich erarbeitet und diese darauf in einen breiteren theoretischen Zusammenhang zu integrieren versucht. Allerdings besteht dabei die Gefahr, daß diese Minitheorien nur innerhalb eines bestimmten experimentellen Paradigmas sinnvoll sind und keine Möglichkeit besteht, sie in ein breiteres Modell zu integrieren. Dies zeigt sich deutlich bei den in den obigen Abschnitten besprochenen Modellen, in welchen die beim Collins & Quillian-Paradigma beobachteten Ergebnisse durch mengentheoretische Relationen, durch subjektive Ähnlichkeitsmaße oder durch den Vergleich von semantischen Merkmalen zu erklären versucht wird. All diese Modelle liefern zwar mehr oder weniger gute Voraussagen der RZen in den besprochenen Experimenten; für einen allgemeinen Ansatz zur Erklärung von Verstehensleistungen oder von sprachlichen Verhaltensweisen können diese Modelle jedoch nicht gebraucht werden, da sie keine Aussage über die innere Struktur des sprachlichen L Z G machen. Das Fehlen von Spezifikationen über die verschiedenen Arten von Relationen, die zwischen Begriffen bestehen können, macht diese Modelle für die Erklärung selbst so einfacher Aufgaben, wie sie von Quillians Teachable Language Comprehender geleistet werden, unbrauchbar.
IV. KASUSGRAMMATIK UND DAS MODELL VON SIMMONS 1. Kasusgrammatik In dem Modell von Quillian finden sich drei Arten von Verbindungen, durch welche Knoten miteinander in Beziehung gesetzt werden können: Oberbegriffsrelationen, attributive Relationen und relationale Trippel, bei welchen zwei Wörter durch eine Relation miteinander verknüpft werden. Diese Dreiteilung ist jedoch zu grob, um eine eindeutige Abbildung der verschiedenen Beziehungen, die zwischen Begriffen bestehen können, in einem semantischen Netzwerk zu ermöglichen. So definiert Quillian (1968, p. 250) beispielsweise den Knoten für das Wort „Bequemlichkeit" u. a. durch die Relationen: „Bequemlichkeit — machen — weniger — traurig". Für die Definition des Begriffes „Schreiner" in einem Quillian'sehen Netzwerk müßten etwa folgende Relationen eingeführt werden: „Schreiner — machen — Möbel". Nun ist die Beziehung zwischen „Bequemlichkeit" u n d „machen" verschieden von derjenigen zwischen „Schreiner" und „machen". Diese Verschiedenheit kann nicht damit erklärt werden, daß das Verb „machen" in den beiden Sätzen in verschiedenen Bedeutungen gebraucht wird: Im ersten Satz ist das Subjekt ein Zustand und der Rest des Satzes beschreibt eine Folge dieses Zustandes; im zweiten Satz ist das Subjekt das willentliche Agens der Handlung, die in dem Satz beschrieben wird. Um solchen Unterschieden in einem semantischen Netzwerk Rechnung tragen zu können, müßten die Relationen zwischen den Begriffen so spezifiziert werden können, daß sie die jeweilige Rolle, die ein Begriff im Satzganzen spielt, eindeutig beschreiben. Dieses Problem deckt sich teilweise mit der Aufgabenstellung der linguistischen Syntax; denn auch hier geht es darum, die den Sätzen der natürlichen Sprache unterliegende Struktur aufzudecken (Chomsky, 1965). Allerdings liefern weder die klassische Schulgrammatik noch die generative Transformationsgrammatik adäquate Beschreibungen der inhaltlichen Funktion, welche die einzelnen Satzglieder innerhalb des Satzganzen spielen. Dies kann an folgenden Beispielsätzen demonstriert werden: (1) Der Knabe zerbrach die Scheibe mit einem Stein. (2) Der Stein zerbrach die Scheibe. (3) Die Scheibe zerbrach.
Kasusgrammatik
75
In einer traditionellen Grammatik würde im ersten Satz das Wort „Knabe", im zweiten Satz das Wort „Stein" und im dritten Satz das Wort „Scheibe" als Subjekt bezeichnet werden; in der Tiefenstruktur einer generativen Transformationsgrammatik wären diese drei Wörter jeweils die Nomen der ersten Nominalphrasen in dem entsprechenden Satz. Obwohl diesen drei Wörtern in beiden Grammatikmodellen dieselbe strukturelle Beschreibung zugeordnet wird, kommen ihnen innerhalb des Satzganzens völlig verschiedene inhaltliche Funktionen zu: „Knabe" ist der Agent, d . h . der willentliche Verursacher der Handlung, „Scheibe" ist das von der Handlung betroffene Objekt und „Stein" ist das Instrument der Handlung. Solchen inhaltlichen Rollen, welche die Satzglieder einnehmen können, wird in der von Fillmore (1968a, 1968b, 1969, 1971) entwickelten Kasusgrammatik Rechnung getragen. Diese Theorie hat inzwischen eine breite Resonanz gefunden und seit Filimores Artikel aus dem Jahre 1968 sind eine große Zahl von Arbeiten über Probleme der Kasusgrammatik veröffentlicht worden. Im folgenden soll jedoch nur auf diejenigen Aspekte der Kasusgrammatik eingegangen werden, die sich für die Entwicklung auf dem Gebiet der semantischen Netzwerke als bedeutsam erwiesen haben. Ein Satz setzt sich nach Fillmore zusammen aus Angaben über die Modalität und der Aussage (proposition) im engeren Sinn. Die Angaben über die Modalität betreffen die Zeit der beschriebenen Handlung, den Modus (aktiv vs. passiv), Affirmation vs. Negation usw. Die Satzaussage, von der im folgenden allein die Rede sein wird, setzt sich zusammen aus einem Verb und einer Reihe von Ergänzungen, die auch Aktanten des Satzes oder Argumente des Verbes genannt werden. Diese Ergänzungen lassen sich, entsprechend der inhaltlichen Rolle, die sie im Satzganzen spielen, einer begrenzten Zahl von semantischen Tiefenkasus zuordnen. Dabei besteht die Regel, daß nicht mehr als eine Ergänzung für jeden Tiefenkasus stehen kann; mit anderen Worten: Wenn zwei Ergänzungen im selben Satz stehen, dann gehören sie verschiedenen Tiefenkasus an. Fillmore (1968a) unterscheidet folgende sechs Tiefenkasus: Agentiv: Der Kasus des charakteristischerweise belebten, wahrgenommenen verantwortlichen Urhebers der Tätigkeit oder Handlung, die durch das Verb beschrieben wird. Instrumental: Der Kasus der unbelebten Kraft oder des Objekts, das in der Tätigkeit oder dem Zustand, die durch das Verb beschriebenen werden, eine Rolle spielt.
76
Kasusgrammatik und das Modell von Simmons
Dativ: Der Kasus des Belebten, das durch die Tätigkeit oder das Geschehen, das durch das Verb ausgedrückt wird, affiziert wird. F aktiv: Der Kasus des Objekts oder des Wesens, das aus der Tätigkeit oder dem Zustand, die beide durch das Verb bezeichnet werden, resultiert, bzw. als Teil der Bedeutung des Verbs verstanden wird. Lokativ: Der Kasus, der lokale Position oder räumliche Ausdehnung in Zustand oder Tätigkeit, die durch das Verb beschrieben werden, ausdrückt. Objektiv: Der semantisch neutralste Kasus, der Kasus, in dem alles aufgeht, was durch ein Nomen beschrieben werden kann, dessen Rolle in der vom Verb identifizierten Tätigkeit bzw. dem Geschehen mit der semantischen Interpretation des Verbs selbst identifiziert wird. Ganz offensichtlich sollte dieser Begriff begrenzt bleiben auf Dinge, die durch die Tätigkeit oder den Zustand, die das Verb beschreibt, affiziert werden. Dieser Ausdruck ist nicht mit dem Begriff des „direkten Obj e k t s " zu verwechseln oder mit dem Namen des Oberflächenkasus also mit Akkusativ (zit. n. der deutschen Ubersetzung von Fillmore 1968, in Abraham, 1971, p. 341). Benefaktiv: Der Kasus des Belebten, für welches eine Tätigkeit durchgeführt wird. Im folgenden werden für jeden der oben genannten Tiefenkasus zwei Beispielsätze gegeben, wobei das im jeweiligen Kasus stehende Satzglied unterstrichen ist. Agentiv: Der Mann ging in die Stadt. Das Kind wurde von der Mutter bestraft. Instrumental: Der Wind zerbrach die Scheibe. Sie fuhr mit dem Auto in die Stadt. Dativ: Das Kind wurde von der Mutter bestraft. Die Frau gab dem Mann ein Buch. Faktiv: Die Rosen sind im Treibhaus gezüchtet worden. Schreiner machen Möbel. Lokativ: Die Scheibe zerbrach. Die Frau gab dem Mann ein Buch. Benefaktiv: Die Frau kaufte ihrem Kind Schuhe. Er tat es für seinen Vorgesetzten.
Kasusgrammatik
77
Später führte Fillmore noch weitere Kasus ein, so 1969 den Komitativ. Dieser Kasus, dessen Gebrauch von Walmsley (1971) näher analysiert wurde, nennt den Begleiter von anderen Aktanten. Er findet sich in Konstruktionen wie: Der Mann ging mit seinem Hund spazieren. Der Professor erforschte mit seinen Assistenten den Virus. Die komitative Verbindung zwischen zwei Nominalphrasen ist verschieden von der einfacher Adjunktion. So kann etwa aus den beiden Sätzen Der Mann ging ins Kino. Die Frau ging ins Kino, nicht der Satz Der Mann ging mit der Frau ins Kino, abgeleitet werden, denn hier ist auch Teil der Bedeutung, daß der Mann und die Frau zur gleichen Zeit ins gleiche Kino gingen. Zusätzlich zu den bereits genannten nennt Fillmore (1971) noch folgende weitere Kasus: Gegen-Agens: Die Kraft, welche gegen die durch das Verb beschriebene Aktion Widerstand leistet (Er rannte gegen den Wind). Ursprung: Der Ort, von welchem eine Bewegung ausgeht (Er fuhr von Genf nach Berlin). Ziel: Der Ort, auf den eine Bewegung hinzielt (Er fuhr von Genf nach Berlin). Auf der Grundlage einer solchen Liste von Tiefenkasus lassen sich die einzelnen Verben im Hinblick darauf beschreiben, von welchen Tiefenkasus sie begleitet werden. So ist beispielsweise das Verb „zerbrechen" immer von einem Satzglied im Objektiv-Kasus begleitet und es kann von Satzgliedern im Agentiv- und Instrumental-Kasus begleitet sein. Fillmore benützt zur Darstellung dieser Zusammenhänge folgende Notation zerbrechen Ο (A) (I), wobei die Buchstaben Ο, Α und I für die Objektiv-, Agentiv- und Instrumentalis-Kasus stehen. Das obige Schema wird von Fillmore als Kasusrahmen des Verbes „zerbrechen" bezeichnet. Das Verb „ermorden" muß von einem Dativ- und einem Agentiv-Kasus begleitet sein, die das Opfer und den Mörder bezeichnen. Das Instrument der Handlung kann, aber muß nicht im Satz erwähnt werden. Damit ergibt sich folgender Kasusrahmen, ermorden D (I) A In bezug auf seinen Kasusrahmen unterscheidet sich das Verb „ t ö t e n " von dem Verb „ermorden" dadurch, daß bei „töten" der Dativ obligatorisch ist und mindestens einer der beiden Kasus Instrument oder Agentiv genannt werden muß. Diese Art von Zusammen-
78
Kasusgrammatik und das Modell von Simmons
hang wird von Fillmore durch verschränkte Klammern dargestellt: töten [ D (ΐχΑ)] Gewisse Verben unterscheiden sich in ihren Bedeutungen lediglich darin, daß sie einen verschiedenen Kasusrahmen haben, so etwa die Verben „sehen" u n d „zeigen": sehen [ Ο + D] zeigen [ Ο + D + A] Die beschriebenen Kasusrahmen geben lediglich an, welche Tiefenkasus bei den verschiedenen Verben an der Satzoberfläche repräsentiert sein müssen oder sein k ö n n e n . Für die Z u o r d n u n g von Tiefenzu Oberflächenkasus werden zusätzlich Regeln benötigt, die, wie auch die Kasusrahmen, sprachspezifisch sind, d. h. für die verschiedenen Sprachen müssen verschiedene Regeln formuliert werden. Folgende Regel, die sowohl für die deutsche wie auch für die englische Sprache z u t r i f f t , beschreibt die Auswahl des Oberflächensubjektes: Enthält die Tiefenstruktur eine Ergänzung im Agentiv-Kasus, dann wird diese auf der Satzoberfläche z u m S u b j e k t . Enthält die Tiefenstruktur keinen Agentiv- aber eine Instrumentalis-Ergänzung, d a n n wird diese zum Oberflächensubjekt. Enthält die Tiefenstruktur weder eine Agentiv- n o c h eine Instrumentalis-Ergänzung, dann wird der Objektiv zum Oberflächensubjekt. Diese Regel erklärt die Zuordnung der Subjekte zu verschiedenen Tiefenkasus in den drei Sätzen: Der Knabe zerbrach die Scheibe mit einem Stein. Der Stein zerbrach die Scheibe. Die Scheibe zerbrach. Im weiteren n i m m t Fillmore an, daß den verschiedenen Tiefenkasus je eine Präposition zugeordnet werden k a n n : d e m Agentiv die Präposition „von", d e m Instrumentalis die Präposition „ m i t " , dem Benefaktiv die Präposition „für" usw. Objektiv und Faktiv hätten normalerweise keine Präposition. Die Präpositionen würden der entsprechenden Nominalphrase immer dann vorangestellt werden, wenn diese auf der Oberfläche nicht als Subjekt oder direktes Objekt repräsentiert wird. Komplizierter ist die Generierung von Sätzen, die in der Tiefenstruktur kein Verb enthalten. A b b . 9 zeigt als Beispiel dafür drei Stufen aus der Ableitung des Satzes „es sind viele Bücher in dem Gestell". Die Tiefenstruktur des Satzes (Abb. 9a) enthält je eine Ergänzung im Objektiv- und Lokal-Kasus, j e d o c h kein Verb. Die Generierung des Subjektes geschieht n u n nicht durch eine Verschiebung der Ergänzung im Objektiv-Kasus in die Subjekt-Position, sondern durch eine Verdoppelung dieses Satzgliedes. Auf der in A b b . 9b) gezeigten Zwischenstufe der Satzableitung ist die Nominalphrase „einige Bü-
Kasusgrammatik Abb. 9: Die Generierung v o n „Es sind viele Bücher in d e m Gestell" nach Fillmore ( 1 9 6 8 b )
80
Kasusgrammatik und das Modell von Simmons
eher" demnach zweimal enthalten. Als weitere Schritte bei der Satzgenerierung wird in die bislang leerstehende Stelle für das Verb „sein" eingesetzt und die Nominalphrase in Subjektposition pronominalisiert. Durch ähnliche Transformationen entstehen Satzkonstruktionen wie „Das Gestell hat einige Bücher", „Auf dem Gestell sind einige Bücher" oder „Es gibt einige Bücher auf dem Gestell". In all diesen Beispielen haben die Verben keine eigene Bedeutung sondern sie sind lediglich durch grammatische Transformationen eingeführt worden. Bei der in Abb. 9 gezeigten Ableitung sind die Präpositionen schon in der semantischen Tiefenstruktur des Satzes enthalten. Dies entspricht der Annahme von Fillmore, daß eine enge Beziehung zwischen den semantischen Tiefenkasus einerseits und den einzelnen Präpositionen anderseits bestehe. Hauptsächlich drei Argumente sprechen jedoch gegen diese Annahme: Zunächst sind in einer Reihe von Sprachen, so ζ. B. im Deutschen, die Präpositionen für die Beziehung der Tiefenkasus weniger wichtig als etwa die Stellung der Satzglieder oder die durch Flektion ausgedrückten Oberflächenkasus. Zudem sind auch im Englischen, wie Nilsen ( 1 9 7 3 ) dies für die Präposition „with" (mit) oder Hemphill ( 1 9 7 3 ) für die Präposition „ f o r " (für) gezeigt haben, die verschiedenen Präpositionen mehrdeutig und es gibt wohl keine Präposition, die ausschließlich oder hauptsächlich einem Ttefenkasus zuzuordnen ist. Ein weiterer Hinweis dafür, daß die Präpositionen erst auf Grund syntaktischer Transformationen in den Satz eingeführt werden, liefert die Analyse der folgenden Passivsätze: Das Mädchen wurde von dem Jungen geschlagen. Die Scheibe wurde von dem Stein zerbrochen. Das Mädchen wurde von einem Jungen gesehen. Bei diesen drei Sätzen gehören die durch „von" eingeleiteten Präpositionalobjekte verschiedenen Tiefenkasus an: im ersten Satz dem Agentiv, im zweiten dem Instrumentalis und im dritten Satz dem Dativ. Den drei Präpositionalobjekten ist jedoch gemeinsam, daß sie in der aktiven Form der drei Sätze jeweils Subjekt sind. Die einfachste Erklärung der Generierung dieser drei Sätze ist durch die von Chomsky ( 1 9 5 7 ) postulierten Regeln möglich. Danach sind alle drei Passivsätze von aktiven Sätzen abgeleitet und die Präposition „von" wurde erst bei dieser Aktiv- zu Passiv-Transformation eingeführt. Die Schwierigkeiten bei der Formulierung von Regeln zur Zuordnung von Phänomenen der sprachlichen Oberfläche zu Tiefenkasus sollten nicht als Argument gegen die Kasustheorie verstanden werden; denn die primäre Funktion eines Kasussystems ist nicht die Beschreibung von sprachlichen Oberflächenphänomenen. Allerdings ge-
81
Kasusgrammatik
winnt damit das Problem, die Tiefenkasus unabhängig von der Sprachoberfläche zu bestimmen, eine zentrale Wichtigkeit. Die oben zitierten Kasusbeschreibungen von Fillmore sind lediglich eine grobe und ungenaue Beschreibung der Funktionen der verschiedenen Ergänzungen. Nilsen (1972) und McCoy (1969) versuchten, eine exaktere inhaltliche Beschreibung der Tiefenkasus zu geben, indem sie den einzelnen Kasus semantische Merkmale zuordneten. Nilsen postuliert folgende sechs Tiefenkasus: Agentiv, Instrument, Ursprung und Ziel, die etwa den entsprechenden Kasus bei Fillmore entsprechen, der Patient, welcher die beiden Filimorschen Kasus Objektiv und Dativ zusammenfaßt; der Kausativ, der Kasus für unbelebte, jedoch nicht von einem Menschen kontrollierte Verursacher von Handlungen und Prozessen (der Blitz zerstörte das Haus). Im weiteren benützt Nilsen sechs semantische Merkmale zur Beschreibung der Beziehung zwischen einer Handlung und den daran beteiligten Aktanten: Der Aktant kann den Ablauf der Handlung willentlich kontrollieren oder er kann von einem anderen Aktanten willentlich kontrolliert sein; der Aktant kann die Ursache der Handlung sein oder aber sein Zustand kann ein Effekt der Handlung sein; im weiteren kann der Aktant im Ursprung der Handlung stehen oder er kann das Ziel der Handlung bilden. Tab. 13 zeigt die von Nilsen gegebene Bestimmung der Kasus durch diese semantischen Merkmale. So ist etwa der Agentiv dadurch definiert, daß die entsprechende Ergänzung die Handlung willentiich kontrolliert, sie verursacht und am Ursprung der Handlung steht.
Instrument Causativ Patient Ursprung Ziel
+
+
+
+
Ziel
Ursprung
Ursache
Effekt
Kontrollierend
s
3 £5 EL rt '
* c/i c Agentiv
Kontrolliert
Tab. 13: Die Zuordnung von Tiefenkasus zu semantischen Merkmalen nach Nilsen (1972)
+
+
+
+
+
+ +
+ +
+
82
Kasusgrammatik und das Modell von Simmons
Die inhaltliche Bestimmung der Tiefenkasus durch sc man tische Merkmale ist jedoch nur dann sinnvoll, wenn auch die Bedeutungen dieser Merkmale klar beschrieben werden können. Nun ist die obige Beschreibung der von Nilsen verwendeten Merkmale allein schon wegen der Kürze der Darstellung fragmentarisch. Bei Nilsen selbst findet sich jedoch auch keine genaue Bestimmung beispielsweise dafür, wann ein Aktant im Ursprung der Handlung steht. So lange solche Spezifikationen fehlen oder so lange die Beschreibung der Tiefenkasus, wie es bei Fillmore der Fall ist, nur sehr ungenau bleibt, so lange fehlt den Tiefenkasus die inhaltliche Bedeutung. Dieser Einwand trifft nicht nur die Systeme von Fillmore und Nilsen, sondern auch andere Kasussysteme, wie etwa dasjenige von Anderson (1971). Zudem sind, wie Wettler (1974b) zu zeigen versuchte, auch die wenigen bislang veröffentlichten Experimente zu einer psychologischen Validierung der Tiefenkasus (ζ. B. Engelkamp, 1973; Shafto, 1973) von nur begrenzter Aussagekraft. Damit stellt sich die Frage, welche Vorteile es mit sich bringt, wenn die Relationen zwischen einer Handlung und den daran beteiligten Aktanten in der semantischen Repräsentation durch Tiefenkasus beschrieben werden. Am Anfang dieses Kapitels wurde erwähnt, daß die auf der Kasusgrammatik basierende Repräsentation von Sätzen gegenüber einem Quillian'sehen Netzwerk den Vorteil habe, daß die verschiedenen Satzteile eindeutig unterschieden werden können. Wie Charniak (1975c) bemerkt hat, läßt sich dieser Vorteil auch mit einer sog. Positionsnotation erreichen. In dieser, in älteren Systemen der künstlichen Intelligenz verwendeten Notation sind die Ergänzungen eines Verbes in einer geordneten, dem Verb beigefügten Liste enthalten, wobei die Funktion der einzelnen Ergänzung durch deren Position innerhalb der Liste bestimmt wird. Der Satz „der Mann gibt dem Mädchen die Blume" würde in einem Kasussystem und in der Positionsnotation folgende beiden Repräsentationen haben. In einem Kasussystem: geben Agentiv-Mann Dativ-Mädchen Objektiv-Blume In Positionsnotation: geben (Mann, Mädchen, Blume) Die Repräsentation in einem Kasussystem wäre gegenüber der Positionsnotation nur dann von Vorteil, wenn die Angabe des Kasus Rückschlüsse über die Funktion des Satzgliedes erlauben würde. Solche Rückschlüsse oder Inferenzen lassen sich zwar formulieren; sie gelten jedoch immer nur für einen Teil der Verben. So besteht beispielsweise die Regel, daß bei allen Verben des Besitz wechseis (geben, nehmen, stehlen, kaufen, usw.) die im Dativ stehende Person nach
Die Struktur des Netzwerkes von Simmons
83
der beschriebenen Handlung der Besitzer des Aktanten ist, der im Objektiv-Kasus steht. Diese Regel besagt jedoch nichts über den Aktanten im Dativ bei anderen Verben. Nun können Regeln, die nur für ein Verb oder eine Gruppe von Verben gelten, auch bei einer Repräsentation der Sätze in Positionsnotation formuliert werden. Die oben gegebene Regel könnte dann etwa folgendermaßen reformuliert werden: Beim Verb „geben" ist der an zweiter Stelle in der Ergänzungsliste genannte Aktant nach der Handlung der Besitzer des an dritter Stelle genannten Aktanten. Analysiert mein also die Kasusgrammatik unter dem Aspekt ihrer Nützlichkeit in einem programmierbaren System, dann bringt sie streng betrachtet nicht viel Neues; denn es ist weder möglich, allgemeine Regeln über die Zuordnung der Tiefenkasus zu Phänomenen der Satzoberfläche aufzustellen, noch ist es möglich, die Tiefenkasus inhaltlich zu definieren, noch ist es möglich den Tiefenkasus Inferenzregeln zuzuordnen. Wenn die Kasusgrammatik trotzdem im Gebiet der Computersemantik sehr populär geworden ist, dann liegt dies wohl hauptsächlich an ihrer an die Intuition appellierenden Anziehungskraft. Dennoch glaube ich, daß die Verwendung von Tiefenkasus für die Entwicklung von semantischen Netzwerken einen wichtigen Fortschritt bedeutete; denn die auf der Kasusgrammatik basierenden Repräsentationen, wie sie in den folgenden Abschnitten geschildert werden, ermöglichen nicht nur eine klare Darstellung der inhaltlichen Zusammenhänge zwischen den Satzgliedern, sondern sie erleichtern auch die Formulierung von Algorithmen für Verstehensprozesse. 2. Die Struktur des Netzwerkes von Simmons Das von Simmons entwickelte semantische Netzwerk basiert weitgehend auf der Kasusgrammatik; es ist das bekannteste aus einer Gruppe von einander ähnlichen Modellen zur Repräsentation von Wissensinhalten (ζ. B. Sandewall, 1970; Palme, 1971, 1973; McCalla, 1972; Schubert, 1975; Kintsch, 1972, 1974). Diese Modelle unterscheiden sich von dem Simmons-Netzwerk hauptsächlich dadurch, daß in ihnen auf einzelne Aspekte, wie ζ. B. auf die Repräsentation von Quantifikatoren oder auf Probleme der Notation näher eingegangen wird. Im Vergleich mit Simmons bilden diese Modelle jedoch keine grundsätzlich neuen Ansätze für eine Theorie des semantischen Langzeitgedächtnisses oder für die Erklärung von Verstehensprozessen; aus diesem Grunde wird auf diese Modelle im folgenden nicht näher eingegangen werden.
84
Kasusgrammatik und das Modell von Simmons
Wie bei Quillian, so ist auch das semantische Netzwerk von Simmons ( 1 9 7 2 a , 1972b) eine Struktur von untereinander verbundenen Type- und Token-Knoten. Die verschiedenen Arten von Verbindungen zwischen den Knoten lassen sich dabei in drei Gruppen aufgliedern. Bei der ersten Gruppe handelt es sich um Verbindungen, durch welche ein Verb mit den Knoten für die an der Handlung beteiligten Aktanten assoziiert wird. Diese Relationen entsprechen den Tiefenkasus in der Grammatik von Celce-Murcia ( 1 9 7 2 ) , welche weitgehend mit den Fillmore-Kasus übereinstimmen. Sie haben folgende Bezeichnungen: CA1 der erste kausale Agens der Handlung; er entspricht dem Agentiv bei Fillmore. CA2 der zweite kausale Agens der Handlung; er entspricht bei Fillmore dem Instrumentalis. THEME das „Thema" der Handlung; es entspricht bei Fillmore dem Objektiv. S O U R C E der Ursprung der Handlung; dies kann der lokale Ursprung sein; dieser Kasus kann jedoch auch, ζ. B. bei Verben des Besitzwechsels, den ursprünglichen Besitzer des von der Handlung betroffenen Objektes bezeichnen. GOAL der Zielpunkt der Handlung, wie SOURCE, so beschränkt sich die Bedeutung auch dieses Kasus nicht auf lokale Ergänzungen. LOC der Ort der Handlung. Durch die zweite Gruppe von Verbindungen werden den einzelnen Aktanten Attribute zugeordnet. Solche Attribute sind: MOD die Verbindung für adjektivische Attributionen. HASPART die Verbindung zwischen einem Ganzen und seinem Teil. POSS die Verbindung zwischen einem Besitzer und dem Besitz. ASSOC eine Sammelkategorie, die verschiedene, nicht näher spezifizierte Verbindungen zwischen Knoten bezeichnet. SHAPE und SIZE bezeichnen Formbestimmungen und Größenangaben. Die dritte Art von Relationen bezeichnet Qualifikationen und Mengenverhältnisse: Q = nichtnumerische Qualifikationen (ζ. B. „einige"); NBR = Anzahl; D E T = Artikel; COUNT = Zählbarkeit; SUP = Oberbegriff; SUB = Unterbegriff; E Q = Identität; P A R T O F = Teil von. Eine mit TOK bezeichnete Relation verbindet einen Token- mit seinem Type-Knoten. Ein Knoten in einem Simmons-Netzwerk besteht aus dem Namen dieses Knotens und aus einer Reihe von Verbindungen zu anderen
Die Struktur des Netzwerkes von Simmons
85
Knoten. Der Name eines Knotens besteht in den Darstellungen von Simmons in der Regel aus dem Buchstaben C und einer daran anschließenden Zahl. Damit wird ausgedrückt, daß Knoten semantische Einheiten und von einzelsprachlichen Wörtern unabhängig sind. J e d e der von einem Knoten ausgehenden Verbindungen besteht aus zwei Teilen: Der Bezeichnung, um welchen Typ von Verbindung es sich handelt, und dem Namen des Knotens, auf welchen die Verbindung hinweist. Tab. 14 zeigt die Knotenstruktur für die Repräsentation des Satzes „Der Mann, der mit einer Angel den großen Fisch gefangen hatte, schenkte ihn einer schönen Frau". Alle in der Tabelle aufgeführten Knoten sind Tokens. Der erste Knoten, C l , enthält vier Relationen: die Token-zu-Type Verbindung zum Type-Knoten für „fangen", eine Agens-Verbindung (CA1) zum Knoten für Mann (C2), eine Instrumental-Verbindung (CA2) zum Knoten für Angel (C3) und eine Objektiv· Verbindung (THEME) zum Knoten für Fisch (C4). Für jede dieser Verbindungen existiert eine reziproke Verbindung, die in der Tabelle durch ein Minuszeichen markiert ist. So enthält beispielsweise der Knoten für Mann (C2) zwei inverse Agentiv-Relationen zu den Knoten für die Verben „fangen" und „geben". Um die Darstellung nicht unnötig zu komplizieren, wurden in Tab. 14 die in den Knoten enthaltenen Hinweise über Artikel, Tempus und Numerus weggelassen. Abb. 10 ist die Repräsentation desselben Beispielsatzes in der von Rumelhart, Lindsay & Norman (1972) entwickelten Notation. Jedes der in Klammern stehenden Wörter stellt einen Knoten im semantischen Netz dar; die vor die Wörter gesetzten Sterne geben an, daß es sich bei den jeweiligen Knoten um Token handelt, die von Rumelhart et al. als Sekundärknoten bezeichnet werden. Auch in dem Modell von Rumelhart et al. wird angenommen, daß die Verbindungen zwischen den Knoten bidirektional seien, d . h . daß die Pfeile in beiden Richtungen durchschritten werden können. Aus dieser Annahme lassen sich eine Reihe von Folgerungen für ein psychologisches Modell des L Z G schließen. So impliziert sie, daß beim Vorhandensein einer Verbindung, die von einem Knoten für eine Handlung zu einem daran beteiligten Aktanten führt, zugleich eine Verbindung besteht, die von dem Knoten für diesen Aktanten zu den Handlungsknoten führt. Wie folgendes Beispiel zeigen soll, ist diese Annahme nicht ganz unproblematisch: Letzten Sonntag sei ich mit einer Person, die ich jeden Tag sehe, in den Stadtpark spaziert und habe die Tauben gefüttert. Wenn ich mich nun später an diesen Akt des Tauben-Fütterns erinnere, dann wird mir auch diese Person in den Sinn kommen. Der umgekehrte Fall scheint jedoch unwahrschein-
86
Kasusgrammatik und das Modell von Simmons
Tab. 14: Repräsentation des Satzes „Der Mann, der den großen Fisch mit der Angel gefangen hatte, schenkte ihn einer schönen F r a u " in einem semantischen Netzwerk nach Simmons C1 T O K CA1 CA2 THEME C4 T O K SIZE -THEME -THEME C7 T O K MOD -GOAL
fangen C2 C3 C4 Fisch C6 C1 C5 Frau C8 C5
C2 TOK -CA1 -CA1
Mann C1 C5
C3 T O K -CA 2
Angel C1
C5 T O K CA1 GOAL THEME C8 TOK -MOD
schenken C2 C7 C4 schön C7
C6 T O K -SIZE
groß
Abb. 10: Die Repräsentation desselben Satzes in der Notation von Rumelhart, Lindsay & Norman (1972) (FANGEN)
(GEBEN)
lieh: Wenn ich in irgendeinem Zusammenhang an diese Person denke, dann wird mir kaum das Tauben-Füttern in den Sinn kommen. Eine solche Reziprozität wird jedoch durch die Annahme von bidirektionalen pointers vorausgesagt. Gegen die Annahme, daß alle Pointers bidirektional seien, spricht auch folgende Erfahrung: Verlangt man von einer schweizerischen Vp, alle Kantone der Schweiz, oder von einer amerikanischen Vp, alle Bundesstaaten der USA aufzuzählen, dann kann sie diese Aufga-
Die Struktur des N e t z w e r k e s von S i m m o n s
87
be in der Regel nicht oder nur unter den allergrößten Schwierigkeiten erfüllen. Dies, obwohl sie jeden Kanton oder Bundesstaat kennt und eine ganze Reihe von Vorstellungen damit verknüpft. Unter der Annahme, daß bidirektionale Verbindungen zwischen den Begriffen für die einzelnen Kantone und dem Oberbegriff „Schweizerischer K a n t o n " bestünden, müßte die Aufgabe ohne Schwierigkeiten zu lösen sein. Natürlich können die obigen Beispiele nicht als Beweis dafür betrachtet werden, daß das Postulat von bidirektionalen Pointers falsch ist: Unsere gegenwärtigen Kenntnisse über mnemische Prozesse in natürlichen Situationen sind sicherlich zu grob, um eine exakte Überprüfung dieser Annahme zu ermöglichen. Solange uns jedoch solche exakten Kenntnisse fehlen, bildet das Postulat von reziproken Verbindungen zwischen den verschiedenen Einheiten im Gedächtnis wohl die ζ. Z. beste Approximation der „wirklichen" Verbindungen zwischen Gedächtnisinhalten. Die in Tab. 14 und Abb. 10 dargestellte Struktur repräsentiert nicht nur den Satz „Der Mann, der den großen Fisch gefangen hatte, schenkte ihn einer schönen Frau" sondern auch synonyme Sätze wie beispielsweise: Der Fisch, den der Mann mit der Angel gefangen hatte und einer schönen Frau schenkte, war groß. oder Der Mann fing mit der Angel einen großen Fisch und schenkte ihn einer Frau, die schön war. Diese Unabhängigkeit der semantischen Repräsentationen von der Oberflächenform der einzelnen Sätze ist insofern vorteilhaft, als die verschiedenen sprachlichen Realisationen den gleichen Wahrheitswert haben, d. h. es ist kein Fall denkbar, in dem eine der Paraphrasen zutrifft und die andere falsch ist. Bei den meisten Verstehensleistungen ist dieser Aspekt der Bedeutung, die extensionale Bedeutung, von Wichtigkeit. Anderseits ist es bei gewissen Problemen notwendig, Sätze mit gleichem Wahrheitswert verschieden zu repräsentieren. Folgende beide Sätze sind dafür ein Beispiel. Peter sagte, daß die Frau, die im Nachbarhaus w o h n t , einen roten Hut trage. Peter sagte, daß die Frau, die einen roten Hut trage, im Nachbarhaus wohne. Bei den beiden Nebensätzen handelt es sich um sog. determinative Relativsätze (Gresillon, 1975), durch die der Hörer des Satzes in die Lage versetzt werden soll, das durch das Kernwort bezeichnete Objekt — in unserem Beispiel die Frau — eindeutig zu identifizieren. Die
88
Kasusgrammatik und das Modell von Simmons
eigentliche Mitteilung, die Peter übermitteln wollte, ist jedoch im Prädikat enthalten. Der Satz „Was Peter gesagt hat, stimmt n i c h t " hat deshalb verschiedene Bedeutungen, je nachdem, a u f w e i c h e n der beiden Beispielsätze er sich bezieht. Auf den ersten der beiden Sätze bezogen bedeutet diese Verneinung „Peter hat nicht gesagt, daß die Frau einen roten Hut trage" und auf den zweiten Satz bezogen bedeutet sie „Peter hat nicht gesagt, daß die Frau im Nachbarhaus wohne". Wie Posner (1975) gezeigt hat, kann auf Grund der syntaktischen Struktur eines Satzes bestimmt werden, in welchem Satzglied die Mitteilung des Satzes enthalten ist. Wenn ein System in der Lage sein soll, die Frage „Hat Peter die Wahrheit gesagt?" richtig zu beantworten, dann müßten die obigen beiden Beispielsätze verschieden repräsentiert sein. Dieser Verschiedenheit könnte durch die von Woods (1975) vorgeschlagene Unterscheidung zwischen strukturellen Relationen und Aussagerelationen ausgedrückt werden. Strukturelle Relationen sind Verbindungen, die keine selbständigen Bedeutungen haben und erst innerhalb einer größeren Struktur sinnvoll sind; dies trifft beispielsweise für die Kasusrelationen zwischen einem Verb und einem Aktanten zu. Eine Aussagerelation hat unabhängig von anderen Relationen eine eigene Bedeutung. Eine solche Aussagerelation ist beispielsweise die Oberbegriffsverbindung. Besteht etwa zwischen zwei Knoten Α und Β eine Oberbegriffsverbindung, dann ist damit eine vollständige Aussage spezifiziert: Α ist der Oberbegriff von B. Im Gegensatz dazu spezifiziert eine Agentiv- oder Instrumentalis-Relation keine vollständige Aussage sondern kann lediglich im Zusammenhang mit den anderen Kasusverbindungen in eine sinnvolle Aussage gebracht werden. Bei dem ersten der obigen beiden Beispielsätze müßten die Knoten für „sagen" und „tragen" und im zweiten Beispielsatz die Knoten für „sagen" und „ w o h n e n " durch Aussagerelationen miteinander verbunden sein. Anderseits lassen sich eine Reihe von Sätzen bilden, die einerseits den gleichen Wahrheitswert haben wie der Satz „Der Mann, der den großen Fisch mit der Angel gefangen hatte, schenkte ihn einer schönen Frau", die anderseits jedoch in einem semantischen Netzwerk andere als die in Tab. 13 und Abb. 10 gezeigten Repräsentationen haben. Dies trifft etwa auf folgende beiden Sätze zu: „Der Mann, der den großen Fisch geangelt hatte, schenkte ihn einer schönen F r a u " oder „Die schöne Frau bekam von dem Mann gratis den großen Fisch, den er geangelt hatte". Diese Sätze würden darum verschieden repräsentiert werden, weil in dem Simmons-Netzwerk eine relativ enge Beziehung zwischen Type-Knoten einerseits und Wörtern der natürlichen Sprachen anderseits besteht. So besteht etwa für das Wort „angeln" ein eigener Ty-
Die Struktur des Netzwerkes von Simmons
89
pe-Knoten, obwohl die Bedeutung dieses Wortes auch durch den Ausdruck „mit Hilfe einer Angel fangen" umschrieben und semantisch repräsentiert werden könnte. Nun ist es für Verstehensprozesse notwendig, bedeutungsgleiche Sätze mit verschiedener Wortwahl als solche zu erkennen. Erhält ein verstehendes System beispielsweise den Satz „Wellington besiegte Napoleon in der Schlacht bei Waterloo" eingegeben, dann müßte es in der Lage sein, die Frage „Wer verlor die Schlacht bei Waterloo?" richtig zu beantworten. Um dies zu ermöglichen, formulierte Simmons sog. Paraphrasierungsregeln. Struktur und Anwendung dieser Regeln können am Beispiel der folgenden drei Sätze gezeigt werden, die zwar die gleiche Bedeutung haben, denen jedoch in einem Simmons-Netzwerk verschiedene semantische Strukturen zugeordnet werden: Napoleon verlor die Schlacht bei Waterloo gegen Wellington. TOK: verlieren; SOURCE: Napoeon; GOAL: Wellington; THEME: Schlacht bei Walterloo. Wellington gewann die Schlacht bei Waterloo gegen Napoleon. TOK: gewinnen; SOURCE: Napoleon; GOAL: Wellington; THEME: Schlacht bei Waterloo. Wellington besiegte Napoleon in der Schlacht bei Waterloo. T O K : besiegen; C l : Wellington; THEME: Napoleon; LOC: Schlacht bei Waterloo. Simmons ( 1 9 7 3 ) , von dem dieses Beispiel stammt, gibt keine Begründung für die von ihm vorgenommenen und nicht unbedingt einleuchtenden Zuordnungen von einzelnen Satzgliedern zu den Tiefenkasus. Die Paraphrasierungsregel, durch welche Sätze mit dem Verb „verlieren" und Sätze mit dem Verb „gewinnen" ineinander überführt werden können, hat folgende Form: (verlieren (SOURCE-SOURCE) (THEME-THEME) (GOALGOAL) gewinnen) Dies bedeutet, daß bei einer Ersetzung der Verben die Tiefenkasus der drei Ergänzungen nicht verändert werden. Die Informationen darüber, daß die Oberflächenkasus der Satzglieder bei den beiden Verben verschieden sind, ist nicht Teil der Paraphrasierungsregel, sondern der Programme für die Analyse und Generierung von Sätzen. Sätze mit den Verben „verlieren" und „besiegen" können mit folgender Regel ineinander überführt werden (verlieren (Cl-GOAL) (THEME-SOURCE) (LOC-THEME) besiegen) Diese Regel gibt an, daß der Aktant, der in einem Satz mit dem Verb „besiegen" im Agentiv-Kasus steht, bei einem Satz mit dem Verb
90
Kasusgrammatik u n d das Modell von Simmons
„verlieren" im GOAL-Kasus steht; in gleicher Weise wird bei dieser Transformation der THEME- durch den SOURCE-Kasus und der LOC- durch den THEME-Kasus ersetzt. Erhält das System den Satz „Napoleon verlor die Schlacht bei Waterloo gegen Wellington" dann kann zu einem beliebigen späteren Zeitpunkt die Frage „Gewann Wellington die Schlacht bei Waterloo?" mit Hilfe folgender Mechanismen beantwortet werden. Zunächst wird nach semantischen Repräsentationen von Sätzen gesucht, in denen die gleichen Ausdrücke wie in der Frage vorkommen. In unserem Beispiel haben der eingegebene Satz und die Frage zwei gemeinsame Ausdrücke: „Wellington" und „Schlacht bei Waterloo". Danach wird nach einer Paraphrasierungsregel gesucht, durch welche sich Sätze mit den beiden Verben ineinander überführen lassen. Findet sich eine solche Regel, dann wird in einem dritten Schritt danach gesucht, ob die Tiefenkasus der beiden semantischen Repräsentationen den in der Regel angegebenen Beziehungen entsprechen. Da die Tiefenkasus bei den beiden Verben „gewinnen" und „verlieren" einander entsprechen, muß für die Lösung des gegebenen Beispieles lediglich überprüft werden, ob die Ergänzungen „Wellington"und „Schlacht bei Waterloo" in dem vorher eingegebenen Satz die gleichen Tiefenkasus haben wie in der Frage. Dieses Vorgehen ist relativ einfach und ermöglicht in gewissen Fällen sicher eine effiziente Beantwortung von Fragen über früher dem System eingegebene Wissensinhalte. Andererseits wird die Brauchbarkeit dieses Systems wegen folgender zwei Probleme eingeschränkt. Zunächst ist es möglich, daß zwei inhaltlich ähnliche Sätze keine gemeinsamen Ausdrücke enthalten. Erhält das System etwa den Satz „Der Fahrer hat den Motor des Wagens angelassen", dann kann die Frage „Hat der Chauffeur das Auto gestartet?" nicht beantwortet werden. Zudem müßten, sobald das System einen größeren Wortschatz hat, eine sehr große Zahl von Paraphrasierungsregeln eingeführt werden, was einen großen Zeitaufwand bei der Antwortsuche nach sich ziehen würde. Kap. VI enthält eine genauere Analyse dieser Nachteile und die Beschreibung von alternativen Modellen zur semantischen Repräsentation, mit Hilfe derer diese Nachteile vermieden werden können. In den beiden letzten Abschnitten dieses Kapitels werden von Simmons und seinen Mitarbeitern entwickelte Algorithmen beschrieben, welche die maschinelle Analyse und Generierung von englischen Sätzen in, bzw. aus einem semantischen Netzwerk ermöglichen. Ein nicht nur oberflächliches Verstehen dieser und anderer, in den folgenden Kapiteln beschriebenen Ansätze setzt voraus, daß der Leser über gewisse Grundkenntnisse in der Programmiersprache LISP ver-
Die Struktur des Netzwerkes von S i m m o n s
91
fügt. Der folgende Abschnitt 3 soll diese Kenntnisse bis zu dem Grade vermitteln, wie er für das Verständnis der darauffolgenden Abschnitte notwendig ist. Man könnte argumentieren, daß es sich hierbei um ein technisches Wissen handelt, welches zwar für das Verstehen der Computerprogramme notwendig sei, für das Verstehen der psychologischen und linguistischen Implikationen der geschilderten Modelle jedoch keine Bedeutung habe. Dies stimmt insofern, als die durch Programme beschriebenen und gesteuerten Prozesse sich auch natürlichsprachlich ausdrücken lassen. Andererseits besteht dabei die Gefahr, daß solche Beschreibungen sehr grob sind und über theoretisch bedeutsame Probleme hinweggehen. Fast alle mir bekannten größeren Programme im Bereich der künstlichen Intelligenz enthalten Tricks, im Fachjargon „kludges" genannt. Dabei handelt es sich meist um versteckte Routinen, die in den Beschreibungen der Programme vom Autor nicht erwähnt werden, und welche dazu dienen, Mängel in der allgemeinen Konzeption des Programmes zu überbrücken. Die Diskrepanz zwischen dem theoretischen Anspruch des Autors und der tatsächlichen Leistungsfähigkeit seines Ansatzes erkennt der Leser in solchen Fällen erst, wenn er dessen Programme analysiert. Für eine detaillierte Beschreibung zumindestens einiger Beispiele von Programmen zum Verstehen von Sprache spricht auch ein zweites Motiv: Als Folge der zunehmenden Popularität der künstlichen Intelligenz im Bereich der kognitiven Psychologie sind in den letzten Jahren eine Reihe von Modellen entwickelt worden, die sich in der verwendeten Notation eng an Computerprogramme anlehnen. Der Satz Peter ging in die Stadt wird dabei etwa in den Ausdruck (GEHEN PETER STADT VERGANGENHEIT) transformiert, und der Autor bezeichnet diesen dann als die semantische Repräsentation des Satzes. Wie weit solche Ausdrücke für die Beschreibung von Verstehensprozessen nützlich sind, zeigt sich erst durch die Beantwortung folgender beider Fragen: Lassen sich Prozesse beschreiben, durch welche sich Sätze natürlicher Sprache in diese Art von Repräsentation überführen lassen und vice versa? Bilden solche Repräsentationen eine günstige Basis für die Durchführung von Such- und Inferenzprozessen? Diese beiden Fragen können nur dann beantwortet werden, wenn konkrete Vorstellungen über die Satzanalyse bestehen. Jeder auf diesem Gebiet entwickelte Formalismus enthält notwendigerweise eine Reihe von wichtigen Annahmen sowohl über den Analyseprozeß als
92
Kasusgrammatik und das Modell von Simmons
auch über die durch die Analyse aufgebaute syntaktische oder semantische Struktur. Algorithmen für die Satzanalyse sind also zugleich psychologische Modelle für das Verstehen von Sprache und die Speicherung von Sätzen. Bei den bestehenden Ansätzen handelt es sich sicher um mangelhafte Modelle; es sind jedoch die einzigen detaillierten Beschreibungen der beim Verstehen von Sätzen ablaufenden Analyseprozesse und müssen deshalb zur Kenntnis genommen werden.
3. Einführung in die Programmiersprache LISP Die von McCarthy et al. (1962) entwickelte Programmiersprache LISP zeichnet sich gegenüber anderen Programmiersprachen dadurch aus, daß sie eine zugleich elegante und einfache Bearbeitung von nicht numerischen Daten erlaubt. Zur Zeit ist LISP die am häufigsten benützte Sprache im Bereich der künstlichen Intelligenz im allgemeinen und der automatischen Bearbeitung natürlicher Sprachen im besonderen. Eine minimale Kenntnis dieser Sprache ist deshalb für das Verstehen der Arbeiten auf diesem Gebiet notwendig und wird in manchen Publikationen auch vorausgesetzt. Dieses Minimum soll dem Leser durch die folgenden Abschnitte vermittelt werden; d. h. er soll ein so weites Verständnis von LISP erwerben, daß ihm die Rezeption der Fachliteratur nicht wegen seiner Unkenntnis dieser Sprache verschlossen bleibt. Zudem sollen die Beispiele dem Leser ein gewisses Gefühl für die bei der Programmierung in LISP sehr spezifische Denkweise vermitteln. Die hier vermittelten Kenntnisse werden jedoch nicht ausreichen, um selbständig eigene Programme in LISP zu schreiben. Gute Anleitungen zur Programmierung in LISP finden sich in McCarthy et al. ( 1 9 6 2 ) , Weissmann ( 1 9 6 7 ) und King & Hayes ( 1 9 7 6 ) . Wie in den natürlichen Sprachen die Wörter, so sind in LISP die Atome die primitivsten Einheiten, aus denen sich alle komplexen Ausdrücke zusammensetzen. Dabei lassen sich zwei Arten von Atomen unterscheiden: Die numerischen Atome oder Zahlen einerseits und die alphabetischen Atome anderseits. Die alphabetischen Atome, von denen im folgenden allein die Rede sein wird, sind Sequenzen von Buchstaben und/oder Ziffern, wobei das erste Zeichen ein Buchstabe sein muß. Atome werden durch Wortzwischenräume oder Klammern begrenzt. Werden eines oder mehrere Atome in Klammem gesetzt, so entsteht damit eine Liste. Listen selbst können auch in Klammern gesetzt und so zu Listen höherer Ordnung miteinander verbunden werden.
Einführung in die Programmiersprache LISP
93
(ABC D E23) (X) ((A B) (CD EF))
ist eine Liste aus drei Atomen ist eine Liste aus einem Atom ist eine Liste aus zwei Listen, die aus j e zwei Atomen bestehen ((DER MANN) ISST) ist eine Liste, die aus einer Liste aus zwei Atomen und aus einem Atom besteht Atome können in drei verschiedenen Funktionen gebraucht werden: a) Atome als Namen von Variablen Werden sie in dieser Funktion gebraucht, dann entsprechen die Atome etwa den Variablen in algebraischen Gleichungen. Während der Wert einer Variable in einer algebraischen Gleichung immer eine Zahl ist, kann der Wert einer Variable in LISP auch ein Atom oder eine Liste sein. b) A tome als Name einer Funktion Der Name einer LISP-Funktion entspricht in einer algebraischen Gleichung einem Operator, ζ. Β. , , + " , „—", „ : " , usw. Im Unterschied zu algebraischen Operatoren werden die Namen von Funktionen in LISP allerdings nicht durch spezielle Symbole bezeichnet, d. h. sie sind äußerlich nicht von den anderen Atomen zu unterscheiden. Zudem werden die Namen von Funktionen in LISP nicht zwischen, sondern vor die Variablen gestellt. Der algebraische Ausdruck X + Y wird in LISP folgendermaßen geschrieben (PLUS X Y). Eine LISP-Funktion ist also eine Liste, deren erstes Glied der Name der Funktion ist, und deren weitere Glieder die sog. Argumente der Funktion sind. Dabei ist für jede Funktion festgelegt, wieviele Argumente sie hat. Ein LISP-Programm ist nun nichts anderes als eine oder mehrere ineinandergeschachtelte Funktionen. Dies soll im folgenden an der Funktion mit dem Namen CAR demonstriert werden. Diese Funktion dient dazu, das erste Glied einer Liste zu bestimmen. Nehmen wir an, es bestände eine Liste mit dem Namen X, die aus den beiden Atomen Α und Β zusammengesetzt ist. Erhält nun das System den Ausdruck (CAR X ) eingegeben, dann wird dieser Ausdruck wie man sagt evaluiert, d. h. es wird dessen Wert berechnet. Der Wert der Variable X , die zuerst evaluiert wird, ist die Liste ( A B ) . Der Wert der Funktion CAR, der als zweites berechnet wird, ist in diesem Beispiel das erste Glied dieser Liste, also das Atom A. Bei der Evaluation von ineinander verschachtelten Ausdrücken wird der Wert der inneren, stärker eingebetteten Variablen und Funktionen immer zuerst berechnet. Nehmen wir an, es gäbe eine
94
Kasusgrammatik und das Modell von Simmons
Variable mit dem Namen Y, welche als Wert die Liste (Χ X) habe. Erhält das System nun den Ausdruck (CAR (CAR Υ)) dann laufen folgende Prozesse ab: Zuerst wird die innere Funktion (CAR Y) evaluiert. Dies ist jedoch nur möglich, wenn zuvor Y evaluiert wurde. Der Wert von Y ist die Liste (Χ X) und der Wert von X ist die Liste (Α Β). Y evaluiert deshalb zu der zusammengesetzten Liste ((Α Β) (A B)) und (CAR Y) hat damit den Wert (A B). Das Resultat der Evaluation des Ausdruckes (CAR (CAR Y)) ist damit das Atom A. c) Atome als konstante Werte Nun kann es vorkommen, daß das Argument einer Funktion nicht evaluiert werden sollte, d. h. daß die in einem Argument enthaltenen Atome nicht als Namen von Funktionen oder Variablen, sondern als konstante Werte betrachtet werden. Dies kann durch eine Funktion mit dem Namen QUOTE (deutsch: zitieren) erreicht werden. Die Wirkung dieser Funktion ist, daß ihr Argument nicht evaluiert wird. Erhält das System beispielsweise den Ausdruck (CAR (QUOTE (CAR X))) dann wird die Liste (CAR X) nicht als Funktion betrachtet, sondern als eine Liste von zwei Konstanten. Der Wert des obigen Ausdrucks ist deshalb CAR. Der hinter dem Funktionsnamen QUOTE stehende Ausdruck wird vom System „wörtlich genommen". Nimmt man wie beim obigen Beispiel an, die Variable X habe als Wert die LISTE (A B) dann sind die beiden Ausdrücke (CAR X) und (CAR (QUOTE (AB))) äquivalent und haben den Wert A. In vielen LISP-Systemen kann die Bezeichnung QUOTE durch das Symbol # ersetzt werden, eine Vereinfachung, von der auch in den folgenden Abschnitten Gebrauch gemacht werden soll. Im folgenden sollen noch einige weitere LISP-Funktionen erklärt werden, die in den später zu besprechenden Programmen häufig gebraucht werden: CDR (ausgesprochen: Kudr): Wie CAR, so hat auch diese Funktion eine Liste als Argument. Ihr Wert ist die Liste, die übrig bleibt, wenn das erste Element des Argumentes entfernt wurde. Wenn der Wert von X die Liste (A B) ist, dann evaluiert (CDR X) zu (B).CAR-undCDR-Funktionen können ineinander verschachtelt werden. Hat eine komplexe Liste Ζ den Wert ( ( A B ) C ( D (E F)))
Einführung in die Programmiersprache L I S P
dann evaluiert
CONS
SET und SETQ
EQUAL
95
(CAR Ζ) zu (Α Β), (CDR Ζ) zu (C (D (E F))), (CAR (CDR Ζ)) zu C, (CDR ( C A R Z ) ) zu (B), und (CAR (CDR (CDR (CDR Z)))) zu Ε : Diese Funktion hat zwei Argumente, die beide evaluiert werden. Das erste Argument kann ein Atom oder eine Liste sein, während das zweite Argument eine Liste sein muß. Der Wert von CONS ist eine Liste, welche der Wert des zweiten Argumentes ist, und an deren Anfang der Wert des ersten Argumentes gesetzt wurde. Hat die Variable U den Wert (C D) und die Variable V den Wert (A B), dann hat (CONS U V) den Wert ((C D)A B). Die Funktionen CAR, CDR und CONS sind miteinander verwandt; denn es gilt für jede beliebige Liste L, daß der Wert von (CONS (CAR L) (CDR L)) wiederum L ergibt. : Diese Funktionen dienen dazu, Variablen Werte zuzuordnen. Das erste Argument dieser Funktionen ist der Name der Variable, welcher ein Wert zugeordnet werden soll, und das zweite Argument ist der zuzuordnende Wert. Die beiden Funktionen unterscheiden sich voneinander dadurch, daß das zweite Argument bei S E T evaluiert wird und bei SETQ nicht. Die drei Ausdrücke (SET Α (QUOTE B)), (SET A # B) und (SETQ A B ) sind also identisch. Hat die Variable X den Wert (A B) dann hätte die Variable X I nach Anwendung der Funktion (SET X I X) ebenfalls den Wert ( A B ) . Der Wert der Variable X2 nach Anwendung von (SETQ X 2 X) wäre jedoch das Atom X. : Diese Funktion hat zwei Argumente, die beide evaluiert werden. Der Wert der Funktion ist entweder „wahr" oder „falsch". Diese beiden Werte werden in LISP durch die Symbole Τ (vom engl, „true") und N I L (= nichts) bezeichnet. E Q U A L evaluiert zu T, wenn die beiden Argumente den gleichen Wert haben und zu NIL, wenn die beiden Argumente verschiedene Werte haben. Wenn also X den Wert (A B) hat, dann evaluiert
96
NULL
AND
COND
Kasusgrammatik und das Modell von Simmons
(EQUAL (CAR Χ) # A) zu Τ . Der Wert von (EQUAL (CDR X) # A) wäre NIL. : Der Wert dieser Funktion ist T , wenn ihr Argument zu NIL evaluiert. In allen anderen Fällen ist der Wert dieser Funktion NIL. Als Argument kann sowohl eine andere Funktion aufgerufen werden, oder es kann eine Liste sein. Listen haben dann den Wert NIL, wenn es sich um sog. leere Listen handelt, die nur aus den beiden Klammern bestehen. Wenn (SETQ V (A)) durchgeführt wurde, dann ist der Wert von (NULL (CAR V)) NIL, da der Wert von (CAR V ) ) das Atom Α ist und der Wert von (NULL (CDR V)) ist T , da der Wert des von (CDR V) eine leere Liste ist. : Diese Funktion kann beliebig viele Argumente haben, die alle evaluiert werden. Hat keines der Argumente den Wert NIL, dann ist der Wert der Funktion T , sonst ist ihr Wert NIL. Namen von Variablen, denen im Ablauf des Programmes noch kein Wert zugeordnet worden ist, haben automatisch den Wert NIL. : Diese Funktion wird dann benützt, wenn die Ausführung eines Prozesses von bestimmten Bedingungen abhängig gemacht werden soll. Die Funktion kann beliebig viele Argumente haben, die in folgender Form angeordnet sind: (COND ((erste Bedingung) (erste Handlung)) ((zweite Bedingung) (zweite Handlung)) ((letzte Bedingung) (letzte Handlung))) Bei der Evaluierung dieses Ausdruckes wird zunächst die erste Bedingung evaluiert. Ist ihr Wert T , dann wird die erste Handlung durchgeführt. Ist der Wert der ersten Bedingung NIL, dann wird die zweite Bedingung evaluiert. Ist diese T, dann wird die zweite Handlung durchgeführt; ist sie NIL, dann wird die dritte Bedingung evaluiert usw. bis zum Ende der Funktion. Wenn im Laufe dieses Prozesses eine wahre Bedingung gefunden und die entsprechende Handlung durchgeführt wurde, dann bricht die
Einführung in die Programmiersprache LISP
DE
97
Evaluation der Funktion ab, d. h. die restlichen Bedingungen und Handlungen werden vom Programm ignoriert. Dieser Ablauf kann an folgendem Beispiel demonstriert werden: Es soll bestimmt werden, ob ein Satz mit den Artikeln „der", „ d i e " oder „ d a s " beginne. Wenn ja, dann sollte der Wert der bestimmenden Funktion das Wort „maskulin", „feminin" bzw, „neutrum" sein. Beginnt der Satz mit keinem der drei Wörter, dann soll der Wert der Funktion NIL sein. Es soll angenommen werden, daß der Satz durch eine Liste von Wörtern mit dem Namen SATZ repräsentiert ist. Diese Aufgabe könnte nun durch folgende COND-Funktion gelöst werden: (COND ( ( E Q U A L (CAR SATZ) # DER) (# MASKULIN)) ((EQUAL (CAR SATZ) # DIE) (# FEMININ)) ((EQUAL (CAR SATZ) # DAS) (# NEUTRUM)) (T NIL)) Bei den ersten drei Zeilen der Funktion wird jeweils geprüft, ob das erste Wort des Satzes (CAR SATZ) einem der drei gesuchten Artikel gleich ist. Die durchgeführte Handlung besteht lediglich aus der Nennung des Wortes, welches der resultierende Wert der Funktion ist. Die Bedingung der vierten Zeile der Funktion ist der Wert T. Dies ist so zu interpretieren, daß die Bedingung auf alle Fälle wahr ist, d. h. in all denjenigen Fällen, in denen die vierte Zeile evaluiert wird. Der Wert der Funktion ist dann NIL. : Bei den bislang erwähnten Funktionen handelt es sich ausschließlich um sog. Systemfunktionen. Dies sind Funktionen, die Teil der Sprache LISP sind und die der Benützer eines LISP-Systems schon fertig vorfindet. Die Funktion DE erlaubt es nun dem Benützer, eigene Funktionen zu schreiben, die er, genau wie Systemfunktionen, überall in seinen Programmen verwenden kann. Dies ist vor allem dann nützlich, wenn an verschiedenen Stellen des Programmes oder in verschiedenen Programmen der gleiche Prozeß durchgeführt werden muß. Die Funktion DE hat folgenden Aufbau: (DE Name-der-neuen-Funktion (Namen-der-Argumente) Beschreibung-der-Funktion)
Kasusgrammatik u n d das Modell von Simmons
Dies soll im folgenden am Beispiel einer Funktion mit dem Namen ELEMENT demonstriert werden. Durch diese Funktion kann gefunden werden, ob in einem Satz ein bestimmtes Wort enthalten ist. Auch in diesem Beispiel wird angenommen, daß der Satz durch eine einfache Liste von Wörtern dargestellt ist. Die Funktion ELEMENT benötigt zwei Argumente. Das erste Argument ist der SATZ (d. h. die Wortliste), in dem nach dem Wort gesucht wird, und das zweite Argument ist das gesuchte Wort. Die beschriebene Aufgabe kann nun durch folgende Funktion gelöst werden, die weiter unten erklärt werden soll: (DE ELEMENT (SATZ WORT) (COND ((NULL SATZ) NIL) ((EQUAL WORT (CAR SATZ)) T) (T (ELEMENT (CDR SATZ) WORT)))) Die erste Zeile enthält lediglich den Namen der zu definierenden Funktion und deren Argumente. Die eigentliche Funktion ist eine dreigliedrige COND-Funktion, deren Ablauf allerdings nicht ganz leicht zu durchschauen ist. Der Kern der Funktion ist die zweitletzte Zeile, in welcher überprüft wird, ob das gesuchte Wort (WORT) mit dem ersten Wort des Satzes (CAR SATZ) identisch ist. Wenn ja, dann hat die Funktion ELEMENT den Wert T. Nun muß diese Prüfung aber nicht nur beim ersten Wort des Satzes, sondern möglicherweise auch beim zweiten, dritten usw. bis zum letzten Wort des Satzes durchgeführt werden. LISP kennt jedoch weder die Ausdrücke „zweiter" und „dritter" noch den Ausdruck „usw". Was in LISP jedoch bestimmt werden kann, sind das erste Glied einer Liste (mit der Funktion CAR) u n d die Liste nach der Wegnahme des ersten Gliedes (mit der Funktion CDR). Dies genügt nun, um das zweite, dritte, usw. Glied zu bestimmen; denn das zweite Glied wird j a zum ersten Glied, wenn das erste Glied nicht mehr in der Liste enthalten ist, das dritte Glied wird zum ersten Glied, wenn wiederum das erste Glied weggelassen wird usw. Diese Art von Wiederholung wird durch die letzte Zeile der obigen Funktion bewirkt. Da die Bedingung Τ ist, wird die darin spezifizierte Handlung immer dann durchgeführt, wenn die Bedingungen in den beiden oberen Zeilen nicht zu Τ evaluieren, d. h. nicht zutreffen. Die
Einführung in die Programmiersprache LISP
99
Handlung besteht in einem Aufruf der Funktion ELEMENT. Innerhalb der Definition der Funktion ELEMENT wird also auf diese Funktion bezug genommen. Dabei ist jedoch nicht mehr der ganze Satz das Argument der Funktion, sondern der CDR des Satzes, d. h. der Satz ohne das erste Wort. Der Wert von (CAR SATZ) ist beim wiederholten Ablauf der Funktion also das zweite Wort des Satzes. Ist auch dieses nicht das gesuchte Wort, dann wird die Funktion ELEMENT nochmals aufgerufen, wobei die Liste SATZ wiederum um das erste Wort verkürzt wird. Dieses wiederholte Aufrufen der Funktion wird so lang fortgesetzt, bis entweder das gesuchte Wort gefunden wird oder bis alle Wörter des Satzes abgesucht wurden. Dies ist dann der Fall, wenn die in der ersten Zeile der COND-Funktion enthaltene Bedingung (NULL SATZ) den Wert Τ hat. Ist diese Bedingung erfüllt, dann ist der Wert der Funktion NIL. Enthält ein Programm, welches über die Funktion ELEMENT verfügt, den Befehl (ELEMENT (# (DER MANN GEHT FORT) # GEHT) dann wird diese Funktion durchgeführt, wobei die Liste (DER MANN GEHT FORT) das als Satz bezeichnete Argument und das A t o m GEHT das als WORT bezeichnete Argument bilden. In diesem Fall wird zunächst geprüft, ob die als Satz bezeichnete Liste leer ist, d. h. kein Wort enthält. Da dem nicht so ist, wird darauf geprüft, o b das erste Wort des Satzes das Wort GEHT ist. Da auch dies nicht der Fall ist, wird die Funktion Element nochmals aufgerufen, wobei diesmal das als SATZ bezeichnete Argument aus der Liste (MANN GEHT FORT) besteht. Da auch jetzt das erste Wort nicht das Wort GEHT ist, wird die Funktion ELEMENT nochmals mit der Liste (GEHT FORT) als Argument aufgerufen. Bei diesem dritten Aufruf der Funktion entspricht das erste Wort der Satzliste dem gesuchten Wort GEHT und der Wert der Funktion wird damit T. Damit sind jedoch die Berechnungen noch nicht abgeschlossen; denn der Wert Τ ist das Resultat der Funktion ELEMENT bei ihrem dritten Aufruf. Nun ist durch die letzte Zeile der Funktion festgesetzt, daß der Wert der Funktion gleich dem Wert der Funktion bei ihrem
100
Kasusgrammatik und das Modell von Simmons
zweiten Aufruf entspricht und dieser wiederum dem Wert der Funktion beim dritten Aufruf. Damit bildet der Wert Τ auch das Resultat der Funktion bei ihrem zweiten und ersten Aufruf. Tab. 15 ist eine Beschreibung der Prozesse, die beim wiederholten Ablauf der rekursiven Funktion ablaufen. Dabei wird von dem System auf einer push-down Liste, die dem Benutzer nicht zugänglich ist, abgespeichert, in welcher Reihenfolge die ineinander verschachtelten Funktionen aufgerufen wurden. Die Möglichkeit zur Rekursivität, d. h. zum Aufrufen einer Funktion durch sie selbst, ist für die Simulierung kognitiver und sprachlicher Prozesse wichtig; denn in der Sprache selbst können Einbettungen gleichartiger Satzteile beobachtet werden. Ein Beispiel dafür sind etwa die eingebetteten Relativsätze von der Form: „Den Linguisten, die Satzkonstruktionen, die kein Mensch, der nicht selbst ein Linguist ist, verstehen kann, als Beispielsätze verwenden, müßte das Publizieren verboten werden". Tab. 15: Rekursiver Aufruf der LISP-Funktion E L E M E N T (Erläuterungen siehe Text) Erster Aufruf der Funktion E L E M E N T Liste SATZ ist nicht leer Erstes Wort ist nicht GEHT Zweiter Aufruf der Funktion E L E M E N T Liste SATZ ist nicht leer Erstes Wort ist nicht GEHT Dritter Aufruf der Funktion E L E M E N T Liste SATZ ist nicht leer Erstes Wort ist GEHT Resultat des dritten Aufrufs ist Τ Ende des dritten Aufrufs Resultat des zweiten Aufrufs ist Τ Ende des zweiten Aufrufs Resultat der Funktion ist Τ Ende der Funktion
PUT und GET
: In den bisherigen Ausführungen wurden Atome als Einheiten dargestellt, die lediglich aus einem Wort beste hen, und durch die Funktionen und Variablen benannt werden können. Zusätzlich dazu können den Atomen durch die Funktion PUT noch Eigenschaften zugeordnet werden. J e d e Eigenschaft besteht aus einem Indika-
Einführung in die Programmiersprache LISP
101
tor und aus einem Wert. Durch die Befehle: (PUT # MANN # O B E R B E G R I F F # MENSCH) und (PUT # MANN # WORTKLASSE # SUBSTANTIV) werden dem Atom Mann unter dem Indikator OBERBEG R I F F die Eigenschaft MENSCH und unter dem Indikator WORTKLASSE die Eigenschaft SUBSTANTIV zugeordnet. Die Funktion G E T dient dazu, Eigenschaften von Atomen aufzufinden. Sie hat zwei Argumente, das Atom und den Indikator, und ihr Wert ist die gesuchte Eigenschaft. Der Wert von (GET # MANN # WORTKLASSE) wäre die Eigenschaft SUBSTANTIV. Das Gesamt der Eigenschaften eines Atomes wird als dessen Eigenschaftsliste (engl, „property-list") bezeichnet. GENSYM : Diese Funktion dient dazu, neue Atome zu kreieren. Der Name dieses Atoms wird dabei vom LISP-System bestimmt und ist in der Regel ein Buchstabe und daran angehängt eine Reihe von Zahlen (ζ. B. G00123). Die GENSYM-Funktion ist beispielsweise dann nützlich, wenn während des Verstehensprozesses in einem semantischen Netz neue Token-Knoten aufgebaut werden. Wird einem System beispielsweise der Satz „Peter sah einen weißen Hund" dargeboten, dann muß im semantischen Netz ein Knoten für das Objekt „weißer Hund" aufgebaut werden. Dies könnte durch folgenden Befehl geschehen: (PUT (PUT (GENSYM) # TOK # HUND) # F A R B E # WEISS) Bei der Ausführung dieses Befehles wird zunächst die innerste Funktion GENSYM ausgeführt, d. h. ein neuer Knoten geschaffen. Darauf wird diesem Knoten unter dem Indikator TOK die Eigenschaft HUND und zuletzt unter dem Indikator F A R B E die Eigenschaft WEISS zugeordnet. Der damit geschaffene Knoten hat die gleiche Struktur wie die in Tab. 14 dargestellten Token in dem semantischen Netzwerk von Simmons.
102
Kasusgrammatik und das Modell von Simmons
4. Die Analyse von Sätzen in ein semantisches Netzwerk Die automatische Satzanalyse (engl, parsing) wird schon seit den Anfängen der Computerlinguistik in den frühen fünfziger Jahren als der wichtigste Problembereich dieses Fachgebietes betrachtet. Dies ist hauptsächlich dadurch bedingt, weil die Lösung dieser Aufgabe als der wichtigste Schritt für eine Reihe von technischen Anwendungen, wie ζ. B. für die automatische Übersetzung oder für die Kommunikation zwischen Mensch und Maschine in natürlicher Sprache betrachtet wird. Auf die recht breite Literatur über automatische Satzanalyse soll hier nur insoweit eingegangen werden, als sie für das Thema dieser Arbeit, das semantische Wissen und das Verstehen natürlicher Sprache, relevant ist. Leider ist dies, vor allem bei der älteren, vor 1 9 7 0 veröffentlichten Literatur auf diesem Gebiet kaum der Fall. Detaillierte Beschreibungen von Systemen zur automatischen Satzanalyse finden sich beispielsweise in Booth ( 1 9 6 7 ) oder Zampolli ( 1 9 7 4 ) . Eine kurze und leicht verständliche Einführung in die klassischen Ansätze auf dem Gebiet der automatischen Satzanalyse gibt die Monographie von Hays (1967). Durch das Wort „Satzanalyse" wird eine Vielzahl verschiedener Prozeduren bezeichnet, deren Gemeinsamkeit lediglich darin besteht, daß Sätze irgendwie zerlegt oder in eine andere Struktur transformiert werden. Dabei muß jedoch jeweils spezifiziert werden, in welche Bestandteile ein Satz zerlegt wird. In den klassischen, auf linguistische Modelle hin orientierten Parsern ( d . h . Programmen zur automatischen Satzanalyse) sollte durch die Analyse die syntaktische Tiefenstruktur des Satzes aufgedeckt werden, d. h. die syntaktischen Abhängigkeiten zwischen den einzelnen Wörtern und Satzgliedern. In der von Chomsky (1957) entwickelten generativen Transformationsgrammatik (abgekürzt GTG) ist die Tiefenstruktur eines Satzes zugleich ein Abbild von dessen Generierung; dieser Ausdruck bezeichnet allerdings nicht den psychologischen Prozeß der Satzbildung. Tab. 16 zeigt einige Regeln einer GTG des Deutschen. Diese Regeln müssen so verstanden werden, daß bei der Bildung eines Satzes der Ausdruck links des Pfeiles durch den Ausdruck rechts des Pfeiles ersetzt wird.
103
Die A n a l y s e von Sätzen in ein semantisches Netzwerk Tab. 16: Beispiel von Regeln einer generativen Transformationsgrammatik (1) S -*• NP + V P Abkürzungen: (2) NP -*· DET + Ν (3) NP -*• NP + PNP (4) V P V / T R A N S + NP (5) V P -»· V/ITRANS + PNP (6) PNP ->· P R A E P + NP (7) DET -* der, die, das, d e m . . . (8) Ν -»• Frau, Mann, Hund, Stein, Hut . . . (9) V / T R A N S schlägt, kennt, m a c h t . . . ( 1 0 ) V / I T R A N S -»· geht, steht . . . (11) PRAEP in, auf, zu, mit . . . (12) NPj + V/TRANS + NP2 N P 2 + wird + von + N P j + V / T R A N S
NP VP
=
PNP
=
V/TRANS = V/ITRANS = PRAEP = DET = Ν = ( P A R T . PERF)
Nominalphrase Verbalphrase oder Prädikate Nominalphrase mit vorangestellter Präposition transitives V e r b intransitives V e r b Präposition Artikel Nomen
Zudem, gilt die Festsetzung, daß als erster Schritt der Satzgenerierung die Regel angewendet werden muß, deren linker Teil das Symbol S (das sog. Satzausgangssymbol) bildet. Die Reihenfolge, in der die anderen Regeln angewendet werden, ist nicht festgesetzt. Bei der Bildung eines Satzes nach dieser Grammatik wird also zunächst das Symbol S durch die beiden Symbole NP und VP ersetzt. Darauf kann durch die Anwendung von Regel (3) das Symbol NP durch die Symbole NP und PNP und durch die Anwendung von Regel (4) kann das Symbol VP durch die beiden Symbole V/TRANS und NP ersetzt werden. Damit entsteht die Kette: NP + PNP + V/ TRANS + NP. Jedes dieser vier Symbole wird nun wieder durch andere Symbole ersetzt. Dieser Vorgang wird so lange fortgesetzt, bis die gebildete Kette ausschließlich aus (in Tab. 16 klein geschriebenen) Wörtern besteht. In der Terminologie der GTG werden die in Tab. 16 groß geschriebenen Symbole als nicht-terminale und die klein geschriebenen Wörter als terminale Symbole bezeichnet. Nicht-terminale Symbole können dabei rechts und links des Pfeiles stehen, terminale Symbole lediglich rechts des Pfeiles. Abb. 11 zeigt die Tiefenstruktur des Satzes „der Mann mit dem Hut schlägt den Hund" der mit dem in Tab. 16 beschriebenen Regelsystem generiert wurde. Abb. I I a und Abb. 1 1 c enthalten die gleichen Informationen und unterscheiden sich voneinander lediglich in der Art der Repräsentation: Während das Symbol für das dominierende Satzglied sich in Abb. I I a oberhalb der dominierten Satzglieder oder Wörter befindet, steht es in Abb. 11 c am Anfang des Klammerausdruckes, in welchem die dominierten Satzglieder enthalten sind. Die in Abb. I I b dargestellte Repräsentation ist insofern verschieden, als durch die Verklammerung lediglich angegeben ist, welche Satzglieder zusammengehören, ohne daß diesen Gruppen höherer Ordnung eine Bezeichnung zugeordnet wäre.
104
Kasusgrammatik und das Modell von Simmons
Abb. 11: Tiefenstruktur eines Satzes, der durch die in Tab. 16 beschriebene Grammatik generiert wurde (a) Darstellung in einem Stemma:
DET
der
mann
mit
dem
hut
schlägt
den
hund
(b) Darstellung als Klammerausdruck: (((der mann) (mit (dem hut))) ((schlägt) (den hund))) (c) Darstellung durch indizierte Klammern: (S (NP (NP (DET der) (N mann)) (PNP (PRAEP mit) (NP (DET dem) (N hut)))) (VP (V/TRANS schlägt) (NP (DET den) (N hund))))
Die automatische Satzanalyse, bei der ein Satz in eine der in Abb. 11 gezeigten Tiefenstrukturen zerlegt werden soll, kann mit Hilfe derselben Regeln durchgeführt werden, die für die Generierung des Satzes verwendet werden. Die Satzanalyse kann dabei als Prozeß betrachtet werden, bei dem festgestellt wird, nach welchen Regeln der zu analysierende Satz generiert wurde. Dies kann mit folgenden beiden Methoden erreicht werden: Bei der bottom-up (von unten nach oben) Analyse wird der Satz von links nach rechts Wort für Wort abgetastet. Dabei wird zunächst bestimmt, welchen Wortklassen die einzelnen Wörter zugeordnet werden können. Solche Zuordnungen können ganz einfach dadurch gefunden werden, daß man nach Regeln sucht, in deren rechten Teil sich das entsprechende Wort befindet; im linken Teil dieser Regel befindet sich dann das Symbol für die entsprechende Wortklasse. Sind die einzelnen Wortklassen bestimmt worden, dann wird wiederum nach einer Regel gesucht, deren rechter Teil aus den Symbolen für diese Wortklassen besteht; der linke Teil dieser Regel enthält dann das Symbol für die nächsthöhere Kategorie. Diese Suche nach höheren Kategorien wird so lange fortgesetzt, bis der ganze Satz unter
Die Analyse von Sätzen in ein semantisches Netzwerk
105
eine Kategorie, die Kategorie S, subsumiert werden kann. Entspricht die gesuchte Tiefenstruktur der in Abb. I I b gezeigten Repräsentation, dann wird bei jedem Schritt der Analyse, bei dem eine Regel erfolgreich angewendet werden kann, eine neue Liste geschaffen, deren erstes Glied das Symbol für die neu gefundene Kategorie ist. Tab. 17 zeigt den sukzessiven Aufbau der Tiefenstruktur bei der bottom-up Analyse des oben gegebenen Beispielsatzes „der Mann mit dem Hut schlägt den Hund". Tab. 17: Bottom-up Analyse des Beispielsatzes aus A b b . 11. Die Zahlen in der ersten Kolonne geben an, welche der in T a b . 16 genannten Regeln für den entsprechenden Schritt der Analyse angewendet wurde 7 8 2 11 7 8 2 6 3 9
2 4 1
der m a n n mit dem h u t schlägt den h u n d (DET der) mann mit dem hut schlägt den h u n d ( D E T der) (N mann) mit dem h u t schlägt d e n h u n d (NP (DET der) (N mann)) mit dem h u t schlägt den hund (NP (DET der) (N mann)) (PRAEP mit) d e m hut schlägt den h u n d (NP (DET der) (N mann)) (PRAEP mit) ( D E T dem) hut schlägt den hund (NP (DET der) (N mann)) (PRAEP mit) (DET dem) (N hut) schlägt den hund (NP (DET der) (N mann)) (PRAEP mit) (NP (DET dem) (N hut)) schlägt den h u n d (NP (DET der) (N mann)) (PNP (PRAEP mit) (NP (DET dem) (N hut))) schlägt den hund (NP (NP (DET der) (N mann)) (PNP (PRAEP mit) (NP (DET dem) (N hut)))) schlägt den h u n d (NP (NP (DET der) (N mann)) (PNP (PRAEP mit) (NP (DET dem) (N hut)))) (V/TRANS schlägt) den hund
(NP (NP (DET der) (N mann)) (PNP (PRAEP mit) (NP (DET dem) (N hut)))) (V/TRANS schlägt) (NP (DET den) (N hund)) (NP (NP (DET der) (N mann)) (PNP (PRAEP mit) (NP (DET dem) (N hut)))) (VP (V/TRANS schlägt) (NP (DET den) (N hund))) (S (NP (NP (DET der) (N mann)) (PNP (PRAEP mit) (NP (DET dem) (N hut)))) (VP V / T R A N S schlägt) (NP (DET den) (N hund))))
Die zweite Methode zur Satzanalyse im Rahmen der GTG ist die sog. top-down (von oben nach unten) Analyse. Hier wird nicht von den einzelnen Wörtern des zu analysierenden Satzes ausgegangen, sondern das System generiert, vom Symbol S ausgehend, verschiedene Sätze, deren Wörter und Satzteile mit dem zu analysierenden Satz verglichen werden. Dabei wird jeweils das am weitesten links in der Tiefenstruktur stehende nicht-terminale Symbol expandiert; d. h. es wird eine Regel angewendet, durch welche dieses Symbol durch eines oder mehrere terminale oder nicht-terminale Symbole ersetzt wird.
106
Kasusgrammatik und das Modell von Simmons
Entspricht die so generierte Wortkette dem zu analysierenden Satz, dann ist dieser Satz erfolgreich analysiert worden; unterscheidet sich die generierte Wortkette von dem zu analysierenden Satz, dann werden durch die Anwendung anderer Regeln neue Wortketten mit den zugehörigen Tiefenstrukturen produziert. T a b . 18 zeigt die einzelnen Schritte der top-down Analyse des in A b b . 11 beschriebenen Beispielsatzes. Wie in Tab. 17, so sind auch hier nur diejenigen Schritte der Analyse aufgeführt, die zur richtigen Analyse des Satzes führen. Trotz der Verschiedenheit zwischen den beiden Algorithmen sind die top-down und die bottom-up Analyse in vielen Punkten ähnlich. S o sind beispielsweise die Mengen der Sätze, die mit jedem der beiden Algorithmen analysiert werden können, identisch. Tab. 18: Beginn der top-down Analyse des Beispielsatzes aus Abb. 11 nach den in Tab. 16 genannten Regeln 1 3 2 7 8 6 11
(S (S (S (S (S (S (S
(NP (NP (NP (NP (NP (NP (NP
VP)) (NP PNP)) VP) (NP (DET N)) PNP) VP) (NP (DET der) N) PNP) VP) (NP (DET der) (N mann)) PNP) VP) (NP (DET der) (N mann)) (PNP (PRAEP NP))) VP) (NP (DET der) (N mann)) (PNP (PRAEP mit) NP)) VP)
Beiden Algorithmen ist auch gemeinsam, daß die Analyse von Sätzen mit mehrdeutigen Wörtern und Satzteilen äußerst aufwendig ist. Beginnt ein Satz beispielsweise mit den drei Wörtern „die alten gruben . . . " , dann sind zwei Interpretationen möglich, die etwa in folgenden Sätzen stehen könnten: „die alten gruben stürzten e i n " und „die alten gruben löcher und die jungen schütteten sie z u " . J e nachdem, welche der beiden Interpretationen verfolgt wird, würde von einem bottom-up Algorithmus nach der Analyse der ersten drei Wörter eines der beiden folgenden Fragmente einer Tiefenstruktur aufgebaut werden: (NP ( D E T die) (ADJ alten) (N gruben)) . . . (NP ( D E T die) (N alten)) ( V / T R A N S gruben) . . . Falls sich das System nun für die falsche der beiden Alternativen entschieden hat, dann wird es in einem späteren Zeitpunkt der Satzanalyse stecken bleiben, d. h. es kann keine Regel gefunden werden, durch welche die analysierten Satzglieder zu einer Einheit höherer Ordnung verbunden werden können. In diesem Falle muß die bis zu diesem Zeitpunkt aufgebaute Tiefenstruktur gelöscht und der Prozeß zu einem früheren Zeitpunkt der Satzanalyse wiederaufgenommen werden. Dieses, in der Fachsprache „ b a c k t r a c k i n g " genannte Vorgehen ist darum sehr kompliziert, weil dem S y s t e m nicht bekannt
Die A n a l y s e von S ä t z e n in ein s e m a n t i s c h e s N e t z w e r k
107
ist, an welcher Stelle der Analyse eine Regel falsch angewendet wurde. Sowohl bei bottom-up als auch bei top-down Parsern gibt es folgende zwei Methoden, mehrdeutigen Wörtern und Satzteilen Rechnung zu tragen: Zum einen kann in jedem Zeitpunkt der Analyse jeweils nur eine der möglichen Alternativen verfolgt werden. Der Prozeß des back-tracking verläuft in diesem Falle ähnlich der depthfirst Suche, wie sie in Kap. III beschrieben wurde. Analyseprogramme mit diesem Ablauf werden deshalb auch als depth-first Parser bezeichnet. Zum anderen können zu jedem Zeitpunkt der Analyse alle möglichen Alternativen verfolgt werden. Die „falschen" Analysen können bei bottom-up Parsern dadurch erkannt werden, daß die gefundenen Kategorien nicht unter Kategorien höherer Ordnung subsumiert werden können; bei top-down Parsern führen die falschen Analysen zu Wortketten, die in dem zu analysierenden Satz nicht enthalten sind. Programme zur Satzanalyse, bei denen auf diese Art verschiedene Interpretationen zugleich verfolgt werden, nennt man breadth-first Parser. Die bislang beschriebenen Algorithmen eignen sich zur Analyse von Sätzen, deren Struktur durch eine GTG dargestellt wird. Ein alternatives Modell zur Repräsentation der syntaktischen Struktur von Sätzen ist das sog. Ubergangsnetzwerk. Ein Übergangsnetzwerk, auch gerichteter Graph genannt, besteht aus einer Reihe von sog. Zuständen, die durch gerichtete, d. h. nur in einer Richtung durchschreitbare Relationen miteinander verbunden sind. Dabei können den einzelnen Relationen Bedingungen zugeordnet werden, durch welche bestimmt wird, wann jede Relation durchschritten werden kann. Solche Übergangsnetzwerke werden zur Repräsentation von verschiedenen Arten von komplexen Prozessen verwendet. Dienen sie der Beschreibung syntaktischer Strukturen, dann bezeichnen die Bedingungen an den Übergängen zwischen den Zuständen häufig Wortklassen. Abb. 12 zeigt ein Übergangsnetzwerk, durch welches einige einfache deutsche Satzformen beschrieben werden. Dabei bilden die verschiedenen Zahlen eine Numerierung der einzelnen Zustände, wobei Zustand 1 den Anfang und Zustand 12 das Ende des Satzes bezeichnet. Jeder der durch Abb. 12 beschriebenen Sätze beginnt mit einer Nominalphrase, die aus einem Artikel (DET) und einem Nomen (N) bestehen muß. Darauf, in Zustand 3, sind drei Verzweigungen möglich, kann der Satz auf drei Weisen fortgesetzt werden: durch ein transitives Verb mit anschließendem direkten Objekt (Zustände 7 und 8), durch ein intransitives Verb mit anschließendem Präpositionalobjekt (Zustände 4, 5 und 6) oder durch eine Passivkonstruktion (Zustände 9, 10 und 11). Eine detaillierte Beschreibung der syntaktischen Struk-
108
Kasusgrammatik und das Modell von Simmons
tur deutscher Sätze in der Form eines Ubergangsnetzwerkes findet sich in Wettler (1970a). Die syntaktische Analyse von Sätzen, deren Struktur durch ein Übergangsnetzwerk beschrieben wird, ist sehr einfach: Das Programm muß lediglich überprüfen, ob die Aufeinanderfolge der Wortklassen in dem zu analysierenden Satz einer der Sequenzen entspricht, die in dem Übergangsnetzwerk durchschritten werden können. Abb. 12: Darstellung eines Ausschnittes der in Tab. 16 dargestellten Grammatik in einem Ubergangsnetzwerk
Übergangsnetzwerke von der in Abb. 12 gezeigten Form können in nur eingeschränktem Maße als Modelle zur Beschreibung natürlicher Sprachen betrachtet werden, da sie keine Beschreibung rekursiver Strukturen erlauben. Dieser Mangel kann damit behoben werden, daß man bei den Übergängen zwischen den Zuständen nicht nur Symbole für Wortklassen, sondern auch Symbole für komplexe syntaktische Konstruktionen als Bedingungen zuläßt.
S o beschreibt das obige Schema die im Deutschen mögliche Konstruktion, daß Nebensätze rekursiv ineinander verschachtelt werden, wobei der eingebettete jeweils nach dem Subjekt des übergeordneten Nebensatzes steht („Ich staunte, daß der Mann, weil sein Hund, als er eine Katze sah, davonlief, die Pistole zog"). Einigen Verbindungen im obigen Schema sind keine Bedingungen zugeordnet. Dies bedeutet, daß man diese Verbindungen unmittelbar, d. h. ohne ein weiteres Wort oder Satzglied zu analysieren, durchschreiten kann. Eine andere Schwierigkeit bei der Verwendung von Übergangsnetzwerken zur Beschreibung natürlicher Sprachen ergibt sich daraus, daß
Die Analyse von Sätzen in ein sematisches Netzwerk
109
natürliche Sprachen kontextsensitiv sind. Dies heißt, daß Abhängigkeiten ζ. B. zwischen Wortformen bestehen, die sich in verschiedenen Satzteilen befinden. So ist im Deutschen etwa die Form des konjugierten Verbes vom Numerus des Subjektes abhängig. Die Darstellung solcher Abhängigkeiten in einem Übergangsnetzwerk würde eine solche Vermehrung der Zustände notwendig machen, daß das Modell zu kompliziert würde. Diese beiden Unzulänglichkeiten hatten zur Folge, daß Ubergangsnetze für lange Zeit als linguistische Modelle und bei der automatischen Satzanalyse keine Verwendung fanden. Inzwischen konnte jedoch durch die Arbeiten von Thorne, Bratley 8c Dewar (1968) und von Woods (1970) gezeigt werden, daß das Modell der Übergangsnetze so ergänzt werden kann, daß einerseits beliebige natürlichsprachliche Sätze damit repräsentiert und analysiert werden können, und daß andererseits die Vorteile dieses Modelles für die automatische Satzanalyse gewahrt bleiben. Vor allem der Algorithmus von Woods hat im Gebiet der Computersemantik eine recht breite Popularität gewonnen und ist inzwischen in verschiedenen Fragen-Antwort-Systemen übernommen worden. In dem Programm von Woods entspricht jeder Zustand im übergangsnetz einer LISP-Funktion. J e d e dieser Funktionen besteht aus ihrem Namen, d. h. dem Namen des Zustandes, und aus einer oder mehreren Listen, welche die Übergänge beschreiben, die von diesem Zustand aus beschritten werden können. Diese Listen sind im allgemeinen aus folgenden drei Teilen zusammengesetzt: 1. der Bedingung, unter welcher der entsprechende Ubergang beschritten werden kann; 2. Anweisungen ζ. B. über den Aufbau der Tiefenstruktur, die bei der Wahl dieses Uberganges durchzuführen sind; und 3. der Name des nächsten Zustandes. Abb. 13: Beispiel eines Übergangsnetzes nach Woods (1970)
110
Kasusgrammatik und das Modell von Simmons
A b b . 13 zeigt eines der von Woods verwendeten Übergangsnetz werke, welches einfache englische Aussage- und Fragesätze beschreibt (im Englischen werden Fragen durch ein Hilfsverb am Satzanfang bezeichnet). Das Programm, welches die Analyse dieser Sätze durchführt, ist in Tab. 19 enthalten. In diesem Programm werden folgende Funktionen verwendet: CAT: Diese Funktion sucht, ob das zu analysierende Wort einer bestimmten Wortklasse angehört; wenn j a , dann ist der Wert der Funktion T, sonst ist ihr Wert F. SETR entspricht etwa der LISP-Funktion S E T Q und hat wie diese zwei Argumente. Sie bewirkt, daß dem Register, welches durch das erste Argument bezeichnet wird, der Wert zugeordnet wird. In dem in Tab. 19 dargestellten Programm werden folgende sechs Register benützt: 1. T Y P E erhält bei Aussagesätzen den Wert DCL und bei Fragesätzen den Wert Q. 2. Das mit einem Stern * bezeichnete Register enthält das Wort, das gerade analysiert wird. 3. und 4. AUX und V enthalten das Hilfs- und Hauptverb des Satzes. 5. SUBJ enthält die Tiefenstruktur des Subjektes und 6. VP enthält die Tiefenstruktur der Verbalphrase, die am Ende der Analyse aufgebaut wird. Tab. 19: Das Programm von Woods zur Analyse von Sätzen mit der in Abb. 13 beschriebenen syntaktischen Struktur (S/
(Q1
(Q2
(Q4
(PUSH NP/ Τ (SETR SUBJ *) (SETR T Y P E (QUOTE DCL)) (TOQ1)) (CAT A U X Τ (SETR A U X *) (SETR T Y P E (QUOTE Q)) (TO Q2))) (CAT V T (SETR A U X NIL) (SETR V *) (TO Q4)) (CAT A U X Τ (SETR A U X *) (TO Q3))) (PUSH NP/ Τ (SETR SUBJ *) (TO Q3))) (POP (BUILDQ (S+++(VP+)) T Y P E SUBJ A U X V) T ) (PUSH NP/ Τ (SETR VP (BUILDQ (VP (V+) *) V)) (TO Q5)))
Die Analyse von Sätzen in ein semantisches Netzwerk (Q5
111
(POP (BUILDQ (S++++) T Y P E SUBJ A U X V P ) T ) (PUSH PP/ Τ (SETR VP (APPEND (GETR V P ) (LIST * ) ) ) (TO Q 5 ) ) )
GETR:
Der Wert dieser Funktion ist der Wert des Registers, das durch das Argument der Funktion bestimmt wird. TO: Gibt an, welche Funktion als nächste durchgeführt werden soll. NP: Diese Funktion ist ein Unterprogramm, welches Nominalphrasen analysiert. Wird an der Stelle im Satz, an dem diese Funktion aufgerufen wird, eine Nominalphrase gefunden, dann ist der Wert der Funktion deren syntaktische Tiefenstruktur. PUSH wird dann benützt, wenn der Übergang zwischen zwei Zuständen nicht von der Wortklasse des Inputwortes abhängt, sondern wenn nach dem Vorhandensein eines bestimmten Satzteiles gefragt wird. Dies ist ζ. B. beim Übergang vom Zustand S zu q j der Fall, der nur beim Vorhandensein einer Nominalphrase beschritten werden kann. Das Argument von PUSH ist die Funktion, die das gesuchte Satzglied analysiert. Nach Durchführung dieser Funktion hat das *-Register als Wert die Tiefenstruktur des analysierten Satzgliedes. POP: In dem in Tab. 19 gezeigten Programm wird diese Funktion jeweils am Ende des Satzes aufgerufen, wenn die Tiefenstruktur des gesamten Satzes aufgebaut wird. BUILDQ: Mit Hilfe dieser Funktion können beliebige Listen zusammengestellt werden. In dem gezeigten Programm sind dies die Tiefenstrukturen der analysierten Satzglieder. Das erste Argument von B U I L D Q ist eine Liste, die u. a. eines oder mehrere +-Zeichen enthält; die restlichen Argumente sind Namen von Registern. Die Funktion bewirkt, daß die +-Zeichen durch die Inhalte dieser Register ersetzt werden. Erhält das System den Satz „der Mann sah die Frau auf der Strasse", dann laufen folgende Prozesse ab: Zunächst wird die Funktion S durchgeführt, wobei hier als erstes die Funktion NP aufgerufen wird. Da das erste Satzglied tatsächlich eine Nominalphrase ist, ist der Wert der Funktion Τ und es werden die folgenden Befehle ausgeführt. Dabei wird dem Register SUBJ als Wert die Tiefenstruktur der analysierten Nominalphrase und dem Register T Y P E das A t o m DCL zugeordnet. Die Tiefenstruktur des Subjektes besteht, was aus Tab. 19 nicht erschlossen werden kann, aus der Liste (NP (DET der) ( N mann)).
112
Kasusgrammatik und das Modell von Simmons
Als nächstes wird darauf die Funktion Q1 durchgeführt. Hier wird zunächst getestet, ob das nächste Wort ein Verb ist. Da auch dieser Test positiv ist, d. h. den Wert Τ hat, werden wiederum die darauffolgenden Befehle durchgeführt: Das Register A U X bleibt leer, das Register V erhält den Wert „sah" und das Programm gelangt zur Funktion Q4. Nach der von Woods verwendeten Grammatik könnte der Satz hier zu Ende sein. In diesem Falle würde durch die Funktion BUILDQ (in der ersten Zeile der Funktion Q 4 ) die Tiefenstruktur des Satzes zusammengestellt. Da der zu analysierende Satz jedoch noch weitergeht, wird wieder nach einer Nominalphrase gesucht. Diese hat die Tiefenstruktur (NP (DET die) (N frau)) und das Programm führt als nächstes den verschachtelten Befehl (SETR VP (BUILDQ (VP (V+) * ) V)) durch. Dabei läuft zuerst die Funktion BUILDQ ab: In der Liste (VP (V+) * ) wird das Symbol + durch den Inhalt des Registers V, und das Symbol * durch die Tiefenstruktur der eben analysierten Nominalphrase ersetzt. Damit wird folgende Struktur aufgebaut: (VP (V sah) (NP (DET die) (N frau))) Durch die Funktion SETR wird dieser Ausdruck dann dem Register VP zugeordnet und das Programm geht zur letzten Funktion Q 5 . Auch hier wird zunächst nicht der in der ersten Zeile von Q 5 beschriebene Aufbau der Tiefenstruktur durchgeführt, sondern die Funktion PP analysiert zunächst erfolgreich eine Nominalphrase mit vorangestellter Präposition. Durch den Befehl (SETR VP (APPEND ( G E T R VP) (LIST * ) ) ) wird der Inhalt des Registers VP um die Tiefenstruktur des eben analysierten Satzteiles erweitert. Da zu diesem Zeitpunkt alle Wörter des Satzes analysiert sind, wird beim nächsten Aufruf der Funktion Q 5 der abschließende Aufbau der Tiefenstruktur durchgeführt, welche folgende Form hat: (S D C L (NP (DET der) (N mann)) (VP (V sah) (NP (DET die) (N frau)) (PP (PREP auf) (NP (DET der) (N straße))))). Die beschriebenen Prozesse sind sicher nicht einfach — vor allem, wenn man bedenkt, daß jede der erwähnten Funktionen wiederum ein komplexer LISP-Ausdruck ist, und daß in dem besprochenen Beispiel nur wenigen syntaktischen Regeln Rechnung getragen wird. Ein brauchbares Programm zur Analyse selbst eines sehr eingeschränkten Ausschnittes von einfachen Satzformen mit einem Übergangsnetzwerk ist mehrere hundert Zeilen lang. Andererseits sind die älteren Parser ζ. B. von Kuno & Oettinger (1963) oder der 1964 veröf-
Die Analyse von Sätzen in ein semantisches Netzwerk
113
fentlichte MITRE-Parser, die beide auf der GTG basieren, ungleich viel komplexere Programme, die eine viel längere Rechenzeit benötigen. Vergleicht man ihn mit anderen Programmen zur automatischen Satzanalyse, dann besteht der zweite Vorteil des von Woods entwickelten Algorithmus darin, daß er sehr flexibel ist und für verschiedene linguistische Modelle verwendet werden kann. So modifizierte Simmons das Programm von Woods derart, daß als Resultat der Analyse nicht eine syntaktische Tiefenstruktur sondern ein semantisches Netzwerk mit der in Tab. 14 beschriebenen Struktur aufgebaut wird. Dafür wird in dem Programm von Simmons jedesmal, wenn ein neues Satzglied analysiert wurde, mit der Funktion GENSYM ein neuer Knoten aufgebaut. Darauf wird eine Funktion aufgerufen, die anhand einer dem Verb des Satzes zugeordneten Liste bestimmt, in welchem Tiefenkasus dieses Satzglied steht. Diese Liste enthält sowohl syntaktische, als auch semantische Restriktionen. In dem Satz „Die Frau tanzte mit dem Mann einen Walzer" beispielsweise werden den drei Nominalphrasen in dem System von Simmons folgende Tiefenkasus zugeordnet: Frau : CA1 und LOC Mann : LOC2 Walzer : THEME. Die dem Verb „tanzen" zugeordnete Liste enthält nun folgende Restriktionen für die Bestimmung der Tiefenkasus: CA1 und LOC. Syntax : Subjekt; Semantik: Belebt LOC2. Syntax : Präpositionalobjekt; Präposition: mit THEME. Syntax : Direktes Objekt; Semantik: Belebt. Jedesmal, wenn im Laufe der Analyse eine Nominalphrase aufgebaut und der entsprechende Knoten kreiert wurde, dann werden diese Bedingungen analysiert und damit die Rolle der neuen Nominalphrase festgestellt. Die Einführung von semantischen Restriktionen in dem Analyseprogramm von Simmons hat den Vorteil, daß damit syntaktisch mehrdeutige Sätze desambiguiert werden können. So kann das System bestimmen, daß in dem Satz: „Der Mann tanzte mit Gummistiefeln" die Nominalphrase „Gummistiefel" nicht die Rolle LOC2 hat. Wie in späteren Kapiteln zu zeigen sein wird, können durch diesen Ansatz allerdings nur ein Teil der Probleme gelöst werden, in denen die Interpretation syntaktisch mehrdeutiger Konstruktionen über die Bedeutungen der einzelnen Satzteile gefunden werden soll.
114
Kasusgrammatik und das Modell von Simmons
5. Die Generierung von Sätzen aus einem semantischen Netzwerk Im Gegensatz zum Problem der Satzanalyse wurde dem Problem der Generierung von Sätzen in der Computerlinguistik wenig Aufmerksamkeit geschenkt. Dies liegt u. a. sicher daran, daß die Satzgenerierung im Rahmen der GTG unproblematisch ist; denn die Regeln der GTG, wie sie in Tabelle 16 beschrieben sind, sind ja Regeln zur Generierung syntaktisch korrekter Sätze. Die Tatsache, daß durch solche Regeln auch inhaltlich sinnlose Sätze generiert werden, wird dabei so lange nicht als störend empfunden, als man sich lediglich für die syntaktische Struktur der Sätze interessiert. Innerhalb eines Fragen-Antwort-Systemes ist die Satzgenerierung ein komplizierterer Prozeß. Zum einen besteht hier das Problem nicht darin, irgendeinen korrekten Satz zu formulieren, sondern einen bestimmten Inhalt sprachlich auszudrücken. Zudem kann eine bestimmte semantische Struktur auf verschiedene Weise sprachlich formuliert werden, sei dies durch die Wahl der verwendeten Wörter oder durch verschiedene syntaktische Strukturen. In dem von Simmons & Slocum (1972) entwickelten Programm zur Satzgenerierung muß der Benutzer deshalb zunächst spezifizieren, in welcher syntaktischen Form der Satz generiert werden soll. Dazu gehören Angaben über die Tätigkeitsform, die Aussageart und die Zeit des zu bildenden Satzes. Tabelle 20 zeigt eine semantische Tiefenstruktur von der in Abschnitt 2 beschriebenen Form, welche die Basis für die Generierung des in diesem Abschnitt behandelten Beispielsatzes bildet. Der Knoten C3 enthält die Angaben über die Tab. 20: Semantische Ausgangsstruktur für die Satzgenerierung nach Simmons (1972b). C5
TOK tanzen MODAL C3 CA1-Locus C2 THEME C4
02
TOK Witwe NR SING DETDEF MOD C1
C1
C3 TEMPUS VERGANGENHEIT ASPEKT PERFEKT MODUS FRAGE TAETIGKE ITS FORM AKTIV FORM EINFACH ERFRAGT THEME C4 TOK Walzer NR SING DET INDEF
TOK lustig
Satzform: Es soll sich um einen aktiven Fragesatz im Perfekt handeln, wobei das Thema (= Walzer) der Aussage erfragt wird. Diese Angabe ist notwendig, weil sich die Form der Frage danach richtet, ob die Aussage als Ganzes oder ob ein bestimmtes Satzglied erfragt
Die Generierung von Sätzen aus einem semantischen Netzwerk
115
wird. Der Knoten C5 gibt zudem an, daß die beiden Aktanten CA1 und LOCUS durch dasselbe Satzglied (Witwe) repräsentiert sind. Zu Beginn der Satzgenerierung werden auf der Grundlage dieser semantischen Struktur zwei Registern Werte zugeordnet. Das Register STN enthält die Struktur des zu generierenden Satzes. Diese hängt von dem Verb ab und davon, welche Aktanten in der Tiefenstruktur expliziert sind. Ist das Verb „ t a n z e n " von einem Agens und einem Objekt (THEME) begleitet, dann ist die unmarkierte Satzordnung: Agens Verb Objekt. Das Register STN erhält deshalb den Wert (CA 1-LOCUS VACT THEME). Das zweite Register, *, hat wie bei dem Parser von Woods (1970) die Funktion eines Arbeitsgedächtnisses. Zu Beginn der Satzgenerierung enthält es das Symbol für das erste zu expandierende Satzglied, CA1LOCUS. Die eigentliche Generierung wird durch Übergangsnetze gesteuert, die den für die Satzanalyse verwendeten Netzen ähnlich sind. Den einzelnen Übergängen innerhalb der Netze sind jeweils Tests zugeordnet, durch die überprüft wird, ob der entsprechende Übergang gewählt werden kann, und Aktionen, die dabei durchgeführt werden müssen. Abbildung 14 zeigt ein solches Netzwerk, welches die Generierung von einfachen englischen Frage- und Aussagesätzen ermöglicht. Zu Beginn der Generierung befindet sich das System im Zustand R und es wird überprüft, ob ein Frage- oder Aussagesatz generiert werden soll. Diese Information ist dem Indikator MODUS des Knotens C3 zugeordnet. Da den beiden Übergängen keine Aktionen beigeordnet sind, tritt das System ohne weitere Handlung in einen der beiden Zustände Q oder S l . Bei der in Tabelle 20 gezeigten Tiefenstruktur ist dies der Zustand Q. Der nächste Test betrifft den erfragten Inhalt, der unter dem Indikator E R F R A G T angegeben ist. Wird nach dem ganzen Inhalt des Satzes gefragt, beginnt die Frage mit einem Verb, ζ. B. Tanzte die lustige Witwe einen Walzer? und das System tritt in den Zustand S l . Wird nach dem Subjekt gefragt, dann beginnt der Satz mit dem Pronomen „wer" und das System tritt in den Zustand V I . Bei dem Beispiel von Tabelle 20 bezieht sich die Frage auf ein anderes Satzglied, das Objekt (THEME) des Satzes, u n d es wird deshalb der Übergang zum Zustand Q1 gewählt. Damit sind zwei Aktionen verbunden. Zum einen wird durch die Funktion WH-FRAGE das Fragepronomen („was", engl. ,,WHAT") bestimmt und der Variable PREP zugeordnet. Zum zweiten erhält das Register Q-FRONT den Wert T. Diese Flagge wird zu einem späteren Zeitpunkt der Generierung benützt werden.
116
Kasusgrammatik und das Modell von Simmons
Der nächste Übergang zum Zustand V I ist obligatorisch, d. h. es ist ihm kein Test zugeordnet. Die damit verbundene Aktion ist die Generierung des Subjektes „die lustige Witwe" durch die Funktion NP. Das expandierte Subjekt wird darauf in das Register STN aufgenommen und das * -Register erhält als Wert das nächste zu expandierende Satzglied, VACT. Auch der Ubergang von V I zu V 2 ist obligatorisch. Die Aktion besteht hier in der Durchführung der Funktion VP, die das Prädikat „hat getanzt" generiert und dem *-Register als Wert zuordnet. Beim Übergang zu V3 wird zunächst getestet, ob Q-FRONT den Wert Τ hat, darauf wird dem Register STN der Wert (PRE (CAR * ) STN (CDR *)) zugeordnet. Dieser Ausdruck beschreibt den ganzen zu generierenden Satz: Die Variable PRE hat den Wert „was", das erste Glied des *Registers ist das Hilfszeitwort „hat", der bisherige Wert von STN ist die Nominalphrase „die lustige Witwe" und das zweite Glied des *Registers ist das Partizip „getanzt". Hätte Q-FRONT den Wert F gehabt, wäre eine verschiedene Satzstruktur generiert worden, die dem englischen Aussagesatz entspricht. Für die Generierung der Oberflächenstruktur müssen nun lediglich die dem obigen Ausdruck zugeordneten Werte herausgeschrieben werden. Der von Simmons & Slocum beschriebene Ansatz zur Generierung von Sätzen ist sehr elegant und hat den Vorteil, daß die Netze sehr leicht um weitere Funktionen erweitert werden können, welche die Generierung von weiteren Satzformen ermöglichen. Andererseits werden durch die Programme nur ein Ausschnitt der Prozesse beschrieben, die bei der Satzbildung ablaufen. Sowohl die Auswahl der Inhaltswörter, als auch die Spezifikation der Satzform müssen vom Benutzer eingegeben werden. Die dabei ablaufenden Prozesse sind mindestens ebenso kompliziert, wie die von Simmons & Slocum beschriebenen Mechanismen. In dem letzten Abschnitt des folgenden Kapitels und in den Kapiteln IX und X werden diese Prozesse näher analysiert werden.
Die Generierung von Sätzen aus einem semantischen Netzwerk
117
V. LEXIKALISCHE DEKOMPOSITION UND DAS MODELL VON SCHÄNK
1. Die Notwendigkeit lexikalischer Dekomposition Die Autoren der in den letzten beiden Kapiteln beschriebenen semantischen Netzwerke postulierten, daß diese Modelle eine eindeutige und interlinguale Repräsentation des Inhaltes von Sätzen ermöglichen. Wie im letzten Kapitel am Beispiel des Modelles von Simmons gezeigt wurde, können dabei tatsächlich viele der in den natürlichen Sprachen anzutreffenden Mehrdeutigkeiten vermieden werden. Andererseits erlauben semantische Netzwerke keine interlinguale, d. h. von den Einzelsprachen unabhängige Repräsentationen von Satzbedeutungen. Da der offenen Klasse der Inhaltswörter eine ebenfalls offene Klasse von type-Knoten zugeordnet wird, muß beim Aufbau eines semantischen Netzwerkes eine Entscheidung darüber getrofi3n werden, welche Wörter welchen Knoten zuzuordnen sind. Wie am Beispiel der Farbbenennungen gezeigt werden soll, können solche Zuordnungen nicht unabhängig von einzelsprachlichen Lexika getroffen werden: Legt man sowohl deutschsprachigen als auch japanischen Vpn die gleichen Farbmuster vor, dann zeigt sich, daß in beiden Sprachen der Spektralbereich verschieden eingeteilt wird (Zollinger, 1973). Während Farbmuster im gelb-rot Bereich von deutschsprechenden Vpn als gelb, braun oder rot bezeichnet werden, nennen die japanischen Vpn hier eine größere Anzahl von Farben, für die keine deutschen Wörter bestehen. Wie Brown & Lenneberg (1954) gezeigt haben, besteht eine Beziehung zwischen den in verschiedenen Sprachen unterschiedlichen Farbbenennungen einerseits und dem richtigen Wiedererkennen von Farbmustern andererseits. Man kann also annehmen, daß die Repräsentation von Farben im LZG durch einzelsprachliche Farbbenennungen mitbestimmt wird. Wenn man nun Knoten für die Repräsentation von Farbwerten bestimmt, dann muß entschieden werden, welche Farbwerte welchen Knoten zuzuordnen sind. Will man dabei nicht willkürlich eine eigene Einteilung der Farbwerte erstellen, dann muß gezwungenermaßen eine der in den natürlichen Sprachen vorgegebenen Einteilungen übernommen werden. Eine Repräsentation der Farbwerte in einem semantischen Netzwerk, welche den Einteilungen in den verschiedenen Einzelspra-
Die Notwendigkeit lexikalischer Dekomposition
119
chen gleichermaßen entspricht, ist also nicht möglich. Nun muß man sich allerdings fragen, ob die Forderung, daß das begriffliche LZG interlingual sein soll, sinnvoll ist. Die Antwort auf diese Frage wird unmittelbar davon abhängen, welche Stellung man zur sog. Sapir-Whorf'schen Hypothese einnimmt. Aufgrund der Beobachtung, daß bei den westeuropäischen im Gegensatz zu den Indianersprachen die lokalen Präpositionen („in", „nach", „vor" usw.) auch für die Bezeichnung von Zeiträumen („in fünf Tagen", „vor einer Woche") gebraucht werden können, stellte Whorf (1956) die Hypothese auf, daß diesem Unterschied in der sprachlichen Struktur ein Unterschied im Zeitempfinden der beiden Kulturen entspreche. Die schon von Humboldt (1822) vertretene, heute als Sapir-Whorf'sche Hypothese bezeichnete Annahme, nach welcher verschiedenen Sprachstrukturen auch eine Verschiedenartigkeit der Denkabläufe entspricht, war lange Zeit Gegenstand wissenschaftlicher Diskussionen. Diese Diskussionen sind heute allerdings seltener geworden, da immer mehr der Eindruck besteht, daß es keine wissenschaftliche Methode gibt, mit der die gegenseitigen Abhängigkeiten zwischen Sprachtypus und Denkstruktur analysiert werden könnten. Auch wenn jedoch über die Art der von Whorf postulierten Abhängigkeiten keine wissenschaftlich abgesicherten Aussagen gemacht werden können, dann ist auch ohne interkulturelle Vergleiche evident, daß eine enge Abhängigkeit zwischen Begriffsstrukturen und sprachlichen Oberflächenstrukturen besteht. Ein Beispiel dafür ist etwa das Wort „establishment" welches in den späten Sechzigerjahren in den deutschen Wortschatz aufgenommen wurde. Dieses Wort kann sinnvoll nur dann gebraucht werden, wenn damit eine bestimmte Vorstellung über die Gesellschaftsstruktur verbunden ist. Die Frage, ob die Übernahme des Wortes „establishment" in den deutschen Wortschatz eine Veränderung in der Vorstellung der Gesellschaftsstruktur bewirkte, oder ob eine veränderte Vorstellung zum Gebrauch dieses Wortes führte, kann ebensowenig beantwortet werden wie die Frage nach der Henne und dem Ei. Wichtig in diesem Zusammenhang ist lediglich, daß der Gebrauch dieses Wortes den Begriff einer nicht-egalitären, hierarchisch gegliederten Gesellschaft voraussetzt, unabhängig davon, ob man diesen Begriff für zutreffend hält. Ein anderes Wort, dessen Gebrauch einen bestimmten kognitiven Bezugsrahmen voraussetzt, ist etwa das Wort „Flittchen"; die zunehmend seltenere Verwendung dieses Wortes wiederspiegelt hier unmittelbar eine Veränderung der Moralvorstellungen der Sprachbenutzer. Zieht man nun in Betracht, daß verschiedene Personen und Personengruppen unterschiedliche Begriffsstrukturen haben, und daß sich
120
Lexikalische Dekomposition und das Modell von Schänk
diese Unterschiede in der Sprache reflektieren, dann scheint die Forderung nach einer universellen und interlingualen Tiefenstruktur unangebracht; da sich die Begriffsstruktur von Hans Müller am Freitagabend nicht nur von derjenigen von Peter Meier, sondern auch von derjenigen von Hans Müller am Samstagvormittag unterscheidet, kann man streng genommen die Begriffsstruktur jeweils nur eines bestimmten Individuums zu einem bestimmten Zeitpunkt nachbilden. Andererseits ist die Entwicklung von Modellen der begrifflichen Tiefenstruktur heute noch so wenig fortgeschritten, daß man ein fiktives durchschnittliches Individuum nachzubilden versucht und dieses Problem damit irrelevant bleibt. Unabhängig davon, daß Begriffsstrukturen nicht nur in verschiedenen Kulturen, sondern auch innerhalb einer Kultur interindividuell verschieden sind, stellt sich das Problem der Universalität der Tiefenstruktur noch auf einer anderen Ebene: Sind die in den semantischen Netzwerken verwendeten Relationen, welche die Abhängigkeiten zwischen Begriffen beschreiben, allgemeingültig oder sind auch diese Relationen vom indoeuropäischen Sprachbau abhängig? So könnte man sich etwa konkret fragen, ob die in der Tiefenstruktur der generativen Transformationsgrammatik postulierten Relationen zwischen den Satzgliedern oder ob die Tiefenkasus von Fillmore geeigneter sind, interlingual gültige Relationen zwischen Begriffen abzubilden. Nun ist es prinzipiell möglich, Regelsysteme zu entwickeln, welche die Transformation von Sätzen beliebiger Sprachen in beide der genannten Tiefenstrukturen erlauben. Die Entscheidung, welches der möglichen Regelsysteme vom Sprachbenutzer angewandt, d. h. zu welcher der möglichen Tiefenstrukturen die Sätze transformiert werden, könnte höchstens aufgrund von psychologischen Versuchen gefällt werden. Zur Zeit steht jedoch keine experimentelle Methode zur Verfügung, mit deren Hilfe sich gesicherte Aussagen zu diesem Problem gewinnen lassen. Während in der Diskussion über Modelle der semantischen Tiefenstruktur das Problem der Universalität aus den oben genannten Gründen heraus von untergeordneter Wichtigkeit ist, kommt der Frage, ob durch die semantischen Modelle tatsächlich der Inhalt von Sätzen repräsentiert wird, eine zentrale Bedeutung zu. Allerdings ist es unmöglich, ein allgemeines Kriterium dafür anzugeben, ob zwei Sätze die gleiche oder verschiedene Bedeutungen haben. Zunächst kann Bedeutungsgleichheit nicht dadurch definiert werden, daß die Sätze austauschbar gebraucht werden können; denn ein aktiver Satz und seine passivische Form haben zwar in der Regel die gleiche Bedeutung (Ausnahmen von dieser Regel finden sich in Lakoff, 1971), werden jedoch in verschiedenen situativen oder sprachlichen Kontexten ge-
Die Notwendigkeit lexikalischer D e k o m p o s i t i o n
121
braucht. Zugleich kann die Bedeutung eines Satzes nicht in Beziehung auf den außersprachlichen Sachverhalt erschlossen werden, auf den sich der Satz bezieht; denn in einem Modell der kognitiven Struktur ist die Bedeutung j a stets Bedeutung für einen bestimmten Sprachbenutzer. Zudem wird durch eine Reihe von Satztypen, ζ. B. durch Fragesätze, gar kein Sachverhalt beschrieben. Diesen Schwierigkeiten könnte damit Rechnung getragen werden, daß man Bedeutungsgleichheit von zwei Sätzen immer dann annimmt, wenn sie sich gegenseitig implizieren. Mit anderen Worten: Wenn aufgrund der Tatsache, daß man einen Satz Α für richtig hält, folgert, daß man auch Satz Β für richtig hält, und wenn aufgrund der Tatsache, daß man Satz Β für richtig hält, folgert, daß man auch Satz Α für richtig hält, dann und nur dann haben die Sätze Α und Β die gleiche Bedeutung. Diese Regel gibt beispielsweise an, daß die beiden Sätze Hans kaufte von Fritz ein A u t o und Fritz verkaufte Hans ein Auto bedeutungsgleich sind. Nun lassen sich allerdings andere Satzpaare konstruieren, die sich in der beschriebenen Art gegenseitig implizieren, und die man trotzdem nicht als bedeutungsgleich bezeichnen kann; so ζ. B. das Paar Hans lebt und Hans atmet. Der Unterschied zwischen dem ersten und dem zweiten Satzpaar besteht darin, daß man allein aufgrund der Kenntnis der deutschen Sprache entscheiden kann, daß „kaufen" und „verkaufen" sich gegenseitig implizieren. Um zu entscheiden, daß „leben" und „atmen" sich gegenseitig implizieren, braucht man nicht nur sprachliche Kenntnisse, sondern auch Kenntnisse über die Welt, in diesem Beispiel der Physiologie des Menschen. Die oben gegebene Regel muß demnach folgendermaßen umformuliert werden: Zwei Sätze sind dann und nur dann bedeutungsgleich, wenn allein aufgrund sprachlicher Kenntnisse entschieden werden kann, daß sie sich gegenseitig implizieren. Analysiert man jedoch die so modifizierte Regel genauer, dann sieht man, daß es sich hier um eine Tautologie handelt; denn die sprachlichen Kenntnisse, aufgrund derer über die Bedeutungsgleichheit entschieden wird, sind ja nichts anderes als Kenntnisse über die Bedeutungen der Wörter. An Stelle der Regel könnte man deshalb genau so gut sagen: Zwei Sätze sind dann und nur dann bedeutungsgleich, wenn aufgrund der Kenntnis ihrer Bedeutung entschieden werden kann, daß sie sich gegenseitig implizieren. Man muß sich also bewußt sein, daß alle Urteile über Bedeutungsgleichheit und Bedeutungsverschie-
122
Lexikalische Dekomposition und das Modell von Schänk
denheit letztlich auf unserer Intuition basieren. Trotzdem kann man sagen, daß semantische Netzwerke insofern nicht die Bedeutungen von Sätzen repräsentieren, als verschiedene Sätze mit gleichem Inhalt in manchen Fällen verschiedenen Tiefenstrukturen zugeordnet werden. Abb. 15 zeigt beispielsweise die Repräsentation der beiden inhaltlich gleichen Sätze Hans kaufte von Fritz für fünf Franken ein Buch und Fritz verkaufte Hans für fünf Franken ein Buch. Wenn also dem System der zweite dieser beiden Sätze eingegeben wurde, und es erhält die Frage Hat Hans von Fritz ein Buch gekauft?, dann kann die richtige Antwort nur unter Anwendung der in Kap. IV beschriebenen Paraphrasierungsregeln gefunden werden. Ein solches Vorgehen ist zwar theoretisch möglich, wird aber unpraktikabel, sobald es bei einer größeren Menge von Daten angewendet werden soll: Entweder m u ß das System für jeden einkommenden Satz alle Abb. 15: Repräsentation von bedeutungsgleichen Sätzen in einem semantischen Netzwerk
möglichen semantischen Repräsentationen der Bedeutung des Satzes aufbauen. In diesem Fall können zwar sich auf den Satz beziehende Fragen unabhängig von der Form der Frage direkt beantwortet werden: andererseits vervielfachte sich dabei die Menge der gespeicherten Inhalte. Eine andere Lösung bestünde darin, daß jeder Satz nur einmal im semantischen Netz repräsentiert wird, und daß aufgrund der Frage eine Reihe von Paraphrasen gebildet werden, welche mögliche semantische Repräsentationen des erfragten Inhaltes sind. Dies hätte allerdings zur Folge, daß für die Beantwortung einer Frage die Datenbasis mehrmals abgesucht werden müßte. Beide Lösungen sind also unökonomisch. Das Problem, daß Inhalte, die auf verschiedene
Die Notwendigkeit lexikalischer Dekomposition
123
Weise repräsentiert werden können, nur schwer wiederzufinden sind, ist darum schwerwiegend, da es nicht nur biem Beantworten von Fragen auftritt. Vielmehr muß bei der Durchführung von allen Arten von Deduktonsprozessen und Inferenzen häufig nach bestimmten Inhalten im LZG gesucht werden, wobei man jedesmal der gleichen Schwierigkeit begegnet. Ein anderes in diesem Zusammenhang auftretendes Problem besteht darin, daß eine sehr große Zahl von Regeln eingeführt werden muß, um Bedeutungsrelationen zwischen Begriffen anzugeben. So bestehen beispielsweise bei semantischen Netzwerken in der Regel eins-zu-eins-Relationen zwischen Adjektiven und den ihnen entsprechenden Begriffen. Die Sätze: Hans ist gesund Hans ist krank und Hans ist tot würden in der Repräsentation von Simmons etwa folgendermaßen dargestellt: THEME Hans THEME Hans THEME Hans MOD gesund MOD krank MOD tot. Diese Darstellung zeigt jedoch nicht, daß es sich bei den drei Sätzen um sich gegenseitig ausschließende Aussagen handelt, d. h., daß zu einem bestimmten Zeitpunkt nur einer der drei Sätze zutreffen kann. Dieses Wissen ist jedoch wichtig, um etwa den Satz Hans ist gesund und krank als sinnlos zu erkennen. Auch diese Informationen könnten natürlich durch Regeln ausgedrückt werden, durch welche die semantischen Repräsentationen von solchen Sätzen miteinander verglichen und die jeweils notwendigen Inferenzen durchgeführt werden könnten. Ein solches Vorgehen machte es jedoch notwendig, eine extrem große Zahl von Regeln zu formulieren, welche Zusammenhänge zwischen Adjektiven und Adjektiven und zwischen Adjektiven und anderen Wörtern angeben. So lange jedoch solche Regeln noch nicht formuliert sind, enthält das System keine Aussage über die Bedeutungen dieser Adjektive. Die Formulierung solcher Regeln würde allerdings ins Uferlose führen, da damit alle überhaupt möglichen Zusammenhänge zwischen allen Adjektiven ausgedrückt werden müßten. Noch krasser zeigt sich die Beschränktheit dieser Modelle etwa bei der Analyse des Satzes Hans züchtet Rosen, welcher in einem semantischen Netz folgendermaßen repräsentiert wird:
124
Lexikalische Dekomposition u n d das Modell von Schänk
CO TOK züchten Cl TOK Hans C2 TOK Rose AGENS Cl NR PLURAL OBJEKT C2 Das Verb „züchten" wird hier als Handlung repräsentiert, gleichermaßen wie etwa „schlagen", „essen", oder „gehen". Nun bedeutet „züchten" ja nicht eine einzelne Handlung, sondern eine Reihe von verschiedenen Aktionen, die den Zweck haben, eine bestimmte Art von Lebewesen zu produzieren. Diese Aktionen sind etwa: „pflanzen", „düngen", „begießen" usw. Alle diese Informationen, welche die Bedeutung von „züchten" konstituieren, sind in dem entsprechenden type-Knoten nicht enthalten. Nun wäre es natürlich möglich, diese Informationen zu formalisieren und dem Knoten für „züchten" beizufügen. So lange dies jedoch nicht getan wurde, enthält das semantische Netzwerk keine Informationen über die Bedeutung dieses Begriffes.
2. Die Theorie begrifflicher Abhängigkeiten In seiner Theorie der begrifflichen Abhängigkeiten (conceptual dependency theory) entwarf Schänk (1968, 1972, 1973, 1974, 1975) eine Repräsentation der semantischen Tiefenstruktur von Sätzen, in welcher in stärkerem Maße als bei den semantischen Netzwerken die Bedeutung der Sätze erfaßt werden soll. Wie bei der Kasusgrammatik und bei den semantischen Netzwerken, so wird auch hier angenommen, daß Sätze durch eine oder mehrere Bedeutungsstrukturen abgebildet werden können, wobei eine Bedeutungsstruktur — von Schänk Konzeptualisation genannt — aus einer Reihe von Begriffen besteht, die durch eine endliche Anzahl von semantischen Relationen miteinander verbunden sind. Schänk unterscheidet vier Arten von Begriffen oder konzeptuellen Kategorien: (a) Eine Handlung (ACT) ist ein Begriff, von dem gesagt werden kann, daß ein menschliches oder tierisches Wesen dadurch einen Einfluß auf ein Objekt ausübt. Während also etwa die Begriffe für „gehen" oder „werfen" als Handlungen bezeichnet werden, fallen die Begriffe für „stehen" oder „lieben" nicht in diese Kategorie. (b) Ein „Vorstellungs-Erzeuger" (engl, „picture-producer", abgekürzt PP) ist ein Begriff für ein spezifisches physikalisches Objekt (ζ. B. Hans Meier, der Luganersee usw.) oder für eine nicht spezifizierte Instanz einer Klasse von physikalischen Objekten (ζ. B. ein Buch, ein Tisch, ein Mensch). Durch die Wahl der Be-
125
Die Theorie begrifflicher Abhängigkeiten
Zeichnung „picture-producer" will Schänk ausdrücken, daß solche Objekte seines Erachtens im LZG durch eine bildhafte Vorstellung repräsentiert sind. Da diese Annahme, v. a. bei der Analyse mentaler Aktionen nur schwer aufrechterhalten werden konnte, findet sie in Schanks neueren Veröffentlichungen keine Erwähnung mehr. (c) Ein „Vorstellungs-Helfer" (engl, „picture-aider" abgekürzt PA) ist ein Attribut, welches einen PP spezifiziert. PA's werden in natürlichen Sprachen häufig durch Adjektive ausgedrückt. (d) Wie die PA die PP, so modifizieren die sog. Aktions-Helfer (engl, „action-aider" abgekürzt AA) die Handlungen (ACT). AA's werden häufig durch Adverbien ausgedrückt. Sowohl PA's als auch AA's sind nur im Zusammenhang mit den modifizierten PP's oder ACT's bedeutungsvoll. Diese vier Arten von Begriffen bilden die Konstituenten für zwei Arten von Konzeptualisationen: Handlungen und Zustände. J e d e Handlung hat als obligatorischen Kern einen PP, den Aktor, und einen ACT, die miteinander durch eine „konzeptuelle Hauptverbindung" assoziiert sind. Diese Relation wird in Schanks Notation folgendermaßen ausgedrückt: PP < > ACT Zusätzlich zu diesem obligatorischen Kern kann eine Handlung durch weitere PP's modifiziert werden, die in drei möglichen Kasusrelationen zur Aktion stehen können: Der Objekt-Kasus
ACTPP
der Recipient-Kasus
ACT geben PTRANS
LOC
(Hans)
— GESUNDHEIT
(>0)
Hans -fc GESUNDHEIT
(-3)
3. Die Theorie begrifflicher Abhängigkeiten als psychologisches Gedächtnismodell Die Analyse der psychologischen Relevanz des Systemes von Schänk kann von zwei Fragen ausgehen: Sind die von ihm postulierten semantischen Einheiten sinnvolle Elemente für die Darstellung von Wissensinhalten? und: Werden Sätze im LZG in der gleichen Form gespeichert, wie die von Schänk beschriebenen Konzeptualisationen?
136
Lexikalische Dekomposition und das Modell von Schänk
Die wohl offensichtlichste Unzulänglichkeit des Modelles von Schänk in bezug auf die Darstellung von Wissensinhalten bilden seine Skalen für Zustandsbeschreibungen, da hier qualitativ verschiedene Zustände durch Werte auf der gleichen Skala repräsentiert werden. So werden sowohl Kopfweh als auch ein gebrochenes Bein durch einen negativen Wert auf der GESUNDHEIT-Skala abgebildet. Tatsächlich handelt es sich hier nicht nur um erlebnismäßig völlig verschiedene Dinge, sondern auch um Zustände, die in verschiedenen Handlungszusammenhängen stehen. So zeigt nach Schänk etwa Abb. 18 die Repräsentation sowohl des Satzes Hans hat kein Kopfweh mehr, da ich ihm ein Aspirin gab als auch des Satzes Hans hat keinen Durchfall mehr, da ich ihm ein Aspirin gab. Nun darf jedoch die Tatsache, daß ein semantisches System nicht in der Lage ist, allen möglichen Sätzen eine sinnvolle Tiefenstruktur zuzuordnen, nicht als Kritik gegen dieses System verwendet werden. Der Stand des Wissens auf diesem Gebiet ist noch so gering, daß semantische Modelle weder heute noch in naher Z u k u n f t aufgrund dieses Kriteriums beurteilt werden dürfen. Wenn dies trotzdem manchmal geschieht, dann liegt die Schuld daran teilweise bei den Autoren dieser Systeme selbst; denn sie versuchen häufig, den Eindruck zu erwecken, daß die theoretischen Probleme größtenteils gelöst seien, und daß allein durch eine Vergrößerung der Datenbasis ein System geschaffen werden kann, dessen Leistungen dem menschlichen Sprachverhalten analog seien. Das Fehlen von Angaben darüber, was das eigene System nicht leistet, führt häufig zu Uberschätzungen der entsprechenden Systeme bei Laien, und selbst für Leser, die mit der Materie vertraut sind, ist es nicht immer leicht, die wirklichen Fähigkeiten dieser Modelle abzuschätzen. Obwohl also nicht verlangt werden kann, daß ein semantisches System eine Beschreibung aller sprachlichen Inhalte ermöglicht, so sollten diese Modelle doch daraufhin überprüft werden, ob sie Teil eines breiteren Systemes werden könnten; mit anderen Worten: es muß danach gefragt werden, ob die in einem beschränkten System enthaltenen Annahmen beibehalten werden können, wenn dieses System Teil eines „vollständigen" Systems wird. Diese Frage könnte positiv nur dann beantwortet werden, wenn es gelänge, ein solches „vollständiges" System zu formulieren. Andererseits kann jedoch schon heute in Form von Gedankenexperimenten überprüft werden, ob es sinnvoll wäre, bestehende Annahmen in einem breiteren System beizubehalten. Folgendes Beispiel soll dazu dienen, diese Uberlegung zu verdeutlichen: Nehmen wir an, wir besäßen ein einfaches System, welches das sprachliche Verhalten eines Gastgebers am Be-
Die Theorie begrifflicher Abhängigkeiten
137
ginn von Einladungen simuliert. Dieses System hätte eine Reihe von Sätzen gespeichert, die beim Eintreffen neuer Gäste geäußert werden, Das freut mich aber, daß sie gekommen sind Fühlen sie sich doch wie zu Hause Entschuldigen sie die Unordnung usw. Zudem hätte das System eine Reihe von Regeln, welche bestimmten Sätzen der Gäste feststehende Antworten zuordnen, z . B . Wie geht es Ihnen? Danke gut und Ihnen? oder Sie haben es aber schön hier. J a , aber glauben sie mir, es war viel Arbeit, bis es so weit war. Ein solches, naiv-assoziationistisches Modell basiertauf der Annahme, daß Sätze als Ganzes gespeichert sind, und daß sich Regeln formulieren lassen, durch welche verbale und nichtverbale Reize bestimmten verbalen Reaktionen zugeordnet werden. Dieses Modell soll nun erweitert werden, so daß es nicht nur die stereotypen Anfangsgespräche sondern auch längere Unterhaltungen zu simulieren in der Lage ist. Solche Unterhaltungen sind jedoch so flexibel und haben eine so große Variationsbreite, daß sie nicht durch gespeicherte Satzmuster erklärt werden können, und man muß annehmen, daß hier Mechanismen wirksam sind, welche in dem System für die Simulation der Anfangsgespräche nicht enthalten sind. Nun hat man zwei Möglichkeiten: Einerseits könnte man postulieren, daß die stereotypen Anfangsgespräche durch andere Mechanismen gesteuert sind als die „flexiblen" Unterhaltungen, und daß damit das bestehende Modell zur Simulierung der Anfangsgespräche in einem breiteren Modell der sprachlichen Kommunikation unverändert beibehalten werden könnte. Andererseits könnte man behaupten, daß sprachliche Kommunikation generell nicht ein Äußern von festen Satzmustern ist, und daß auch bei stereotypen Konversationen komplexere Mechanismen wirksam sind, als die in dem bestehenden beschränkten System vorhandenen Regeln. Im ersten Fall könnte das bestehende System Teil eines größeren Systemes werden, im zweiten Fall, wo diese Möglichkeit fehlt, muß das bestehende System nicht nur als ungenügend, sondern auch als falsch betrachtet werden. Unterzieht man nun Schanks Einteilung der Zustandsskalen einem solchen Gedankenexperiment, dann scheint es schwierig, die von ihm postulierten Skalen in einem breiteren Modell des LZG zu verwenden; denn Dimensionen wie GRÖSSE, GESUNDHEIT oder PHYSIKALISCHER ZUSTAND sind nicht nur zu grob und psychologisch unplausibel, sondern sie subsumieren auch, wie dies am Beispiel der Krankheitsskala gezeigt wurde, verschiedenartige Zustände unter
138
Lexikalische Dekomposition und das Modell von Schänk
einer Dimension. Falls Zustände überhaupt durch Werte auf primitiven Skalen abgebildet werden sollen, dann müßten die Dimensionen dieser Skalen am ehesten den Sinnesempfindungen (ζ. B. F a r b e , Temperatur, Geschmackswerte usw.) entsprechen. Unbefriedigend ist auch Schanks Einteilung der primitiven Aktionen. So wird ζ. B . das Schlagen mit der Hand als P R O P E L - H a n d und das Treten mit dem Fuß als M O V E - F u ß dargestellt. Demgegenüber basieren so verschiedene Aktionen wie „ e r b r e c h e n " und „schwitzen" auf der gleichen primitiven Handlung E X P E L . In der Theorie der begrifflichen Abhängigkeiten wird weiter postuliert, daß j e d e Aktion einen belebten Agens hat. Damit könnte das Fallen eines unbelebten Gegenstandes nicht als Aktion repräsentiert werden. In seinen neueren Arbeiten versucht Schänk nun diesem Mangel zu begegnen, indem physikalische Kräfte als Agenten von Handlungen eingesetzt werden. Der Satz: „Das Buch fiel vom Tisch auf den B o d e n " erhält damit die Repräsentation: Schwerkraft
PROPEL
r\
Buch
Boden
L; Tisch Eine solche Darstellung impliziert, daß dem Sprecher der Begriff der Schwerkraft geläufig ist — eine Voraussetzung, die für einen großen Teil der Bevölkerung nicht zutrifft. Diese Schwierigkeit k ö n n t e umgangen werden, wenn die Forderung nach einem obligatorischen Agens fallengelassen würde, wie dies ζ. B. in der Kasusgrammatik von Fillmore der Fall ist. Zudem muß die allgemeine Frage gestellt werden, ob die Annahme von primitiven Aktionen sinnvoll ist; denn man könnte beispielsweise postulieren, daß sich alle Handlungen auf Zustandsänderungeh reduzieren lassen. „ G e b e n " wäre in diesem Fall eine Zustandsänderung, bei der ein Objekt seinen POSS-Wert ändert, genau wie etwa bei „sterben" der Wert eines Objektes auf der GES U N D H E I T S - S k a l a verändert wird. Die Entscheidung darüber, wann ein Geschehen als Zustandsänderung und wann es als Handlung betrachtet wird, scheint bei Schänk vom Vorhandensein eines verursachenden Agens abzuhängen. Man muß sich dann allerdings fragen, warum „ e r r ö t e n " als Zustandsänderung und „schwitzen" als Handlung betrachtet wird. Eine Rückführung von Handlungen auf Zustandsveränderungen findet sich in dem in Kap. V I I beschriebenen Modell. Analysiert man die von S c h ä n k aufgezählten primitiven A k t i o n e n unabhängig von den Problemen, die sich aus seiner Unterscheidung zwischen Zustandsänderungen und Handlungen ergeben, dann zeigt sich, daß sie sich genau genommen auf nur zwei Aktionen reduzieren ließen: „ B e w e g e n " und „Informationsübertragung". PTRANS,
139
Die Theorie begrifflicher Abhängigkeiten
PROPEL, MOVE, GRASP, INGEST, EXPEL, SPEAK und ATTEND sind alle verschiedene Arten von physikalischen Bewegungen von Objekten, während MTRANS und MBUILD Prozesse der Informationsübertragung sind. ATRANS ist ebenfalls eine Informationsübertragung, bei welcher durch Bewegungen und/oder Zeichengebung ein Besitzverhältnis gewechselt wird. Aus der Tatsache, daß sich die elf von Schänk aufgezählten primitiven Handlungen auf zwei reduzieren lassen, folgert jedoch noch nicht, daß in einem semantischen System von der Möglichkeit zu einer solchen Beschränkung auch Gebrauch gemacht werden sollte: Das Ziel eines Systems zur Repräsentation von Handlungen besteht ja nicht darin, daß es auf möglichst wenigen Primitiva basiert, sondern daß es ein psychologisch sinnvolles Modell unserer Repräsentation von Handlungsabläufen bildet. Dabei scheint die Annahme, daß eine möglichst weitgehende Reduktion nicht die psychologische Struktur abbildet, durchaus sinnvoll. Wenn jedoch die einzelnen primitiven Aktionen nach psychologischen Gesichtspunkten bestimmt werden, dann scheint die von Schänk getroffene Einteilung zumindest unplausibel: Einerseits werden, wie weiter oben zu zeigen versucht wurde, subjektiv verschiedene Handlungen (schwitzen — erbrechen) durch gleiche, und subjektiv ähnliche Handlungen (schlagen — treten) durch verschiedene Primitiva repräsentiert. Zudem müssen oft einfache Handlungen durch ein kompliziertes Gefüge von primitiven Handlungen ausgedrückt werden. So würde etwa die Handlung „werfen" von Schänk folgendermaßen aufgeschlüsselt: Χ4Ψ M O V E H A N D Ο ΧΟ
PTRANS
D Y
-ο -ο
157
158
Lexikalische Dekomposition und das Modell von Schänk
wird „einnehmen" als Oberflächenverb gewählt. Wenn nicht, dann wird danach gefragt, ob das Objekt der Handlung gasförmig ist. Wenn ja, dann sucht das System, ob als Verb „rauchen" gebraucht werden kann. Dies hängt von zwei Bedingungen ab: Zunächst muß das Objekt des Einnehmens Rauch sein und zudem m u ß der Rauch aus einem Rauchinstrument (Zigarette, Pfeife usw.) stammen. Rauchinstrumente sind von Goldman dadurch definiert, daß sie unter der Eigenschaft FUNKTION-VON einen Pointer zu der in Abbildung 22 gezeigten Konzeptualisation haben. Abb. 22: Konzeptualisation für „rauchen". ->Mund jemand INGEST < °
jemand
Rauch
< PROPEL
ΐ° Rauch
%
Konzept
Mund
Bei der Bestimmung, ob das Verb „rauchen" adäquat ist, wird also nicht darauf geachtet, ob die dem Satz zu Grunde liegende konzeptuelle Struktur mit derjenigen für „rauchen" übereinstimmt. Das System überprüft lediglich, ob im Instrument der Hauptkonzeptualisation, welches wiederum eine eigene Konzeptualisation ist, dem FROM-Kasus ein Rauchinstrument zugeordnet ist. Kann das Wort „rauchen" nicht gebraucht werden, dann wird das Wort „ a t m e n " gewählt, wenn L u f t eingenommen wird, und „inhalieren" wenn es sich um andere gasförmige Objekte handelt. Die Einnahme von Flüssigkeiten durch den Mund wird als „trink e n " beschrieben. Dabei unterscheidet Goldman zwischen „trinken 1" und „trinken 2 " , je nachdem, ob es sich um eine alkoholische oder nicht-alkoholische Flüssigkeit handelt, „trinken 2 " ist das intransitive Verb, welches den Konsum von Alkohol unabhängig von einer einzelnen Aktion beschreibt (ζ. B. „er trinkt, weil er Kummer hat"), „trinken 1" ist das transitive Verb, wie es ζ. B. in dem Satz „Am Morgen trank er ein Glas Milch" gebraucht wird. Die Bestimmung, zwischen „trinken 1" und „trinken 2 " ausschließlich aufgrund des Alkoholgehaltes des Objektes zu entscheiden, kann allerdings der Tatsache nicht Rechnung tragen, daß auch bei alkoholischen Getränken „trinken" im transitiven Sinne gebraucht werden kann.
Die Generierung von Sätzen aus einer konzeptuellen Dependenzstruktur
159
Die Einnahme fester Objekte durch den Mund wird mit „essen" bezeichnet. Die Festsetzung, nach welcher die Einnahme fester Objekte nicht durch den Mund als „einnehmen" bezeichnet wird, scheint in diesem Zusammenhang sinnlos; sie ist jedoch im Rahmen des weiter unten zu besprechenden Paraphrasierungsprogrammes sinnvoll. Inhaltlich gesehen ist der dargestellte Entscheidungsbaum mangelhaft; denn eine genauere Analyse des Gebrauches der Verben des Einnehmens zeigt, daß die von Goldman angegebenen Kriterien ζ. T. unvollständig, und ζ. T. falsch sind. So hängt die Wahl des Verbes bei der Beschreibung der Einnahme nicht-gasförmiger Objekte durch den Mund nicht von der Festigkeit oder Flüssigkeit des Objektes ab. Abbildung 23 zeigt einen alternativen Entscheidungsbaum zur Beschreibung des Gebrauches von Verben des Einnehmens. Dabei wird in einem ersten Schritt überprüft, auf welche Art das Objekt eingenommen wird. Geschieht dies durch „gießen", d. h. durch das Schütten von nicht-abgegrenzten Mengen aus einem Behälter in den Mund und direkt anschließendes Schlucken, dann wird das Verb „trinken" gebraucht. Wird das Objekt jedoch auf andere Weise in den Mund befördert, dann kann das Verb „trinken" nicht gebraucht werden, unabhängig davon, ob das Objekt fest oder flüssig ist. In diesem Falle wird danach gesucht, ob das Objekt ein Nahrungsmittel ist, d. h. ob es normalerweise gegen Hunger eingenommen wird. Ist dies der Fall, dann wird das Verb „essen" gebraucht, in allen anderen Fällen kann das Verb „einnehmen" gewählt werden oder ein anderes Verb, welches die Art der Einnahme beschreibt, ζ. B. „löffeln". Dieser Entscheidungsbaum gibt an, daß die Einnahme von Suppe oder anderer flüssiger Nahrungsmittel wie Creme mit dem Löffel als „esAbb. 23: Der Gebrauch der Verben „essen", „trinken" und „einnehmen"
160
Lexikalische Dekomposition und das Modell von Schänk
s e n " bezeichnet wird, während die Einnahme von Getränken wie K a f f e e mit dem Löffel weder als „trinken" noch als „ e s s e n " bezeichnet werden können. Aufgrund des Entscheidungsbaumes von Goldman wäre in all diesen Fällen das falsche Verb gewählt worden. Bei dem in Abbildung 23 gezeigten Entscheidungsbaum wird nicht nur die Art des eingenommenen Objektes berücksichtigt, sondern auch die Weise, in der es eingenommen wird. Kapitel X enthält eine ausführlichere Analyse der Rolle, die solche instrumentellen Bedeutungskomponenten bei der Generierung von einzelnen Verben spielen. Allerdings beschreibt Abbildung 23 nur einen Teil der Faktoren, die bei der Wahl von Verben des Essens und Trinkens bedeutsam sind. Eine vollständigere Darstellung der dabei relevanten Komponenten findet sich in Ballweg-Schramm ( 1 9 7 6 ) . Die beschriebenen Entscheidungsbäume gelten jeweils nur für eine einzelne Sprache; d. h. daß für die Generierung von Verben bei verschiedenen Sprachen jeweils andere Entscheidungen relevant sind. So besteht beispielsweise in der deutschen Sprache das Verb „fress e n " , welches für das Einnehmen von Nahrung durch Tiere und im metaphorischen Gebrauch für tiergleiches Essen durch Menschen gebraucht wird. Im Gegensatz zum Englischen, das kein Verb mit dieser Bedeutung kennt, muß also bei der Generierung der deutschen Verben des Einnehmens danach gefragt werden, ob der Agens ein Mensch oder ein Tier ist. Zudem müssen bei der Wahl der Verben eine Reihe von Faktoren überprüft werden, die nicht in den zu Grunde liegenden Konzeptualisationen enthalten sind, sondern die allgemeine Wissensinhalte und Überzeugungen betreffen. Die Konzeptualisation Hans
M T R A N S TUN r > GESUNDHEIT ( - 1 0 )
Fritz
- 1 0 )
besagt beispielsweise, daß Hans Trude mitteilt, daß er Fritz töten wird.
Die Gencricrung von Sätzen aus einer konzeptuellen Depcndcnzstruktur
up io pa
•C
•a c
e § 3
Ο
•ο -c Τ
2 OQ c/3
161
162
Lexikalische Dekomposition und das Modell von Schänk
J e nachdem, ob der Sprecher annimmt, daß Trude sich über den Tod von Fritz freut, daß sie Angst davor hat oder daß es ihr gleich ist, muß als Verb „versprechen", „drohen", oder „sagen" gebraucht werden. Da Goldmans System nicht auf ein semantisches Gedächtnis rekurrieren kann, sind solche Faktoren in seinem Programm jedoch kaum berücksichtigt. Nachdem der Satzgenerator das Verb gefunden hat, werden in der zweiten Phase der Generierung die übrigen Teile des Syntaxnetzes aufgebaut. Dazu benützt das System Regeln über die Zuordnung von Teilen der Konzeptualisation zu den verschiedenen Arten von syntaktischen Satzgliedern. Diese Regeln sind den Verben zugeordnet, die in der ersten Phase der Generierung bestimmt wurden. Jedem Verb sind hierfür zwei Pointer zugeordnet. Der erste Pointer weist auf dessen Oberflächenform. Im folgenden soll das mit Hilfe des binären Entscheidungsbaums gefundene Verb als Lexem und die damit assoziierte Oberflächenform als Morphem bezeichnet werden. Diese in der Linguistik geläufige Unterscheidung ist auch in dem System von Goldman sinnvoll, weil zwischen Lexemen und Morphemen keine eins-zu-eins-Beziehung besteht. So hat beispielsweise das Morphem „ t r i n k e n " nicht nur zwei Bedeutungen (die oben erwähnten „trinken 1" und „trinken 2") sondern es hat in den verschiedenen Bedeutungen auch andere Valenzen. Der zweite von dem Verblexem ausgehende Pointer zeigt auf den Ergänzungsrahmen des Verbes, in dem konzeptuellen Teilstrukturen einzelne Satzglieder zugeordnet sind. Die folgende Darstellung zeigt den Ergänzungsrahmen für das Lexem „empfangen": Satzglied: Subj. Akk.-Obj. Dat.-Obj.
konzeptuelle Struktur: TO OBJECT ACTOR
Zusätzliche
(PREP
Forderungen:
FROM)
Dieser Rahmen wird vom System Zeile für Zeile durchgearbeitet. Dabei wird jeweils zunächst die genannte Teilstruktur in der Konzeptualisation gesucht. Ist dies ein PP mit einem Pointer zu einem Morphem, dann wird im Syntaxnetz ein Knoten für das entsprechende Satzglied aufgebaut und diesem Knoten das entsprechende Morphem zugeordnet. In gewissen Fällen kann diese Teilstruktur jedoch eine vollständige Konzeptualisation sein, so ζ. B., wenn es sich um das OBJECT eines MTRANS-Aktes handelt. Dann wird durch eine rekursive Anwendung des Generierungsprozesses ein Syntaxnetz für diese eingebettete Konzeptualisation gebildet und dieses Syntaxnetz dem Knoten für das entsprechende Glied des übergeordneten Satzes zugeordnet. Weitere, hier nicht besprochene Programme sorgen für
Die Generierung von Sätzen aus einer konzeptuellen Dependenzstruktur
163
die Eingliederung der Funktionswörter in das Syntaxnetz. Bei der in Abbildung 20 gezeigten Tiefenstruktur wird unter Anwendung des Entscheidungsbaumes beispielsweise das Verb „erwürgen" gefunden. Der diesem Verb zugeordnete Ergänzungsrahmen gibt an, daß der ACTOR der ersten Konzeptualisation, in diesem Falle der Handlung GRASP, Oberflächensubjekt wird. Weiter wird der STATEACTOR im Resultatteil der zweiten Konzeptualisation (INGEST) Akkusativobjekt. Das entsprechende Syntaxnetz hat dann folgende Struktur: 1
LEX ERWÜRGEN SUBJ 2 AKK.-OBJ. 3
2 3
LEX OTHELLO LEX DESTEMONA
Mit Hilfe der von Simmons & Slocum (1972) entwickelten Programme kann darauf aus diesem Syntaxnetz der Satz „Othello erwürgt Desdemona" generiert werden. Die bislang besprochenen Mechanismen in dem System von Goldman sind rein deterministisch. Daraus folgt, daß aus einer bestimmten konzeptuellen Tiefenstruktur jeweils nur ein Oberflächensatz abgeleitet werden kann. Wenn nun, wie in dem weiter oben gegebenen Beispiel, aus einer Tiefenstruktur verschiedene Paraphrasen generiert werden, dann ist dies mit Hilfe von drei zusätzlichen Mechanismen möglich. Zunächst kann nach Synonymen gesucht werden, d. h. nach Phonemen, die demselben Lexem zugeordnet sind. Dies ist wohl die am wenigsten interessante Möglichkeit zur Generierung von Paraphrasen. Die zweite Möglichkeit besteht darin, den Fokus des Satzes zu verändern. Dadurch wird beispielsweise ermöglicht, zu dem Satz „Hans gab Fritz ein Buch" die Paraphrase „Fritz bekam von Hans ein Buch" zu generieren. Die dritte und interessanteste Methode zur Generierung von Paraphrasen besteht darin, bei der Suche im binären Entscheidungsbaum einzelne Äste auszulassen. So wird beispielsweise im Entscheidungsbaum für Verben des tötens danach gefragt, ob die instrumenteile Handlung würgen (GRASP Hals), schießen (PROPEL Kugel) oder Gift verabreichen (ATRANS Gift) ist. J e nachdem wird als Verb erwürgen, erschießen oder vergiften gewählt. Nun hat das System die Möglichkeit, diese Entscheidung zu übergehen und in jedem Fall den Ast zu wählen, der bei nicht spezifiziertem Instrument gewählt wird. Die entsprechenden Verben sind dann „ t ö t e n " oder „ermorden". Der Ergänzungsrahmen dieser Verben gibt dann an, wie die instrumenteile Aktion auf der Oberfläche ausgedrückt werden kann. Auf diese Weise wurden die am Anfang dieses Abschnittes genannten Paraphrasen des Satzes „Othello erwürgte Desdemona" generiert.
164
Lexikalische Decomposition und das Modell von Schänk
Ein weiterer, mit dem Ansatz von Goldman sehr leicht durchzuführender Prozeß bildet die Generierung von Nomen, welche eine Konzeptualisation beschreiben (ζ. B. „der Mord", „das Lesen"), oder die als Rollenträger in einer Konzeptualisation definiert sind (ζ. B. „der Mörder", „der Zuschauer"). Solche Nominalisationen von Aktionen werden v. a. dann gebraucht, wenn eine Konzeptualisation in eine andere eingebettet ist. Dabei wird in der oben beschriebenen Weise zunächst das Verb der eingebetteten Konzeptualisation gesucht. Wenn dieses Verb substantiviert werden kann, und wenn im Ergänzungsrahmen der übergeordneten Konzeptualisation vermerkt ist, daß die eingebettete Konzeptualisation in Form einer Nominalphrase repräsentiert werden kann, dann wird die substantivierte Form des entsprechenden Verbes als neuer Knoten in das Syntaxnetz aufgenommen. Hier zeigen sich sehr deutlich die Möglichkeiten des Systems von Goldman, komplexe konzeptuelle Strukturen in einzelne Wörter zu komprimieren. Im Gegensatz zu früheren Systemen für die Generierung von Paraphrasen, so ζ. B. zu dem in Kap. IV beschriebenen System von Simmons, in dem für jedes Wortpaar eine besondere Paraphrasierungsregel angegeben werden muß, arbeitet das System von Goldman mit allgemeinen Regeln, die bei beliebigen semantischen Inhalten angewendet werden können. Dies ist dadurch möglich, daß es von einer Tiefenstruktur ausgeht, in der Inhalte unabhängig vom Vokabular einer natürlichen Sprache repräsentiert sind.
VI. DIE REPRÄSENTATION KOMPLEXER WISSENSINHALTE
1. Inferenzprozesse in dem System von Rieger Die konzeptuelle Dependenztheorie von Schänk ermöglicht es, den Inhalt von Sätzen unabhängig von der jeweils einzelsprachlichen Satzform darzustellen. Es fehlen in dieser Theorie jedoch Annahmen darüber, auf welche Weise die in den Sätzen genannten Objekte und Klassen von Objekten im LZG repräsentiert sind. Spezifische Vorstellungen über die Repräsentation von Begriffen und I n s t a l l i e r u n gen von Begriffen bilden jedoch die Voraussetzung nicht nur für die Entwicklung von Fragen-Antwort-Systemen sondern auch für die adäquate Beschreibung der Analyse zusammenhängender Texte. So kommt es häufig vor, daß in einem Text wiederholt auf dasselbe Objekt oder dieselbe Person bezug genommen wird und dabei jeweils neue Informationen über dieses Objekt genannt werden. Das den Text analysierende System muß dann in der Lage sein, die Identität des mehrmals bezeichneten Objektes festzustellen und festzuhalten. Zur Darstellung komplexer Zusammenhänge im episodischen Gedächtnis eignen sich die in Kap. IV besprochenen semantischen Netzwerke. Es liegt deshalb nahe, nach einer Synthese zwischen diesen beiden Modellen zu suchen. Ein solcher Versuch könnte es u. U. ermöglichen, einen breiten Bereich von allgemeinen und episodischen Wissensinhalten in einer von der Sprachoberfläche unabhängigen Form zu repräsentieren. Dieses Vorhaben ist in einer Arbeit von Rieger (1974, 1975) verwirklicht worden. Das von ihm programmierte System dient u. a. dazu, auf der Grundlage von allgemeinen Wissensinhalten Inferenzen über eingegebene Sätze und Texte zu ermöglichen. Die von Rieger entworfene Gedächtnisstruktur ist aus zwei Arten von Elementen zusammengesetzt. Zum einen besteht sie aus Knoten, die Begriffe und Instanziierungen von Begriffen repräsentieren und zum anderen aus Konzeptualisationen. Knoten der ersten Art entsprechen etwa den Type- und Token-Knoten in semantischen Netzwerken. J e d e m dieser Knoten ist eine Liste, der sogenannte ASET, zugeordnet. Diese Liste besteht aus Hinweisen zu Konzeptualisationen, in denen der entsprechende Begriff vorkommt. Die Informationen über einen Begriff sind hier also nicht Teil des entsprechen-
166
Die Repräsentation komplexer Wissensinhalte
den Knotens, sondern sie sind selbständige Einheiten, die mit dem Knoten lediglich durch einen Pointer verbunden sind. In jedem A S E T eines Begriffes wird auf eine Oberbegriffsrelation verwiesen; in dem System von Rieger hat jeder Begriff also nur einen Oberbegriff. An Stelle des Verweises auf eine Oberbegriffsrelation im A S E T eines Begriffes wird bei den Knoten für Instanziierungen von Begriffen angegeben, welchem Begriff der Token zugeordnet ist. Den Knoten, welche Konzeptualisationen beschreiben, ist neben den A S E T noch ein sog. BONDVALUE zugeordnet. Der BONDVALUE gibt an, um welche Art von Konzeptualisation (ζ. B. ATRANS, POSS usw.) es sich handelt und welche PP an welcher Stelle in der Konzeptualisation enthalten sind. Abb. 25 zeigt die Repräsentation des Satzes Hans glaubt, daß Fritz sein Auto verkaufte, in der im letzten Kapitel beschriebenen Notation von Schänk (a), in dem System von Rieger (b) und in dem von Rieger verwendeten LISP-Formalismus (c). Die Abbildung zeigt, daß v. a. der LISP-Formalismus der von Simmons verwendeten Darstellung semantischer Netzwerke sehr ähnlich ist. Rieger nimmt nun an, daß man beim Verstehen jedes Satzes eine große Zahl von Inferenzprozessen durchführt. Diese erlauben es einerseits, Präsuppositionen des Satzes zu erschließen und sie ermöglichen es zudem, den analysierten Satz in seinen Kontext zu integrieren. Im folgenden soll eine Liste der 16 von Rieger aufgeführten Arten von Inferenzen gegeben werden. Für jede der 16 Klassen wird dabei ein Beispiel gegeben werden. Darin wird der eingegebene Text in Normalschrift und die inferierte Aussage in Großbuchstaben geschrieben. 1. Spezifikation von im Text nicht erwähnten Objekten und Personen. Hans hob einen Stein auf. Er schlug Fritz. HANS SCHLUG F R I T Z MIT DEM STEIN. 2. Kausale Inferenzen. Hans schlug Fritz mit einem Stein. HANS WAR WAHRSCHEINLICH BÖSE AUF F R I T Z . 3. Inferenzen über die Resultate von Handlungen. Hans gab Fritz ein Auto. F R I T Z HAT DAS AUTO. 4. Inferenzen über die Motivationen von Handlungen. Hans schlug Fritz. HANS WOLLTE WAHRSCHEINLICH F R I T Z SCHADEN. 5. Inferenzen über das Ermöglichen von Handlungen. Hans ging nach Amerika. WIE BEKAM E R DAS GELD?
Inferenzprozesse in dem System von Rieger
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
167
Inferenzen über die Funktion von Objekten. Hans möchte das Buch haben. HANS MÖCHTE WAHRSCHEINLICH DAS BUCH LESEN. Das Inferieren von Handlungen auf Grund des Herstellens von deren Voraussetzungen. Hans schaute im Kochbuch nach, wie man einen Braten zubereitet. HANS WIRD NUN ANFANGEN, DEN BRATEN ZUZUBEREITEN. Inferenzen bei fehlenden Voraussetzungen von Handlungen. Hans konnte nicht den Ziellauf der Pferde sehen. Er verwünschte den Mann vor ihm. DER MANN STAND IHM IN DER SICHT. Inferenzen über das Eingreifen in Handlungen. Das Kind rannte auf die Straße. Hans rannte ihm nach. HANS WOLLTE DAS KIND VOR SCHADEN BEWAHREN. Inferenzen zur Voraussage von Handlungen. Hans wollte Nägel haben. ER GING IN EIN EISENWARENGESCHÄFT. Inferenzen über die Vermittlung von Wissen. Hans sagte Fritz, Maria habe Karl mit einem Stock geschlagen. FRITZ WUSSTE, DASS KARL SCHADEN ZUGEFÜGT WURDE. Inferenzen auf Grund von allgemeinen Normen. Hat Hans eine Gallenblase? DAS IST SEHR WAHRSCHEINLICH. Inferenzen über die Dauer von Zuständen. Hans überreichte Fritz gestern ein Buch. Hält Fritz das Buch immer noch in der Hand? WAHRSCHEINLICH NICHT. Inferenzen über Merkmale von Objekten und Personen. Die Windeln von Karlchen sind naß. KARLCHEN IST WAHRSCHEINLICH EIN KLEINKIND. Inferenzen über Situationen. Hans geht an einen Maskenball. WAHRSCHEINLICH WIRD ER EIN KOSTÜM TRAGEN. Inferenzen über die Intention von Aussagen. Hans konnte nicht über den Zaun hüpfen. WARUM WOLLTE ER DIES TUN?
Die Repräsentation komplexer Wisscnsinhalte
168
Abb. 25: Repräsentation des Satzes: „Hans glaubt, daß Fritz sein Auto verkaufte." (a) in der Notation von Schänk, (b) in dem System von Rieger (1974) und (c) in dem von Rieger programmierten LISP-Formalismus (a) Fritz
• ATRANS «f^—Auto X < Fritz
MLOC (LZG (HANS)) r> Fritz Χ
Φ
ATRANS•
- Geld < ^CX
BONDVALUE: (MLOC C3765 C0018) ASET: null C3765 BONDVALUE: (DUALCAUSE C3766 C3767) ASET: (C3764) C3766 BONDVALUE: (ATRANS C0021 C7641 C0021 C0027) ASET: (C3765) C3767 BONDVALUE: (ATRANS C0027 C5321 C0027 C0021) ASET: (C3765) J e d e dieser 16 aufgeführten I n f e r e n z e n wird auf Grund verschiedener ζ. T. recht komplexer R e g e l n g e z o g e n . Bei d e m ersten Beispiel wird beispielsweise nach der Eingabe des ersten Satzes z u n ä c h s t inferiert, daß Hans den Stein m i t der H a n d a u f h o b . Darauf kann auf
I n f e r e n z p r o z e s s e in d e m S y s t e m von Ricgcr
169
das Resultat der Handlung geschlossen werden, daß Hans den Stein in der Hand hält. Nach der Analyse des zweiten Satzes fehlt zunächst in der dabei aufgebauten Konzeptualisation eine Angabe über das bei der Handlung (PROPEL) verwendete Objekt. Für den Fall, daß bei einem eingegebenen Satz mit dem Verb „schlagen" das Instrument der Handlung nicht spezifiziert wird, führt das System folgende Prozesse durch. Zunächst wird, ausgehend vom ASET des Agens der Handlung, danach gesucht, ob der Agens ein Objekt in der Hand hält. Kann eine Konzeptualisation mit diesem Inhalt gefunden werden, dann nimmt das System an, daß es sich dabei um das gesuchte Instrument handelt. Wird dieser Inhalt nicht gefunden, dann nimmt das System an, daß die Hand des Agens das Instrument des Schlagens bildet. Noch komplexer sind die Inferenzprozesse, durch welche kausale Verbindungen aufgebaut werden. Hierfür müssen verschiedenste Arten von Wissensinhalten benützt werden, so etwa Wissen über Motivationen (ζ. B.: Wenn man auf jemanden böse ist, will man ihm schaden), Wissen über den Gebrauch von Gegenständen (ζ. B.: der hauptsächliche Verwendungszweck von Messern ist das zerschneiden von Gegenständen) usw. In Anbetracht der Fülle solcher Wissensinhalte war es für Rieger unvermeidbar, sich auf die Formalisierung hauptsächlich dieser Wissensinhalte zu beschränken, die für die Behandlung der von ihm aufgeführten Beispiele notwendig sind. Diese Beschränkung hat allerdings zur Folge, daß das System bei der Analyse anderer als der von ihm gegebenen Beispielsätze falsche Inferenzen ziehen würde. Bei der Eingabe der Sätze Hans warf den Brief auf den Boden. Fritz hob ihn auf. Er schlug Hans, würde durch die von Rieger aufgeführten Regeln inferiert werden, daß Fritz als Instrument des Schlagens den Brief benützte. Solche Mängel könnten dadurch behoben werden, daß dem System weitere Wissensinhalte eingegeben werden, so ζ. B., daß nur starre Objekte oder nur Objekte mit einem bestimmten Gewicht als Instrument zum Schlagen verwendet werden können. Allerdings würde bei einer Erweiterung der Wissensinhalte ein Mangel des Rieger'schen Systems, der sich schon bei der von ihm programmierten Version zeigt, noch ausgeprägter auftreten. Dieser Mangel ist eine Konsequenz davon, daß die Inferenzen nicht „gelenkt" sind, d. h., daß das System nach jedem eingegebenen Satz so viele Inferenzprozesse wie möglich durchführt, auch wenn deren Nützlichkeit zu diesem Zeitpunkt noch nicht abgeschätzt werden kann. Rieger nimmt an, daß auch beim menschlichen Sprachverstehen eine große Anzahl solcher nicht-gelenkter Inferenzprozesse ablaufen; beim Menschen würden diese Prozesse parallel, d. h. gleichzeitig so
170
Die Repräsentation komplexer Wissensinhalte
lange durchgeführt werden, bis durch einen neu eingegebenen Satz oder durch einen anderen Reiz die Aufmerksamkeit des Subjektes auf einen neuen Inhalt abgelenkt wird. N u n ist es zum einen kaum möglich, auf den heute bestehenden Rechenanlagen ein Fragen-Antwort-System zu programmieren, welches auf diesen Annahmen basiert. Zum anderen führen diese Annahmen auch bei einem psychologischen Modell des Sprachverstehens zu Schwierigkeiten: Da keine Regeln dafür gegeben werden, welche der möglichen Inferenzen sinnvoll sind, wird jeder der inferierten Inhalte wiederum eine Reihe weiterer Inferenzprozesse auslösen. Nach der Eingabe ζ. B. des Satzes Hans gab Fritz ein Buch, wird zunächst inferiert, daß Fritz ein Buch hat, daß Hans kein Buch mehr hat, daß Fritz das Buch liest, usw. Zudem wird vom System jedoch auch danach gesucht werden, warum Hans möchte, daß Fritz das Buch liest, was wohl der Inhalt des Buches sei, oder wie Hans das Buch erworben hat. Solche für die beschriebene Handlung irrelevante Inferenzen sollten jedoch nur dann gezogen werden, wenn sie für die Lösung eines bestimmten Problemes notwendig sind. Bei den von ihm analysierten Beispielen mußte Rieger deshalb „von H a n d " den Inferenzprozeß lenken. Dies geschah dadurch, daß er dem System während der Durchführung der Inferenzprozesse jeweils mitteilte, ob eine bestimmte Inferenz gezogen oder ausgelassen werden solle. Ein solches Vorgehen bildet jedoch lediglich ein Umgehen aber keine befriedigende Lösung des beschriebenen Problemes.
2. Die Repräsentation komplexer Objekte bei Winston Eine sinnvolle Beschränkung der bei der Analyse eines Textes möglichen Inferenzen ist nur dann möglich, wenn Beschreibungen darüber verfügbar sind, welche Inhalte in einem bestimmten Zusammenhang relevant sind. Man müßte also einen Formalismus entwickeln, der angibt, welche Faktoren für einzelne Klassen von Handlungen oder Situationen konstitutiv, u n d welche anderen Faktoren innerhalb der beschriebenen Handlung oder Situation nicht bedeutsam sind. Ein analoges Problem stellt sich bei der Beschreibung der Wahrnehmung komplexer Objekte. Auch hier muß das Subjekt über Ordnungsprinzipien verfügen, durch welche die eintreffenden Reize in voneinander abgehobene Objekte strukturiert werden. Dieser Prozeß wird zum einen durch allgemeine Prinzipien gesteuert, die den von Wertheimer (1923) und anderen beschriebenen Gestaltgesetzen entsprechen und von der vorherigen Kenntnis der Objekte zumindest
Die Repräsentation komplexer Objekte bei Winston
171
teilweise unabhängig sind. Durch ein von Guzman (1968) entwickeltes Programm ist es möglich, solche von der Gestaltpsychologie beschriebenen Ordnungsprozesse nachzubilden. Dieses Programm enthält als Eingangsdaten Strichzeichnungen von komplexen Strukturen geometrischer Körper und bestimmt darauf, wieviele Körper in der gezeigten Situation enthalten sind, und welche der gezeigten Flächen den einzelnen Körpern zugehören. So findet das Programm beispielsweise, daß bei der in Abb. 26 gezeigten Situation die Flächen 19, 20, 29, 30 und 34 alle demselben Körper zugehörig sind. Abb. 26: Beispiel einer Konfiguration geometrischer Körper, die durch das Programm von Guzman (1968) analysiert werden können
Das Programm von Guzman verfügt jedoch nicht über Begriffe für die abgebildeten Objekte, d. h. es kann beispielsweise nicht erkennen, daß Keile und Quader zwei verschiedene Klassen von Körpern bilden. Solche Begriffe für Klassen von Objekten spielen jedoch bei der Wahrnehmung u. a. von solchen Objekten und Situationen eine wichtige Rolle, die in der natürlichen Umgebung vorkommen und von denen man über Erfahrungen verfügt. Deshalb wurde von Winston (1970, 1975) versucht, den Ansatz von Guzman dahingehend zu erweitern, daß eine semantisch-begriff-
172
Die Repräsentation komplexer Wissensinhalte
liehe Repräsentation von dargebotenen Objekten möglich ist. Durch dieses Programm wird in einem ersten Schritt eine semantische Repräsentation der dargebotenen Struktur von Objekten aufgebaut. Darin ist jedes Objekt durch einen Knoten (in Abb. 27: einen Kreis) repräsentiert. Diesen Knoten sind Informationen über die Form (Quader, Keil usw.) und über die Lage (liegend, stehend) des Objektes zugeordnet. Zudem wird durch Verbindungen zwischen den Knoten angegeben, in welcher Relation die einzelnen Objekte zueinander stehen. Abb. 27 (a) zeigt die semantische Repräsentation des nebenstehenden Torbogens. Diese Repräsentation könnte wie folgt paraphrasiert werden: Die Struktur besteht aus drei Objekten: Α, Β und C. Alle drei sind Quader; die Position von Α ist liegend, Β u n d C sind stehend. Α ist von Β und C gestützt und Β ist links von C. J e d e der Relationen und Attribute ist in dem System von Winston ebenfalls durch eine, in Abb. 27 nicht dargestellte komplexe semantische Struktur repräsentiert. Nach dem Aufbau der semantischen Beschreibung für eine dargebotene Struktur können dem System weitere Konstellationen von Objekten dargeboten werden, wobei jeweils angegeben wird, ob es sich dabei um eine Instanz des zu formalisierenden Begriffes handelt oder nicht. Dieses Vorgehen entspricht also dem von Ach (1921) durchgeführten Begriffsbildungsexperiment. Nach der Darbietung der Konstellation (b) wird in der semantischen Repräsentation vermerkt, daß bei den unter dem Begriff subsumierten Strukturen notwendigerweise das Objekt Α von den Objekten Β und C gestützt sein muß. Nach der Darbietung von C wird eine zusätzliche Verbindung zwischen Β und C aufgebaut, die besagt, daß die beiden Körper nicht unmittelbar nebeneinander stehen dürfen. Konstellation (d) steht insofern im Widerspruch zu dem bislang formalisierten Begriff, als es sich beim oberen Teil Α des Bogens nicht um einen Quader sondern u m einen Keil handelt. Deshalb wird die entsprechende Spezifikation in der semantischen Repräsentation fallen gelassen. Die Darbietung von Konstellationen, die keine Instanz des Begriffes bilden, führt also zu einer Begriffsverengung und die Darbietung von Instanzen des Begriffes führt zu einer Begriffserweiterung. Die semantische Beschreibung für eine Klasse von Konstellationen besteht in dem System von Winston also aus Angaben darüber, welche Eigenschaften bei allen Instanzen dieser Klasse gleichbleibend sind. Diese Beschreibung kann einerseits bei der Wahrnehmung neuer Instanzen dieser Klasse modifiziert werden; zum anderen dient diese Beschreibung auch als stereotypes Muster, durch welches die Wahrnehmung von neuen Instanzen der Klasse gesteuert wird.
Die Repräsentation komplexer Objekte bei Winston
173
Abb. 27: Der Erwerb des Begriffes „Torbogen" auf Grund von richtigen und falschen Beispielobjekten in dem System von Winston (1975) von dem Programm aufgebauter Begriff
Dargebotenes Beispielobjekt Torbogen:
(a)
(a) Kein Torbogen:
(b)
(b) Kein Torbogen:
(c)
(c) Torbogen:
(d)
174
Die Repräsentation komplexer Wissensinhalte
3. Das Frame-Modell von Minsky Dieser zweite Aspekt, d. h. die Steuerung von Wahrnehmungsprozessen durch komplexe begrifflich-semantische Strukturen, bildet das Thema eines Aufsatzes von Minsky (1975a, 1975b), der auch für das Verstehen der Sprachwahrnehmung einen wichtigen Beitrag geliefert hat. Die darin skizzierte ,,frame"-(Rahmen-) Theorie wird von Minsky wie folgt zusammengefaßt: „Wenn man einer neuen Situation begegnet (oder wenn man seine Sicht eines Problemes erheblich verändert), dann wählt man aus dem Gedächtnis eine Struktur, die Frame genannt wird. Dabei handelt es sich um ein erinnertes Gerüst, das der Wirklichkeit angepaßt werden kann, indem Einzelheiten daraus verändert werden." „Eine Frame ist eine Datenstruktur zur Darstellung stereotyper Situationen. Dabei kann es sich um den Aufenthalt in einem Wohnzimmer oder um den Besuch einer Geburtstagseinladung für Kinder handeln. J e d e m Frame sind verschiedene Arten von Informationen zugeordnet. Einige dieser Informationen geben an, wie der Frame gebraucht werden kann, andere beschreiben, welches Ereignis als nächstes erwartet werden m u ß , und wiederum andere Informationen handeln davon, was man unternehmen kann, wenn diese Erwartungen nicht eintreffen." (Minsky, 1975b, p. 118.) Eine für das Erkennen und Verstehen von Situationen wichtige Eigenschaft von Frames ist, daß sie mit anderen Frames, welche benachbarte oder zeitlich sukzessive Situationen beschreiben, in Beziehung gesetzt werden können. Solche Verbindungen werden nach Minsky durch sog. Terminalknoten ermöglicht: Ein Terminalknoten repräsentiert eine Eigenschaft oder einen Ausschnitt aus der beschriebenen Situation, die, bzw. der für die beschriebene Struktur nicht allgemein gültig ist. Jedem Terminalknoten sind Restriktionen darüber zugeordnet, welche Eigenschaften der entsprechende Ausschnitt haben kann. Eine solche Restriktion ist beispielsweise in der Beschreibung des Torbogens, daß es sich bei den beiden Stützen um Quader handeln muß. In manchen Fällen bestehen Terminalknoten wiederum aus vollständigen Frames, die eine komplexe Situation beschreiben. Wenn zwei Frames nun benachbarte oder sukzessive Situationen beschreiben, dann haben sie häufig gemeinsame Terminalknoten. Ein einfaches Beispiel hierfür bildet die Repräsentation von zwei Ansichten desselben Würfels, die in Abb. 28 dargestellt ist. Der mittlere Teil der Abbildung zeigt die beiden Frames für die jeweils benachbarten Ansichten des Würfels. Von den vier Terminalknoten Α, Ε, Β und C sind zwei, die Knoten Ε und B, beiden Frames gemeinsam. Dabei
175
Das Frame-Modell von Minsky
handelt es sich um die Knoten für die Seitenflächen, die in beiden Ansichten sichtbar sind. Abb. 28: Frames für zwei benachbarte Situationen nach Minsky
Α
Ε
Β
C
Man kann sich vorstellen, daß die Orientierung in einer sich verändernden Umgebung durch die Auswahl der jeweils adäquaten Frames ermöglicht wird. Dabei kann der für eine neue Situation passende Frame über die Terminalknoten des vorherigen Frames gefunden werden. Um zu bestimmen, welcher Frame als Schema für eine neue Situation adäquat ist, bestehen für jedes Paar von einander benachbarten Frames Transformationsregeln. Diese geben an, in welcher Weise sich die Terminalknoten beim Übergang von einem Frame zum anderen verändern. Beim Ubergang vom linken zum rechten Frame in Abb. 28 finden beispielsweise drei Transformationen statt: Die Fläche Α verschwindet, die Fläche C erscheint auf der rechten Seite und die Fläche Β wird nach links verschoben und verändert ihren Winkel. Als Terminalknoten können zwei verschiedene Arten von semantischen Einheiten fungieren. Beschreibt der Frame eine stereotype Situation, dann handelt es sich um die konzeptuelle Repräsentation eines Objektes oder einer Beziehung von Objekten. Handelt es sich bei dem Frame jedoch um einen Plan, in dem ein Handlungsablauf beschrieben wird, dann können auch Teilhandlungen davon Terminalknoten bilden. So bildet etwa die Teilhandlung, daß jemand am Bahnhof eine Fahrkarte kauft, ein Indiz dafür, daß die komplexe Handlung „Eisenbahnreise" abläuft. Die von Hewitt (1975) gemachte Unterscheidung zwischen Frames zur Repräsentation stereotyper Situationen einerseits und den sog. Plänen oder Handlungsframes andererseits ermöglicht es, den sehr schillernden Begriff des Frames etwas zu klären. Minsky postulierte n u n , daß auch das Verstehen von Sprache durch ähnliche Mechanismen gesteuert wird. Als Terminalknoten
176
Die Repräsentation komplexer Wissensinhalte
fungieren dabei Inhaltswörter, die Hinweise darauf geben, daß eine Instanziierung einer bestimmten stereotypen Situation oder eines stereotypen Ereignisses beschrieben wird. Die in dem eingegebenen Text nicht erwähnten Merkmale der Situation oder des Ereignisses könnten auf der Grundlage der in dem Frame enthaltenen allgemeinen Wissensbestände ergänzt werden. Der Frame-Aufsatz von Minsky bildet selbst lediglich ein Rahmenwerk: Er zeigt grundsätzliche und allgemeine Möglichkeiten, die in kognitiven Prozessen benützten Wissensinhalte zu strukturieren; andererseits enthält er nur wenige Hinweise darauf, wie der geschilderte allgemeine Ansatz an konkreten Beispielen von Verstehensprozessen angewendet werden kann. Für die folgenden, von Minsky lediglich als Fragen formulierten Probleme sind bis heute noch keine befriedigenden Lösungen gefunden worden: Auf welche Weise wird ein Frame ausgewählt, der bestimmte Bedingungen erfüllen soll? Auf welche Weise werden Sub-Frames ausgewählt und anderen Frames zugeordnet, damit zusätzliche Einzelheiten repräsentiert werden können? Auf welche Weise kann ein Frame, der zur Beschreibung einer gegebenen Situation ungenügend ist, durch einen anderen Frame ersetzt werden? Was soll getan werden, wenn kein passender Frame gefunden wird? Soll der alte Frame modifiziert oder soll ein neuer aufgebaut werden? Welche Frames sollten auf der Grundlage von neuen Erfahrungen beibehalten oder verändert werden?
4. Frame-Modelle für das Verstehen von Sprache Angeregt durch den oben besprochenen Aufsatz von Minsky wird in einer wachsenden Zahl von Arbeiten versucht, Frames zu entwickeln, auf deren Grundlage man das Verstehen natürlicher Sprachen erklären kann. Dabei hofft man, durch die Verwendung dieser Strukturen Regeln dafür formulieren zu können, welche Inferenzprozesse beim Sprachverstehen durchgeführt werden sollen. Wie im ersten Abschnitt dieses Kapitels gezeigt wurde, zeigt sich an diesem Problem die Unzulänglichkeit der herkömmlichen Modelle zur Repräsentation von Wissensstrukturen, so etwa der von Simmons (1972) und Rieger (1975) verwendeten semantischen Netzwerke. Die Suche in einem semantischen Netz k ö n n t e mit dem Aufsuchen eines Begriffes in einem Lexikon verglichen werden. Der Begriff, über dessen Bedeutung man sich informieren möchte, ist dort meistens
Frame-Modelle für das Verstehen von Sprache
177
unter Hinweis auf andere Begriffe erklärt, und in den Beschreibungen der anderen Begriffe wird dann wiederum weiter verwiesen. Eine solche Suche wird häufig dann abgebrochen, wenn der Benutzer des Lexikons merkt, daß er den Begriff, über dessen Bedeutung er sich eigentlich informieren wollte, vergessen hat. Demgegenüber könnte die Suche in einem Frame-System mit dem Aufsuchen eines Rezeptes in einem Kochbuch verglichen werden: Alle Wissensinhalte, die für die Zubereitung eines Gerichtes bedeutsam sind, stehen in einem einzigen Rezept; man erfährt etwa in dem Rezept für die Zubereitung von Spiegeleiern nichts über die Hühner, welche diese Eier gelegt haben, und in dem Rezept für ein Suppenhuhn wird man ebenfalls nicht auf Eier verwiesen. Die Mehrzahl der Frames, welche zur Formalisierung des Sprachverstehens entworfen wurden, beschreiben nicht komplexe Objekte oder Situationen, sondern stereotype Handlungsabläufe. So sind Frames entwickelt worden, die das Einkaufen in einem Selbstbedienungsgeschäft (Charniak, 1975b), den Gebrauch eines Regenschirmes (Charniak 1975a), einen Viehdiebstahl im wilden Westen (Rieger, 1975b) oder den Vollzug von Sprechakten (Schmidt, 1975; Perrault Sc Cohen, 1977) beschreiben. Im folgenden soll an zwei herausgegriffenen Beispielen gezeigt werden, inwieweit mit Hilfe dieses neuen Ansatzes Lösungen für die bei der Formalisierung des Sprachverstehens auftretenden Probleme gefunden werden können. Tab. 24 zeigt einen von Schänk & Abelson (1977) entwickelten Frame — die beiden Autoren benennen diese Struktur mit dem Wort Skript —, in dem der Besuch in einem Kaffeehaus amerikanischen Stils beschrieben wird. Das Skript wird durch eine Reihe von Angaben eingeleitet, welche die am Handlungsablauf teilnehmenden Personen und Objekte, die Eingangsbedingungen und die Resultate der Handlung beschreiben. Den Hauptteil des Skripts bilden vier Szenen, durch welche die Handlung in vier Stadien aufgegliedert wird. J e d e dieser Szenen besteht aus einer Reihe von Konzeptualisationen, die jeweils eine primitive Handlung der konzeptuellen Dependenzstruktur enthalten. Das Skript besteht also hauptsächlich aus einer Liste von einfachen Handlungen, aus denen die komplexe Handlung „Besuch eines Restaurants" zusammengesetzt ist. J e d e dieser einzelnen Teilhandlungen ist dabei eine Voraussetzung für die Durchführung der folgenden Aktionen.
178
Die Repräsentation komplexer Wissensinhalte
Tab. 24: Skript eines Gasthausbesuches nach Schänk & Abelson ( 1 9 7 7 , p . 43f.) Skript: Gasthaus Spezifikation: Kaffee Eigenschaften: Tisch, Speisekarte, Nahrung (=N), Rechnung, Geld Rollen: Kunde (=Ku), Kellner (=Ke), Koch (=Ko), Kassierer (=Ka), Besitzer (=B) Eingangsbedingungen: Ku ist hungrig, Ku hat Geld Resultate: Ku hat weniger Geld, Β hat mehr Geld, K u ist nicht hungrig, K u freut sich (manchmal) 1. Szene: Betreten des Gasthauses K u P T R A N S sich selbst ins Gasthaus K u A T T E N D seine Augen zu den Tischen Ku MBUILD, wo er sitzen will Ku P T R A N S sich selbst zum Tisch Ku MOVE in sitzende Lage 2. Szene: Bestellung K u verlangt Speisekarte, Ke bringt Speisekarte K u M T R A N S Liste der Speisen in sein Arbeitsgedächtnis > Ku MBUILD Wahl von Ν K u MTRANS Zeichen zu Ke K e P T R A N S sich selbst zu Ku K u MTRANS „Ich möchte N " zu Ke Ke P T R A N S sich selbst zu K o K e M T R A N S (ATRANS N) zu Ko K o M T R A N S „kein N " zu K e Ke P T R A N S sich selbst zu K u Ke M T R A N S „kein N " zu K u
Ko TUN (N zubereiten)
Φ
3.Szene
4. Szene: nicht bezahlen 3. Szene: Essen K o A T R A N S Ν zu K e Ke A T R A N S Ν zu Ku K u INGEST Ν 4. Szene: Ausgang K u M T R A N S zu Ke (Ke A T R A N S Rechnung zu Ku) Ke MOVE (Schreiben der Rechnung) Ke P T R A N S sich selbst zu K u K a A T R A N S Rechnung zu Ku K u A T R A N S Trinkgeld zu K e Ku P T R A N S sich selbst zu K a K u A T R A N S Geld zu K a nicht bezahlen: Ku PTRANS sich selbst aus dem Gasthaus
Ein von Schänk und seinen Mitarbeitern entworfenes S y s t e m von Programmen SAM (Skript Anwendung Mechanismus) ermöglicht es, die in dem Skript enthaltenen Informationen für das Verstehen von einfachen Texten zu verwenden, in denen der Besuch von Restau-
Frame-Modelle für das Verstehen von Sprache
179
rants beschrieben wird. Teil dieses Programmsystems sind erweiterte Fassungen des Satzanalysators von Riesbeck und des Satzgenerators von Goldman, die in den Abschnitten 4 und 5 des Kapitels V beschrieben wurden. SAM ermöglicht hauptsächlich folgende Leistungen: a) Auf Grund von Schlüsselwörtern, ζ. B. dem Wort „Restaurant" wird bestimmt, welchem Skript die eingegebene Geschichte zugeordnet werden kann. b) Die einzelnen Aussagen des eingegebenen Textes werden in eine Repräsentation der konzeptuellen Dependenzstruktur analysiert und den im Skript enthaltenen Teilhandlungen zugeordnet. c) Die im eingegebenen Text genannten Personen und Objekte werden den entsprechenden Eigenschaften und Rollen im Skript zugeordnet. d) Mehrdeutigen Wörtern können die für das Skript spezifischen Bedeutungen zugeordnet werden. So besteht beispielsweise die Regel, daß das Verb „bedienen" im Zusammenhang mit dem Besuch eines Restaurantes die Bedeutung von „servieren" hat, im Zusammenhang mit Ballspielen jedoch die Bedeutung von „übergeben des Balles". e) Eingegebene Texte können zusammengefaßt werden, indem sie das System auf wenige, für die Handlung wichtige Aussagen verkürzt. Dabei handelt es sich um Teilhandlungen, die in dem Skript als für den Ablauf der Aktion wichtig markiert sind. f) Umgekehrt können eingegebene Texte ausführlich paraphrasiert werden. Dazu wird der eingegebene Text um die darin nicht erwähnten Teilhandlungen des Skriptes ergänzt. g) Auf Grund der Aufeinanderfolge der in dem Skript enthaltenen Teilhandlungen kann das System Fragen über die zeitliche Sukzession der im Text erwähnten Aussagen beantworten. Diese Leistungen sind jedoch nur so lange möglich, als die eingegebene Geschichte dem Skript entspricht. Weicht sie von dem beschriebenen stereotypen Schema ab, dann können die abweichenden Aussagen nur in Ausnahmefällen sinnvoll interpretiert werden. Eine Möglichkeit, mit welcher der Variabilität von Handlungsabläufen in beschränktem Maße Rechnung getragen werden kann, bilden die sog. „wenn dann"-Verbindungen. Diese geben an, wie die in einem Skript beschriebene Handlung fortgesetzt wird, wenn bestimmte unerwartete Teilhandlungen eintreten. Eine solche „wenn dann"-Verbindung befindet sich in der zweiten Szene von Tab. 24: Wenn der Kellner dem Gast sagt, daß die gewünschte Speise nicht erhältlich ist, dann wird der Gast entweder eine andere Speise bestellen, oder er wird das Lokal verlassen.
180
Die Repräsentation komplexer Wissensinhalte
W. Lehnert (1976), eine Mitarbeiterin von Schänk, versuchte mit Hilfe dieser „wenn dann"-Verbindungen einen Algorithmus zu entwickeln, welcher die Beantwortung von „warum nicht"-Fragen erlauben soll. Solche Fragen können immer dann sinnvoll gestellt werden, wenn Teile eines eingegebenen Textes einer erwarteten Handlungsstruktur widersprechen. Dies ist etwa bei der folgenden Geschichte der Fall: Hans ging in ein Restaurant. Er setzte sich an einen Tisch und las die Speisekarte. Er bestellte einen Hamburger. Der Kellner sagte ihm, es gäbe keine mehr. Darauf verlies Hans das Lokal, ohne zu bezahlen. Eine mögliche „warum nicht"-Frage zu diesem Text ist etwa: Warum aß Hans keinen Hamburger? Lehnert postuliert nun, daß man bei der Beantwortung dieser Art von Fragen eine zweite Geschichte konstruiert, die den im Skript beschriebenen normalen Ablauf der Handlung darstellt. Darauf überprüfe man, an welcher Stelle der eingegebene Text zum ersten Mal von der Skript-Geschichte abweicht. Im obigen Beispiel ist dies bei dem Satz: Der Kellner sagte ihm, es gäbe keine mehr, der Fall. Das in diesem Satz beschriebene Ereignis bildet nach Lehnert die Antwort auf alle Fragen, die sich nach dem warum des nichtEintreffens eines späteren Inhaltes aus dem Skript erkundigen. Die Anwendung dieser Regel führt allerdings nur dann zu sinnvollen Antworten, wenn die Abweichung vom normalen Ablauf des Skripts als eine mögliche Modifikation im Skript selbst vermerkt ist. So würde etwa bei der folgenden Geschichte durch die Anwendung der von Lehnert formulierten Regel keine sinnvolle Antwort gefunden werden: Hans ging in ein Restaurant. Er setzte sich an einen Tisch. Er konnte keine Speisekarte finden. Plötzlich erinnerte er sich, daß er kein Geld bei sich hatte. Er verließ das Restaurant ohne zu essen. Auf Grund der Regel von Lehnert würde hier die Frage Warum bezahlte Hans nicht? mit dem Satz Weil er keine Speisekarte finden konnte, beantwortet werden; denn dieser Inhalt bildet die erste Abweichung vom normalen Ablauf des Skripts. Die Schwierigkeit, auf der Grundlage des Skript-Modelles eine Regel für die Beantwortung von „warum nicht"-Fragen zu formulieren, ist eine Folge der Rigidität des von Schänk entwickelten Ansatzes. Wie in den Kap. I X und X gezeigt werden soll, werden üblicherweise gerade solche Inhalte geäußert, die
Frame-Modelle für das Verstehen von Sprache
181
von den in Frames beschriebenen üblichen Handlungsabläufen abweichen. Darum ist es für die Formalisierung des sprachlichen Verstehens wichtig, daß auch nicht-stereotype Situationen und Handlungen adäquat analysiert werden können. Eine bessere Lösung für das Verstehen von nicht-stereotypen Situationen bildet der Ansatz von Charniak (1976a, 1976b). Charniak entwickelte eine Reihe von miteinander verbundenen Frames, durch die die komplexe Handlung „anmalen" beschrieben wird. Die Beziehungen zwischen den verschiedenen Frames werden durch zwei Arten von Relationen beschrieben: Die KOMMT-VON-Relation verbindet eine Handlungs- oder Zustandsbeschreibung mit einem Frame, in dem detailliert beschrieben wird, wie diese Handlung ausgeführt bzw. dieser Zustand hergestellt wird. Die FÜHRT-ZU-Relation verbindet eine Handlungs- oder Zustandsbeschreibung mit einem Frame, in dem angegeben ist, welche Konsequenzen das Auslassen dieser Handlung bzw. dieses Zustandes nach sich zieht. Abb. 29: Der Frame für die komplexe Tätigkeit „anstreichen" nach Charniak (1976b) Variablen
:
Ziel
:
Ereignis
:
AGENS, ein Lebenswesen OBJEKT, ein fester Gegenstand FARBE, eine Flüssigkeit, normalerweise eine Farbe INSTRUMENT, ein fester Gegenstand, normalerweise eine Rolle oder ein Pinsel, sollte absorbierend sein. OBJEKT ist von FARBE bedeckt KOMMT-VON: P6 PI: OBJEKT nicht schmutzig KOMMT-VON: „WASCHEN" FUHRT-ZU: „SCHMUTZIGES OBJEKT" P2: Alle Dinge in der Nähe sind mit Papier bedeckt P3: SCHLAUFE P4: bringe FARBE an das INSTRUMENT KOMMT-VON: „EINTAUCHEN" P5: GROESSER Tropfschwelle Menge von FARBE auf INSTRUMENT KOMMT-VON: „ABSTREIFEN" P6: INSTRUMENT in Kontakt mit OBJEKT P7: GROESSER Menge von FARBE auf INSTRUMENT Schwellenwert zum anstreichen KOMMT-VON: entweder „DRUECKEN" oder P4 P8: FARBE vom Instrument entfernt FÜHRT-ZU: „VERSTEIFUNG der Bürste von INSTRUMENT"
182
Die Repräsentation komplexer Wissensinhalte
A b b . 29 zeigt eine vereinfachte Version des zentralen Frames, in welchem das Anstreichen eines Objektes mit einem Pinsel oder einer Tapeziererrolle beschrieben wird. (Der in Charniak, 1976a, aufgeführte vollständige Frame ist mehrere hundert Zeilen lang). Die Ausdrücke „Variablen", „ Z i e l " und „Ereignis" entsprechen etwa den Ausdrücken „Eigenschaften" und „ R o l l e n " , „Resultate" und „Szene" in dem Skript von Schänk und Abelson. Den Variablen zugeordnet sind zwei Arten von semantischen Restriktionen. Zum einen wird angegeben, welche Eigenschaften das Objekt besitzen muß ( ζ . B. bei dem I N S T R U M E N T muß es sich um einen festen Gegenstand handeln), und zum anderen, welche Klasse von Gegenständen normalerweise als Objekt in Betracht kommen (ζ. B. das I N S T R U M E N T ist normalerweise ein Pinsel oder eine Rolle). Die Aussagen P I bis P8, die den Handlungsablauf beschreiben, könnten wie folgt paraphrasiert werden: Zunächst wird das OBJEKT gereinigt ( P I ) und dessen Umgebung mit Papier bedeckt (P2). Dann wird das I N S T R U M E N T in die FARBE getaucht (P4) und abgestreift, so daß es nicht tropft (P5). Darauf bringt man es mit dem anzumalenden OBJEKT in Berührung (P6). Man achtet darauf, daß sich die F A R B E vom I N S T R U M E N T auf das OBJEKT überträgt. Dies geschieht dadurch, daß man das I N S T R U M E N T gegen das OBJEKT drückt, oder daß man die Teilhandlung P4 wiederholt (P7). A m Schluß wird das I N S T R U M E N T gereinigt (P8). Die in Anführungszeichen gesetzten Ausdrücke, auf welche durch die K O M M T - V O N und FUEHRT-ZU-Verbindungen hingewiesen wird, sind Bezeichnungen für andere Frames, die wiederum eine komplexe oder einfache Handlung oder einen Zustand beschreiben. Abb. 30 zeigt den Frame für SCHMUTZIGES OBJEKT, der lediglich eine Kausalverbindung beschreibt: Wenn man ein schmutziges Objekt anmalt, dann wird die Farbe später abbröckeln oder Blasen bilden. Charniak bezeichnet solche Kausalverbindungen als „einfache Ereignisse". Abb. 30: Der Frame für das einfache Ereignis „ S C H M U T Z I G E S nach Charniak (1976b) Ereignis:
OBJEKT"
U N D SOI: O B J E K T ist schmutzig S02: O B J E K T wird mit F A R B E angemalt V E R U R S A C H T (nach etwa einem Jahr) O D E R S03: F A R B E bildet Blasen S04: F A R B E bricht ab
Diese Strukturen, zusammen mit einer Reihe von Inferenzregeln, ermöglichen es, Fragen über eingegebene Texte über das entspre-
Frame-Modelle für das Verstehen von Sprache
183
chende Thema sinnvoll zu beantworten. Ein Beispiel eines solchen Dialoges ist etwa: Text: Hans malte einen Stuhl an. Er vergaß, ihn zu waschen. 1. Frage: Kann er dies tun? Antwort: J a . 2. Frage: Was wird passieren? Antwort: Die Farbe wird abblättern oder Blasen bilden. Text: Er tauchte den Pinsel in die Farbe. Er strich ihn über den Stuhl. 3. Frage: Könnte er diesen Schritt auslassen? Antwort: Nein. 4. Frage: Warum nicht? Antwort: Weil bei diesem Schritt Farbe an den Stuhl kommt, und dies ist das Ziel der Handlung. Text: Nachdem er den Stuhl fertig angemalt hatte, suchte er Zeitungspapier. 5. Frage: Warum? Antwort: Um den Pinsel zu putzen. Tatsächlich ist das System von Charniak zur Zeit der Abfassung dieses Kapitels (Ende 1977) noch nicht so weit implementiert, daß der obige Dialog möglich ist. Dazu muß eine große Zahl von Inferenzregeln formalisiert werden, welche die in den Frames enthaltenen Informationen benützen. Bei der Antwort auf Frage fünf muß beispielsweise berücksichtigt werden, daß der Ausdruck „etwas anmalen" in zwei Bedeutungen verstanden werden kann. Zum einen kann darunter die gesamte in dem Frame beschriebene Aktion verstanden werden. Zum anderen, und diese Bedeutung ist die in Frage fünf gemeinte, kann sich der Ausdruck nur auf die eigentliche Handlung des Anstreichens beziehen, die in der Schlaufe P3 beschrieben wird. Weiter muß bei der Beantwortung der fünften Frage berücksichtigt werden, daß der vermutliche Gebrauch des Zeitungspapiers davon abhängt, in welchem Stadium innerhalb der komplexen Handlung darauf hingewiesen wird. Würde der Satz „er suchte Zeitungspapier" beispielsweise am Anfang des eingegebenen Textes auftreten, dann würde dies als eine Teilhandlung von P2 interpretiert werden. Die von Schänk und von Charniak entwickelten Frame-Modelle sind sehr viel detaillierter als der von Minsky beschriebene Ansatz. Trotz ihrer Mängel und Unvollständigkeiten zeigen diese beiden Arbeiten, daß die Strukturierung von Wissensinhalten in Frames eine brauchbare Grundlage für die Formalisierung von sprachlichen Verstehensprozessen liefern. Mißt man die Modelle von Schänk und von Charniak allerdings an den von Minsky aufgeworfenen, am Ende von Abschnitt 3 erwähnten fünf Problemen, dann zeigt sich deutlich, daß eine Reihe wichtiger theoretischer Fragen weiterhin ungelöst bleibt:
184
Die Repräsentation komplexer Wissensinhalte
1. Auf welche Weise wird ein Frame ausgewählt, der bestimmte Bedingungen erfüllen soll? Bei Schänk geschieht die Auswahl von Frames über bestimmte Schlüsselwörter; wie im folgenden Kapitel gezeigt werden soll, ist diese Methode mangelhaft. Charniak geht in seinen ,,anmalen"-Frames nicht auf diese Frage ein. 2. Auf welche Weise werden Sub-Frames ausgewählt und anderen Frames zugeordnet, damit zusätzliche Einzelheiten repräsentiert werden können? Schänk geht nicht auf diese Frage ein. Bei Charniak wird das Auffinden von Sub-Frames bis zu einem gewissen Maße durch die KOMMT-VON- und FUEHRT-ZU-Verbindungen ermöglicht. 3. Auf welche Weise kann ein Frame, der zur Beschreibung einer gegebenen Situation ungenügend ist, durch einen anderen Frame ersetzt werden? 4. Was soll getan werden, wenn kein passender Frame gefunden wird? 5. Welche Frames sollten auf der Grundlage von neuen Erfahrungen beibehalten oder verändert werden? Auf die Fragen 3 bis 5 finden sich weder bei Schänk noch bei Charniak befriedigende Antworten. Im folgenden Kapitel wird ein Modell des begrifflichen Wissens geschildert werden, das den Frame-Modellen verwandt ist. Es sollte sich von den besprochenen Frame-Modellen v. a. darin unterscheiden, daß es eine größere Flexibilität der Analyse auch von solchen Handlungen erlaubt, die sich nicht strikt an ein stereotypes Schema anlehnen. Diese Flexibilität wird dadurch erreicht, daß die Frame-Strukturen, die als Rezepte bezeichnet werden sollen, nicht aus einer Reihe von Teilhandlungen zusammengesetzt sind, sondern aus einer Serie von Zustandsbeschreibungen. Die einzelnen Rezepte sind zudem durch verschiedene Arten von Relationen miteinander verbunden, die über das wann, wie, warum und wozu der beschriebenen Handlungen und Zustände informieren.
VII. DIE STRUKTUR VON REZEPTEN
Jedes Rezept oder Aktionsschema ist eine komplexe Struktur, die aus vier Teilen zusammengesetzt ist: 1. Die Liste der Aktanten oder Rollen: Diese Liste enthält Bezeichnungen für die Personen und Objekte, welche in der beschriebenen Handlung eine bedeutsame Rolle spielen. Die für die einzelnen Aktanten gewählten Namen sind arbiträr. 2. Eine Liste von Propositionen, welche die Voraussetzungen oder Prärequisite für den Vollzug der Handlung beschreiben. 3. Der Korpus des Rezeptes: dieser enthält die Beschreibungen der Zustände, die während des Vollzuges der Handlung durchlaufen werden. Diese Zustände sollen im folgenden als Zwischenzustände bezeichnet werden. 4 . Die Beschreibung(en) des, bzw. der üblicherweise intendierten Haupt-Resultate(s) der Handlung, abgekürzt I.H.-R. Die Voraussetzungen, die Zwischenzustände und die Haupt-Resultate sind Zustände; zusammen bilden sie die Aussagen oder die Propositionen des Rezeptes.
1. Voraussetzungen und Zwischenzustände Bevor diese erste und grobe Gliederung von Rezepten weiter detailliert wird, sollen zwei Merkmale der gegebenen Einteilung näher analysiert werden. Der erste Punkt betrifft die Unterscheidung zwischen Voraussetzungen und Zwischenzuständen: in gewissen Fällen kann nicht ohne weiteres entschieden werden, welcher dieser beiden Kategorien eine bestimmte Aussage zuzurechnen ist. Der Unterschied zwischen den beiden Arten von Aussagen könnte etwa folgendermaßen beschrieben werden: Im Korpus eines Rezeptes sind die Beschreibungen aller derjenigen Zustände enthalten, von denen man erwartet, daß sie während des Vollzuges der Handlung hergestellt werden. Hört man etwa, daß jemand etwas kocht, dann erwartet man, daß diese Person in die Küche geht, daß sie mit verschiedenen Küchengeräten hantiert usw. Man erwartet jedoch nicht, daß die Person in ein Haushaltwarengeschäft geht, um diese Geräte zu kaufen. Die Verfügung über Küchengeräte bildet damit eine Vorausset-
186
Die Struktur von Rezepten
zung der Handlung „kochen", und das sich in der Küche befinden ist ein Zwischenzustand. Die Unterscheidung zwischen Voraussetzungen und Zwischenzuständen ist unabhängig davon, durch wen der Zustand realisiert wird: Eine Voraussetzung kann vom Aktor des Handlungsrezeptes, aber auch von anderen Aktanten produziert werden. Eine häufige Voraussetzung von Handlungen ist beispielsweise, daß der Aktor einer Handlung über Geld verfügt, um etwas zu erwerben. Diese Voraussetzung kann durch den Aktor selbst produziert werden, indem er das Geld verdient; es ist jedoch auch möglich, daß ihm eine andere Person das Geld gegeben hat, wobei der Aktor selbst keine eigene Handlung für die Realisierung dieser Voraussetzung durchführt. Andere Voraussetzungen sind überhaupt nicht das Resultat von Handlungen; das trifft beispielsweise bei der Voraussetzung zu, daß Schnee vorhanden sein muß, um skizufahren. Gleicherweise können auch Zwischenzustände von Handlungen durch den Aktor des Rezeptes oder durch eine andere Person hergestellt werden. Allerdings lassen sich Fälle beschreiben, in denen sich Voraussetzungen und Zwischenzustände voneinander nicht klar abgrenzen lassen. Wie die Verfügung über Kochgeschirr, so wird man auch die Verfügung über Nahrungsmittel als Voraussetzung der Handlung „koc h e n " betrachten; dies trifft vor allem in einer Kultur zu, in der man ein bis zwei mal pro Woche im Supermarkt einkaufen geht. Wenn man nun plötzlich während des Kochens merkt, daß kein Salz mehr im Hause ist, und zum Krämer um die Ecke eilt, um welches zu besorgen, dann könnte diese Handlung, bzw. das durch sie produzierte Resultat als Teil des Korpus betrachtet werden. Dies trifft jedoch lediglich für diesen einzelnen und individuell spezifischen Vollzug der Handlung „kochen" zu, und es wäre damit nicht gerechtfertigt, das Rezept für die Handlung zu modifizieren, um einem solchen abweichenden Spezialfall Rechnung zu tragen. Dies kann besser durch die weiter unten zu besprechenden Verbindungen zwischen Aussagen und Rezepten und durch die allgemeinen Inferenzregeln geleistet werden. Die Tatsache, daß Voraussetzungen und Zwischenzustände in gewissen Fällen nicht klar voneinander abgegrenzt werden können, bildet so lange keinen ausreichenden Grund dafür, auf diese Unterscheidung zu verzichten, als diese Unterscheidung gewisse Vorteile mit sich bringt. Diese Vorteile ergeben sich aus der Möglichkeit, Inferenzregeln zu formulieren, bei denen von dieser Unterscheidung Gebrauch gemacht wird. Dies wird bei den im folgenden Kapitel beschriebenen Inferenzregeln (R2), ( R 6 ) , ( R 7 ) und ( R 9 ) der Fall sein.
Handlungen und Zustände
187
2. Handlungen und Zustände Ein weiteres Merkmal bei der oben gegebenen Gliederung von Rezepten, welches erklärt werden soll, betrifft die Beschreibung von Handlungen als eine Sequenz von Zuständen. Der hauptsächliche Vorteil dieses Ansatzes besteht darin, daß das System damit einen höheren Grad von Flexibilität gewinnt, d. h. daß ein Rezept für die Beschreibung auch solcher Handlungsvollzüge benützt werden kann, die nicht streng einem stereotypen Muster folgen. In der Regel ist es für den Vollzug einer komplexen Handlung lediglich notwendig, daß gewisse Zwischenzustände realisiert werden; dabei ist es jedoch unwichtig, auf welche Weise man diese Zwischenzustände produziert. Wenn man beispielsweise mit einem bestimmten Zug verreisen will, dann muß man wissen, zu welcher Zeit und von welchem Bahnsteig er abfährt; es ist jedoch unwichtig, auf welche Weise dieses Wissen erworben wird. Andererseits werden gewisse Zwischenzustände häufig durch ganz bestimmte stereotype Handlungen produziert. Wenn jemand beispielsweise Nahrungsmittel bekommen möchte, dann wird er diese üblicherweise in einem Geschäft kaufen; dies, obwohl man Nahrungsmittel auch auf anderen Wegen bekommen kann — so könnte man sie etwa beim Nachbarn borgen. In all diesen Fällen, in denen ein Zwischenzustand eines Rezeptes normalerweise durch eine bestimmte Handlung hergestellt wird, ist es nützlich, diesen Zusammenhang zu erwähnen. Dies soll durch einen Verbindungspfeil geschehen, welcher „normalerweise-hergestellt-durch" (abgekürzt: nhd) genannt werden soll. Die nhd-Verbindung verknüpft einen Zwischenzustand mit dem Rezept für die Handlung, durch welche dieser Zwischenzustand normalerweise hergestellt wird. In gewissen Fällen ist die Beschreibung von Handlungen durch eine Sequenz von Zuständen nicht ohne weiteres möglich. Die semantische Repräsentation und das Verstehen von Sätzen wie: Wir bewegen uns zu schnell; ich kann jetzt nicht anhalten. oder Da der Ball stillstand, mußte der Junge ihn holen gehen, sind nur dann adäquat möglich, wenn ein Begriff für „bewegen" zur Verfügung steht. Dieser Begriff kann nicht auf die beiden Zustände Zunächst ist ein Objekt A an einem Ort Β und dann ist das Objekt A an einem Ort C wobei Β und C verschiedene Orte sind reduziert werden; denn damit hätten die beiden Ereignisse: Α bewegt sich von Β nach C. und Α bewegt sich nicht, Β entfernt sich von Α und C bewegt sich auf Α hin. die gleiche Repräsentation.
188
Die Struktur von Rezepten
Cercone & Schubert ( 1 9 7 5 ) , deren semantisches System ebenfalls auf Zustandsbeschreibungen basiert, definieren einfache Ereignisse wie beispielsweise „bewegen" als Zustände. Für diese Annahme geben sie die folgende Rechtfertigung: Bei einer primitiven Handlung sensu Schänk „kann von einem Nomen gesagt werden, daß es zu einem bestimmten Zeitpunkt etwas tut. . . . Eine Betrachtung der von Schänk vorgeschlagenen Inferenzregeln zeigt, daß eine Handlung selbst keine definitive Veränderung einer Situation ausdrückt; sie beschreibt eher das Bestehen einer Situation, welche auf eine Veränderung hin ausgerichtet ist, und tatsächliche Veränderungen müssen daraus inferiert werden (Cercone & Schubert, p. 8 6 ) " . Ein anderer Hinweis, der in die gleiche Richtung zielt, ergibt sich aus der Analyse von anderen Begriffen, die eindeutig Zustände sind. Ein solcher Begriff ist etwa „Temperatur": Die Temperatur eines Objektes hat zur Folge, daß dessen Umgebung sich an die Temperatur des Objektes anpaßt. „Warm sein" und „wärmen" beschreiben damit zwei verschiedene Aspekte des gleichen Ereignisses. Gleichermaßen hat die Bewegung eines Objektes zur Folge, daß dieses Objekt seinen Ort verändert. Ich sehe nun keinen Grund, zwischen diesen beiden Arten von Folgen oder Wirkungen einen grundsätzlichen Unterschied zu machen, und damit besteht auch kein Anlaß, die Begriffe „Temperatur" und „Bewegung" in zwei verschiedene Klassen von Begriffen zu ordnen. Definiert man in Anlehnung an Cercone & Schubert „Bewegung" als einen Zustand, dann stellt sich die Frage, was man dabei gewinnt, wenn man auf die Unterscheidung zwischen Zuständen und Handlungen verzichtet. Nun, streng genommen findet sich diese Unterscheidung auch in den hier beschriebenen Strukturen; denn die Rezepte selbst sind ja Beschreibungen von Handlungen. Der Unterschied zwischen dem hier vertretenen Modell, welches auf Zustandsbeschreibungen basiert, und anderen, auf Handlungen basierenden Modellen besteht darin, daß komplexe Handlungen hier nicht als eine Reihe von Teilhandlungen sondern als eine Sequenz von Zwischenzuständen beschrieben werden. Dabei konnte für zumindest eine Zustandskategorie, nämlich „bewegen", gezeigt werden, daß sie einer sog. primitiven Handlung entspricht. Solche „dynamische Zustände" sind allerdings nur am Rande bedeutsam: Die semantische Beschreibung der komplexen Handlung „erschießen" ist hier nicht Verursachen (CAUSE), daß jemand stirbt, durch das Antreiben (PROPEL) einer Kugel aus einem Gewehr durch das Bewegen (MOVE) des Fingers zum Abzug sondern die Liste der Zwischenzustände, daß man ein Gewehr hat,
Die Syntax von Rezepten und Zustandsbeschreibungen
189
das Gewehr geladen ist, die Kugel im Körper der anderen Person ist und diese Person tot oder verletzt ist. Folgt m a n nun den nhd-Verbindungen dieser einzelnen Zwischenzustände, dann wird man auf einfachere Handlungen wie „laden", „zielen" usw. verwiesen. Folgt man nun wiederum den nhd-Verbindungen der Zwischenzustände dieser einfachen Handlungen, dann stößt man früher oder später auf den primitiven Begriff „bewegen". Dies wird jedoch nur dann geschehen, wenn die komplexe Handlung „erschießen" bis ins letzte Detail analysiert wird; man kann annehmen, daß bei alltäglichen Verstehensprozessen eine solche detaillierte Analyse nur selten durchgeführt wird. Der hauptsächliche Vorteil einer auf Zustandsbeschreibungen basierenden Repräsentation besteht also vor allem in den schon weiter oben erwähnten Punkten, daß diese Repräsentation flexibler ist, und daß Inferenzen leichter Zustandsbeschreibungen zugeordnet werden können als Repräsentationen von Handlungen.
3. Die Syntax von Rezepten und Zustandsbeschreibungen Abb. 31 zeigt die beiden Rezepte für „essen" und für „Spaghettiessen" sowie deren Verbindungen. Die beiden Rezepte sind jeweils durch unterbrochene Linien eingerahmt; alle Elemente außerhalb dieser beiden Rahmen bilden nicht Teile eines der beiden Rezepte. In dieser, wie auch in den folgenden Abbildungen von Rezepten wird folgende Notation verwendet: Rezepte und Instanziierungen von Rezepten (s. u.) sind in eckige Klammern gesetzt. Runde Klammern haben keine festen Bedeutungen; sie werden immer dann gesetzt, wenn der eingeklammerte Ausdruck als Einheit zu betrachten ist, und dieser Zusammenhang ohne das Setzen der Klammer nicht ohne weiteres ersichtlich wäre. Bezeichnungen für Zustände, Konjunktionen und die in der Liste der Rollen aufgeführten Aktanten werden in Großbuchstaben, alle anderen Bezeichnungen werden in Kleinbuchstaben geschrieben. Sind mehrere Elemente durch Konjunktionen miteinander verbunden, dann wird die Konjunktion vor die Liste dieser Elemente gesetzt und diese Liste wird zusammen mit der Konjunktion in runde Klammern gesetzt. Verwendete Konjunktionen sind UND, ODER (Disjunktion) und UND/ODER.
190
Die S t r u k t u r von Rezepten
Abb. 31: Rezepte für „essen" und „Spaghetti-essen"
Rollen: ESSER NAHRUNG Voraussetzung: POSS ESSER N A H R U N G W Korpus: LOC IN NAHRUNG (Mund von ESSER) W
nhd
LOC IN NAHRUNG (Magen von ESSER) W nhd I.H. R.: G E F U E H L HUNGER ESSER F ] (ODER [* •[kauen . . .] • [schlucken . . .]
[Spaghetti-essen'
[*
*ESSER »NAHRUNG [Spargel-essen. . .] »ESSER »NAHRUNG
»ESSER
»NAHRUNG
Rollen: S-ESSER SPAGHETTI GABEL L O E F F E L Voraussetzungen: POSS S-ESSER SPAGHETTI W (ODER SUP SPAGHETTI Spaghetti W (UND/ODER KONSISTENZ SPAGHETTI weich W FORM SPAGHETTI Spaghetti ähnlich)) POSS S-ESSER GABEL POSS S-ESSER L O E F F E L Korpus: LOC HALTEN (linke Hand von S-ESSER) L O E F F E L W LOC HALTEN (rechte Hand von S-ESSER) GABEL W LOC IN (Zinken von Gabel) SPAGHETTI W nhd 1 • [stechen . . .] LOC AUF GABEL L O E F F E L W LOC UMGEBEN SPAGHETTI GABEL W nhd I -•[drehen. LOC IN SPAGHETTI (Mund von S-ESSER) W I.H. R.: *]
Zustandsbeschreibungen bestehen aus den folgenden vier Gliedern: 1. Die Zustandskategone: Diese ermöglicht eine grobe Klassifizierung der Zustände in eine begrenzte Zahl sich gegenseitig ausschließender Klassen. Wichtige Zustandskategorien sind POSS (zur Bezeichnung von Eigentums- und Verfügbarkeitsbeziehungen), GEFUEHL, WISSEN, INTENDIEREN, LOC (zur Bezeichnung von lokalen Beziehungen), sowie eine Reihe von „physikalischen" Kategorien wie FARBE, TEMPERATUR,
Die Struktur des episodischen Gedächtnisses
191
GROESSE, usw. Das Wort „physikalisch" ist darum in Anführungszeichen gesetzt worden, weil durch die Zustandsbeschreibungen ja nicht die physikalischen Eigenschaften von Objekten beschrieben werden sollen sondern die Repräsentation dieser Eigenschaften im LZG. 2. Die Spezifikation der Zustandskategorie: Für einige Zustandskategorien ist es nützlich, sie weiter zu spezifizieren, da unter der Kategorie verschiedene Arten von Beziehungen subsumiert werden. Die Kategorie LOC hat etwa die Spezifikationen IN, A U F , DISTANZ usw., die Kategorie G E F U E H L hat u. a. die Spezifikationen HÜNGER, DURST, ANGST. Andere Zustandskategorien, wie WISSEN, INTENDIEREN oder TEMPERATUR sind eindeutig und müssen deshalb nicht weiter spezifiziert werden. 3. Die Aktanten: Jede Zustandsbeschreibung hat einen oder mehrere Aktanten. Dabei handelt es sich um die Personen oder Objekte die von dem neu beschriebenen Zustand betroffen sind. Dabei kann es sich um die Aktanten des Rezeptes oder um irgendwelche Begriffe handeln. Bei den Zustandskategorien INTENDIEREN und WISSEN bezeichnet der erste Aktant eine Person und der zweite Aktant einen Zustand oder eine Handlung. 4. Der Wert des Zustandes: Dabei kann es sich um den Wert wahr (W) oder falsch ( F ) oder aber um einen numerischen Wert handeln. Die Skala, in welcher der Wert angegeben wird, hängt dabei von der Zustandskategorie und der Spezifizierung ab. Wird beispielsweise die Zustandskategorie LOC durch IN oder A U F spezifiziert, dann ist der Wert W oder F ; wird sie durch DISTANZ spezifiziert, dann ist der Wert ein Längenmaß. Ist bei einer Zustandsbeschreibung kein Wert angegeben, dann handelt es sich bei dem ausgelassenen Wert um W.
4 . Die Struktur des episodischen Gedächtnisses Benötigt das System während eines Lern- oder Verstehensprozesses die in einem Rezept enthaltenen Wissensinhalte, dann wird dieses Rezept aktiviert. Weiter unten sollen Regeln dafür formuliert werden, unter welchen Umständen ein Rezept aktiviert wird. In Anlehnung an ältere Gedächtnismodelle beispielsweise von Feigenbaum ( 1 9 7 0 ) oder von Reitman ( 1 9 7 0 ) kann man die Aktivierung eines Rezeptes als einen Transferprozeß betrachten, bei dem Ausschnitte aus dem LZG in eine Art Arbeitsgedächtnis übertragen werden.
192
Die Struktur von Rezepten
Eine adäquate Beschreibung der Aktivierung von Rezepten setzt jedoch voraus, daß vorher konkrete Vorstellungen über die Repräsentation von Handlungen entwickelt wurden. Dabei soll im weiteren die von Tulving (1972) beschriebene Unterscheidung zwischen semantischem und episodischem Gedächtnis übernommen werden. Das episodische Gedächtnis setzt sich aus Spuren einzelner Ereignisse zusammen, wie ζ. B., daß das Mittagessen gestern versalzen war, oder daß Hans, als er jung war, einen roten Hund besaß. Im semantischen Gedächtnis sind andererseits alle diejenigen Wissensinhalte gespeichert, die entweder a priori sind, oder die von den einzelnen Erlebnissen und Wahrnehmungen abstrahieren. Dazu gehört etwa das Wissen, daß Kühe vier Beine haben, daß sie braun, schwarz oder gescheckt sind, daß sie um so mehr Milch geben, je größer ihre Halsglocke ist. Nicht nur die Inhalte des episodischen, sondern auch diejenigen des semantischen Gedächtnisses variieren von Person zu Person. Der Unterscheidung zwischen semantischem und episodischem Gedächtnis entspricht die Gliederung der Begriffe in „type"- und „token"-Knoten bei den in Kap. III beschriebenen semantischen Netzwerken oder in Primär- und Sekundär-Knoten in dem Modell von Norman & Rumelhart (1975). Schänk postulierte, „die Unterscheidung zwischen semantischem und episodischem Gedächtnis ist falsch", und versuchte dies mit dem folgenden Argument zu belegen: „Verändern wir das semantische Gedächtnis, in dem wir es vom lexikalischen Gedächtnis abtrennen, dann verbleiben eine Reihe von Assoziationen und andere Relationen zwischen Begriffen, die nur durch eigene Erfahrungen erworben sein können. Wir postulieren deshalb, daß das begriffliche Gedächtnis episodischer Natur ist." (Übersetzt aus Schänk, 1974b,p. 3). Dieses Argument beruht zunächst einmal auf der falschen Annahme, alles inhaltliche Wissen sei empirisch. Ein starkes Argument gegen diese Annahme bildet die von Kant (1781) geleistete Analyse der synthetischen a posteriori Raum und Zeit. Im weiteren ist Schank's Argumentation in bezug auf die von Tulving gemachte Unterscheidung irrelevant; denn Tulving schreibt explizit, daß sowohl das semantische als auch das episodische Gedächtnis „Informationen von den Wahrnehmungssystemen empfangen" (Tulving, 1972, p. 385). Drittens läßt Schänk außer acht, daß auch in dem von ihm befürworteten Gedächtnismodell von Rieger (1974) zwischen Begriffen und Instanzen von Begriffen („tokens") und damit zwischen semantischem und episodischem Gedächtnis unterschieden wird. Ereignisse können im episodischen Gedächtnis auf zwei verschiedene Arten repräsentiert sein. Die Entscheidung, welche dieser beiden Arten man zur Repräsentation eines Ereignisses wählt, hängt von der
Die Struktur des episodischen Gedächtnisses
193
Detailliertheit ab, mit der das Ereignis geschildert, bzw. wahrgenommen wird. Wenn eine Handlung lediglich erwähnt wird, dann baut das System eine sog. Rezept-Nennung auf. Eine Rezept-Nennung ist ein Knoten und besteht aus Verbindungspfeilen zum entsprechenden Rezept, zu den Knoten für die Aktanten, die an dem Ereignis beteiligt sind, und möglicherweise zu den Repräsentationen für Ereignisse und Zustände, die den Kontext der Handlung bilden. Solange ein Ereignis lediglich erwähnt wird und solange zur Integrierung dieses Ereignisses in das episodische Gedächtnis keine komplexen Inferenzen notwendig sind, ist diese ökonomische Art der Repräsentation ausreichend. Sobald jedoch eine tiefere Analyse des Ereignisses notwendig wird, müssen auch dessen einzelne Zwischenzustände und die den nhd-Verbindungen zugeordneten Ereignisse repräsentiert werden. Diese, ausführlichere Repräsentation eines Ereignisses im episodischen Gedächtnis soll im folgenden als Retusche bezeichnet werden. Eine Retusche ist eine Kopie eines Rezeptes, die gegenüber dem Original, d. h. dem Rezept, in drei Punkten abweicht: Erstens stehen an Stelle der Bezeichnungen für die Aktanten Verbindungspfeile zu den Knoten, welche die Rollenträger in dem beschriebenen Ereignis repräsentieren. Zweitens enthält eine Retusche die Beschreibungen all derjenigen Merkmale des Ereignisses, die nicht in dem entsprechenden Rezept beschrieben sind. Drittens fehlt in der Retusche die Liste der Voraussetzungen. In den Abbildungen dieses und der folgenden Kapitel soll für die Darstellung von Verbindungspfeilen folgende Notation verwendet werden: Alle Verbindungen werden mittels durchgezogener Linien mit einer Pfeilspitze repräsentiert. Das Pfeilende ist der Ursprung und die Spitze ist der Endpunkt der Verbindung. Hat eine Verbindung ihren Ursprung in einer Zustandsbeschreibung, dann ist der Ursprung des Pfeiles unterhalb der Bezeichnung für die Zustandskategorie. Verweist eine Verbindung auf ein Rezept oder eine Retusche, dann weist die Spitze des Pfeiles auf den Beginn dieser Struktur. Steht an Stelle eines Aktanten oder einer Zustandsbeschreibung ein Hinweis auf eine Gedächtnisstruktur, dann wird an Stelle dieses Aktanten, bzw. dieser Zustandsbeschreibung das Symbol * gesetzt. Dieses ist der Ursprung des entsprechenden Verbindungspfeiles. Die bisherigen Ausführungen zum Aufbau des episodischen Gedächtnisses sollen an folgenden Beispieldialog erläutert werden: Eingegebener Text: „Hans aß eine heiße Wurst. Er verbrannte sich seinen Mund." Frage: „Warum verbrannte er sich seinen Mund?" Antwort: „Weil die Wurst heiß war." oder „Weil er die heiße Wurst hineinsteckte."
194
Die Struktur von Rezepten
Zum Auffinden dieser Antworten benötigt das System eine Beschreibung für den Zustand, daß sich die Wurst in dem Mund von Hans befindet, und zudem muß diese Zustandsbeschreibung als eine Instanz des Zwischenzustandes LOC IN NAHRUNG (Mund von ESSER) W aus dem Rezept für „essen" erkennbar sein. Abb. 32 zeigt das Rezept für ,,essen", die nach der Analyse der beiden eingegebenen Sätze aufgebaute Retusche und die Gedächtnisknoten, welche zur Beschreibung des geschilderten Ereignisses notwendig sind. Das Rezept und die Retusche sind von unterbrochenen Linien eingerahmt. Wie Abb. 32 zeigt, können die in Abb. 31 enthaltenen Ausdrücke (Mund von ESSER) u n d (Magen von ESSER) als Abb. 32: Repräsentation der Sätze „Hans aß eine heiße Wurst. Er verbrannte sich seinen Mund." im episodischen Gedächtnis
Die Struktur des episodischen Gedächtnisses
195
Verbindungen zu Knoten betrachtet werden, die wiederum mit den entsprechenden Begriffen im semantischen Gedächtnis verbunden sind. Die Oberbegriffsrelation SUP u n d die Relation „Körperteilvon" wurden, faute die mieux, von den Modellen für semantische Netze übernommen. In Abb. 32 fehlen zwei Verbindungen, die von den Ausdrücken ESSER und NAHRUNG in der Rollen-Liste des Rezeptes zu den Begriffen für „Mensch" und „Nahrungsmittel" führen. Solche Verbindungen können dazu dienen, die Menge der möglichen Objekte, welche die entsprechende Rolle einnehmen können, zu beschränken; sie hätten damit die Funktion zusätzlicher Voraussetzungen für den Ablauf der Handlung, ζ. B.: NAHRUNG muß ein Nahrungsmittel sein. Der Begriff der Rezept-Nennung kann ein Kriterium dafür liefern, welche der an der Handlung beteiligten Objekte oder Personen in die Rollen-Liste des Rezeptes aufgenommen werden sollten. In den meisten Fällen werden Ereignisse lediglich als Rezept-Nennung repräsentiert sein. In der Rollen-Liste sollten deswegen alle Aktanten genannt werden, die für die wichtigen Inferenzen über die Handlung bedeutsam sind. Inferenzen über eine Handlung sind alle diejenigen Inhalte, die man auf Grund des Wissens, daß die Handlung stattfand, erschließen kann. Wichtige solche Rückschlüsse über die Handlung „mit dem Zug fahren" sind etwa, daß der Reisende vorher an einem bestimmten Ort und nachher an einem anderen Ort war, daß er sich in einem Zug befand, usw. Es ist jedoch in der Regel unwichtig, durch welche Art von Lokomotive der Zug gezogen wurde. Aus diesem Grund sollten der Reisende, der Herkunfts- und der Zielort und der Zug in der Rollenliste erwähnt werden, die Lokomotive jedoch nicht. Die Annahme, die Retusche sei eine erweiterte Kopie des Rezeptes, ist unökonomisch, und es sind andere Repräsentationen denkbar, die weniger Speicherplatz benötigen. Eine solche ökonomischere Repräsentation könnte darin bestehen, daß in die Retusche nur diejenigen Inhalte aufgenommen werden, die das Rezept ergänzen. Bei der Entscheidung, welcher dieser beiden Repräsentationen man den Vorzug gibt, muß man im Auge behalten, daß die beiden Formalismen ohne Schwierigkeiten ineinander überführt werden können, und daß sie darum prinzipiell die gleichen Leistungen ermöglichen. Die erste der beschriebenen Repräsentationen hat gegenüber der anderen den Nachteil, daß sie mehr Speicherplatz benötigt; zugleich hat sie jedoch den Vorteil, daß für das Beantworten von Fragen weniger Zeit benötigt wird. Verfügt man beispielsweise über eine Retusche eines Ereignisses, in dem jemand Spaghetti ißt, dann kann die Frage: „Hatte er einen Löffel in der Hand?" bei der ersten Art von Repräsentation direkt auf Grund der Inhalte beantwortet werden, die in der Re-
196
Die Struktur von Rezepten
tusche enthalten sind. Bei der zweiten Art von Repräsentation wäre dazu der Rückgriff auf das entsprechende Rezept notwendig. Die Entscheidung zwischen den beiden Arten von Repräsentationen wird also davon abhängen, welche relative Wichtigkeit man den beiden Faktoren „Ökonomie in bezug auf Speicherplatz" und „Ökonomie in bezug auf Suchzeit" beimessen will. Nun ist allerdings zumindest noch eine dritte Art der Repräsentation von Retuschen denkbar, die zwar sehr kompliziert ist, sich jedoch sehr gut als den beiden anderen überlegen erweisen könnte. Bei den Retuschen dieser dritten Art würden mehrere Rezepte ganz oder in Ausschnitten ineinander amalgiert werden. Damit könnte man der Beobachtung Rechnung tragen, daß bei einzelnen Ereignissen häufig verschiedene Handlungen, die in mehreren Rezepten beschrieben sind, ineinander verworben werden.
5. Analyse von Handlungen und lexikalische Dekomposition Der Korpus des Rezeptes für „essen" beschreibt lediglich die beiden Zustände, daß sich die Nahrung im Mund des Essers und später im Magen des Essers befindet. Der letztere dieser beiden Zustände darf nicht als I.H.-R. der Handlung betrachtet werden; denn das intendierte Ziel beim Essen ist die Vermeidung von Hunger und nicht das Füllen des Bauches. Der Korpus dieses Rezeptes ist darum so spärlich, weil Art des Essens weitgehend durch die Eigenschaften der Nahrung bestimmt wird; die verschiedenen Arten des Essens haben damit nur wenige Gemeinsamkeiten. Aus demselben Grund führt die nhd-Verbindung des ersten Zwischenzustandes nicht zu einem, sondern zu einer ganzen Reihe von Rezepten. Diese beschreiben, wie die verschiedenen Arten von Nahrungen, die jeweils in der Liste der Voraussetzungen spezifiziert sind, in den Mund befördert werden. Der untere Teil von Abb. 31 zeigt eines dieser Rezepte; es beschreibt, wie man in der Schweizerischen Mittelklasse Spaghetti ißt. Die verschiedenen Zustandsbeschreibungen dieses Rezeptes, welches die gleiche Struktur wie das Rezept für „essen" hat, sollten ohne weitere Erläuterungen verständlich sein. Wenn das System, ausgehend vom Rezept für „essen", das Rezept für „Spaghetti-essen" aktiviert, dann wird auch hiervon eine Rezept-Erwähnung oder eine Retusche aufgebaut, darin werden die Rollen S - E S S E R und SPAGHETTI durch Relationen zu den beiden Knoten repräsentiert, die in der Retusche für „essen" den Rollen E S S E R und NAHRUNG zugeordnet sind. Zur Repräsentation von Zusammenhängen zwischen verschiedenen
Analyse von Handlungen und lexikalische Dekomposition
197
Rezepten und Retuschen wird in Abb. 32 und den folgenden Abbildungen folgende Notation verwendet: Jeder Hinweis auf ein Rezept wird durch eine Rezept-Nennung dargestellt. Eine solche RezeptNennung ist ein Ausdruck in eckigen Klammern, der eine Reihe von Argumenten enthält. Das erste Argument ist ein Hinweis auf das entsprechende Rezept. Ist die Beschreibung dieses Rezeptes in der Darstellung enthalten, dann wird dieser Hinweis durch das Symbol „ * " dargestellt, von dem ein Pfeil ausgeht, der zur Beschreibung dieses Rezeptes führt. Enthält die Darstellung keine Beschreibung des Rezeptes, dann besteht der Hinweis aus dem in Kleinbuchstaben geschriebenen Namen des Rezeptes. Durch die anderen Argumente der Rezept-Nennung wird bezeichnet, welche Objekte den einzelnen Aktanten des Rezeptes zugeordnet werden. Dabei ist es möglich, daß der Aktant dieses Rezeptes mit einem Aktanten eines anderen Rezeptes identisch ist. In diesem Fall enthält die Rezept-Nennung die Bezeichnung des Aktanten aus dem anderen Rezept, die durch das Symbol „ * " präfixiert wird. Werden einer oder mehrere Aktanten in einer Rezept-Nennung nicht spezifiziert, dann wird an ihrer Stelle das Symbol ,,—" gesetzt. Diese Festsetzungen der Notation sollen im folgenden am Beispiel der Rezept-Nennung * * E S S E R »NAHRUNG aus Abb. 31 dargestellt werden. Dabei handelt es sich um eine Nennung des Rezeptes für „Spaghetti-essen", und der Pfeil, der von dem ersten Stern ausgeht, führt deshalb zur Beschreibung dieses Rezeptes. Die Ausdrücke * E S S E R und *NAHRUNG bedeuten, daß die ersten beiden Aktanten im Rezept für „Spaghetti-essen", d. h. S - E S S E R und SPAGHETTI, denselben Objekten zugeordnet werden, wie die Aktanten E S S E R und NAHRUNG im Rezept für „essen". Die beiden Bindestriche bedeuten, daß der dritte und vierte Aktant im Rezept für „Spaghetti-essen", d. h. G A B E L und L Ö F F E L , in dem RezeptHinweis nicht spezifiziert werden. In gewissen Fällen wird innerhalb eines Rezeptes oder einer Retusche auf das Rezept, bzw. die Retusche selbst verwiesen. Für diese Art von Hinweisen wird das alleinstehende Symbol „ * " verwendet. Die Zwischenzustände des Rezeptes für „Spaghetti-essen" sind wiederum durch nhd-Verbindungen mit anderen Rezepten assoziiert, in denen die Handlungen „stecken" oder „drehen" beschrieben werden. Diese Handlungsbeschreibungen werden dann aktiviert, wenn die darin enthaltenen detaillierten Wissensinhalte für das Verstehen etwa einer eingegebenen Geschichte notwendig sind. Das sukzessive Fortschreiten zu mehr und mehr detaillierten Beschreibungen einer Handlung, welches durch die nhd-Verbindungen ermöglicht wird, ist jedoch nicht endlos, sondern es wird früher oder später bei Beschrei-
198
Die Struktur von Rezepten
bungen von primitiven Aktionen abbrechen. Diese primitiven Aktionen entsprechen den weiter oben erwähnten dynamischen Zuständen. Die beiden wichtigsten dieser dynamischen Zustände bezeichnen räumliche Bewegung und die Übermittlung von Informationen (bei Schänk MTRANS). Annahmen und Spekulationen über solche primitiven Aktionen sind jedoch in diesem Zusammenhang nur von sekundärer Wichtigkeit; denn es wird für das Verstehen einer beschriebenen Handlung nur in den seltensten Fällen notwendig sein, auf diese detaillierte Ebene der semantischen Beschreibung bezug zu nehmen. Unabhängig von der Frage, welche primitiven Aktionen man postulieren soll, stellt sich jedoch das Problem, inwieweit die Bedeutungen von Begriffen in einer semantischen Repräsentation aufgeschlüsselt werden sollen. Sowohl in der Linguistik, wie auch auf dem Gebiet der „künstlichen Intelligenz" fand in den vergangenen Jahren eine intensive Diskussion dieses Problemes statt. Dabei ging es um die Frage, wie „ t i e f " eine semantische Repräsentation sein soll; d. h. ob die semantischen Einheiten sprachlichen Wörtern entsprechen sollten, oder ob eine lexikalische Dekomposition der Wörter in primitivere Einheiten sinnvoll sei: Die erste dieser beiden Positionen wurde dabei hauptsächlich von Verfechtern der semantischen Netzwerke, wie ζ. B. Simmons ( 1 9 7 2 ) oder Kintsch ( 1 9 7 4 ) geltend gemacht; die konsequentesten Vertreter der zweiten Position sind Schänk ( 1 9 7 3 ) und Wilks ( 1 9 7 5 ) . Die hauptsächlichen Argumente dieser Diskussionen sind die folgenden: — eine oberflächliche Repräsentation erleichtert die Transformation natürlichsprachlicher Sätze in die semantische Struktur und vice versa; — bei einer „oberflächlichen", d. h. sprachnahen semantischen Repräsentation ist die Durchführung von Inferenzprozessen komplizierter als bei einer semantischen Repräsentation mit lexikalischer Dekomposition; — die Aufgliederung von natürlichsprachlichen Ausdrücken in eine aus Primitiva zusammengesetzte Struktur ist häufig unnötig und darum ein vermeidbarer Aufwand; — „intelligente" Anwendungen semantischer Modelle, wie ζ. B. automatische Übersetzung, Fragen-Antwort- oder Datenbanksysteme benötigen eine von den einzelnen natürlichen Sprachen unabhängige semantische Repräsentation. Das dritte und das vierte dieser Argumente beziehen sich auf technische, hauptsächlich im Bereich der Informatik bedeutsame Aspekte des Problemes und sie können deshalb in diesem Zusammenhang vernachlässigt werden. Von den verbleibenden beiden Argu-
Analyse von Handlungen und lexikalische Dekomposition
199
menten hat das erste stark an Uberzeugungskraft eingebüßt, da heute allgemein anerkannt wird, daß für die Transformation natürlichsprachlicher Sätze selbst in eine „oberflächliche" semantische Repräsentation sehr komplexe Inferenzprozesse durchgeführt werden müssen. Damit verbleibt lediglich das zweite der vier oben genannten Argumente, das jedoch auch nicht stichhaltig ist: Wenn man eine semantische Repräsentation daraufhin konzipiert, daß die Durchführung von Inferenzprozessen so weit wie möglich vereinfacht werden soll, dann muß diese Repräsentation nicht notwendigerweise eine Struktur von Primitiva sein. Dies zeigt sich etwa beim Vergleich von möglichen Repräsentationen der Bedeutung des Verbes „warten". Abb. 33: Repräsentation des Verbes „warten" in der konzeptuellen Dependenztheorie (nach Schänk, 1973a, p. 68)
• CONC < -
Ο PTRANS
Γ Χ
PTRANS
Ο
Χ
D
L< Abb. 33 zeigt die Repräsentation dieses Verbes in dem System von Schänk. Die Darstellung könnte etwa wie folgt paraphrasiert werden: Eine Person X, der Wartende, denkt sich (CONC), daß eine andere Person Y sich zu ihr hinbewegt (PTRANS). Dies ist für X ein Grund, nicht sich selbst zu bewegen. Schänk reduziert hier also die Bedeutung des Verbes „ w a r t e n " auf den Zustand, in dem man auf die A n k u n f t eines sich selbst bewegenden Objektes wartet. Doch selbst abgesehen von dieser inhaltlichen Reduzierung der Bedeutung, für die Schänk keine Begründung gibt, ist die von ihm gegebene Repräsentation für die Durchführung von Inferenzprozessen ungeeignet. Eine wichtige Inferenz des Zustandes „warten" ist beispielsweise, daß die wartende Person nicht intendiert und häufig auch nicht die Möglichkeit hat, das erwartete Ereignis selbst herzustellen. Eine zwei-
200
Die Struktur von Rezepten
te wichtige Inferenz von „warten" ist, daß die wartende Person den Vollzug einer Handlung intendiert, für die das erwartete Ereignis eine Voraussetzung bildet. Diese Inferenzen sind jedoch nicht Teil der in Abb. 33. gezeigten Repräsentation, und sie müssen deshalb auf irgendeine Weise der semantischen Beschreibung des Verbes zugeordnet werden. In Anbetracht dessen scheint es einfacher, einen Knoten für den Begriff „warten" einzuführen und diesem Knoten alle Inferenzen, die mit diesem Zustand verbunden sind, zuzuordnen. Die Informationen, welche in dem in Abb. 33 gezeigten Graph beschrieben sind, könnten dann Teil dieser Inferenzen bilden (nach meinem Verstehen der Bedeutung des Verbes „warten", wäre das Denken (CONC) an das erwartete Ereignis allerdings nicht Teil der Bedeutung). Die dem Knoten für „warten" zugeordneten Inferenzen können in der Form von Regeln formuliert werden, die beim Sprachverstehen oder dem Vollzug anderer kognitiver Prozesse ablaufen. Eine dieser Regeln ist etwa die folgende: Wenn eine Person wartet und du möchtest wissen, worauf sie wartet, dann suche nach einem aktivierten Rezept, in dem die Person der Aktor des I.H.-R. ist. Enthält dieses Rezept einen Zwischenzustand, der normalerweise nicht durch den Aktor des I.H.-R. hergestellt wird, dann könnte es sich dabei um den Zustand handeln, auf dessen Realisierung die Person wartet. In den folgenden Abschnitten 6 bis 10 sollen fünf weitere Verbindungen zwischen Rezepten, zwischen Retuschen und zwischen Rezepten und Retuschen beschrieben werden, die für die Durchführung der im folgenden Kapitel beschriebenen Inferenzprozesse notwendig sind. 6. Die „normalerweise hergestellt für"-Verbindung (nhf) Diese Verbindung ist das Gegenstück zur nhd-Verbindung. Sie verknüpft ein Rezept mit dem Zwischenzustand eines anderen Rezeptes, der normalerweise durch die in dem ersten Rezept beschriebene Handlung produziert wird. Wenn ein Rezept Α durch eine nhf-Verbindung mit einem Zwischenzustand eines Rezeptes Β verknüpft ist, dann bildet Α eine Teilhandlung von B. So existiert beispielsweise eine nhf-Verbindung von dem Rezept für „Spaghetti-essen" zu dem ersten Zwischenzustand des Rezeptes für „essen". Dies kann so interpretiert werden, daß die im Rezept für „Spaghetti-essen" beschriebene Handlung eine der Möglichkeiten bildet, den Zustand zu produzieren, daß sich die Nahrung im Mund des Essers befindet. J e d e nhf-Verbindung besteht aus drei Teilen: die Angabe des Rezeptes, auf welches hingewiesen wird, die Angabe des Zwischenzu-
Die ,,aktant-in"-Verbindung (ai)
201
standes, welcher durch die Teilhandlung hergestellt wird, und Angaben über die Zuordnung der Aktanten der beiden Rezepte. Es kann angenommen werden, es bestehe ein Rezept für die Handlung „ein Billet kaufen" mit den Rollen: K Ä U F E R V E R K Ä U F E R B I L L E T P R E I S GEGENWERT Eine der nhf-Verbindungen dieses Rezeptes führe zu dem Zwischenzustand POSS R E I S E N D E R F A H R K A R T E ( R E I S E N D E R * GEBÜHR) W in dem Rezept für „Eisenbahnfahren" (siehe Abb. 36). Dieses Rezept habe die folgenden sieben Rollen: R E I S E N D E R ZUG EISENBAHNGESELLSCHAFT VON ZU FAHRKARTE GEBÜHR Der erwähnten nhf-Verbindung wäre in diesem Falle die Liste K Ä U F E R - V E R K Ä U F E R - - B I L L E T PREIS zugeordnet. Dies kann so interpretiert werden, daß der erste, dritte, sechste und siebente Aktant in der Rollenliste des Rezeptes für „Eisenbahnfahren", d . h . die Rollen R E I S E N D E R EISENBAHNGESELLSCHAFT FAHRKARTE GEBÜHR dieselben Objekte bezeichnen wie die Aktanten K Ä U F E R V E R K Ä U F E R B I L L E T PREIS in dem Rezept für „ein Billet kaufen". Eine entsprechende nhd-Verbindung führt von dem Rezept für „Eisenbahnfahren" zu dem Rezept für „ein Billet kaufen". Bei dieser Verbindung geschieht die Zuordnung der Aktanten beider Rezepte durch die weiter oben besprochene Rezept-Nennung. 7. Die ,,aktant-in"-Verbindung (ai) Diese Verbindung verknüpft nominale Knoten, d. h. Knoten, die Objekte oder Klassen von Objekten repräsentieren, mit Rezepten, in denen diese Begriffe als Aktanten fungieren. Der Knoten für „Eisenbahnzug" hat beispielsweise eine ai-Verbindung zum Rezept für „Eisenbahnfahren" in diesem Rezept die Rolle von ZUG einnimmt. Die ai-Verbindungen spielen eine wichtige Rolle bei der Aktivierung von Rezepten und bei der Desambiguierung mehrdeutiger Wörter. Enthält ein zu analysierender Text etwa das mehrdeutige Wort „Zug", dann muß vom Leser entschieden werden, ob es sich um einen Eisenbahnzug, einen Luftzug, einen Zug in einem Spiel, einen Charakterzug, usw. handelt. Von jedem dieser Begriffe führen ai-Verbindungen zu verschiedenen Handlungsrezepten. Das Wort „Zug" wird sich in der
202
Die Struktur von Rezepten
Regel auf denjenigen Begriff beziehen, von dem eine ai-Verbindung z u einem aktivierten Rezept führt. Ist also das R e z e p t für „Schachspielen" aktiviert, dann wird das Wort „ Z u g " als „ Z u g im S p i e l " , ist j e d o c h das R e z e p t für „Eisenbahnfahren" aktiviert, dann wird es als „ E i s e n b a h n z u g " interpretiert werden. Führt j e d o c h keine der ai-Verbindungen, die von diesen Begriffen ausgehen, zu einem aktivierten Rezept, dann wird die Suche auch auf diejenigen Rezepte ausgedehnt werden, die mit den aktivierten Rezepten verbunden sind. Ist diese Suche erfolgreich, dann wird das mit dem aktivierten R e z e p t verbundene R e z e p t ebenfalls aktiviert werden. Eine genauere Beschreibung der Mechanismen, nach denen diese S u c h e abläuft, wird im folgenden Kapitel gegeben werden.
8. Die Begründungs-Verbindung (Grund) Mit Hilfe dieser Verbindung k a n n bestimmt werden, warum die Realisierung einzelner Voraussetzungen oder Zwischenzustände für den V o l l z u g einer Handlung n o t w e n d i g ist. Die Begründungs-Verbindung verknüpft eine Voraussetzung oder einen Zwischenzustand mit einem Rezept, in dem auf einer allgemeinen Ebene die Gründe beschrieben werden, warum dieser Zustand produziert werden muß. Der G r u n d , warum man beispielsweise für eine Fahrt mit der Eisenbahn eine Fahrkarte benötigt, besteht darin, daß es sich bei dieser Handlung, betrachtet man sie vom Gesichtspunkt der Eisenbahngesellschaft aus, um eine A r t von Geschäftstätigkeit handelt: der Reisende bezahlt eine bestimmte Summe und erhält als Gegenwert dafür das R e c h t , auf einer bestimmten Strecke mit der Eisenbahn zu reisen. Eine detaillierte Beschreibung des Rezeptes für „ G e s c h ä f t s l e b e n " , u n d darüber, wie auf dieses R e z e p t über eine Begründungsverbindung bezug genommen wird, findet sich im letzten Abschnitt des folgenden Kapitels. Ein anderes Beispiel, bei d e m die V e r w e n d u n g der BegründungsVerbindung sinnvoll ist, bildet das Signalisieren der R i c h t u n g beim A u t o f a h r e n . Das Rezept für „ A u t o f a h r e n " enthält einen Zwischenzustand von der A r t S I G N A L I S I E R E N F A H R E R abbiegen ( F A H R E R ) W Dieser Zustandsbeschreibung folgt eine Beschreibung der Prozesse, die beim Abbiegen ablaufen. Die Bedeutung des Signalisierens der Fahrtrichtung innerhalb des Handlungszusammenhanges ist vollständig erst dann verstanden w o r d e n , wenn man inferieren k a n n , daß diese Teilhandlung bei A b w e s e n h e i t anderer Verkehrsteilnehmer nicht notwendig ist. Eine solche Inferenz ist möglich, wenn der oben
203
Die Begründungs-Verbindung (Grund)
beschriebene Zwischenzustand durch eine Begründungs-Verbindung mit dem Rezept für „kommunizieren" verknüpft ist. Dieses Rezept enthält fünf Rollen: SENDER EMPFÄNGER MITTEILUNG ZEICHEN MOTIV Abb. 34: Wie im Straßenverkehr durch Richtungsangaben Kollisionen verhindert werden können autofahren Rollen: FAHRER AUTO VON ZU Korpus: SIGNALISIEREN FAHRER
Grund
abbiegen Fahrer .
"FAHRER Verkehrsteilnehmer
* SIGNAL
_± INTENDIEREN »FAHRER NICHT
* l
If kollidieren * FAHRER Verkehrsteilnehmer J
1
I kommunizieren I Rollen:
SENDER EMPFÄNGER MITTEILUNG ZEICHEN MOTIV
1 1
Die vom Zwischenzustand SIGNALISIEREN ausgehende Begründungs-Verbindung führt zu einer Nennung des Rezeptes für „kommunizieren"; die Argumente dieser Rezept-Nennung geben an, daß es sich beim SENDER um den Aktant FAHRER des Rezeptes für „aut o f a h r e n " und beim EMPFÄNGER um potentielle Verkehrsteilnehmer handelt; die MITTEILUNG ist das abbiegen, das SIGNAL das SIGNALISIEREN durch den FAHRER u n d das MOTIV das Verhindern einer Kollision. Abb. 34 zeigt eine formale Repräsentation dieser Zusammenhänge. Um eine bessere Übersichtlichkeit der Darstellung zu erreichen, wurden Rezepte und Rezept-Nennungen nicht in eckige Klammern, sondern in durch unterbrochene Linien gezeichnete Rahmen gesetzt. Im übrigen entspricht die in Abb. 34 verwendete Notation derjenigen von Abb. 32 Zusammen mit einer Reihe von Inferenzregeln erlauben diese Wissensinhalte die sinnvolle Verknüpfung von Satzpaaren wie: Hans signalisierte nicht, daß er nach links abbog.
204
Die Struktur von Rezepten
Er stieß mit einem anderen Auto zusammen, oder Hans vergaß, den Richtungsblinker abzustellen. Der Fahrer hinter ihm wurde unruhig. Zur Verbindung des Satzpaares Hans signalisierte nicht, daß er abbog. Er erhielt einen Strafzettel müßten andere Wissensinhalte herangezogen werden; in diesem Beispiel könnte dies eine Begründungs-Verbindung zu einem Rezept sein, in dem die Übertretung von Gesetzen und die daraus resultierenden Konsequenzen beschrieben werden. Es ist somit möglich, daß von einem Zwischenzustand mehr als eine Begründungs-Verbindung ausgeht. Andererseits gibt es Prärequisite oder Zwischenzustände, denen keine Begründungs-Verbindung zugeordnet ist; dies ist immer dann der Fall, wenn der Grund, warum dieser Zwischenzustand produziert werden muß, nicht bekannt ist, oder wenn dessen Notwendigkeit sich aus späteren Zwischenzuständen ergibt. Ein Beispiel für den ersten dieser beiden Fälle bildet das Binden der Schnürsenkel: Hier weiß man in der Regel nicht, warum die einzelnen Zwischenzustände produziert werden müssen; man weiß lediglich, daß die sukzessive Herstellung der einzelnen Zwischenzustände der einzig bekannte Weg dazu ist, den gewünschten Knoten zu produzieren. Ein Beispiel für den zweiten Fall, bei dem die Notwendigkeit eines Zustandes aus späteren Zuständen des Rezeptes ersichtlich ist, bildet der Zwischenzustand LOC HALTEN (rechte Hand von S - E S S E R ) G A B E L W in dem Rezept für „Spaghetti-essen". Die Notwendigkeit dieses Zustandes ergibt sich aus dem folgenden Zustand LOC IN (Zinken von Gabel) SPAGHETTI W dessen Realisierung voraussetzt, daß man die Gabel in der Hand hält. Gleichermaßen ist dieser Zustand wiederum eine Voraussetzung für die Herstellung des folgenden Zustandes: LOC UMGEBEN SPAGHETTI G A B E L W Anders verhält es sich bei den weiter oben besprochenen Beispielen, in denen die Begründung für den Kauf einer Fahrkarte oder des Signalisierens einer Richtungsänderung analysiert wurde; denn es ist prinzipiell möglich, ohne Fahrkarte Eisenbahn zu fahren oder ohne Signalisieren die Fahrtrichtung zu ändern. Diese Zwischenzustände werden darum produziert, weil sie zugleich Zustände von anderen Handlungsrezepten sind, und der Grund, warum sie notwendig sind, kann nur unter Rekurs auf diese anderen Rezepte bestimmt werden. Die Begründungs-Verbindung muß damit zwei Arten von Informationen enthalten: ein Hinweis auf das Rezept, auf das sie sich bezieht,
Ursache und Folge
205
und ein Hinweis darauf, welche Proposition dieses Rezeptes dem Zwischenzustand entspricht, dessen Begründung gegeben wird. Das I.H.R. des Rezeptes, auf das die Begründungs-Verbindung verweist, kann dann als der Grund dafür betrachtet werden, daß der Zwischenzustand produziert werden muß: Der Erwerb des Fahrpreises durch die Eisenbahngesellschaft ist der Grund, daß man beim Eisenbahnfahren eine Fahrkarte besitzen muß, und das Vermeiden von Unfällen ist der Grund, warum man beim Autofahren eine Richtungsänderung anzeigt. Die Begründungs-Verbindung ist also nicht nur eine unspezifische Assoziation, durch die zwei Rezepte miteinander verbunden werden, sondern sie kann für die Formulierung spezifischer Inferenzregeln gebraucht werden. Zwei dieser Regeln sind: Wenn eine Person einen Zwischenzustand produziert hat, dann intendiert sie das I.H.-R. des Rezeptes, auf welches die Begründungs-Verbindung hinweist, die von diesem Zwischenzustand aysgeht. und Das Herstellen eines Zwischenzustandes ist sinnlos, d. h. es trägt nicht zum Erreichen des I.H.-R. der Handlung bei, wenn die Begründungs-Verbindung dieses Zustandes auf ein anderes Rezept verweist, bei dem eine oder mehrere der Voraussetzungen nicht zutreffen. Die Anwendung dieser beiden Regeln kann am Beispiel der Richtungsanzeige beim Autofahren demonstriert werden: Das I.H.-R. des Rezeptes für „kommunizieren" beschreibt, daß der EMPFÄNGER die MITTEILUNG kennt. Weiter enthält dieses Rezept die Voraussetzung, daß der EMPFÄNGER fähig ist, das SIGNAL wahrzunehmen. Die erste der beiden oben erwähnten Inferenzregeln erlaubt damit den Schluß, daß der SENDER, d. h. der FAHRER, intendiert, daß der EMPFÄNGER weiß, daß er seine Richtung ändern will. Für den Fall, daß der EMPFÄNGER aus irgend einem Grunde nicht in der Lage ist, das SIGNAL wahrzunehmen, ist die Richtungsanzeige sinnlos.
9. Ursache und Folge Diese beiden Verbindungen werden hauptsächlich bei der Repräsentation von Ereignisketten im episodischen Gedächtnis verwendet. Sie verknüpfen durch kausale Relationen miteinander verbundene Retuschen und Rezept-Nennungen und werden während der Analyse von Texten oder wahrgenommenen Ereignissen aufgebaut. Man kann annehmen, daß die wichtigste Leistung beim Verstehen von fort-
206
Die Struktur von Rezepten
laufenden Texten der Aufbau von solchen kausalen Verbindungen bildet.
10. Die „während"-Verbindung Ist ein Zustand einmal hergestellt, dann wird er in der Regel so lange andauern, bis er durch ein neues Ereignis modifiziert wird. So ist etwa die Dauer einer lokalen Beziehung unbegrenzt, wenn sie nicht durch eine Handlung aufgehoben wird. Eine Reihe von Zuständen verhalten sich jedoch anders: Der Zustand GEFÜHL HUNGER Zustandsaktor FALSCH dauert nur an, wenn der Zustandsaktor von Zeit zu Zeit ißt, und der Zustand T E M P E R A T U R Objekt HEISS bleibt nur dann bestehen, wenn das Objekt einem Ereignis wie „heizen", „schnelle Bewegung" usw. ausgesetzt ist. Die Handlungen, die für das Aufrechterhalten eines Zustandes notwendig sind, werden diesem Zustand durch eine „während"-Verbindung zugeordnet. Zwischen der „während"- und der nhd-Verbindung besteht ein klarer logischer Unterschied: Die nhd-Verbindung führt zu dem Rezept, das für das Aufrechterhalten des Zustandes notwendig ist. So hätte etwa der Zustand F A R B E (eines künstlichen Objektes) eine nhd-Verbindung zum Rezept für „anmalen" und eine „während"-Verbindung zum Rezept für „reinigen". Bei einer Reihe von Zuständen werden diese beiden Verbindungen jedoch zu demselben Rezept führen: Die Abwesenheit von Hunger wird beispielsweise sowohl durch die Handlung „essen" hergestellt, als auch durch diese Handlung aufrechterhalten.
VIII. DIE BEDEUTUNG VON REZEPTEN UND RETUSCHEN BEI INFERENZ- UND VERSTEHENSPROZESSEN
1. Inferenzregeln Um eingegebene Sätze sinnvoll zueinander in Beziehung zu setzen, benötigt das System eine Reihe von allgemeinen Regeln. Einige dieser Regeln sollen im folgenden näher beschrieben werden. Mit Hilfe der ersten Art von Regeln kann entschieden werden, warum die in dem Text genannten Handlungen und Zustände hergestellt worden sind. Diese Art von Inferenzen wird durch die Anwendung der Regeln (R2) bis (R5) u n d der Regel (RIO) vollzogen. Durch eine zweite Art von Inferenzen soll bestimmt werden, auf welche Weise die Zwischenzustände einer Handlung hergestellt worden sind oder sein könnten. Diese Inferenzen werden durch die Regeln (R6) und (R7) beschrieben. Durch eine dritte Art von Inferenzen können Voraussagen darüber gemacht werden, welche Konsequenzen die einzelnen Zustände und Handlungen für das weitere Geschehen haben können. Diese Inferenzen werden durch die Regeln ( R l ) , (R8) und (R9) beschrieben. ( R l ) W e n n in einem eingegebenen Satz eine Handlung genannt wird, dann bestimme das intendierte Haupt-Resultat dieser Handlung und führe (R2) durch. (R2) Enthält ein eingegebener Satz eine Zustandsbeschreibung (ZB) oder wird eine solche durch ( R l ) inferiert, dann suche in den aktiven Retuschen nach einem Zwischenzustand (ZZ), welcher mit ZB völlig oder teilweise übereinstimmt. Kann ein solcher Zwischenzustand gefunden werden, dann stifte eine Verbindung zwischen ZZ u n d dem Knoten, welcher die eingegebene Geschichte repräsentiert. Wenn ZB neue Informationen über die Aktanten der beschriebenen Handlung enthält, dann korrigiere und spezifiere die Verbindungen zwischen der Retusche und den Gedächtnisknoten für diese Aktanten. Wenn jedoch kein ZZ gefunden werden kann, der mit ZB ganz oder teilweise übereinstimmt, dann expandiere die Rezept-Nennungen, die während der bisherigen Analyse der Geschichte aufgebaut wurden, zu Retuschen und wende (R2) auf diese Retuschen an. Bei der Anwendung dieser Regel werden eine Reihe von komple-
208
Rezepte und Retuschen bei Inferenz- u n d Verstehensprozessen
xen Prozessen durchgeführt, welche zum Aufbau des episodischen Wissens beitragen. Ein sehr wichtiges Problem stellt dabei die Entscheidung, bei welchem Grad von Übereinstimmung eine eingegebene Zustandsbeschreibung als Instanz von einem Zwischenzustand eines Rezeptes betrachtet werden darf. Am häufigsten können solche teilweisen Ubereinstimmungen dann beobachtet werden, wenn die Informationen in einer der beiden Zustandsbeschreibungen spezifischer sind als bei der anderen. Ein Beispiel hierfür liefern die folgenden beiden Sätze: Hans f u h r mit dem Zug nach Zürich. Er bezahlte acht Franken für die Fahrkarte. Das Rezept für „Eisenbahnfahren", auf welches in Abschnitt 2 näher eingegangen wird, enthält den Zwischenzustand POSS REISENDER FAHRKARTE (*REISENDER * GEBÜHR) W In dem ersten der beiden eingegebenen Sätze werden drei Aktanten des Rezeptes für „Eisenbahnfahren" genannt: Hans, der REISENDE; Zug, der ZUG; und Zürich, das Ziel (ZU). Für diese drei Aktanten werden Gedächtnisknoten aufgebaut, und die entsprechenden Rollen in der Retusche für das beschriebene Ereignis werden mit diesen Knoten verbunden. Zudem werden beim Aufbau der Retusche auch Gedächtnisknoten für diejenigen Aktanten geschaffen, die im eingegebenen Text nicht erwähnt sind. Dabei handelt es sich um sog. „dummy"-Knoten, die aus lediglich einer Oberbegriffsverbindung zu der Klasse von Objekten bestehen, durch welche die möglichen Kandidaten für die entsprechende Rolle eingegrenzt wird (siehe hierzu Kap. VII, Abschnitt 4). In der Retusche für das beschriebene Ereignis hat damit nach der Analyse des ersten Satzes der Zwischenzustand, der dem oben erwähnten Zustand in dem Rezept entspricht, folgende Form: POSS Hans Fahrkartei (Hans * Gebührl) W Nimmt man an, daß das Pronomen „er" im zweiten Satz dem Aktanten „Hans" zugeordnet werden kann, dann erhält die Aussage dieses Satzes nach der Durchführung von (R2) folgende Repräsentation: POSS Hans Fahrkarte ( 8 Franken) W In diesem Zeitpunkt der Analyse ist noch nicht bestimmt worden, für wen die Fahrkarte bestimmt ist, und für welche Reise sie benützt werden soll. Damit ist die Repräsentation des zweiten Satzes weniger spezifisch als die Aussage in der Retusche; denn hier ist angegeben, daß es sich bei der Reise u m die in der Retusche beschriebene Reise, und daß es sich beim Benützer der Fahrkarte um Hans handelt. Andererseits ist die Aussage in der Retusche in anderen Punkten weniger spezifisch als die Repräsentation des zweiten Satzes; denn nur letzte-
209
Inferenzregeln
re informiert über den Preis der Fahrkarte. Beide Zustandsbeschreibungen stimmen jedoch darin überein, daß Hans eine Fahrkarte besitzt. Da sich aus den anderen Informationen keine Widersprüche ergeben, wird deshalb angenommen, daß die Aussage des zweiten Satzes eine Instanziierung des Zwischenzustandes aus dem Rezept für „Eisenbahnfahren" bildet. Damit kann die in Abb. 35 gezeigte Gedächtnisstruktur aufgebaut werden. Bei der Suche, ob eine eingegebene Proposition einem Zwischenzustand eines aktiven Rezeptes zugeordnet werden kann, werden Negationen gleich behandelt wie Assertionen; wäre der zweite Satz in dem obigen Beispiel etwa Er kaufte keine Fahrkarte, dann würde dieser Satz ebenfalls als Instanziierung des entsprechenden Zwischenzustandes aus dem Rezept für „Eisenbahnfahren" erkannt werden. In der Retusche würde dann vermerkt werden, daß die Proposition im eingegebenen Text verneint wird. Abb. 35: Gedächtnisstruktur nach der Analyse der Sätze: Hans f u h r mit dem Zug nach Zürich. Er bezahlte 8 Franken für die Fahrkarte — •
[Eisenbahnfahren Rollen: REISENDER ZUG EISENBAHNGESELLSCHAFT ZU F A H R K A R T E GEBÜHR Korpus: r + P O S S R E I S E N D E R F A H R K A R T E (REISENDER BUHR) W ]
VON
* GE
semantisches Gedächtnis episodisches Gedächtnis
Rollen: Korpus:
*
*
*
*
*
*
*
[Fahrkartei ( • ^ 8 Franken
Zürich] Stadtl] Eisenbahngesellschaft 1 ] Zugl] Hans] 4 .
Regel 3 wird bei allen denjenigen eingegebenen Propositionen angewendet, bei denen die Anwendung von Regel 2 erfolglos blieb; dies
210
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
sind solche Handlungs- und Zustandsbeschreibungen, die nicht Teil eines aktiven Rezeptes sind. (R3) Wenn eine Person Ρ einen Zustand Ζ produziert, dann suche im Gedächtnis nach einer Proposition von der Form: INTENDIEREN Ρ Ζ W Kann eine solche Proposition gefunden werden, dann verknüpfe diese Proposition mit der Zustandsbeschreibung Ζ durch „Ursache"- und ,,Folge"-Verbindungen. Die Durchführung dieser Regel geschieht in zwei Schritten. Zunächst wird im episodischen Gedächtnis überprüft, ob der gesuchte INTENDIEREN-Zustand im vorhergehenden Text erwähnt wurde oder daraus inferiert werden kann. Ist dem nicht so, dann wird versucht, diesen Zustand mit Hilfe von allgemeinen Aussagen über menschliche Motivationen zu inferieren. Beispiele solcher allgemeiner Aussagen sind: INTENDIEREN Personl (GEFÜHL HUNGER Personl F) W INTENDIEREN Personl (POSS Personl Geld W) W INTENDIEREN Kindl (POSS Kindl Spielzeug W) W (R4) Wenn ein Rezept aktiviert wird, dann führe (R2) und (R3) durch; dabei ist das I.H.-R. dieses Rezeptes der Wert der Variablen ZB bei der Anwendung von (R2) und der Wert der Variablen Ζ bei der Anwendung von (R3). Diese Regel hat eine ähnliche Funktion wir ( R l ) : In beiden Fällen wird zunächst das Resultat einer Handlung inferiert, und dieses Resultat wird darauf durch die Anwendung von (R2) und (R3) in die bestehenden Wissensinhalte zu integrieren versucht. Der wichtigste Unterschied zwischen den beiden Regeln besteht darin, daß sie durch verschiedene Typen von Propositionen aktiviert werden. Bei ( R l ) beschreibt die eingegebene Proposition eine Handlung; bei (R4) wird die Handlung im eingegebenen Text nicht direkt erwähnt, sondern der Ablauf eines Handlungsrezeptes wird inferiert. Die wichtigste Inferenzregel, durch die Rezepte aktiviert werden, ist (R5). Hans nahm ein Bier aus dem Eisschrank. Es soll angenommen werden, daß durch das Wort „Bier" im obigen Satz das Rezept für „trinken" aktiviert wird. Durch die Anwendung von (R4) wird das I.H.-R. dieses Rezeptes G E F Ü H L DURST TRINKER F bestimmt und diese Zustandsbeschreibung wird darauf durch die Regeln (R2) und (R3) ins Gedächtnis zu integrieren versucht. Ist die Suche im episodischen Gedächtnis erfolglos, dann werden die allgemeinen Wissensinhalte überprüft, unter denen sich die Proposition INTENDIEREN Personl (GEFÜHL D U R S T Personl F) W befindet. Damit kann inferiert werden, daß Hans das Bier darum aus
Inferenzregeln
211
dem Eisschrank nahm, weil er seinen Durst löschen wollte. (R5)Wenn es nicht gelingt, eine eingegebene Proposition durch die Anwendung von ( R l ) bis (R4) in ein aktiviertes Rezept zu integrieren, dann überprüfe, ob einer der in dieser Proposition genannten Begriffe durch eine ai-Verbindung mit einem Rezept zusammenhängt. Wenn ja, dann aktiviere dieses Rezept. Durch die Festsetzung, daß (R5) erst dann angewendet werden soll, wenn ( R l ) bis (R4) erfolglos waren, soll die vorschnelle Aktivierung von Rezepten verhindert werden, die für die eingegebene Geschichte nicht bedeutsam sind. Bei der Analyse der beiden Sätze Hans wollte eine Zeitung kaufen. Er ging zum Bahnhof. würde nach dem ersten Sat,z das Rezept aktiviert werden, das die beim Kauf einer Zeitung ablaufende Handlung beschreibt. J e nach der Kultur, in der man sich befindet, handelt es sich dabei um das Rezept für „Einkaufen im Selbstbedienungsgeschäft" oder um das Rezept, in dem das Kaufen eines Objektes aus einem Münzautomaten beschrieben wird. Für die Analyse dieses Beispieles soll angenommen werden, daß es sich um das Kaufen an einem der Zeitungs- und Tabakkioske handelt, die sich häufig in Bahnhöfen befinden. In diesem Fall könnte der zweite Satz durch (R2) als Teilhandlung des Zeitungskaufens in einem Bahnhof bestimmt werden. Würde (R5) schon vor den Regeln ( R l ) bis (R4) angewendet werden, dann hätte das Wort „Bahnhof" im zweiten Satz die Aktivierung des Rezeptes für „Eisenbahnfahren" zur Folge. Nun lassen sich Beispiele finden, in denen trotz des erwähnten Aufschiebens der Anwendung von (R5) nicht verhindert werden kann, daß ein Rezept vorschnell und unnötigerweise aktiviert wird. Ein solches Beispiel bilden die beiden oben angeführten Beispielsätze, wenn ihre Reihenfolge umgekehrt wird: Hans ging zum Bahnhof. Er wollte eine Zeitung kaufen. Hier wird nach der Analyse des ersten Satzes das Rezept für „Eisenbahnfahren" aktiviert werden, denn da zu diesem Zeitpunkt kein anderes Rezept aktiv ist, können ( R l ) bis (R4) nicht erfolgreich angewandt werden. Diese Schwierigkeit könnte durch die Einführung der Restriktion umgangen werden, daß Rezepte nach der Analyse des ersten Satzes nur dann aktiviert werden dürfen, wenn die durch sie beschriebene Handlung in dem Text direkt erwähnt wird. Dies ist etwa bei dem folgenden Satz der Fall: Hans fuhr mit dem Zug nach Zürich. Auch durch diese Restriktion können jedoch vorzeitige Aktivierungen von Rezepten nicht in allen Fällen verhindert werden: Hans fuhr zu einer Konferenz, an der er einen Vortrag halten sollte. Er packte seinen Koffer und ging zum Bahnhof. Er be-
212
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
eilte sich, weil er fürchtete, zu spät zu kommen. Als er ankam, war er außer Atem. (Er merkte, daß er zu spät kam.) Schnell nahm er den nächsten Bus zum Flughafen. Ohne den in Klammern gesetzten Satz würde man diese Geschichte so interpretieren, daß Hans von Anfang an mit dem Flugzeug verreisen wollte. Obwohl der in Klammern gesetzte Satz keinen direkten Bezug auf die Eisenbahn enthält, wird durch ihn die Interpretation der Geschichte verändert: Der Leser nimmt n u n an, daß Hans ursprünglich mit dem Zug verreisen wollte, diesen jedoch verpaßte und darum das Flugzeug nahm. Stimmt man diesen beiden Interpretationen zu, dann bildet der Beispieltext einen Beleg dafür, daß man bei der Analyse auch von nicht-witzigen oder nicht-„konstruierten" Geschichten unter gewissen Umständen voreilig ein Rezept aktivieren kann. Im Falle der Beispielgeschichte ist dies die vorzeitige Aktivierung des Rezeptes für „Eisenbahnfahren". Die einzige alternative Annahme wäre, daß der Leser erst nach der Analyse des Satzes in Klammern die Inferenz zieht, daß Hans zunächst mit dem Zug verreisen wollte. In diesem Falle würde man jedoch in verschiedenen Stadien der Analyse folgende Antworten geben: Text
Frage Antwort Text Frage Antwort Text Frage Antwort
Hans fuhr zu einer Konferenz, an der er einen Vortrag halten sollte. Er packte seinen Koffer und ging zum Bahnhof. Warum ging er zum Bahnhof? Ich weiß nicht. ν Er beeilte sich, weil er fürchtete, zu spät zu kommen. Zu spät wozu? Ich weiß nicht. Als er ankam, war er außer Atem. Er merkte, daß er zu spät kam. Zu spät wozu? Um den Zug zu erreichen.
Es würde zweifellos nicht leicht sein, eine Versuchsperson zu finden, die bei der Analyse des Textes diese drei Antworten produziert. Das Beispiel zeigt also, daß die voreilige Aktivierung von Rezepten, die in einem späteren Zeitpunkt der Analyse rückgängig gemacht werden m u ß , u„U. nicht nur unvermeidbar ist, sondern beim Verstehensprozeß sogar sinnvoll sein kann. Bei der Anwendung der bislang genannten und der weiter unten zu beschreibenden Regeln stellt sich die Frage ob dieselbe Regel während der Analyse einer Proposition wiederholt angewendet werden soll bzw. darf. Diese Frage steht in einem engen Zusammenhang mit dem Problem, wie ausführlich oder „tief" die beim Verstehen eines
Inferenzrcgeln
213
Textes ablaufenden Inferenzprozesse sind. Dieses Problem kann an folgendem Beispiel illustriert werden: Hans wollte mit dem Zug nach Zürich fahren. Er bestellte ein Taxi. Das obige Satzpaar wird in der Regel so interpretiert werden, daß Hans mit dem Taxi zum Bahnhof fahren wollte, um dort den Zug zu nehmen. Nun enthält das Rezept für „Eisenbahnfahren" keinen Hinweis über die Benützung eines Taxis, und die gegebene Interpretation kann damit nicht allein durch die Anwendung von (R2) gefunden werden. Das Verbinden der beiden Sätze geschieht auf Grundlage des Wissens, daß das Bestellen eines Taxis eine Teilhandlung von Taxifahren (im Sinne von: Benützen eines Taxis als Kunde) ist, daß ein mögliches I.H.-R. dieser Handlung sein kann, daß der Kunde am Bahnhof ist, und daß dies wiederum eine Voraussetzung für Eisenbahnfahren bildet. Eine solche Kette von Verbindungen könnte durch die Einführung einer Regel (R2') aufgebaut werden. Diese Regel wird immer dann angewendet, wenn (R2) erfolglos ist. (R2') Folge den nhd-Verbindungen, die von den Zwischenzuständen der aktiven Rezepte ausgehen und finde so die Rezepte für die Handlungen, durch welche diese Zustände produziert werden können. Prüfe darauf, ob die eingegebene Proposition einem Zwischenzustand eines dieser Rezepte entspricht. Diese Regel könnte rekursiv angewandt werden, d. h. man könnte danach fragen, ob eine eingegebene Proposition Teil einer Handlung ist, die wiederum Teil einer Handlung ist . . . usw. Auf analoge Weise könnten auch die anderen Regeln rekursiv angewandt werden; so z. B. (R5): Ist ein genanntes Objekt Aktant einer Handlung, deren Vollzug Teilhandlung einer anderen Handlung ist . . .? Allerdings ist die Annahme, daß Inferenzregeln so lange rekursiv ablaufen, bis eine Verbindung zwischen den eingegebenen Sätzen gefunden werden kann, nicht sinnvoll. Bei der Analyse des Satzpaares: Hans fuhr in Urlaub. Vor seiner Abreise ging er kurz ins Büro, könnte der Leser, wenn er sich darum bemüht, eine Reihe von möglichen inhaltlichen Verbindungen zwischen den beiden Sätzen finden. So könnte man etwa inferieren, daß viele Leute aus dem Urlaub ihren Freunden Ansichtskarten schreiben, daß eine Voraussetzung dafür der Besitz eines Schreibinstrumentes ist, daß sich in einem Büro Schreibinstrumente befinden, und daß Hans möglicherweise darum ins Büro ging, weil er sich einen Kugelschreiber zum Schreiben der Ansichtskarten besorgen wollte. Man kann jedoch annehmen, daß der Leser — wenn es sich bei dem Text nicht um eine entscheidende Stelle in einem Kriminalroman handelt — mit dem Aufbau sol-
214
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
eher komplexer Verbindungen so lange abwartet, bis ihm mehr Informationen zur Verfügung stehen. Die Häufigkeit, mit der Inferenzregeln beim Verstehensprozeß rekursiv wiederaufgerufen werden, hängt von einer Reihe verschiedener Faktoren ab. Die drei wichtigsten dieser Faktoren sind: 1. Die Wichtigkeit der Mitteilung: Man wird sich mehr anstrengen, um herauszufinden, warum jemand umgebracht wurde, als warum jemand ins Büro ging. 2. Die Situation, in welcher der Text wahrgenommen wird: Ein Text mit den Instruktionen für ein Abschlußexamen wird gründlicher analysiert als ein Text aus einem Unterhaltungsroman. 3. Die Anzahl der aktiven Rezepte: Sind nur wenige Rezepte aktiviert, dann ist es wahrscheinlicher, daß ein inferierter komplexer Zusammenhang „richtig" ist, d. h. den Beziehungen entspricht, die beim Erzähler die semantisch-kognitive Ausgangsbasis für die Äußerung bilden. Bei der Analyse der folgenden Beispiele wird angenommen, daß bei der Durchführung von Inferenzen nur eine Stufe der Einbettung stattfindet; d. h. daß die gleiche Inferenzregel bei der Analyse einer Proposition höchstens zweimal angewendet werden kann. Damit wird beispielsweise überprüft werden, ob eine eingegebene Proposition eine Voraussetzung oder ein Zwischenzustand eines Rezeptes ist, dessen Resultat ein Zwischenzustand eines aktiven Rezeptes bildet. Auf dieser Ebene wird es möglich sein, die beiden Sätze Hans wollte mit dem Zug nach Zürich fahren. Er bestellte ein Taxi. zu verbinden, während zwischen den Sätzen Hans f u h r in Urlaub. Vor seiner Abreise ging er kurz ins Büro, keine Verbindung gefunden werden könnte. Zudem soll angenommen werden, daß unter gewissen Umständen bei der Analyse von Texten ein ausgezeichneter Zustand bestehen kann, der als GRÜNDLICH-Modus bezeichnet werden soll. In diesem Zustand ist die oben formulierte Restriktion über die Tiefe der Inferenzprozesse aufgehoben; d. h. man wird bei der Textanalyse so viele Inferenzen durchführen, wie für das Verbinden der eingegebenen Sätze notwendig sind. Durch die Regeln (R6) und (R7) kann inferiert werden, auf welche Weise ein bestimmter Zwischenzustand produziert wurde. (R6') ermöglicht die wiederholte Anwendung dieser beiden Regeln. (R6) Wenn du bestimmen willst, wie ein Zwischenzustand oder eine Voraussetzung eines Rezeptes produziert worden ist oder produziert werden könnte, dann folge der nhd-Verbindung, die von dieser Zustandsbeschreibung ausgeht. Uberprüfe, ob
Inferenzregeln
215
bei dem Rezept, auf das die nhd-Verbindung verweist, alle Voraussetzungen erfüllt sind. Wenn ja, dann könnte der Zustand durch die Anwendung dieses Rezeptes hergestellt worden sein oder hergestellt werden. Wenn nein, dann wende (R7) an. (R7) Wenn du bestimmen willst, wie ein bestimmter Zustand (der nicht Teil eines Rezeptes sein muß) hergestellt wurde oder hergestellt werden könnte, dann folge der nhd-Verbindung, die der entsprechenden Zustandskategorie zugeordnet ist. Überprüfe, ob bei dem Rezept, auf das diese nhd-Verbindung verweist, alle Voraussetzungen erfüllt sind. Wenn ja, dann könnte der Zustand durch die Anwendung dieses Rezeptes hergestellt worden sein oder hergestellt werden. Wenn nein, und wenn du nicht im GRÜNDLICH-Modus bist, dann gebe die Suche auf. Wenn du im GRÜNDLICH-Modus bist, dann führe (R6') durch. (R6') Wenn durch die Anwendung von (R5) oder (R6) ein Rezept gefunden wurde, durch dessen Anwendung ein beschriebener Zustand produziert werden kann, und wenn bei diesem Rezept eine oder mehrere Voraussetzungen nicht erfüllt sind, dann überprüfe durch Anwendung von (R5), ob diese Voraussetzung produziert werden könnte. Ist dies der Fall, dann könnte der beschriebene Zustand durch dieses Rezept produziert werden oder produziert worden sein. (R7) basiert auf der Annahme, daß nicht nur Propositionen aus Rezepten, sondern auch Zustandskategorien an sich eine nhd-Verbindung zugeordnet werden kann. So hat etwa die Zustandskategorie LOC eine nhd-Verbindung zu Rezepten, in denen verschiedene Arten von Bewegungen beschrieben werden, der Zustand HUNGER F hat eine nhd-Verbindung zum Rezept für „essen" usw. (R7) wird nicht nur dann angewandt, wenn die durch (R6) durchgeführte Suche erfolglos war, sondern auch dann, wenn nach der Art der Produktion einer Proposition gefragt wird, die nicht Teil eines Rezeptes ist. Dies ist beispielsweise dann der Fall, wenn man weiß, daß eine Person einen bestimmten Zustand intendiert, und Voraussagen möchte, was die Person für die Realisierung dieses Zustandes unternehmen wird. Die Regeln (R5) bis (R7) ermöglichen die Aktivierung von Rezepten. Bei der Anwendung von (R5) geschieht dies mit Hilfe von Schlüsselwörtern und bei (R6) und (R7) mit Hilfe von nhd-Verbin düngen, die auf bislang nicht-aktive Rezepte verweisen. Allerdings ist das Problem der Aktivierung von Rezepten durch diese drei Regeln nicht befriedigend gelöst. Wie bei den Ausführungen zu (R5) gezeigt wur-
216
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
de, können durch ai-Verbindungen auch Rezepte aktiviert werden, die für den beschriebenen Kontext nicht relevant sind. Dieser Mangel kann auch bei der verzögerten Anwendung von (R5) zu falschen Aktivierungen führen. Er rührt daher, daß ein bestimmtes Schlüsselwort in verschiedenen Kontexten auch verschiedene Rollen einnehmen kann. Um diesem Faktor Rechnung zu tragen, schlug Fahlman (1977) vor, bei mehreren möglichen Rezepten dasjenige zu aktivieren, auf welches die meisten Hinweise durch ai- und andere Verbindungen deuten. Diese „Überschneidungsmethode" kann an folgendem Beispiel verdeutlicht werden: Hans ging zu dem Gestell. Er nahm eine Thunfischdose und legte sie in seinen Korb. Das Wort „Gestell" könnte ai-Verbindungen zu den Rezepten für „einkaufen im Selbstbedienungsgeschäft", „hantieren in der Küche" und „benützen einer Bibliothek" haben, das Wort „Thunfischdose" zu den Rezepten für „einkaufen im Selbstbedienungsgeschäft", „hantieren in der Küche" und „picknicken" und das Wort „ K o r b " zu den Rezepten für „einkaufen im Selbstbedienungsgeschäft" und „Früchte sammeln". Jedes der drei Wörter verweist also auf mehrere Rezepte, aber lediglich auf eines davon, „einkaufen im Selbstbedienungsgeschäft", wird durch alle drei Wörter verwiesen. Nach Fahlman (1977) kann dies als Kriterium dafür benützt werden, daß dieses Rezept das in dem gegebenen Kontext adäquate ist. Auch diese Regel liefert jedoch keine befriedigende Lösung für das Problem der Rezept-Aktivierung, da die Inhaltswörter auf eine große Anzahl von Rezepten verweisen können, und die Feststellung, daß bestimmte dieser Rezepte irrelevant sind, unter Umständen nur mit Hilfe von komplexen Inferenzprozessen möglich ist. Dies ist etwa bei folgendem Beispiel der Fall: Hans nahm eine Thunfischdose vom Gestell. Dann knipste er das Licht an. Beim ersten Satz bleiben nach der Anwendung der Uberschnei dungsmethode zwei mögliche Rezepte übrig: „einkaufen im Selbstbedienungsgeschäft" und „hantieren in der Küche". Unter der Voraussetzung, daß Hans kein Angestellter in einem Lebensmittelgeschäft ist, wird man nach der Analyse des zweiten Satzes annehmen, daß das Rezept für „hantieren in der Küche" adäquat ist. Dies entscheidet man auf Grund des Wissens, daß es üblicherweise nicht der Kunde ist, der in einem Geschäft das Licht an- oder abstellt. Diese Inferenz verlangt jedoch bereits eine sehr ausführliche Analyse des Rezeptes für „einkaufen im Selbstbedienungsgeschäft". Um solche Inferenzprozesse zu steuern und damit die Anzahl von erfolglosen Inferenzen zu verringern, schlug Charniak (1978) vor,
Xnferenzregeln
217
die ai-Verbindungen zu spezifizieren. Begriffe, die Gegenstände bezeichnen, sollen eine LOCAL-Verbindung zu den örtlichkeiten haben, an denen sich diese Gegenstände normalerweise befinden, und eine ACTION-Verbindung zu den Rezepten für Handlungen, in denen diese Gegenstände vorkommen. Handlungsrezepte sollen ebenfalls eine LOCAL-Verbindung zu den örtlichkeiten haben, in denen die Handlungen durchgeführt werden. Zudem schlägt Charniak (1978) vor, daß allgemeinen Begriffen, die in vielen verschiedenen Handlungsabläufen vorkommen, ζ. B. „gehen", „nehmen", „Person" usw., keine dieser Verbindungen zugeordnet sei. Das Auffinden des richtigen Rezeptes in dem oben gegebenen Beispiel wäre damit relativ einfach: das Rezept für „einkaufen im Selbstbedienungsgeschäft" hat eine LOCAL-Verbindung zu „Lebensmittelgeschäft" und das Rezept für „hantieren in der Küche" zu „Küche" oder „Wohnung". Zudem wird von „Küche" bzw. „Wohnung" eine ACTION-Verbindung zu „Licht an- und ausknipsen" und/oder es wird von diesem Rezept aus eine LOCAL-Verbindung zu „Küche" und „Wohnung" führen. J e d e dieser beiden Verbindungen würde ausreichen, um nach der Analyse des zweiten Satzes das Rezept für „hantieren in der Küche" als das in diesem Kontext relevante zu bestimmen. Durch diese Verbindungen allein kann allerdings der Tatsache nicht Rechnung getragen werden, daß Hans, falls er in einem Lebensmittelgeschäft angestellt ist, sich sehr wohl dort befinden und das Licht angeknipst haben könnte. Um auch diesen Fall zu berücksichtigen, müßte die von Charniak (1978) vorgeschlagene Spezifizierung der ai-Verbindungen noch weiter aufgegliedert werden. Eine sinnvolle Lösung könnte darin bestehen, daß die LOCAL-Verbindungen nicht auf bestimmte Begriffe verweisen, sondern auf eine Variable, die in jedem konkreten Fall neu evaluiert werden muß. So besteht die Konvention, daß man das Licht nur in solchen Räumen an- und abknipst, über die man Verfügungsgewalt hat, dadurch, daß man etwa dort wohnt oder arbeitet: ist man auf Besuch, dann bittet man den Gastgeber um Erlaubnis, das Licht anzuknipsen (eine genauere Analyse des Begriffes der Verfügungsgewalt findet sich im fünften Abschnitt des Kapitels X). Die von der Handlungsbeschreibung „Licht an- und ausknipsen" ausgehende LOCAL-Verbindung sollte also nicht auf eine Reihe von örtlichkeiten hinweisen, sondern auf einen Inferenzprozeß, durch welchen bestimmt wird, ob die in Frage kommende örtlichkeit sich in der Verfügungsgewalt des Agens befindet. (R8) Wenn durch eine eingegebene Proposition oder als Resultat eines Inferenzprozesses eine neue Zustandsbeschreibung Ζ ausgesagt wird, dann suche nach einer Aussage von der Form MISSFALLENjemandl Z W
218
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
Kann eine solche Aussage gefunden werden, dann vermerke im episodischen Gedächtnis die Proposition INTENDIEREN j e m a n d l Ζ F Diese Regel ist in zwei Hinsichten unvollständig. Zum einen wird nicht berücksichtigt, daß die Intention, einen Zustand aufzuheben, die Kenntnis dieses Zustandes voraussetzt. (R8) sollte deshalb nur dann angewendet werden, wenn die Voraussetzung WISSEN j e m a n d l Ζ W zutrifft. Die Einführung einer solchen Restriktion wäre jedoch nur dann sinnvoll, wenn Regeln zur Bestimmung dafür bestünden, unter welchen Bedingungen man annehmen kann, daß eine Person u m ein Ereignis oder um einen Zustand weiß. Der zweite Mangel bei (R8) ergibt sich daraus, daß die Intention, einen Zustand aufzuheben, die Möglichkeit dazu voraussetzt. Wenn man beispielsweise hört, daß es regnet, und zugleich weiß, daß Hans dies nicht gern hat, dann sollte nicht inferiert werden, daß Hans intendiert, den Regen abzustellen. Trotz dieser beiden Mängel erlaubt (R8) zumindest eine grobe Voraussage von Handlungsintentionen. In Kombination mit den Informationen, die den nhd-Verbindungen assoziiert sind, können damit auch eine Reihe von allgemeinen Deduktionen gezogen werden, wie ζ. B.: „Wenn jemand hungrig ist, dann will er essen" oder „Wenn jemand sein Geld verloren hat, dann will er es zurückhaben". (R9)Wenn beim Vollzug einer Handlung ein Zwischenzustand nicht oder fehlerhaft hergestellt wird (dies kann im eingegebenen Text direkt erwähnt oder inferiert worden sein), dann schaue, o b der entsprechenden Zustandsbeschreibung im Rezept eine Begründungs-Verbindung zugeordnet ist. Ist dies der Fall, dann inferiere, daß das I.H.-R. des Rezeptes, auf welches diese BegründungsVerbindung verweist, nicht eintrifft. Durch die Anwendung dieser Regel kann das System bei dem weiter oben schon erwähnten Beispielsatz Hans signalisierte nicht, daß er abbog, inferieren, daß der potentielle Empfänger des Signals nicht weiß, daß Hans abbiegen wollte. (RIO) Wenn eine neue Zustandsbeschreibung von der Form INTENDIEREN MOEGEN Person 1 Zustand 1 W MISSFALLEN eingegeben oder inferiert wird, und wenn die Ursache für diesen Zustand nicht durch die bislang aufgeführten Regeln inferiert werden kann, dann führe den folgenden Prozeß durch: Schaue, ob Personl Mitglied einer Gruppe ist; wenn ja suche
Inferenzregeln
219
nach einer Proposition von der Form INTENDIEREN MOEGEN Gruppe 1 Zustand 1 W MISSFALLEN Kann eine solche Proposition gefunden werden, dann verknüpfe die beiden Propositionen durch Ursache- und Wirkungs-Verbindungen. Der in (RIO) verwendete Begriff „Gruppe" kann auf verschiedene Arten von Vereinigungen angewendet werden, wie einen Fußballverein, ein Geschäftsunternehmen oder einen Staat. Die Regel erlaubt die Analyse all derjenigen Handlungen, deren Motivation sich aus der Identifikation des handelnden Individuums mit einer sozialen Gruppe ergibt. Es braucht nicht erwähnt zu werden, daß die Regel ein nur sehr grobes Abbild der ablaufenden sozialen Prozesse gibt. Die Anwendung von (RIO) kann anhand des folgenden Beispieles dargestellt werden: Familie Müller brauchte Geld. Frau Müller ging ins Leihhaus, um ihren Schmuck zu verpfänden. Der erste Satz dieses Beispieles hat folgende semantische Repräsentation INTENDIEREN Fam. Müller (POSS Fam. Müller Geld W) W Durch die Anwendung von ( R l ) kann aus dem zweiten Satz die Inferenz gezogen werden, daß INTENDIEREN Frau Müller (POSS Frau Müller Geld W) W Das Wissen, daß Frau Müller zur Gruppe der Familie Müller gehört, könnte wie folgt repräsentiert werden: (GRUPPE (Fam. Müller) (Herr Müller, Frau Müller, Lieschen Müller. . .)) Auf Grund dieser drei Propositionen kann durch (RIO) inferiert werden, daß Frau Müller darum Geld möchte, weil die Familie es braucht. Um das Lesen der beiden in den folgenden Abschnitten ausführlich analysierten Beispiele zu erleichtern, sollen die Regeln ( R l ) bis (RIO) in umgangssprachlicher Form wiederholt werden: (Rl) Bestimme das Resultat von Handlungen. (R2) Schaue ob ein Zustand Teil einer Handlung ist. (R3) Schaue ob ein Zustand von seinem Aktor intendiert wird. (R4) Schaue ob das Resultat einer Handlung intendiert wird. (R5) Die Aktivation von Rezepten durch Schlüsselwörter. (R6) Die nhd-Verbindung eines Zustandes aus einem Rezept kann darüber informieren, wie dieser Zustand hergestellt wurde. (R7) Die nhd-Verbindung einer Zustandskategorie kann darüber informieren, wie ein bestimmter Zustand hergestellt wurde.
220
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
(R8)
Wenn jemandem ein Zustand mißfällt, dann will er diesen Zustand aufheben. (R9) Wenn bei der Durchführung einer Handlung ein Zwischenzustand verletzt wird, dann wird das Ziel der Handlung, welche die Notwendigkeit dieses Zwischenzustandes begründet, nicht erreicht. (RIO) Wenn jemand eine bestimmte Einstellung hat, dann kann dies darin begründet sein, weil die soziale Gruppe, der er angehört, diese Einstellung hat. 2. Wissen über Eisenbahnen Die Verwendung der bislang beschriebenen Strukturen und Verbindungen und der Regeln ( R l ) bis (RIO) soll in folgendem an einem Beispiel dargestellt werden. Das System liest dabei eine kurze Geschichte, die aus drei Sätzen mit insgesamt fünf Aussagen besteht. Nach der Analyse jeder Aussage sollen Fragen über das „warum" und das „wie" der beschriebenen Handlungen beantwortet werden. (a)
Text Frage Antwort Frage Antwort
(b)
Text Frage Antwort Frage Antwort
(Ό
Text Frage Antwort Frage Antwort Text Frage Antwort Frage Antwort Text Frage
(d)
(e)
Hans wollte nach Zürich reisen. Warum wollte er nach Zürich reisen? Ich weiß nicht. Wie wollte er nach Zürich reisen? Vielleicht mit dem Zug, vielleicht mit dem Wagen, vielleicht mit dem Flugzeug. Er ging zum Bahnhof. Warum ging er zum Bahnhof? Weil er mit dem Zug reisen wollte. Wie ging er zum Bahnhof? Vielleicht zu Fuß, vielleicht mit der Straßenbahn, vielleicht mit dem Taxi, vielleicht mit dem Auto, und beschaffte sich eine Fahrkarte. Warum beschaffte er sich eine Fahrkarte? Weil er mit dem Zug nach Zürich reisen wollte. Wie beschaffte er sich eine Fahrkarte? Er kaufte sie. Er mußte fast eine Stunde lang warten. Warum mußte er warten? Weil kein Zug nach Zürich fuhr. Wie wartete er? Ich weiß nicht. und ging in eine Gaststätte. Warum ging er in eine Gaststätte?
Wissen über Eisenbahnen
Antwort Frage Antwort
221
: Weil er hungrig war. : Wie ging er in eine Gaststätte? : Vielleicht zu Fuß, vielleicht mit der Straßenbahn, vielleicht mit dem Taxi, vielleicht mit dem Auto. Die hauptsächlichen Wissensinhalte, die für das Finden dieser Antworten benötigt werden, sind in dem Rezept für „Eisenbahnfahren" enthalten, das in Abb. 36 dargestellt ist. Einige Komponenten dieses Rezeptes, die auf der Grundlage der bisherigen Ausführungen nicht ohne weiteres verständlich sind, sollen im folgenden näher erklärt werden. Die Aussagen des Korpus beschränken sich nicht auf die Beschreibung von Aktivitäten, die im ZUG stattfinden, sondern sie informieren beispielsweise auch darüber, daß sich der REISENDE zum Bahnhof begeben m u ß . Die in dem Rezept beschriebene Eisenbahnfahrt beschränkt sich also nicht auf die Reise zwischen zwei Bahnhöfen sondern zwischen zwei Städten. Dementsprechend stehen die Partizipanten VON und ZU für Begriffe für Städte. Die ersten sieben Prärequisite des Rezeptes können damit wie folgt paraphrasiert werden: Die Handlung kann stattfinden, wenn der REISENDE eine Person ist und sich in VON befindet und wenn VON und ZU zwei verschiedene Städte mit Bahnstationen sind. In der Liste der Prärequisite fehlt der Hinweis, daß eine Eisenbahnverbindung zwischen den Städten VON und ZU besteht; das System nimmt damit einfach an, daß alle Bahnstationen miteinander verbunden sind. Dies ist — zumindest in Europa — eine vernünftige Annahme, und auch die Tatsache, daß der Eisenbahnverkehr an Landverbindungen gebunden ist, bildet hier kein Gegenargument: Es ist ohne weiteres möglich, mit dem Zug von London nach Paris zu reisen. Die Liste der Prärequisite enthält jedoch eine Einschränkung in bezug auf die Distanz zwischen VON und ZU. Dies ist darum notwendig, weil die Fahrt mit der Eisenbahn über Distanzen von mehr als ca. 500 Km so beschwerlich und zeitraubend wird, daß man eine Flugreise vorzieht. Allerdings sind die Dinge komplizierter: Flugreisen sind im allgemeinen teurer als Eisenbahnfahrten und die Wahl des Verkehrsmittels wird darum auch davon abhängen, wieviel Geld einem zur Verfügung steht.
222
Rezepte und Retuschen bei Inferenz- u n d Verstehensprozessen
Abb. 36: Das Rezept für „Eisenbahnfahren" [Eisenbahnfahren Rollen: REISENDER ZUG EISENBAHNGESELLSCHAFT VON ZU FAHRKARTE GEBUEHR Prärequisite: SUP REISENDER Person W SUP VON Stadt W SUP ZU Stadt W LOC IN Eisenbahnstation VON W LOC IN Eisenbahnstation ZU W LOC IN REISENDER VON W GLEICH VON ZU F > PLANEN EISENBAHNGESELLSCHAFT ZUG VON ZU W LOC DISTANZ VON ZU < 5 0 0 K m Gründl ^ [ h a n d l u n g s w a h l (REISENDER * - * * * * ) ] Ψ [flugreise (REISENDER . . .)] Korpus: LOC IN REISENDER (Eisenbahnstation VON) W WISSEN REISENDER * W POSS REISENDER FAHRKARTE (REISENDER * GEBUEHR) W ^ [Geschäftsleben ( . . . . ) ] Grund ^ [kaufen ( . . . . ) ] nhd LOC IN ZUG (Eisenbahnstation VON) W WARTEN REISENDER * W WISSEN (Schaffner von ZUG)
*
W
> [kontrollieren (. . . .)] nhd LOC IN ZUG (Eisenbahnstation ZU) I
W
>[Eisenbahnverkehr (. . . .)] nhd
I.H.-R.: LOC IN REISENDER ZU W]
Es besteht deshalb eine Begründungs-Verbindung, die das Prärequisit über die Distanz zwischen VON und ZU mit einem Rezept verbindet, in dem das Abschätzen dieser Faktoren beschrieben wird. Abb. 37 zeigt einen Entwurf dieses Rezeptes, welches „Handlungswahl" genannt werden soll. Um die Darstellung zu vereinfachen, werden in diesem Rezept nur solche Fälle beschrieben, in denen der gewünschte Zustand (ZIEL) durch zwei Handlungen produziert werden
Wissen über Eisenbahnen
223
kann: den A-AKT und den B-AKT. Die anderen Rollen dieses Rezeptes sind der PLANER, die Person, welche das ZIEL verwirklichen möchte, die INTENSITAET, die Stärke, mit der die Verwirklichung des Zieles gewünscht wird, und der WAHL-AKT, die Handlung die vom PLANER gewählt wird, um das ZIEL zu erreichen. Die Aussagen dieses Rezeptes können wie folgt paraphrasiert werden: Die Handlung kann durchgeführt werden, wenn der PLANER mit einer gewissen INTENSITAET ein ZIEL verwirklichen möchte, und wenn dies entweder durch die Durchführung von A-AKT oder von B-AKT erreicht werden kann. Der PLANER beschafft sich Wissen über die Kosten, die mit der Durchführung jeder dieser beiden Handlungen verbunden sind. Er vergleicht diese Kosten und wählt als WAHL-AKT die Handlung, deren Durchführung mit weniger Kosten verbunden ist. Wenn die Kosten von WAHL-AKT ein gewisses Maximum nicht überschreiten, welches von der INTENSITAET abhängt, mit der die Verwirklichung des ZIELes gewünscht wird, dann intendiert der PLANER die Durchführung von WAHL-AKT. Abb. 3 7: Das Rezept für das Wählen zwischen zwei Handlungen die zu demselben Ziel führen [Handlungswahl Rollen: PLANER ZIEL INTENSITAET A-AKT B-AKT WAHL-AKT Prärequisite: INTENDIEREN PLANER ZIEL INTENSITAET W GLEICH ZIEL (I.H.-R. von A-AKT) W GLEICH ZIEL (I.H.-R. von B-AKT) W Korpus: WISSEN PLANER (Kosten von A-AKT) W I j-j— > [Kostenschätzung (PLANER A-AKT)) nhd WISSEN PLANER (Kosten von B-AKT) W L [Kostenschätzung (PLANER B-AKT)] nhd WISSEN PLANER WAHL-AKT W [Vergleichen (Kosten von A-AKT) nhd (Kosten von B-AKT)] WISSEN PLANER (Kosten von WAHL-AKT) < I INTENSITAET W I—— > [Vergleichen ( )] I.H.-R.: INTENDIEREN PLANER WAHL-AKT W
Das Abschätzen der Kosten geschieht durch die Anwendung des Rezeptes für „Kostenschätzung". Der dabei errechnete Wert wird davon abhängen, wie angenehm oder unangenehm dem PLANER die Zwischenzustände der Handlung sind, und welche Mühe ihm die Verwirklichung dieser Zustände und der Prärequisite bereit. Bei der
224
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
„Kostenschätzung" einer Bahnfahrt müßte etwa berücksichtigt werden, daß (INTENDIEREN j e m a n d l ( P O S S j e m a n d l Geld F) F) und daß der PLANER damit nur ungern der EISENBAHNGESELLSCHAFT die GEBUEHR für die FAHRKARTE gibt. Weiter müßte auch in Rechnung gesetzt werden, daß (INTENDIEREN j e m a n d l (WARTEN j e m a n d l T) F) woraus in diesem Falle inferiert werden kann, daß der REISENDE nicht gerne seine Zeit im ZUG verbringt. Ein „vollständiges" System müßte sehr komplexe Beschreibungen solcher Vorlieben und Abneigungen enthalten, denn der subjektive Wert eines bestimmten Geldbetrages hängt von der Gesamtmenge des verfügbaren Geldes ab, oder die Abneigung gegen den Zustand WARTEN von der Dauer, welche man warten muß. Ohne weiter in diese Einzelheiten einzutreten, soll hier angenommen werden, daß eine realistische Schätzung der subjektiven Kosten für die Durchführung von Handlungen berechnet werden kann. Diese Prozesse sind jedoch mit dem Rezept für „Eisenbahnfahren" nicht direkt verbunden; die Begründung für das Prärequisit LOC DISTANZ VON ZU < 5 0 0 Km gibt lediglich an, daß dieser Faktor für die Wahl zwischen den Verkehrsmitteln Eisenbahn und Flugzeug relevant ist. Benötigt das System aus irgendeinem Grunde detailliertes Wissen darüber, in welcher Weise die Wahl des Verkehrsmittels durch die Distanz bestimmt wird, dann kann mit Hilfe des Rezeptes für „Kostenschätzung" berechnet werden, mit welchen Kosten das Erreichen der einzelnen Zwischenzustände beim „Eisenbahnfahren" und beim „Flugreisen" verbunden sind. Üblicherweise wird jedoch ein direkter und schneller Zugang zu diesen Wissensinhalten keine Vorteile mit sich bringen: Hat man einmal gelernt, warum in bestimmten Situationen gewisse Handlungen durchgeführt werden, dann verschwendet man später keine Gedanken mehr über diese Zusammenhänge. Allerdings (und dies ist ein wichtiger Faktor, der in den heutigen „frame"-Modellen m. E. zu wenig berücksichtigt wird), ist Verstehen in gewissen Situationen nur dann möglich, wenn man Zugang zu diesen Wissensinhalten hat. Sätze wie: Hans fuhr mit dem Zug, weil er nicht wußte, daß Paris von Rom weit entfernt ist. oder In einigen Ländern sind die Flugpreise so teuer, daß die meisten Leute selbst sehr lange Reisen mit dem Zug machen, können nur unter Anwendung der Informationen aus dem „Handlungswahl"-Rezept verstanden werden. Der Zustand „PLANEN", das achte Prärequisit in dem Rezept für
Wissen über Eisenbahnen
225
„Eisenbahnfahren", hat drei Argumente: Die Handlung oder der Zustand, die, bzw. der geplant wird, die Person oder Institution, welche diese Handlung oder diesen Zustand herzustellen plant und die Zeit der Handlung bzw. des Beginnes des Zustandes. Der hauptsächliche Unterschied zwischen den Zuständen INTENDIEREN und PLANEN besteht darin, daß bei ersterem der Aktor des Zustandes eine natürliche Person sein m u ß , während bei letzterem als Aktor auch eine Institution fungieren kann. Zudem erwartet man von dem Zustandsaktor von INTENDIEREN, daß er das gewünschte Ziel selbst herstellt, während dies beim Aktor von PLANEN nicht der Fall zu sein braucht. Ihre wichtigste Inferenzregel haben INTENDIEREN und PLANEN jedoch gemeinsam: Man kann erwarten, daß das INTENDIERte oder gePLANte Ereignis eintrifft. Bei drei Propositionen aus dem Korpus des Rezeptes für „Eisenbahnfahren" wird ein Argument eines Zustandes durch einen Pfeil zu einer anderen Proposition des Korpus repräsentiert: Der Schaffner weiß, daß der REISENDE eine FAHRKARTE hat, der REISENDE weiß, daß der ZUG geplant ist, u n d der REISENDE wartet, bis der ZUG in ZU ist. Der komplexe Zustand WARTEN hat zwei Argumente: Die Person, welche wartet, und das Ereignis, auf welches sie wartet. Propositionen mit dem Zustand WARTEN, die Teil eines Rezeptes sind, sind häufig eine „während"- und eine Begründungs-Verbindung zugeordnet. Die „während"-Verbindung verweist auf Handlungen, die während des Wartens durchgeführt werden. Die Proposition aus dem Rezept für „Einkaufen in einem Selbstbedienungsgeschäft", in der Warten bei der Registrierkasse erwähnt wird, hätte beispielsweise eine ,,während"-Verbindung zum Rezept für „Warteschlange"; der Zustand „warten in einer Arztpraxis" hätte „während"-Verbindungen zu möglichen Verhaltensweisen in einem Wartezimmer. Von dem Zustand „warten während der Eisenbahnfahrt" könnten „während"Verbindungen zu den Aktivitäten „Essen im Speisewagen" oder „Gespräch mit einem neuen Bekannten" ausgehen. Die von einer Proposition mit dem Zustand WARTEN ausgehende BegründungsVerbindung weist auf die Handlung, durch deren Vollzug der erwartete Zustand hergestellt wird. Die Proposition (WARTEN REISENDER (LOC IN ZUG (Eisenbahnstation ZU) W) W) wird also eine Begründungs-Verbindung zu dem Rezept für „Transportieren" haben; das intendierte Hauptresultat dieses Rezeptes ist, daß das transportiere Objekt — in unserem Fall der REISENDE — sich am Ort ZU befindet.
226
Rezepte und Retuschen bei Inferenz- u n d Verstehensprozessen
3. Verstehen mit Hilfe der Inferenzregeln In diesem Abschnitt soll beschrieben werden, auf welche Weise ein System unter Anwendung des Rezeptes für „Eisenbahnfahren" und der weiter oben behandelten Inferenzregeln den am Anfang des vorherigen Abschnittes aufgeführten Dialog durchführen kann. Dabei wird allerdings nicht auf das Problem der linguistischen Satzanalyse eingegangen, und es soll angenommen werden, daß ein Algorithmus besteht, der die eingegebenen Sätze in die gleiche Form transformiert, die bislang zur Beschreibung von Zuständen benützt wurde. Diese, auch von Charniak (1976) gemachte Annahme beruht nicht auf der Einstellung, daß ein erfolgreiches Modell der Wissensstruktur auch die Lösung des Problemes der Satzanalyse impliziere; sie bildet lediglich eine von verschiedenen Möglichkeiten, ein breites Problem in verschiedene Teilprobleme aufzugliedern. Nach der — fiktiven — Analyse des ersten Satzes wird das System also folgende Proposition aufgebaut haben: INTENDIEREN Hans (reisen Hans VON Zürich MITTELS) W) W) Die Rolle MITTELS in dem Handlungshinweis für „reisen" steht dabei für das Verkehrsmittel oder die Art der Bewegung, die zu diesem Zeitpunkt der Analyse noch unbekannt sind. Es soll nun angenommen werden, daß die in Paragraph 1 formulierte Restriktion die Anwendung von (R5) nach der Analyse des ersten Satzes verhindert. Da damit keine Rezepte aktiviert sind, kann nur ( R l ) angewendet werden, und das System inferiert, daß (INTENDIEREN Hans (LOC IN Hans Zürich W) W) Schon diese Inferenz erlaubt eine provisorische Antwort auf die erste Frage: Hans wollte nach Zürich reisen, weil er dort sein wollte. Es ist interessant u n d bedeutsam, daß eine solche Antwort in einem Gespräch üblicherweise nur dann gegeben wird, wenn der Antwortende den Frager informieren will, daß er die gestellt Frage nicht beantworten will. Ein anderes Beispiel in diesem Sinne wäre etwa der Dialog: F: Warum kaufst du all diese teuren Möbel? A: Weil ich sie haben will. Bei der Frage nach dem „ w a r u m " einer Handlung will der Fragende entweder wissen, warum dieser Handlung gegenüber einer anderen Handlung mit dem gleichen Resultat der Vorzug gegeben wird, oder warum der Partner das Resultat dieser Handlung für erstrebenswert hält. Die Tatsache jedoch, daß der Aktor einer Handlung deren unmittelbare Hauptresultate produzieren will, ist eine direkte Inferenz und steht d ä m m nicht in Frage. Da nach der Eingabe des ersten Satzes keine weiteren Inferenzen
Verstehen mit Hilfe der Inferenzregeln
227
durchgeführt werden, weiß das System also nicht, warum Hans nach Zürich reisen wollte. Es kann auch nur Vermutungen über das „wie" der Handlung anstellen. Diese Vermutungen können durch die Anwendung von (R7) gefunden werden: Unter der Annahme, daß das System weiß oder inferiert hat, daß sich Hans in einer anderen Stadt als Zürich befindet, wird es nach einem Rezept für eine Ortsveränderung suchen, bei dem das Objekt eine Person ist und VON und ZU zwei verschiedene Städte sind. Diese drei Restriktionen befriedigen die Rezepte für „Autofahren", „Eisenbahnfahren" und „Flugreisen". Nach der Analyse der zweiten Proposition wendet das System zunächst wiederum ( R l ) an. Da auch jetzt immer noch kein Rezept aktiviert wurde, können (R2) und (R3) nicht angewendet werden. Das System vollzieht nun (R5) und aktiviert damit zum ersten Mal ein Rezept, das Rezept für „Eisenbahnfahren". Da die zweite Proposition eine Teilhandlung dieses Rezeptes beschreibt, wird davon eine Retusche aufgebaut. Dabei wird die Proposition (LOC IN Hans Bahnhof W) die durch ( R l ) inferiert wurde, mit der ersten Proposition des Korpus dieses Rezeptes amalgamiert. Wann immer durch das System nach dem „ w a r u m " einer Handlung gefragt wird, sucht es danach, o b das Resultat dieser Handlung eine Proposition aus dem Korpus eines aktiven Rezeptes sein könnte. Ist dies der Fall, dann ist die Antwort des Systemes der Name dieses Rezeptes oder die Erwähnung von dessen intendiertem Hauptresultat. Wenn die Handlung, nach derem „warum" gefragt wird, jedoch nicht Teil eines aktiven Rezeptes ist, dann sucht das System nach einer Kausal- oder „hergestellt-für"-Verbindung, die von dieser Handlung ausgeht. Wird eine solche Verbindung gefunden, dann wird als Antwort der Inhalt geäußert, auf den diese Verbindung verweist. Besteht jedoch keine solche Verbindung, dann werden im GRUENDLICHModus die Regeln ( R l ) bis (R3) angewendet, um eine kausale Verbindung zwischen der eingegebenen und einer anderen Proposition zu finden. In unserem Beispiel genügt der erste dieser drei Mechanismen, um die „warum"-Fragen zu den Propositionen (b) und (c) zu beantworten. Da in dem Rezept für „Eisenbahnfahren" dem Zustand (LOC IN REISENDER (Eisenbahnstation VON) W) keine nhd-Verbindung zugeordnet ist, kann die Antwort auf die „wie"-Frage zur zweiten eingegebenen Proposition durch die gleichen Mechanismen gefunden werden, die bei der Beantwortung der ersten „wie"-Frage angewandt wurden. Die Antwort auf die „wie"Frage in (c) wird durch die Anwendung von (R6) gefunden, d. h. mit Hilfe der nhd-Relation, die von dem Zwischenzustand
228
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
(POSS REISENDER F A H R K A R T E ( . . . ) W) ausgeht. Bis zu diesem Zeitpunkt genügte eine direkte Anwendung der in den Abschnitten 1 und 2 formulierten Inferenzregeln, um die eingegebenen Propositionen zu verarbeiten und die Fragen zu beantworten. Dies ist jedoch bei der Analyse des Satzes (d) Er mußte fast eine Stunde lang warten, nicht mehr möglich. In Abschnitt 2 wurde WARTEN als ein komplexer Zustand beschrieben, dem Inferenzregeln zugeordnet sind. Dieser Zustand hat zwei Argumente: der WARTENDE und der Zustand, AUF den man wartet. Die Frage, welche Person in Proposition (d) die Rolle des WARTENDEn einnimmt, kann auf der Basis ausschließlich syntaktischer Regeln entschieden werden, da in der Geschichte lediglich ein menschlicher Aktant erwähnt wurde. Schwieriger ist jedoch die Entscheidung, welcher Zustand dem Argument AUF entspricht. Einer der Zwischenzustände des Rezeptes für „Eisenbahnfahren" ist die Proposition (WARTEN REISENDER (LOC IN ZUG (Eisenbahnstation ZU) W) W) Man könnte deshalb annehmen, daß das System durch die Anwendung von (R2) inferiert, daß Hans auf die Ankunft des Zuges in Zürich wartet. Eine solche Annahme widerspräche jedoch unmittelbar unserer Intuition. Es bestehen — mindestens — drei Möglichkeiten, um einen solchen Fehler zu vermeiden: Zum einen könnte man tolerieren, daß der Verstehende die Proposition zunächst falsch interpretiert, wobei man annimmt, daß diese falsche Interpretation in einem späteren Zeitpunkt der Analyse korrigiert werden müßte. Der wichtigste Einwand gegen ein solches Vorgehen ist, daß eine solche falsche Interpretation schon zu diesem Zeitpunkt der Analyse von einem menschlichen Subjekt als falsch bezeichnet würde. Eine andere Möglichkeit zur Vermeidung dieses Fehlers könnte darin bestehen, den Korpus des in Abb. 36 gezeigten Rezeptes für „Eisenbahnfahren" um die Proposition zu erweitern, daß der REISENDE auf die Ankunft des ZUGes im Bahnhof VON wartet. Der folgende Text zeigt jedoch, daß auch diese Lösung unbefriedigend ist: „Hans wollte mit dem Zug nach Zürich reisen. Als er am Bahnhof ankam, bemerkte er, daß der Zug schon da war. Er stieg ein und setzte sich in ein zweiter Klasse Abteil. Er mußte fast eine Stunde lang warten." Auch hier muß man annehmen, daß Hans nicht darauf wartet, daß der Zug in Zürich eintrifft. Er wartet vielmehr darauf, daß der Zug abfährt. Eine bessere Lösung für dieses Problem kann dann gefunden
Verstehen mit Hilfe der Inferenzregeln
229
werden, wenn man berücksichtigt, daß die Bedeutung der semantischen Zustandskategorie WARTEN nicht notwendigerweise mit der Bedeutung des deutschen Verbes „warten" übereinstimmen muß. In Abschnitt 2 wurde die Bedeutung der Zustandskategorie WARTEN durch eine Inferenzregel wie folgt definiert: Der Zustand WARTEN kann dann beobachtet werden, wenn der WARTENDE annimmt, dass ein bestimmter anderer Zustand realisiert werden wird, der vom WARTENDEN normalerweise nicht selbst hergestellt werden kann. Die Bedeutung des deutschen Verbes „warten" unterscheidet sich von dieser „Definition" insofern, als das Verb in ail denjenigen Fällen nicht benützt werden kann, in denen der WARTENDE sich auf das gewünschte Ziel hinbewegt. Dabei spielt es keine Rolle, ob der WARTENDE die Bewegung selbst verursacht oder ob er passiv bleibt. Zumindest bei meinem Gebrauch des Verbes „warten", wartet man nicht in einem sich bewegenden Zug — es sei denn, man sitze im Speisewagen und warte auf das Essen. Ebenso wartet man auch nicht in einem sich bewegenden Flugzeug, Autobus oder Aufzug. (Ein möglicher Grund für diese Eigenheit könnte sein, daß sich der heutige Gebrauch des Verbes „warten" zu einer Zeit entwickelte, in der das Pferd das einzige Transportmittel darstellte; Reiter versichern mir, daß das Reiten eines Pferdes eine echte Aktivität sei.) Das Wissen, daß die semantische Zustandskategorie WARTEN nicht in edlen Fällen durch das deutsche Verb „warten" beschrieben werden kann, sollte im Algorithmus für die linguistische Satzanalyse enthalten sein. Damit kann das Problem, auf die Verwirklichung welches Zustandes Hans wartet, relativ einfach entschieden werden: Das System versucht, die in Abschnitt 2 beschriebene Inferenzregel für den Zustand WARTEN für alle Zwischenzustände von „Eisenbahnfahren" anzuwenden, die auf die Proposition POSS R E I S E N D E R Fahrkarte ( )W folgen. Dabei wird schon der erste Versuch erfolgreich sein, da der Zustand LOC IN ZUG (Eisenbahnstation VON) W nicht vom REISENDEn selbst hergestellt wird. Das System kann daraus inferieren, daß Hans darauf wartet, daß der ZUG im Bahnhof eintrifft. Da dem Zustand WARTEN keine nhd-Verbindung beigeordnet ist, kann (R7) nicht Eingewendet werden, und das System findet deshalb keine Antwort auf die „wie"-Frage bei Proposition (d). Für die Beantwortung der ,,warum"-Frage bei Proposition (e) wird das System wiederum nicht das unmittelbare Resultat der Handlung Er ging in eine Gaststätte, weil er dort sein wollte.
230
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
nennen. Das in einer Proposition enthaltene Wort „Gaststätte" ermöglicht die Anwendung von (R5) u n d damit die Aktivierung des Rezeptes für „Besuch einer Gaststätte". Das intendierte Haupt-Resultat dieses Rezeptes ist GEFUEHL HUNGER GAST F und das System kann durch Anwendung von (R4) inferieren, daß Hans in die Gaststätte ging, weil er hungrig war. Zur Beantwortung der ,,wie"-Frage zu Proposition (e) werden die gleichen Prozesse durchgeführt wie bei Proposition (b). Wenn man annimmt, daß dem Zwischenzustand (LOC IN GAST GASTSTÄTTE W) im Rezept für „Besuch einer Gaststätte" nhd-Verbindungen zu den Rezepten für „gehen", „Taxifahren" usw. zugeordnet sind, dann kann die Antwort unmittelbar durch die Anwendung von (R6) gef u n d e n werden. Beim Fehlen von solchen, diesem Zwischenzustand zugeordneten nhd-Verbindungen müßte das System versuchen, die „warum"-Frage zu Proposition (e) durch die Anwendung von (R7) zu beantworten. Die bislang beschriebenen Wissensinhalte würden dabei allerdings nicht ausreichen, um eine befriedigende Antwort zu finden: Die der Zustandskategorie LOC zugeordneten nhd-Verbindungen verweisen auf verschiedene Arten von Ortsveränderungen wie „fliegen", „reisen", „fallen" usw. Die adäquate Antwort in dem obigen Beispiel wäre die Handlung „gehen"; man kann dies annehmen, weil Hans nur eine Stunde Zeit hatte und deshalb in ein nahe gelegenes Gasthaus in weniger als einem Kilometer Entfernung ging. Das System müßte also über das Wissen verfügen, daß die Handlung „gehen" bei relativ kurzen Distanzen zwischen VON u n d ZU gewählt wird. Die Formalisierung dieses Wissens in den Prärequisiten des entsprechenden Rezeptes wäre unproblematisch; ungelöst bleibt jedoch das Problem, wie Kenntnisse über räumliche Relationen repräsentiert werden können, so ζ. B. die Kenntnis, wie weit die nächstgelegene Gaststätte normalerweise entfernt ist.
4. Ohne Billet ins Kino gehen Die nächste Geschichte bildet ein weiteres Beispiel dafür, daß die Gründe für den Vollzug von Teilhandlungen in den Handlungsrezepten enthalten sein sollten. Hans ging ins Kino. Er bezahlte nicht. Die Platzanweiserin wurde wütend.
231
Ohne Billet ins Kino gehen
Das Verstehen dieser Geschichte könnte durch die folgenden Fragen überprüft werden: Wem hat Hans nicht bezahlt? (a) Frage Dem Kino. Antwort Was bezahlte er nicht? (b) Frage Antwort Die Eintrittsgebühr. Warum bezahlte er nicht? (c) Frage Weil er das Geld behalten wollte. Antwort Warum wurde die Platzanweiserin wütend? (d) Frage Antwort Weil er hätte bezahlen sollen. Warum kümmerte sie sich darum? (e) Frage Weil sie für das Kino arbeitet. Antwort Um diese Fragen auf die beschriebene Weise sinnvoll zu beantworten, m u ß man zunächst einmal über Kenntnisse in den folgenden drei Wissensgebieten verfügen: Was normalerweise geschieht, wenn man ins Kino geht; die Regeln des Geschäftslebens; was eine Platzanweiserin mit dem Kino zu tun hat. Abb. 38 zeigt ein unvollständiges Rezept für „ins-Kino-gehen". Während in den früheren Beispielen dieses Kapitels die zeitlichen Aspekte unberücksichtigt blieben, findet sich im Prärequisit dieses Rezeptes der Hinweis, daß die Handlung nur zur Zeit der Darbietung des Filmes stattfinden kann. Weder der semantische Gehalt des Begriffes J E T Z T , noch derjenige des komplexen Zustandes ZEIGEN sind jedoch in diesem Zusammenhang bedeutsam. Die Aussage, daß der Aktor beim Kino sein muß, ist Teil des Korpus und kein Prärequisit, weil der Weg zum Kino Teil der beschriebenen Handlung ist. Das Vorführen des Films geschieht jedoch unabhängig davon, ob der Aktor ins Kino geht, und ist deshalb ein Prärequisit dieses Rezeptes. Abb. 38: Schema für „ins-Kino-gehen" [ins-Kino-gehen Rollen: AKTOR KINO FILM EINTRITT Prärequisite: ZEIGEN KINO FILM JETZT Korpus: LOC DISTANZ AKTOR KINO BEI POSS KINO EINTRITT W LOC IN AKTOR (Sitz in Kino) W [—»SEHEN AKTOR FILM Τ I.H.-R.: (AKTOR) Z I
1
Im Gegensatz etwa zum Rezept für „essen" ist das intendierte Hauptresultat hier zugleich eine Proposition aus dem Korpus. Die dem Resultat zugeordnete Proposition kann deshalb durch einen Hinweis auf die entsprechende Proposition im Korpus repräsentiert werden.
232
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
Nach der Analyse des ersten Satzes baut das System eine Retusche auf, die eine Instanz des Rezeptes für „ins-Kino-gehen" bildet. Diese Retusche enthält Pfeile zu dem Knoten für „Hans" und zu den ebenfalls neu aufgebauten Knoten für „Kino 1", „Film 1" und „Eintrittsgebühr 1". Durch Anwendung der Regeln ( R l ) und (R2) kann der zweite Satz mit der entsprechenden Proposition aus dem Korpus assoziiert werden und das System inferiert, daß Hans die Eintrittsgebühr nicht dem Kino bezahlt hat. Erhält das System einen Satz, durch welchen eine Proposition aus einem aktiven Rezept verneint wird, dann laufen die gleichen Prozesse ab, wie bei der Eingabe von anderen Sätzen, die nicht Teil eines aktiven Rezeptes sind: Durch die Anwendung von (R3) soll bestimmt werden, warum der entsprechende Zustand hergestellt, bzw. nicht hergestellt wurde. Der eingegebene Text erlaubt es jedoch nicht, dieses Problem zu lösen; denn es wird nicht gesagt, daß Hans intendierte, daß das Kino die Eintrittsgebühr nicht besitzt. Das System m u ß deshalb auf die allgemeinen Wissensinhalte zurückgreifen und findet hier als Resultat der Handlung „bezahlen", daß der Bezahlende das bezahlte Geld nicht mehr besitzt. Dieses Resultat widerspricht dem allgemeinen Motiv (INTENDIEREN jemandi (POSS jemand; Geld W) W) Damit kann Frage (c) beantwortet werden. An diesem Punkt der Analyse weiß das System noch nicht, warum Hans bezahlen sollte. Dieses Wissen ist jedoch nicht Teil des Rezeptes für „ins-Kino-gehen"; denn bei einem üblichen Kinobesuch ist dieser Inhalt nicht bedeutsam: Man m u ß einfach bezahlen und damit ist die Sache erledigt. Andererseits ist die Kenntnis, warum man die Eintrittsgebühr bezahlen muß, für die Beantwortung der Fragen (c) u n d (d) notwendig. Dieses Wissen ist im Rezept für „Geschäftsleben" enthalten, das mit dem Zustand POSS KINO EINTRITT W durch einen Begründungs-Pfeil verbunden ist. Dieses Schema bildet den oberen Teil von Abb. 39. Zudem zeigt diese Abbildung, wie die beiden Rezepte für „ins-Kino-gehen" und für „Geschäftsleben" miteinander verbunden sind. Das Rezept für „Geschäftsleben" könnte wie folgt paraphrasiert werden: Geschäftsakte sind möglich, wenn ein Kunde möchte, daß ein bestimmter Zustand (K-ZUSTAND) produziert wird, wenn er das Geld (PREIS) hat, um dafür zu bezahlen, und wenn ein Geschäft in der Lage ist, bestimmte Handlungen (G-AKT) durchzuführen, durch welche der gewünschte Zustand produziert wird. Der Geschäftsakt besteht darin, daß das Geschäft diese Handlungen durchführt, und
233
Ohne Billet ins Kino gehen
daß der K u n d e i h m das Geld gibt. Das G e s c h ä f t tut dies darum, weil es das Geld erhalten m ö c h t e , u n d der K u n d e , weil er den aus der Handlung des G e s c h ä f t e s resultierenden Zustand erstrebt. Abb. 39: Der Zusammenhang zwischen den beiden Rezepten für „Geschäftsleben" und für „ins-Kino-gehen" [Geschäftsleben " Rollen: GESCHÄFT KUNDE G-AKT K-AKT PREIS K-ZUSTAND Prärequisite: INTENDIEREN KUNDE K-ZUSTAND W POSS KUNDE PREIS W FÄHIGKEIT GESCHÄFT G-AKT ERMÖGLICHEN G-AKT K-ZUSTAND Korpus: K-ZUSTAND Τ nhd I POSS GESCHÄFT PREIS nhd
> G-AKT
- > K-AKT
η I.H.-R. (KUNDE) * I.H.-R. (GESCHÄFT) [ins-Kino-gehen Rollen: AKTOR KINO FILM EINTRITT Prärequisite: ZEIGEN KINO FILM JETZT >fe Korpus: POSS KINO EINTRITT W I.H.-R. (AKTOR) *
t
Grund
D a die Handlung des G e s c h ä f t e s in der Regel darin b e s t e h t , e t w a s z u verkaufen, ist der K - Z U S T A N D in der Regel P O S S u n d der GA K T in der Regel die Handlung „verkaufen". Bei einer R e i h e v o n ges c h ä f t l i c h e n H a n d l u n g e n ist dies j e d o c h nicht der Fall; so e t w a bei
234
Rezepte und Retuschen bei Inferenz- und Verstehensprozessen
der Behandlung durch einen Arzt, beim Benützen öffentlicher Verkehrsmittel oder in dem hier analysierten Beispiel beim Besuch eines Kinos. Da in dem Rezept spezifiziert ist, daß die Handlung des Kunden immer ein Bezahlen ist, müssen Tauschgeschäfte durch ein anderes Rezept beschrieben werden. Nach der Analyse des zweiten Satzes der Geschichte wird durch die Anwendung von ( R 9 ) inferiert, daß (POSS K i n o l (Eintritt von Hans) F). Durch die Anwendung von (R8) und dem allgemeinen Wissen, daß (INTENDIEREN jemandl (POSS jemandl Geld W) W) kann gefunden werden, daß (INTENDIEREN Kino (POSS Kino (Eintritt von Hans) F) F) und damit (INTENDIEREN Kino (POSS Kino (Eintritt von Hans) W) W) Durch diese inferierten Propositionen kann nun der dritte Satz durch die folgenden Prozesse mit dem Rest der Geschichte verbunden werden: Da die aktiven Retuschen keine Aussagen über die Platzanweiserin enthalten, und da auch keine Propositionen über die Intentionen der Platzanweiserin existieren, wird (RIO) durchgeführt. Dabei findet das System, daß die Platzanweiserin ein Mitglied der Gruppe ,,Kino" bildet, und kann inferieren, daß die Platzanweiserin darum möchte, daß das Kino die Eintrittsgebühr von Hans besitzt. Dieses Wissen erlaubt die Beantwortung der Fragen (d) und (e).
IX. DER INHALTLICHE ABLAUF VON DIALOGEN
1. Die Bedeutsamkeit pragmatischer Faktoren für die sprachliche Kommunikation In diesem und dem folgenden Kapitel soll ein Modell des sprachlichen Dialoges und der Generierung von Sätzen beschrieben werden, das auf den bislang geschilderten Annahmen über die Struktur des semantischen und episodischen LZG basiert. Im Gegensatz zum letzten Kapitel, in dem die Transformation sprachlicher Sätze in Strukturen des episodischen Gedächtnisses dargestellt wurde, handeln die folgenden Abschnitte von der Transformation von Wissensinhalten in natürlichsprachliche Sätze. Allerdings sind die Ausführungen der beiden Kapitel zueinander nicht reziprok. Zum einen handelt es sich bei der Satzanalyse und der Satzgenerierung um so verschiedene Vorgänge, daß sie nur schwer zueinander in Beziehung gesetzt werden können; zum anderen werden die Ausführungen zur Satzgenerierung allgemeiner sein als diejenigen zum Satz verstehen: Die Überlegungen zum Satzverstehen in Kap. VIII beschränkten sich hauptsächlich auf die Analyse der dabei ablaufenden Inferenzprozesse, wobei alle anderen Mechanismen, wie ζ. B. die syntaktischen Aspekte der Satzanalyse, unberücksichtigt blieben. Im Gegensatz dazu sollen in den Ausführungen dieses und des folgenden Kapitels möglichst viele Faktoren, die für die Generierung von Sätzen relevant sind, behandelt werden. Dabei kann gezeigt werden, daß die von Simmons und von Goldman entwickelten Vorstellungen, die in den Kapiteln IV und V beschrieben wurden, lediglich einen Ausschnitt der Prozesse beschreiben, die für die Sprachproduktion verantwortlich sind. Simmons und Goldman schildern die Satzgenerierung als einen Prozeß, der in folgenden beiden Stufen abläuft: In einem ersten Schritt wird die semantische Tiefenstruktur des zu bildenden Satzes ausgewählt, die bei Simmons die Form einer Proposition im semantischen Netzwerk und bei Goldman die Form einer Konzeptualisation der Schankschen Dependenztheorie hat. Zusätzlich dazu werden gewisse syntaktische Merkmale des zu generierenden Satzes bestimmt, so ζ. B., ob es sich um einen aktiven oder passiven Satz handeln soll, oder welches Satzglied an den Anfang des Satzes zu stehen kommen soll. Das eigentliche Programm für die Satzgenerierung erhält dann le-
236
Der inhaltliche Ablauf von Dialogen
diglich diese beiden Informationen, die semantische Tiefenstruktur und syntaktische Markierungen, als Eingangsdaten und bildet auf deren Grundlage den entsprechenden Satz. Im Gegensatz zu diesem, von Simmons und Goldman beschriebenen Zwei-Stufen-Modell wird hier von folgenden Vorstellungen über den Prozeß der Satzgenerierung ausgegangen: In Gesprächssituationen, d. h. in Situationen, in denen die zur sprachlichen Kommunikation notwendigen Randbedingungen erfüllt sind, werden die wahrgenommenen sprachlichen und nicht-sprachlichen Reize nach bestimmten, weiter unten ζ. T. beschriebenen Regeln mit dem Wissen im LZG verglichen. Dabei werden fortwährend Inhalte aus dem LZG aktiviert. Mit Hilfe der Kenntnisse über den situativen und sprachlichen Kontext, über das Wissen des Gesprächspartners und über verschiedene andere soziale Faktoren wird dann überprüft, o b die aktivierten Inhalte ganz oder teilweise geäußert werden sollen. Die Gesamtheit der Wissensinhalte, die für die Bildung eines Satzes relevant sind, soll im folgenden als Satzbasis bezeichnet werden. Diese Satzbasis setzt sich zusammen aus dem Wissen, welches den Inhalt der Aussage, u n d dem Wissen, welches die soziale Situation und den Gesprächspartner betrifft. Die erste Art von Wissen soll im folgenden als die inhaltliche Basis, die zweite Art als die pragmatische Basis des Satzes bezeichnet werden. Die inhaltliche Basis des Satzes kann nun wiederum unterteilt werden einerseits in die Aussage des Satzes im engeren Sinn und andererseits in diejenigen Inhalte, die zwar die Form des Satzes mitbestimmen, ohne jedoch Teil der Aussage zu sein. Diese Inhalte sollen im folgenden als die Präsuppositionen des Satzes bezeichnet werden. Diese Gliederung, wie auch die hier beschriebenen Vorstellungen über die Satzproduktion, sollen an folgendem konstruierten Beispiel verdeutlicht werden: Person Α sagt zu Person Β in irgendeinem Zusammenhang: Hans ist ein ehrlicher Mensch. Β wird darauf diese Aussage mit dem Wissen über Hans, das er im episodischen Gedächtnis gespeichert hat, vergleichen. Dabei findet er den Wissensinhalt, daß Hans seiner älteren Schwester die Tassen gestohlen hat. Mit Hilfe von Inferenzregeln, die den Begriffen „ehrlich" und „stehlen" zugeordnet sind, wird Β zunächst einen Widerspruch zwischen der Aussage von Α und seinem eigenen Wissen feststellen. Als nächstes wird Β überprüfen, ob anzunehmen ist, daß Α von diesem Diebstahl weiß. Ist dies nicht der Fall, dann wird er Α darüber orientieren, warum er dessen Aussage unglaubwürdig findet. Die entsprechende Äußerung könnte in diesem Fall etwa lauten: Aber er hat meiner älteren Schwester die Tassen gestohlen.
Bedeutsamkeit pragmatischer Faktoren für sprachliche Kommunikation
237
Neben dem Wissen, das die Aussage dieses Satzes bildet, basiert die Antwort von Β auf zwei weiteren Arten von Kenntnissen: Dem pragmatischen Wissen, ζ. B. daß der Diebstahl Α unbekannt ist, und den Präsuppositionen, ζ. B. daß er mehr als eine Schwester hat; die Verwendung des Ausdruckes „meine ältere Schwester" basiert auf dieser Präsupposition. Die folgenden Wissensinhalte (a) bis (k) bilden eine mögliche Satzbasis für die Äußerung von Β in dem oben beschriebenen Kontext. (a) Hans hat Hanna die Tassen gestohlen. (b) Hanna ist die Schwester von B. (c) Β hat noch eine andere Schwester als Hanna. (d) Diese Schwester ist jünger als Hanna. (e) Leute, die stehlen, sind unehrlich. (f) Α glaubt, daß Hans ehrlich sei. (g) Α weiß nicht, daß (a). (h) Α weiß nicht, daß (b). (i) Α glaubt (e). (j) Wenn ich Α sagen werde, daß (a), dann wird er mir dies glauben, (k) Es ist wünschenswert, daß Α glaubt, daß (a) der Fall ist. Dabei ist (a) die Aussage des Satzes, die Inhalte (b) bis (e) sind Präsuppositionen, und die Inhalte (f) bis (k) sind Teil der pragmatischen Basis des Satzes. Die skizzierten Vorstellungen über die Satzbildung, die in den folgenden Abschnitten konkretisiert werden sollen, stimmen in den meisten grundsätzlichen Annahmen mit der Theorie der Sprechakte überein. Diese, von Searle (1969) entwickelte Theorie beschreibt die sprachlichen Handlungen, die sog. lokutiven Akte, als soziale Geschehen, die unter zwei Aspekten betrachtet werden können. Zum einen bilden sie eine soziale Handlung des Sprechers, wobei eine bestimmte Aussage, je nach der Situation, in der sie gesprochen wird, verschiedene soziale Handlungen wie Drohen oder Versprechen darstellen kann. Unter diesem Aspekt betrachtet wird die Sprechhandlung von Searle als illokutiver Akt bezeichnet. Als illokutive Verben bezeichnet er Wörter wie „drohen", „versprechen" oder „schmeicheln", durch die spezifiziert wird, welche Art von sozialer Handlung der Sprechakt darstellt. Zudem kann jede Sprechhandlung unter dem Aspekt betrachtet werden, daß sie beim Hörer eine bestimmte Wirkung hervorruft, sei dies eine Handlung oder eine Veränderung seines Wissens. Unter diesem Aspekt betrachtet, bezeichnet Searle Sprechhandlungen als perlokutive Akte; perlokutive Verben wären dann etwa „überzeugen", „alarmieren", „inspirieren" usw. Eine Analyse der Bedeutungen von illokutiven Verben zeigt, daß illokutive Akte sehr komplexe soziale Geschehen darstellen. So be-
238
Der inhaltliche Ablauf von Dialogen
steht etwa der illokutive A k t „versprechen" in der Analyse von Searle aus folgenden K o m p o n e n t e n : (1) Durch das Äußern des Satzes S a drückt der Sprecher S p eine Aussage ρ aus. (2) Durch die Aussage ρ bestimmt S p einen zukünftigen A k t A , den er durchführen wird. (3) Der Hörer Η zieht es vor, daß S p den A k t Α vollzieht, als daß S p den A k t Α nicht vollzieht. (4) S p glaubt, daß (3) zutrifft. (5) E s ist weder für Sp, noch für Η selbstverständlich, daß S p den Akt Α unter normalen Umständen vollzieht. (6) S p intendiert, Α zu tun. (7) S p intendiert, durch das Äußern des Satzes Sa die Verpflichtung zu übernehmen, Α zu tun. (8) S p möchte Η wissen lassen, daß das Äußern von Sa ihn verpflichtet, Α zu tun. Dieses Wissen soll dadurch übermittelt werden, daß Η die Bedeutung von Sa erkennt (dies ist eine Vereinfachung der entsprechenden von Searle beschriebenen Regel). (9) Die semantischen Regeln der Dialekte von Sp und von Η sind derart, daß S a dann und nur dann korrekt und ernsthaft geäußert wird, wenn die Bedingungen (1) bis (8) zutreffen. Die erwähnte Übereinstimmung zwischen dem hier geschilderten Modell und der Sprechakttheorie betrifft insbesonders die in dieser Theorie vertretene Perspektive, unter welcher der Gebrauch von Sprache als sozialer Akt verstanden wird, in der die Wahl der Äußerung durch den vom Sprecher verfolgten Zweck bestimmt wird. Diese Betrachtungsweise der Sprache findet sich allerdings nicht erst in der Sprechakttheorie, sondern bereits in dem Bühlerschen Organon-Modell (Bühler, 1 9 3 4 ) oder beim späten Wittgenstein ( 1 9 5 8 ) . In zumindest zwei Punkten unterscheidet sich jedoch der in diesem Kapitel beschriebene Ansatz von der Sprechakttheorie: Die in der Sprechakttheorie enthaltene Analyse der illokutiven Akte kann insofern als finale Betrachtungsweise der sprachlichen Kommunikation bezeichnet werden, als die Generierung von Sätzen und die Wortwahl lediglich als Funktion des vom Sprecher verfolgten Zieles beschrieben wird. Die Theorie geht j e d o c h nicht darauf ein, unter welchen Bedingungen die verschiedenen Arten von illokutiven Akten stattfinden. Dies ist vor allem darum unbefriedigend, weil mit einer solchen Art von Theorie nicht vorausgesagt werden kann, wann ein bestimmter Sprechakt auftritt. Das Fehlen von solchen Regeln hat zur Folge, daß Aussagen der Sprechakttheorie für die Erklärung sprachlicher Ereignisse ebensowenig nützlich sind, wie beispielsweise die Sätze „ E r ißt, weil er Hunger h a t " oder ,,Er geht fort, weil er es
Bedeutsamkeit pragmatischer Faktoren für sprachliche K o m m u n i k a t i o n
239
will" für die Erklärung des Essens oder Fortgehens. Dieser Einwand betrifft lediglich die Brauchbarkeit der Sprechakttheorie zur Erklärung sprachlicher Ereignisse innerhalb eines Verhaltensmodelles und nicht den Wert dieser Theorie im allgemeinen. Die von Searle (1969) geleistete Analyse illokutiver Verben kann als Beitrag zur Soziolinguistik betrachtet werden; denn er beschreibt die möglichen sozialen Funktionen von Sprechhandlungen. Man kann nun, über das Anliegen von Searle hinausgehend, danach fragen, ob diese Art von Analyse auch als Beitrag zur Wortsemantik betrachtet werden kann. Dies würde bedeuten, die von Searle gegebenen Beschreibungen illokutiver Akte zugleich als Bedeutungsanalysen der entsprechenden Verben zu betrachten, vergleichbar den Aufschlüsselungen der Verbbedeutungen von Schänk (1973a). Dies soll in folgendem anhand der Analyse des Sprechaktes und Verbes „drohen" geschehen. Eine Analyse des Sprechaktes „drohen" nach der Art von Searle würde drei Bedingungen angeben, unter denen die entsprechende Sprechhandlung zutrifft: 1. Der Sprecher Sp erwähnt, daß ein zukünftiges Ereignis E l stattfinden kann. 2. Sp nimmt an, daß der Hörer Η das Ereignis E l nicht gerne hat. 3. Sp sagt (oder setzt als Wissen von Η voraus), daß Η durch das Produzieren, bzw. nicht-Produzieren von einer zweiten Handlung E2 Sp veranlaßt, E l nicht durchzuführen. Diese drei Bedingungen sind etwa in dem folgenden Satz gegeben: Für den Fall, daß seine Bedingungen nicht erfüllt würden, drohte der Entführer, das Flugzeug zu sprengen. Andererseits lassen sich leicht Beispiele konstruieren, in denen die oben genannten drei Bedingungen zutreffen, bei denen man jedoch zögern würde, die entsprechende Sprechhandlung als Drohung zu bezeichnen. Wenn ein Richter zu einer wegen Alkohol am Steuer angeklagten Person sagt: Wenn sie nochmals betrunken Auto fahren, dann werde ich ihnen den Führerschein abnehmen, dann ist dies, zumindest vom Richter aus gesehen, keine Drohung, sondern eine Warnung, Ankündigung oder Rechtsbelehrung. Der Richter wird beispielsweise nicht sagen: Ich drohe ihnen, ihnen den Führerschein wegzunehmen. Falls der Angeklagte jedoch der Ansicht ist, daß der Richter selbst bei einem Rückfall nicht das Recht habe, ihm den Führerschein abzunehmen, und daß diese Handlung einen Akt der Willkür darstellte, dann könnte er den Satz äußern: Der Richter hat mir gedroht, mir den Führerschein abzunehmen.
240
Der inhaltliche Ablauf von Dialogen
Man gebraucht die Wörter „drohen" und „Drohung" also nur, wenn man den kommentierten Sprechakt für verwerflich oder illegitim hält. Dieser Faktor läßt sich nur erfassen, wenn bei der Analyse nicht nur das zwischen Sprecher und Hörer ablaufende soziale Geschehen berücksichtigt wird, sondern auch die Einstellung des Kommentators, d. h. desjenigen, der den Sprechakt berichtet. Die oben gegebenen drei Bedingungen müssen also, will man die Bedeutung des Verbes „drohen" beschreiben, um eine vierte Bedingung erweitert werden: 4. Der Kommentator findet den von Sp durchgeführten Sprechakt verwerflich oder illegitim. Die Bedeutungsanalyse des Verbes „drohen" darf sich also nicht auf Faktoren beschränken, die den kommentierten Sprechakt bestimmen, sondern sie muß weitere Faktoren einbeziehen, die den kommentierenden Sprechakt betreffen. Mit Hilfe von einigen allgemeinen Annahmen über Motivationen und von den weiter oben beschriebenen Vorstellungen über Wissensstrukturen soll hier versucht werden, den in der Sprechakttheorie geschilderten finalen Ansatz in ein kausales Modell zu integrieren. Hat eine Aussage innerhalb des finalen Ansatzes die Form Der Sprecher macht eine Aussage, weil er will, daß der Hörer deren Inhalt weiß, dann hätte die entsprechende Aussage innerhalb des kausalen Ansatzes die Form Durch einen wahrgenommenen Inhalt wird beim Sprecher ein bestimmter Gedächtnisinhalt aktualisiert. Aufgrund seiner Vorstellungen über das Wissen des Hörers will er, daß dieser um diesen Gedächtnisinhalt weiß. Darum macht er eine bestimmte Aussage. Der zweite Punkt, in dem sich die hier geschilderten Vorstellungen von der Sprechakttheorie unterscheiden, betrifft den dort verwendeten Bedeutungsbegriff. Vertreter der Sprechakttheorie (ζ. B. Kallmeyer et al., 1 9 7 4 ) nehmen an, daß die Bedeutung einer Aussage nur unter Berücksichtigung des Kontextes, in der sie gemacht wird, verstanden werden kann. Die Bedeutung beispielsweise des Satzes Der Hund ist bissig, wäre also, j e nach Kontext Das ist ein guter Wachhund. oder Nimm dich in acht. Die Bedeutung dieser Warnung könnte dann durch eine Analyse nach der Art von Searle in folgende Komponenten zerlegt werden: (1) Wenn eine Person dem Hund zu nahe kommt, ist es möglich, daß der Hund diese Person beißt.
Bedeutsamkeit pragmatischer Faktoren für sprachliche Kommunikation
(2)
241
Ich (der Sprecher) nehme an, daß du (der Hörer) den Inhalt obiger Aussage nicht weißt. (3) Ich nehme an, daß du nicht gern gebissen wirst. (4) Durch die Äußerung der Warnung will ich erreichen, daß du nicht gebissen wirst. Nun muß man jedoch konsequenterweise die Bedeutungen jeder dieser vier Sätze angeben. So hat etwa Satz (4) u. a. folgende Bedeutung: (4') Ich will, daß du weißt, daß ich erreichen will, daß du nicht gebissen wirst. Diese Art von Bedeutungsanalyse kann dann rekursiv fortgesetzt werden: (4") Ich will, daß du weißt, daß ich will, daß du weißt, daß ich erreichen will, daß du nicht gebissen wirst. In der beschriebenen Form ist Satz (4") nur schwer verständlich. Dennoch lassen sich Situationen beschreiben, in denen der Satz Der Hund ist bissig, tatsächlich wegen des in (4") genannten Motives geäußert wird. Folgender fiktiver Dialog zwischen einem Mann (M) und seiner Freundin (W) gibt ein Beispiel einer solchen Situation: W: Du zeigst mir gar nicht, daß du mich gern hast. M: Auf welche Art sollte ich dies zeigen? W: Indem du mich beispielsweise auf gefährliche Situationen aufmerksam machst. M: Aber gefährliche Situationen kannst du so gut erkennen wie ich. W: Trotzdem, tu doch wenigstens so. Kurz nach diesem Dialog, begegnet das Paar einem Hund und Μ sagt: Dieser Hund ist bissig. Er tut dies nicht, u m W zu warnen (Bedeutung (4)); er tut es auch nicht, um W zu zeigen, daß er sie auf eine gefährliche Situation aufmerksam macht (Bedeutung (4')), sondern er tut es, u m W seinen guten Willen zu zeigen, auf ihren Wunsch einzugehen (Bedeutung (4")). Dieses Beispiel zeigt jedoch lediglich, daß die in der Sprechakttheorie beschriebenen sehr komplexen Motive für illokutive Akte selbst dann bedeutsam sein können, wenn sie zunächst „an den Haaren herbeigezogen" wirken. Dies ist jedoch noch kein ausreichender Grund, diese pragmatischen Aspekte als Teil der Satzbedeutung zu betrachten, eine solche Aufhebung des Unterschiedes zwischen Satzbedeutung einerseits und pragmatischen Faktoren andererseits wird in der Sprechakttheorie und der Textlinguistik damit begründet, daß Sätze nur unter Berücksichtigung des situativen Kontextes verstehbar seien. Dieses Argument ist jedoch schlichtweg falsch: Wenn ich
242
Der inhaltliche A b l a u f von Dialogen
einen Telephonanruf bekomme, und am anderen Ende der Leitung sagt eine mir unbekannte Stimme lediglich den Satz Gestern ist J e a n Gabin gestorben, dann verstehe ich diesen Satz. Obwohl ich nicht weiß, wer diesen Satz sagt und warum, kann ich die Antwort geben Nein, das war vorgestern, und wenn ich später gefragt werde: Hast du verstanden, was die Stimme am Telephon sagte? dann kann ich antworten: Ich habe schon verstanden, was sie sagte, nur weiß ich nicht, warum sie es gesagt hat. Andererseits ist es ebensowenig möglich, die Bedeutung von Sätzen unabhängig vom Kontext zu analysieren, in dem sie geäußert werden. Dies demonstriert etwa folgende Anekdote: Der Kapitän eines Schiffes hatte schon seit langem mit seinem Maat Streit und warf ihm vor, er trinke zu viel. Eines Abends, als der Kapitän auf der Brücke Wache hielt, sah er den Maat wieder an der Reling Shanties gröhlen. Er schrieb darauf ins Bordbuch: Heute, am 16. Mai, ist der Maat betrunken. Drei Tage später hatte der Maat Wache und entdeckte im Bordbuch diese Eintragung. Er überlegte sich, wie er sich an seinem Kapitän rächen könne und trug ins Bordbuch ein: Heute, am 19. Mai, ist der Kapitän nüchtern. Der Maat nahm an, der Leser würde diese Eintragung so deuten, daß der Kapitän normalerweise betrunken sei, und daß seine Nüchternheit an diesem Tage nur deshalb erwähnt werde. Grice (1968, 1975) interpretiert die Regel, nach der eine sprachliche Äußerung immer im Hinblick darauf interpretiert wird, daß sie vom Sprecher als mitteilenswert oder bedeutsam erachtet wird, durch das Prinzip der Kooperation zwischen Sprecher und Hörer: Der Hörer, der sich nach diesem Prinzip verhält, berücksichtige, daß der Sprecher sich bei seinen Äußerungen nach folgenden Maximen richte: 1. die Maxime der Quantität a) die Aussage soll so informativ wie möglich sein b) die Aussage soll nicht mehr Informationen als notwendig enthalten 2. die Maxime der Qualität a) die Inhalte der Aussage sollen vom Sprecher für wahr gehalten werden b) es sollen nur Inhalte geäußert werden, für deren Richtigkeit der Sprecher glaubhafte Hinweise besitzt 3. die Maxime der Beziehung es sollen nur solche Inhalte geäußert werden, die bedeutsam sind. 4. die Maxime der Art und Weise
B e d e u t s a m k e i t p r a g m a t i s c h e r F a k t o r e n f ü r sprachliche K o m m u n i k a t i o n
243
a) die Aussage soll klar sein b) die Aussage soll nicht mehrdeutig sein c) die Aussage soll so kurz wie möglich sein d) die Aussage soll den üblichen Regeln entsprechen Der Maat in der obigen Anekdote konnte dadurch mit einem sachlich richtigen Satz beim Leser einen unzutreffenden Eindruck erzielen, indem er die dritte der von Grice formulierten Maximen verletzte. Nach Posner (1978) kann die Tatsache, daß die Interpretation sprachlicher Ereignisse durch solche Faktoren mitbestimmt wird, auf zwei Arten interpretiert werden. Zum einen könnte man annehmen, daß die Bedeutungen von Wörtern und Sätzen sehr breit seien, wobei allein durch den Kontext erschlossen werden kann, welche der möglichen Bedeutungen die vom Sprecher gemeinte ist. Zum anderen ließe sich postulieren, daß Wörter eine relativ enge Bedeutung haben, und daß durch den Kontext weitere, über den Inhalt des Satzes hinausgehende Bedeutungen erschließbar seien. Ein Beispiel, an dem sich dieses Problem analysieren läßt, ist die Konjunktion „ u n d " in den folgenden Sätzen: Anna ist in der Küche und bäckt Kuchen. Anna fiel in einen tiefen Schlaf und ihre Wangen röteten sich wieder. Peter heiratete Anna und sie bekam ein Kind. Gib mir dein Bild und ich gebe dir meines. In diesen Sätzen sind jeweils zwei Aussagen durch „ u n d " verbunden. Dieses „ u n d " wird vom Hörer jedoch nicht so verstanden, daß jeweils beide Aussagen zutreffen, sondern daß zwischen ihnen auch eine bestimmte inhaltliche Beziehung besteht: Anna ist in der Küche und dort bäckt sie Kuchen. Anna fiel in einen tiefen Schlaf und währenddessen röteten sich ihre Wangen wieder. Peter heiratete Anna und danach bekam sie ein Kind. Wenn du mir dein Bild gibst, dann gebe ich dir meines. Dies könnte nun so interpretiert werden, daß die Konjunktion „ u n d " nicht nur die Bedeutung der logischen Konjunktion „ e t " habe, sondern darüber hinaus, je nach ihrem Kontext, örtliche, zeitliche und kausale Relationen zwischen den Teilsätzen bezeichne. Bei einer solchen Interpretation müßte man jedoch auch annehmen, daß etwa der Strichpunkt ebenfalls all diese Bedeutungskomponenten habe; denn das Verstehen der gegebenen Beispielsätze ändert sich nicht, wenn man die Konjunktion „ u n d " durch einen Strichpunkt ersetzt. Es ist jedoch offensichtlich nicht sinnvoll, einem Satzzeichen eine derart breite Bedeutung zuzuordnen.
244
Der inhaltliche Ablauf von Dialogen
Posner (1978) nimmt deshalb an, daß das Verstehen von Sätzen durch zwei Faktoren bedingt sei. Zum einen erhalte der Satz seine Bedeutungen durch die kontextunabhängigen Bedeutungen seiner Satzglieder. Zum anderen werde diese Bedeutung durch pragmatische Regeln modifiziert. Eine solche pragmatische Regel besagt etwa, daß die Aufeinanderfolge von Ereignissen in deren Beschreibung gleich bleiben soll. Diese Regel erklärt die Interpretation des dritten der oben gegebenen Beispielsätze. Eine andere Regel bestimmt, daß verschiedene Ereignisse nur dann in einem Satz beschrieben werden sollen, wenn zwischen ihnen eine inhaltliche Beziehung besteht. Diese Regel erklärt die Interpretation des ersten Beispielsatzes. Man könnte n u n einwenden, daß die Frage, o b pragmatische Faktoren als Teil der Satzbedeutung betrachtet werden sollen, deswegen unwichtig sei, weil man für die Erklärung der Satzgenerierung auf alle Fälle pragmatische Faktoren berücksichtigen müsse. Damit hätte die Art der Beantwortung dieser Frage keinen Einfluß auf die Forschungsstrategie. Dies trifft jedoch nicht zu: Eine konsequente Durchführung der Sprechakttheorie führt zu einer Ablehnung der sog. Wortsemantik, da es wegen der pragmatischen Bedingtheit jeder Bedeutung falsch wäre, nach der Bedeutung eines isolierten Wortes zu suchen. Verzichtet man jedoch völlig auf die Wortsemantik, dann können wichtige sprachliche Phänomene nicht mehr erklärt werden, so ζ. B., daß verschiedene Sätze, die sich möglicherweise nur in einem Wort voneinander unterscheiden, selbst wenn sie in gleichen Situationen geäußert werden, verschiedene Bedeutungen haben. Die oben eingeführte Trennung zwischen der inhaltlichen und der pragmatischen Satzbasis u n d die gleichzeitige Analyse der Wechselwirkungen zwischen den beiden Faktoren werden es erlauben, diese methodische Schwierigkeit zu vermeiden, ohne daß dabei der Gegenstand der Untersuchung künstlich eingeschränkt würde. 2. Methodologische Aspekte Entsprechend der Funktion, die sie in der sozialen Interaktion ausüben, und der Motivation, aufgrund derer sie geäußert werden, kann man sprachliche Akte in vier Gruppen unterteilen: (a) Befehle (b) Fragen, deren Beantwortung unmittelbar handlungsrelevant ist (c) Orientierungsgespräche, die nicht unmittelbar handlungsrelevant sind (d) Literarische Formen Die Kategorien (a) und (b) beinhalten sprachliche Aktionen, die in der Regel unmittelbar nicht-sprachliche Handlungen beeinflussen.
Methodologische Aspekte
245
Demgegenüber sind die in den Kategorien (c) und (d) subsumierten sprachlichen Akte höchstens indirekt handlungsrelevant. Kategorie (c) u m f a ß t alle Arten von Informationsgesprächen, wobei es sich dabei um einen psychotherapeutischen Dialog, um eine wissenschaftliche Diskussion oder um ein Partygespräch handeln kann. Die Kategorie (d) umfaßt alle Arten von schriftlichen Äußerungen. Erste Ansätze zur Beschreibung einfacher literarischer Texte, bei welchen Ansätze aus der Computersemantik benützt werden, finden sich in Rumelhart (1976), Chafe (1975) oder Thorndyke (1975). Die folgenden Ausführungen werden sich nur auf sprachliche Ereignisse beziehen, die in Kategorie (c) der oben gegebenen Aufteilung fallen. Zusätzlich zu dieser Restriktion sollen auch alle diejenigen Sprechakte außer acht gelassen werden, zu deren Erklärung der Rekurs auf nicht-sprachliche Formen der Kommunikation notwendig ist. Der Verzicht auf die Behandlung von nicht-sprachlichen Kommunikationsformen, wie ζ. B. von Blickkontakten, entspringt nicht der Ansicht, daß es sich hier um psychologisch weniger interessante oder weniger wichtige Kommunikationsformen handle; im Gegenteil: gerade darum, weil es sich hier um äußerst komplexe Vorgänge handelt, sollten sie besser gar nicht, als nur am Rande behandelt werden. Den sprachlichen Korpus, der diesem Kapitel zu Grunde liegt, bilden Kopien der sog. Marburger Protokolle, die vor ca. 10 Jahren im Institut für Psychologie der Universität Marburg durch folgendes Vorgehen gewonnen wurden: Männliche Studenten wurden angeworben, gegen Entgelt an einem psychologischen Versuch teilzunehmen. Bei ihrer Ankunft im Institut forderte man die Vpn auf, jeweils zu zweit in einem separaten Zimmer zu warten. Diese Wartezeit dauerte etwa eine halbe Stunde, und die Gespräche zwischen den beiden Studenten, die sich vorher nicht kannten, wurden auf Tonband aufgen o m m e n . Mit dem Einverständnis der Vpn wurden diese Tonbandaufnahmen darauf abgetippt, wobei man strikt darauf achtete, die Texte in ihrer ursprünglichen, „ungrammatischen" Form zu erhalten. Da andererseits jedoch bei der Übertragung in die schriftliche Form eine Reihe von phonetischen Informationen verloren gingen, wurden die Protokolle, wie Foppa (1970) darauf hingewiesen hat, in der transkribierten Fassung stellenweise unverständlich. Dies betrifft jedoch lediglich wenige Stellen in den Protokollen. Die folgenden Ausführungen basieren auf insgesamt zwölf Protokollen, die zusammen 212 Schreibmaschinenseiten umfassen. Mit Ausnahme von wenigen Fällen, bei denen besonders darauf hingewiesen wird, stammen alle der in diesem Kapitel benützten Beispiele aus diesen zwölf Marburger Protokollen.
246
Der inhaltliche Ablauf von Dialogen
Die Aufzeichnungen der Marburger Protokolle sind weniger detailliert als andere Notationen, wie sie etwa von Schänk & Schoenthal (1976) oder von Henne 8c Rehbock (1979) verwendet wurden. So fehlen in den hier verwendeten Protokollen systematische Angaben über kürzere Sprechpausen, Sprechgeschwindigkeit, Betonung und Gleichzeitigkeit von Äußerungen beider Partner. Bei den in den folgenden Abschnitten beschriebenen Inhaltsanalysen hatte ich jedoch nie den Eindruck, daß die Berücksichtigung dieser Faktoren eine adäquatere Beschreibung der inhaltlichen Aspekte der Gesprächsabläufe erlaubt hätte. Die hier vorgenommene Analyse der Protokolle geschah nicht nach einem strengen System: Aufgrund eines sorgfältigen Durchlesens der Dialoge wurden in einem ersten Schritt Hypothesen über den inhaltlichen Ablauf der Gespräche formuliert. Diese Hypothesen wurden darauf systematisiert und bei einem nochmaligen Durchlesen überprüft und, wo dies nötig war, erweitert und modifiziert. Durch die so gefundenen Regeln wird der inhaltliche Ablauf der analysierten Gespräche weitgehend beschrieben. Allerdings ermöglichen diese Regeln es nicht, deterministische Voraussagen zu machen, was eine Person in einem bestimmten Moment des Gesprächsverlaufes sagen wird; denn eine solche Voraussage würde die Kenntnis aller Wissensinhalte dieser Person voraussetzen. Es wurde ebenfalls darauf verzichtet, die in der quantitativen Linguistik benützten Variablen wie type-token-ratio (Zipf, 1945) syntaktische Tiefe (Yngve, 1960), Redundanz (Attneave, 1959; Hofmann, 1973) usw. zu verwenden: diese Variablen sind zwar exakt quantifizierund meßbar, kovariieren jedoch nicht oder kaum mit inhaltlichen Variablen, dem Gegenstand dieser Untersuchung. Unabhängig davon, ob man eine exakte und intersubjektiv kontrollierbare Uberprüfung von Gesprächsinhalten für möglich oder wünschenswert hält, muß man davon ausgehen, daß dies heute noch nicht möglich ist; die Entwicklung der Forschungen in den vergangenen zwanzig Jahren zeigt meines Erachtens, daß die Verwendung der oben erwähnten Maße mehr zur Vernebelung als zur Erhellung der untersuchten Phänomene beigetragen hat. Daraus darf jedoch nicht gefolgert werden, daß auf die Meßbarkeit sprachlicher Inhalte auch in Z u k u n f t verzichtet werden sollte; denn so lange diese Möglichkeit nicht besteht, ist die einzige Methode zur Uberprüfung semantischer Modelle der sog. Turing-Test, der für Theorien mit psychologischem Anspruch ein unbefriedigendes Verfahren bildet.
Motivationale Faktoren und der Beginn von Gesprächen
247
3. Motivationale Faktoren und der Beginn von Gesprächen Ganz allgemein läßt sich sagen, daß es vermutlich keine menschliche Motivation gibt, die nicht auch als Motiv bei der Sprachproduktion fungieren könnte; denn es läßt sich wohl keine Zielsetzung vorstellen, deren Erreichen nicht durch sprachliche Kommunikation ermöglicht oder erleichtert werden kann. Auch wenn man von handlungsrelevanten Gesprächen absieht, dann bleibt ein recht breites Spektrum von Motiven übrig: Das Sprechen, um den Gesprächspartner zu beeindrucken, um ihn von einer bestimmten Ansicht zu überzeugen oder um sich selbst über gewisse Dinge im Klaren zu werden, wie dies etwa beim psychotherapeutischen Gespräch der Fall ist. In der oben geschilderten Gesprächssituation, in der die Marburger Protokolle gewonnen wurden, sind diese Möglichkeiten allerdings stark eingeschränkt: Die beiden Partner kannten sich vor dem Gespräch nicht und sie wußten, daß sie sich vermutlich nach dem Gespräch höchstens zufällig auf der Straße wieder begegnen würden. Damit erhielten die Gespräche eine starke Unverbindlichkeit. Das hauptsächliche Motiv, das Gespräch aufrechtzuerhalten, ist damit die Informationsvermittlung, d. h. der Erwerb von neuem Wissen. Nun ist der Wunsch, Wissen zu übermitteln, die Grundlage jedes Gespräches; selbst durch ein Prüfungsgespräch, in dem der Kandidat annehmen kann oder soll, daß der Prüfer den Inhalt seiner Äußerungen schon weiß, soll eine Information vermittelt werden: die Information, daß der zu Prüfende den Stoff der Prüfung kennt. Allerdings muß man hier zwischen zwei verschiedenen Funktionen unterscheiden, welche der Faktor Wissensvermittlung bei Gesprächen ausübt: Zum einen ist die Vermittlung von Wissen ein Mittel, um ein anderes Ziel zu erreichen. Wenn ich beispielsweise erzähle, daß ich letzte Woche auf Tahiti in Urlaub war, dann sage ich dies in der Annahme, daß dies der Hörer bislang nicht wußte, und weil ich ihm dieses Wissen vermitteln möchte. In der Regel bezwecke ich durch eine solche Aussage jedoch einen Effekt, der über diese Informationsvermittlung hinausgeht; so ζ. B. möchte ich erklären, warum ich letzte Woche nicht anwesend war, ich möchte erreichen, von dem Gesprächspartner bewundert zu werden, usw. Andererseits kann die Vermittlung des Gesprächsinhaltes, d. h. der Aussage der Rede, der eigentliche Zweck eines Gespräches bilden; dies ist dann der Fall, wenn der Sprecher annimmt, der Hörer sei am Gegenstand der Aussage interessiert und zugleich glaubt, daß sein Wissen über diesen Inhalt dem Hörer Zumindestens teilweise nicht bekannt ist. Bei den in den Marburger Protokollen aufgezeichneten Dialogen handelt es sich in der Regel um diese Art von Gesprächen.
248
Der inhaltliche Ablauf von Dialogen
Die Unterscheidung zwischen Sprechakten, die lediglich der Informationsübermittlung dienen, und solchen, bei denen die Informationsübermittlung Mittel zu einem anderen Zweck ist, ist theoretisch einfach und unproblematisch. Bei der Beobachtung realer Dialoge wird man allerdings häufig Gespräche finden, die sich nicht ohne weiteres einer dieser beiden Kategorien zuordnen lassen. Ein typischer solcher Fall ist etwa der Student der Ingenieurwissenschaften, der einer Freundin die Funktion eines Wankel-Motors oder seiner Hi-FiAnlage erklärt. Bei dieser Art von Dia- oder besser: Monologen ist der Sprecher möglicherweise davon überzeugt, daß sich der Hörer für den Inhalt seiner Ausführungen interessiert; andererseits hat der Hörer und auch der Außenstehende eher den Eindruck, daß der Sprecher vom Motiv geleitet ist, beim Hörer dadurch an Prestige zu gewinnen, indem er ihn auf die Breite seines Wissens aufmerksam macht. Ein anderer Typ von Gesprächen, bei denen der Aspekt der Informationsvermitdung problematisch ist, sind die „weißt-du-noch"Dialoge. Dabei werden meist lang vergangene Erinnerungen, die beiden Gesprächspartnern gemeinsam sind, ins Bewußtsein zurückgerufen. Unabhängig davon, ob es sich dabei um lustvolle oder traurige Erlebnisse handelt, scheint das dabei stattfindende gemeinsame Bewußtwerden der Gedächtnisinhalte befriedigend und damit das eigentliche Gesprächsmotiv zu sein. Natürlich könnte man auch dieses Motiv durch eine weitere Analyse auf ,, tieferliegende" Mechanismen zurückführen: Bei den Inhalten, die durch ,,weißt-du-noch"-Dialoge bewußt gemacht werden, handelt es sich um außergewöhnliche Erlebnisse, und das Bewußtsein, Außergewöhnliches erlebt zu haben, steigert das Selbstgefühl. Diese Steigerung des Selbstgefühles wird dadurch noch verstärkt, daß die Außergewöhnlichkeit der erinnerten Erlebnisse vom Gesprächspartner bestätigt wird. Das weitere Eingehen auf solche tiefenpsychologischen Motivationen würde den Rahmen einer Untersuchung über die Generierung von Sätzen in Dialogen sicherlich sprengen. Unter dem Aspekt, daß die in den Marburger Protokollen festgehaltenen Gespräche primär dadurch motiviert sind, daß sich die beiden Partner gegenseitig Wissen vermitteln möchten, lassen sich sehr deutlich zwei Phasen der Gespräche unterscheiden, die im folgenden als Retuschen-Suche und Retuschen-Ergänzung bezeichnet werden sollen. Ziel der Retuschensuche ist es, eine Retusche zu finden, die sich als Gesprächsgegenstand eignet. Während der Retuschenergänzung wird bestimmt, welche Inhalte der gewählten Retusche in welcher Reihenfolge und in welcher Form geäußert werden. Dabei wird von folgenden Vorstellungen über die Struktur von Re-
Motivationale Faktoren und der Beginn von Gesprächen
249
zepten und Retuschen und von deren Interrelationen ausgegangen, die in Kap. VII entwickelt wurden: Rezepte sind Repräsentationen stereotyper komplexer Ereignisse oder Situationen im semantischen Gedächtnis. Sie setzen sich zusammen aus einer Serie von Zustandsbeschreibungen, welche die notwendigen Voraussetzungen, die Zwischenstadien u n d die Resultate des entsprechenden Ereignisses angeben. Verbindungen zwischen verschiedenen Rezepten geben an, durch welche Handlungen verschiedene Zwischenstadien produziert werden können, und warum das Erreichen dieser Zwischenstadien notwendig ist. Die mnemotische Repräsentation von einzelnen Ereignissen, die Instanzen eines Rezeptes bilden, sind die sog. Retuschen. Diese Retuschen, die Teil des episodischen Gedächtnisses bilden, enthalten die Beschreibungen aller derjenigen Eigenheiten des Ereignisses, die nicht im semantischen Schema enthalten sind. Die Retuschen-Suche geschieht nun mittels eines komplexen Evaluationsprozesses, in den folgende vier Größen eingehen: Das Bedürfnis des Sprechers, ein Gespräch aufzunehmen. Die Annahmen des Sprechers über die Interessen des Partners. Die Annahmen des Sprechers über das Wissen des Partners. Das Wissen des Sprechers über den potentiellen Gesprächsgegenstand. Die Art, in der diese vier Faktoren evaluiert werden, sowie die Form des Gesprächsbeginnes hängen von einer Reihe von situativen Bedingungen ab. So besteht etwa bei Gesprächen ohne direkten Blickkontakt (ζ. B. bei Telephongesprächen) eine festgelegte Sequenz von stereotypen Äußerungen, die der Kontaktaufnahme dienen (Schegloff, 1968). Ein weiterer wichtiger Faktor ist, ob die beiden Gesprächspartner sich schon vor dem Gespräch kannten. Ist dies der Fall, und sind keine situativen Variablen wirksam, die einen bestimmten Gesprächsinhalt nahelegen, dann verläuft die Retuschensuche typischerweise durch folgenden Prozeß: Zunächst wird aus dem episodischen Gedächtnis der Zeitpunkt bestimmt, zu dem die beiden Partner das letzte Mal miteinander kommuniziert haben. Darauf wird im episodischen Gedächtnis nach einem Ereignis gesucht, das nach diesem Zeitpunkt stattfand, und das entweder sehr bedeutsam ist, oder das zu dem H ö r e r i n einer Beziehung steht. Dabei wird für jedes der Ereignisse ein Wert berechnet, den man als die „Äußerungswürdigkeit" dieses Ereignisses bezeichnen könnte. Dieser Wert ist eine Funktion der Bedeutsamkeit dieses Ereignisses, der seither verflossenen Zeitspanne und der Stärke der Beziehung zwischen diesem Ereignis und dem Hörer. Durch einen Vergleich der Äußerungswürdigkeit mit dem Bedürfnis des Sprechers zu einem Gespräch wird dann entschieden, ob das entsprechende Ereignis mitgeteilt werden soll.
250
Der inhaltliche A b l a u f von Dialogen
Abb. 40: Möglicher Algorithmus der bei G e s p r ä c h s a n f ä n g e n a b l a u f e n d e n Prozesse b e i einander bekannten Gesprächspartnern
Motivationale Faktoren und der Beginn von Gesprächen
251
Die Suche nach einem Ereignis, daß als möglicher Gesprächsgegenstand in Frage kommt, kann prinzipiell durch drei verschiedene Prozesse geschehen: Zum einen ist es möglich, daß ein Ereignis nach dem anderen aktiviert und ausgehend von dem Ereignis dessen Beziehung zum Hörer bestimmt wird. Zweitens könnte, von dem Knoten für den Hörer ausgehend, nach Ereignissen gesucht werden, die seit dem letzten Zusammentreffen geschehen sind. Drittens könnten durch eine parallele Suche im Sinne Quillians sowohl vom Knoten für den Hörer als auch von den Repräsentationen der Ereignisse sich Aktivationen ausbreiten. Μ. E. hat der letztgenannte dieser drei Mechanismen die höchste Plausibilität; diese Vermutung konnte bislang allerdings empirisch nicht überprüft werden. Abbildung 40 zeigt in Form eines Flußdiagrammes den postulierten Algorithmus für die Retuschen-Suche, bei der die beiden Gesprächspartner sich bereits kennen. Im Gegensatz zu diesen Regeln, die aufgrund von unsystematischen Beobachtungen gewonnen wurden, konnten die Regeln für die Retuschen-Suche bei sich nicht bekannten Gesprächspartnern anhand der Marburger Protokolle überprüft werden. Da die Sprecher hier nicht wissen, wofür der Partner sich interessiert, muß der erste Schritt bei der Suche darin bestehen, Eigenschaften des Partners zu erfahren, die Rückschlüsse über seine Interessen erlauben. Dabei wird in der beobachteten Situation von den beiden Fakten ausgegangen, die den Gesprächspartnern bekannt sind: daß der andere ein Student ist, und daß er sich zur Teilnahme an dem Versuch bereit erklärt hat. Die analysierten zwölf Gespräche beginnen alle mit einem der Inhalte: Studiensemester oder -richtung, bzw. Grund der Teilnahme am Versuch und Vermutungen über dessen Ablauf. Beispieldialog I ist ein typisches Beispiel eines solchen Gesprächsbeginnes. Beispieldialog I: Beginn eines Gespräches bei sich vorher nicht bekannten Partnern. X: Y: X: Y: X: Y: X: Y:
Im wievielten Semster sind Sie? Ich bin erstes. Ich brauch nur Geld. J a , das hab ich mir auch gedacht. Ich bin auch erstes Semester. Was machen Sie? Theologie Au klasse, das wollt ich früher auch. Und? Ich hatte Angst vor der Seelsorge. Abbildung 41 zeigt den Prozeß der Retuschensuche bei sich vorher nicht bekannten Partnern, wiederum in Form eines Flußdiagrammes. Der beschriebene Suchprozeß verläuft in drei sich überlappenden
252
Der inhaltliche A b l a u f von Dialogen
Abb. 41: Möglicher Algorithmus der bei G e s p r ä c h s a n f ä n g e n a b l a u f e n d e n Prozesse bei einander vorher nicht b e k a n n t e n Gesprächspartnern
Kontingenzregcln
253
Schlaufen. In der ersten Schlaufe wird nach einem Rezept gesucht, das zu einem bekannten Attribut des Gesprächspartners in irgendeiner Beziehung steht. In der zweiten Schlaufe wird nach einer Retusche zu diesem Rezept gesucht. Kann keine Retusche gefunden werden, dann wird zur ersten Schlaufe zurückgegangen und ein neues Rezept gesucht. In der dritten Schlaufe wird bestimmt, ob die Retusche äußerungswürdig ist. Ist dies nicht der Fall, dann wird zur zweiten Schlaufe zurückgegangen und eine neue Retusche gesucht. Man kann beobachten, daß die Entscheidungen, die in den beiden Flußdiagrammen beschrieben sind, selbst thematisiert werden. Dabei bestehen feste Redewendungen, durch die ein Sprecher die von ihm getroffenen Entscheidungen rechtfertigt oder in Zweifel zieht: Der Satz das interessiert sie sicher thematisiert die Relevanz des Gesprächsinhaltes in bezug auf die Attribute des Hörers, während etwa der Satz aber das wissen sie wahrscheinlich schon alles in Frage stellt, ob die geäußerte Retusche für den Hörer bislang unbekannte Inhalte enthält. Die Flußdiagramme in den Abbildungen 4 0 und 4 1 sind keine exakten Algorithmen der Prozesse, die bei Gesprächsbeginn ablaufen, sondern sie sollten eher als Vorstellungshilfen betrachtet werden. Obwohl die uns zur Verfügung stehenden Daten darauf hinweisen, daß Suchprozesse der geschilderten Art stattfinden, sind die beschriebenen Annahmen so allgemein, daß sie lediglich als vorläufige Hypothesen betrachtet werden dürfen. Einer der dabei postulierten Mechanismen, die Bestimmung der Äußerungswürdigkeit einzelner Aussagen, wird in Abschnitt 5 dieses Kapitels näher analysiert werden.
4. Kontingenzregeln Auf den vorhergehenden Seiten wurde analysiert, durch welche Prozesse ein Sprecher beim Beginn eines Dialoges einen bestimmten Gesprächsgegenstand auswählt. Nun wird jedoch während eines Dialoges üblicherweise nicht nur eine, sondern eine ganze Reihe von Retuschen geäußert, und der zunächst gewählte Gegenstand des Gespräches wird von anderen Inhalten abgelöst. In diesem Abschnitt soll auf die Frage eingegangen werden, durch welche Regeln dieser Wechsel des Gesprächsgegenstandes beschrieben werden kann. Hierbei muß man sich zunächst einmal fragen, ob sich solche Regeln überhaupt formulieren lassen. Man könnte nämlich annehmen, daß die Wahl eines Gegenstandes innerhalb eines Gespräches von den
254
Der inhaltliche Ablauf von Dialogen
vorhergehenden Gesprächsinhalten unabhängig sei. In diesem Falle könnte der Wechsel des Gesprächsthemas durch folgende Regel beschrieben werden. Jedesmal, wenn ein Sprecher eine Retusche geäußert hat, wird durch die gleichen Prozesse nach einem neuen Gesprächsgegenstand gesucht, wie sie beim Beginn des Gespräches ablaufen. Damit könnte der inhaltliche Ablauf eines Gespräches durch die Regeln erklärt werden, die am Ende von Abschnitt 3 formuliert wurden. Tatsächlich finden sich in den Protokollen solche Übergänge, bei denen ein inhaltlicher Zusammenhang zum vorhergehenden Gesprächsthema nicht erkennbar ist. Solche Übergänge kommen nach längeren Gesprächspausen vor, und die darauffolgenden Äußerungen beziehen sich in der Regel entweder auf die Versuchssituation oder den Versuchsraum, oder der Sprecher fragt nach Attributen des Gesprächspartners (ζ. B. „studieren sie schon lange in Marburg?"). Allerdings sind solche abrupten Übergänge recht selten; in einigen Protokollen treten sie nie, und in keinem Protokoll treten sie mehr als dreimal auf. Bei allen anderen Übergängen ist ein inhaltlicher Zusammenhang zwischen den beiden aufeinanderfolgenden Gesprächsthemen deutlich erkennbar. Dabei findet der Wechsel des Gesprächsthemas nur selten innerhalb der Rede eines Gesprächspartners statt, sondern fast immer beim Wechsel des Sprechers. Die im folgenden beschriebenen Regeln, nach welchen ein Sprecher auf den vorher geäußerten Inhalt bezug nimmt, sollen im weiteren als Kontingenzregeln bezeichnet werden. Analysiert man die Äußerungen unter dem Gesichtspunkt, welche Rolle sie für den Ablauf des Gespräches spielen, dann lassen sie sich in zwei grobe Kategorien einordnen. Äußerungen der ersten Art sollen als gesprächsorientierte Äußerungen bezeichnet werden. Diese, normalerweise kurzen Äußerungen dienen dazu, den Verlauf des Gespräches aufrechtzuerhalten oder in eine bestimmte Richtung zu lenken. Im Gegensatz dazu dienen die in halts orientierten Äußerungen dazu, dem Hörer Wissensinhalte über den Gegenstand des Gespräches mitzuteilen. Die gesprächsorientierten Äußerungen lassen sich in folgende drei Gruppen unterteilen: Kontaktwörter: Dabei handelt es sich um Interjektionen oder kurze Ausdrücke wie , j a , ja", „ h m " , „ach so". Die Funktion dieser Äußerungen besteht darin, dem Hörer mitzuteilen, daß man seine Aussagen verstanden hat und daran interessiert ist, seine weiteren Äußerungen über den Gesprächsgegenstand zu erfahren. Bestätigungen: Diese haben eine ähnliche Funktion wie die Kontaktwörter. Zudem informieren sie den Hörer, daß man seinen Aussagen
Kontingenzregeln
255
zustimmt, bzw. den von ihm vertretenen Standpunkt teilt. Formal gesehen unterscheiden sich Bestätigungen von Kontaktwörtern darin, daß es sich bei ersteren um ganze Sätze oder zumindest um längere Satzfragmente handelt. Dies sind entweder direkte Bestätigungen wie „das finde ich auch", ,,da haben sie recht gehabt" oder Paraphrasierungen der vorhergehenden Aussagen. Äußerungen, welche lediglich eine Verneinung der vorhergehenden Aussage bilden, sind sehr selten; denn Verneinungen werden üblicherweise zusammen mit der Begründung geäußert, warum man den vom Partner geäußerten Inhalt anzweifelt, bzw. ihn verneint. Solche Äußerungen fallen damit in die Klasse der weiter unten beschriebenen inhaltsorientierten Äußerungen. Kurze Einschübe wie „aber nein" oder „unmöglich" bilden in der Regel keine Verneinungen, sondern sollen dem Hörer mitteilen, daß die von ihm geäußerten Inhalte neu und interessant sind. Damit können solche Äußerungen als Kontaktwörter betrachtet werden. Nachfragen: Diese können die Form von Fragen, wie ζ. B. „wo war das?" oder „von wem wissen sie das?", aber auch von Aussagesätzen, ζ. B. „das verstehe ich nicht", haben. Auch Nachfragen dienen dazu, den Hörer zu weiteren Äußerungen über den Gesprächsgegenstand zu ermuntern; im Gegensatz zu den Kontaktwörtern und den Bestätigungen wird hier jedoch ein Interesse an bestimmten Ausschnitten aus dem behandelten Gesprächsgegenstand geäußert. Bei keiner dieser drei Gruppen von gesprächsorientierten Äußerungen werden neue den Gesprächsgegenstand betreffende Inhalte geäußert. Sie sind also für den inhaltlichen Ablauf des Gespräches nur insofern relevant, als sie den Hörer zur Beibehaltung, zur Wahl oder zum Wechsel eines bestimmten Gesprächsgegenstandes ermuntern. So läßt sich häufig beobachten, daß zwei inhaltsorientierte Äußerungen desselben Sprechers, die voneinander durch eine gesprächsorientierte Äußerung des Partners getrennt sind, einheitlich denselben Wissensinhalt beschreiben. Unterscheidet man die inhaltsorientierten Äußerungen danach, in welcher Beziehung sie zu den vorhergehenden Aussagen stehen, dann lassen sich folgende Gruppierungen beobachten: Ergänzung der eigenen Aussage: Hier handelt es sich um den bereits erwähnten Ablauf, daß der Sprecher mit der Äußerung eines bestimmten Inhaltskomplexes schon vorher begonnen hat, von seinem Partner durch eine gesprächsorientierte Äußerung unterbrochen wurde und nun mit dem Äußern desselben Inhaltes fortfährt. Solche Ergänzungen von eigenen Aussagen treten vor allem dann auf, wenn der Sprecher ausführlich eine Retusche schildert, wie dies in den Beispieldialogen IV und V der Fall ist.
256
Der inhaltliche Ablauf von Dialogen
Wechselseitiges Ergänzen: Handelt das Gespräch von einem Inhaltskomplex, der beiden Partnern bekannt ist, dann können die einzelnen Inhalte wechselweise von beiden Sprechern geäußert werden. Die Aussagen beider Partner basieren dabei auf ihrer individuell spezifischen Retusche desselben Objektes oder Ereignisses. Bei den geäußerten Propositionen handelt es sich jeweils um solche Inhalte, von denen der Sprecher annimmt, daß sie nicht in der Retusche des Hörers enthalten sind (eine Ausnahme von dieser Regel bilden die weiter oben erwähnten ,,weißt-du-noch"-Gespräche). Das wechselseitige Ergänzen kann durch ähnliche Regeln erklärt werden, wie die im folgenden Abschnitt 5 beschriebenen Abläufe bei der RetuschenErgänzung. Eine Reihe von Beispielen für diese Gruppe von Aussagen finden sich in Beispieldialog II. Sowohl bei Ergänzungen der eigenen Aussagen als auch beim wechselseitigen Ergänzen findet kein Wechsel des Gesprächsinhaltes statt; denn die aufeinanderfolgenden Äußerungen beschreiben die gleiche Retusche. Bei den im weiteren beschriebenen Gruppen von inhaltsorientierten Äußerungen wird jeweils gegenüber den vorhergehenden Äußerungen der Inhalt gewechselt. Dies kann dadurch geschehen, daß eine neue Retusche geäußert wird, oder daß nach der Äußerung eines Inhaltes aus dem episodischen Gedächtnis ein damit verbundener Inhalt aus dem semantischen Gedächtnis ausgedrückt wird und umgekehrt. Die Aussagen, bei denen ein Wechsel des Gesprächsinhaltes stattfindet, lassen sich in folgende Gruppen einteilen: Retuschenwechsel bei gleichbleibendem Thema: Hier wird ein allgemeines Thema beibehalten, und der Sprecher äußert einen neuen Inhalt, der dieses Thema ergänzt. Dabei lassen sich zwei voneinander nicht immer klar abgrenzbare Gruppen von Äußerungen unterscheiden. Zum einen kann das gleichbleibende Thema eine allgemeine Regel sein, wie ζ. B. „Professor Ν gibt unverständliche Vorlesungen" oder „die Berliner sind unfreundlich". Die einzelnen Retuschen beschreiben in diesem Fall Ereignisse, durch die diese allgemeine Gesetzmäßigkeit bestätigt wird. Zum anderen kann es sich bei dem allgemeinen Thema um eine Klasse von Situationen oder Ereignissen handeln, die durch ein Rezept beschrieben werden; solche allgemeinen Situationen und Ereignisse sind beispielsweise „Campingurlaub" oder „Seminarklausuren". Hier äußern die Sprecher dann abwechslungsweise ihnen äußerungswürdig scheinende Retuschen, die Instanzen des allgemeinen Rezeptes bilden. Typische Einleitungen von Äußerungen, bei denen Retuschenwechsel bei gleichbleibendem Thema stattfindet, sind „a propos. . .", „so was kenn ich auch" usw. Retuschenwechsel über gemeinsamen Aktanten: In dieser Klasse von Äußerungen wird der inhaltliche Zusammenhang zu den vorhergehen-
Kontingenzregeln
257
den Aussagen nicht durch ein gemeinsames Thema gebildet, sondern durch eine Person oder ein Objekt, die, bzw. das vorher erwähnt wurde. In den Protokollen läßt sich dieser Wechsel häufig dann beobachten, wenn von einem Sprecher ein gemeinsamer Bekannter erwähnt wird, und der Partner darauf ein Erlebnis schildert, an welchem diese Person beteiligt war. Wechsel zwischen kausal verbundenen Retuschen: In diese Gruppe fallen Äußerungen, die zu dem vorhergehenden Dialog durch die Ubergänge „darum" oder ,,daß kommt daher, daß" verbunden werden oder werden könnten. Es wird also an ein vom Gesprächspartner geschildertes Ereignis angeknüpft und eine Retusche geschildert, die als Begründung oder als Folge dieses Ereignisses betrachtet werden kann. Dabei handelt es sich bei beiden dieser so verknüpften Ereignisse um Inhalte des episodischen Gedächtnisses. Bei den bislang aufgeführten Klassen von Äußerungen wurden jeweils nur Inhalte des episodischen Wissens mitgeteilt. Eine Klassifizierung des inhaltlichen Ablaufes von Dialogen wäre jedoch nicht vollständig, wenn dabei nicht auch Äußerungen von Inhalten des semantischen Gedächtnisses berücksichtigt würden. Dabei lassen sich drei Arten von Verläufen unterscheiden: Spezifikation: Hier wird an einen allgemeinen Inhalt angeknüpft und eine Retusche geäußert, die als Beleg für den vorher genannten allgemeinen Inhalt dient. Verallgemeinerung: Anknüpfend an eine Äußerung eines Inhaltes aus dem episodischen Gedächtnis wird hier eine Verallgemeinerung geäußert, durch welche der spezifische Inhalt als Instanz dieses allgemeinen Gesetzes interpretiert wird. Allgemeines Gesetz: In diese Kategorie fallen alle diejenigen Äußerungen, in denen ein allgemeiner Wissensinhalt durch einen anderen allgemeinen Wissensinhalt ergänzt wird. In den Marburger Protokollen kommen solche Übergänge allerdings recht selten vor. Bei den Beispieldialogen II und III handelt es sich um zwei längere, willkürlich herausgegriffene Ausschnitte aus den Marburger Protokollen. Die Zahlen rechts von den einzelnen Äußerungen geben an, welcher der oben aufgestellten inhaltlichen Kategorien die Äußerung zuzuordnen ist. Mit Ausnahme von rhetorischen Verneinungen und Äußerungen des-Nicht-Verstehens sind in diesen beiden Gesprächsausschnitten alle der erwähnten Kontingenzen vertreten. Die beschriebenen Klassen von inhaltlichen Ubergängen erlauben es, die in den Marburger Protokollen enthaltenen Gesprächsabläufe in der Regel problemlos zu klassifizieren. Für eine weitere Beschreibung dieser Abläufe wäre es allerdings notwendig, auf folgende, bislang nicht behandelte Fragenkomplexe einzugehen: Zum einen müß-
258
Der inhaltliche Ablauf von Dialogen
ten als Algorithmen formalisiert)are Regeln entwickelt werden, durch die objektiv, d. h. nicht aufgrund von subjektiven Einschätzungen, bestimmt werden kann, welche der aufgeführten Kontingenzregeln den einzelnen Übergängen zwischen den Äußerungen zuzuordnen sind. Dies ist bislang lediglich bei der Gruppe der Kontaktwörter möglich, da diese linguistisch eindeutig beschreibbar ist und somit von den anderen Gruppen von Äußerungen eindeutig abgegrenzt werden kann. Die objektive Bestimmung der verschiedenen Arten von Kontingenzen bei inhaltsorientierten Äußerungen würde jedoch das Bestehen von Algorithmen für die syntaktische und semantische Analyse der gesprochenen Sprache voraussetzen. Tab. 27: Kategorisierung der Äußerungen in bezug auf den inhaltlichen Zusammenhang mit den vorhergehenden Aussagen In den Beispieldialogen II und III verwendete Kennzahl 1 Gesprächsorientierte Äußerung 1.1 Kontaktwörter 1.1.1 Interjektionen 1 1.1.2 rhetorische Verneinung 1.2 Bestätigungen 1.2.1 Bestätigung durch Bejahung 2 1.2.2 Bestätigung durch Paraphrasierung 3 1.3 Nachfragen 1.3.1 Fragen 4 1.3.2 Äußerung des Nicht-Verstehens 2 Inhaltsorientierte Äußerung 2.1 ohne Wechsel des Gesprächsthemas 2.1.1 Ergänzen der eigenen Aussage 5 2.1.2 Korrektur der eigenen Aussage 6 2.1.3 Wechselseitiges Ergänzen 7 2.2 mit Wechsel des Gesprächsthemas 2.2.1 Retuschenwechsel 2.2.1.1 Retuschenwechsel bei gleichbleibendem Thema 2.2.1.1.1 allgem. Regel als verbindendes Thema 8 2.2.1.1.2 Rezept als verbindendes Thema 9 2.2.1.2 Retuschenwechsel via gemeinsamen Aktanten 10 2.2.1.3 Wechsel zw. kausal verbundenen Retuschen 11 2.2.1.4 Spezifikationen 12 2.2.1.5 Verallgemeinerungen 13 2.2.2 Wechsel zw. semantischem u n d episodischem Wissen 2.2.2.1 Verallgemeinerung 14 2.2.2.2 Exemplifizierung 15 2.2.2.3 Allgemeines Gesetz
Kontingenzregeln
259
Beispieldialog II: Wechselseitiges Ergänzen von Retuschen X: Ich war mal in der Nähe von Cassis da unten. Y: Cassis, ja das k e n n ich. (2) X: Ja,ja.(l) Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y:
Das is ne wunderbare Klettergegend übrigens. (12) J a , ja. (1) So η richtiger Klettergarten, so k a n n man das n e n n e n , so. (5) H m , da war ich oben in der Jugendherberge, da m u ß t e n wir auch so — (10) A c h , die k e n n e n Sie? (4) J a , ja, die lag da oben. (5) Da war ich auch schon mal gewesen. (2) Da gingen wir da runter zu so ner Bucht, äh, oh wie hieß die noch mal? Die h a t t e so η schönen Namen. (5) Das weiß ich nicht. (7) Catalo, oder so ähnlich. Da m u ß t e man ganz schön laufen bis zur Bucht runter. (5) J a , ja. (1) Aber ne schöne Bucht, da k o n n t e man ganz schön rausschwimm e n . (5) H m . (1) Da k o n n t e man lange schwimmen, und man war t r o t z d e m nicht weit vom Ufer, nicht. (5) H m , ja, das ist so ne Art von F j o r d , nicht. (7) J a , ja. (1) Die ist ganz tief. (7) H m . (1) In den Felsen reingeschnitten, nicht. (7) J a , und η wunderbares Wasser. (7) J a . (1) Da waren wir drei Tage, bis zum Ende der Ferien. Da m u ß t e n wir wieder nach Hause. (5) J a , ja. (1) Aber ich finde, die Franzosen sind so laut. (14) A c h , na j a , ich meine die Franzosen, die k o m m e n höchstens von Marseille her, diese Ausflugsboote manchmal, diese, und so (15) H m . (1) Aber sonst ist es schön ruhig, d a sind alle möglichen Leute da, viele Deutsche auch, u n d auch andere. (5) Deutsche u n d Engländer. (7) J a , Norweger hab ich auch g e t r o f f e n . (7) J a , auch viele Skandinavier sind d a u n t e n . (13) J a , ja, ich h a t t e mich da, äh, mit Leuten verabredet, ich hab sei-
260
X: Y: X: Y: X: Y: X: Y: X:
Y: X: Y: X: Y: X: Y:
Der inhaltliche Ablauf von Dialogen
ber leider nicht mitklettern können, ich hatte mir nämlich das Bein verstaucht, oder so was, und die klettern da eifrig in den Felsen rum. (10) Hm. (1) Und dann könnt ich dann beobachten, was so in der Jugendherberge los war. (5) Die Jugendherberge liegt aber ziemlich weit auf m Berg. (7) J a , j a , hm; na j a , gegen Abend hat man η wunderbaren Blick dann nach Marseille. Der Herbergsvater ist doch so η netter Kerl. (7) Avant, allons pendant. (12) Da mußten die Leute immer aller selber spülen und so. (7) J a , das muß man ja sowieso, selber spülen. (13) J a , aber, äh, das geschieht auf so legere Art, nicht. (12) Hm, die französischen Jugendherbergen sind j a sowieso gar nicht mit unseren zu vergleichen, unsere sind meistens von so, ich meine, bei uns machen die einen so auf den Hausvater, und die anderen so auf den Tyrannen oder so ähnlich. (14) J a , Militär. (16) Ja,ja.(l) J a , das ist — (2) Die Franzosen. Die sind meistens so gemütliche Typen. (14) J a , ich glaub der auch. (2) Hm. (1) Der versteht es ganz gut, mit den Leuten zu quatschen. (15)
Beispieldialog III Y: Die haben auch gute Vorträge im Amerikahaus. X : Vorträge auch. (3) Y : J a j a , auch so Vorträge. (3) X : J a stimmt, j a . (2) Y: Das war j a jetzt ne böse Sache mit einem, äh, mit dem amerikanischen Konsul in Frankfurt, der hat η Vortrag gehalten, wollte im Amerikahaus η Vortrag halten. Da war der — über, äh, Vietnam — da war der Andrang (12) X : Hm, h m ( l ) Y: der SDS- und SHB-Studenten, sozialistischer (5) X : Hm, h m ( l ) Y : Hochschulverband, war so groß, daß es, äh, äh, ins Audimax den Vortrag sogar verlegt haben (5) X: Ja,ja(l) Y : jedenfalls in η großen Raum im neuen, äh, Hörsaalgebäude (6) X : Hm, aber das soll gar nichts gewesen sein, ich hab η Bekannten
Kontingenz regeln
261
gesprochen, der ist in Glessen, der ist Journalist da von der DPA, der hat gesagt, also so ein Kappes, der hätte dauernd an dem Thema vorbeigeredet, der hätte überhaupt nicht auf das, das eigentliche Problem Vietnam (7) Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y: X: Y:
J a (1) weshalb die Amerikaner dort sind usw., da wär er gar nicht drauf eingegangen (5) J a , er ist sehr viel unterbrochen worden, und dann soll er sehr lebhaft gewesen sein. (7) J a ? (4) J a , ja, er soll außerdem oftmals, äh, auch angepöbelt worden sein (5) Ja(1) aber nach, äh, 14 Tagen oder nach einer Woche hat ers nochmals wiederholt, den Vortrag (9) So?(4) hat er denselben Vortrag nochmal gehalten, weil der Zuspruch so groß war, das kann ich mir eigentlich nicht denken. (9) Haben sie den von Tadden gehört? (8) Nee, da war ich eingeladen (11) Da war ich auch nicht da (5) Der kommt ja auch nicht wieder (5) Das muß das letzte Ding gewesen sein (7) Aber raffiniert soll der gewesen sein. (7)
Mit dem Problem, inhaltlichen Übergängen in Gesprächen linguistisch definierbare Korrelate zuzuordnen, beschäftigen sich zwei Aufsätze von Reichmann (1978a, 1978b). Reichmann beschreibt Dialoge als hierarchisch gegliederte Strukturen, in denen in einen allgemeinen thematischen Kontext Spezifikationen und Erläuterungen eingebettet werden. Die von ihr analysierten thematischen Übergänge entsprechen also hauptsächlich den oben erwähnten Kategorien Spezifikation, Verallgemeinerung und Exemplifizierung. In ihren Analysen eines englischen Dialoges fand sie, daß diese Arten von Übergängen durch folgende fünf Klassen von sprachlichen Merkmalen charakterisiert werden können: 1. Schlüsselwörter: „wie als . . . " leitet Spezifikationen und Retuschenwechsel bei gleichbleibendem Thema ein; „wie dem auch sei" führt zum Hauptthema zurück usw. 2. Explizit thematisierte Übergänge wie „wie ich schon gesagt habe" oder „aber vorher will ich noch etwas anderes erzählen". 3. Gebrauch von Pronomen: Beim Wechsel zu einem Thema, bei dem ein bestimmter Aktant im Blickpunkt des Geschehens steht, wird
262
Der inhaltliche Ablauf von Dialogen
dieser A k t a n t zunächst durch eine Bezeichnung eingeführt und später durch ein Pronomen bezeichnet. 4. Wiederholung von Wörtern und Sätzen wenn der Sprecher zu einem früheren Thema zurückkehrt. 5. Tempuswechsel: Wenn der Zeitpunkt eines geschilderten Ereignisses von demjenigen eines vorher geschilderten Ereignisses abweicht, dann wird das neue Thema durch eine adverbiale Zeitbestimmung eingeleitet und/oder es findet ein Tempuswechsel statt. Ein zweiter Problemkreis, auf den bei der Formulierung der Kontingenzregeln nicht eingegangen wurde, betrifft die Frage, an welchen Stellen innerhalb des Dialoges der Sprecher welche Art von inhaltlichem Übergang wählt. Bis zu einem gewissen Maße sind hierzu in den Protokollen Regelmäßigkeiten sichtbar. So lassen sich häufig bei demselben Sprecher längere Serien von inhaltsorientierten Äußerungen ohne Wechsel des Gesprächsthemas beobachten (Kategorie 2.1.1), die lediglich von kurzen gesprächsorientierten Äußerungen des Partners unterbrochen werden. Wechselseitige Ergänzungen ohne Wechsel des Gesprächsthemas (Kategorie 2.1.3) treten vor allem dann auf, wenn beide Gesprächspartner über ähnlich breite Kenntnisse in dem thematisierten Wissensgebiet verfügen. In den Marburger Protokollen trifft dies etwa bei den Themen „ S t u d i u m " und „Studiengang" zu. Solche Regeln sind jedoch sehr schwer zu formalisieren; denn es stellt sich hier wiederum das schon in der Einleitung erwähnte Problem, daß kein vollständiges Modell über die Kenntnisse der Sprecher zur Verfügung steht. Zudem sind die inhaltlichen Abläufe auch in hohem Maße durch die Situation bestimmt, in der sich die beiden Partner befinden. So konnte in den Marburger Protokollen nur in seltenen Fällen beobachtet werden, daß in aufeinanderfolgenden Äußerungen jeweils Inhalte des semantischen Gedächtnisses mitgeteilt wurden. In anderen Situationen, wie ζ. B. in einer wissenschaftlichen Diskussion, wird diese Klasse von Übergängen jedoch sehr häufig sein. Die in diesem Abschnitt gegebene Kategorisierung der Äußerungen hat damit einen rein deskriptiven Charakter.
5. Die Retuschen-Ergänzung In den vorhergehenden beiden Abschnitten wurde beschrieben, durch welche Prozesse eine Retusche vom Sprecher als äußerungswürdig bestimmt wird, und welche inhaltlichen Abläufe innerhalb der Dialoge auftreten. In diesem Abschnitt sollen nun diejenigen Prozesse analysiert werden, die bestimmen, welche Elemente der gewählten Retusche äußerungswürdig sind. Auch hier gilt die allgemeine Regel, daß
Die Retuschen-Ergänzung
263
ein Sprecher nur diejenigen Inhalte äußert, die nicht in dem Rezept für den Gesprächsgegenstand enthalten sind; dies erklärt sich daraus, daß Rezepte innerhalb einer bestimmten Kultur weitgehend interindividuell gültig sind. So k a n n ein Sprecher beispielsweise a n n e h m e n , daß das allgemeine Wissen seines Gesprächspartners über das Reisen mit der Eisenbahn mit seinem eigenen Wissen weitgehend übereinstimmt; die Kenntnisse seiner individuellen Erlebnisse beim Eisenbahnfahren, die über dieses allgemeine Wissen hinausgehen, kann er jedoch beim Gesprächspartner nicht voraussetzen. Der Prozeß der Retuschen-Ergänzung soll im folgenden am Beispiel eines Dialoges dargestellt werden, in dem ein Sprecher seinem Partner die Einrichtung seines Zimmers in einem Studentenheim schildert (Beispieldialog IV). Im Gegensatz zu den bislang entwickelten Rezepten, die das Wissen über komplexe Handlungen repräsentieren, beschreibt das R e z e p t , welches diesem Gespräch zu G r u n d e liegt, das Wissen über Zusammenhänge zwischen statischen Objekten. Auch solche Wissensinhalte, wie in diesem Beispiel das Wissen über die Einrichtung eines Studiozimmers, können durch Rezepte repräsentiert werden; bei dem ersten Beispiel für einen „ f r a m e " , mit dem Minsky (1975) diesen Begriff in dem Bereich der künstlichen Intelligenz einführte, handelte es sich u m die Beschreibung eines Zimmers. Die in Abbildung 4 2 gezeigte Darstellung eines Rezeptes für „Studio-Zimmer" unterscheidet sich allerdings stark von derjenigen Minskys. Der Grund hierfür ist, daß sich Minsky um die Formalisierung v. a. solcher Aspekte des Wissens bemühte, die für die visuelle Wahrn e h m u n g wichtig sind, während hier hauptsächlich diejenigen Wissensinhalte beschrieben sind, die im sprachlichen Dialog relevant werden. Sowohl die in Abbildung 4 2 verwendete N o t a t i o n , als auch die Klassifizierung der Relationen wurden, soweit dies möglich war, von dem System von Winston (1975) ü b e r n o m m e n . Dieses bildet m. W. den bislang einzigen ausgearbeiteten Ansatz zur Beschreibung räumlicher Relationen zwischen Objekten in einem ,,frame"-System. Die mit der Präposition „ ü b e r " bezeichnete Verbindung entspricht in dem System von Winston der Relation mit dem treffenderen englischen Ausdruck „ s u p p o r t e d b y " . Das in Abbildung 4 2 gezeichnete Rezept k ö n n t e etwa wie folgt paraphrasiert werden: Ein Studio-Zimmer hat sechs Begrenzungen: der F u ß b o d e n , die Decke u n d die vier Wände, die als W a n d j , Wand2, \Vand3 und Wand4 bezeichnet werden sollen. Die vier Wände befinden sich unmittelbar über dem F u ß b o d e n , u n d die Decke befindet sich über den Wänden. Unterhalb der Decke befindet sich eine Lampe, und auf dem F u ß b o d e n ist ein Teppich. In einer der vier Wände
264
Der inhaltliche Ablauf von Dialogen
Abb. 42: Rezept für „Studio-Zimmer" Studio-Zimmer
Büchergestell
Die Retuschen-Ergänzung
265
(Wand j) ist die Türe, und in einer oder mehreren der anderen Wände befindet, bzw. befinden sich eines oder mehrere Fenster. Zudem enthält ein Studio-Zimmer normalerweise einen Schrank, einen Tisch mit einem Stuhl, ein Bett und ein Gestell. Dieses Schema ist v. a. darum mangelhaft, weil es keine Beschreibungen über die Form und die Positionen der sechs Begrenzungsflächen enthält. So müßte etwa angegeben werden, daß es sich bei den sechs Flächen um Rechtecke handelt, daß Decken und Fußboden horizontal und die Wände vertikal sind, und daß aneinander grenzende Flächen zueinander senkrecht stehen. Diese Informationen sind zwar für die Wahrnehmung von Räumen bedeutsam; für die Analyse des Beispieldialoges IV sind sie jedoch unwichtig und sollen deshalb hier unberücksichtigt bleiben. Beispieldialog IV: Beschreibung eines Studio-Zimmers I. X: Die Zimmer sind schön da oben und praktisch. Y: Wie groß sind die? X: Sie sind nicht sehr groß, aber sie haben den Vorteil — man hat also fließend Wasser da. Y: Hm. X: Und das ist also abgetrennt. Y: Abgetrennt? X: Und zwar — man tritt zunächst in eine Nische, wenn man den Raum betritt, äh, da ist allerdings das Waschbecken, rechts so η Einbauschrank, so η großer, da passen eben alle Klamotten da rein. Y: Hm. X: Und dann ist diese Nische wiederum durch eine Holzwand vom eigendichen Raum abgetrennt. Y: Das ist ja gut. X: Durch eine — mit einer Tür kommt man, betritt, äh, kann man also durch den Raum durch. Diese Tür hat den Vorteil, daß man einmal mit dieser Tür die Wand abschließen kann, ja, und dann auch zugleich den Schrank — also immer wieder. Nicht, das ist also patent gemacht, und dann eben diese holzgetäfelte Wand da, nicht, und dann auf der gegenüberliegenden Seite dieses Fenster. Y: hm. X: Was auch ne ganze Wandseite einnimmt; und dann dieser prima Schreibtisch, der davor ist. Y: Groß? X: Auch über die ganze Länge, äh, Breite des Zimmers, nicht. Y: Das ist ja prächtig.
266 X: Y: X:
Der inhaltliche Ablauf von Dialogen
Vor diesem, vor diesem großen Fenster. Also ein breiter Schreibtisch, das ist j a herrlich. Wo man Schubläden hat und, kleine und so ne große Schublade, und dann so ne Ablage rechts. Y: Hm. X: Nicht, und am Fußende des Bettes dann, direkt am Kopfende des Bettes hat man die Lichtschalter nochmal, die man auch ganz vome hat neben dem Waschbecken, die hat man da nochmal. Also wenn man schläft, dann kann man sich da ne Leseleuchte anmachen oder das große Licht anmachen. Y: Ist ja prächtig. X: Das ist alles so patent gemacht. Ich hab schon viele Studentenheime gesehen; dies ist das beste, was ich je gesehen hab. Y: Ach, ich wohne an sich auch ganz gut . . . Die in Abbildung 42 verwendete, von Winston übernommene Notation erinnert an die Darstellung semantischer Netzwerke, und auch die verwendeten Relationen ähneln denjenigen von Simmons (1972) oder von Rumelhart, Lindsay und Norman (1972). Damit ist die Frage berechtigt, wodurch sich das beschriebene Rezept von einem semantischen Netzwerk unterscheidet. Der wichtigste Unterschied zwischen diesen beiden Arten von Darstellungen besteht m. E. darin, daß bei dem in Abbildung 42 gezeigten Rezept die einzelnen Wissensinhalte unter einem bestimmten Thema vereinigt sind; in diesem Falle ist dieses Thema die Beschreibung eines Zimmers. In einem semantischen Netzwerk andererseits würden etwa von dem Knoten für „Stuhl" Relationen zu den Knoten für „Holz", „Schreiner", „Möbelgeschäft", „Lehne" usw. ausgehen, die für die Beschreibung eines Zimmers alle irrelevant sind. Einerseits ähnelt also die Knotenstruktur innerhalb des Rezeptes für Studio-Zimmer einem semantischen Netzwerk; andererseits sind jedoch in einem ,,frame"-Modell die Wissensinhalte in strukturierten und voneinander abgehobenen Einheiten geordnet. Einen vergleichbaren Ansatz zur Strukturierung von Wissensinhalten, welche die Form von semantischen Netzen haben, beschreibt Scragg (1975). Die Aussagen des Gesprächspartners X in Beispieldialog IV geben eine Reihe von Hinweisen darauf, in welchen Punkten sich seine Retusche des beschriebenen Zimmers von dem allgemeinen Studio-Zimmer-Rezept unterscheidet. Folgende Unterschiede scheinen dem Sprecher dabei bedeutsam zu sein: 1. Das Zimmer ist in einen Vorraum („Nische") und einen Hauptraum aufgeteilt. 2. Vorraum und Hauptraum sind durch eine hölzerne Zwischenwand voneinander abgetrennt.
Die Retuschen-Ergänzung
267
3. In dem Vorraum ist fließendes Wasser. 4. In dem Vorraum befindet sich ein großer Schrank. 5. Das Fenster liegt gegenüber des Eingangs und nimmt die ganze Wandbreite ein. 6. Der Tisch steht vor dem Fenster und nimmt ebenfalls die ganze Wandbreite ein. 7. Die Schranktüre ist zugleich die Türe der Zwischenwand. Dabei scheint es sich u m folgendes System zu handeln, daß bei der Konstruktion von Kajütbooten häufig angewendet wird: Zwei aneinandergrenzende Wände haben j e eine Türöffnung, die an die Kante zwischen den beiden Wänden grenzt. Sie haben j e d o c h nur eine gemeinsame Türe, deren Scharnier sich an der Kante zwischen den beiden Wänden befindet. Dies bedingt, daß durch das Schließen einer Türöffnung jeweils die andere Türöffnung aufgemacht wird. 8. Der Schreibtisch hat viele Schubladen und eine Ablage. 9. A m Bett befindet sich ein Lichtschalter. Ein möglicher Grundriß des Zimmers, das in Beispieldialog IV geschildert wird, findet sich in Abbildung 43. Während die Aussagen von Sprecher X eine zuverlässige „ R e k o n s t r u k t i o n " des Vorraumes und der Positionen und Größen von Fenster und Tisch erlauben, sind die Positionen des Bettes sowie die Proportionen des Zimmers mehr oder weniger willkürlich bestimmt worden. Zudem ist es möglich, daß sich in dem beschriebenen Zimmer noch weitere, nicht genannte Möbelstücke befinden, wie ζ. B. ein Beisetztisch. Abbildung 4 4 ist eine mögliche Retusche des Rezeptes für Studiozimmer, das der Schilderung zu Grunde liegt. Die Darstellung enthält nur diejenigen Knoten und Verbindungen, die entweder nicht in dem entsprechenden Rezept enthalten sind, oder die für die Repräsentation der protokollierten Aussagen notwendig sind. Der linke Teil der Darstellung beschreibt den Vorraum, der mittlere Teil die Funktionsweise der Zwischentüre, und der rechte Teil beschreibt den Hauptraum. Die verwendete Notation ist hier dieselbe wie bei der vorhergehenden Darstellung, und Abbildung 4 4 sollte damit ohne weitere Erläuterungen verständlich sein. Aus der Darstellung des Studio-Zimmers in Abbildung 4 4 ist nicht ersichtlich, daß es sich bei den Seitenwänden des Vorraumes (Wand2 und Wandg) u m eine Fortsetzung der Seitenwände des Hauptraumes (Wandg und Wandy) handelt. Dies ist darum gerechtfertigt, weil man sich in der Regel nicht merkt, welche topologischen Beziehungen zwischen den Wänden von verschiedenen Räumen einer Wohnung bestehen. Einen Beleg hierfür liefert ein Experiment von Norman (1973), in dem die V p n einen Grundriß ihres Zimmers und der daran grenzenden R ä u m e zeichnen mußten. D a alle V p n dieses Experi-
268
Der inhaltliche Ablauf von Dialogen
Abb. 43: Möglicher Grundriß des in Beispieldialog IV geschilderten StudioZimmers Fenster
Schreibtisch
Gestell
Bett
hölzerne . Zwischenwand
. Schrank- und Zwischen türe
Waschbecken... • Schrank
Die Retuschen-Ergänzung Abb. 44: Retusche des in Beispieldialog IV geschilderten Studio-Zimmers
269
270
Der inhaltliche Ablauf von Dialogen
mentes ζ. T. schon seit länger als einem Jahr in demselben Studentenheim wohnten, konnten die Zeichnungen mit den Grundrissen des Architekten verglichen werden. Dabei zeigte sich, daß die Vpn das Zueinander der verschiedenen Räume nicht erinnerten, sondern aufgrund allgemeiner Kenntnisse zu rekonstruieren versuchten. Diese Untersuchung von Norman kann auch als Beispiel dafür dienen, wie die Struktur von Retuschen empirisch ermittelt werden kann. Bevor ich mit der Beschreibung der Retuschen-Ergänzung fortfahre, soll kurz auf ein allgemeines Problem eingegangen werden, welches mit der in den Abbildungen 42 und 4 4 gezeigten Art der Repräsentation zusammenhängt: Paivio (1969), Bower (1972), Simon (1972) und andere argumentieren, daß das Langzeitgedächtnis aus einer semantisch-begrifflichen Komponente einerseits und aus einer visuellen bildhaften Komponente andererseits bestehe. Konkrete Objekte, wie beispielsweise ein Zimmer u n d die darin enthaltenen Möbel würden im LZG nicht, oder nicht nur, als Begriffsstrukturen, sondern (auch) in bildhafter Form gespeichert werden. Für die Annahme eines Gedächtnisses für bildhafte Vorstellungen sprechen v. a. zwei Klassen von Argumenten: Zum einen äußern die meisten Personen eine sehr starke introspektive Evidenz, daß sie konkrete Gegenstände in der Form von Bildern erinnern. Zum anderen scheinen eine Reihe der in Paivio (1971, 1975) beschriebenen Experimente auf das Vorhandensein von gespeicherten bildhaften Vorstellungen hinzuweisen. Im Gegensatz zu den Inhalten des semantisch-begrifflichen Gedächtnisses, die aus diskreten Elementen aufgebaut sind, werden die bildhaften Gedächtnisinhalte häufig als „analog" bezeichnet. Nun ist m. W. noch nie die These vertreten worden, die Gedächtnisspuren von konkreten Objekten seien Kopien oder direkte Transformationen des Retinabildes. Mit anderen Worten heißt dies, daß auch konkrete Objekte im Gedächtnis in einer symbolischen Form gespeichert werden. Der Unterschied zwischen der sog. visuellen und der begrifflichen Repräsentation eines Gegenstandes bestünde also lediglich darin, daß bei der ersteren die Gedächtnisspur dem optischen Eindruck „näher" oder „verwandter" wäre, als beispielsweise die in Abbildung 42 gezeigte Begriffsstruktur. Eine solche, dem optischen Eindruck verwandte Repräsentation ist beispielsweise der in Abbildung 43 gezeigte Grundriß. Nun kann ein solcher Grundriß sicher nicht als adäquate Repräsentation unseres bildhaften Wissens von einem Zimmer betrachtet werden; er müßte zumindest noch um weitere Informationen ergänzt werden, welche die dritte, senkrechte Dimension berücksichtigen, und die Positionen der einzelnen Gegenstände dürften nicht durch exakte, absolute Maße gegeben werden, sondern sie müßten zumindest ζ. T. durch ihre gegenseitigen räumlichen Bezie-
Die Retuschen-Ergänzung
271
hungen beschrieben werden. Zieht man weiterhin in Betracht, daß Linien und Flächen durch geometrische Formen beschrieben werden können, dann kommt man zum Schluß, daß die visuell-bildliche Repräsentation von Objekten im Gedächtnis sich in keinem entscheidenden Punkt von einer semantisch-begrifflichen Repräsentation unterscheidet, wie sie etwa in Abbildung 42 dargestellt ist. Die Annahme, daß neben der semantisch-begrifflichen Gedächtnisspur von einem Gegenstand noch eine zweite, visuell-bildliche Spur bestehe, wird damit unplausibel. Das Erleben von bildhaften Vorstellungen kann besser durch die alternativen Annahmen erklärt werden, daß im semantischen Gedächtnis Informationen über die Gestalt (Farbe, Helligkeit usw.) von Objekten in propositionaler Form enthalten sind, und daß diese Informationen die Basis für die Rekonstruktion von Vorstellungsbildern liefern (Norman, 1978). Der Prozeß der Retuschen-Ergänzung besteht nun darin, daß der Sprecher die einzelnen Inhalte der Retusche mit dem entsprechenden Rezept vergleicht und alle diejenigen Inhalte der Retusche äußert, die von dem Rezept abweichen. Dieser Prozeß wird durch zwei Mechanismen gesteuert: Zum einen muß für jeden Inhalt der Retusche bestimmt werden, ob die Modifikation des Rezeptes genügend wichtig ist, daß dieser Inhalt geäußert wird. Zum anderen müssen Regeln darüber bestehen, in welcher Reihenfolge die einzelnen Inhalte abgetastet werden. Bei der Bestimmung, welche Inhalte der Retusche äußerungswürdig sind, wird von der Tatsache Gebrauch gemacht, daß Rezepte möglichst allgemeine Beschreibungen von Handlungsabläufen und Tatbeständen sind. So wird ζ. B. in den Rezepten für komplexe Handlungen lediglich angegeben, daß im Verlaufe der Handlung bestimmte Zustände realisiert werden müssen, und wie diese Zustände normalerweise produziert werden. Die Handlungsrezepte geben jedoch keine exakte und zwingende Anweisung über die Durchführung der beschriebenen Aktion. Damit bilden alle diejenigen Inhalte einer Retusche, die dem Rezept widersprechen, eine signifikante Abweichung, die in der Regel geäußert wird. Als Kriterium der AußerungsWürdigkeit gilt also nicht, ob der einzelne Inhalt der Retusche auch im Rezept enthalten ist, sondern o b er dem Rezept widerspricht. Nehmen wir an, ein Sprecher beschreibe eine Eisenbahnreise, die er kürzlich unternommen habe. In der Regel wird er nicht erwähnen, daß er eine Fahrkarte besessen hat; denn dieser Inhalt ist bereits in dem Rezept für „mit-dem-Zug-Reisen" enthalten (siehe die Beschreibung dieses Rezeptes in Kapitel VIII). Falls er mit der Straßenbahn zum Bahnhof gefahren ist, dann würde er dies in der Regel auch nicht erwähnen, obwohl das Rezept für „mit-dem-Zug-Reisen" keine An-
272
Der inhaltliche Ablauf von Dialogen
gaben darüber enthält, auf welche Weise der Reisende zum Bahnhof gelangt. Anstatt dessen ist der Zustand (LOC IN R E I S E N D E R (Bahnhof von VON) W) in diesem Rezept durch eine nhd-Verbindung mit anderen Rezepten assoziiert, die verschiedenen Arten des innerstädtischen Verkehrs (Taxi, Straßenbahn, gehen, Autofahren usw.) beschreiben. Die Information, daß der Reisende mit der Straßenbahn zum Bahnhof fährt, ist also nicht Teil des Rezeptes; andererseits widerspricht sie dem Rezept auch nicht und wird deshalb vom Sprecher nicht als äußerungswürdig betrachtet werden. Würde der Sprecher jedoch ohne Fahrkarte reisen, dann stünde dies im direkten Widerspruch zu dem Rezept und würde darum von ihm geäußert werden. Andererseits lassen sich Situationen ausdenken, in denen der Sprecher erwähnt, daß er mit der Straßenbahn zum Bahnhof gefahren ist. In einem solchen Fall wird jedoch die geschilderte Situation so sein, daß man die Benützung eines anderen Verkehrsmittels erwarten würde, oder es wird während der Straßenbahnfahrt selbst etwas ungewöhnliches passiert sein wie ζ. B. in: Letzten Samstag fuhr ich mit dem Zug nach Basel. Ich nahm die Straßenbahn zum Bahnhof. Es war ein solcher Verkehr, daß ich Angst hatte, den Zug zu verpassen. Wie für die Beschreibung von komplexen Handlungsabläufen, so gilt auch für die Beschreibung von statischen Situationen die Regel, daß nur diejenigen Inhalte geäußert werden, die zu dem entsprechenden Rezept im Widerspruch stehen. So kann man etwa annehmen, daß den Knoten für „Fenster", „Bett", „Tisch" usw. sog. Normalwerte zugeordnet sind. Diese Werte geben an, daß ein Einzelbett normalerweise ca. 5 0 cm hoch ist und eine rechteckige Matraze von ca. 180 cm Länge und 9 0 cm Breite hat. Durch solche Normalwerte werden auch die üblichen Maße, bzw. Schwankungsbreiten von Fenstern, Tischen usw. repräsentiert. Andererseits enthält das Rezept für Zimmer, im Gegensatz zur Retusche, nur wenige Aussagen über die gegenseitigen räumlichen Beziehungen zwischen den einzelnen Möbelstücken, da diese Relationen von Fall zu Fall variieren. Bei der Schilderung einer Zimmereinrichtung wird deshalb der Sprecher in der Regel nicht erwähnen, an welcher Wand das Bett steht. Weichen hingegen die Maße des Bettes in dem beschriebenen Zimmer Stark von den Normalwerten ab, oder handelt es sich dabei um ein Rund- oder Wasserbett, dann würde dies vom Sprecher erwähnt werden. Die Auswahl der Aussagen von Sprecher X in Beispieldialog IV scheint weitgehend durch diesen Mechanismus gesteuert zu sein. Lediglich bei zwei der insgesamt neun geäußerten Inhalte kann man annehmen, daß sie in einem üblichen Zimmer in einem Studenten-
Die Retuschen-Ergänzung
273
heim vorkommen: der Lichtschalter am Bett und die Ablagen des Schreibtisches. Alle anderen Inhalte sind für den geschilderten Raum „spezifisch". Nun ist die Einschätzung, welche Merkmale eines Studio-Zimmers üblich, und welche Merkmale für dieses Zimmer spezifisch sind, in hohem Maße subjektiv; die Analyse eines einzelnen Beispieldialoges bildet deshalb nur eine schwache Bestätigung der in den obigen Abschnitten postulierten Regel. Zufälligerweise findet sich nun in einem anderen der Marburger Protokolle ein Dialog, in dem ein anderer Sprecher, der offensichtlich in dem gleichen Studentenheim wohnt, sein Zimmer schildert (Beispieldialog V). Dieser Dialog ist für eine inhaltliche Analyse weniger gut geeignet als Beispieldialog IV, da der Sprecher hier in starkem Maße von der Gestik als Hilfsmittel der Kommunikation Gebrauch macht. Nichtsdestoweniger werden hier sieben der neun Inhalte erwähnt, die in Beispieldialog IV genannt werden. Zudem handelt es sich bei den Inhalten, die nur in einem der beiden Dialoge vorkommen, ausschließlich um solche Attribute, die für ein Studio-Zimmer wenig untypisch sind: Am Bett befindet sich ein Lichtschalter, es befindet sich ein kleiner Tisch im Zimmer, der Schreibtisch hat viele Schubladen und eine Ablage. Die weitgehende Übereinstimmung in bezug auf die geäußerten Inhalte kann als eine erste und vorläufige empirische Bestätigung für die Gültigkeit der beschriebenen Mechanismen für die Auswahl der Sprechinhalte betrachtet werden. Beispieldialog V: Beschreibung eines Studio-Zimmers II Y : Ja, bei uns ist es natürlich so: Wir haben, na ja, das kommt auf den einzelnen an — ist nicht, ist nicht groß, das Zimmer, nicht X : hm Y : groß ist es nicht, zwölf Quadratmeter höchstens; aber η abteilbaren Waschraum dabei, nicht, schöner großer Einbauschrank, ja, da ist also, wenn man da reinkommt, da kann man ruhig, sagen wir hier diese Breite nehmen, von der Wand bis ungefähr da zu diesem Apparat hier da, dieses Ding, das ist das Zimmer. X: hm Y : Wenn man reinkommt, da ist das Fenster, quer vorm Fenster der große Schreibtisch, steht über die ganze Breite; das ist also wunderschön, so η Schreibtisch. X: hm Y : Nicht, und dann hat man hier das Bett stehen. X: hm Y: Und da ist dann noch η bißchen Platz, und dann steht da so η kleiner Tisch.
274
Der inhaltliche Ablauf von Dialogen
hm mit m Stuhl. Und dann ist Schluß, schon, hm Und dann ist davor der Waschraum hm mit dem einen Waschschrank; und die Tür des einen Waschschranks X: hm Y: kann man gleichzeitig als Zwischentür zum Waschraum nehmen. Die kann man, die hat zwei Funktionen, nicht. X: hm Y: Also wenn mal irgendwie Besuch kommt, oder da ist mal ne Maid da, X: hm Y: da können sich, die kann sich also da waschen. X: hm Y: Oder man kann sich selbst da waschen, ohne daß man sich dabei was tut, nicht Der zweite, für die Äußerung einer Retusche bedeutsame Mechanismus regelt die zeitliche Reihenfolge, in welcher die einzelnen Inhalte erwähnt werden. Die einfachste Annahme über diesen Mechanismus ist, daß der Sprecher nach jeder Äußerung eines Inhaltes einen mit diesem Inhalt verbundenen zweiten Inhalt oder Knoten fokussiert und darauf die Äußerungswürdigkeit dieses zweiten Inhaltes evaluiert. Diese Annahme läßt sich anhand der in Abbildung 4 4 dargestellten Retusche des geschilderten Studio-Zimmers überprüfen: Zwei Inhalte, die in dem Beispieldialog unmittelbar nacheinander geäußert werden, sollten auch in der Darstellung direkt miteinander verbunden sein. Dabei muß man allerdings annehmen, daß die Verbindungen, die über einen Konjunktionsknoten (UND, ODER) laufen, wie ζ. B. die Verbindung zwischen „Vorraum" und „Waschbecken", direkte Verbindungen bilden, da diese Konjunktionsknoten lediglich syntaktische Funktion haben. Mit Ausnahme von denjenigen Fällen, in denen der durch die Konjunktion beschriebene Zusammenhang direkt thematisiert wird, können also die Konjunktionsknoten in diesem Zusammenhang unberücksichtigt bleiben. Transkiribiert man die Aussagen in Beispieldialog IV in einfache Propositionen von der in Kapitel VII beschriebenen Form, dann können die geäußerten Inhalte und deren Reihenfolge folgendermaßen dargestellt werden: 1 2 3
(LOC IN Zimmer Waschbecken W) (LOC IN Waschbecken Hauptraum F ) ( T E I L Zimmer Vorraum W)
Die Retuschen-Ergänzung
4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
275
(LOC IN Vorraum Waschbecken W) (LOC IN Vorraum Schrank W) (DIMENSION GRÖSSE Schrank groß) (LOC ZWISCHEN (Vorraum Hauptraum) Wand 4 W) (MATERIAL Wand 4 Holz W) (TEIL Wand 4 Tür! W) (TEIL Schrank Tür! W) (ODER (SCHLIESSEN Tü r i Wand 4 W) (SCHLIESSEN Tür : Schrank W) W) (MATERIAL Wand 4 Holz W) (LOC GEGENÜBER Wand 4 Wand 5 W) (TEIL Wand 5 Fenster W) (VON/BIS Fenster (Wandg Wandy) W) (LOC VOR Fenster Tisch W) (VON/BIS Tisch (Wandg Wandy) W) (TEIL Tisch Schubladen W) (LOC BEI Tisch Ablage W) (LOC BEI Bett Lichtschalter W) Insgesamt 17 dieser 21 Propositionen sind direkte Entsprechungen von Relationen, die in der Retusche des Studio-Zimmers (Abbildung 44) enthalten sind. Lediglich bei den Propositionen 1, 2, 7 und 14 handelt es sich um Inferenzen, die aus den Inhalten der Retusche deduziert wurden. Abbildung 45 zeigt diejenigen Inhalte der Retusche, die in Beispieldialog IV erwähnt wurden. Dabei sind die geäußerten Relationen mit durchgezogenen Linien und alle anderen Relationen mit unterbrochenen Linien bezeichnet. Die den Relationen zugeordneten Zahlen geben an, in welcher Position innerhalb des Dialoges die entsprechenden Propositionen geäußert wurden. Wie man sieht, entspricht diese Reihenfolge recht genau der postulierten Regel, daß bei jeder Aussage von einem Begriff ausgegangen wird, der in der vorherigen Aussage genannt wurde: Der Sprecher erwähnt zuerst den Vorraum und die darin enthaltenen Gegenstände, das Waschbecken und den großen Schrank (Propositionen 3 bis 6). Darauf wird die hölzerne Wand (Wand 4 ) des Vorraumes, die in die Wand eingelassene Türe und deren Funktionsweise beschrieben (Propositionen 7 bis 13). Diese Wand bildet zugleich eine Begrenzung des Hauptraumes, und der Sprecher erwähnt als nächstes die gegenüberliegende Wand, deren Fenster und den davor stehenden Schreibtisch (Proposition 14 bis 20). Lediglich beim Ubergang von Proposition 20 zu Proposition 21 wird nicht von einem bereits erwähnten Knoten ausgegangen.
276
Der inhaltliche Ablauf von Dialogen
Abb. 45: Reihenfolge der erwähnten Inhalte bei der Beschreibung des Zimmers
Abbildung 45 zeigt noch zwei weitere Regelmäßigkeiten, die allerdings wegen der Beschränktheit des zur Verfügung stehenden Materials nicht als gesicherte Regeln betrachtet werden dürfen. Die erste Regelmäßigkeit kann bei denjenigen Knoten beobachtet werden, die
Die Retuschen-Ergänzung
277
in mehreren Propositionen erwähnt werden. Hier werden in der Regel alle diese Propositionen geäußert, die mit dem Knoten direkt verbunden sind. Ein Knoten Α habe beispielsweise direkte Verbindungen zu den Knoten B, C und D. Die Propositionen, die durch diese Verbindungen beschrieben werden, sollen als f(A B), f(A C) und f(A D) bezeichnet werden. Zudem habe der Knoten Β eine Verbindung zu einem Knoten E; die entsprechende Proposition sei f(B E). In diesem Falle würde der Sprecher nach der Äußerung von f(A B) nicht mit der Proposition f(B E) fortfahren, sondern zunächst f(A C) und f(A D) nennen und erst dann f(B E). Diese Regel ist allerdings nicht wirksam, wenn der Sprecher in einer „Sackgasse", d. h. an einem Knoten angelangt ist, der nicht Teil einer äußerungswürdigen, bislang nicht genannten Relation ist. In diesem Fall wird der Sprecher zu einem früher erwähnten Knoten zurückgehen und von dort aus nach einer bislang nicht erwähnten Relation suchen. Ein Beispiel für diese Strategie bilden die Propositionen 3 bis 8, die in den folgenden Aussagen verbalisiert wurden: ,,. . . man tritt zunächst in eine Nische, wenn man den Raum betritt, äh, da ist allerdings das Waschbecken; rechts so η Einbauschrank, so η großer, da passen eben idle Klamotten da rein. (Y:Hm) Und dann ist diese Nische wiederum durch eine Holzwand vom eigentlichen Raum abgetrennt. . ." (aus Beispieldialog IV). Hier wurden zunächst die Relationen „Vorraum-Waschbecken" und „Vorraum-Schrank" erwähnt; dann, ausgehend von Schrank, die Relation „Schrank-groß". An dieser Stelle befindet sich der Sprecher offensichtlich in einer Sackgasse. Er geht darum zum Knoten für „Vorraum" zurück und findet die Relation (BEGRENZUNG Vorraum Wand 4 W), welche Teil von Proposition 7 wird. Die zweite Regelmäßigkeit zeigt sich bei den sog. asymmetrischen Relationen. Dabei handelt es sich um diejenigen Arten von Beziehungen, in denen durch eine Umstellung der Objekte die Bedeutung der Proposition verändert wird. So haben etwa die beiden Propositionen (TEIL Schrank Tür W) und (TEIL Tür Schrank W) verschiedene Bedeutungen. Im Gegensatz dazu ist die Stellung der Objekte bei den symmetrischen Beziehungen (BEI, GEGENÜBER) irrelevant: (LOC BEI Gestell Tisch W) und (LOC BEI Tisch Gestell W)
278
Der inhaltliche Ablauf von Dialogen
haben die gleiche Bedeutung. In den Abbildungen 44 und 45 sind die Pfeile bei den asymmetrischen Relationen IN, TEIL und BEGRENZUNG so gerichtet, daß jeweils das „Ganze" am Ausgangsp u n k t des Pfeiles, und der Teil, das im Ganzen enthaltene Objekt, bzw. die Begrenzung, an der Pfeilspitze stehen. Von Proposition 4 an ist nun bei allen Aussagen, welche asymmetrische Relationen beschreiben, der Begriff am Ausgangspunkt des Pfeilers bereits schon in einer früheren Proposition erwähnt worden. Der Sprecher hielt sich also strikt an die rhetorische Regel, daß das Ganze vor dessen Teilen erwähnt werden soll. Das Äußern einer Retusche verläuft also hauptsächlich nach zwei Regeln: Zum einen werden alle diejenigen Inhalte geäußert, die zu dem entsprechenden Rezept im Widerspruch stehen. Zum anderen richtet sich die Aufeinanderfolge der geäußerten Inhalte nach der Nähe der erwähnten Relationen in der Retusche. Diese beiden Regeln, wie auch weitere in diesem Abschnitt erwähnte Regelmäßigkeiten, sind darum vorläufig, weil sie lediglich durch einige unsystematisch gewonnene Protokolle gestützt werden und bislang experimentell nicht überprüft wurden. Es liegt darum nahe, die postulierten Mechanismen durch ein kontrolliertes Experiment zu überprüfen. Ich halte einen solchen Versuch für wünschenswert und auch notwendig; andererseits wird es sehr schwierig sein, eine experimentelle Situation herzustellen, in der das Verhalten von Sprechern in einer natürlichen Sprechsituation provoziert werden kann. Würde man beispielsweise eine Vp in einem Experiment auffordern, ihr Zimmer zu beschreiben, dann wird sie aufgrund der Situation vermuten, daß ihr Gesprächspartner, der VI, sich nicht tatsächlich für die Einrichtung ihres Zimmers interessiert. Der Aspekt, daß das Gespräch der Übermittlung von Informationen dient, würde in diesem Falle weitgehend verloren gehen, und es ist sehr wahrscheinlich, daß dadurch die Auswahl der Äußerungen stark beeinflußt wird. Wenn bislang auch keine befriedigende Lösung gefunden wurde, um diese Art von methodologischen Schwierigkeiten zu umgehen, dann darf dies jedoch nicht als ausreichender Grund zum prinzipiellen Verzicht auf eine experimentelle Oberprüfung der postulierten Gesetzmäßigkeiten betrachtet werden.
X. DIE GENERIERUNG DER SATZOBERFLÄCHE
1. Topikalisation und die Generierung von Nominalphrasen Die Grundlage für die Äußerungen in den oben analysierten Beispieldialogen IV und V sind Propositionen, die im episodischen Gedächtnis gespeichert sind. Wie die Analysen des vorhergehenden Abschnittes gezeigt haben, entspricht die Aufeinanderfolge, in der die verschiedenen Inhalte geäußert werden, der Nähe der entsprechenden Propositionen innerhalb der Retusche. In diesem Abschnitt soll nun analysiert werden, durch welche Prozesse auf der Basis dieser semantischen Propositionen Oberflächensätze generiert werden. In Anbetracht der Vielfalt syntaktischer Formen muß diese Analyse allerdings auf wenige, ausgewählte syntaktische Formen beschränkt bleiben, die für das Veranschaulichen der grundlegenden Mechanismen geeignet scheinen. Für die Erklärung der Satzgenerierung soll hier auf eine Unterscheidung zurückgegriffen werden, die im ersten Abschnitt des letzten Kapitels eingeführt wurde. Dort sind die Wissensinhalte, welche an der Bildung von Aussagen beteiligt sind, in drei Gruppen aufgeteilt worden: die Aussage des Satzes, die Präsuppositionen und die pragmatischen Inhalte. Als Aussage eines Satzes wurde dabei die „Bedeutung eines Satzes im eigentlichen Sinne" bezeichnet. Bei der Beschreibung von Gesprächsabläufen wurde in den obigen Abschnitten nun noch ein weiterer Terminus für die Bezeichnung der semantischen Basis einer Äußerung eingeführt: die Proposition. Zwischen der Proposition eines Satzes u n d der Aussage besteht folgender Unterschied. Die Proposition ist der Ausschnitt aus dem semantischen oder episodischen Gedächtnis, der geäußert wird. Die Proposition, die dem Satz Das Mädchen schlägt den Knaben, zu Grunde liegt, könnte etwa mit der Notation von Simmons folgendermaßen beschrieben werden: C 1: Aktion: schlagen C 2: TOK Mädchen Aktor: C 2 Objekt: C 3 C 3: TOK Knabe Die Aufeinanderfolge der drei Satzglieder dieses Beispielsatzes wird in der linguistischen Syntax als unmarkierte oder normale Satzordnung bezeichnet; Sätze mit unmarkierter Satzordnung sind dadurch
280
Die Generierung der Satzoberfläche
gekennzeichnet, daß allen Satzgliedern ein gleichstarkes Gewicht, die gleiche Bedeutsamkeit, zukommt. Bei markierten Sätzen wird eines der Satzglieder stärker betont und/oder die Aufeinanderfolge der Satzglieder weicht von der unmarkierten, normalen Sukzession ab. Die Markierung durch Umstellung der Satzglieder geschieht in der deutschen Sprache in der Regel dadurch, daß das hervorgehobene, topikalisierte Satzglied an den Anfang oder das Ende des Satzes verschoben wird (1) Der Mann gab dem Mädchen die Blume. (2) Dem Mädchen wurde die Blume von dem Mann gegeben. (3) Dem Mädchen gab der Mann die Blume. (4) Der Mann gab die Blume dem Mädchen. (5) Geschenkt hat er sie ihr. Während der Satz (1) unmarkiert ist, wird bei den Sätzen (2), (3) und (4) das Dativobjekt „dem Mädchen" hervorgehoben. Dies geschieht dadurch, daß es bei (2) durch Passivisierung und bei (3) durch Subjektinversion an den Anfang, und daß es bei (4) durch Umstellung mit dem Akkusativobjekt an das Satzende verschoben wird. Bei (5) wird das Verb durch Voranstellung hervorgehoben. Bei der markierten Satzordnung konzentriert sich das Hauptgewicht der Aussage, d. h. die Information, die der Sprecher übermitteln will, auf das jeweils hervorgehobene Satzglied. Dies läßt sich leicht durch eine von Posner (1972) beschriebene Methode feststellen, bei der der Satz verneint wird. Wenn ein Hörer beispielsweise den obigen Beispielsatz (3) durch Nein, das stimmt nicht, kommentiert, dann könnte er diesen Kommentar durch die Aussage Es war ein Junge, ergänzen. Dieser zweite Satz wäre hier gleichbedeutend mit Es war ein J u n g e , dem der Mann die Blume gab. jedoch auf keinen Fall mit Es war ein Junge, der dem Mädchen die Blume gab. Andererseits sind die obigen Beispielsätze (1) bis (4) insofern bedeutungsgleich, als in jeder denkbaren Situation entweder alle vier Sätze zutreffen oder keiner von ihnen. Die Unterschiedlichkeit der Satzform muß also durch pragmatische oder stilistische Faktoren gesteuert sein. Eine wichtige Rolle spielen dabei die Vermutungen des Sprechers über das Wissen des Hörers. Wenn der Sprecher beispielsweise annimmt, der Hörer wisse, daß das Mädchen von dem Mann eine Blume bekommen hat, er wisse jedoch nicht, daß das Mädchen dafür nichts bezahlte, dann wird er den Satz (5) äußern. Im folgenden soll die semantische Grundlage eines Satzes, in welcher diese pragmatischen Faktoren, die seine Form bestimmen, mit berücksich-
Topikalisation und die Generierung von Nominalphrasen
281
tigt sind, als die Aussage des Satzes bezeichnet werden. Die Termini Proposition und Aussage bezeichnen die semantische Tiefenstruktur eines Satzes in verschiedenen Phasen der Satzbildung. Die Proposition ist der im LZG gespeicherte Inhalt. Durch pragmatische Faktoren, die im folgenden näher analysiert werden sollen, werden einzelne Elemente dieser Proposition hervorgehoben. Die so modifizierte Proposition ist die Aussage des Satzes. Bei den Beschreibungen von Zimmereinrichtungen in den Beispieldialogen IV und V trat der Unterschied zwischen Proposition und Aussage kaum in Erscheinung; denn bei der Äußerung einer Retusche kommt den verschiedenen Elementen der Propositionen die gleiche Bedeutsamkeit zu. DeuÜicher ist dieser Unterschied jedoch in Konversationen, in denen elliptische, d. h. verkürzte Konstruktionen auftreten. Ein Beispiel für eine solche Konstruktion findet sich in folgendem kurzen Dialogausschnitt: X : J a j a , das ist schön da oben. Y: Schön ja, aber das einzige ist eben dieser Berg. Ich muß den Berg hoch; also, ich hab noch nie solche Muskeln hier gehabt, das X: Fahrrad? Fahrrad oder zur Fuß? Y: Ich geh zu Fuß. Hier ist die von X gestellte Frage „ F a h r r a d ? " eine abgekürzte Form für den Inhalt: Trifft es zu, daß es ein Fahrrad ist, mit dem sie sich den Berg hinaufbewegen ? Die Aussage, welche damit erfragt wird, ist: Es ist ein Fahrrad, mit dem ich mich auf den Berg bewege. Die Proposition im LZG von Y, aufgrund derer die Antwort auf diese Frage gefunden wird, könnte durch den unmarkierten Satz Ich bewege mich mit dem Fahrrad auf den Berg ausgedrückt werden. Dieselbe Proposition kann jedoch auch als Basis für andere Aussagen dienen, wie ζ. B. Ich bin es, der mit dem Fahrrad auf den Berg fährt. oder Es ist ein Berg, auf den ich mit dem Fahrrad fahre. Uber diese Gebiete, die Topikalisation von Satzteilen und die Bildung von elliptischen Sätzen besteht eine sehr breite linguistische Literatur (siehe ζ. B. Halliday, 1967; Lakoff, 1971; Zemb, 1968), und auch eine Reihe von psychologischen Untersuchungen von Osgood (1971), Olson (1970, 1972) und Herrmann & Deutsch (1976) beschäftigen sich mit der Frage, unter welchen Bedingungen solche Konstruktionen gebildet werden. Auf diese Arbeiten wird jedoch im folgenden nicht eingegangen werden, sondern der Gebrauch von Ellipse und
282
Die Generierung der Satzoberfläche
Topikalisation soll lediglich daraufhin analysiert werden, auf welche Weise er von Kenntnissen im LZG bestimmt wird. Der Unterschied zwischen dem hier beschriebenen Ansatz u n d der Behandlung der Topikalisation innerhalb einer linguistischen Theorie kann an einer Arbeit von Kiefer (1970) dargestellt werden. Dort wird versucht, das Umstellen von topikalisierten Satzgliedern im Rahmen der generativen Transformationsgrammatik zu beschreiben. Dabei unterscheidet Kiefer zwei Fälle, in denen solche Transformationen stattfinden können. Im ersten Fall ist ein Satzglied emphatisch betont, d. h., daß dieses Satzglied von einem anderen — ausgesprochenen oder gedachten — Satzglied abgehoben werden soll. Eine solche emphatische Betonung besteht etwa in folgendem Beispielsatz: Peter las das Buch (und nicht etwas anderes). Diesem Satz wird in der generativen Transformationsgrammatik folgende Tiefenstruktur zugeordnet (Lu, 1965):
Peter
Past
lesen
Art
Ν
Peter
Past
V
NP
Def
das
Buch
lesen
unspezifiziert
Durch eine Reihe von Transformationen werden dann die Konstituenten NEG u n d S2 gelöscht, und die zweite Nominalphrase von S j kann durch eine fakultative Transformation mit der ersten Nominalphrase vertauscht werden. Die Löschung von S2 kann dabei nach Kiefer nur unter der Bedingung durchgeführt werden, daß das unspezifizierte Satzglied in S2 aufgrund von S j oder aufgrund des situativen Kontextes inferiert werden kann (,,. . . S2 can be deleted only if
Topikalisation und die Generierung von Nominalphrasen
283
either (a) the term „unspecified" can uniquely be infered from the corresponding term in S j , or (b) presuppositions arising from the situational context . . . allow this inference". Kiefer, 1970, p. 133). Der zweite Fall von Betonung eines Satzgliedes kann nach Kiefer dann beobachtet werden, wenn ein bekannter Inhalt, das Thema, durch einen neuen Inhalt, den Kommentar, ergänzt wird. So kann der Satz Den Abendstern sah er. dann geäußert werden, wenn das Thema Er sah etwas. schon bekannt ist und durch den betonten Kommentar ,,den Abendstern" ergänzt wird. Bei der Generierung dieses Satzes wird nach Kiefer zunächst folgende Oberflächenstruktur aufgebaut:
Det
Ν
ArtDef
den
Abendstem
sah
er
Diese Struktur werde dann obligatorisch der Transformationsregel: ArtDef 1
Ν V NP 2 3 4
1 Com 2 3 4
unterworfen. Das dabei neu eingeführte Element Com gibt an, daß die erste Nominalphrase den Kommentar des Satzes bildet. Durch diese Transformation ist dann folgende Struktur generiert worden:
284
Die Generierung der Satzoberfläche S
NP
NP
Pro
sah
er
Ν
Det
Art
V
Det
den
Com
Abendstern
In den Analysen von Kiefer ist also berücksichtigt, daß die Betonung von Nominalphrasen durch pragmatische Faktoren bestimmt wird. In diesem Punkte entspricht sein Ansatz den hier vertretenen Vorstellungen. Der grundsätzliche Unterschied zwischen den beiden Ansätzen zeigt sich jedoch in dem Stellenwert, der diesen außersprachlichen Faktoren beigemessen wird. Bei Kiefer wird der Hinweis auf diese Faktoren während der Ableitung des Satzes in dessen strukturelle Beschreibung eingeführt. Die pragmatischen Regeln selbst sind dabei lediglich in sehr allgemeiner Form als Restriktion für die Anwendung einer bestimmten syntaktischen Transformation formuliert. Ein Beispiel hierfür ist etwa die weiter oben zitierte Restriktion, daß eine bestimmte Transformation nur dann durchgeführt werden darf, wenn das nicht spezifizierte Satzglied inferiert werden kann. Innerhalb eines linguistischen Ansatzes, dessen Zielsetzung die Beschreibung sprachlicher Strukturen bildet, kann der allgemeine Hinweis auf das Vorhandensein pragmatischer Faktoren und von Präsuppositionen genügen. In einem Modell der sprachlichen Kommunikation, wie es hier angestrebt wird, ist die Aufschlüsselung gerade dieser Faktoren jedoch von zentraler Bedeutung. In dem von Kiefer verwendeten Ansatz der generativen Transformationsgrammatik heißt die Frage: Inwieweit kann die Annahme von Präsuppositionen dazu verhelfen, Sätzen mit topikalisierten Satzgliedern eine strukturelle Beschreibung zuzuordnen? Die entsprechende Frage in dem hier vertretenen Ansatz lautet: In welchen Situationen, und auf der Grundlage von welchen
Topikalisation und die Generierung von Nominalphrasen
285
semantischen und pragmatischen Wissensinhalten werden bestimmte Satzglieder topikalisiert? Um diese zweite Frage zu beantworten, müssen die Phänomene, die in der Linguistik unter dem Begriff der Präsupposition subsumiert werden, detailliert aufgeschlüsselt werden. Zudem kann der Prozeß der Satzbildung in diesem Ansatz nur dann adäquat beschrieben werden, wenn vorher ein Modell der semantischen Satzbasis, des außersprachlichen Wissens und der Intention des Sprechers erarbeitet wurde; denn jede Aussage ist durch alle diese Faktoren mitbestimmt. Ganz allgemein kann hier gesagt werden, daß Ellipsen dann benützt werden, wenn ein Kontext gegeben ist, und der Inhalt, der durch die Ellipse beschrieben wird, ohne weitere Angaben in diesen Kontext integriert werden kann. Der Kontext der Frage „Fahrrad?" im obigen Beispieldialog ist beispielsweise die Beschreibung einer mühsamen Bewegung auf einen Berg. Das semantische Wissen, daß ein Fahrrad in der Regel als Instrument für die menschliche Fortbewegung benützt wird, ermöglicht dann den Schluß, daß durch die Ellipse „Fahrrad?" nach dem Instrument der Bewegung auf den Berg gefragt wird. Diese Abhängigkeit der Bedeutung sprachlicher Akte vom jeweiligen Kontext ist in ihrer allgemeinsten Form in dem semiologischen Ansatz von Prieto ( 1 9 6 6 , 1975) beschrieben worden. Nach Prieto findet jede Art von Zeichengebung innerhalb eines situationsspezifischen Universums (univers de discours) statt. Dieses Universum hat zwei Seiten: Die Gesamtheit aller Zeichen, die innerhalb dieses Universums angewendet werden können (univers du discours indiquant), das sog. Gesprächsrepertoir, und die Gesamtheit aller außersprachlichen Ereignisse, die innerhalb dieses Universums eintreffen können (univers du discours indique), die Gesprächswelt. Durch die Zeichengebung wird dabei die Gesamtheit der möglichen Ereignisse in der Gesprächswelt eingeschränkt. Dabei wird die Art der Zeichengebung nicht nur vom Inhalt der Mitteilung, sondern auch vom Gesprächsrepertoir, auch Code genannt, und von den möglichen Ereignissen bestimmt. Der Code, mit dem beispielsweise Verkehrsbeschränkungen am Straßenrand angezeigt werden, ist der Code der Verkehrszeichen. Deshalb wird die Geschwindigkeitsbeschränkung durch das entsprechende Zeichen (eine schwarze Zahl in einem runden weißen Feld mit einem roten Rand) eingegeben und nicht durch ein Schild mit dem entsprechenden Hinweis in sprachlichem Code („Auf der kommenden Strecke ist die Höchstgeschwindigkeit 60 km pro Stunde"). Das Gesamt der möglichen Ereignisse, die Gesprächswelt, bestimmt die Zeichengebung auf zwei Arten: Zum einen werden, was trivial
286
Die Generierung der Satzoberfläche
ist, in der Regel nur solche Ereignisse bezeichnet, die tatsächlich eintreffen können. Zum anderen kann bei der Bezeichnung eines solchen Ereignisses von der Eingeschränktheit der jeweiligen Gesprächswelt Gebrauch gemacht werden. Ein Beispiel hierfür ist etwa die in manchen Gaststätten zu findende Bezeichnung von Herren- und Damentoiletten durch die schematischen Zeichnungen einer Hose und eines Damenrockes. Wenn man durch eine Türe mit der Anschrift „WC" gegangen ist und zwei andere Türen vor sich sieht, dann ist die Gesprächswelt so eingeschränkt, daß die beiden Zeichnungen als eindeutige Zeichen erkannt werden können. In einem anderen Universum, ζ. B. in einem Konfektionsgeschäft, hätten die gleichen Zeichnungen andere, und u. U. gleichzeitig mehrere Bedeutungen. Sowohl sprachliche, als auch nichtsprachliche Zeichen haben nach Prieto also die Funktion, die Menge aller in einer bestimmten Situation möglicher Ereignisse einzuschränken (als mögliches Ereignis kann hierbei auch ein innerpsychischer Sachverhalt, wie ζ. B. ein Wunsch des Sprechers, gelten). Dieser Aspekt des Mitteilens wurde in den psycholinguistischen Versuchen von Olson (1970, 1972) und von Herrmann & Deutsch (1976) mit Hilfe des folgenden experimentellen Paradigmas untersucht: Die Vpn erhielten eine Reihe von Objekten dargeboten und hatten die Aufgabe, eines dieser Objekte zu benennen. Dabei zeigte sich, daß die Vpn in der Regel für die Benennung diejenigen Attribute verwendeten, die die eindeutige Bezeichnung des Objektes mit möglichst wenigen Wörtern erlauben. Erhielten die Vpn beispielsweise einen großen hellen Würfel, einen großen dunklen Kegel und einen kleinen dunklen Kegel dargeboten, dann wurde der letztere mit dem Ausdruck „der kleine" bezeichnet. Dieses Verhalten der Vpn entspricht dem von Prieto beschriebenen Modell des Bezeichnens: Das Gesamt der im Experiment dargebotenen Objekte bildet die Gesprächswelt, und die Bezeichnungen für die Attribute der Objekte, d. h. die Wörter „Würfel", „Kegel", „groß", „klein" und „dunkel", bilden den Code. Für die Mitteilung werden diejenigen Elemente des Codes ausgewählt, durch welche die Gesprächswelt auf das zu bezeichnende Objekt eingeschränkt werden kann. Nach ähnlichen Regeln verläuft die Generierung von Nominalphrasen in dem von Winograd (1971, 1972), entwickelten Fragen-Antwort-System SHRDLU. Die Gesprächswelt bildet hier eine Menge von geometrischen Körpern, die sich voneinander in ihrer Form (Würfel, Pyramide, Schachtel), Farbe (grün, rot, blau) und Größe unterscheiden. Steht das System während des Dialoges vor der Aufgabe, einen dieser Körper zu benennen, dann werden nur diejenigen Attribute des Gegenstandes geäußert, die für dessen Identifizierung im
Inferenzprozesse bei der Satzgenerierung
287
jeweiligen Kontext notwendig sind. Dieser Kontext ist meistens aus der Form der Frage, die an das System gestellt wird, leicht zu definieren. Wird beispielsweise die Frage Welche Pyramide ist in der Schachtel? gestellt, dann m u ß bei der Antwort lediglich ein Objekt aus der Gruppe der Pyramiden bestimmt werden. Gesetzt den Fall, daß das System zwei Pyramiden kenne, eine große grüne und eine kleine blaue, und daß sich letztere in der Schachtel befinde, wäre die von dem System generierte Antwort entweder „die kleine" oder „die blaue".
2. Inferenzprozesse bei der Satzgenerierung Sowohl die Generierung von Nominalphrasen, als auch die Bildung von Satzellipsen werden also durch die gleiche Regel gesteuert: Es wird jedesmal von einem bestimmten Kontext ausgegangen, und es werden nur diejenigen Elemente der Aussage des Satzes geäußert, die nicht schon durch den Kontext gegeben sind. Wie das System von Winograd und andere Fragen-Antwort-Systeme zeigen, ist diese Regel leicht formalisierbar (d. h. ζ. B. für einen Computer programmierbar), so lange sowohl der jeweilige Kontext als auch die Gesprächswelt exakt beschrieben werden können. Man kann annehmen, daß diese Regel auch in weniger restriktiven Situationen, wie sie beispielsweise bei der Aufnahme der Marburger Protokolle bestanden, angewendet wird. Allerdings kann die Anwendung dieser Regel hier nur schwer formalisiert werden. Dies liegt hauptsächlich daran, daß Äußerungen, die in freien Dialogen aufeinanderfolgen, nicht unmittelbar aufeinander Bezug nehmen, sondern daß zwischen den einzelnen Äußerungen teilweise recht komplexe Inferenzprozesse stattfinden. Die Einbettung eines — vollständigen oder verkürzten — Satzes in den bestehenden Kontext setzt dabei voraus, daß der Hörer diese Inferenzen des Sprechers nachvollzieht. Beispieldialog VI basiert auf einer ganzen Reihe von solchen, im Gespräch nicht verbalisierten Inferenzen. Das zentrale Thema dieses Gesprächsausschnittes betrifft die Frage, wie Sprecher Y ein Stipendium für ein Studium in Amerika erhalten hat. Dabei wird vorausgesetzt, daß beide Partner über allgemeine Kenntnisse über Hochschulstudium und Stipendienwesen verfügen. Abbildung 47 zeigt die Beziehung des Begriffes für „Stipendium" zu den beiden Rezepten für die komplexen Handlungen „studieren" und „anstellen" (im Sinne von: eine berufliche Stellung verschaffen). Der Formalismus der Abbildung ist weitgehend der gleiche wie bei den Beschreibungen der Rezepte in Kapitel VII. Alle diejenigen Inhalte, die für die Analyse
288
Die Generierung der Satzoberfläche
von Beispieldialog VI nicht bedeutsam sind, werden in Abbildung 47 lediglich durch in Anführungszeichen gesetzte Stichwörter repräsentiert. Beispieldialog VI: Das Äußern von Propositionen, die miteinander nicht direkt verbunden sind. Y: . . . ich geh nächstes Jahr nach Amerika, ich hab η Stipendium X: Ja? Y: und so lange ich da — X : Von wo haben sie das bekommen? Y: Von wo — das sind private Beziehungen X: Ach, so, nicht irgendwie — Y : Nee, nee X: durch ne kirchliche Organisation Y : Nee, nee, das heißt, ein Bekannter, der — dessen Vater ist Professor auf m College in Virginia X: Hm Y : Die nehmen jedes Jahr zwei Deutsche auf X : Ach so Die in Abbildung 47 repräsentierten Inhalte können folgendermaßen paraphrasiert werden: Der Vollzug der komplexen Tätigkeit „studieren" ist an drei Voraussetzungen gebunden: Der Student muß die Hochschulreife besitzen, die normalerweise durch die Abiturprüfung erworben wird; er muß zum Studium zugelassen werden, was durch eine Bewerbung erreicht werden kann; er muß die Mittel zum Studium besitzen. Eine der für das Studium typischen Tätigkeiten ist der Besuch von Vorlesungen. Ziel des Studiums ist der Erwerb von Wissen in dem entsprechenden Fachgebiet und/oder der Erwerb eines Abschlußexamens. Die Mittel zum Studium erhält der Student von seinen Eltern oder durch ein Stipendium. Ein Stipendium ist eine Art von Anstellung, bei welcher der Beitragsgeber (typischerweise eine karitative Organisation, die Hochschule oder der Staat) dem Studenten eine Art von Lohn dafür gibt, um an einer Hochschule zu studieren. Dabei gelten die gleichen Regeln, wie für andere Arten von Anstellungen: Es wird vorausgesetzt, daß der Auftraggeber zur Anstellung ermächtigt ist, daß der Arbeitnehmer zu der ihm zugewiesenen Arbeit fähig ist, daß der·Auftraggeber oder der Betrieb über die Lohnsumme (in diesem Falle: das Stipendium) verfügt, und daß der Arbeitnehmer die entsprechende Arbeit verrichten will. Der Prozeß der Anstellung verläuft typischerweise so, daß der Arbeitnehmer durch eine Bewerbung den Auftraggeber auf sein Interesse aufmerksam macht, und daß sich der Auftraggeber darauf durch eine Prüfung oder ein Interview Kenntnisse über die Fähigkeiten des Arbeitneh-
Inferenzprozesse bei der Satzgenerierung
289
Abb. 47: Mit dem Begriff „Stipendium" verbundene Rezepte
mers verschafft. Das Resultat einer Anstellung ist, daß der Arbeitnehmer in dem Betrieb für einen bestimmten Lohn arbeitet. Neben den in Abbildung 47 formalisierten Wissensinhalten basiert Beispieldialog VI noch auf einer Reihe von weiteren Kenntnissen, so ζ. B., daß Universitäten, die ausländische Studenten aufnehmen, häufig auch für das Stipendium dieser Studenten aufkommen, daß eine Anstellung dann erleichtert wird, wenn Auftraggeber und Arbeitnehmer gemeinsame Bekannte haben, und daß Hochschulprofessoren — im Gegensatz beispielsweise zum technischen Universitätspersonal — über die Vergabe von Stipendien entscheiden.
290
Die Generierung der Satzoberfläche
Die beiden Gesprächspartner von Beispieldialog VI machen nun nicht nur von allen diesen Wissensinhalten Gebrauch, sondern sie setzen auch voraus, daß der andere über das gleiche Wissen verfügt: Nach der ersten Aussage „ich geh nächstes J a h r nach Amerika" wird das Rezept für die komplexe Handlung „studieren" aktiviert. Da die Sprecher X und Y voneinander wissen, daß sie Studenten sind, können sie auch voraussetzen, daß der andere die Hochschulreife besitzt, die in der Regel die hinreichende Bedingung für die Zulassung zum Studium in den meisten Ländern bildet (die Protokolle wurden in den 60er Jahren aufgenommen). Die ersten beiden Prärequisite des Rezeptes für „studieren" werden deshalb im Gespräch nicht erwähnt. Y kann jedoch annehmen, daß sein Partner über das dritte Prärequisit, die Mittel für sein Studium, nicht orientiert ist; zugleich erachtet er diesen Punkt für ausreichend bedeutsam, um ihn X mitzuteilen: „Ich hab η Stipendium". Durch diese Aussage wird X zugleich versichert, daß Y zum Studium nach Amerika geht. Komplexer sind die Inferenzen, die den späteren Aussagen von Y zu Grunde liegen. Durch die Frage von wo haben sie das bekommen? und durch die Äußerung ach so, nicht irgendwie — durch ne kirchliche Organisation gibt X zu verstehen, daß er sich für die Retusche interessiert, in welcher die Anstellung, d. h. die Erlangung des Stipendiums, beschrieben wird. Y antwortet jedoch nicht mit einer Äußerung der Retusche nach den im letzten Kapitel beschriebenen Regeln; er nennt lediglich wenige Propositionen und Stichwörter, die X eine teilweise Rekonstruktion der Retusche erlauben. Durch den Hinweis das sind private Beziehungen wird auf das — in Abbildung 47 nicht beschriebene — Wissen Bezug genommen, daß die Anstellung durch gemeinsame Bekannte erleichtert werden kann; die Ellipse ein Bekannter, der — dessen Vater ist Professor auf m College in Virginia spezifiziert zwei Rollen des „anstellen" Rezeptes: AUFTRAGGEBER und BETRIEB (die anderen drei Rollen: ARBEITNEHMER (= Sprecher Y), ARBEITEN (= studieren) und LOHN (= Stipendium) sind bereits am Anfang des Beispieldialoges implizit oder explizit spezifiziert worden). Die letzte Bemerkung von Y die nehmen jedes Jahr zwei Deutsche auf spezifiziert die beiden letzten Prärequisite des „anstellen"-Rezeptes: POSS (College in Virginia) Stipendium und WOLLEN (College in Virginia)
Inferenzprozesse bei der Satzgenerierung
291
(studieren (2 Deutsche) (College in Virginia) ) Die Aussagen von Sprecher Y bilden also nicht das Abbild von miteinander verbundenen Wissensinhalten im LZG. Die einzelnen Äußerungen könnten eher als eine Art von Ecksteinen aus dem episodischen Gedächtnis beschrieben werden, die miteinander nicht direkt verbunden sind. Dieses Fehlen einer Kontinuität zwischen den geäußerten Inhalten hat zur Folge, daß die grammatische Form nicht durch die sonst üblichen Regeln für die Generierung von Satzergänzungen bestimmt wird. Ähnlich wie bei der in Kapitel IV besprochenen Kasusgrammatik von Fillmore, so lassen sich auch bei Rezepten Regeln dafür angeben, in welcher grammatischen Form die verschiedenen Rollenträger beschrieben werden. Diese Regeln sind allerdings komplexer als bei Fillmore, da die in einem Rezept beschriebene Handlung durch verschiedene Verben bezeichnet werden kann. Wird etwa die Handlung, die in dem „studieren"-Rezept beschrieben ist, durch das Oberflächenverb „studieren" bezeichnet, dann wird der Rollenträger STUDENT zu dem grammatischen Subjekt, HOCHSCHULE, L E H R E R und M I T T E L werden zu Präpositionalobjekten mit den Präpositionen „an", „bei" und „ m i t " und FACH wird zum Akkusativobjekt: Hans Müller studierte in Bern mit einem Stipendium bei Professor Stalder Theologie. J e nachdem, welche Rollen einer komplexen Handlung der Sprecher fokussiert, kann dieselbe Handlung durch verschiedene Verben bezeichnet werden. Ist dies etwa die Rolle ABSCHLUSS, dann wird die im „studieren"-Rezept beschriebene Handlung durch das Verb „erwerben" bezeichnet. Dabei gelten dann folgende Regeln für die Zuordnung von Rollenträgern zu oberflächengrammatischen Formen: STUDENT wird zum Subjekt, HOCHSCHULE, L E H R E R und FACH zu Präpositionalobjekten mit den Präpositionen „an", „bei" und „in", und ABSCHLUSS wird zum Akkusativobjekt: Hans Müller erwirbt an der Universität Bern bei Professor Stalder ein Lizenziat in Theologie. Als weitere Regel gilt, daß Hochschule oder FACH durch Genitivobjekte bezeichnet werden können: Hans Müller erwirbt an der Universität Bern ein Lizenziat der Theologie. bzw. Hans Müller erwirbt ein Lizenziat der Universität Bern in Theologie. Beispieldialog VI enthält nur wenige Aussagen, in denen diese Regeln wirksam wareri. Ein Beispiel dafür ist die Frage Von wo haben sie das bekommen?
292
Die Generierung der Satzoberfläche
Bei der Beschreibung der Handlung „anstellen" durch das Verb „bek o m m e n " wird ARBEITNEHMER zum Subjekt, LOHN zum Akkusativobjekt und AUFTRAGGEBER zum Präpositionalobjekt mit „ v o n " oder „ d u r c h " (es m u ß hier angemerkt werden, daß bei diesem, wie auch bei anderen Verben, verschiedene Zuordnungen möglich sind). Alle diese drei Rollenträger sind in der Frage von X durch Pronomen in den entsprechenden Kasus repräsentiert: AUFTRAGGEBER durch „von w o " (das Pronomen „ w o " fungiert häufig als dialektale Form des Fragepronomens im Dativ), LOHN durch „das" und ARBEITNEHMER durch „sie". Bei den späteren Aussagen des Beispieldialoges können solche Regeln nicht mehr angewendet werden, da der Sprecher Y einzelne, isolierte Satzteile äußert, die nicht in ein Rezept eingebettet sind.
3. Die Bestimmung des gemeinsamen Wissens Eine detaillierte Analyse der Zuordnung von Begriffen und Propositionen aus Rezepten zu syntaktischen Kasus wird weiter unten anhand eines ausgewählten Kasus, des Dativs im Deutschen, geleistet werden. Vorher soll jedoch noch kurz ein anderes Problem angeschnitten werden, die Frage, durch welche Mechanismen vom Sprecher die Gesprächswelt eingeschränkt wird. Sowohl bei der Analyse der Beispieldialoge IV und V im letzten Kapitel, als auch bei den Beispielen dieses Kapitels zeigte sich, daß der Sprecher über ein Modell darüber verfügt, welche Wissensinhalte er beim Hörer voraussetzen kann. Diese, dem Sprecher und Hörer gemeinsamen Wissensinhalte sollen im folgenden mit dem vereinfachenden Ausdruck „gemeinsames Wissen" bezeichnet werden; der Ausdruck ist darum vereinfachend, weil damit nicht das gesamte dem Sprecher und Hörer gemeinsame Wissen bezeichnet wird, sondern nur diejenigen Wissensinhalte des Sprechers, von denen er glaubt, daß auch der Hörer über sie verfüge. Dabei ist es möglich, daß der Sprecher beim Hörer gewisse Wissensinhalte voraussetzt, über welche dieser nicht verfügt, oder daß umgekehrt der Sprecher nicht weiß, daß der Hörer über bestimmte, auch ihm bekannte Wissensinhalte ebenfalls verfügt. Im letzten Kapitel wurde die Annahme gemacht, daß das gemeinsame Wissen mit denjenigen Wissensinhalten identisch sei, die im semantischen Gedächtnis gespeichert sind. Für die beiden dort analysierten Beispieldialoge IV und V scheint diese Annahme weitgehend zuzutreffen; denn die beiden Gesprächspartner kannten sich vor dem Gespräch nicht, und bei dem Thema, der Beschreibung einer Zimmer-
Die Bestimmung des gemeinsamen Wissens
293
einrichtung, konnte nicht auf gemeinsame episodische Gedächtnisinhalte zurückgegriffen werden. Bei anderen Arten von Gesprächen umfaßt das gemeinsame Wissen jedoch noch weitere Inhalte; dies trifft immer dann zu, wenn der Sprecher Kenntnisse über das episodische Wissen des Hörers besitzt, wenn im Gespräch auf die gemeinsam wahrgenommene Situation Bezug genommen wird, oder wenn an episodische Inhalte angeknüpft wird, die im bisherigen Gesprächsverlauf geäußert wurden. Es fragt sich nun, mit Hilfe welcher Mechanismen der Sprecher sein Modell des gemeinsamen Wissens aufbaut, und inwieweit die Generierung von Oberflächensätzen durch das gemeinsame Wissen bestimmt wird. Der Aufbau cjes gemeinsamen Wissens kann mit zwei verschiedenen Arten von Regeln erklärt werden. Die erste Art von Regeln basiert auf der Annahme, daß der Sprecher während des Gespräches inferiert, über welche Wissensinhalte der Hörer Bescheid weiß. Dies kann einerseits dadurch geschehen, daß er aufgrund ihm bekannter Eigenschaften des Hörers (ζ. B. ,,der Hörer ist ein Student der Theologie") darauf schließt, über welches Wissen der Hörer vermutlich verfügen wird (,,. . . also wird er die Geschichte von Daniel in der Löwengrube kennen"). Andererseits kann der Sprecher sein Modell des gemeinsamen Wissens auch aufgrund seiner Kenntnisse über frühere Erfahrungen des Hörers aufbauen (ζ. B.: „er fuhr letzte Woche mit dem Zug nach Mailand; er sollte also wissen, daß man dabei durch einen langen Tunnel fährt"). Nun ist es introspektiv unplausibel, daß der Sprecher vor jeder Aussage überlegt, ob der Hörer den Inhalt dieser Aussage schon kennt, oder daß er vor der Äußerung eines Pronomens überprüft, ob der Hörer den Referenten dieses Pronomens vermutlich korrekt bestimmen kann. Andererseits sollte der introspektiven Evidenz in bezug auf Erklärungen für sprachliche Kommunikationsprozesse kein zu starkes Gewicht beigemessen werden: So ist beispielsweise von Charniak ( 1 9 7 4 ) recht klar demonstriert worden, daß das Verstehen von Pronomen nur durch die Annahme von recht komplizierten Prozessen erklärt werden kann, bei denen der Hörer von sehr komplexen Wissensinhalten Gebrauch macht. Für diese, nicht bewußten Prozesse fehlt jedoch jede introspektive Evidenz. Damit wird die Annahme, daß auch bei der Satzbildung solche nicht-bewußte Prozesse ablaufen, zumindest nicht abwegig. Zudem gibt es Situationen, in denen das Modell des gemeinsamen Wissens vom Sprecher direkt thematisiert wird; dies geschieht in Redewendungen wie: „das müßtest du doch wissen" oder „das weißt du sicher noch nicht". Nun kann ein Modell des gemeinsamen Wissens zumindest teilweise auch ohne Rekurs auf das Wissen des Hörers aufgebaut werden;
294
Die Generierung der Satzoberfläche
dies ist darum möglich, weil das Wissen um den Gesprächsgegenstand weitgehend durch den Kontext gegeben ist. Ein einfaches Modell, in welchem implizit eine Art „gemeinsames Wissen", jedoch kein Modell des Hörers vorhanden ist, bildet das oben erwähnte Fragen-AntwortSystem von Winograd. Die „pragmatischen Fähigkeiten" dieses Systems beschränken sich auf einige Regeln von der Form: Wenn eine bestimmte Klasse von Objekten genannt wird, dann muß eine Beschreibung von einem Objekt dieser Klasse nur so weit spezifiziert werden, daß dieses Objekt von den anderen Objekten dieser Klasse eindeutig unterschieden werden kann. Diese Regel ist so einfach, daß man nicht von einem „Wissen" des Systems über den gemeinsamen Gesprächskontext sprechen darf. Es wäre jedoch ohne weiteres möglich, solche Regeln so weit auszubauen und zu verfeinern, daß das System bei der Satzgenerierung flexibel den gemeinsamen Kontext berücksichtigt. Der prinzipielle Unterschied zwischen einem solchen System und einem anderen, welches über ein Hörermodell verfügt, würde sich jedoch bei der Beantwortung etwa folgender Frage zeigen: „Warum hast du die große blaue Pyramide als ,die blaue' bezeichnet?" Ein System, welches über ein Hörermodell verfügt, wäre prinzipiell in der Lage, darauf eine Antwort von der Art zu geben: „Weil du wissen solltest, daß es sich um eine Pyramide handelt". Für Winograds System wäre die Formulierung einer solchen Antwort jedoch auch dann nicht möglich, wenn es im oben erwähnten Sinne erweitert würde, da es über keine Repräsentation der Kenntnisse des Hörers — in diesem Falle: des Benützers — verfügt. Man kann annehmen, daß beide Arten von Regeln beim Aufbau des Modelles des gemeinsamen Wissens beteiligt sind. Hierzu wird bei jedem Auftreten eines neuen Gesprächsthemas zunächst das kontextunabhängige gemeinsame Wissen aufgebaut. Dazu werden einerseits die für das entsprechende Thema relevanten Rezepte daraufhin überprüft, ob sie dem Hörer bekannt sind. Die Einschätzung darüber wird von den Kenntnissen über den allgemeinen kulturellen und Erfahrungshintergrund des Hörers abhängen. So wird man bei einem europäischen Gesprächspartner beispielsweise erwarten, daß er über ein elaboriertes Rezept zum Thema „Eisenbahnfahren" verfügt; von einem amerikanischen Gesprächspartner wird man dies nicht als selbstverständlich annehmen. Die zweite Art von kontextunabhängigem gemeinsamen Wissen wird aufgrund der Kenntnisse über die episodischen Erfahrungen des Gesprächspartners deduziert. Wenn man beispielweise weiß, daß der Gesprächspartner aus Frankfurt/M. stammt, dann kann man etwa, falls dies für das Thema des Gespräches relevant ist, in das gemein-
Semantische Rollen und der Gebrauch des Dativs im Deutschen
295
same Wissen die Kenntnis integrieren, daß der Frankfurter Hauptbahnhof ein Sackbahnhof ist. Während des Gespräches wird dann vom Sprecher die so aufgebaute Struktur des gemeinsamen Wissens mit dem eigenen episodischen Wissen verglichen und es werden mittels der weiter oben geschilderten Regeln diejenigen Inhalte des episodischen Wissens geäußert, die nicht Teil des gemeinsamen Wissens sind. Dabei wird bei der Satzbildung, ζ. B. bei der Wahl von Pronomen, ständig auf das gemeinsame Wissen Bezug genommen. Die Integrierung der kontextunabhängigen Kenntnisse in die Struktur des gemeinsamen Wissens geschieht während des Gesprächsverlaufes: Jede geäußerte Proposition wird nach ihrer Äußerung Bestandteil des gemeinsamen Wissens. Damit kann der Sprecher auf sie in der gleichen Weise Bezug nehmen, wie auf die anderen Elemente des gemeinsamen Wissens. Sowohl für den Sprecher, als auch für den Hörer ist damit jede Äußerung eine sukzessive Erweiterung des bei beiden Partnern verschiedenen gemeinsamen Wissens. 4. Semantische Rollen und der Gebrauch des Dativs im Deutschen In den bisherigen Ausführungen dieses Kapitels wurden zwei Arten von Erklärungen benützt, um die Rolle des semantischen und des episodischen Wissens bei der Sprachgenerierung zu beschreiben. Bei den Erklärungen der ersten Art handelt es sich um allgemeine Regeln, die unabhängig von dem spezifischen Gesprächsgegenstand gültig sind. Hierzu gehört beispielsweise die Regel, daß ein Sprecher nur solche Inhalte äußert, die mit dem bestehenden Wissen des Gesprächspartners verbunden werden können. Bei den Erklärungen der zweiten Art wurde zu zeigen versucht, auf welchen konkreten Gedächtnisstrukturen einzelne, in den Beispieldialogen geäußerte Aussagen basieren. Diesen beiden Arten von Erklärungen ist gemeinsam, daß sie nur sehr schwer anhand eines breiten Datenmaterials überprüft werden können, d. h. sie sind nur schwer falsifizierbar. Dies wäre nur dann möglich, wenn ein sprachlicher Korpus zur Verfügung stünde, der eine größere Anzahl von Sätzen zu einem bestimmten, bei den verschiedenen Sätzen gleichbleibenden Wissensinhalt enthielte. Ein solcher Korpus wird jedoch unter Beibehaltung von natürlichen Sprechbedingungen kaum produziert werden können. Wenn man trotz dieser Schwierigkeiten versuchen will, einen bestimmten linguistischen oder psycholinguistischen Ansatz anhand einer breiteren Erfahrung zu überprüfen, dann muß man deshalb auf die eigenen Kenntnisse
296
Die Generierung der Satzoberfläche
über sprachliche Formen zurückgreifen, die nicht in Protokollen festgehalten sind; dieser, in der linguistischen Forschung gebräuchliche Rückgriff auf die eigene sprachliche Intuition hat auch darum eine gewisse Berechtigung, weil bei intuitiven Einstufungen etwa der Synonymität oder der Grammatikalität in der Regel hohe intersubjektive Übereinstimmungen beobachtet werden können. In den folgenden Abschnitten soll mit Hilfe eines solchen Ansatzes versucht werden, den Gebrauch einer bestimmten grammatischen Konstruktion, des Dativs im Deutschen, in Abhängigkeit von semantischen und pragmatischen Faktoren zu erklären. Dabei sollen zunächst alle Nominalphrasen, die oberflächengrammatisch Dativobjekte bilden, gleichgesetzt werden. Daraus folgert beispielsweise, daß in den kommenden Ausführungen nicht zwischen dem sinngebenden und dem freien Dativ unterschieden werden soll. Eine solche Unterscheidung ist j a bereits das Ergebnis bestimmter theoretischer Vorstellungen über die Funktionen des Dativs im Satzganzen, und ihre Übernahme würde damit den Weg zu einer unvoreingenommenen inhaltlichen Analyse von Dativkonstruktionen versperren. Eine erste inhaltliche Analyse von Sätzen mit Dativobjekt zeigt, daß diese zum großen Teil durch inhaltlich gleiche Sätze ersetzt werden können, in denen das dativische Satzglied durch einen anderen Oberflächenkasus oder durch ein Präpositionalobjekt ausgedrückt wird. Der Kellner spuckte dem Gast in die Suppe. Der Kellner spuckte in die Suppe des Gastes. Mir träumte. Ich träumte. Sie hat dem Kind eine Puppe gebastelt. Sie hat für das Kind eine Puppe gebastelt. Der Vogel entfloh dem Käfig. Der Vogel floh aus dem Käfig. E r schlug dem Mann ins Gesicht. Er schlug in das Gesicht des Mannes. Die Liste solcher Satzpaare, in denen der Dativ durch ein anderes Satzglied ersetzt werden kann, ließe sich ohne Schwierigkeiten erweitern. Damit stellt sich die Frage, ob sich pragmatische oder semantische Faktoren definieren lassen, durch welche bestimmt wird, ob eine Proposition aus dem LZG durch einen Satz mit einem direkten Dativobjekt oder durch eine andere syntaktische Konstruktion geäußert wird. Für die Beantwortung dieser Frage muß auf die in Kapitel VII geschilderten Annahmen über den Aufbau von Handlungsrezepten zurückgegriffen werden. Ein Handlungsrezept ist dort als eine Struktur
Semantische Rollen und der Gebrauch des Dativs im Deutschen
297
beschrieben worden, die aus vier Listen zusammengesetzt ist: Die Rollen, die Prärequisite, der Korpus und die intendierten Resultate. Der Korpus wurde dabei als eine Liste von Zuständen definiert, durch welche der Ablauf der komplexen Handlung beschrieben wird. Wie die einzelnen Propositionen des Korpus, so werden auch die Resultate der Handlungen durch Zustandsbeschreibungen repräsentiert. J e d e dieser Zustandsbeschreibungen ist wiederum eine Liste, die aus folgenden Elementen zusammengesetzt ist: Der Name für die Zustandsklasse (ζ. B. ORT, G R Ö S S E , F A R B E usw.), die Spezifikation der Zustandskiasse (ζ. B. DISTANZ, GRÜN), eines oder mehrere Objekte, die von dem Zustand affiziert sind, und der Wert des Zustandes (z. B. W, F, 100 km). Enthält eine Zustandsbeschreibung mehr als ein Objekt, dann bezeichnet in der Regel das Objekt in der ersten Position den Gegenstand, über den etwas ausgesagt wird, und die späteren Objekte bezeichnen dessen Attribute, also ζ. B. (POSS Katze Schwanz W). Im weiteren soll das Objekt in der ersten Position als Aktor des Zustandes bezeichnet werden. Wie ebenfalls schon weiter oben erwähnt wurde, besteht in vielen Fällen keine eindeutige Zuordnung zwischen einzelsprachlichen Verben und Handlungsrezepten; zum einen gibt es Rezepte, für deren Beschreibung kein einzelsprachliches Verb zur Verfügung steht (ζ. B. das Rezept für „einkaufen in einem Selbstbedienungsgeschäft"), und zum anderen gibt es Verben, die für die Beschreibung von verschiedenen Rezepten gebraucht werden (ζ. B. das Verb „fahren"). Sieht man von den Hilfs- und Modalverben und von gewissen Zustandsverben (ζ. B. „blühen") ab, dann läßt sich sagen, daß durch ein Verb die Art und/oder das Resultat eines Handlungsablaufes spezifiziert wird. Diesen beiden Konstituenten der Verbbedeutung entsprechen manchmal, aber nicht immer, Korpus und intendiertes Resultat eines Handlungsrezeptes. Verben, die hauptsächlich den Ablauf einer Handlung beschreiben, sollen im weiteren als instrumenteile Verben bezeichnet werden. Ein solches instrumentelles Verb ist etwa „hämmern": Durch den Gebrauch dieses Verbes wird lediglich angegeben, daß ein Hammer oder ein hammerartiges Objekt wiederholt gegen ein anderes Objekt gestoßen wird, wobei das Resultat der Handlung offen bleibt. Andere Verben, die lediglich das Resultat der Handlung spezifizieren, sollen im weiteren als resultative Verben bezeichnet werden. In diese Kategorie gehört etwa das Verb „ t ö t e n " , durch welches lediglich angegeben wird, daß die beschriebene Handlung den Tod des Objektes verursachte. Viele Verben, wie beispielsweise „zerhämm e m " oder „erstechen" haben sowohl eine instrumenteile, wie auch eine resultative Bedeutungskomponente.
298
Die Generierung der Satzoberfläche
Diesen Komponenten der Verbbedeutungen entsprechen nun einzelne Oberflächenkasus. Dies zeigt sich sehr deutlich bei denjenigen aus der Gruppe von Verben mit Dativobjekt, die einen Besitzwechsel beschreiben. Bei den durch diese Verben beschriebenen Handlungen können vier Rollen spezifiziert werden: Der AKTOR der Handlung, der den Besitzwechsel vollzieht; das OBJEKT, das den Besitzer wechselt; der GEBER, der freiwillig oder unfreiwillig von dem OBJEKT abläßt; und der NEHMER, der das OBJEKT durch die Handlung erwirbt. Die Prärequisite und die Resultate sind bei allen diesen Handlungen dieselben: Besitzwechsel Rollen: AKTOR GEBER NEHMER OBJEKT PRQ: POSS GEBER OBJEKT W POSS NEHMER OBJEKT F Korpus: . . . . IHR: POSS GEBER OBJEKT F POSS NEHMER OBJEKT W Die Bedeutungen der verschiedenen Verben des Besitzwechsels unterscheiden sich voneinander in folgenden beiden Faktoren: Zum einen kann durch das Verb der Korpus der Handlung angegeben werden, d. h. das Verb kann eine instrumenteile Bedeutungskomponente haben. Verben wie „beschlagnahmen", „rauben" oder „vererben" geben an, auf welche Art der Besitzwechsel vollzogen wird. Andere Verben, wie ζ. B. „ b e k o m m e n " oder „nehmen", haben keine instrumentelle Bedeutungskomponente. Zudem wird durch das Verb spezifiziert, in welcher logischen Beziehung die Rollenträger zueinander stehen. Hierbei lassen sich folgende Zusammenhänge unterscheiden: A.Der AKTOR der Handlung ist weder mit dem GEBER, noch mit dem NEHMER identisch. Dies kann bei folgenden Verben der Fall sein 1 : zusprechen, zuteilen, übereignen, überschreiben. B. Der AKTOR der Handlung ist mit dem GEBER identisch. Verben dieses Typs sind: geben, abtreten, schenken, vermachen, unterstützen. C. Der AKTOR der Handlung ist mit dem NEHMER identisch. Verben dieses Typs sind: nehmen, stehlen. Im weiteren unterscheiden sich die Verben des Besitzwechsels voneinander in den Rollen, die als Aktanten genannt werden. Tabelle 28 zeigt elf Klassen dieser Verben. Bei jeder dieser Klassen tritt eine verschiedene Kombination von Aktanten in Erscheinung, wobei in sechs 1
Für das Auffinden der Verbbeispiele benützte ich den Thesaurus von Domseiff (1959).
Semantische Rollen und der Gebrauch des Dativs im Deutschen
299
Klassen jeweils zwei Rollen durch denselben Aktanten repräsentiert sind. Die Zuordnungen der einzelnen Rollen zu den Oberflächenkasus lassen sich durch folgende Regeln beschreiben: (1) Der AKTOR wird im aktiven Satz immer zum Subjekt. (2) Ist der A K T O R zugleich G E B E R oder NEHMER, dann werden diese Rollen auf der Oberfläche nicht noch ein zweites Mal repräsentiert. (3) Ist kein A K T O R spezifiziert, dann wird G E B E R oder NEHMER zum Subjekt. (4) Das O B J E K T wird immer zum Akkusativobjekt. (5) Ist kein O B J E K T spezifiziert, dann wird die noch freie Rolle zum Akkusativobjekt. (6) Die durch (1) bis (5) syntaktisch nicht spezifizierte Rolle wird zum Dativobjekt. Diese Regeln ähneln formal den von Fillmore ( 1 9 6 8 ) beschriebenen Regeln für die Zuordnung von Tiefen- zu Oberflächenkasus. Nun lassen sich jedoch Verwendungen des Dativs bei Verben des Besitzwechsels beobachten, denen durch die sechs Regeln nicht adäquat Rechnung getragen werden kann. So ist etwa das Dativobjekt beim Verb „stehlen" zweideutig. Der Satz Der Mann stahl seiner Freundin die Blumen, kann in seiner ersten Leseart paraphrasiert werden als Der Mann stahl die Blumen, die seiner Freundin gehörten, und in seiner anderen Leseart als Der Mann stahl die Blumen, um sie seiner Freundin zu geben. In seiner zweiten Leseart beschreibt der Satz also zwei Handlungen: Das Stehlen der Blumen und das (reale oder intendierte) Übergeben der Blumen an die Freundin. Dabei ist die Freundin der Aktor des aus der Handlung resultierenden Zustandes, und das Stehlen ist die instrumentelle Handlung, durch die diese Zustandsänderung ermöglicht wird. Durch solche Doppelhandlungen können auch andere Verwendungen des Benefaktiv-Kasus semantisch beschrieben werden: Das Mädchen verdiente ihrem Freund ein Vermögen. Auch hier ist das Resultat, daß dem Freund ein Vermögen zukommt, und das Verdienen des Geldes schafft dafür die Voraussetzung. Man kann also sagen, daß in den zwei Beispielsätzen zwei Ereignisse beschrieben werden: Einerseits ein Besitzwechsel, wobei das Dativobjekt der Aktor des resultierenden POSS-Zustandes ist, und andererseits eine Handlung („stehlen", „verdienen"), durch die dieser Besitzwechsel ermöglicht wird. Der Aktor dieser Handlung wird durch das Subjekt des Satzes beschrieben.
Die Generierung der Satzoberfläche
300
Tab. 28: Die Zuordnung semantischer Rollen zu Oberflächenkasus bei Verben des Besitzwechsels Beispiel eines Verbes
Durch das Verb spezifizierte Rollen
entsprechender syntaktischer Kasus
geben
AGENS = NEHMER OBJEKT AGENS = GEBER OBJEKT AGENS NEHMER OBJEKT AGENS GEBER OBJEKT AGENS = NEHMER AGENS = GEBER AGENS = OBJEKT AGENS = OBJEKT GEBER OBJEKT NEHMER OBJEKT AGENS OBJEKT
Nominativ Dativ Akkusativ Nominativ Dativ Akkusativ Nominativ Dativ Akkusativ Nominativ Dativ Akkusativ Nominativ Akkusativ Nominativ Akkusativ Nominativ Akkusativ Nominativ Akkusativ Nominativ Akkusativ Nominativ Akkusativ Nominativ Akkusativ
stehlen
zusprechen
absprechen
beschenken bestehlen verschenken kaufen einbüßen bekommen verstaatlichen
GEBER
NEHMER
GEBER NEHMER GEBER NEHMER
Solche Doppelereignisse, bei denen Subjekt und Dativobjekt diesen beiden semantischen Rollen zugeordnet sind, werden nicht nur durch Verben des Besitzwechsels, sondern auch durch andere Verben beschrieben. Durch den Beispielsatz Die Mutter hat dem Kind eine Puppe gebastelt, wird einerseits ausgesagt, daß die Mutter eine Puppe bastelte, und andererseits, daß die Mutter intendierte, die Puppe dem Kind zu geben. Auf analoge Weise können die Zuordnungen von Subjekt und Dativobjekt zu semantischen Rollen bei folgenden Sätzen beschrieben werden: Der Feldherr eroberte dem Kaiser eine Stadt. Der Vogel ist dem Mann zugeflogen. Er schrieb ihm einen Brief. Er schickte ihm ein Paket.
Semantische Rollen und der Gebrauch des Dativs im Deutschen
301
Die Beobachtung, daß durch Sätze mit Dativobjekten häufig zwei Ideen zugleich ausgedrückt werden, findet sich auch in einem Aufsatz von Weisgerber ( 1 9 6 2 ) . Allerdings unterscheidet sich diese Arbeit sowohl methodologisch, als auch in ihrer Zielsetzung grundsätzlich von dem hier vertretenen Ansatz. Weisgerber geht von der in Kap. V behandelten Sapir-Whorf'schen Hypothese aus, daß durch die Sprache die Interpretation der Welt gesteuert wird: .jeder auftretende individuelle Satz ist nicht einfache ,Wiedergabe' von .objektiven Geschehnissen', sondern Prägung von Geschehen zu sprachlicher Bewußtheit" (Weisgerber, 1 9 6 2 , p. 7). Die Art, in welcher die verschiedenen Sprachen die Interpretation der Welt bestimmen, läßt sich nach Weisgerber am besten durch die Analyse der Grundmuster von Sätzen, der sog. Satzbaupläne, bestimmen. Diese Grundmuster sind von Brinkmann ( 1 9 5 9 ) in vier Klassen gegliedert worden: Vorgangssätze, die das Erleben des Sprechers beschreiben, ζ. B. Es regnet. Der Vater schläft. Handlungssätze, die ein Gestalten beschreiben, ζ. B. Ich habe den Brief geschrieben. Er unterstützt seine Eltern. Urteilssätze, welche die Welt bewerten, ζ. B. Er ist zufrieden. Seine Leistungen sind genügend. Identitätssätze, welche die Welt deuten, ζ. B. Karl ist mein Freund. Er bleibt Ministerpräsident. Obwohl diese vier Satzbaupläne recht vage definiert sind, lassen sich nicht alle Sätze in eines der vier Muster eingliedern. So können etwa Sätze, die aus Subjekt, Verb, Dativobjekt und Raumergänzung bestehen, wie ζ. B. Er trat ihm auf den Fuß. Er klopfte ihm auf die Schulter. Er ging mir aus dem Wege, keinem der vier von Brinkmann aufgeführten Satzbaupläne zugeordnet werden. Weisgerber postuliert deshalb einen fünften Satzbauplan, den sog. Betätigungssatz. Wie Handlungssätze, so beschreiben auch Betätigungssätze eine aktive Handlung des Agens; andererseits bleibt nach Weisgerber das Verhältnis zwischen den an der Handlung Beteiligten offen und der Nachdruck wird auf den Schauplatz des Geschehens verlegt. Das Dativobjekt bezeichne dabei eine in die Handlung einbezogene Person, die jedoch nicht zum Objekt des Handelns werde. Diese Betrachtungsweise entspricht der hier vorgenommenen Ana-
302
Die Generierung der Satzoberfläche
Iyse, nach welcher das Dativobjekt ebenfalls von der Handlung affiziert wird, jedoch nicht das Objekt der instrumenteilen Handlung darstellt. Hier endet allerdings die Übereinstimmung zwischen den beiden Ansätzen: Weiter oben wurde versucht, die Rolle, welche das Dativobjekt innerhalb der beschriebenen Handlung spielt, so genau wie möglich zu spezifizieren. Weisgerber hingegen bemüht sich daru m , aus den von ihm beschriebenen Satzbauplänen völkerpsychologische Aussagen abzuleiten.
5. Der Begriff der Zugehörigkeit In den oben gegebenen Beispielsätzen ist ohne weiteres ersichtlich, daß ein tatsächlicher oder intendierter Besitzwechsel beschrieben wird. Ist das Resultat eines Doppelereignisses nicht ein POSS- sondern ein anderer Zustand, dann kann der Aktor dieses Zustandes nicht durch ein Dativobjekt bezeichnet werden. So ist der Satz Er baute den Kindern eine Hütte, dessen Resultat ein Besitzverhältnis ist, durchaus möglich; andererseits kann nicht gesagt werden Er baute dem Salat ein Glashaus, denn hier ist das Resultat keine Besitz- sondern eine lokale Relation (der Salat ist im Glashaus). Weniger deuüich ist diese Regel bei den folgenden vier Beispielsätzen, durch die ebenfalls ein Doppelereignis beschrieben wird: Der Mann half dem Kind, auf den Baum zu klettern. Der Kellner spuckte dem Gast in die Suppe. Der Trompeter erstach seinem Nachbarn die Großmutter. Er wusch dem Vater das Auto. Für die semantische Beschreibung dieser vier Beispielsätze ist es notwendig, die Bedeutung der Zustandskategorie POSS näher zu analysieren. Bei der Definition der Zustandsbeschreibungen in Kapitel VII fehlte eine solche Analyse, und es wurde angenommen, daß die dort gegebenen Beispiele aufgrund unserer allgemeinen Kenntnis über den Begriff der Possession verstanden werden könnten. Allerdings werden bei verschiedenen Vorkommen von POSS-Zuständen auch verschiedene Arten von Beziehungen zwischen dem Aktor des Zustandes und dessen Objekt ausgedrückt. Durch die Zustandsbeschreibung POSS Peter_Meier Abitur W wird beispielsweise angegeben, daß der Aktor ein Examen erfolgreich absolviert und damit die Berechtigung zum Hochschulstudium besitzt. Durch andere Zustandsbeschreibungen, wie ζ. B. durch
Der Begriff der Zugehörigkeit
303
POSS Peter_Meier Schäferhund W wird die Verfügungsgewalt über ein Objekt ausgedrückt. In Anbetracht der Verschiedenheit der Beziehungen, welche unter einen POSS-Zustand subsumiert werden können, definierte Wilks diesen Zustand als eine ausschließlich syntaktische Beziehung. Das Bestehen einer POSS-Relation wird in seinem — für die automatische Analyse der englischen Sprache konzipierten — System immer dann angenommen, wenn ein Genitiv oder die Präposition ,,of" gebraucht werden (King, 1976, p. 4). Obwohl die Zustandskategorie POSS an sich also keinen semantischen Inhalt hat, sind Propositionen dieser Kategorie nicht bedeutungslos. Die Bedeutung solcher Propositionen kann durch die Inferenzregeln definiert werden, denen sie unterworfen sind. Die wohl häufigste Inferenz, in der auf POSS-Zustände Bezug genommen wird, ist die Überprüfung von Prärequisiten von Handlungsrezepten, jedesmal, bevor das System die Annahme macht, daß ein bestimmtes Handlungsrezept abläuft oder ablaufen könnte, wird überprüft, ob alle Prärequisite dieses Rezeptes zutreffen. Diese Prärequisite haben häufig die Form von POSS-Zuständen. Für diese Überprüfung ist es nun unwichtig, welche Art von Verfügungsgewalt, Besitz- oder Eigentumsrelation durch den jeweiligen POSS-Zustand ausgedrückt wird. So haben etwa die beiden Sätze Peter nahm Messer und Gabel. und Peter nahm im Hotel ein Zimmer mit Dusche. POSS-Zustände als intendierte Resultate der beschriebenen Handlungen: POSS Peter (UND Messer Gabel) W und POSS Peter Dusche W Bei diesen beiden Zustandsbeschreibungen werden jeweils verschiedene Arten von Beziehungen zwischen dem Aktor und dem Objekt des Zustandes beschrieben. Nun gibt es Handlungsrezepte, in denen diese Zustände Prärequisite sind. So etwa der Zustand POSS ESSER BESTECK W im Handlungsrezept für „essen", und der Zustand POSS DUSCHER DUSCHE W im Rezept für „duschen". Nach der Analyse der obigen beiden Beispielsätze wird das System bei der Aktivierung der beiden Rezepte aus seinem episodischen Wissen inferieren können, daß die beiden Prärequisite erfüllt sind. Dabei muß nirgends spezifiziert werden, welche Art von Beziehung durch den POSS-Zustand beschrieben wird.
304
Die Generierung der Satzoberfläche
Die Bedeutung der Zustandskategorie POSS kann damit wie folgt definiert werden: Durch den POSS-Zustand wird beschrieben, daß zwischen dem Aktor und dem Objekt eine Art von Zugehörigkeit besteht. Diese erlaubt es dem Aktor, das Objekt zu verwenden. Die Art der Zugehörigkeit (ζ. B. ob dabei die räumliche Nähe zwischen Aktor und Objekt notwendig ist) und die Art der Verwendung hängen dabei von der Natur des Aktors und des Objektes ab. Durch den Rückgriff auf solche Inferenzregeln kann die Verwendung der Zustandskategorie POSS also sinnvoll und exakt beschrieben werden, ohne daß dabei die Unbestimmtheit des Begriffes der Possession oder der Zugehörigkeit eliminiert werden muß. Versteht man die Zustandskategorie POSS in diesem Sinne, dann resultieren auch die vier weiter oben gegebenen Beispielsätze in POSSZuständen: Der Gast hat eine Suppe mit Spucke darin (Prärequisit zum Essen), der Nachbar hat keine Großmutter mehr (Prärequisit beispielsweise zum Kinder hüten) und der Vater hat ein sauberes Auto (Prärequisit für den Sonntagnachmittagsausflug). Auch das resultative Verb „helfen" beschreibt ein Ereignis, durch welches ein POSS-Zustand produziert wird: Ein A k t o r _ l (Dativobjekt) vollzieht eine Handlung_l (Infinitivergänzung), und durch die instrumenteil nicht spezifizierte Handlung_2 („helfen") produziert A k t o r _ 2 (Subj e k t ) einen Zustand, der die Durchführung von Handlung_l ermöglicht. Auf ähnliche Weise können die Bedeutungen der Verben „nützen" und „schaden" beschrieben werden, die ebenfalls ein Dativobjekt als Ergänzung haben. Der Gebrauch des Dativobjektes ist unabhängig davon, ob der aus der Doppelhandlung resultierende POSS-Zustand verneint wird oder nicht. Dies erklärt die Ambiguität des weiter oben gegebenen Beispielsatzes Der Mann stahl seiner Freundin die Blumen. Die semantischen Repräsentationen der beiden Lesungen unterscheiden sich lediglich darin, daß beim resultierenden Zustand POSS Freundin Blumen der Quantifikator im einen Fall W und im anderen Fall F ist.
6. Die Rolle der Intentionalität für den Gebrauch des Dativs Ein weiterer Aspekt, durch welchen der Gebrauch des Dativobjektes bestimmt wird, ist die Intentionalität. So kann etwa der Satz Der Kellner spuckte dem Gast in die Suppe, nur gebraucht werden, wenn der Kellner intendierte, dem Gast die Suppe zu geben. Zur Beschreibung einer Situation, in welcher der
Die Rolle der Intentionalität für den Gebrauch des Dativs
305
Kellner beim Spucken aus Versehen die Suppe trifft, würde kein Dativobjekt verwendet werden. Wenn dabei der Sprecher aus irgendeinem Grund spezifizieren möchte, daß es sich dabei um die Suppe handelt, die einem bestimmten Gast gehört, dann würde dies durch ein Genitivobjekt ausgedrückt werden: Der Kellner spuckte in die Suppe des Gastes. Die Wahl des Dativobjektes hängt also davon ab, daß der Aktor der instrumenteilen Handlung die Absicht hat, den Besitzwechsel herbeizuführen. Dies zeigt sich auch im Gebrauch des dativischen Reflexivpronomens : Weiter oben wurde die Regel formuliert, daß der Aktor des aus der Handlung resultierenden POSS-Zustandes immer dann auf der Satzoberfläche nicht besonders erwähnt wird, wenn er mit dem Aktor der instrumentellen Handlung identisch ist. Soll jedoch im Satz gerade dieser Aspekt besonders hervorgehoben werden, dann wird der Aktor im Satz zweimal erwähnt: Durch das Subjekt und durch das Reflexivpronomen im Dativ. Der Rentner kaufte sich ein Grundstück. Er verdiente sich ein Vermögen. Andererseits ist der Satz Er verspielte sich das Vermögen, ungebräuchlich; denn es ist unplausibel, daß jemand die Absicht hat, durch Spielen sein Vermögen zu verlieren. Es sind jedoch Situationen denkbar, in denen jemand mit Absicht das Vermögen eines anderen verspielt: Er verspielte ihm das Vermögen. Dabei ist es lediglich wichtig, daß der Aktor des instrumenteilen Aktes den resultierenden POSS-Zustand beabsichtigt; es ist jedoch irrelevant, welches das Motiv dieser Absicht ist. So kann der Satz Der Trompeter erstach seinem Nachbarn die Großmutter, auf zwei Weisen verstanden werden. Zum einen ist es möglich, daß der Trompeter seinem Nachbarn ein Leid zufügen wollte; zum anderen ist auch denkbar, daß der Nachbar, der seine Großmutter beerben wollte, den Trompeter um diese Handlung gebeten hatte. Die bislang beobachteten Abhängigkeiten und Gesetze können nun in folgenden Regeln zusammengefaßt werden, durch welche der Gebrauch des Dativobjektes weitgehend beschrieben werden kann: (1) Ein Dativobjekt wird dann gebraucht, wenn aus der beschriebenen Handlung eine Zugehörigkeitsrelation (im Sinne des oben beschriebenen POSS-Zustandes) resultiert u n d wenn zudem das Herstellen dieser Zugehörigkeitsrelation vom Aktor der Handlung intendiert ist.
306 (2) (3)
Die Generierung der Satzoberfläche
Der resultierende Zustand kann dabei auch verneint sein. Grundsätzlich gelten dabei folgende Zuordnungen von semantischen Rollen zu Oberflächenkasus: Der Aktor der instrumentellen Handlung wird zum Subjekt des Satzes. Der Aktor des resultierenden Zustandes wird zum Dativobjekt. Das Objekt des resultierenden Zustandes wird zum Akkusativobjekt. Die Regeln (1) bis (3) gelten sowohl für Verbendes Besitzwechsels, als auch für andere Verben. Zwischen den beiden Arten von Verben besteht folgender Unterschied: Bei den Verben des Besitzwechsels beschreibt die instrumentelle Bedeutungskomponente eine Handlung, die unmittelbar einen Besitzwechsel zur Folge hat. Die anderen Verben, die von einem Dativobjekt begleitet werden können, beschreiben ein Doppelereignis: Dessen erster Teil ist die instrumenteile Handlung, deren unmittelbare Folge nicht ein Besitzwechsel, sondern ein Ortswechsel (ζ. B. „bringen") oder eine Herstellung (ζ. B. „machen") ist. Der zweite Teil des Doppelereignisses ist ein Besitzwechsel, der instrumentell nicht spezifiziert ist. Die Regeln (4) und (5) beschreiben die wichtigsten Ausnahmen von Regel (3): (4) Bei einer Reihe von Verben des Besitzwechsels („bestehlen", „beschenken") erscheint das Objekt des resultierenden Zustandes nicht auf der Satzoberfläche. Bei diesen Verben wird der Aktor des resultierenden Zustandes durch das Akkusativobjekt ausgedrückt. (5) Ist der Aktor der instrumenteilen Handlung zugleich der Aktor des resultierenden POSS-Zustandes, dann wird er in der Regel nur durch das Subjekt bezeichnet. Eine besondere Betonung der Identität dieser beiden Rollenträger kann durch ein Reflexivpronomen im Dativ ausgedrückt werden. Diese Regeln sind rein grammatischer Natur insofern, als die beschriebenen Beziehungen zwischen Satzinhalt und Satzoberfläche keine Bezüge zu den Prozessen der Satzbildung und des Satzverstehens aufweisen. Es ist jedoch ohne weiteres möglich, diese grammatikalischen Gesetzmäßigkeiten über die Verwendung des Dativs in einem Modell der Satzbildung zu integrieren; denn die weiter oben beschriebenen Vorstellungen zu Satzbildung basieren auf dem gleichen Modell zur Repräsentation inhaltlichen Wissens wie die grammatikalischen Überlegungen zum Dativ. Die Satzbildung ist am Anfang dieses Kapitels als ein Prozeß beschrieben worden, bei dem ein Ausschnitt aus dem episodischen Gedächtnis isoliert und in eine Wortkette transformiert wird. Diese Transformation wird durch zwei
Die R o l l e der Intentionalität für den Gebrauch des Dativs
307
Arten von Mechanismen gesteuert: Zum einen zieht der Sprecher bei der Satzbildung in Betracht, welche Relationen und Begriffe dem Hörer bekannt sind; dieser Faktor bestimmt nicht nur die Auswahl der zu äußernden Inhalte, sondern auch die Topikalisation von Satzgliedern oder die Wahl von Pronomen. Neben diesen pragmatischen Mechanismen beruht die Satzbildung auf einer Reihe von einzelsprachlichen Prozessen, durch die beispielsweise die Wortfindung gesteuert wird. Diese mehr „oberflächlichen" Prozesse bei der Satzbildung werden in den Arbeiten von Simmons u n d von Goldman beschrieben, die in den Kap. IV und V referiert wurden. Diese beiden Ansätze können als Teil des hier geschilderten, allgemeinen Modelles der Sprachproduktion betrachtet werden, und es erübrigt sich deshalb, hier ein weiteres Mal auf sie einzugehen. Die weiter oben gewählten Beispiele für die Satzbildung waren nun so ausgewählt, daß durch einen Satz jeweils nur eine Proposition aus dem episodischen Gedächtnis beschrieben wurde. Die grammatische Analyse der Sätze mit Dativobjekt zeigt nun, daß diese Sätze in der Regel auf mindestens zwei semantischen Propositionen basieren, der instrumenteilen Handlung und der resultierenden Zugehörigkeitsrelation. Ein Sprecher bildet m.a.W. dann einen Satz mit Dativobjekt, wenn er zugleich zwei Propositionen äußern will: Zum einen, daß eine bestimmte Zugehörigkeitsrelation willentlich produziert worden ist, und zum anderen, auf welche Weise diese Zugehörigkeitsrelation hergestellt wurde. Dies kann an dem weiter oben erwähnten Beispielsatz Der Trompeter erstach seinem Nachbarn die Großmutter, veranschaulicht werden. Dieser Satz könnte etwa in folgender Situation geäußert werden: Zwei Gesprächspartner, Α und B, wissen, daß der Nachbar dem Trompeter eine größere Summe Geld gegeben hat. Β kann sich dies nicht erklären, d. h. er kann keine Kausalverbindung zwischen dieser Handlung und einem anderen, vorhergehenden Ereignis aufbauen. Β weiß jedoch, daß Α über das Verhältnis zwischen dem Trompeter und seinem Nachbar besser Bescheid weiß als-er selbst, und er fragt Α deshalb: Warum hat der Nachbar dem Trompeter Geld gegeben? Α weiß nun, daß der Nachbar aus irgendwelchen Gründen wollte, daß seine Großmutter tot sei, und daß der Trompeter die Großmutter erstach. Der Trompeter hat damit seinem Nachbarn einen Gefallen getan, und dies bildet einen hinreichenden Grund dafür, daß der Nachbar ihm Geld gibt. Abbildung 48 zeigt eine formale Darstellung dieses Ausschnittes aus dem episodischen Wissen von A. Um die Frage von Β befriedigend zu beantworten, m u ß Α zwei Inhalte äußern: Einerseits, daß der
308
Die Generierung der Satzoberfläche
Nachbar keine Großmutter mehr hat, und andererseits, daß dieser Zustand durch die Handlung des Trompeters produziert wurde. Damit sind die Bedingungen für die Bildung eines Satzes mit Dativ erfüllt. Abb. 48: Mögliches episodisches Wissen für die Bildung des Satzes: „Der Trompeter erstach seinem Nachbarn die Großmutter" erstechen-Rezept A Rollen: AKTOR
P3 IHR:
TOD
(INTEND
OPFER
INSTRUMENT
PI
PI
P2 PI:
(POSS P2 PI
F)
P2:
P3: 1
tun (P2 P3 Geld) PRQ: POSS P2 Geld I IHR: POSS P3 Geld
SUP Person Großmutter von P2 SUP Person Enkel von PI Nachbar von P3 SUP Person Nachbar von P2 Beruf Trompeter
Die durch unterbrochene Linien eingerahmten Wissensinhalte sind dem Sprecher und dem Hörer gemeinsam. Die durch durchgehende Linien eingerahmten Inhalte bilden die Satzbasis (nähere Erklärungen im Text).
Nun lassen sich andere Situationen vorstellen, in denen der gleiche Inhalt ohne die Benützung eines Dativs geäußert wird. So könnte der Trompeter als Angeklagter vor Gericht stehen, wobei er zugeben müßte, daß er die Großmutter erstochen hat. Er möchte jedoch nicht den Eindruck erwecken, daß diese Handlung etwas mit seinem Nachbarn zu tun hat. In diesem Fall wird der Trompeter nicht den Dativ benützen, sondern sagen: Ich habe die Großmutter meines Nachbarn erstochen. Bei diesem Satz bildet lediglich die Aktion des Erstechens die Satzbasis, und die resultierende POSS-Relation wird nicht thematisiert. Durch analoge Mechanismen kann die Bildung der zwei Sätze in dem weiter oben analysierten Satzpaar
Die Rolle der Intentionalität für den Gebrauch des Dativs
309
Der Kellner spuckte dem Gast in die Suppe. und Der Kellner spuckte in die Suppe des Gastes, erklärt werden. Damit ist für zumindest eine grammatische Konstruktion aufgezeigt worden, in welcher Weise die Art der Satzbildung durch Inhalte des episodischen Gedächtnisses und durch pragmatische Regeln bestimmt wird, und wie diese beiden Faktoren zusammenwirken. Es handelt sich dabei um ein Beispiel, und der Anspruch auf allgemeine Gültigkeit der postulierten Strukturen u n d Prozesse wird mit weiteren Beispielen erhärtet werden müssen. Der Wert des geschilderten Modelles gegenüber anderen Ansätzen zur Erklärung sprachlicher Leistungen liegt m. E. darin, daß hier ein großer Teil der Faktoren, die für die sprachliche Kommunikation relevant sind, beschrieben und integriert sind. Dabei handelt es sich hauptsächlich um folgende Strukturen und Mechanismen: 1. Ein formales Modell des semantisch-begrifflichen und des episodischen Gedächtnisses. 2. Regeln darüber, wie Inhalte des semantisch-begrifflichen Gedächtnisses beim Verstehen von Sprache benützt werden. 3. Regeln darüber, welche Inferenzprozesse beim Aufbau des episodischen Gedächtnisses ablaufen. 4. Ein Modell, in welcher Weise die Auswahl der geäußerten Inhalte durch den Sprecher von den Inhalten des semantischen u n d episodischen Gedächtnisses und von den Kenntnissen über das Wissen des Hörers bestimmt werden. 5. Vorstellungen darüber, in welcher Weise die Form von Äußerungen durch den Inhalt der Aussage und durch pragmatische Faktoren bestimmt wird. Zu jedem dieser fünf Punkte bestehen sowohl weitgehend formalisierte Vorstellungen, als auch konkrete Beispiele, welche die Funktion der einzelnen Faktoren beim Sprachverstehen und bei der Satzgenerierung beschreiben. Die zweifellos notwendigen Verbesserungen des geschilderten Ansatzes und die ebenso notwendigen Entwürfe von alternativen Konzeptionen müssen auch daran gemessen werden, o b dabei alle der erwähnten Faktoren integriert werden können.
LITERATURVERZEICHNIS
Abelson, R. P. & Reich, C. M. (1969), Implicational molecules: A m e t h o d for extracting meaning f r o m input sentences. Proceedings of the International Joint Conference of Artificial Intelligence, Washington D.C., 641—647. A c h , Ν. (1921), Über die Begriffsbildung. Bamberg: Buchners Verlag. Anderson, J . Μ. (1971), The Grammar of Case. L o n d o n : Cambridge University Press. Anderson, J . R. & Bower, G. H . (1973), Human Associative Memory. New York: J o h n Wiley & Sons. Anisfeld, M. & K n a p p , Μ. ( 1 9 6 8 ) , Association, s y n o n y m i t y , and directionality in false recognition. Journal of Experimental Psychology, 77, 1 71—179. Atkinson, R. C. & Shiffrin, R . M. (1968), H u m a n memory: A proposed system and its control processes. In: K. W. Spence Sc J . T. Spence (Eds.), Advances in the Psychology of Learning and Motivation Research and Theory, Vol. II, New York: Academic Press, 8 9 - 1 9 5 . Attneave, F. (1959), Applications of Information Theory to Psychology. New York: H o l t . Austin, J . L. (1962), How to Do Things with Words. London: O x f o r d University Press. Baddeley, A. D. (1964), Semantic a n d acoustic similarity in short-term m e m o r y . Nature, 204, 1 1 1 6 - 1 1 1 7 . Baddeley, A. D. (1966a), The influence of acoustic a n d semantic similarity on long-term memory for w o r d sequences. Quarterly Journal of Experimental Psychology, 18, 3 0 2 - 3 0 9 . Baddeley, A. D. (1966b), Short-term m e m o r y f o r word sequences as a f u n c t i o n of acoustic, semantic a n d f o r m a l similarity. Quarterly Journal of Experimental Psychology, 362—365. Ballweg-Schramm, Angelika (1976), „essen", „ t r i n k e n " u n d so weiter. Deutsche Sprache, 2 4 4 - 2 5 7 . Barondes, S. H. (1970), Some critical variables in studies of the effect of inhibitors of protein synthesis on m e m o r y . In: W. L. Byrne (ed). Molecular Approaches to Learning and Memory. New York: Academic Press, 27—34. Barondes, S. H. & Cohen, H. D . (1966), Puromycin effect on successive phases of m e m o r y storage. Science, 151, 594—595. Barondes, S. H . 8c Cohen, H. D. (1967), Delayed and sustained effect of acetoxycyloheximide on m e m o r y in mice. Proceedings of the National Academy of Science, 58, 157—164. Barondes, S. H. & Cohen, H. D. (1968), Memory impairment after subcutaneous injection of acetoxycloheximide. Science, 160, 556—557. Bartlett, F. C. (1932), Remembering. Cambridge: Cambridge University Press. Bates, Elisabeth, Masling, M., & Kintsch, W. (1977), Recognition m e m o r y for aspects of dialogue. Program o n cognitive factors in h u m a n learning and m e m o r y Report No. 6 9 , Institute for study of intellectual behavior, University of Colorado, Boulder, Colorado.
Literaturverzeichnis
311
Bilodeau, Ε. Α. (1965), Free Association Norms by Discrete and Continued Methods. Washington D.C.: Office of Naval Research, D e p t . of t h e Navy. Binet, A. & Henri, V. (1894), La memoire des phrases. L 'Annee Psychologique, 1, 2 4 - 5 9 . Bischof, W. F. (1976), Psychology of language and m e m o r y . In: Charniak, E. & Wilks, Y. (eds.), Computational Semantics. Amsterdam: North Holland, 185-203. Bobrow, D. G. & Winograd, T. (1977). An overview of K R L , a knowledge representation language. Cognitive Science, 1. Booth, A. D. (ed.) (1967), Machine Translation. Amsterdam: North Holland Publishing Company. Bousfiled, W. A. (1953), The occurence of clustering in the recall of r a n d o m l y arranged associates. The Journal of General Psychology, 49, 229—240. Bousfield, W. Α., Cohen, Β. Α., & Whitmarsh, G. A. (1958), Associative clustering in t h e recall of words of different taxonomic frequencies of occurence. Psychological Report, 4, 39—44. Bousfield, W. A. & Sedgewick, C. H. W. (1944), An analysis of sequences of restricted associative responses. The Journal of General Psychology, 30, 149-165. Bower, G. H. (1972), Mental imagery and associative learning. In: L. W. Gregg (ed.), Cognition in Learning and Memory. New York: J o h n Wiley & Sons 51-88. Bransford, J . D., Barclay, J . R., & Franks, J . J . (1972), Sentence m e m o r y : A constructive versus interpretative approach. Cognitive Psychology, 3, 193— 209. Bransford, J . D. & Franks, J . J . (1971), The abstraction of linguistic ideas. Cognitive Psychology, 2, 3 3 1 - 3 5 0 . Bransford, J . D. & J o h n s o n , Μ. K. (1972), Contextual prerequisites f o r understanding: Some investigations of comprehension and recall. Journal of Verbal Learning and Verbal Behavior, 11, 717—726. Brinkmann, Η. (1959), Die S t r u k t u r des Satzes im Deutschen. Neuphilologische Mitteilungen, 60. Brown, J . (1954), Some tests on t h e decay theory of immediate m e m o r y . (Quarterly Journal of Experimental Psychology, 6, 141—148. Brown, R. W. & Lenneberg, Ε. Η. (1954), A study in language and cognition. Journal of Abnormal and Social Psychology, 59, 454—462. Brown, W. P. (1961), Conceptions of perceptual defense. British Journal of Psychology (Monogr. Suppl. No. 35). Bühler, K. (1934), Sprachtheorie. Jena: G. Fischer. Celce-Murcia, M. (1972), English comparatives. Ph.D. Thesis. University of California Los Angeles. Cercone, R. 8c Schubert, L. (1975), Toward a state based conceptual representation. Proceedings of the Fourth International Joint Conference on Artificial Intelligence, Tblissi/USSR, Vol. I, 8 3 - 9 0 . Chafe, W. L. (1975), Some t h o u g h t s on schemata. Proceedings of the Conference on Theoretical Issues in Natural Language Processing, Cambridge (Mass.), 99-101. Charniak, E. (1974), Toward a model of children's story comprehension. AI-TR266, Artificial Intelligence L a b o r a t o r y , Massachusetts Institute of Technology. Charniak, E. (1975a), A partial t a x o n o m y of knowledge a b o u t actions. Proceed-
312
Literaturverzeichnis
ings of the Fourth International Joint Conference on Artificial Intelligence, Tblissi/USSR, Vol. I, 9 1 - 9 8 . Charniak, E. (1975b), Organization and inference in a framelike system of comm o n sense knowledge. Proceedings of the Conference on Theoretical Issues in Natural Language Processing, Cambridge (Mass.), 46—55. Charniak, E. (1975c), A brief on case. Working Paper No. 22, Istituto per gli studi semantici e cognitivi, Lugano—Castagnola. Charniak, E. (1976a), A framed PAINTING: T h e representation of a c o m m o n sense knowledge representation. Working paper No 28, Institut p o u r les etudes semantiques et cognitives, Genf. Charniak, E. (1976b), Ms. Malaprop, A language comprehension program. Report Nr. 3 1 , Institut pour les etudes semantiques et cognitives, Genf. Charniak, E. (1976c), Inference a n d knowledge I. In: E. Charniak & Y. Wilks (eds.), Computational Semantics. An Introduction to Artificial Intelligence and Natural Language Comprehension. A m s t e r d a m : North Holland Publishing C o m p a n y , 1—21. Charniak, E. (1978), With a spoon in the hand this must be the eating frame. Proceedings of the Conference on Theoretical Issues in Natural Language Processing-2, Urbana, II., 1 8 7 - 1 9 3 . Chomsky, N. (1957), Syntactic Structures. Den Haag: M o u t o n . Chomsky, N. (1965), Aspects of the Theory of Syntax. Cambridge, MA.: MIT Press. Clark, Η. H. (1968), On the use a n d meaning of prepositions. Journal of Verbal Learning and Verbal Behavior, 7,421—431. Collins, A. M. & Quillian, M. R. (1969), Retrieval time for semantic m e m o r y . Journal of Verbal Learning and Verbal Behavior, 8, 240—247. Collins, A. M. & Quillian, M. R. (1970), Does category size affect categorization time? Journal of Verbal Learning and Verbal Behavior, 9, 432—438. Conrad, Carol (1972), Cognitive economy in semantic m e m o r y . Journal of Experimental Psychology, 92, 149—154. Deese, J . (1959), Influence of inter-item associative strength u p o n immediate free recall. Psychological Reports, 5, 305—312. Deese, J . (1961), From the isolated verbal unit to connected discourse. In: C. N. Cofer (ed.), Verbal Learning and Verbal Behavior. New York: Mc Graw Hill. Deese, J . (1962), On the structure of associative meaning. Psychological Review, 69, 1 6 1 - 1 7 5 . Deese, J . (1965), The Structure of Association in Language and Thought. Baltimore: J o h n Hopkins Press. Dixon, N. F. (1958), The effect of subliminal stimulation u p o n a u t o n o m i c and verbal behavior. Journal of Abnormal and Social Psychology, 57, 29—36. Dornseiff, F. ( 1 9 5 9 s ) , Der deutsche Wortschatz nach Sachgruppen. Berlin: Walter de Gruyter. Ebbinghaus, H. (1885), Über das Gedächtnis. Leipzig: Duncker & H u m b l o t . Eisenberg, P. (1976), Maschinelle Sprachanalyse. Beiträge zur automatischen Sprachbearbeitung I. Berlin: Walter de G r u y t e r . Engelkamp, J . (1973), Semantische Struktur und die Verarbeitung von Sätzen. Studien zur Sprachpsychologie: 4. Bern: Hans Huber. Ervin, S. M. (1961), Changes with age in the verbal determinants of word association. American Journal of Psychology, 74, 361—372. Fahlman, S. E. (1977), A system for representing and usingrealworld knowledge. Diss, phil., Massachusetts Institute of Technology.
Literaturverzeichnis
313
Feigenbaum, Ε. Α. (1970), I n f o r m a t i o n processing a n d m e m o r y . In: D. A. Norman (ed.), Models of Human Memory. New York: Academic Press, 451 — 468. Fillenbaum, S. (1969), Words as feature complexes. Journal of Experimental Psychology, 82, 4 0 0 - 4 0 2 . Fillenbaum, S. & R a p o p o r t , A. (1971), Structures in the Subjective Lexicon. New York: Academic Press. Fillmore, C. J . (1968a), Lexical entries for verbs. Foundations of Language, 4, 373—393. Fillmore, C. J . (1968b), The case f o r case. In: E. Bach & R. T. Harms (eds.), Universals in Linguistic Theory. New York: Holt, Rinehart and Winston, 1—88.
Fillmore, C. J . (1969), Toward a modern theory of case. In: D. A. Reibel & S. A. Schane (eds.), Modern Studies in English. Readings in Transformational Grammar. Englewood Cliffs: Prentice-Hall, 361—375. Fillmore, C. J . (1971), Types of lexical i n f o r m a t i o n . In: D. D. Steinberg & L. A. Jacobovits (eds.), Semantics. An Interdisciplinary Reader in Philosophy, Linguistics, and Psychology. Cambridge: At t h e University Press, 370— 392. Foppa, K. (1963), Die Wirkung von „Wiederholungsketten" auf das Auswendiglernen. Zeitschrift für experimentelle und angewandte Psychologie, 10, 109-124. Foppa, K. (1970), Psychologische Aspekte des Sprachverhaltens. In: K. Bättig (Hg.), Psychologische Experimente in Psychiatrie, Hirnforschung und Industrie. Bern: Hans Huber, 19—23. Freedman, J . F. & L o f t u s , E. F. (1971), Retrieval of words f r o m long-termm e m o r y . Journal of Verbal Learning and Verbal Behavior, 10, 107—115. Garrod, S. & Trabasso, T . (1973), A dual m e m o r y information processing interpretation of sentence comprehension. Journal of Verbal Learning and Verbal Behavior, 12, 1 5 5 - 1 6 8 . Garskof, Β. E. & H o u s t o n , J . P. (1963), Measurement of verbal relatedness: An ideographic approach. Psychological Review, 70, 277—288. Giuliano, Κ. E. (1963), Analog networks for word association. IEEE Transactions on Military Electronics. MIL: 7, 221—234. Glass, A. L. & Holyoak, K. (1974), The effect of some and all on reaction time for semantic decisions. Memory & Cognition, 2, 436—440. Glass, A. L., Holyoak, K. J . , & OT>eIl, C. (1974), Production frequency a n d the verification of quantified sentences. Journal of Verbal Learning and Verbal Behavior, 13, 237—254. Goldman, Ν. M. (1974), Computer generation of natural language f r o m a deep conceptual base. Report No. 2, Istituto per gli studi semantici e cognitivi, Lugano—Castegnola. Goldman, N. (1975a), Conceptual generation. In: R . C. Schank, Conceptual Information Processing. Amsterdam: N o r t h Holland. 289—371. Goldman, N. (1975b), Sentence paraphrasing f r o m a conceptual base. Communications of the ACM, 18, 9 6 - 1 0 6 . Grisillon, Almuth (1975), Les relatives dans Panalyse linguistique de la surface textuelle: Un cas de region f r o n t i i r e . Languages, 3 7, 99—121. Grice, H. P. (1968), Utterer's meaning, sentence meaning, and word-meaning. Foundations of Language, 4, 225—242. Grice, H. P. (1975), Logic and conversation. In: P. Cole & J . L. Morgan (eds.), Syntax and Semantics, Vol. Ill: Speech Acts. New York: Adacemic Press.
314
Literaturverzeichnis
Groner, R., Keller, B. & Menz, C. (1977), Formal precision, where and what for, or: The ape climbs the tree. Forschungsberichte aus dem psychologischen Institut der Universität Bern, 1977—1. G u z m ä n , A. (1968), Decomposition of a visual scene into threedimensional bodies. Proc. of the Fall Joint Computer Conference, 291—304. Hall, J . F. (1954), Learning as a function of w o r d frequency. American Journal of Psychology, 67, 1 3 8 - 1 4 0 . Halliday, Μ. A. K. (1967), Notes on transitivity and theme in English. Journal of Linguistics, 3, 3 7 - 8 1 , 1 9 9 - 2 4 4 . Harris, Z. (1954), Distributional structure. Word, 10, 1 4 6 - 1 6 2 . Hays, D. G. (1967), Introduction to Computational Linguistics. New York: American Elsevier Publishing Company. Hemphill, Linda (1973), The relationship of language and belief: With special emphasis on English „ f o r " constructions. Diss, phil., Stanford University. Henley, Nancy M. (1969), A psychological study of the semantics of animal terms. Journal of Verbal Learning and Verbal Behavior, 8, 1 76—184. Henne, Η. & Rehbock, Η. (1979), Einführung in die Gesprächsanalyse. Berlin: Walter de Gruyter. Herrmann, T h . (1962), Syntaktische Untersuchungen zum unmittelbaren Behalten von Wortketten. Zeitschrift für experimentelle und angewandte Psychologie, 9, 397—416. Herrmann, Th. & Deutsch, W. (1976), Psychologie der Objektbenennung. Studien zur Sprachpsychologie: 5. Bern: Hans Huber. Hewitt, C. (1975), How t o use what y o u k n o w . Proceedings of the Fourth International Joint Conference on Artificial Intelligence, Tblissi/USSR, Vol. I, 189-198. H o f m a n n , K.-D. (1973), Grundlagen der Informationstheorie. Düsseldorf: Schwamm. Holyoak, K. J . & Glass, A. L. (1975), The role of contradictions and counterexamples in the rejection of false sentences. Journal of Verbal Learning and Verbal Behavior, 14, 2 1 5 - 2 3 9 . H ö r m a n n , H. ( 1 9 7 6 ) , Meinen und Verstehen. Frankfurt/M.: Suhrkamp. H o r s t k o t t e , G u d r u n (1978), Wortbedeutung u n d K o n t e x t . Eine Untersuchung zur Theorie des semantischen Gedächtnisses. Diss. Phil., Technische Universität Berlin. H u m b o l d t , W. v. (1822), Uber das vergleichende Sprachstudium in Beziehung auf die verschiedenen Epochen der Sprachentwicklung. Abhandlungen der historisch-philologischen Königlichen Preußischen Akademie der Wissenschaften aus den Jahren 1820 bis 1821, 2 3 9 - 2 6 0 . J a m e s , C., T h o m p s o n , J . , & Baldwin, J . (1973), The reconstructive process in sentence m e m o r y . Journal of Verbal Learning and Verbal Behavior, 12, 51-63. J e n k i n s , J . J . , Mink, W. D „ & Russell, W. A. (1958), Associative clustering as a f u n c t i o n of verbal associative strength. Psychological Reports, 4, 127— 136. J e n k i n s , J . J . & Russell, W. A. (1952), Associative clustering during recall. Journal of Abnormal and Social Psychology, 47, 818—821. J o h n s o n , Μ. K „ Bransford, J . D „ & Solomon, S. K. (1973), Memory for tacit implications of sentences. Journal of Experimental Psychology, 98, 203— 205. J o h n s o n , P. E. (1964), Associative meaning of concepts in physics. Journal of Educational Psychology, 55, 84—88.
Literaturverzeichnis
315
J o h n s o n , S. C. (1967), Hierarchical clustering schemes. Psychometrika, 32, 241 — 254. J u n g , C. G. & Riklin, F. (1906), Experimentelle Untersuchungen über Assoziationen Gesunder. In: C. G. J u n g (Hg.), Diagnostische Assoziationsstudien. Leipzig: J . A. Barth, 7 - 1 4 5 . Kallmeyer, W., Klein, W. u . a . (1974), Lektürekolleg zur Textlinguistik. Frankf u r t a.M.: Athenäum K a n t , I. (1 781), Kritik der reinen Vernunft. Riga: J . F. Hartknoch. Katz, J . J . & F o d o r , J . A. (1963), T h e structure of a semantic theory. Language, 39, 1 7 0 - 2 1 0 . Katz, J . J . & F o d o r , J . A. (1964), T h e structure of a semantic theory. In: J . A. Fodor & J . J . Katz (eds.), The Structure of Language. Readings in the Philosophy of Language. Englewood Cliffs, N . J . : Prentice-Hall, 479—518. K e n t , G. H. & Rosanoff, A . J . (1910), A study of association in insanity. American Journal of Insanity, 67, 37—96. Kiefer, F. (1970), On the problem of word order. In: M. Bierwisch & Κ. Ε. Heidolph (eds.), Progress in Linguistics. Den Haag: M o u t o n , 127—142. King, Margaret (1976), Mutatis mutandis I. Preliminary remarks on the adaptation of Wilks' preference semantics system f o r use within a data base interrogation system. Working paper No. 3 0 , Institut pour les i t u d e s semantiques et cognitives, Genf. King, Margaret & Hayse, P. (1976), Programming in LISP. In: Charniak/Wilks (eds.), Computational Semantics. Amsterdam: N o r t h Holland, 235—281. Kintsch, W. (1968), Recognition a n d free recall of organized lists. Journal of Experimental Psychology, 78, 481—487. Kintsch, W. (1972), Notes on the structure of semantic memory. In: Ε Tulving & W. Donaldson (eds.), Organization and Memory. New York: Academic Press, 2 4 7 - 3 0 8 . Kintsch, W. (1974), The Representation of Meaning in Memory. Hillsdale, N . J . : Erlbaum Associates. Kintsch, W. & Bates, E. (1977), Recognition m e m o r y for statements f r o m a classroom lecture. Journal of Experimental Psychology: Human Learning and Memory, 3, 150—168. Kiss, G. R. (1967), Networks as models f o r word storage. In: N. L. Collins & D. Michie (eds.), Machine Intelligence I. New Y o r k : American Elsevier Publishing Comp., 155—167. Kiss, G. R . (1975), An associative thesaurus of English: Structural analysts of a large relevance network: In: A. Kennedy & A. Wilkes (eds.), Studies in Long-Term Memory. New York: Wiley, 103—121. K u n o , S. & Oettinger, A. G. (1963), Multiplepath syntactic analyzer. In: Popplewell (ed.), Information Processing-1962. Amsterdam: North Holland Publishing C o m p a n y , 3 0 6 - 3 1 2 . L a k o f f , G. ( 1 9 7 1 ) , On generative semantics. In: D. D. Steinberg & L. A. J a k o b o vits (eds.), Semantics. An Interdisciplinary Reader in Philosophy, Linguistics and Psychology. Cambridge: At the University Press, 232—307. L a k o f f , G. (1972), Hedges: A study in meaning criteria and the logic of f u z z y concepts. In: P. M. Peranteau, J . N. Levi, & G. C. Phares (eds.), Papers from the Eighth Regional Meeting Chicago Linguistic Society. Chicago: Chicago Linguistic Society, 183—228. Landauer, Τ . Κ. & F r e e d m a n . J . L . (1968), I n f o r m a t i o n retrieval f r o m long-term m e m o r y : Category size a n d recognition time. Journal of Verbal Learning and Verbal Behavior, 7, 2 9 1 - 2 9 5 .
316
Literaturverzeichnis
Landauer, Τ . Κ. & Meyer, D. Ε. (1972), Category size and semantic m e m o r y retrieval. Journal of Verbal Learning and Verbal Behavior, 11, 539—549. Lazarus, R. S. & McCleary, R . A. (1951), Automatic Discrimination w i t h o u t awareness: A study of subperception. Psychological Review, 58, 113— 122. L e h n e r t , Wendy (1976), Dynamic processing a n d question answering. Proceedings of the International Conference on Computational Linguistics, COLING, O t t a w a . Lu, J . Η. T . (1965), Contractive stress and emphatic stress. Project Report N o . 10. The Ohio State University. (Zit. n. Kiefer, 1970). Mac K a y , D. G. (1966), To e n d ambiguous sentences. Perception &Psychophysics, 1, 4 2 6 - 4 3 6 . Mac K a y , D . G. & Bever, T. G. (1967), In search of ambiguity. Perception & Psychophysics, 2, 1 9 3 - 2 0 0 . Mandler, G. (1966), Organization and m e m o r y . In: K. W. Spence & J . T . Spence (eds.), The Psychology of Learning and Motivation: Advances in Research and Theory, Vol. I. New York: Academic Press, 3 2 7 - 3 7 2 . Mandler, G., Meitzer, R. H., & Pearlstone, Ζ. (1969), The structure of recognition: Effects of listtags and of acoustic a n d semantic confusion. Technical Report No. 7, Center for H u m a n I n f o r m a t i o n Processing, University of California, San Diego. Mayer, A. & Orth, J . (1901), Zur qualitativen Untersuchung der Assoziation. Zeitschrift für Psychologie, 26, 1—13. McCalla, G. I. & Sampson, J . R. (1972), MUSE: A model t o understand simple English. Communications of the ACM, 15, 29—40. McCarthy, J . , Abrahams, P. W„ Edwards, D. J . , Hart, P. & Levin, Μ. I. (1962), LISP 1.5 Programmers Manual. Cambridge, Mass.: MIT Press. McCoy, A. M. B. C. (1969), A case grammar classification for Spanish verbs. Ph. D. Tesis, University of Michigan. Meyer, D. E . (1970), On the representation and retrieval of stored semantic i n f o r m a t i o n . Cognitive Psychology, 1, 242—300. Meyer, D. E . (1973), Verifying affirmative a n d negative propositions: Effects of negation on memory retrieval. In: S. Kornblum (ed.), Attention and Performance IV, New York: Academic Press. Meyer, D. E. (1975), Long-term memory retrieval during the comprehension of affirmative and negative sentences. In: A. Kennedy & A. Wilkes (eds.), Studies in Long-Term Memory. New York: Wiley, 289—312. Michie, D. (1974), On Machine Intelligence. Edinburgh: Edinburgh University Press. Mill, J . (1869), Analysis of the Phenomena of the Human Mind. L o n d o n : Longmans, Green, Reader & Dyer. Miller, G. A. (1956), The magical number seven, plus or minus t w o : Some limits o n our capacity for processing i n f o r m a t i o n . Psychological Review, 63, 81-97. Miller, G. A. (1972), English verbs of motion: A case study in semantics and lexical m e m o r y . In: A. W. Melton & E. Martin (eds.), Coding Processes in Human Memory. Washington D. C.: Winston, 335—372. Miller, G . A. & Selfridge, G. A. (1950), Verbal c o n t e x t and the recall of meaningful material. American Journal of Psychology, 63, 176—185. Millward, R. B., Rice, C. & C o r b e t t , A. (1975), Category production m e t h o d s and verification times. In: A. Kennedy & A. Wilkes (eds.), Studies in Long-Term Memory. New York: Wiley, 219—252.
Literaturverzeichnis
317
M i n s k y , Μ. ( 1 9 6 8 ) , Semantic Memory. C a m b r i d g e Mass.: M I T Press. M i n s k y , M. ( 1 9 7 5 a ) , A f r a m e w o r k f o r representing k n o w l e d g e . I n : P. H. Winston (ed.), The Psychology of Computer Vision. N e w Y o r k : Mc Graw-Hill, 211-280. M i n s k y , M. ( 1 9 7 5 b ) , A f r a m e w o r k f o r representing k n o w l e d g e . Proceedings ot t h e C o n f e r e n c e o n Theoretical Issues in Natural Language Processing, Cambridge, Mass., 1 1 8 - 1 3 0 . Neisser, U. ( 1 9 7 6 ) , Cognition and Reality. San Francisco: Freeman & Co. Newell, A. & S i m o n , H. A. ( 1 9 7 2 ) , Human Problem Solving. E n g l e w o o d Cliffs: Prentice-Hall. Nilsen, D. L. F. ( 1 9 7 2 ) , Toward a Semantic Specification of Deep Case. Den Haag: M o u t o n . Nilsen, D. L. F. ( 1 9 7 3 ) , The Instrumental Case in English. D e n Haag: M o u t o n . Nilsson, N. J . (1971), Problem Solving Methods in Artificial Intelligence. New Y o r k : McGraw-Hill. N o r m a n , D. A (1973), M e m o r y , k n o w l e d g e , a n d the answering of questions. In: R . L. Solso (ed.), Contemporary Issues in Cognitive Psychology: The Loyola Symposium. Washington, D.C.: V. H. Winston & Sons, 135—165. N o r m a n , D. A. ( 1 9 7 8 ) , The role of active m e m o r y processes in p e r c e p t i o n a n d cognition. Actes du XXIe Congris International de Psychologie. Paris: PUF, 1 6 5 - 1 8 4 . N o r m a n , D. Α., & R u m e l h a r t , D. E. (1970), A system f o r p e r c e p t i o n and mem o r y . I n : D. A. N o r m a n (ed.), Models of Human Memory. New Y o r k : A c a d e m i c Press, 21—64. N o r m a n , D. Α., R u m e l h a r t , D. E „ & the LNR Research G r o u p ( 1 9 7 5 ) , Explorations in Cognition. San Francisco: F r e e m a n & Co. O l s o n , D. R. ( 1 9 7 0 ) , Language a n d t h o u g h t : Aspects of a cognitive t h e o r y of sem a n t i c s . Psychological Review, 4, 257—273. O l s o n , D. R. (1972), Language use f o r c o m m u n i c a t i n g , i n s t r u c t i n g a n d t h i n k ing. In: J . B. Carroll & R . O. Freedle (eds.), Language Comprehension and the Acquisition of knowledge. Washington D. C.: Winston & Sons, 139— 167. O s g o o d , C. E. (1949), T h e similarity p a r a d o x in h u m a n learning: A r e s o l u t i o n . Psychological Review, 56, 1 3 2 - 1 4 3 . O s g o o d , C. E. ( 1 9 7 1 ) , Where d o sentences c o m e f r o m ? In: D. D. Steinberg & L. A. J a k o b o v i t s (eds.), Semantics. An Interdisciplinary Reader in Philosophy, Linguistics and Psychology. C a m b r i d g e : C a m b r i d g e University Press., 497-529. Paivio, A. ( 1 9 6 9 ) , M e n t a l imagery in associative learning a n d m e m o r y . Psychological Review, 76, 2 4 1 - 2 6 3 . Paivio, A. (1971), Imagery and Verbal Processes. N e w Y o r k : H o l t , Rinehart & Winston. Paivio, A. ( 1 9 7 5 ) , I m a g e r y a n d long-term m e m o r y . I n : A. K e n n e d y & A . Wilkes (eds.), Studies in Long Term Memory. L o n d o n : J o h n Wiley & Sons, 57— 85. P a l e r m o , D. S. & J e n k i n s , J . J . ( 1 9 6 4 ) , Word Association Norms, Grade School through College. Minneapolis: University of M i n n e s o t a Press. P a l m e , J . (1971), Making c o m p u t e r s u n d e r s t a n d n a t u r a l language. I n : N. Findler & B. Meitzer (eds.), Artificial Intelligence and Heuristic Programming. E d i n b u r g : E d i n b u r g h University Press. Palme, J . ( 1 9 7 3 ) , T h e S Q A P data base f o r n a t u r a l language i n f o r m a t i o n . Report N o . C 8 3 7 6 - M 3 , Research institute of n a t i o n a l d e f e n s e , S t o c k h o l m .
Literaturverzeichnis
318
Pecheux, Μ. (1975), Analyse du discours. Langue et ideologies. Languages, 3 7. Perrault, G R. & C o h e n , P. H . (1977), Planning speech acts. A. I. Memo 7 7 - 1 , Dept. of C o m p u t e r Science, University of T o r o n t o . Peterson, L. R. & Peterson, M. J . (1959), Short-term retention of individual verbal items. Journal of Experimental Psychology, 58, 193—198. Pohl, Uta (1964), Zur Psychologie des Gedächtnisses: II. Weitschweifigkeit, Satzeigenschaft und Behaltenseffekt. Zeitschrift für Psychologie, 169, 215-231. Pollio, H. R. (1963), Α simple matrix analysis of associative structure. Journal of Verbal Learning and. Verbal Behavior, 2, 166—169. Posner, R. (1972), Dialogsorten — Die Verwendung von Mikrostrukturen zur Textklassifizierung. In: Ε . Gülich & W. Raible (Hg.), Textsorten. Frankfurt a.M.: A t h e n ä u m , 1 8 3 - 2 0 0 . Posner, R. (1972), Theorie des Kommentierens — Eine Grundlagenstudie zur Semantik und Pragmatic. Frankfurt/M.: Fischer-Athenäum. Posner, R. (1978), Semantic^ and pragmatics of sentence connectives in natural language. In: F. Kiefer & J . Searle (eds.), Speech Acts and Pragmatics. Amsterdam: North-Holland. Postman, L. (1975), Verbal learning a n d m e m o r y . Annual Review of Psychology, 26, 2 9 1 - 3 3 5 . Prieto, L . J . (1966), Messages et signaux. Paris: Presses Universitäres de France. (Deutsch: Nachrichten u n d Signale. Berlin/DDR: Akademie-Verlag, 1972). Prieto, L. J . (1975), Pertinence et practique. Paris: Les editions de minuit. Quillian, M. R. (1967), Word concepts: A theory and simulation of some basic semantic capabilities. Behavioral Science, 12, 410—430 Quillian, M. R. (1968), Semantic m e m o r y . In: M. Minsky (ed.), Semantic Information Processing. Cambridge (Mass.): MIT Press, 227—270. Quillian, M. R. (1969), The teachable language comprehender. Communications of the ACM, 12, 4 5 9 - 4 7 6 . R a p o p o r t , Α., Livant, W. P. & Boyd, I. (1966), A study of lexical graphs. Foundations of Language, 2, 338—376. Reichman, Rachel (1978a), Conversational coherency. R e p o r t TR-17-78, Center for Research in Computer Technology, Harvard University, Cambridge, Mass. Reichman, Rachel (1978b), Conversational coherency, Cognitive Science, 2, 283-327. Reitman, J u d i t h S. (1970), Computer simulation of an information-processing model of short-term memory. I n : D. A. Norman (ed.), Models of Human Memory. New York: Academic Press, 117—148. Rieger, C. I. (1974), Conceptual m e m o r y . Ph.D.-Thesis, Computer Science Department, Stanford University. Rieger, C. I. (1975a), Conceptual m e m o r y and inference. In: R. C. Schank, Conceptual Information Processing. Amsterdam: N o r t h Holland. 157— 288.
Rieger, C. (1975b), Conceptual overlays: A mechanism f o r t h e interpretation of sentence meaning in context. Advance Papers of the Fourth Int. Joint Conf. on Artificial Intelligence, Tblissi UdSSR. Vol. I, 1 4 3 - 1 5 0 . Riesbeck, C. K. (1974a), Computational understanding: Analysis of sentences and context. Report No. 4, Istituto per gli studi semantici e cognitivi, Lugano-Castagnola. Riesbeck, C. Κ. (1974b), Expectation as a basic mechanism of language comprehension. In: A. Zampolli (ed.), Computational and Mathematical Unguis-
Literaturverzeichnis
319
tics. Proceedings of the International Conference on Computational Linguistics, Pisa 1973. Firenze: Olschki. Riesbeck, C. K. (1975), Conceptual analysis. In: R. C. Schank, Conceptual Information Processing. Amsterdam: N o r t h Holland. 83—156. Rips, L. I., Shoben, Ε. I., Sc S m i t h , Ε. E. (1973), Semantic distance and the verification of semantic relations. Journal of Verbal Learning and Verbal Behavior, 12, 1 - 2 0 . Rosch, Eleanor H. (1973), On the internal structure of perceptual and semantic categories. In: Τ . E. Moore (ed.), Cognitive Development and the Acquisition of Language. New York: Academic Press, 111—144. Rosch, Eleanor, C. B. Mervis, W. D. Gray, D „ J o h n s o n & P. Boyes-Braem (1976), Basic objects in natural categories. Cognitive Psychology, 8, 382—439. Rumelhart, D. E. (1976), Understanding and summarizing brief stories. Technical Report No. 58, Center for Human Information Processing, University of California, San Diego. R u m e l h a r t , D. E., Lindsay, P. H., & N o r m a n , D. A. (1972), A process model for long-term m e m o r y . In: E . Tulving & W. Donaldson (eds.), Organization and Memory. New York: Academic Press, 197—246. Russell, W. A. & Meseck, O. R. (1959), Der Einfluß der Assoziation auf das Erinnern von Worten in der deutschen, französischen u n d englischen Sprache. Zeitschrift für experimentelle und angewandte Psychologie, 6, 191 — 211.
Sachs, Jacqueline D. S. (1967), Recognition memory for syntactic and semantic aspects of connected discourse. Perception & Psychophysics, 2, 437 — 442. Sandewall, Ε. (1970), Formal m e t h o d s in the design of question-answering systems. Report No. 28, Dept. of C o m p u t e r Sciences, Uppsala University. Schaeffer, B. & Wallace, R . (1969), Semantic similarity and comparison of word meanings. Journal of Experimental Psychology, 82, 343—346. Schank, G. & Schoenthal, G. (1976), Gesprochene Sprache. Eine Einführung in Forschungsansätze und Analysemethoden. Tübingen: Niemeyer-Verlag. Schank, R. (1968a), The use of conceptual relations in content analysis and data base storage. T R A C O R d o c u m e n t No. 68—347-U, Austin, Texas. Schank, R. (1968b), Outline of a conceptual semantics for generation of coherent discourse. T R A C O R d o c u m e n t No. 68—462-U, Austin, Texas. Schank, R. (1972), Conceptual dependency: A theory of natural language understanding. Cognitive Psychology, 3, 552—631. Schank, R. C. (1973a), The fourteen primitive actions a n d their inferences. Memo AIM-183, Stanford University Artificial Intelligence Project. Schank, R . C. (1973b), Causality and reasoning. Report N o . 1, Istituto per gli studi semantici e cognitivi, Lugano-Castagnola. Schank, R. (1974a), Adverbs and belief. Lingua, 33, 4 5 - 6 7 . Schank, R. (1974b), Is there a semantic m e m o r y ? Report No. 3, Istituto per gli studi semantici e cognitivi, Lugano-Castagnola. Schank, R . C. (1975), Conceptual dependency theory. In: R. C. Schank, Conceptual Information Processing. A m s t e r d a m : North Holland. 22—82. Schank, R. & Abelson, R . (1975), Scrips, plans, and knowledge. Proceedings of the Fourth International Joint Conference on Artificial Intelligence, Tblissi/USSR, Vol. I, 1 5 1 - 1 5 7 . Schank, R . & Abelson, R . (1977), Scripts, Plans, Goals and Understanding. An Inquiry into Human Knowledge Structure. Hillsdale, New J e r s e y : Lawrence Erlbaum Associates.
320
Literaturverzeichnis
Schänk, R., G o l d m a n , N „ Rieger, C., & Riesbeck, R. (1973), MARGIE: Memor y , analysis, response, generation a n d inference o n Englisch. Proceedings of the Third International Joint Conference on Artificial Intelligence, Stanford. Schänk, R. C „ Tesler, L., & Weber, S. (1970), SPINOZA II: Conceptual casebased natural language analysis. AIM-109, C o m p u t e r Science Department, S t a n f o r d University. Schegloff, E. (1968), Sequencing conversational openings. American Anthropologist, 70, 1 0 7 5 - 1 0 9 5 . S c h m i d t , C. F. ( 1 9 7 5 ) , Understanding h u m a n action. Proceedings of the Conference on Theoretical Issues in Natural Language Processing, Cambridge (Mass.), 2 1 5 - 2 1 9 . Schubert, L. K. (1975), Extending t h e expressive power of semantic networks. Proceedings of the Fourth International Joint Conference on Artificial Intelligence, Tblissi/USSR, 1 5 8 - 1 6 4 . Scragg, G. W. (1975), Frames, planes, and nets: A synthesis. Report Nr. 19, Istituto per gli studi semantici e cognitivi, Lugano-Castagnola. Searle, I. R. ( 1 9 6 9 ) , Speech Acts. L o n d o n : Cambridge University Press. S h a f t o , M. (1973), The space for case. Journal of Verbal Learning and Verbal Behavior, 12, 5 5 1 - 5 6 2 . Shepard, R. N. ( 1 9 6 7 ) , Recognition m e m o r y for words, sentences, and pictures. Journal of Verbal Learning and Verbal Behavior, 6, 156—163. Simmons, R . F. (1965), Answering English questions b y computer: A survey. Communications of the ACM, 8, 53—70. Simmons, R . F. (1970), Natural language question answering systems: 1969. Communications of the ACM, 13, 15—30. Simmons, R. F. ( 1 9 7 1 ) , Natural language for instructional communication. In: Findler & Meitzer (eds.), Artificial Intelligence and Heuristic Programming. Edinburgh: Edinburgh University Press, 191 — 198. Simmons, R. F. (1972a), Some semantic structures f o r representing English meanings. Technical Report NL-1, Department of Computer Sciences, The University of Texas at Austin. (Abgedruckt in Simmons 1972c). Simmons, R. F. (1972b), Semantic networks: Their c o m p u t a t i o n and use for understanding English sentences. Technical Report NL-6, Department of C o m p u t e r Sciences, The University of Texas at Austin. (Abgedruckt· in Simmons, 1973). Simmons, R . F. (1972c), Some semantic structures f o r representing English meanings. In: J . B. Carroll & R . O. Freedle (eds.), Language Comprehension and the Acquisition of Knowledge. New York: Wiley, 71—97. Simmons, R . F. (1973), Semantic networks: Their c o m p u t a t i o n and use f o r understanding English sentences. In: R. Schänk & K. Colby (eds.), Computer Models of Thought and Language. San Francisco: Freeman, 63— 113. Simmons, R. & Slocum, J . (1972), Generating English discourse f r o m semantic nets. Communications of the ACM, 15, 891—905. Simon, H. A. (1972), What is visual imagery? An i n f o r m a t i o n processing interp r e t a t i o n . I n : L. W. Gregg (ed.), Cognition in Learning and Memory. New York: J o h n Wiley & Sons, 1 8 3 - 2 0 4 . S m i t h , Ε. E., S h o b e n , Ε. I., & Rips, L. I. (1974), Structure and process in semantic m e m o r y : A featural model for semantic decisions. Psychological Review, 81, 2 1 4 - 2 4 1 . Smith, Ε. E., Rips, L. I., & Shoben, Ε. I. (1974), Semantic m e m o r y and psycho-
Literaturverzeichnis
321
logical semantics. In: G. H . Bower (ed.), The Psychology of Learning and Motivation, Vol. 8, New Y o r k : Academic Press, 1 —45. Sperling, G. (1960), The information available in brief visual presentations. Psychological Monographs, 74, ganzes H e f t 4 9 8 . Sternberg, S. (1966), High-speed scanning in h u m a n memory. Science, 153, 652-654. Sternberg, S. (1969), Memory-scanning: Mental processes revealed by reactiontime experiments. American Scientist, 4, 421—457. T h o r n d y k e , P. W. (1975), Cognitive structures in h u m a n story comprehension. Ph. D.-Thesis, Department of Psychology, Stanford University. T h o r n e , J . P., Bratley, P., & Dewar, H. (1968), The syntactic analysis of English by machine. In: D. Michie (ed.), Machine Intelligence 3. New Y o r k : American Elsevier Publishing C o m p a n y , 281—309. T h u m b , A. & Marbe, K. (1901), Experimentelle Untersuchungen über die psychologischen Grundlagen der sprachlichen Analogiebildung. Leipzig: W. Engelmann. Tulving, E. (1972), Episodic a n d semantic m e m o r y . In: Ε. Tulving & W. Donaldson (eds.), Organization and Memory. New York: Academic Press, 381 — 403. Turing, Α. Μ. (1950), C o m p u t i n g machinery and intelligence. Mind, 59, 433— 4 6 0 . Abgedruckt in: E. A. Feigenbaum & J . Feldman (eds.), Computers and Thought. New Y o r k : Mc Graw-Hill, 1 9 6 3 . U n d e r w o o d , B. J . (1957), Interference and forgetting. Psychological Review, 64, 4 9 - 6 0 . U n d e r w o o d , B . J . (1965), False recognition p r o d u c e d by implicit verbal responses. Journal of Experimental Psychology, 70, 122—129. U n d e r w o o d , B. J . (1970), A breakdown of the total-time law in free-recall learning. Journal of Verbal Learning and Verbal Behavior, 9, 573—580. Wallace, A. F. C. & Atkins, J . (1960), The meaning of kinship terms. American Antropologist, 62, 58—79. Walmsley, J . B. (1971), The English comitative case and the c o n c e p t of deep structure. Foundations of Language, 7, 493—507. Waugh, N. C. & N o r m a n , D. A . (1965), Primary m e m o r y . Psychological Review, 72, 8 9 - 1 0 4 . Weisgerber, L. (1962), Die ganzheitliche Betrachtung eines Satzbauplanes. Wirkendes Wort, Beiheft 1. Düsseldorf: Schwann-Verlag. Weissman, C. (1967), LISP 1.5 Primer. Belmont, (Ca.): Dickenson. Weizenbaum, J . (1966), ELIZA- A computer program for the study of natural language communication between man and machine. Communications of the ACM, 9, 3 6 - 4 5 . Weizenbaum, J . (1976), Computer Power and Human Reason. San Francisco: Freeman and Co. Wertheimer, M. (1923), Untersuchungen zur Lehre von der Gestalt. Psychologische Forschung, 4, 301—350. Wettler, M. (1970a), Syntaktische Faktoren im verbalen Lernen. Studien zur Sprachpsychologie: 1. Bern: Hans Huber. Wettler, M. (1970b), Experiments in learning German prose. Proceedings of the International Conference on Psychology of Human Learning, Prag, Vol. II, 1 5 1 - 1 5 7 . Wettler, M. (1972), The f o r m a t i o n of a semantic network b y induction. Psychologische Forschung, 35, 291—316. Wettler, Μ. (1974a), Uber die Speicherung syntaktischer Merkmale im Langzeit-
322
Literaturverzeichnis
gedächtnis. In: L. & U. Eckensberger (Hg.), Bericht über den 28. Kongreß der DGfP. Göttingen: Hogrefe, Bd. 1, 1 3 9 - 1 5 2 . Wettler, M. (1974b), Über die Struktur des semantischen Langzeitgedächtnisses. Working paper No. 10, Istituto per gli studi semantici e cognitivi, LuganoCostagnola. Wettler, M. ( 1 9 7 6 ) , How to connect frames. Working paper Nr. 29, Institut pour les etudes semantiques et cognitives, Genf. Wettler, Μ. (1978), Zur Repräsentation komplexer Begriffe in Handlungsschem a . I n : H. Ueckert (Hg.), Komplexe Informationsverarbeitung. Göttingen: Hogrefe. Whorf, B. L. (1956), Language, Thought, and Reality. New York: Wiley (Deutsche Übersetzung: Whorf, 1963). Whorf, B. L. ( 1 9 6 3 ) , Sprache, Denken, Wirklichkeit. Reinbek.: Rowohlt. Wickeigren, W. A. (1970), Multitrace strength theory. In: D. A. N o r m a n (ed.), Models of Human Memory. New York/ Academic Press, 67—102. Wickeigren, W. A. & Norman, D. A. (1966), Strength models and serial position in short-term recognition m e m o r y . Journal of Mathematical Psychology, 3, 3 1 6 - 3 4 7 . Wickens, D. D. (1970), Encoding categories of words: An empirical approach to meaning. Psychological Review, 77, 1—15. Wickens, D. D. (1972), Characteristics of word encoding. In: W. Melton & E. Martin (eds.), Coding Processes in Human Memory. Washington D.C.: Winston, 1 9 1 - 2 1 5 . Wilkins, A. J . (1971), Conjoint f r e q u e n c y , category size, and categorization time. Journal of Verbal Learning and Verbal Behavior, 10, 382—385. Wilks, Y. A. (1975), Seven theses on Artificial Intelligence and natural language. Report Nr. 17, Istituto per gli studi semantici e cognitivi. Lugano-Castagnola. Winograd, T. (1971), Procedures as a representation f o r data in a c o m p u t e r program f o r understanding natural language. MAC TR-84, Project MAC, Massachusetts Institute of Technology. Winograd, T . (1972), Understanding Natural Language. New York: Academic Press. Winograd, T . (1976), Towards a procedural understanding of semantics. Memo AIM-292, Stanford Artificial Intelligence L a b o r a t o r y . Winston, P. H. (1970), Learning Structural Descriptions f r o m Examples. Diss, phil., Massachusetts Institute of Technology, Cambridge, Mas. Winston, P. H. (1975), Learning structural descriptions f r o m examples. In: P. H. Winston (ed.), The Psychology of Computer Vision. New York: Mc Graw-Hill, 1 5 7 - 2 0 9 . Wittgenstein, L. (1958), Philosophical Investigations. O x f o r d : Blackwell. (Zitiert nach: L . Wittgenstein,Schriften. F r a n k f u r t : S u h r k a m p , 1960). Woods, W. A. (1970), Transition network grammars for natural language analysis. Communications of the ACM, 13, 591—606. Woods, W. A. (1975), What's in a link: Foundations f o r semantic networks. In: D. G. Bobrow & A. Collins (eds.), Representation and Understanding. New Y o r k : Academic Press, 35—82. Wundt, W. ( 1 8 8 3 ) , Über psychologische Methoden, Philosophische Studien 1, 1-38. Yngve, V. H. (1960), A model and a hypothesis f o r language structure. Proceedings of the American Philosophical Society, 104, 444—466.
Literaturverzeichnis
323
Zampolli, Α. ed. (1974), Computational and Mathematical Linguistics. Proceedings of the International Conference on Computational Linguistics, Pisa 1973. Firenze: Olschki. Zemb, J . M. (1968), Les Structures Logiques de la proposition Allemande. Paris, Diss. phil. Zipf, G. K. (1945), The meaning-frequency relationship of words. Journal of General Psychology, 33, 2 5 1 - 2 5 6 . Zollinger, H. (1973), Zusammenhänge zwischen Farbbenennung und Biologie des Farbsehens beim Menschen. Vierteljahresschrift der Naturforschenden Gesellschaft in Zürich, 118, 2 2 7 - 2 5 5 .
PERSONENVERZEICHNIS
Abelson, R.P. 38, 177 f., 182 Ach, N. 172 A n d e r s o n , J . M . 82 Anisfeld, M. 65 f. A t k i n s , J . 27 A t k i n s o n , R.C. 15 ff. Attneave, F. 246 Baddeley, A.D. 14 f., 17, 19, 65 Baldwin, J . 141 Ballweg-Schramm, A. 160 f. Barclay, J . R . 140 Barondes, S.H. 18 Bartlett, F.C. 141 Bates, Ε. 140 Bever, T.G. 29 Bilodeau, E.A. 32 Bischof, W. 72, 149 B o o t h , A.D. 102 Bousfield, W.A. 19 Bower, G.H. 270 Boyd, I. 26 Bransford, J . D . 140 Bartley, P. 109 Brinkman, H . 301 B r o w n , J . 17 Brown, R.W. 118 Bühler, K. 238 Celce-Murcia, M. 8 4 Cercone, R. 188 Chafe, H.P. 245 Clark, H.H. 28 C h a m i a k , E. 82, 177, 181 ff., 216 f., 226,293 C h o m s k y , N. 7 4 , 8 0 , 1 0 2 C o h e n , B.A. 19 C o h e n , H.D. 18 C o h e n , P.H. 177 Collins, A.M. 32, 55 f., 58, 60, 63, 72 C o n r a d , C. 62, 68 C o r b e t t , A. 64
D e e s e . J . 24 ff., 32 f. Deutsch, W. 2 8 1 , 2 8 6 Dewar, H. 109 Dixon, N.F. 17 Dornseiff, F. 298 Ebbinghaus, H. 34 E n g e l k a m p , J . 82 Ervin, S.M. 22 Fahlman, S.E. 216 Feigenbaum, E.A. 191 Fillenbaum, S. 26 ff., 32, 65 f. Fillmore, C.J. 75 ff., 84, 291, 299 F o d o r , J . A . 40, 144 F o p p a , N. 8, 34, 245 Franks, J . J . 140 Freedman, J . L . 56 f. Garrod, S. 140 Garskopf, B.E. 26 Glass, A.L. 72 Goldman, N. 68, 142, 155 ff., 179, 235 f., 307 Gresillon, A. 87 Grice, H.P. 242 Groner, R. 9 Guiliano, K.E. 30, 32 G u z m a n , A. 171 Halliday, M.A.K. 281 Harris, Z. 30 Hayes, P. 92, 149 Hays, D.G. 102 Hemphill, L. 80 Henley, N.M. 28 f., 32 Henne, H. 246 H e r r m a n n , T. 140, 2 8 1 286 Hewitt, C. 175 H o f m a n n , K.-D. 246 Holyoak, K.J. 72 H ö r m a n n , H. 140 H o r s t k o t t e , G. 29 H o u s t o n , J.P. 26
325
Personenverzeichnis H u m b o l d t , W. v. 119 J a m e s , C. 141 Jenkins, J . J . 22 f. J o h n s o n , M.K. 140 J o h n s o n , S.C. 27 J u n g , C.G. 20 ff. Kallmeyer, W. 240 Kant, I. 192 K a t z , J . J . 40, 144 Keller, B. 9 Kent, G.H. 2 3 Kiefer, Ε. 282 King, M. 92, 3 0 3 Kintsch, W. 8 3 , 140, 198 Kiss, G.R. 26 Knapp, M. 65 f. Kuno, S. 112 L a k o f f , G. 64 f., 68 f., 120, 28 Landauer, T.K. 56 f., 60 Lazarus, R.S. 17 Lehnert, W. 180 Lenneberg, E.H. 118 Lindsay, P.H. 85 f., 266 Livant, W.P. 26 L u , J . H . T . 282 MacKay, D.G. 29 Mandler, G. 19 Marbe, K. 2 3 Masling, M. 140 Mayer, A. 22 Mc Calla, G.I. 8 3 McCarthy,J. 92 McCleary, R.A. 17 McCoy, A.M.B.C. 81 Menz.C. 9 Meseck, O.R. 2 3 Meyer, D.E. 57 ff., 69 Mill,J. 3 3 Miller, G.A. 16, 28, 67 f., 128, 14 Millward, R.B. 64 Mink, W.D. 22 Minsky, M. 39, 174 ff., 183, 26 Neisser, U. 4, 11 Newell, A. 50 Nilsen, D.L.F. 8 0 ff. Nilsson, N J . 4 8
Norman, D.A. 15, 18, 85 f., 192, 266, 271 O'Dell, C. 72 Oettinger, A.G. 112 Olson, D.R. 2 8 1 , 2 8 6 Orth, J . 22 Osgood, C.E. 281 Palermo, D.S. 23 Palme,J. 83 Paivio, A. 2 7 0 Perrault, C.R. 177 Peterson, L . R . 1 7 , 3 5 Peterson, M.J. 1 7 , 3 5 Pohl, U. 141 Pollio, H.R. 26 Posner, R. 88, 2 4 3 f., 280 Postman, L. 73 Prieto, L. 285 f. Quillian, M.R. 32, 36, 39 ff., 50 f., 53, 55 f., 5 8 , 60, 63, 65, 68, 72, 74, 82, 84 R a p o p o r t , A. 26 ff., 32 Rehbock, H. 246 Reich, C.M. 38 Reichmann, R. 2 6 1 Reitman, J . S . 15, 191 Rice, C. 64 Ricklin, F. 20 ff. Rieger, J . I . 142, 165 ff., 176 f., 192 Riesbeck, C.K. 141 ff., 179 Rips, L.I. 69 ff. Rosanoff, A.J. 2 3 R o s c h . E . 69 Rumelhart, D.E. 15, 85 f., 192, 245, 266 Rüssel, W.A. 22 f. Sachs, J . D . S . 140 Sandewall, E. 8 3 Schaeffer, B. 70 Schänk, G. 246 Schänk, R.C. 118, 124 f., 142, 165, 177 f., 182 f., 188, 192, 198 f., 239 Schegloff, E. 249 Schmidt, C.F. 177 Schoenthal, G. 246
326 Schubert, L. 188 Schubert, L.K. 8 3 Scragg, G.W. 2 6 6 Searle, I.R. 237 ff. Selfridge, J . 141 S h a f t o , M. 82 Shiffrin, R.M. 15 ff. Shoben, E.I. 69 ff. Simmons, R.F. 36, 39, 74, 8 3 ff., 89, 113 f., 116, 118, 123, 156, 163 ff., 176, 198, 235 f., 266, 279, 307 Simon, H.A. 5 0 , 2 7 0 Slocum, J . 1 1 4 , 1 1 6 , 1 5 6 , 1 6 3 Smith, E.E. 69 ff. Solomon, S.K. 140 Sperling, G. 16 Sternberg, S. 5 3 ff. Tesler, L. 142 T h o m p s o n , J . 141 T h o m d y k e , P.W. 245 T h o m e , J . P . 109 T h u m b , Α. 2 3 Trabasso, Τ. 140 Tulving, Ε. 12, 192 Turing, A.M. 6 U n d e r w o o d , B.J. 1 7 , 3 4 , 6 6
Personenverzeichnis Wallace, A.F.C. 27 Wallace, R . 70 Walmsley,J.B. 77 Waugh, N.C. 15 Weber, S. 142 Weisgerber, L. 301 Weissmann, C. 92 Weizenbaum, J . 1 0 , 3 9 Wertheimer, M. 170 Wettler, M. 30, 32, 35, 82, 108, 141, 149 Whitmarsh, G.A. 19 Whorf, B.L. 119 Wickelgren, W.A. 15, 18 Wickens, D.D. 35 Wilkins, A J . 62 ff., 68 Wilks, Y 198 Winogard, T. 286 f., 294 Winston, P.H. 170 ff., 263, 266 Wittgenstein, L. 238 Woods, W.A. 88, 109, 115, 142 Wundt, W. 20 Yngwe, V.H. 246 Zampolli, A. 102 Zemb, J.-M. 2 8 1 Zollinger, H. 118
SACHVERZEICHNIS
action-aider 125 Additivität der Reaktionszeiten 54 Agentiv 74 f., 77, 81, 84, 138 Aehnlichkeitsmatrix 27 Aehnlichkeitsnetzwerk 24 ff., 31 ai-Verbindung 201 f., 216 A k t a n t 75, 185 Aktionshelfer 125 Aktionsschema 185 Aktivierung 191 f., 201, 211, 216 Allgemeinbegriff 42 analoges Netzwerk 30 AND 9 6 Anfangsgespräche s. Gesprächsbeginn A n t o n y m 66 Arbeitsgedächtnis 191 A r g u m e n t 75 A S E T 165 f., 169 Assoziationsnormen 23 Assoziationsstärke 23 Assoziationstheorie 8, 33 ff., 63 Assoziationsversuch 19 ff. assoziative Aehnlichkeit 24 f. assoziative A n t w o r t 20 assoziative Kette 26 assoziatives Netzwerk 24 ff., 36 assoziative S t r u k t u r 12 ff. asymetrische Relation 277 A t o m 92 f. A T R A N S 126 A T T E N D 127 Aussage 7 5 , 2 7 9 , 2 8 1 Aussagerelation 88 äussere Assoziation 20 Aeusserungswürdigkeit 249 f., 271, 274 automatische Satzanalyse 102, 104 automatische Uebersetzung 102 BABEL 155 backtracking 106 f. Bedeutungsgleichheit 121 Begriffsbildung 172
Begründung 134, 202, 230 ff. Benefaktiv 76, 299 Bestätigung 254 Betätigungssatz 301 Bewegungsverb 28, 67 bildhaftes Gedächtnis 270 f. blinde Suche 51 BONDVALUE 166 bottom-up-Analyse 104 ff. breadth-first-Suche 46 ff. CAR 9 3 ff. charakteristisches Merkmal 69 Charakterizität 69 CDR 9 4 clustering 68 clustering-Technik 27 Computersimulation 6 ff. conceptual-dependency-Theorie 124 f. COND 96 conjoint frequency 62 CONS 95 Darbietung des Lernmaterials 13 Dativ 76, 8 1 f., 295 ff. definitorisches Merkmal 64, 6 8 depth-first-Suche 46 ff., 107 deterministische Voraussage 2 4 6 Dialog 235 Direktiv-Kasus 125 f. Distributionsanalyse 30 Doppelhandlung 299, 302 Dreiervergleich 28 d u m m y - K n o t e n 208 dynamischer Zustand 1 8 8 , 1 9 8 E i n b e t t u n g 100 einschränkende Adverbien 6 4 E L I Z A 39 elliptischer Satz 281 endlose Schlaufe 51 Entscheidungsbaum 156, 159f., 163 episodisches Gedächtnis 1 2 , 1 9 1 ff., 291
328 EQUAL 95 Ergänzung 255 Ergänzungsrahmen 163 Ermöglichung 133 Erregungsübertragung 18 Exemplizifierung 261 externale Assoziation 20 Evaluation 9 3 f. EXPEL 127 extensionale Bedeutung 87 Faktiv 76 false alarm 14 Farbbenennung 118 Fokus 163 Folge-Verbindung 2 0 5 , 2 1 0 Form-Test 52 Fragen-Antwort-System 36 ff. frame 174 ff., 181 ff., 2 3 6 , 2 6 6 frame-Theorie 174 ff. freier Dativ 296 freie R e p r o d u k t i o n 14 Füllerwörter 14, 65 Gedächtnisökonomie 4 3 Gedächtnisspur 17 Gegen-Agens 77 gemeinsames Wissen 292 ff. generative Transformationsgrammatik 74 f., 102 ff., 282 Generierung 37, 45, 78 f., 8 9 , 102, 104, 114 ff., 154 ff., 235, 279 ff., 306 generisches Merkmal 72 GENSYM 1 0 1 , 1 1 3 Gesprächsbeginn 137, 247 ff. Gesprächsgegenstand 2 5 3 gesprächsorientierte Aeusserung 2 5 4 Gesprächsrepertoir 285 Gesprächssituation 236 Gesprächswelt 285 Gesuch 143 Gesuchsliste 143 ff. Gestaltspsychologie 4, 171 G E T 100 gerichteter Graph 107 GRASP 127 Handlung 124, 187 ff. Handlungsframe 175 Handlungssatz 301
Sachverzeichnis Hauptresultat 185 hedge 6 4 Hörermodell 294 hypothetisches Konstrukt 12 Identitätssatz 301 ikonischer Speicher 16 illokutiver Akt 237 f., 241 illokutives Verb 237, 239 Individualbegriff 42 Inferenzprozess 165 ff., 198 f., 207 ff., 287 ff. Inferenzregel 83, 182 f., 207 ff., 226 ff. Informationsgespräch 245 INGEST 127 Inhalt der Aussage 236 inhaltliche Basis 236 inhaltsorientierte Aeusserung 2 5 4 Initiierung 134 innere Assoziation 20 I n s t r u m e n t 75, 81, 84, 128 instrumenteile Handlung 128 f., 163, 305 f. instrumentelles Verb 297 internale Assoziation 20 Intentionalität 304 ff. Intersektionskoeffizient 2 4 f. Intrusion 14 Kasusgrammatik 74 ff., 2 9 1 Kasusrahmen 77 f. kategorisierte Wortliste 19 Kausalverbindung 131 f. Kausativ 8 1 Klassengrösse 57 kludge 9 1 Knoten 31, 40, 84 f., 165 K n o t e n s t r u k t u r 85 Komitativ 7 k o m m e n t i e r t e r Sprechakt 240 K o n j u n k t i o n s k n o t e n 274 K o n t a k t w o r t 254, 258 Kontext 2 3 6 , 2 4 2 Kontextabhängigkeit 109 Kontiguität 3 3 Kontingenzregel 2 5 3 ff. kontinuierliches Wiedererkennen 65 Konzeptualisation 124 ff., 165 konzeptuelle Hauptverbindung 125 Korpus 1 8 5 , 1 9 6 , 2 2 1
329
Sachverzeichnis künstliche Intelligenz 6 ff., 9 1 Kurzzeitgedächtnis 15 ff. Langzeitgedächtnis 15 ff. Latenzzeit 32 Lernexperiment 13 ff. Lernliste 14 Lexem 162 lexikalische Dekomposition 118 ff., 196 f f . lexikalisches Gedächtnis 192 LISP 90, 92 ff., 109, 142, 166 Liste 92 f. literarische Texte 245 Lokativ 76 lokutiver A k t 237 Marburger Protokolle 245 f. MARGIE 142 Markierung 66, 2 8 0 MBUILD 127 mehrdeutige Verben 149 Mehrdeutigkeit 29, 106, 113, 142 memorieren 16 miss 14 MITRE-Parser 113 Modalität 75 Modus 75 Morphem 162 MOVE 127 MTRANS 127 multidimensionale Skalierung 71 Nachfragen 255 nhd-Verbindung 187, 193, 197, 213, 215 nhf-Verbindung 2 0 0 f. nicht-sprachliche Kommunikation 245 nicht-terminales Symbol 103, 105 NIL 95 Nominalisation 164 Nominalphrase 103, 279 ff. Normalwert 272 NULL 9 6 Oberbegriffsrelation 4 3 Oberbegriffssatz 55 ff. Oberflächenkasus 44, 78 ff., 8 9 Objektiv-Kasus 76, 81, 8 3 f., 125 f. Organon-Modell 238
Paarlernen 13 Paarvergleich 28 paradigmatische Assoziation 22 parallele Suche 54 Paraphrase 6 8 , 8 7 , 140, 155, 163 Paraphrasierungsregel 89 ff., 122 parsing 102 Patient-Kasus 81 pattern-mach 56 perlokutiver Akt 137 picture-aider 125 picture-producer 124 f. plane 4 3 pointer 4 0 Positionsnotation 82 f. präexperimentelle E r f a h r u n g 34 f. pragmatische Satzbasis 236, 279 pragmatische Faktoren 237, 241, 244, 280, 2 8 4 Präposition 78 f. Prärequisit 221, 303 f. Präsupposition 166, 236 f., 279, 284 Primärknoten 42, 192 primitive Aktion 68, 125 ff., 138, 188, 198 Prinzip der Kooperation 242 proaktive Hemmung 3 4 f. Programmiersprache 7, 92 Pronominalisierung 8 0 P R O P E L 126, 169 property-list 101 Proposition 75, 185, 279, 2 8 1 propositionales Gedächtnis 270 f. Prüfliste 14 Pseudo-Englisch 38 P T R A N S 126 push-down-Liste 50, 100 PUT 100 Q u a l i f i k a t i o n 84 QUOTE 94 Reaktionszeitexperiment 5 3 ff. R e d u n d a n z 246 Reflexivpronomen 305 R e k o n s t r u k t i o n 141 Rekursivität 1 0 0 , 2 1 3 Relativsatz 87 request 143 resultative Verben 297 Resultierung 133
330 Retusche 193 ff., 249 Retuschenergänzung 248, 262 ff. Retuschensuche 248 f. Retuschenwechsel 256 f. Rezept 185 ff., 248 f., 263 Rezeptnennung 193, 195 ff. Rezipient-Kasus 125 f. Reziprozität 85 Rollenliste 195 SAM 178 Sapir-Whorf'sche Hypothese 119, 3 0 1 Satzanalyse 37, 91, 142 ff., 226 Satzausgangssymbol 103 Satzbasis 236, 2 4 4 Satzbauplan 3 0 1 Satzbildung s. Generierung Satzverfikation 55 ff., 69, 72 Schema 175 Schlüsselwort 39, 179, 184, 2 6 1 Sekundärknoten 4 2 , 85, 192 self-paced 13 semantische Markierung 4 0 semantische Repräsentation 91 semantisches Gedächtnis 12 f., 192 semantisches Merkmal 63 ff., 68 f., 72, 8 1 semantisches Netzwerk 36 ff., 74, 83, 118, 122, 266 SET 95 SETQ 95 SHRDLU 286 simultane Darbietung 13 Sinnstruktur 141 Skript 177 ff. Sortierungsversuch 68 SPEAK 127 Speicherung von Sätzen 140 Sprechakt 177, 237 ff., 245 Spezifikation 2 5 7 , 2 6 1 S t e m m a 104 strukturelle Relation 88 S u b f r a m e 176, 184 subjektive Aehnlichkeit 26, 29, 32, 7 1 S u b t r a k t i o n s m e t h o d e 55 Suchbaum 49 Suchprozess 4 5 ff., 5 1 Suchstrategie 4 6 ff. Sukzession von Aeusserungen 2 7 4 f. sukzessive Darbietung 13 Synapse 18
S achverzeichnis Synonym 65, 163 syntagmatische Assoziation 22 syntaktische Tiefe 246 Syntaxnetz 156, 162 S y s t e m f u n k t i o n 97 tabuisierte Wörter 17 Teachable Language C o m p r e h e n d e r 5 1 ff. Tempuswechsel 262 terminales Symbol 103 Terminalknoten 174 f. THEME 8 4 f. Tiefenkasus 75, 77 ff., 89, 113 token 42 ff., 8 5 , 192 top-down-Analyse 105 ff. Topikalisation 279 ff. Transformation 80 type 42 ff., 85, 192 type-token-Ratio 246 Uebergangsnetzwerk 107 ff., 115 Ultrakurzzeitgedächtnis 16 ungrammatische Sätze 151 Universalität 120 univers du discours indiquant 285 univers du discours indique 285 unmarkierte Satzordnung 279 Ursache-Verbindung 2 0 5 , 2 1 0 Ursprung 7 7 , 8 1 , 8 4 Urteilssatz 301 Valenz 162 Verallgemeinerung 2 5 7 , 2 6 1 Verbalphrase 103 Verben des Besitzwechsels 82, 298 ff., 306 Verben des Einnehmens 159 ff. Verbundenheit 62 Verfügung s. Zugehörigkeit Vergessensintervall 14 Verneinung 255 Voraussetzung 185 f. Vorstellungen 2 7 0 f. Vorstellungserzeuger 124 f. Vorstellungshelfer 125 während-Verbindung 206, 225 Wahrnehmung 170, 174 Wahrnehmungsabwehr 17 wechselseitiges Ergänzen 256, 262
331
Sachverzeichnis weisst-du-noch-Dialoge 248, 256 wenn-dann-Verbindung 179 f. Wiedererkennen 14, 53, 65, 140 Wiederholungskette 34 Wissen des Gesprächspartners 236 Wortsemantik 239, 2 4 4 Zeiger 4 2
Ziel 7 7 , 8 1 Zirkularität 40 Zugehörigkeit 186, 302 ff. Zustand 125, 129 f., 187 ff. Zustandsänderung 129 f. Zustandsbeschreibung 136, 181 Zustandskategorie 190 Zwischenzustand 185 f.
GRUNDLAGEN DER KOMMUNIKATION FOUNDATIONS OF COMMUNICATION
Konsequenzen kritischer Wissenschaftstheorie Herausgegeben von Christoph Hubig u n d Wolfert von Rahden Oktav. VIII, 398 Seiten. 1978. Kartoniert DM 3 4 - (de Gruyter Studienbuch)
Franz von Kutschera
Einführung in die intensionale Semantik Oktav. XII, 187 Seiten. 1976. Kartoniert DM 2 8 , - (de Gruyter Studienbuch)
David K. Lewis
Konventionen Eine sprachphilosophische Abhandlung Aus dem Englischen übersetzt von Roland Posner und Detlef Wenzel Oktav. XIV, 2 2 4 Seiten. 1975. Kartoniert DM 2 8 , - (de Gruyter Studienbuch)
Georg Meggle
Grundbegriffe der Kommunikation Oktav. Ca. 256 Seiten, 1980. Kartoniert ca. DM 3 2 , - (de Gruyter Studienbuch)
Georg Henrik von Wright
Handlung, Norm und Intention Untersuchungen zur deontischen Logik Aus dem Englischen übersetzt von Detlef Wenzel Herausgegeben und eingeleitet von Hans Poser Oktav. XXIX, 158 Seiten. 1977. Kartoniert DM 2 8 , - (de Gruyter Studienbuch) Preisänderungen vorbehalten
Walter de Gruyter
W DE
G
Berlin · New York
GRUNDLAGEN DER KOMMUNIKATION FOUNDATIONS OF COMMUNICATION
Sprachwandel Reader zur diachronischen Sprachwissenschaft Herausgegeben und eingeleitet von Dieter Cherubim Oktav. X, 368 Seiten. 1975. Kartoniert DM 2 8 , - (de Gruyter Studienbuch)
Max J. Cresswell
Die Sprachen der Logik und die Logik der Sprache Aus dem Englischen übersetzt von Roland Posner und Bernd Wiese Oktav. XII, 4 3 1 Seiten. 1979. Kartoniert DM 3 6 , - (de Gruyter Studienbuch)
Maschinelle Sprachanalyse Beiträge zur automatischen Sprachbearbeitung I Herausgegeben und eingeleitet von Peter Eisenberg Oktav. 272 Seiten. 1976. Kartoniert DM 3 2 , - (de Gruyter Studienbuch)
Semantik und künstliche Intelligenz Beiträge zur automatischen Sprachbearbeitung II Herausgegeben und eingeleitet von Peter Eisenberg Oktav. VIII, 244 Seiten. 197 7. Kartoniert DM 3 2 , - (de Gruyter Studienbuch)
Carl G. Hempel
Aspekte wissenschaftlicher Erklärung Aus dem Englischen übersetzt von Woltgang Lenzen Oktav. XII, 240 Seiten. 1977. Kartoniert DM 2 8 , - (de Gruyter Studienbuch)
Preisänderungen vorbehalten
Walter de Gruyter
w DE
G
Berlin · N e w York