243 99 5MB
German Pages 112 [113] Year 1971
DEUTSCHE AKADEMIE DER WISSENSCHAFTEN ZU B E R L I N INSTITUT FÜR ORIENTFORSCHUNG V E R Ö F F E N T L I C H U N G Nr. 73
PROBLEME DER LEXIKOGRAPHIE
A K A D E M I E - V E R LA G • 19 7 0
BERLIN
Protokollband der Sektion I I der Tagung des Instituts für Orientforschung der Deutschen Akademie der Wissenschaften zu Berlin anläßlich seines zwanzigjährigen Bestehens vom 23. —25. Oktober 1967 Herausgegeben von Kaspar Riemschneider
Erschienen im Akademie-Verlag GmbH, 108 Berlin, Leipziger Straße 3—4 Copyright 1970 by Akademie-Verlag GmbH Lizenznummer: 202 • 100/79/70 Ofsetdruck und buchbinderinche Weiterverarbeitung: V E B Druckerei „Tboma* Müntzer*4, 582 Bad Langenealxa Beetellnummer: 2013/73 • ES 7L + 7 B • EDV 751 760 5 16,-
I n h a l t s v e r z e i c h n i s
Vorbemerkung
5
Ladislav Z g u s t a Die Lexikographie und die Sprachwissenschaft
7
Erich U a t e r Hensohliohes Denken und maschinelles Systematisieren in der Lexikographie
23
Gottfried S p i e s Probleme der automatischen Analyse chinesischer Texte fUr lexikalische Projekte
31
Klaus
39
K a d e n t das ohinesisohe Radikalsystem noch aktuell?
Oldfioh S v a r n y Grammatikalische und phonetische Anzeigen im chinesischen Wörterbuch
53
Dieter G a s d e Zum Problem der Getrennt- und Zusammenschreibung lexikalischer Einheiten der modernen chinesischen•Sprache
59
Margot B i l s l g Uber den, Wechsel vom Passivischen zum Aktivisohen bei den mit huä zusammengesetzten perfektiven Partizipien im modernen Literaturhindi
67
Hildegard H ö f t m a n n Verfahrensweise und Methoden bei der Aufnahme schriftlich nicht fixierter Sprachen
75
Zygmunt P r a j z y n g i e r Semantic Value of the Awutü Noun Affixes
83
Rajmund 0 h 1 y Zum Problem der wissenschaftlichen Terminologie im Swahili
93
Gudrun E n g e l m a n n / Renate R a c k e b r a n d t Zu einigen Problemen bei der Arbeit an einem DeutschSuaheli -Wärt erbuch
101
V o r b e m e r k u n g
Im Arbeitsprogramm des Instituts für Orientforsohung nahmen und nehmen lexikographische Unternehmungen einen wichtigen Platz ein. Das Ägyptische Wärterbuch liegt seit 1963 rollständig vor, an einem Thesaurus des Hethitisohen wird seit Tielen Jahren gearbeitet. Doch auoh die lexikalische Bearbeitung moderner Sprachen gehört zum. Programm des Instituts; ein Chinesisch-Deutsches Wörterbuch, ein Japanisch-Deutsches Zeiohenlexikon und ein Wörterbuch Deutsch-Suaheli «erden vorbereitet. Daher war die II. Sektion der Jubiläumstagung zum zwanzigjährigen Bestehen des Instituts fUr Orientforschung vom 23. bis 25. Oktober 1967 "Problemen der Lexikographie" gewidmet. Die auf den Sitzungen dieser Sektion vorgetragenen Referate werden hiermit vorgelegt. Ausgenommen wurden nur diejenigen, bei denen sich die Autoren eine Veröffentlichung an anderer Stelle vorbehalten hatten. Der Herausgeber dankt Frau Anita Ulaszewski für ihre gewissenhafte Mitwirkung bei der redaktionellen Bearbeitung des Bandes.
Kaspar K. Riemschneider
L a 4 i i 1 IT
Z g u s t a
Dia Lexikographie und die Sprachwissenschaft
Der Titel dieses Beitrages könnte zu der Annahme verleiten, daß wir die zwei Begriffe in einen Gegensatz zueinander stellen, daB wir etwa die Lexikographie als ein Fach auffassen, das sich jenseits der Sprachwissenschaft befindet. Das ist aber mit diesem Titel nicht gemeint. Nach unserer Auffassung ist die Lexikographie ein sprachwissenschaftliches Fach, das in dem breiten Rahmen dieser Disziplin eine gewisse Selbständigkeit hat und das auch die •ersehiedensten Anknüpfungen zu anderen Fächern aufrechterhalten muß, wenn es erfolgreich betrieben werden soll. Da es üblich ist, einen Beitrag mit einem Zitat zu eröffnen, und zwar womöglich mit einem griechischen, werden wir sagen, daB es sich um das OX%JUX MOCÖ' SXov MOIC tiepoc handelt. Vir wollen zuerst in groben Umrissen die verschiedenen sprachwissenschaftlichen Richtungen verfolgen und die Frage untersuchen, inwiefern sioh die Veränderungen in der sprachwissenschaftlichen Theorie in der Lexikographie ausgewirkt haben. Dazu möchte ich noch eine Bemerkung vorausschicken. Diese Darlegungen werden teilweise einen historischen Charakter haben, es soll aber selbstverständlich sein, daß wir uns hier nioht um eine Geschichte der Lexikographie bemühen, sondern daß wir nur einige Werke aus der großen Anzahl der Wörterltfloher auswählen, die wir als typisch für eine Richtung oder Einstellung betrachten. Weil die Lexikographie aus Gründen, auf die wir später eingehen werden, eine verhältnismäßig konservative Wissenschaft ist, in der die Entwicklungen ziemlich langsam vor sioh gehen, müssen wir den Anfang unserer Bemerkungen zurüokverlegen in das 17. bzw. in das 16. Jh. Seit den ersten Anfängen war die Lexikographie mit der Erklärung der Bedeutung der Wörter einer anderen Spraohe verbunden. Obzwar es Ausnahmen gibt, von denen wir später eine erwähnen werden, kann man doch behaupten, daß die Mehrheit der uralten und alten Glossenverzeichnisse, Glossare und sonstiger Wörterverzeichnisse dem Zweck gewidmet war, entweder eine andere Sprache lexikalisch
8
L. Zgusta
zu erfassen, oder unklare Wörter der eigenen Spraohe, etwa dialektisohe oder sakrale, zu erklären. Diese Tendenzen entwickeln sieh seit Jahrhunderten zu Wörterbüohern wie wir sie heute kennen. Wir können feststellen, daß in der Epoche, die wir als Anfang unserer Beobachtungen gewählt haben, diese zweisprachigen Wörterbücher schon einen Höhepunkt erreicht haben. Es handelt sich da unseres Erachtens um die lexikographisehen Werke des Robert Estienne (lateinisch Stephanus) und seines Sohnes Henri Estienne (Stephanus). Der ältere Stephanus hat 1931 seinen Thesaurus Linguae Latinae herausgegeben, der dann in verschiedenen Auflagen Uber zwei Jahrhunderte in Gebrauch war, bis 1771 Forcellini sein Lexlcon totlus latinitatis herausgab. Noch größer ist wahrscheinlich die Leistung des jüngeren Stephanus. Ohne jede größere Vorarbeit auf diesem Gebiet hat er 1573 seinen Thesaurus graeoae linguae herausgegeben. Das Werk besitzt noch heute einen sehr großen Wert. 1831 wurde dieses Wörterbuoh nämlich in einer Neubearbeitung herausgegeben. Diese Auflage wird noch heute von jedem Gratfzisten benutzt; vor einigen Jahren (1954) erschien ein unveränderter Neudruck dieses mehrbändigen Werkes. Obwohl das lexikalische Material der griechischen Sprache seit Stephanus durch neue Inschriften und Papyri bereichert wurde, ist die Art und Weise, in der die griechischen Wörter in diesem Thesaurus bearbeitet wurden, so reichhaltig, scharfsinnig und umfassend, daß man auf die Benutzung dieses Werkes nicht verzichten kann. Wenn alse das ursprüngliche Werk, zwar in einer Neubearbeitung, aber dooh im Grunde nach den Prinzipien und naoh der Arbeitsweise des ursprünglichen Herausgebers, heute in das 5. Jh. seiner brauchbaren Existenz geht, kann man wahrscheinlich mit Recht behaupten, daß es sioh um einen Höhepunkt auf dem Gebiete der zweisprachigen Lexikographie philologischen Schlages handeln muß. Naoh diesem Höhepunkt beginnt sich aber schon die Zeit zu verändern. Man widmet sioh nicht mehr der Pflege der lateinischen und der griechischen Sprache allein, sondern die einzelnen Nationalspraohen in Europa werden immer stärker herangezogen und gepflegt. Dieses neue Interesse findet dann auch in der Lexikographie seinen Ausdruck. Wenn man sieh nur um die wichtigsten Werke kümmert, kann man sagen, daß an der Spitze dieser neuen lexikographisohen Richtung das italienische Vooabolarlo degli Acoademici della Orusoa steht. Es handelt sich um ein Wörterbuoh, das die florentinisohe Akademie im Jahre 1612 herausgab und das dann in fünf weiteren Auf-
L. Zgusta
9
lagen eraobien. Vir haben bier ein der eigenen Nationalspräche gewidmete« Wörterbuch ror uns. in dieser Hinsicht handelt es sieh ÜB ein Werk, das sohon der neuen Zeit gehört, der Zeit der Nationalspraohen. Auf der anderen Seite gehört aber bei aller Ehrwürdiglceit und bei allem Erfolg dieses Werkes die Art und Weise, in der der italienische Wortschatz dargestellt wird, doch teilweise in die Gedankenwelt, in der man die alten Spraohen behandelte. So wird s.B. die Bedeutung der italienischen Wörter in diesem Wörterbuch, und zwar nioht nur in der 1. Auflage, sondern auch in der 4. Auflage 1729/38 duroh die Angabe des lateinischen und griechischen Äquivalentes beschrieben. Die Vorstellung geht also dahin, daß der italienische Benutzer durch die Angabe des betreffenden lateinischen und griechischen Wortes mehr Uber die Bedeutung des betreffenden italienischen Ausdruckes erführt. Aber auch in der Trage der Aufnahme des Wortschatzes mdssen wir feststellen, daß das Wörterbuch den Sprachgebrauch der treoentisti fiorentini widerspiegelt, der anderthalb Jahrhunderte vor dem Wörterbuch selbst lag. Naoh den Prinzipien des Wörterbuchs werden Wörter der anderen italienischen Autoren, etwa der venezianischen, nur dann angeführt, wenn sie auch in der Tosoana gebräuchlich waren. Diese Bemerkungen sollen nioht als Vorwürfe gegen das Wörterbuoh selbst aufgefaßt werden. Die Entwicklung der italienischen Schriftsprache auf tosoanischer Grundlage machte eine solche Methode unumgänglioh. Für die Entwicklung der Theorie der Lexikographie bedeutet das aber, daß, obwohl dieses Wörterbuch sohon einer neuen Welt gehört, es doch nooh keine neue methodische Ära eröffnet. Die neue Ära, die wir im Sinne haben, ist die Epoche der Sprachwissenschaft, die wir als 1egisch-normstir bezeichnen möchten. Also das 17. Jh., das Jahrhundert des französischen Rationalismus, das Jahrhundert der Gramnaire gfcnfcrale et ralaonnfre von Port Royale (1600). Man hat sioh vor allem bemüht, den grammatischen Bau der Sprache logisoh zu erklären und als ganz logisoh darzustellen. Auf dem Gebiete des Wortschatzes versuchte man, die Art und Weise, in der die Wörter gebrauoht werden, zu normieren, eine Regelmäßigkeit einzuführen und Absonderliches auszumerzen, wenn es zu einem rationellen Zwecke nioht nützlich war. Wir wollen nioht sagen, daß Bemühungen dieser Art das erste Hai im 17. Jh. auftauchten. Letzten Bades kennen wir Ja den Streit der Anemalisten und der Analogieteil sohon in der alten griechischen und römischen Sprachwissenschaft, in dem die Analogisten sioh bemühten, jede spraohliohe Tatsaohe
10
L. Zgusta
als rationell und logisch darzustellen und absonderliche Ausnahmen als unrichtig su brandmarken. Auf dem Gebiet des Wortschatzes ist sogar das Fragment einer sprachwissenschaftlichen Schrift erhalten, die von Gajus Julius Caesar stammt, der gleichzeitig erfolgreicher Feldherr und erfolgreicher Sprachwissenschaftler war. Caesar sagt in diesem Fragment: "tamqoam scopulum sie fugias inauditum atque insolens verbum", also "einem unerhörten und ungebräuchlichen Wort sollst du als einer Klippe ausweichen". Die stilistisch-puristische Tendenz dieser analogistisohen Auffassung ist ganz klar. Im 17. Jh. handelt es sieh aber um etwas anderes. Man wollte nicht nur dem guten Stil dienen, sondern man wollte die Spraohe als Ganzes, also auoh den Wortschatz rationell bewältigen und normieren, so daB sie von allen Sprechern auf dieselbe Art und Weise benutzt wird. An der Spitze dieser Bemühungen steht zweifellos das Wörterbuch, das gleichzeitig als ein Höhepunkt dieser Gattung gelten muß, nämlich das Dictionnaire de 1'Académie française. Die französische Akademie wurde 1635 auf Veranlassung des Kardinals Riohelieu gegründet, und zwar ganz besonders zu dem Zwecke, dieses Wörterbuch zu schreiben. Die 1. Auflage erschien 1694, die 8. Auflage 1932. An einer weiteren Auflage wird zur Zeit gearbeitet. Was ist so neu in diesem Wörterbuch? Zuerst die Art der Darstellung. Das Stichwort wird hier duroh die lexikalische Definition erklärtj es folgen die Angabe der Synonyma und die Beispiele, die entweder die typische Gebrauchsweise des Wortes illustrieren oder die phraseologischen Hedewendungen erklären: Also ganz wie in einem Wörterbuch unserer Zeit. Dabei ist es vielleicht nicht ohne Interesse zu bemerken, ds8 dieses Wörterbuoh auoh in anderen Punkten den modernen einsprachigen Wörterbüchern sehr ähnlioh ist: So beklagen sioh z.B. die Herren Akademiker, daß es leichter ist, die Bedeutung eines technischen Ausdrucks wie Teleskop zu definieren als die Bedeutung eines allgemeinen Wertes wie Mensch, sie beklagen sich, daB sie nioht wissen, welche Wörter als rein faohlioh-spraohlioh aufzufassen sind und welche dem allgemeinen Wortschatz angehören - sie sagen also 1694 ungefähr dasselbe wie wir 1967. Es gibt aber andere moderne Aspekte bei diesem Wörterbuch, die viel wiohtiger sind. So z.B. der Bntschlufl der Akademie, in das Wörterbuch nur diejenigen Wörter aufzunehmen, die in ihrer Zeit in Gebrauch waren. Han hat zwar nioht Jedes veraltete Wort vermieden, aber man hat nur diejenigen aufgenommen, die auch von den Zeitgenossen gebraucht wurden, zugestandenermaßen als Archaismen, aber doch als synohron verkommende Wörter. Dieser Etat-
L. Zguata
11
Schluß, nur die zeitgenössische Sprache zu erfassen, Ist einer der folgenschwersten, weil er einen Bruoh mit der ganzen Tradition darstellt, die den Sinn des Wörterbuches darin sah, Altes, Fremdes, Unverständliches zu erklären, wogegen es hier gilt, das Übliche, das Normale, das Geläufige zu erfassen und zu normieren. Es scheint, da8 eine klare theoretische Fassung dieses Entschlusses eigentlich erst nach Jahrhunderten von dem Romanisten Leo 3Serba 1940 wiederholt und entwickelt wurde. Aber in noch einer Hinsicht ist dieses epochemachende Wörterbuch von der allergrößten Wichtigkeit: In der Vorrede zur 1. Auflage lesen wir eine theoretische Erörterung, in der es heifit, daß z.B. griechische und lateinische Wörterbücher aus Cioero oder aus Demosthenes usw. zitieren müssen, weil eben diese Autoren als die besten gelten, wogegen der Lexikograph selbst in einer Zeit lebt, in der die Sprache diesem Standard nicht entspricht. Von sich selbst behaupten aber die unsterblichen Herren der französischen Akademie, das ihr Wörterbuch in der besten Zeit der französischen Sprache ausgearbeitet wurde und daß sie deswegen keine Notwendigkeit sehen, Zitate von irgendeinem Auter anzuführen, weil einige der besten Schriftsteller in ihren Reihen gewesen seien, so daB man sich auf ihr Sprachgefühl und ihr SprachbewuBtsein (sentiment) verlassen dürfe. (Das Wörterbuoh wurde damals und wird auch heute gemeinsam von den Mitgliedern der Akademie bearbeitet, vor allem in Form von Diskussionen.) Diese Stellungnahme muB zwar als dem Geiste der Zeit entsprechend, aber in der Lexikographie als neu gelten. Zum ersten Mal stützt man sich da ganz prinzipiell auf die sprachliche Fähigkeit des Spreohers. Der Erfolg dieses Wörterbuches und seine Wirkung waren ganz ungeheuer. In der folgenden Zeit verbreiten sich dann die normierenden Tendenzen auf immer neue Sprachen. Von den hierher gehörenden Werken werden wir nur eins erwähnen, das englische Wörterbuoh von Samuel Johnson. Bezeichnenderweise hat man in England keine Akademie gegründet, sondern auf eine ganz praktische Art und Weise haben einige hervorragende Londoner Buchhändler ein Konsortium gebildet, das Johnson sieben Jahre finanziell unterstützt hat| in diesen sieben Jahren ist es Samuel Johnson mit seiner riesigen Arbeitskraft gelungen, die ungeheure Leistung zu vollbringen und das Wörterbuch zu schreiben, das 1755 erschien. Das Wörterbuoh "lebte" dann mehr als ein Jahrhundert und ist erst in der zweiten Hälfte des 19. Jh. durch das Oxford-Wörterbuoh ersetzt worden. Johnson, der allein arbeitete, war so vernünftig zu wissen, daß er sich nicht nur auf sein eigenes Sprachempfinden verlassen konnte. Er sammelte Kontexte
12
L. Zgusta
aus der Literatur. Sein Hauptverdienst ist aber nioht in dieser Richtung zu suchen, obwohl er hier sohon rein teohnisoh Ungeheures geleistet hat. Vor ihn stand das, was vor jedem Lexikographen einer nooh nioht ganz stabilisierten Sprache steht, ein Material, das unendliche Variationen, Schwankungen, Abweichungen, Unsicherheiten und Unklarheiten in sich birgt. Seine Aufgabe beschreibt Johnson alt den folgenden Worten: "Ohoice was to be made out of a boundless •ariety, without any established prinoiple ef seleotion". Wir haben da wieder ein eigentlich sehr modernes Prinzip vor uns, nämlich das Prinzip, das der normierende Sprachwissenschaftler üblicherweise keine neuen Wörter oder Regeln sohafft, sondern daß er eine Auswahl trifft, die er aus verschiedenen Gründen als die beste betrachtet, wobei er allerdings das nioht Gewählte keinesfalls direkt prohibitiv behandelt. Johnson sagt zwar, daß er keine festgelegten Prinzipien hatte. Er schildert aber, wie ihm das immer eingehendere Studium des vorhandenen Materials ermöglichte, die Regelmäßigkeiten, das übliche, das Normale zu erkennen, was er dann zum Auswahlprinzip machte. Diese Auswahl ist Johnson so gelungen, daß sein Wörterbuch, wie sohon gesagt, ein Jahrhundert als das wichtigste Wörterbuch der zeitgenössischen englischen Sprache galt und als ein Grundstein der Stabilisierung der englischen Sprache zu betrachten ist. Wir werden die anderen Wörterbücher dieser Art nioht weiter erörtern, weil damit diese Epoche der logisoh-normativen Sprachwissenschaft und ihrer Einwirkung auf die Lexikographie hinreichend charakterisiert ist. Wir sind auf diese Epoche so eingehend eingegangen, weil sie nicht zu den bekanntesten gehört, obwohl die Prinzipien der damaligen Lexikographie eigentlich sehr "modern" waren: Ähnliches hat vor kurzem Chomsky Uber die theoretische Auffassung der Spraohe festgestellt (N. Chomsky, Cartesian Linguistica, Cambridge 1966). Die folgenden Epochen werden wir viel kürzer skizzieren. Mit dem Ende des 18. Jh. kommen wir zu einer neuen Epoche in der Sprachwissenschaft, die wir als die historisch-vergleichende bezeichnen dürfen. Zuerst war das Interesse an fremden Sprachen eigentlich nur registrierend. Als Repräsentant dieser Art von Wörterbüchern kann das Wörterbuch des Peter Simon Pallas, Linguarum totius orbls vooabularia, genannt werden, das in St. Petersburg 17S6 ersohien. Es werden hier äquivalente Wörter der verschiedensten Sprachen der Welt zusammengestellt, allerdings selbstverständlich ohne einegründlichere Bearbeitung und tiefere Erfassung der ganzen Bedeutung und der Anwendungsart.
L. Zgueta
13
Es wäre überflüssig, die Begründung und den Aufbau der historischen Sprachwissenschaft im 19. Jb. zu schildern. Bs genügt zu sagen, daß diese spraohgesohichtliohe Hiohtung zu großartigen historischen lexikographischen Werken geführt hat. Als Repräsentanten der Gattung darf man wohl das monumentale, von Jakob und Wilhelm Grimm begonnene Deutsche WCrterbuch (1854 bis etwa 1954) nennen, in dem die Bedeutung und Geschichte der deutschen Wärter anhand zahlreicher und o.ft erschöpfender Belege dargestellt wird. Die vergleichende und historische Sprachwissenschaft kann man aber nur dann betreiben, wenn die Einzelsprachen auch rein beschreibend bearbeitet und so für die Sprachvergleichung und die historische Betrachtung der Sprache vorbereitet sind. Die Entwicklung führte also zu einer vertieften philologischen Bearbeitung des Wortschatzes der verschiedenen Sprachen. Als Repräsentant dieser Gattung der Wörterbücher kann das altindische Sanskrit-Worterbuoh von 0. Böhtlingk und R. Roth genannt werden, das 1855 - 1871 in St. Petersburg erschienen und bis heute in seiner Art unübertroffen ist. Den Höhepunkt hat diese philologische Bearbeitung der Sprache wahrscheinlich in dem Thesaurus linguae latlnae erreicht, dessen Publikation 1900 von mehreren deutschen Akademien in Angriff genommen wurde. Die sogenannten akademischen Wörterbücher mehrerer Sprachen gehören auch in diese Gattung, z.B. das Hew English Dlctlonary on Historioal Prlnciplee (1884 ff.) und sein Nachfolger, das Oxford Engl!ah Diotionary (1933 ff.). Das 19. Jh. war aber viel reichhaltiger, was die verschiedenen sprachwissenschaftlichen Richtungen angeht. Uan kann £a nicht nur z.B. die psychologisierende Richtung eines H. Steinthal oder eines Wundt nennen. Weit wichtiger ist Humboldts Sprachauffassung, die bis heute vor allem in der Weisgerberschen Betrachtungsweise fortgesetzt wird. Für die Lexikographie waren aber besonders diejenigen Richtungen von Bedeutung, die sowohl historisch waren, als auch die Saohbezogenheit des Wortes unterstrichen. Am Anfang dieser Bemühungen steht wohl die linguistische Palaeontologie von Adalbert Kuhn. Dieser Forscher hat sich bemüht, in die kulturellen und zivilisatorischen Bedingungen, in die Lebensweise und in das geographische Hilieu der vorhistorischen Indogermanen einzudringen, indem er durch Sprach- und Wortvergleichung das Gemeinsame der indogermanischen Einzelsprachen feststellte und daraus Rückschlüsse zog, welche Sachen und welche Begriffe den vorhistorischen Indogermanen bekannt und welche ihnen unbekannt waren. Wenn es z.B. in den indo-
14
L. Zgusta
germanischen Einzelspraohen kein gemeinsames Wort für das Meer gibt, zog Adalbert Kuhn den SohluB, daß das Heer den vorgeschichtlichen Indogermanen unbekannt war. Obwohl diese sprachwissenschaftliche Uethode kein einheitliches Wörterbuoh zustande gebracht hat, kann man doch z.B. in dem Reallexiken der indogermanischen Altertumskunde von 0. Schräder und A. Nehring (2. Aufl. 1917) viele Passagen finden, die in lezikographischer Hinsicht sehr bemerkenswert sind. In dieser Epoche war für die Lexikographie auch die sprachgeographische und dialektologische Forschung von großer Wichtigkeit. Männer wie Q. Wenker, Begründer des Deutschen Sprachatlasses, J. Sillleron, Bearbeiter des Atlas linguistique de la France (1902 - 1912) und K. Jaberg und J. Jud, die Bearbeiter des Italienischen Sprachatlasses (Sprach- und Sachatlas Italiens und der Südschwels, 1928) haben in diesen Werken ungeheures Wortmaterial nicht nur zusammengebracht, sondern auch geordnet und bearbeitet. Dadurch wurde die Kenntnis der Schichtung der Sprache sehr stark bereichert. Das dialektologische Interesse führte dann zu einer solchen Anzahl von SpezialWörterbüchern in den verschiedensten Sprachen, daß es eigentlich unmöglich ist, näher auf sie einzugehen. Mit dem Beginn des 20. Jh. kommen wir zu einem neuen Meilenstein in der Entwicklung der Sprachwissenschaft. Es handelt sich um die Betrachtungsweise, die man als strukturell-funktionell bezeichnen kann und deren Begründung mit dem Namen Ferdinand de Saussures verbunden ist. Die strukturell-funktionelle Sprachbetrachtung ist wieder weniger historisch eingestellt als die sprachvergleichende Epoche. Es handelt sioh um Prinzipien der Sprachbetrachtung, die so allgemein bekannt sind, daß wir hier nur kurz sagen dürfen, daß ihre Grundlage in der Auffassung der Sprache als eines kohärenten Zeichensystems besteht, in dem die Funktion der einzelnen Bestandteile, mitunter also auch von Wörtern, nicht nur duroh ihre Sachbezogenheit festzustellen und festzulegen ist, sondern auoh duroh ihre gegenseitige Abgrenzung in den Wechselwirkungen und im Wechselspiel des Systems. Die strukturell-funktionelle Sprachbetraehtung hat die Lexikographie in verschiedener Hinsicht bereichert. Man kann nicht sagen, daß mit dieser neuen Epoche in der Sprachwissenschaft auf einmal eine neue Art von Wörterbüchern entstehen würde. Das ist auch bei dem Charakter der Lexikographie unmöglich. Es handelt sich eher um teilweise Bereicherungen der Methode der Analyse und der Darstellung. Was das Studium der lexikalischen Bedeutung
It. Zgusta
15
direkt angeht, muß man in diesem Zusammenhang wahrscheinlich die von Jost Trier begründete Wortfeldforschung erwähnen, also das methodisoh bewußte Studium von semantisch zusammenhängenden und zusammengehörenden Wortgruppen, die als Ganzes untersucht werden und in denen das untersuchte Wort nicht isoliert betrachtet wird, sondern eben als Bestandteil eines Systems, in dem z.B. die Bedeutung der Synonyma und der semantisch zusammenhängenden Wörter in ihrer gegenseitigen Abgrenzung und Beeinflussung gesehen wird. Die Auswirkungen soloher und ähnlicher Auffassungen kann man in den verschiedensten Wörterbüchern sehen. Wenn man z.B. das Wörterbuch Der deutsche Wortschatz nach Sachgruppen von F. Dornselff (1934, 6. Aufl. 1965) mit dem ähnlichen synonymischen prästrukturellen englischen Werk von P.M. Roget vergleicht, etwa mit der 4. Auflage (Thesaurus of Bnglish Wörde and Hirases, London 1860), sieht man den großen Unterschied in der Feinheit der Bearbeitung, den die strukturelle und Wortfeldauffassung verursaoht hat. Eine andere Auswirkung des Strukturalismus und Funktionalismus auf die Lexikographie kann man in dem sogenannten Antipurismus sehen. Historisches Interesse kann dazu führen, den Schwerpunkt in die Geschichte zurückzuverlegen, und so führen auch nioht selten historische Richtungen in der Sprachwissenschaft zu einem Purismus, der nur das Alte und höchstens das im Alten unmittelbar Wurzelnde zulassen will. Die puristischen Tendenzen haben in manchen Sprachen eine sehr starke Auswirkung gehabt. Die funktionelle Sprachbetraohtung legt nicht mehr so viel Wert auf das Historische: Wenn etwas in der 3prache eine legitime, nützliche Funktion erfüllt, dann ist es eben notwendig und durch den Usus sanktioniert, gleichgültig ob es sich um eine Neubildung, um ein entlehntes Fremdwort oder was sonst immer handelt. Selbstverständlich wird dieser funktionalistische Gesichtspunkt durch den Umstand gemildert, daß man sich in der Uehrheit der Fälle in den Grenzen der historisch gegebenen Regelmäßigkeiten einer Sprache befindet. Diese Grenzen sind aber viel breiter gezogen als im Purismus. Wiederum kann man nioht sagen, daß man jetzt ganz neue Wörterbücher schuf, die auf Grund dieses strukturellen und funktionellen Gesichtspunktes absolut verschieden von den bisherigen Wörterbüchern wären} wenn man aber einsprachige Wörterbücher der Sprachen, in denen der Funktionalismus plötzlich einen sehr starken Einfluß auszuüben begonnen hat, mit den älteren vergleicht, also etwa das Akademische Wörterbuch der tschechischen Sprache aus den 30er Jahren mit den älteren tscheohi-
16
L. Zgusta
sehen Werken dieser Art, wo ja in Frag seit den 20er Jahren die strukturell-funktionalistisohe Spraohbetrachtung ihr Zentrum in jener Zeit hatte, so ist es erstaunlioh, wie ausgeprägt der Bruah mit dem Purismus hier ist. Die metbodisoh klarste Auswirkung der strukturell-funktionellen Sprachauffassung kann man aber bei L.V. §Serba und seiner Moskauer lexikegraphisohen Schule feststellen. S&erba selbst hat 1940 in der "Iswestija" der Moskauer Akademie seinen Aufsatz Opyt obflgej teorii leksikografii erscheinen lassen, in dem er diesen Standpunkt vom Gesichtspunkt der Theorie aus erörtert. Noch lehrreicher sind aber die diesbezüglichen Wörterbücher selbst. Es handelt sich •or allem um das russiseh-franzÖBisohe Wörterbuch, das Söerba selbst in mehreren Auflagen herausgegeben hat (4. Aufl. 1955), um das russisch-englische Wörterbuch seiner Sohüler A.I. Smirnlckij und 0.3. Achmanova, aber auoh um einige Wörterbücher der Sprachen der Sowjetunion, die zu den orientalischen gehören. Die Punktion des Wortes, die Punktion des Ausdrucks in der Gesamtwirkung der Aussage, aber auoh die Punktion des Wörterbuches selbst werden hier zu den Grundsteinen der ganzen Arbeit und Darstellung. SSerba unterscheidet ein Wörterbuch, welches über eine andere Sprache zu informieren hat, Ton einem Wörterbuch, das helfen soll, eine andere Spraohe als Kommunikationsmittel zu benutzen. Die ganze Behandlung der Polysemie, die ganze Behandlung des Anlsomorphiamus der Sprachen wird von dieser Punktion des Wörterbuches abhängig gemacht. Durch diese Unterscheidung schuf §Serba eine Klarheit, die zwar praktisch in der Ausarbeitung der Wörterbücher nicht zu erreichen ist, da der Lexikograph üblicherweise mehreren Zwecken dienen muß, die aber begrifflich höchst«nützlich und wertvoll ist. Die Wörterbüoher SSerbas, die zur Bildung von Texten in einer Fremdsprache bestimmt sind, waren in ihrer Zeit bahnbrechend, und bis heute gibt es nur wenige lexikographische Werke, die ihnen in der Genauigkeit der Angaben gleichkommen. Eine andere sprachwissenschaftliche Methode des 20. Jh. vertritt die Kopenhagener Schule, die wir als die logisoh-analysierende Riohtung bezeichnen dürfen. Sie ist eng mit dem Namen von Louis HJelmslev verbunden, der sich bemüht hat, das Spraohsystem durch eine logisohe Analyse zu erfassen, indem er wohl auf Grund eines ursprünglich induktiven Studiums, aber in seinen Hauptarbeiten doch auf eine rein deduktive Art und Weise alle vom System gegebenen und im System inhVrenten kombinatorischen Möglichkeiten entwickelte und
L. Zgusta
17
dann feststellte, welche von diesen theoretischen Möglichkeiten in der einen oder in der anderen Sprache tatsächlich angewandt werden. Diese Methode des spraohlioh-logisohen Kalküls will jade Entität in ihre Bestandteile zerlegen, tun die letzten und kleinsten Elemente des ganzen Baues festzustellen. Für die Lexikographie ist diese Sohule von Bedeutung, weil sie, wenn man die spezielle glossematisohe Terminologie der Kopenhagener Sohule beiseite läßt, sioh darum bemüht, die lezikalisohe Bedeutung des Wortes nicht nur in ihre Komponenten zu zerlegen, sondern anstrebt, womöglich dieselben Bestandteile in Bedeutungen verschiedener Wörter zu finden und auf diese Art und Weise zusammenhängende Subsysteme im ganzen Wortschatz aufzuspüren. Um ein ganz einfaches, ja primitives Beispiel zu wählen, wird die lexikalische Hauptbedeutung von Wörtern wie "Knabe und 'llädohen von der Kopenhagener Sohule so in Bestandteile zerlegt, daB nur die Komponente 'maskulin oder "feminin den Unterschied macht. Durch den Vergleich von etwa Knabe" und "Mann spielt dann die semantische Komponente "jung" oder "erwachsen" die distinktive Rolle. Diese semantischen Komponenten werden dann in anderen Wörtern gesuoht, was zum Aufdecken der Zusammenhänge im Wortschatz führt. Diese analysierende Behandlung der lexikalischen Bedeutung wird in den letzten Jahren vor allem von den französischen Semantikern A.-J. Qreimas und B. Pottier betrieben. Meines Eraehtens gehören zu dieser Gattung auch die semantischen Untersuchungen der amerikanischen Linguisten J» Fodor, J. Katz und P. Postal, die Vertreter der Transformationstheorie sind. Ein einheitliches Wörterbuch, das auf Grund dieser Spraohbetrachtung ausgearbeitet würde, existiert meines Wissens bisher nioht. Diese Spraohbetrachtung selbst ist*zu neu, als daß dies der Fall sein könnte. Es ist aber zu erwarten, daß diese Methode sehr bald auoh ihre lexikographisohen Früchte bringen wird. Eine weitere Sichtung in der Sprachwissenschaft des 20. Jh. ist die amerikanische Sohule, die man als deskrlptlv-taxonomisch bezeichnen könnte und die vor allem mit den Namen von L. Bloomfield sowie dessen Schülern und Naohfolgern zusammenhängt. Diese Sohule widmet ihre ganz besondere Aufmerksamkeit der Form des spraohliohen Ausdruoks. Die Semantik ist durch die Anhänger dieser Sohule sehr wenig betrieben worden, ja es gab eine Zeit, in der das Wort "Bedeutung" selbst für die Deskriptivisten als "dirty word" galt, wie man soherzhaft sagte. Nichtsdestoweniger ist diese deskriptiv-t&xonomisohe, d.h. also klassifikatorisohe Spraohauffassung nioht ohne
L. Zgusta
18
Auswirkung auf die Lexikographie geblieben. Für diese Sohule ist das observable behayier das Wesentliche, in unserem Falle also das feststellbare Vorkommen der Wörter in verschiedenen Kombinationen und Kombinationstypen, was duroh den Terminus dlstrlbution bezeichnet wird. Wenn man in dieser distributiven Art und Weise vorgeht, stehen vor allem die syntagmatisch-kombinatorischen Eigenschaften des Wortes im Vordergrund, an deren Gruppierung die Analyse der Bedeutung vorgenommen wird. Als Repräsentant der nioht allzu zahlreichen Wörterbücher, die zu dieser Gattung gehören, kann man das Conoise diotionary of Spoken Chinese von Yuen Ren Chao und Lien Shen Yang (Cambridge 1961) bezeichnen. Die Einflüsse des Distributionalismus sind aber auch auf Gebieten feststellbar, wo man es nioht unbedingt erwarten würdet so sind z.B. die Stichwörter des neuen griechischen Teil-Thesaurus, des Lexikons des frühgrlechischen Epos (1955 ff.), die von dem Kölner Sprachforscher H.J.Seiler bearbeitet wurden, sehr stark nach diesen distributionalistisohen Prinzipien aufgebaut. In den meisten Fällen gehört hierher auch die sehr umfangreiche, allerdings teilweise unveröffentlichte Wortforschung, die im Zusammenhang mit der maschinellen Ubersetzung erfolgte. Die deskriptiv-taxonomisohe Sohule ist aber nicht die einzige amerikanische sprachwissenschaftliche Richtung der 30er, 40er und 50er Jahre. Die Tradition der 3praohforscher, die zugleich auch die Ethnographie einbezogen, wie F. Boas und E. Sapir, wurde fortgesetzt! allgemein wird diese Sohule, die mit den Namen wie B. Whorf, F. Nida, K.L. Pike, D. Hymes verbunden ist, als die ethnolinguistisohe bezeichnet. Sie bemüht sich nicht hur um die fremden Sprachen selbst, son'dern auch um die ethnographischen Besonderheiten der Völker, von denen diese Sprachen gesprochen werden. Das Studium der Wortbedeutung dient auch dazu, in die Begriffswelt der Spreoher der anderen Spraohen einzudringen sowie deren gesellschaftliche und sonstige Einrichtungen zu verstehen. So ergibt sich ein Kontrast zwischen der deskriptiv-taxonomisohen Schule, die es in ihrer reinen Form ablehnte, sioh mit der begrifflichen Seite des Wortes zu beschäftigen (für Bloomfield selbst hiefi es, das Studium der Bedeuii
h
tung des Wortes Salz sei das Studium der ohemisohen Zusammensetzung des "salz" genannten Stoffes und nioht eine linguistische Untersuchung) und der ethnelinguistischen Sohule, wo z.B. ein Nida behauptet, die Angabe, ein Indianerwort bedeute "ein Initiationsritus" sei eigentlich ohne eine Beschreibung des Ritus selbst und des gan-
L. Zgusta
19
zen gesellschaftlich-religiösen Kontextes bedeutungsleer. Auf diese Art und Weise entwickelten sich im Rahmen dieser ethnolinguistischen Schule Wörterbücher, die diesen informativen Charakter haben. Hierher gehört das Wörterbuch von M. Mathlot, das in Kürze erscheinen wird. Abschließend soll in dieser kurzen Übersicht noch erwähnt werden, daß gegen Ende der 50er Jahre in den Vereinigten Staaten von N. Chomsky die sogenannte generative Grammatik begründet wurde, die heute als eine bedeutende und fruchtbare sprachwissenschaftliche Richtung gelten kann. Wenn wir in Betracht ziehen, wie kurz diese Schule existiert, dürfen wir uns nicht wundern, daß ihr Einfluß auf die Lexikographie vorläufig kaum zu spüren ist. Die Semantik dieser Schule, die namentlich von Fodor, Katz und Postal betrieben wird, wurde schon oben im Zusammenhang mit der logisoh-analysierenden Spraohbetrachtung erwähnt. Das Besondere dieser Schule, das hier am meisten interessiert, ist die Art und Weise, wie das Syntaktische mit dem Semantischen kombiniert bzw. einheitlich bewältigt wird. Bei dem wachsenden Interesse, das'dieser Spraohauffaasung in verschiedenen Ländern in immer größerem Maße entgegengebracht wird, ist zu erwarten, daß auch die Lexikographie eine Bereicherung oder wenigstens eine teilweise Bereicherung in diesem Sinne erfahren wird. Bisher haben wir uns in erster Linie mit der Sprachwissenschaft beschäftigt und versucht, an einigen Beispielen zu zeigen, daß eine veränderte Betrachtungsweise in der Sprachwissenschaft auch in einem veränderten modus procedendi der Lexikographie Widerhall findet. Wenn wir also zum anfänglichen oxf)|U( wxö* iXov ttai (icpog zurückkehren, so lag bisher der Schwerpunkt im 6\ov» im Ganzen, in der Sprachwissenschaft. Nichts liegt aber ferner als die Auffassung, daß jede neue sprachwissenschaftliche Schule zu einem vollständigen Umsturz in der Lexikographie geführt hat und auoh führen muß. Im Gegenteil. Wenn wir die Tatbestände vom Standpunkt des (lepoQ, des Teiles, d.h. der Lexikographie aus betrachten, so sehen wir, daß die Lexikographie ein wissenschaftliches Fach ist, in dem die Veränderungen ziemlich langsam und vor allem sehr vorsichtig vor sich gehen. Diese Tatsache hat verschiedene Gründe. Erstens ist die Lexikographie sehr sachgebunden, so daß ihre Tätigkeit und ihre Uethoden in einem hohen Grade vom Gegenstand selbst diktiert werden. Zweitens dauert die Verwirklichung lexikographischer Projekte sehr lange, so daß man für eine lange Zeit unbedingt bei einer
20
L. Zgusta
Methode bleiben muß. Wenn wir uns nur die wenigen Beispiele der Wörterbücher, die oben angeführt wurden, vergegenwärtigen, die ein Jahrhundert oder sogar mehrere Jahrhunderte in verschiedenen Auflagen "gelebt'' haben, so sehen wir, daß im Vergleich dazu das "Leben" einer sprachwissenschaftlichen Methode, die nur etwa zwei Jahrzehnte oder noch weniger im Vordergrund steht, eigentlich ephemerisoh ist. Diese Tatsache hat große Vorteile, denn die Lexikographie kann auf diese Weise nur das Neue übernehmen, was duroh die Zeit und duroh die Erfahrung als bewährt gelten kann. Wir wollen diese Bemerkungen nicht weiterführen, sondern nur duroh einige Beispiele belegen, daß bisweilen die Lexikographie tatsäohlioh ihre eigenen Wege geht und auoh gehen muß, ohne sioh den manohmal scharf zugespitzten theoretisohen Lehren verschiedener Schulen zu sehr zu beugen. So sind z.B. jedem Vertreter der strukturell-funktionellen Methode wenige Lehren ao wichtig wie diejenige vom Gegensatz der langue und der parole, des Systems der Sprache und seiner Manifestation in der konkreten Rede. Endlose Untersuchungen sind Uber das Thema des Verhältnisses dieser zwei Ebenen geschrieben worden. De Saussure selbst hat eigentlioh zwei Sprachwissenschaften postuliert, "linguistique de la langue", die sioh mit dem System der Sprache beschäftigt und "linguistique de la parole", die das konkrete Spreohen und die konkreten Aussagen untersuohen. Diese ganze Thematik kann in den letzten fünfzig Jahren als ein sprachwissenschaftlicher "evergreen" bezeichnet werden. Die Lexikographie sieht diesen Unterschied nicht immer in einem so scharfen Lioht. Sie untersucht hauptsächlich konkrete Sätze, konkrete Kontexte, also im allgemeinen was als parole bezeichnet werden müßte. Selbstverständlich bemüht sie sioh auoh, aus dem Bereich dieses konkreten Materials Rückschlüsse auf die abstrakte Ebene des Systems selbst zu ziehen. Manohmal ist das aber nicht möglich. Zum Beispiel kann man das sehr wohl auf dem Gebiete der toten Sprachen illustrieren. Von der toten Sprache existieren nur die Texte. Man kann neues Material wohl durch neue Funde gewinnen, aber die vollständige Sprachfähigkeit und das vollständige Spraohbewußtsein kann eben nicht in dem Ausmaße wie bei einer lebendigen Sprache da sein. Deswegen ist jedem Spraohforsoher und jedem Lexikographen auf dem Gebiete einer toten Sprache jedes Fragment eines Textes, jedes Wörtohen so wertvoll. Selbst wenn es klar ist, daß es sioh nur um etwas Okkasionelles handelt. Ebenso verfährt die Lexikographie mit der Exegese
L. Zgusta
21
einea Jeden Hapaxlegomenon. Alles muß erfaßt, erklärt und ausgenutzt werden. Man könnte annehmen, daß es sioh in solchen Fällen im allgemeinen um wertvolle künstlerische Texte handelt. Aber selbst ein Wörtchen, das vor Jahrhunderten ein Knabe auf die Wand von Pompeji gekritzelt hat, wird aufgenommen. Jedes Bruohstüok ist zu wertvoll, um beiseite gelassen zu werden. Ebenso verfährt auch die Lexikographie, wenn z.B. auf dem Gebiete der modernen Sprachen die Idiolekte einzelner Sprecher erfaßt werden: Wieder wird alles, jede Einzelheit, jede Okkasionalität erfaßt und nicht die Auswahl des Regelmäßigen, Systemhaften getroffen. Dadurch soll nicht die Forderung de Saussure's aufgehoben sondern nur festgestellt werden, daß sie auf einigen Gebieten der Lexikographie keine absolute Geltung hat. Ebenso ist es mit dem strukturalistisohen Gegensatz von Synchronie und Diachronie: Heute ist jedem Lexikographen klar, daß es etwas anderes ist, ein synchron!sches Wörterbuch zu schreiben, in dem der Zustand einer Sprache zu einem bestimmten Zeitpunkt erfaßt wird, als ein diachronisches Wörterbuch, welches die Entwicklungsgeschichte einer Sprache darstellt. Das schließt nicht aus, daß es der Zweck eines Wörterbuches erforderlich machen kann, zeitlioh Verschiedenes hineinzuarbeiten. Es ist auch so, daß der Lexikograph, der ganz synchron sein will, doch diachronisch arbeiten muß, manchmal sogar mit dem Blick nicht nur auf die vergangene, sondern auch auf die zukünftige Entwicklung. Warum hat sioh das Wörterbuch von Johnson mit seiner "ohoioe out of a boundless variety without any established principle of selection" im Laufe eines Jahrhunderts so gut bewährt? Eine der Ursaohen war, daß Johnson die Dynamik des synchronen Zustandes so gut zu erkennen oder sich in ihn einzufühlen vermochte, daß er die von ihm sicher beeinflußte zukünftige Entwicklung doch antizipiert hat. Ohne einen gewissen Grad einer solchen Antizipation kann der Sprachwissenschaftler die zukünftige Entwicklung nicht beeinflussen, weil prohibitive und präskriptive Bemühungen, die den tatsächlichen Entwicklungstendenzen der Sprache selbst zuwiderlaufen, im allgemeinen wenig Einfluß haben. Wir haben einige Wechselwirkungen zwischen der Sprachwissenschaft und der Lexikographie kurz skizziert. Selbstverständlich wollen wir nicht behaupten, daß diese Gedanken irgendeinen Anspruch auf Vollständigkeit erheben. Wir haben weder alle gegenwärtigen nooh vergangenen sprachwissenschaftlichen Richtungen erwähnt, noch alle Funkte der Überschneidung oder Verschiedenheit zwischen der
22
L. Zguata
Sprachwissenschaft und Lexikographie genannt. Ebenso würde es zu weit führen und allzu viel Zeit in Anspruch nehmen, wenn wir die verschiedenen Typen heute existierender Wörterbücher auch nur sehr knapp darzustellen versuchten.
S u m m a r y Lexicography and Linguistics The author gives a brief survey of lexicography since the 18th century and its development under the influence of various trends in linguistics, especially of the logical-normative epoch (17th and ISth century), the historical-comparative epooh (since the end of the 18th century) and the various schools of language study in the 20th century, the structural-functional school (de Saussure), the logical-analytical (Hjelmslev), the descriptive-taxonomic (Bloomfield) and generative grammar (Chomsky). A consideration of the relation between linguistics and lpxioography permits the conclusion that changes in linguistio points of approach are only slowly reflected in lexicography. The reason for this lies in the practical oharaoter of lexicography and also in the fact that in a lexicographical project the completion of which covers a considerable period of time the method initially decided upon must be maintained to the end. Distinctions such as those between langue and parole or between synchrony and diachrony can have no absolute validity for lexicography.
Erioh
Hater
Menschliches Denken und nasohinelles Systematisieren in der Lexikographie
Diese Aufgabenteilung birgt scheinbar keine Probleme in sich: Der Mensch leistet die Denkarbeit, die Maschine soll ihm beim Systematisieren helfen. Das Sortieren der Belege, von Menschenhand nur sehr langsam zu bewältigen, sollen die flinken, wenngleich stumpfsinnigen, mechanisch bewegten Teile und elektrischen Impulse eines Automaten schnell und exakt ausfuhren. Nun zeigt aber die praktische Erfahrung dem, der es sehen will, das ein Zusammenarbeiten von Mensch und Maschine auch in der Lexikographie keineswegs so unproblematisch ist, wie man zunächst annahm. Will man die Ursache für diese unerwartete Entdeckung finden, so muß man offensichtlich Wesen und Funktion des menschlichen Denkens einerseits und der datenverarbeitenden Maschinen andererseits neu durchdenken und präziser formulieren. Das Wörterbuch der deutschen Gegenwartssprache''" bezeichnet als denken "alle Stufen und Formen der menschlichen höheren Gehirntätigkeit" i es wird dann weiter unterteilt in neun Bedeutungsschattierungen, nämlich: (etwas) überlegen, gesinnt sein, beabsichtigen, meinen, (sich) versetzen, (sich) vorstellen, (sich) erinnern, (etwas) in den Mittelpunkt seines Strebens stellen, urteilen. Es gibt bereits heute eine ganze Literatur zu der Frage, ob Maschinen denken können. Uns scheint diese Erörterung müßig, solange man nicht präzisiert, welche Bedeutung man bei Gebrauch des Wortes "denken" meint. Ist die Lösung einer komplizierten mathematischen Aufgabe denkerische Tätigkeit? Dahn können Maschinen wesentlich besser denken als der begabteste Mensoh, nämlich genauer, schneller und umfassender. Ist die geistvolle, ästhetische Interpretation etwa eines lyrischen Kunstwerkes ebenfalls denkerische Tätigkeit? Dann finden wir in der ersten bis vierten Generation datenverarbeitender Maschinen auch nicht den Ansatz zur Denkfähigkeit. Aber Ma2 schinen können lernen, wie Steinbuoh bewies. Bedingt ein Lernprozeß einen DenkprozeS, oder kann das erstere ohne das zweite erfolgen? Und zwischen dem mathematischen Problem und dem lyrischen Kunstwerk finden wir noch eine große Zahl von Zwischenstufen, deren
24
E. Mater
Einordnung uns nicht weniger schwer fallen dürfte. Alle diese "Formen menschlicher höherer Gehirntätigkeit" fallen noch unter die erste Bedeutungsvariante von "denken", also unter "Uberlegen". Daraus mag schon verständlich werden, daß wir mit der herkömmlichen Vorstellungswelt hier keine Klärung erzielen können. Für datenverarbeitende Maschinen sind - soweit es unter Thema angeht - vier Kriterien kennzeichnend: 1. Maschinen lesen automatisch Informationen ab, die auf einem Maschinenspeicher (Lochband, Lochkarte, Magnetband usw.) verzeichnet sind. 2. Durch ein Programm werden der Maschine Anweisungen gegeben, welche Operationen sie in welcher Reihenfolge ausführen soll. Sie stoppt erst, wenn sie alle Programme abgearbeitet hat. Komplizierte Aufgaben müssen oft in mehrere Teil- oder Unterprogramme aufgegliedert werden. 3. Das Ausdrucken der Ergebnisse erfolgt ebenfalls automatisch, wobei die Anordnung des Textes durch Programm festgelegt wird. 4. Alle Operationen laufen in Geschwindigkeiten ab, die weit über dem menschlichen Vorstellungsve'rmögen liegen. So werden z.B. von unseren relativ langsamen Maschinen in der Stunde ca.. 45 000 Lochkarten sortiert, je Sekunde 200 Buchstaben oder Zeichen gelesen und pro Stunde rund 1 Million Anschläge - wenn man es mit der Schreibmaschine vergleicht - ausgedruckt. Moderne Großautomaten führen heute in der Sekunde mindestens 1 Million Operationen aus. Was soll nun ein Lexikograph - also ein denkender Mensch - mit solchen Maschinen anfangen? Der erste Schritt orientiert sich ausschließlich an den unter 4. genannten hohen Arbeitsgeschwindigkeiten. Der Lexikograph simuliert mit den Maschinen die langsame menschliche Handarbeit auf einer quantitativ höheren Ebene: Er läßt sich Belege heraussuchen, Beispiellisten zusammenstellen, Koni' textrecherchen ausführen. Diese Absicht ist legitim, aber technologisch wenig sinnvoll. Die eigentlichen Möglichkeiten programmgesteuerter Automaten werden dabei nicht genutzt. Auch ist es auf dieser Stufe und bei dieser Arbeitsform meist erforderlich, in die Belege zuvor alle Informationen einzuspeichern, die man später suchen läßt. - Der zweite Schritt führt zur Aufstellung von Systematiken, die ohne Maschinen nicht zusammengestellt würden, weil der manuelle Aufwand viel zu hoch wäre. Solche Gruppen - etwa nach Gesichtspunkten der Morphologie, Syntax, Wortbildung, Semantik usw. zusammenge-
E. Kater
25
stellt - haben in der Regel einen unerwartet hohen Aussagegehalt. Der Lexikograph findet sein Uaterial in einer Systematik vor, in der er es nooh nie sah. Häufigkeiten, Distributionen oder Strukturen werden zumindest im Ansatz erkennbar und vermitteln ihm einen eminent heuristisohen Gewinn. Zwar hat auch hier der Lexikograph noch jedes Wort selbst mit den zutreffenden Merkmalen ausgezeichnet, wie er es aus seiner Wörterbuoharbeit gewöhnt ist, aber in kaum einem Einzelfall konnte er dabei die Verflechtungen und Verteilungen des Singulären im Verhältnis zur Gesamtheit des Wortmaterials überschauen. Auf die Vorzüge dieses Verfahrens hat bereits de Tollenaere^ in seiner bedeutenden Untersuchung hingewiesen und gefordert, vielerlei Materialquellen synchroner wie auch diachroner Art in ihren Beziehungen zueinander zu untersuchen. Der dritte Schritt schließlich repräsentiert den jetzigen Erkenntnisstand unserer theoretischen und praktischen Untersuchungen. Er stellt den Versuch dar, aus den Antithesen "menschliches Denken" einerseits und "maschinelle Prozesse" andererseits eine Synthese auf qualitativ höherer Ebene zu finden: Die progressive Auffindung sprachlicher Gesetzmäßigkeiten mit Hilfe der Maschinen. Als Bindeglied soll dabei der heuristische Effekt, der unserem zweiten Schritt entspricht, fungieren. Wir müssen, um diesen komplizierten Versuch wenigstens in seinen Umrissen deutlich werden zu lassen, wieder auf die eingangs forcierte Definition des Begriffes "denken" zurückkommen. Wir bleiben bei der ersten Bedeutungsschattierung "(etwas klar, scharf) überlegen". Ist Lexikographie in diesem Sinne "Denkarbeit"? Wir meinen ja. Auch das Exzerpieren von geeigneten Belegstellen, auch das Sichten des Materials auf wichtige und das Ausscheiden aussagearmer Belege, der Aufbau eines Wörterbuchartikels nach den Besonderheiten des Materials, die Hervorhebimg bedeutungsvoller Eigenheiten grammatischer oder semantischer Art, schließlich das Ausarbeiten, überprüfen und Korrigieren eines solchen Artikels - : Das alles bezeichnen wir als Punktion menschlicher Denktätigkeit im Sinne der oben gegebenen Definition. Es führt aber scheinbar keine Brücke von dieser Porm der Lexikographie zur Programmierung einer Maschine, die Wörterbuchartikel automatisch ausarbeiten s o l l D e n n was der Lexikograph unangefochten und in Ubereinstimmung mit allen Fachkollegen tut, ist die Unterordnung fast aller linguistischen Kriterien unter sein Sprachgefühl. Er
26
B. Hater
weiß eben einfaoh, welcher Artikel knapp gefaßt werden kann und welcher detailliert aufzubauen ist; er weiß, wann es sich um eine einfache Bedeutungsübertragung handelt, wann Polysemie, wann Homonymie oder sogar Homographie vorliegt. Im Binzelfall können die Ansichten darüber graduell auseinandergehen, sie werden jedoch nie prinzipiell voneinander abweichen. Er weiß, welche Kasus ein Verb regieren kann, welche Adjektive gesteigert werden können, welche Substantive Pluraliatantum sind usw. usw. Woher weiß er das? Was ist dieses scheinbar Irrationale Regulativ "Sprachgefühl"? Die Antwort, daß man alle grammatischen Angaben eines Wortes zugleich mit deren Bedeutung erlernt, kann nur zum Teil stimmen. Am wenigsten trifft sie bei derjenigen Sprache zu, die jedermann am besten beherrscht: bei der eigenen Muttersprache. Man kann das leicht überprüfen, wenn man etwa den Text eines Fachgebietes liest, in dem einem jegliche Grundkenntnisse fehlen. Ohne die Bedeutung der Pachtermini zu kennen, ohne überhaupt den Inhalt des Textes zu verstehen, kann man doch als Laie die syntaktischen sowie fast alle morphologischen Merkmale jedes Wortes genau angeben. Wir wollen und können in dieses Phänomen jetzt nicht weiter eindringen, sondern nur folgende Hypothese daraus ableiten: Bas, was wir "Sprachgefühl" nennen, besteht zu wesentlichen Teilen aus einem Hegelsystem, dem wir unbewußt folgen, ohne es klar formulieren zu können, oder es ist in anderen Fällen die intuitive Kenntnis vom Zusammenwirken einer Vielzahl sprachlicher Gesetze, deren jedes einzelne uns bekannt sein kann, ohne daß wir jedoch die Relationen nennen können, die sich aus ihren wechselseitigen Verkettungen auf unterschiedlichen sprachlichen Ebenen ergeben. Wenn wir nun aber Spräche maschinell bearbeiten wollen, müssen wir alle Regeln oder Gesetze ganz klar, ganz präzise als Programm formulieren. Die Präge heißt folglich für den dritten Schritt unserer maschinellen Sprachverarbeitung: Wie kann man sich Regeln oder Konventionen, die uns das Sprachgefühl vorschreibt, so bewußt machen und beschreiben, daß sie auch von datenverarbeitenden Systemen richtig erkannt und ausgeführt werden? Die Beantwortving dieser Präge dient keineswegs mir einer Spielerei, etwa der maschinellen Erzeugung grammatisoh richtiger, semantisch sinnvoler Texte. Vielmehr glauben wir, daß jede Teilantwort uns bisher unbekannte Gesetzmäßigkeiten natürlicher Sprachen aufdeckt und einen Ausschnitt aus dem unbewußt angewendeten Regelsystem in das Gebiet des Bewußten, also in den Bereich der Wissenschaft 1ichen Erkenntni s, überführt.
E. Hater
27
Wieviel Anfechtbares auch in den Voraussetzungen enthalten sein mag, von denen wir ausgingen, eines wird nicht bestritten «erden: Venn man ein Wort, einen Satz maschinell richtig analysieren oder generieren kann, so sind alle Gesetze sprachlicher Art, die für diesen Prozeß erforderlich «erden, vollständig, riohtig und widerspruchsfrei erkannt. Wenn die gleichen Gesetze, auf einen 2., 3. bis n. Satz angewendet, nicht zu richtigen Ergebnissen führen, so werden Einschränkungen gültig, die formulierbar und folglich im Prinzip erkennbar sein müßten. Es ist ein anderes, solche generellen Forderungen aufzustellen, ein anderes, sie in der praktischen Kleinarbeit am Material zu erfüllen. Wir sehen in diesem Bekenntnis keine Einschränkung unserer Hypothese, sondern eine Aufforderung an die Linguisten, eine Forderung, der wir uns selbst nicht entziehen wollen. Aber wo soll der erste Ansatzpunkt zu finden sein? Wir haben solche Ansatzpunkte bisher fast nur im zweiten Schritt unseres provisorischen Systems entdecken können, nämlich in den Systematiken, die nach neuartigen, jedoch der Sprache immanenten Gesichtspunkten maschinell angelegt -wurden. Wenn man die traditionelle alphabetische Anordnung des Materials aufgibt zugunsten verschiedener Sachgruppen, so erwäohst aus deren Auswertung - wie wir schon oben darlegten - fast immer ein heuristischer Gewinn. Verteilungen und. Strukturen werden entweder erkennbar oder verführen zumindest zu Fragestellungen, deren Beantwortimg mit maschinellen Verfahren relativ leicht fällt. Nicht immer findet man auf Anhieb die richtige Lösung, aber ein Prozeß schrittweiser Annäherung wirkt sich im Grunde noch gewinnbringender aus, weil dabei vielerlei Gesetze auf unterschiedlichen Ebenen ineinanderwirken. Oft ergeben sich in Zwischenstufen Fehler, die für die sprichwörtliche Dummheit der Maschinen kennzeichnend sind. So sollte uns die Maschine z.B. alle deutschen Verben^ nennen, die sich mit den Kompositionsgliedern "be - in" verbinden können. Unter den Ergebnissen stand auch "beinstellen". Ein andermal sollte sie uns Grundwörter zitieren, die sich mit "an verbinden. Darunter fand sich ein deutsches Verb "tWorten", dem ein Kompositionsglied "an vorausging. Kann man mit so dummen Maschinen Uberhaupt sinnvoll arbeiten? Wenn sich anstelle des Autors eine Tabelliermaschine befände, so würde die eben aufgeworfene Frage aus ihrer Sicht lauten: Kann man mit so dummen Menschen überhaupt sinnvoll arbeiten? Wer hat recht? Wer hat formuliert, woran man erkennt, ob es sich um die Komposi-
28
S. Mater
tionsglieder be-, in-, an- handelt? Der Mensch, der das formulierte - in diesem Beispiel ich selbst - hat ungenaue Angaben geliefert. Er hat unterstellt, daß das, was ihm im Unterbewußtsein selbstverständlich war, auch im Unterbewußtsein der Maschine enthalten sein mtisse. Dort sind aber keine konstruktiven Elemente für "Unterbewußtsein" und "Sprachgefühl" vorhanden, sondern Kern- und Außenspeioher, ein Ubersichtliches, absolut zuverlässiges Gedächtnis. Dort laufen keine irrationalen Prozesse ab, und deswegen sind derartige Geräte das beste, unerbittlichste Korrektiv, das sich ein Wissenschaftler wünschen kann. Dort findet jene säuberliche Trennung im Begriff des Denkens statt, die wir Menschen kaum verwirklichen können, nämlich die Scheidung in exakt formulierte und in unbewußt gefühlte Regeln. Ver die Problematik ahnt, die aus der scheinbaren Widersprüchliohkeit natürlicher Spraohen erwächst, wird die Chancen ermessen können, die dem Gesellschaftswissenschaftler aus der Verwendung daten- oder informationsverarbeitender Systeme erwachsen. Den Begriff des menschlichen Denkens kann man nicht einengen auf exakt formulierbare, logische Operationen; dahinter liegt mehr, wo&l auch viel Unbekanntes. Darf man nooh sagen: "Maschinen können denken", oder "Maschinen sind dumm"? Es ist hoffentlich verständlich geworden, warum wir es ablehnen, solche auf organische Wesen zugeschnittene Begriffe auf technische Konstruktionen zu übertragen. Sind datenverarbeitende Maschinen tapfer? Nein - also sind sie feige? Hier wird der Unfug deutlich, der aus einer unangebrachten Vermengung prinzipiell verschiedener Kategorien entsteht. Die Wissenschaftler unserer Zeit müssen in die schmerzlich-nüchterne Erkenntnis hineinwachsen, daß der Mensch - bezogen auf das Gesamtsystem des Kosmos - nicht das Maß aller Dinge ist. Sie werden in diesem großen Prozeß der geistigen Umbewertung, für den die Datenverarbeitungsmasohinen nur eine unter vielen Ausdruoksformen sind, das Reservat des geistigen Menschen zu behaupten haben. Für dessen Kommunikationsmittel, die natürliche Sprache, bleibt ohne allen Zweifel der Mensch das Maß aller Dinge. Seine Position zur Welt der exakten Wissenschaft kann er, seilte er abgrenzen durch Methoden, die wir hier darzustellen versuchten.
E. Mater
29
S u m m a r y Human Thought and Mechanical Systématisation in Lexicography The shades of meaning in the term "human thought" are oontrasted in their various gradations, from striotly logical thought processes to intuition and feeling for language, with those operations specified in the programme of a machine. The author proceeds from the purely quantitative tasks entrusted to computers to the qualitatively new possibilities which oan arise from a synthesis of human thought and mechanical processes, i.e., step-by-step discovery with machines of the laws of speech. Mistakes arising always have their origin in inexact human processes of thought. These result mainly from impermissible generalisation of the antiquated human sentence as the standard for all things. This sentence should apply for the natural speech as a means of communication, but not for systems outside the human consciousness, therefore also not for machines .
Anmerkungen 1 2 3 4 5
Wörterbuch der deutschen Gegenwartssprache. Hrsg. v. R. Klappenbach und W. Steinitz. 2. Aufl. Berlin 1966 K. Steinbuch: Automat und Mensch. 3. Aufl. Berlin 1965, S.191 ff F. de Tollenaere: Nieuwe Wegen in de Lexlcologie. Amsterdam 1963, s. 112 ff Vgl. G. Wahrig: Neue Wege in der Wärterbucharbeit. Berichte des Instituts für Buchmarktforschung. Juni 1967, S. 61 E. Mater: Deutsche Verben. Bd. 3. Leipzig 1967
G o t t f r i e d
S p i e s
Probleme der automatischen Analyse chinesischer Texte filr lexikalische Projekte
Die folgenden Bemerkungen referieren in kurzer Form Überlegungen zum Einsatz von Datenverarbeitungsanlagen für die Analyse chinesischer Schriftzeichentexte zur Gewinnung und Ordnung von lexikalischem Material für lexikographisohe oder lexikologische Arbeiten. 1. Technische Probleme Schon die Beschäftigung mit einer so undifferenzierten Aufgabenstellung wie die maschinelle Analyse chinesischer Zeiohentexte fördert besondere Schwierigkelten zutage, deren Lösung einen erhebliohen Aufwand erfordert. Die Bewältigung des Schriftsystems, d.h. von 8 - 10 000 verschiedenen Schriftzeichen,, für deren eindeutige Kodierung und Dekodierung ein rationell praktizierbares System zu finden ist: 1. für die Eingabe des Materials als Voraussetzung für die Verarbeitung der Informationen und 2. für das Ausdrucken der Ergebnisse, das wiederum Voraussetzung ist für das normale und fruchtbare Wechselspiel zwisohen Mensch und Maschine. Denn das ausgedruckte Ergebnis einer von der Maschine nach Programm ausgeführten Informationsverarbeitung ist jeweils Eontrolle und Grundlage für ein weiteres Programm. Das Programm selbst, nach dem die Maschine arbeitet, ist Ausdruck bisheriger Kenntnisse und Erkenntnisse oder vermeintlicher Erkenntnisse von der Struktur des Materials, eine maschinengerecht formulierte These oder Fragestellung, die mit dem ausgedruckten Ergebnis beantwortet wird - positiv oder negativ und neue Fragen aufwirft. Ohne eine rationelle Bewältigung dieser technischen Probleme ist eine fruchtbare Arbeit von vornherein in Frage gestellt. Wie sie im einzelnen geltist werden können, soll hier nicht erörtert werden. Überlegungen zur Eingabe und erste praktische Versuche sind bisher aus der UdSSR und den USA bekannt 1 , wenn auch ohne Angaben über die tatsächliche Leistung der vorhandenen Anlagen bzw. die erwartete Leistung der vorgesehenen Kode-Systeme. Für die Ausgabe der Ergebnisse in Form von Sohriftzeichen sind im internationalen Rahmen bisher keine Anlagen bekannt.
32
G. Spies
2. Orientierung an der bisherigen Praxis linguistischer Informationsverarbeitung Zu verschiedenen grundsätzlichen Tragen sieht man sich veranlaßt Stellung zu nehmen, wenn der Einsatz datenverarbeitender Geräte für die lexikalische Analyse von Texten erwogen wird. Es gibt gerade auf diesem Gebiet viele Mißverständnisse über Charakter und Ziele solcher Projekte, insbesondere Uber ihren wissenschaftlichen Wert. Häufig wird der Verdacht geäußert, daß sie der Gefahr erliegen, Lexikographie oder Sprachwissenschaft allgemein mit technischem Aufwand zu drapieren oder unzureichende schöpferische Leistung durch enorme Materialmengen zu ersetzen. Der hohe finanzielle Aufwand für die Geräte erfordert dringlicher als Jede manuelle Arbeitsweise eine Antwort auf die Frage nach der Perspektive. Die bisherigen Zielstellungen solcher Projekte zur maschinellen Textbearbeitung und ihre Arbeitsergebnisse sind sehr unterschiedlich. Drei Typen sollen hier genannt werden. 1. Die Entzifferung unbekannter Texte toter Sprachen. Für den Sinologen scheidet diese Art von Projekten als Anregung für eigene Überlegungen zunächst aus, denn sie beginnen mit -einer fast totalen Unkenntnis von der Struktur des Materials, während der Sinologe es mit einer Sprache zu tun hat, deren grammatisches und lexikalisches Grundgerüst ihm bekannt ist. 2. Die Maschinenübersetzung. Diese Aufgabenstellung ist außerordentlich komplex und enthält neben der Untersuchung von grammatischer und semantischer Struktur der Ausgangssprache zusätzlich die Problematik ihres Verhältnisses zur Zielsprache. Ungenügende Grundlagenforschung und der Primat der gestellten praktischen Aufgabe zwingen solche Vorhaben zur Beschränkung auf klar abgegrenzte Textarten (in der Regel wissenschaftliche Fachtexte) mit einer gegenüber der Allgemeinspraehe stark eingeschränkten und weitgehend normierten lexikalischen und grammatischen Struktur. Insbesondere aber für die chinesische Gegenwartssprache besteht die Notwendigkeit breiter linguistischer Grundlagenforschung im Bereich der Allgemeinspraehe. 3. Die sogenannte maschinelle Lexikographie. Sie hat eine relativ einfache Zielstellung und bisher auch - zumindest quantitativ eindrucksvolle Ergebnisse aufzuweisen. Eingegebene Texte werden automatisch oder halbautomatisch in ihre lexikalischen Elemente zerlegt, nach einem festgelegten Ordnungsprinzip sortiert (meist alphabetisch) und mit Belegstellen ausgedruckt, gegebenenfalls durch
G. Spies
33
gleichzeitige statistische Erhebungen ergänzt. Hohe Effektivität der Ordnungs- und Zählvorgänge sowie des Ergebnisdrucks sind dabei die spezifische Leistung der technischen Anlagen« Seit rund zehn Jahren «erden von zentralen Institutionen, besonders in Frankreich, Italien und den Niederlanden Millionen von Textbelegen zu repräsentativen Texten der nationalen Kultur und Literatur in Form von Konkordanzen aufbereitet und z.T. publiziert. Das hat begeisterte Zustimmung gefunden, aber es gab auoh Kritiker, die besorgt die Frage stellten: Wer soll das alles verarbeiten? Und "verarbeiten" hieß in diesem Zusammenhang, das Material in die Form einsprachiger oder zweisprachiger Wörterbücher bringen, also in die Arbeitsergebnisse der traditionellen Lexikographie umwandeln. Selbstverständlich kann das nicht der einzige Maßstab für die Bewertung solcher Leistungen sein. 3. Mechanische Ordnung des Materials - Quantität und Qualität Wer wie die Kollegen der Arbeitsgruppe deutsch-chinesisches Wörterbuoh Jahre mit der Sammlung und Ordnung von lexikalischem Material zu tun hat, das auch graphisch sehr schwierig ist und nur von ausgebildeten Fachkräften mit chinesischen Sprachkenntnissen sortiert werden kann, begreift spontan den ökonomischen Nutzen, den eine automatische Ordnung des Materials für die Befreiung der geistigen Arbeit von den Fesseln, mechanischer Vorarbeiten bedeuten würde. Aus dem quantitativen Vergleich zwischen manueller und maschineller Leistung läßt sich dieser Nutzen in finanziellen Beträgen ausrechnen. Aber spätestens nach der erfolgten Ordnung des Materials stellt sich der Lexikograph doch die Frage, ob er denn Uber den ökonomischen Gewinn durch Zeitersparnis hinaus seinem Ziel in wesentlichen Funkten nähergekommen ist, oder ob die Maschine zu nichts anderem als zur Perfektion mechanischer Arbeit gedient hat. Das Letztere scheint ihm zuzutreffen, wenn er das Ergebnis der maschinellen Ordnung, die Wortliste, mit dem eigentlichen Ziel seiner Arbeit vergleicht. Das Problem des Verhältnisses von maschineller und manueller Lexikographie wurde zuletzt erörtert von E. Mater in seinem Vortrag auf dem 10. Internationalen Linguistenkongreß in Bukarest 1967. In diesen Ausführungen wurde festgestellt, daß beide qualitativ anders und eigentlich nicht miteinander vergleichbar seien. Da das BedUrfbis nach Wörterbüchern fUr die verbale Kommunikation bestehen bleibt, aber der manuelle Aufwand für ihre Erarbeitung sehr hoch
34
G. Spies
ist, soll doch die Trage gestellt werden, ob die maschinelle Lexikographie trotz ihrer spezifischen Besonderheiten der manuellen helfen kann und auf «eiche Weise. 4. Einigen Aufsohluß darüber gibt eine Analyse der bisher üblichen Wärterbucharbeit 1. Ausgangspunkt ist der Text, der mit dem Ziel gelesen wird, Einheiten für das Wörterbuch zu gewinnen, also schon mit einer ungefähren Vorstellung davon, welche Einheiten für das Wörterbuch wichtig sein könnten. Das bedeutet: Wesentlich mehr Informationen des Textes (lexikalische, distributioneile und grammatische) werden bei der Lektüre verarbeitet als in die Kartei aufgenommen werden in Form von lexikalischen Einheiten mit Kontext. 2, Die ausgewählten Einheiten werden nach dem Ordnungssystem des künftigen Wörterbuches umgeordnet: Der erste Schritt der Materialverarbeitung. Selbstverständlich wäre auch eine andere Ordnung möglich, wichtig ist dabei aber, daß mit hohem Zeitaufwand jeweils nur eine Ordnung der manuellen Kartei möglich ist. 3. Es folgt die Ausarbeitung mit folgenden Fragestellungen: a) soll die Einheit aufgenommen werden (Problem der Häufigkeit, Verhältnis zur semantischen und formalen Struktur der lexikalischen Einheiten usw.), b) welche Merkmale hat sie (d.h. Analyse der Bedeutung und grammatischen Funktionen). Alle im Verlauf dieser Prozedur verarbeiteten Informationen aus dem Belegmaterial fließen zusammen in der Beschreibung der lexikalischen Einheit (Stichwort), oft in einer sehr komplexen Form wie dem Äquivalent. Die wesentlichen Nachteile dieser Arbeitsweise sind folgende: 1. Die Arbeit läuft Einheit für Einheit in einer der Struktur des Materials nicht angemessenen Reihenfolge ab. 2. Während der Bearbeitung werden alle Informationen nur an dem Maßstab des gesteckten Zieles gemessen, d.h. zerfallen in Randerscheinungen, die ignoriert werden (wie etwa eine ungewöhnliche grammatische Funktion einer aufzunehmenden Einheit, eine seltene Bedeutungsvariante, eine Einheit mit besonders geringer Frequenz usw.), und relevante Informationen, die in das Wörterbuch eingehen. Ein'neues Projekt, das auf dem gleichen Material basieren könnte, etwa lexikologische oder grammatische Untersuchungen, würden den Bearbeiter wieder an den Anfang des Prozesses versetzen: die Text-
G. Spies
35
lektüre, da ja die in der Materialkartei aufgenommenen Informationen durch das Ziel der ersten Lektüre, das Wörterbuchprojekt geprägt (reduziert) sind und außerdem die Informationen in der Wörterbuohkartei hinsichtlich ihrer strukturellen Uerkmale in keiner unmittelbar zugänglichen Ordnung vorliegen. Man könnte sich damit zufrieden geben, daß das gestellte Ziel mit der Zusammenstellung des Wörterbuchs erreicht ist und die Aufstellung der Haterialkartei eben den dafür notwendigen und gerechtfertigten Aufwand bedeutet. Aber es kommt ein zweiter Gesichtspunkt hinzu. Vill man das Wörterbuch z.B. systematisch in einer bestimmten Richtung duroh Angaben zu den aufgenommenen Einheiten erweitern oder ergänzen, so macht sich eine Umordnung des Materials nach entsprechenden Kriterien erforderlich. Soll das Wörterbuch durch zusätzliche Textlektüre ergänzt werden, ist ein wesentlich höheres Quantum von verarbeiteter Textmenge Je Beleg erforderlich. Mit anderen Worten: Die Perspektive eines lexikographischen Projekts die weitere strukturorientierte interne Verbesserung der Darstellung des aufgenommenen Wortbestandes (auch naoh der Publikation zur Vorbereitung weiterer Auflagen) duroh systematische Vergleiohe grammatisch oder semantisch definierter Gruppen lexikalischer Einheiten, die kontinuierliche Ergänzung durch Angleiohung an die Entwicklung der Lexik auf der Grundlage weiterer Exzerptionen mit besonderer Berücksichtigung produktiver wortbildender Morpheme - diese Perspektive bringt bei der manuellen Arbeitsweise zugleich mit d«m Anwachsen der Kartei zwangsläufig ein immer ungünstigeres Verhältnis von Aufwand und Ergebnis mit sich. Es besteht bei der manuellen Exzerption eine zu starre Verbindung von Zielstellung und Ergebnis, für das eine Informationsgewinnung eingesetzt wird, die in keinem ökonomisch günstigen Verhältnis zur Informationsverarbeitung steht. Mit diesen kurzen Bemerkungen sollte die Oberzeugung unterstrichen werden, daß erst die maschinellen Methoden der Lexikographie eine im mechanischen Aufwand ökonomische und vor allem im Inhalt klare Perspektive geben kann, angefangen von der ersten Zusammenstellung eines allgemeinepraohigen Wörterbuches über seine systematische Erweiterung bis hin zu Spezialwörterbüchern. 5. Mensch und Maschine in der Lexikographie Beim Vergleich zwischen Mensch und Maschine gibt es neben der Trage naoh dem Unterschied sine ebenso legitime: Was ist das Gemeinsame
36
G. Spies
(sofern man die Maschine überhaupt als eigenständige Größe betrachtet)? Wenn man einen so komplexen Vorgang wie die Ausarbeitung eines Stichwortes für ein Wörterbuch analysiert,, wird man zu dem Schluß kommen, daß es sich lohnt, diesen Prozeß in seine kleinsten erkennbaren Schritte aufzulösen. Dann bleiben nur wenige abgrenzbare Elemente geistiger Leistung, für die der Einsatz maschineller Methoden keinen entscheidenden Vorteil bringt. Der Grund dafür liegt in der Natur der geistigen Analyse, die sich wesentlich als eine Abfolge von Ordnungsvorgängen darstellt, orientiert an formalen Kriterien des Materials, oder in hohem Grade formalisierbar auch dort, wo 34« auf intuitiver Grundlage erfolgt. Natürlich hängt der Wert dieser maschinellen Bearbeitung von Texten nicht davon ab, daß oder inwieweit sie nützlich für die Zusammenstellung von Wörterbüchern sein kann. Man wird nie alle Informationen, die die eingegebenen Texte enthalten, in die Form solcher Wörterbücher bringen, denn zu deren Wesensmerkmalen gehört die Abstraktion, der Verzicht auf Randerscheinungen. Aber was für die Arbeit am Wörterbuch Randerscheinung ist, ist häufig für die lexikologische oder grammatische Forschung von zentralem Interesse. In diesem Sinne ermöglichen die gespeicherten Texte als Repräsentation des sprachlichen Gesamtsystems den Übergang zur umfassenden linguistischen Grundlagenforschung mit den Mitteln der elektronischen Datenverarbeitung ohne zusätzliche Informationsgewinnung und unter Verwendung aller im Laufe der lexikographischen Arbeit isolierten Kriterien zur Struktur des Wortschatzes und zu distributioneilen Eigenschaften seiner Gruppen. Die bisher am meisten geübte Praxis der maschinellen Lexikographie ist die Zusammenstellung von Indices und Konkordanzen zu begrenzten Texten. Das hat den Verdacht genährt, daß sie eigentlich nur eine außerordentlich rationelle Form der Dokumentation von lexi kaiischem Material ist. Die Beschäftigung mit diesen Problemen zeigt aber, daß Wortlisten nioht nur nach graphisch formalen Gesichtspunkten geordnet sein müssen, sondern Auswahl und Ordnung nach spezifischen Fragestellungen der geistigen Analyse sein können und sollten, die sich immer an der Struktur des Materials orientiert. Wortlisten dieser Art enthalten damit alle drei wesentlichen Faktoren einer fundierten verbalen Darstellung: geistige Konzeption der Analyse, Ergebnis und Nachweis des Materials. Im Vergleich zu dieser möglichen Form der Darstellung machen viele Aufsätze über Fragen der Struktur des Wortschatzes oder der grammatisohen Eigen-
8. Spies
37
schaften von Gruppen lexikalischer Einheiten einen eher impressionistischen Eindruck. Das Ergebnis ist aus einer umfangreichen linearen Darstellung oft nur schwer herauszulösen, das Material gering und durch mangelhafte Dokumentation kaum UberprUfbar. Damit wird aber ein wesentliches Bedürfnis der wissenschaftlichen Kommunikation stark behindert: neue Fragestellungen an gleichem Material zu untersuchen und auf diese Weise Ergebnisse zu erzielen, die mit den vorangegangenen voll vergleichbar sind. Es sollte dafür plädiert werden, die Ergebnisse sprachwissenschaftlicher Arbeit stärker als bisher in Form solcher Wortlisten oder Tabellen zu publizieren, deren Ordnungamerkmale zugleich Merkmale des jeweilen Sprachsystems sind. Im Einsatz datenverarbeitender Geräte liegen viele Möglichkeiten, gewonnene Informationen ohne Verlust in großem Umfange zu verarbeiten, zu konzentrieren und in einer dem Charakter des Materials angemessenen Form darzustellen. 6. Technische Erwägungen im Interesse umfassender Analyse Die Frage, welchen Einfluß eine Zielstellung dieser Art auf die Wahl der technischen Einrichtung hat, sollte nicht ganz Ubergangen werden. Solange die Untersuchungen auf die Wortliste, d.h. eine Menge von isolierten Einheiten mit ihren internen Strukturmerkmalen oder bereits listenmäßig erfaßten zusätzlichen Merkmalen beschränkt bleibt, scheinen die Lochkarte als Speichermedium und die elektromechanisch arbeitenden Sortiergeräte die geeignete Ausrüstung zu sein. Hier steht die vertikale Analyse des Materials durch Ordnung nach positionsgleichen formalen oder formalisierten Merkmalen im Vordergrund. Bei Einbeziehung des Satzes, also der horizontalen Analyse, scheint der Ubergang zur elektronischen Ausrüstung (Magnetband) geraten. Damit ist die Möglichkeit gegeben, in komplexeren Programmen Probleme der Distribution von grammatischen Merkmalen oder Probleme der lexikalischen Distribution über lineare Entfernungen zu untersuchen, für die die 80 Spalten einer Loohkarte nicht ausreichen. Insbesondere für die ohinesische Sprache, bei der die Syntax weit stärker ausgeprägt ist als die Morphologie, muß diese Möglichkeit offengehalten werden. Hinzu kommt auch für die vertikale Sortierung chinesischer Einheiten, daß (bei beliebigem Kode-System) eine mehrstellige Ziffernkombination, d.h. eine ebenso große Zahl von vertikalen Sortiergängen erst ein relevantes Merkmal (Schriftzeichen) ¿solieren kann. Deshalb wäre für dieses Material der ausschließli-
38
G. Spies
che Einsatz der Lochkartentechnik zumindest mit einem größeren Zeitaufwand bei gleicher Materialmenge verbunden.
S u m m a r y Problems of Automatic Analysis of Chinese Texts for Lexicographic Projects After a brief discussion of the technical and specialised conditions necessary for a well-thought-out use of electronic data processing in dealing with Chinese texts, the advantages of continuous storage of representative general language texts for lexicographical projects are contrasted with excerpting and arranging material by hand. Emphasis centres here round the problem of loss of information in partial excerpting by hand and the limits set by manual cataloguing to a structurally adequate processing of lexical material. This structurally adequate processing, which demands frequent re-arrangement of the catalogue according to characteristics of the structure of the vocabulary (suffixes, productive word-forming elements etc.), or according to the grammatical characteristics of single lexical groups, is of decisive long-term importance for lexicographic projects. The considerable increase in the effectiveness of work which results from mechanical analysis permits the lexicographer to grasp more quickly than hitherto the tendencies of development and changes in vocabulary and to embody them in the dictionary.
Anmerkungen 1 Vgl. A.A. Zvonov: Kodirovanie ieroglifiôeskich znakov. In: Kratkie soobiSenija institute narodov Azii. Nr. 68. Moskau 1964
K l a u s
K a d e n
Ist das chinesische Radikalsystem nooh aktuell? Zur Problematik der Einordnung der vereinfachten Sohriftzeichen
1. Aufgabenstellung Anfang des 1. Jh. analysierte der Schriftgelehrte und Lexikograph Zu Shen in seinem Standardwörterbuch n Shuo wen jie zi" die bis dahin existierenden fast 10 000 chinesischen Sohriftzeichen zum ersten Ual nach graphisohen Gesichtspunkten und ordnete sie insgesamt 540 verschiedenen Grundelementen, sogenannten Klassenzeichen oder Radikalen, zu. Später wurde die Menge der Radikale aus unterschiedlichen Gründen auf 214 reduziert, eine Zahl, die seit der Herausgabe des "Kangxi zidian" (1716) bis in die letzte Zeit hinein nioht mehr verändert worden ist. Neben der phonetischen Anordnung naoh Reimen hat das Radikalsystem über Jahrhunderte eine wichtige Rolle vor allem in den lexikographischen Arbeiten der. Chinesen, aber auch in den von Ausländern zusammengestellten ohinesisoh-fremdspraohigen Wörterbüchern gespielt. Jedem größeren Wörterbuch ist auch heute noch zumindest ein Index beigegeben, in dem die Zeichen nach Radikalen geordnet sind. Das sind bekannte Tatsachen, und es brauoht nicht weiter darauf eingegangen zu werden. Auch sollen hier zunächst nicht die Vor- und Nachteile des Radikalsystems, die ihm anhaftenden Widersprüche und das Problem seiner mehr oder weniger groBen Praktikabilität im Vergleich zu anderen System«! diskutiert werden. Vielmehr geht es darum, einmal die Auswirkungen der seit den 50er Jahren in der Volksrepublik China durchgeführten Maßnahmen zur Sohriftreform auf die äußere Gestalt der chinesischen Sohrift zeichen und damit auf ihre Zuordnung zu bestimmten Radikalen abzustecken und einzuschätzen. Die Präge ist, ob es angesichts der teilweise recht einschneidenden Veränderungen der Zeichengestalt ratsam oder überhaupt nooh möglich ist, das System der Radikale weiter beizubehalten oder ob man es nioht besser in Zukunft ganz aufgeben sollte. Entspricht das Radikalsystem noch den Anforderungen der Zeit oder hat es seine Rolle ausgespielt? Ist das Radikalsystem nooh aktuell?
K. Kaden
40
Dieses Problem ergab sich aus einer konkreten Arbeit. Bei der Vorbereitung.auf das Studienjahr 1 9 6 7 / 6 8 entstand die Aufgabe, ein SchriftZeichenminimum für die Studenten des ersten Jahres zu erarbeiten. Zu diesem Zweck waren als erster Schritt alle Zeichen, die in dem von H. Vietze zusammengetragenen Wortsohatzminimum 1 vorkommen, in eine Kartei Ubertragen worden. Es handelte sich dabei um 1 0 4 1 der gebräuchlichsten Zeichen. Etwa 3 5 - 4 0 ° / o davon waren durch die Sohriftreform in irgendeiner Weise betroffen.^ Diese sollten in ihrer neusten und auch in ihrer alten, unverkürzten Form gegeben werden. In das Minimum sollten des weiteren auch Angaben Ober die Radikale, die Anzahl der Zusatzstriohe sowie die Gesamtstrichzahl ftir die veralteten sowie für die vereinfachten, jetzt gültigen Zeiohenformen aufgenommen werden. Die Radikalzuordnung der vereinfachten Zeichen erwies sich dabei als viel schwieriger als ursprünglich anzunehmen war. Es gibt bisher keine autoritativen Veröffentlichungen zu diesem Problem. Ich gelangte zunächst zu der oberflächlichen Meinung, dafi es wohl keinen Sinn haben dürfte, angesiohts der Zeiohenreform auf dem Radikalsystem zu bestehen. Eine differenziertere Untersuchung der in der Kartei verzettelten Sohriftzeiohen unter Hinzuziehung der neusten Materialien zur Sohriftreform ermöglichte dann jedoeh erst einen genaueren Überblick über verschiedene Einzelfragen und gab die Grundlage für exakter zu begründende Schlußfolgerungen. 2. Untersuchung Der letzte Stand der Reform der chinesischen Schriftzeichen läßt sioh an Hand der folgenden in der Volksrepublik China veröffentlichten Materialien feststellen: 1. "Gesamttabelle der vereinfachten Zeichen (2. Auflage)" Herausgegeben in Peking vom Chinesischen Komitee für die Sohriftreform, Sept./Okt. 1964»^ einschließlich der darin enthaltenen "Gemeinsamen Bekanntmachung des Chinesischen Komitees für die Sohriftreform, des Kulturministeriums der Volksrepublik China und des Erziehungsministeriums der Volksrepublik China Uber die vereinfachten Zeiohen" o (*/? Herausgegeben vom 7erlag für die Schriftreform in Peking, 1966. Verarbeitet alle bisherigen Materialien zur Schriftreform und gibt an etwa 4000 Zeichen deren letzten Stand wieder. Sehen wir nun, wie sich die Reform der Schriftzeichen in ihrer Gesamtheit auf die Radikale der Zeichen und auf das Radikalsystem als solches auswirkt. Es lassen sich acht Fälle unterscheiden: 1. Das Zeichen wird nicht von der Schriftreform betroffen, es verändert sich nicht. Radikal sowie Zahl und Form der Zusatzstriche bleiben erhalten. Beispiele: tt 9.3 £ 142.5 117.6 fä 60.6 %40.5 4ll 18.5 85.3 "tt 61.3 9.5 rf usw. 2. Das Radikal des Zeichens verändert sich nicht, jedoch verringert sich die Anzahl der Zusatzstriche durch die Reform. Beispiele: >f 85.11—» >;L 85.2 113.13 — 113.1
%
!£• 32.8 — * 3t 32.4
iH 41.8 — H k usw.
41.6
ifä 75.12 — t f r
75.6
85.10—»•
85.9
$
42
K. Kaden
3. Von dem Zeichen bleibt nur das Radikal erhalten, die ursprünglichen Zusatzstriohe fallen ganz weg. Im verwendeten Material waren das folgende Schriftzeichen: 10.6 — • JL 10.0 IL & M 53.12—• f 53.0 Ift Außerdem gehört dazu auch das Zeichen Jt,
44.6 —•>
f
84.6 — • 51.10—-
\ f
84.0 51.0
44.0
4. Bas Radikal fallt durch die Schrift reform weg. Die übrigbleibenden ursprünglichen Zusatzstriche bilden jetzt allein das Zeichen. Dieses existierte aber - wenn auch meist mit anderer Bedeutung bereits vor der Reform und wurde schon früher einem bestimmten Radikal zugeordnet bzw. war selbst Radikal. Die Bedeutungen von ursprünglich zwei Zeichen werden in einem Zeichen vereinigt. Im Material gehören dazu zum Beispiel:
4* 4k 41
& m
9.7 — 9.12 60,9 — 64.8 : 144.5 —
-
»-
H t
*
«-
£
%
120.1 152.5 35.6 135.2 75-1
m
*
Ä.
H.
145.7 172.11 173.4 167.8 199.9
—
•
1
—
•
A 114.6
—
•
—
•
—
•
166.0
&
7.2 145.3 176.0
u.a. Auch die folgenden Zeichen können hier aigeführt werden: fft 190.9 — •
#
ff
130.5
190.12—181.3
5. Das Zeichen wird durch ein anderes, einfacheres, meist gleich oder ähnlich lautendes, in seiner Gestalt aber oft durchaus unähnliches ersetzt, welches früher bereits existierte und schon immer einem bestimmten Radikal zugeordnet wurde bzw. selbst Radikal war. Dieser Fall ähnelt dem Fall 4. Auch hier werden eigentlioh die Bedeutungen von ursprünglich zwei Schriftzeichen in dem einfacheren der beiden vereinigt. Im Uaterial finden sich dazu folgende Beispiele: 52.9
•
IL
16.0
» 5
0L 53.12 r 27.0 4L 60.6 »• iä 30.3 Auch diese Zeichen gehören dazu: X . 103.0 E5- 23.2 109.12—• 1 6.1 u.a.
86.8 — 172.2 * # 191.0 — - H
fl & W
71.0 30.2 68.0
1 1 5 . 1 0 — • ^ 150.0 1 4 0 . 1 1 — * h 25.0
K. Kaden
43
6. Das Radikal des Zeichens bleibt zwar erhalten, aber es verringert sich seine Strichzahl, und seine äußere Form verändert sich. Sie Zahl der Zusatzstriche kann dabei gleichbleiben (z.B. * ^t
.
— o d e r
sich ebenfalls verringern (z.B. $ $ — - i f Ü ,
Das betrifft eine größere Anzahl von Zeichen. Da bisher noch keine entsprechende Ubersicht existiert, folgt hier eine Liste aller Radikale, deren Strichzahl durch die Reform vermindert w u r d e t Rad.Nr.
alte Form und Strichzahl
54 98
3
%
113 114
neue Form und Strichzahl