188 74 6MB
German Pages 223 [224] Year 2004
L r a C C D G E A P H E C G A
Mainr
LEXICOGRAPHICA Series Maior Supplementary Volumes to the International Annual for Lexicography Supplements ä la Revue Internationale de Lexicographie Supplementbände zum Internationalen Jahrbuch für Lexikographie
Edited by Sture Allen, Pierre Corbin, Reinhard R. K. Hartmann, Franz Josef Hausmann, Ulrich Heid, Oskar Reichmann, Ladislav Zgusta 116
Published in cooperation with the Dictionary Society of North America (DSNA) and the European Association for Lexicography (EURALEX)
Zita Hollos
Lernerlexikographie: syntagmatisch Konzeption für ein deutsch-ungarisches Lernerwörterbuch
Max Niemeyer Verlag Tübingen 2004
Bibliografische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.ddb.de abrufbar. ISBN 3-484-39116-2
ISSN 0175-9264
© Max Niemeyer Verlag GmbH, Tübingen 2004 http://www.niemeyer.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbeständigem Papier. Druck und Einband: Digital PS Druck AG, Birkach
Danksagung
Vor allem möchte ich mich bei Herrn Professor Herbert Ernst Wiegand für seine intensive Betreuung sowie für seine konstruktive und anregende Kritik während der Arbeit sehr herzlich bedanken. Mit seiner Hilfe konnte ich mich schnell in die einschlägige metalexikographische Literatur einarbeiten und mich in die relevanten Teilbereiche der Wörterbuchforschung anhand seiner neuesten Beiträge vertiefen. Ihm ist zu verdanken, dass ich bereits am Anfang der Arbeit Kontakte zum Institut für Deutsche Sprache und zum Dudenverlag in Mannheim knüpfen konnte. Außerdem danke ich sehr meinem Zweigutachter PD Dr. Klaus-Peter Konerding für seine Verbesserungsvorschläge und tätige Hilfe bei der letzten Überarbeitung für die Veröffentlichung. An dieser Stelle möchte mich auch bei den Mitarbeitern des Instituts für Deutsche Sprache, Frau Kathrin Steyer und Herrn Cyril Belica, für ihre Hilfe bei den COSMAS-Korpusrecherchen und für die anregenden Diskussionen bedanken. Mein Dank gilt ebenso Herrn Werner Scholze-Stubenrecht, dass er mir die Einsicht in die Duden-Sprachkartei ermöglichte und nützliche Informationen über die lexikographische Praxis gab. Weiterhin bedanke ich mich herzlich bei meiner ungarischen Professorin Regina Hessky. Ohne sie wäre eine Promotion in Heidelberg für mich nicht möglich gewesen. Sie beriet mich bei der Arbeit am Kapitel über den ungarischen lexikographischen Gesamtprozess und an der kontrastiven Analyse der Wortkombinationen und vermittelte Ansprechpartner am Institut für ungarische Sprachwissenschaft der Ungarischen Akademie der Wissenschaften. Ein Dankeswort gilt ferner auch Herrn Tamäs Väradi, der mich mit den ungarischen maschinenlesbaren Korpora vertraut machte. Mein ganz besonderer Dank gilt meinem Kollegen Daniel Strigel, der die ganze muttersprachliche Korrektur der Dissertation übernahm. Ich danke hierbei auch Frau Eva Ruzsiczky, die die Probeartikel hinsichtlich des Ungarischen Korrektur las. Endlich, aber an erster Stelle danke ich sehr meinen Eltern, die mich in den letzten drei Jahren auf alle mögliche Art und Weise unterstützten sowie meinem Verlobten Jörg Dötsch, der mich stets ermutigte und mir die Druckvorlage Korrektur las. Außerdem bedanke ich mich bei meiner Freundin Margarita Lindinger, an die ich mich jeder Zeit mit meinen Fragen wenden konnte. Allen oben genannten Personen und denen, die ich hier nicht erwähnen konnte, aber mir bei der Dissertation auf irgendeine Weise behilflich waren, danke ich nochmals aus ganzem Herzen.
Heidelberg, im September 2003
Zita Hollös
Inhaltsverzeichnis
0. Begründung des Forschungsvorhabens
1
1. Der lexikographische Gesamtprozess hinsichtlich des Deutschen in Ungarn 1.1 Kurze Geschichte der deutsch-ungarischen und ungarisch-deutschen Lexikographie nach dem Zweiten Weltkrieg 1.2 Die deutsch-ungarische Wörterbuchlandschaft der Jahrtausendwende 1.2.1 Das deutsch-ungarische Großwörteibuch HALASZ/FÖLDES/UZONYI 1.2.2 Zwei neu konzipierte, deutsch-ungarische Handwörterbücher: HFLRA und
3
HESSKY
2. Allgemeiner Teil der Wörterbuchkonzeption 2.1 Zweck und Benutzerbezug des Wörterbuchs 2.2 Konzipierung einer Wörterbuchbasis 2.2.1 Sekundärquellen 2.2.2 Die Identifikation und Anordnung der Primärquellen 2.2.3 Vorstellung der COSMAS-I-Korpora 2.2.4 Recherche mit COSMAS1 2.3 Der Wörterbuchgegenstand 2.4 Bestimmung des zugrunde gelegten Kollokationsbegriffe 2.4.1 Die theoretische Basis des Kollokationsbegriffs 2.4.2 Die empirische Basis des Kollokationsbegriffs 2.4.3 Der Kollokationsbegriff intralingual 2.4.4 Datenerhebung und -Selektion für die Basis- und KollokatorWörteihuchartikel 2.4.5 Zwei mögliche Vorgehensweisen bei der kontrastiven Analyse der sprachlichen Daten 2.4.6 Der Kollokationsbegriff interlingual 2.4.7 Ergebnisdokumentation der lexikographisch aufbereiteten Daten für die Datenrepräsentation 2.5 Der Wörterbuchtyp 3. Das Programm für die Datendistribution 3.1 Die Datendistributionsstruktur auf die integrierten Bauteile des Wörterbuchs 3.2 Die Verteilung der Daten auf zwei Wörterverzeichnisse und eine vollständige Wörterbuchcharakteristik
3 7 7 12
17 17 23 24 27 27 30 37 38 39 44 45 53 66 70 77 79 81 81 84
4. Das Programm für die Mikrostruktur 87 4.1 Für die Wörterbuchkonzeption relevante Wörterbuchbenutzungssituationen und die damit verbundenen Wörterbuchfunktionen 87 4.1.1 Konsultationssituationen bei der gestörten Formulierung von Schriftstücken 89 4.1.2 Konsultationssituationen bei der gestörten Textlektüre 93 4.1.3 Nichtkonfliktbedingte Konsultationssituationen im Spracherlernungsprozess 96
VIII 4.2 Überblick über die verschiedenen Arten von Mikrostrukturen 4.3 Der Formkommentar zu verschiedenen Lemmazeichentypen im BasisWörterverzeichnis 4.4 Der semantische Kommentar zu verschiedenen Lemmazeichentypen im BasisWörterverzeichnis 4.4.1 Der semantische Kommentar zu Substantivlemmata 4.4.2 Der semantische Kommentar zu Verblemmata 4.4.3 Der semantische Kommentar zu Adjektivlemmata 4.5 Der Formkommentar und der semantische Kommentar zu verschiedenen Lemmazeichentypen im Kollokator-Wörterverzeichnis
101 104 113 114 120 127 133
5. Weitere artikelinterne textuelle Strukturen anhand von Probeartikeln aus dem Basis-Wörterverzeichnis 141 5.1 Konkrete Suchbereichsstrukturen sowie Suchbereichs- und Mikroarchitekturen zu verschiedenen Lemmazeichentypen 142 5.2 Die innere Schnellzugriffsstruktur 150 6. Die Makrostruktur und die äußeren Zugriffsstrukturen 153 6.1 Quantitative und qualitative Lemmaselektion 154 6.2 Äußeres Zugriffsprofil, Lemmaanordnung und makrostrukturelle Abdeckung.... 159 7. Die mediostrukturellen Komponenten 163 7.1 Verweisvoraussetzungen für das geplante Wörterbuch 163 7.2 Verschiedene Verweisarten und verweisvermittelnde Angaben im Wörterbuch.. 167 8. Zusammenfassung und Ausblick
173
9. Anhang 9.1 Probeartikel zu verschiedenen Lemmazeichentypen im Basis- und KollokatorWörterverzeichnis 9.1.1 Wörterbuchartikel zu Substantivlemmata 9.1.2 Wörterbuchartikel zu Verblemmata 9.1.3 Wörterbuchartikel zu Adjektivlemmata 9.1.4 Kollokator-Wörterbuchartikel 9.2 Probeartikel für ein deutsches syntagmatisches Wörterbuch 9.3 Linguistische Analyse der Wortkombinationen (intra- und interlingual)
177 177 177 179 181 182 189 192
Literatur Korpora Wörterbücher Sekundärliteratur
201 201 201 202
Resümees,
209
0.
Begründung des Forschungsvorhabens
Beim Übersetzen in die Fremdsprache (oder beim freien Schreiben in der Fremdsprache) nehmen die Wortverbindungen eine weitaus wichtigere Stellung ein, als man ihnen in den traditionellen zweisprachigen Übersetzungswörterbüchem (oder den einsprachigen Wörterbüchern der Fremdsprache) einräumt. Eine erschöpfende lexikographische Kodifizierung dieser für den Wörterbuchbenutzer vitalen Wortverbindungen würde denn auch toxikologische und metalexikographische Kategorien voraussetzen, die die Kriterien nicht nur zur Selektion und Darbietung der Wortverbindungen in den Wörterbuchartikeln angeben, sondern auch die Methoden zur Kontrastierung der Wortverbindungen. Die Diskussion dieser Kategorien und der Methodologie steckt aber erst in den Anfängen, vor allem was die kontrastive Lexikologie und somit auch die zweisprachige Lexikographie betrifft. (Kromann 1989,265; Hervorhebung - Z.H.)
Obwohl dieses Zitat von Kromann (1989) auf Ende der 80er Jahre zu datieren ist, hat es bis heute nicht an Relevanz verloren. Seine Bilanz ist nach wie vor ernüchternd zutreffend. Die theoretischen Probleme, die im Rahmen dieser Dissertation erörtert und für die einige Lösungsvorschläge unterbreitet werden, haben ihren Ursprung in der eigenen langjährigen lexikographischen Praxis. In erster Linie hat nicht die universitäre Beschäftigung mit Wörterbüchern und Wörterbuchdidaktik, sondern die Mitarbeit an dem völlig neu konzipierten, deutsch-ungarischen Handwörterbuch meine Aufmerksamkeit auf die Problematik der Auswahl und der Anordnung der Kompetenzbeispielangaben im Wörterbuch und in den jeweiligen Wörterbuchartikeln gelenkt.1 Im Rahmen der Tätigkeit als Autorin für Substantivlemmata, später bei der redaktionellen Betreuung des Substantivlemmabestandes im Rahmen des genannten Wörterbuchprojekts, und nicht zuletzt im Zusammenhang mit der Konzipierung und Verwirklichung eines eigenen deutsch-ungarischen Schulwörterbuchs gewann die Frage nach dem Beispielangebot relativ zum Wörterbuchtyp immer mehr an Gewicht.2 Vor allem die Problematik einer Abgrenzung der Kollokationen von den freien Wortkombinationen innerhalb der syntagmatischen Kompetenzbeispielangaben hat mein fachliches Interesse geweckt. Auf diese Fragen konnten die einsprachigen allgemeinen Wörterbücher und die Spezialwörterbücher - wie Duden Deutsches Universalwörterbuch (Duw), Langenscheidts Großwörterbuch Deutsch als Fremdsprache (LGWDAF) oder Duden Stilwörterbuch (DUDEN-2), um nur die wichtigsten zu nennen - keine befriedigende Antwort geben. Die lexikographische Praxis zeigt, dass dieses Problem noch nicht gelöst ist und dass die bisherigen Versuche nicht zufriedenstellend sind. Wenn man sich mit der einschlägigen Literatur auseinandersetzt und nach den Ergebnissen der linguistischen Forschung auf diesem Gebiet fragt, dann wird man schnell feststellen können, dass über den Kollokationsbegriff kein Konsens besteht, was sich mit den diversen Terminologien relativ zum jeweiligen Zweck erklären lässt. Nach wie vor ist Viehweger zuzustimmen, der behauptet, dass ein theoretisch tragfähiger Kollokationsbegriff gegenwärtig nach wie vor noch weitgehend ein Desiderat darstellt, daB ,Kollokation' somit zu jenen Kategorien der Linguistik gehört, die mit einer ganz unterschiedlichen Begrifflichkeit gebraucht werden. (Viehweger 1988,108)
1
2
Hessky, Regina (Chefredakteur): N6met-magyar k6ziszötir. Nemzeti Tankönyvkiadö - Grimm Kiadö. Budapest 2000. Hollös, Zita: N6met-magyar Suliszötär. Grimm Kiadö. Szeged 1999.
2 Des Weiteren ist anzunehmen, dass für diesen unbefriedigenden Zustand auch der Mangel an ausreichendem und angemessenem Beispielmaterial und dessen z.T. methodologisch einseitige, manchmal sogar oberflächliche Untersuchung, verantwortlich sind. Die Arbeiten von J. Bahns 1993a, 1993b, 1994, 1996, 1997 (überwiegend in Bezug auf das Englische) zählen - neben denen F. J. Hausmanns 1984, 1985, 1997 (für das Französische) oder den innovativen Arbeiten von H.-P. Kromann 1989, D. Viehweger 1982, 1989 und K. Steyer 2000, 2002a, 2002b, 2002c (für das Deutsche) - zu den wenigen neueren Arbeiten, die neben theoretischen Ausführungen auch praktische Relevanz aufweisen, obwohl nach meiner bisherigen Kenntnis weder in der Theorie noch in der Empirie eine annähernd vollständige Analyse und Systematisierung des Phänomens innerhalb eines gewissen Bezugsrahmens vorgenommen wurde. Zuletzt lässt sich das Forschungsvorhaben auch durch persönliche Motivation und praktisches Interesse begründen, die ihre Ursachen einerseits im früheren Studium des Deutschen als Fremdsprache und andererseits in der praktischen lexikographischen Arbeit an zwei zweisprachigen Wörterbuchprojekten haben. Die Entwicklung neuer und innovativer Konzepte für zweisprachige Wörterbücher (v.a. für zweisprachige Lernerwörterbücher) stellt eine ebenso aktuelle wie wichtige Aufgabe für die theoretische und praktische Lexikographie dar. Die Konzeption sollte sich hierbei an der Zweckbestimmung und dem anvisierten Benutzerkreis des jeweiligen Wörterbuchs orientieren. Die Maxime für die praktische Lexikographie könnte in diesem Sinne folgendermaßen lauten: Verwirkliche eine wissenschaftlich fundierte Wörterbuchkonzeption in einer „gut konsumierbaren " Form!
1.
Der lexikographische Gesamtprozess hinsichtlich des Deutschen in Ungarn
1.1 Kurze Geschichte der deutsch-ungarischen und ungarisch-deutschen Lexikographie nach dem Zweiten Weltkrieg Die Konzipierung eines zweisprachigen Wörterbuchs mit dem Sprachenpaar DeutschUngarisch für einen ungarischen Benutzerkreis erfordert die Einbettung des Vorhabens in den lexikographischen Gesamtprozess in Ungarn. Für die zu entwickelnde Wörterbuchkonzeption ist vor allem die neuere Geschichte der ungarischen Lexikographie, d.h. die Periode von dem Zweiten Weltkrieg bis zur Gegenwart, von Interesse. Eine Zusammenfassung der Geschichte der ungarischen Lexikographie von den Anfängen bis zur Gegenwart bietet Bakos (1991). Er schildert jedoch nur kurz die Zeitperiode nach dem Zweiten Weltkrieg. Die einst hervorragenden, einsprachigen lexikographischen Produkte der eisten Hälfte dieses Zeitraums sind leider bis heute die einzigen Werke dieser Art. Zu erwähnen sind die folgenden: im Sprachwissenschaftlichen Institut der Ungarischen Akademie der Wissenschaften erstelltes, großes ungarisches Bedeutungswörterbuch, A magyar nyeb> irtelmezö szötära (1962) mit ca. 60.000 Stichwörtern, die Handwörterbuch-Version des obigen Wörterbuchs, Magyar ertelmezö kiziszotär (1972), sowie die erste Synonymik, Magyar Szinonimaszötär von G. O. Nagy und έ. Ruzsiczky (1978). (vgl. Bakos 1991, 2378) Obwohl seit mehreren Jahren die Arbeiten an einem neuen, ungarischen Bedeutungswörterbuch im Sprachwissenschaftlichen Institut der Ungarischen Akademie der Wissenschaften im Gange sind, ist es immer noch nicht fertig gestellt worden. Zwar stellt ein sich Synonymwörterbuch nennendes Werk mit dem Titel Magyar Szökincstär [Ungarische Wortschatzkammer] von G. Kiss (1998) ein neues Produkt auf dem ungarischen Wörterbuchmarkt dar, kommt aber in Anbetracht des mangelhaften konzeptuellen Hintergrunds dem oben genannten Synonymwörterbuch von O. Nagy/Ruzsiczky (1978) bei weitem nicht nahe.1 Die zweisprachige Lexikographie erfährt bis Mitte der 60er Jahre auch einen Aufschwung. Beim Akademie Verlag erscheinen Großwörterbücher für das Russische, Deutsche, Englische, Französische und Italienische. Wie es im Vorwort des Verlages des Deutsch-ungarischen Großwörterbuchs von Haläsz/Földes/Uzonyi (1998) zu lesen ist: Im Laufe der Jahrzehnte veraltete jedoch diese - zu ihrer Zeit als modern geltende - Wörterbuchfamilie. Für ihre Erneuerung und Aktualisierung verfügte der Verlag in den sechziger Jahren noch über Geld und Mittel - später folgten lediglich unveränderte Nachdrucke. (HALÄSZ/FÖLDES/UZONYI 1998, XVII)
Daneben existieren weitere Klein- oder Taschenwörterbücher sowie Handwörterbücher auch für andere (nicht) europäische Sprachen. Das Spektrum der Wörterbuchtypen wird auch durch z.B. Dialektwörterbücher oder zweisprachige polytechnische Wörterbücher erweitert, (vgl. Bakos 1991,2380)
1
Siehe dazu RUZSICZKY (2000).
4 Ein Artikel von Kontra (1994-1995) lässt erahnen, was hinter den Kulissen der lexikographischen Werkstätten am Anfang dieser Periode ablief. Er berichtet über einen nicht veröffentlichten Vortrag von Laszlö Orszägh, eines der hervorragendsten praktischen Lexikographen seiner Zeit im Sprachwissenschaftlichen Institut, den er am 3. April 1953 an der Ungarischen Akademie der Wissenschaften hielt. In seinem Vortrag beschäftigt er sich in erster Linie mit der zweisprachigen ungarischen Lexikographie. Anhand seines Berichts kann man die Umstände der Entstehung der Wörterbücher und im Zusammenhang damit die Entstehung der heutigen lexikographischen Praxis einigermaßen in Erfahrung bringen. Die damalige lexikographische Praxis war durch drei Organe bestimmt: • durch das Lexikographische Komitee der Ungarischen Akademie der Wissenschaften: verant-
wortlich für die Bestimmung der äußeren und inneren Charakteristika der einzelnen Wörterbuchtypen und der lexikographischen Praxis sowie für die Festlegung der metalexikographischen Richtlinien (ab Frühling 1952) • durch das von der Ungarischen Akademie der Wissenschaften unabhängige,finanzielleOrgan, genannt Tärcabizottsäg: zuständig für diefinanziellenFragen hinsichtlich der Veröffentlichung der Wörterbücher und für ihre Anpassung an den Volkwirtschaftsplan • und durch den Akademie Verlag: beauftragt mit der Redaktion und Veröffentlichung der einzelnen Wörterbücher (ab 1951). Kontra bezeichnet zurückblickend diese Periode als „das goldene Zeitalter der ungarischen Lexikographie" und untermauert seine These mit einem Zitat aus Orszäghs Vortrag, in dessen Sinne seit Ende 1950 bis 3. April 1953 (Tag des Vortrage) zwanzig zweisprachige oder mehrsprachige Wörterbücher, in einer Auflagenzahl von etwa 175 000, erschienen sind. (vgl. Kontra 1994-1995,208-209) Die detaillierte Geschichte der deutsch-ungarischen und ungarisch-deutschen Lexikographie von der Jahrhundertwende bis zum Ende des Zweiten Weltkriegs ist bei Fejέr (1995) nachzulesen. Sie stellt die vier bedeutendsten lexikographischen Produkte dieser Zeit detailliert vor. Dies sind: Deutsches und Ungarisches Wörterbuch von Zs. Simonyi/J. Balassa (1899-1902), Taschenwörterbuch der ungarischen und deutschen Sprache von J. Balassa (1915-1917), Großes Handwörterbuch der deutschen und ungarischen Sprache von B. Kelemen (1929) und Nimet-magyar is magyar-nimet nagyszötdr [Deutschungarisches und Ungarisch-deutsches Großwörterbuch] von B. Kelemen, überarbeitet von T. Thienemann (1941/1942). Hinsichtlich der deutsch-ungarischen und ungarisch-deutschen Lexikographie von dem Zweiten Weltkrieg bis zur Gegenwart fehlt zur Zeit einschlägige Literatur. Abgesehen von einigen Aufsätzen sind kaum nennenswerte Wörterbuchrezensionen, ganz zu schweigen von Wörterbuchkritiken, ausfindig zu machen.2 Einer der Gründe dafür mag auch sein, dass zur Zeit noch keine Bibliographie zur ungarischen Lexikographie nach 1964 existiert. Die einzige mir bekannte Bibliographie, die die Periode zwischen 1945 und 1964 umfasst, jedoch keine Angaben über die Wörterbücher enthält, ist die von Magay (1966). In Zukunft soll eine Bibliographie zur ungarischen Lexikographie im Auftrag des Lexikographischen Komitees der Ungarischen Akademie der Wissenschaften erarbeitet werden. 2
Zur Zeit der Erscheinung des Deutsch-ungarischen Großwörterbuchs von E. HALASZ (1952) gibt es nur eine einzige Rezension über das Werk, und zwar ORSZÄGH (1953). WIEGAND (1992) berichtet zwar viel später in Zusammenhang mit dem neuen deutsch-ungarischen Wörterbuchprojekt von R. HESSKY über die Unangemessenheit dieses Werkes heutzutage, aber es fehlen immer noch ernst zu nehmende, wörterbuchkritische Arbeiten zu diesem Thema. Dieser Umstand ist mit kommerziellen, verlagsspezifischen und nicht zuletzt mit persönlichen Interessen zu erklären.
5 Im Folgenden wird über das Wenige, was über die Geschichte der deutsch-ungarischen und ungarisch-deutschen Lexikographie nach dem Zweiten Weltkrieg bei Fej6r (1995) zu finden ist, berichtet. Mit der Gründung des Sprachwissenschaftlichen Instituts der Ungarischen Akademie der Wissenschaften erfährt die ungarische Lexikographie - worauf bereits hingewiesen wurde - eine starke Aufwärtstendenz. Neben den bereits erwähnten einsprachigen Bedeutungswörterbüchern und Spezialwörterbüchern entwickelt sich die zweisprachige Lexikographie rasant. Die bereits bei Kelemens Wörterbüchern vorhandene Dreigliederung hinsichtlich der Größe in Klein- oder Taschenwörterbücher (20-30.000 Stichwörter), Handwörterbücher (40-60.000 Stichwörter) und GroBwörterbücher (ab 70.000 Stichwörter) ist bei den Wörterbüchern von Haläsz viel ausgeprägter. Während Kelemen sein Taschenwörterbuch (1897/98) immer mehr erweitert, geht Haläsz umgekehrt vor und reduziert sein deutsch-ungarisches (19S2) und ungarisch-deutsches (Groß-)Wörterbuch (1957) bis hin zum Kleinwörterbuch. Im deutschsprachigen Ausland gibt es kaum Wörterbuchinitiativen, abgesehen von einer Umarbeitung des Taschenwörterbuchs von Kelemen durch T. Thienemann, das 1956 in Graz veröffentlicht wurde. In Deutschland erschienen beim Langenscheidt Verlag die Wörterbücher von Haläsz. In Leipzig stellen die Kleinwörterbücher von H. Weissling (1962 und 1965) eigenständige lexikographische Produkte dar. Da den Wörterbüchern von Haläsz fast ein halbes Jahrhundert lang keine ähnlichen Werke gegenübergestellt werden konnten, waren sie die einzigen Quellen der deutschen Sprache für das ungarische Publikum. Seine GroBwörterbücher wurden mehrmals erweitert und neu verlegt. Die 2. („vollständig bearbeitete und erweiterte") Ausgabe des deutsch-ungarischen Wörterbuchs [Großwörterbuchs - Z.H.] ist 1967 in einem Band erschienen, die 3. Ausgabe - in der Änderungen nur als Anhang erschienen - 1970. Seitdem ist das Wörterbuch kein einziges Mal überarbeitet worden. (HALASZ/FÖLDES/UZONYI 1 9 9 8 , XVm)
Die Hand- und Kleinwörterbücher erfuhren eine noch größere Auflagenzahl, wobei die den Neuauflagen hinzugefügten Ergänzungen genauso nicht einmal in die Makrostruktur eingearbeitet wurden. Den Wörterbüchern, sowie dem Vorwort der ersten Auflage - wie allen literarischen, nicht literarischen und publizistischen Werken der damaligen Zeit - kann die allgemein gültige, politische Ideologie nicht abgesprochen werden. Laut Haläsz diente die damalige gesprochene Sprache mit ihren Einzelheiten im Alltag als Grundlage für sein Wörterbuch (damals ein vollkommen neuer Gedanke), wobei eine möglichst große Vollständigkeit angestrebt wurde. Früher nicht erfasste Teile des Fachvokabulars fanden darin Berücksichtigung, jedoch nur solche dialektalen Elemente wurden aufgenommen, die wichtige Unterschiede zwischen dem nord- und süddeutschen Sprachgebrauch darstellten. Laut Verfasser enthält das Wörterbuch ein reiches Angebot an syntaktischen Beispielen, Wortgruppen, Wendungen und Redensarten. Beide Wörterbücher sehen in erster Iinie ungarische Benutzer vor. Das deutsch-ungarische Wörterbuch dient dementsprechend der Textrezeption und bietet „mehr oder weniger differenziertes Material zu einem passiven Verständnis" (Haläsz 1957, VII-VIII), während dessen das ungarisch-deutsche Wörterbuch „möglichst fest umrissene und eingehend erläuterte Elemente zum aktiven Sprachgebrauch" (ebenda) verzeichnet. (vgl. Fej6r 1995,24-27) Es ist nicht Aufgabe dieser Arbeit die obigen Aussagen zu überprüfen, sowie systematische Wörterbuchkritik zu betreiben, sondern den Stellenwert dieser Wörterbücher in der heutigen Zeit mit Hilfe von Fachleuten zu bestimmen, die sich damit auseinandergesetzt haben. Fej£r (1995) beschäftigt sich in ihrem Buch kaum mit den Wörterbüchern von
6
Haläsz, weil sie die Entstehungszeit dieser Wörterbücher nicht zum Thema ihrer Arbeit gewählt hat, aber immerhin ist bei ihr zu lesen: Heute gelten die Wörterbücher von Haläsz dagegen in mancherlei Hinsicht als veraltet. Davon ist nicht nur das Wörterbuchkorpus betroffen, sondern auch zahlreiche Äquivalente sowie der ganze syntagmatische Bereich. (Fej6r 1995,27)
Wiegand (1992) untersucht die Wörterbücher von Haläsz, mit besonderer Berücksichtigung des deutsch-ungarischen Großwörterbuchs, hinsichtlich der Lemmaselektion, der Kompetenzbeispielangaben und einiger ausgewählten konzeptuellen Fragen, und formuliert eine viel schärfere Kritik als Fejör (1995): Für alle genannten Wörterbücher gilt: Hinsichtlich der Lexik der deutschen Standardsprache der Gegenwart ist die Lemma- und Sublemmaselektion und damit die quantitative und qualitative makrostrukturelle Abdeckung nicht mehr zeitgemäß. Es fehlen wichtige Teile der deutschen Lexik. Hinzu kommt, daB im großen Haläsz in vielen Fällen das in den Wörterbuchartikeln vorfindbare Deutsch kein korrektes gegenwärtiges Standarddeutsch ist. Weiterhin muß festgestellt werden, daB unter den verschiedenen neueren Aspekten der metalexikographischen Forschung die makrostrukturelle Anlage und die Textgestaltung der Artikel aller zweisprachigen Wörterbücher Dt.Ung./Ung.-Dt. in wichtigen Hinsichten überholt sind. (Wiegand 1992,344)
Wenn Fej6r (1995) behauptet: Der Schwerpunkt der deutsch-ungarischen und ungarisch-deutschen Lexikographie nach dem Zweiten Weltkrieg bis zur Gegenwart liegt ohne Zweifel bei Elöd Haläsz, der in dieser Hinsicht eine Art Monopol besitzt. (Fej6r 1995,25)
dann muss man dieser Aussage leider - wenn auch in einer abgeschwächten Form - zustimmen; ein großer Teil dieses Monopols am Anfang des 21. Jahrhunderts liegt nämlich immer noch bei den überarbeiteten Großwörterbüchern von Haläsz, die 1998 beim Akademie Verlag mit dem Titel Deutsch-ungarisches Grosswörterbuch mit neuer Rechtschreibung bzw. Ungarisch-deutsches Grosswörterbuch mit neuer Rechtschreibung von Haläsz/ Földes/Uzonyi (1998) erschienen sind. Die Stellungnahme des Verlags zum nahezu ein halbes Jahrhundert alten, lexikographischen Erbe ist deutlich: Wir haben uns entschlossen, keine absolut neuen Wörterbücher vorzulegen: Wir wollen all den Werten aus dem geistigen Nachlass der großen Verfasser, die bis heute noch Validität besitzen, treu bleiben. (HALÄSZ/FÖLDES/UZONYI 1 9 9 8 , XVII)
Inwieweit dieses Vorhaben heutzutage noch als angemessen gelten kann und in welchem Maße sie tatsächlich verwirklicht wurde, ist das Thema des nächsten Kapitels.
7 1.2
Die deutsch-ungarische Wörterbuchlandschaft der Jahrtausendwende
Die neueren zweisprachigen Wörterbücher mit dem Sprachenpaar Deutsch-Ungarisch sind für die vorliegende Wörterbuchkonzeption nicht nur wegen des lexikographischen Gesamtkontextes in Ungarn bedeutend, sondern sie spielen auch bei der Auswahl der sekundären Quellen für die Wörterbuchbasis eine wichtige Rolle.3 In diesem Kapitel werden die neueren Wörterbücher der Jahrtausendwende wegen des Mangels an metalexikographischer Literatur unter bestimmten ausgewählten Aspekten exemplarisch vorgestellt. Die Beispiele, die aus einem Kolloquiumsbericht von Wiegand (1992) hinsichtlich des deutsch-ungarischen Großwörterbuchs von Haläsz (1992) stammen, werden zum Zweck des Vergleichs von HALÄSZ (1992) mit dem überarbeiteten Großwörterbuch HALÄSZ/FÖLDES/UZONYI (1998) übernommen. Es geht dabei darum, festzustellen, in welchem Maße es sich bei HALÄSZ/FÖLDES/UZONYI DT.-UNG. (1998) um ein verbessertes und erweitertes Werk handelt, weiterhin ob es dieser Überarbeitung von HALÄSZ tatsächlich eine „Weiterentwicklung des Werkes" (HALÄSZ/FÖLDES/UZONYI 1998, XIX) vorliegt, wie es die Verfasser behaupten und aus den Rezensionen von M. Wermke (1999) und R. Fej6r (1999) zu entnehmen ist. Andererseits soll mit Hilfe der Gegenüberstellung der zwei Wörterbücher der Wert von HALÄSZ/FÖLDES/UZONYI DT.-UNG. für die Wörterbuchbasis bestimmt werden. Anschließend werden auch die zwei neu konzipierten, deutsch-ungarischen Handwörterbücher von I. H6ra (1996) und von R. Hessky (Hg.) (2000) kurz vorgestellt. Rezensionen über diese Wörterbücher waren bisher nicht zu finden.
1.2.1 Das deutsch-ungarische Großwörterbuch
HALÄSZ/FÖLDES/UZONYI
Der erste Aspekt, unter dem das deutsch-ungarische Großwörterbuch HALÄSZ/FÖL· DES/UZONYI (1998) untersucht wird, ist die Lemmaselektion. Im Vorwort der Herausgeber findet man als eines der Ziele der Überarbeitung „die Auffrischung des Stichwortbestandes des mehr als 45-jährigen Wörterbuchs, was sowohl Streichungen als auch Erweiterungen bedeutet" (HALÄSZ/FÖLDES/UZONYI 1998, XIX), weiterhin: Veraltete oder unrichtige lexikalische Elemente (wie evtl. überhaupt nicht existierende und von uns „Phantomwörtei" genannte Einheiten) wurden gelöscht oder mit konkretisierenden Bemerkungen versehen, z.B. „veraltet". Nicht wenige solcher Stichwöiter mussten gestrichen oder durch andere ersetzt werden, die in der Ausgangssprache fehlerhaft oder gar falsch waren, (ebenda) Vergleichen wir als erstes den Lemmabestand von HALÄSZ (1992) mit dem des überarbeiteten Wörterbuchs HALÄSZ/FÖLDES/UZONYI (1998), um die obigen Aussagen überprüfen zu können. Die folgende Tabelle stellt einen Teil der Lemmastrecke , 3 " IM HALÄSZ/FÖL· DES/UZONYI (1998), und zwar die erste Spalte auf der Seite 314, verglichen mit den gleichen Strecken im HALÄSZ (1992) und im 2Duw (1989), dar. (vgl. Wiegand 1992,344-348)
3
Zur Wörterbuchbasis siehe Kapitel 2.2.
8 HALASZ/FÖLDES/UZONYI 1
HALASZ
2
DUW
Böse bösen
+
+
-
-
bösen (sich) Bösewicht bösfertig
+
-
+
+
+
•
bösgesbiBt -* bösfertig Bösglänbigkeit boshaft Boshaftigkeit Bosheit böshendg Bösing Boskett böslich Bösling bösmäulig bösmeinend Bosniak
+
-
+
-
-
+
-
+
-
+
+
-
Bosniake —> Bosnier Bosnickel Bosnien Bosnier Bosnigl -> Bosnickel bosnisch Bosporus Boss Bossage Bosse Boßel Bosselbahn bosselieren bosseln bosseln boßen -» bösen Μ A f l C A A i m ΑΜΑΜ nossenqnaaer Bossenwerk Bossiereisen bossieren -* bosselieren Bossierer —> Bossler
+
•
-
+
+
-
+
-
+
-
+
-
-
+ +
+ + +
+ +
+ +
+ + +
+ + + + +
9 HALÄSZ/FÖLDES/UZONYI
Bossterwachs
HALÄSZ
2
Duw
-
+
+
_ _
+
-
_
+
-
+
+
+
+
+
UOSslg
Bossler Höst1 Böst2 Boston1 Boston2 böswillig -> bösmeinend Böswilligkeit bot1 -» bieten Bot bot.2 Botanik Botaniker botanisch botanisieren Botanisiertrommel Bötchen Bote 58 (49)
+ + -
+
+ + + + +
+
-
+
17
37
Tab. 1: Lemmateilstrecke , 3 " im HALÄSZ/FÖLDES/UZONYI (1998, 314), verglichen mit den gleichen Teilstrecken im HALÄSZ (1992) (E. Haläsz: Deutsch-ungarisches Großwörterbuch) und im 2Duw (1989) (Duden Universalwörterbuch), Erklärungen zur Tabelle: + Lemma ist im Wörterbuch vorhanden, - Lemma ist im Wörteibuch nicht vorhanden, —> Verweis(lemma), Lemmata in Normalschrift: sind sonst in keinem der zwei Wörterbücher vorhanden, Zahlen: Zahl der insgesamt verzeichneten Lemmata Aus den 5 8 Lemmata im HALÄSZ/FÖLDES/UZONYI sind 4 9 entweder in einem der untersuchten Wörterbücher - HALÄSZ bzw. 2 Duw - oder sogar in beiden vorhanden. Die neun Lemmata {bösen, Bosniak, bosnisch, Bossage, Bosselbahn, boßen -* bösen, bossig, Bossler, bot2), die keines der zwei Wörterbücher verzeichnet, stehen in Normalschrift und können im Weiteren außer Acht gelassen werden. Zusätzliche Lemmata, die nur in einem der zwei Wörterbücher erscheinen, sind in der Tabelle nicht mitverzeichnet. Im HALÄSZ ist es ausschließlich das Lemma Böse2, das entweder im HALÄSZ/FÖLDES/UZONYI vergessen wurde, oder der Index beim Lemma Böse1 (evtl. bei Streichung von Böse2 oder bei der Lemmaselektion) fälschlicherweise nicht getilgt wurde. Dieser Fehler untermauert sogar die Behauptung des Verlages im Vorwort, dass das fast ein halbes Jahrhundert alte HALÄSZ als Grundlage zur Lemmaselektion gedient hat.4 Die Frage ist nur: In welchem Maße wurde der Lemmabestand von HALÄSZ tatsächlich revidiert und erweitert? 2Duw bringt drei zusätzliche Lemmata, nämlich Boskop, Bossa Nova und Boston3. Abgesehen von den insge4
Keines der zwei anderen Wörteibücher verzeichnet zwei Homonyme im Falle von Böse.
10 samt vier Zusatzlemmata sind alle anderen Lemmata der zwei Wörterbücher (HÄLÄSZ bzw. 2 DUW) im HALASZ/FÖLDES/UZONYI zu finden. Hinzu kommt noch, dass insgesamt fünf Lemmata (Böse, Bösewicht, böswillig, Böswilligkeit und Bötcheri) sowohl im HALASZ als auch im 2DUW aufgeführt sind. Wenn man die kleinen Plus-Zeichen in der Tabelle verfolgt, ist nicht zu verkennen, dass sie abwechselnd, aber fast kontinuierlich über die Lemmastrekken der zwei Wörterbücher - HALÄSZbzw. 2 Duw - verlaufen.5 Da diese Praxis keineswegs einen Zufall darstellt, sondern auch für die Fortsetzung der Lemmastrecke sowie für andere Lemmastrecken zutrifft, liegt die Vermutung nahe, dass die oben genannten Wörterbücher systematisch und fast ausschließlich zur Lemmaselektion herangezogen wurden. Nach Wiegand (1992) sind 40% der Lemmata im HALASZ (1992) veraltet, oder sie gehören zum Peripheriebereich der heutigen deutschen Lexik (vgl. Wiegand 1992, 348). Die Lemmata der obigen Lemmateilstrecke wurden jedoch mit einer einzigen Ausnahme auch aus dem alten HALASZ übernommen. Obwohl der Mangel an Wörtern, die zum Kernwortschatz gehören und bisher im HALASZ gefehlt haben, durch die Lemmaselektion anhand von 2 Duw beseitigt wurde, enthält das neue, überarbeitete, deutsch-ungarische Großwörterbuch HALASZ/FÖLDES/UZONYI immer noch einen großen Anteil an Lemmata, die aus diesem, nicht mehr zeitgemäßen Lemmabestand stammen. Im Folgenden wird das deutsch-ungarische Großwörterbuch HALÄSZ/FÖLDES/UZONYI (1998) im Hinblick auf die Kompetenzbeispielangaben untersucht. Dieser Teil des Datenangebots ist für den Entwurf einer Wörterbuchkonzeption von erheblicher Bedeutung. Wied e r u m w e r d e n Beispiele v o n HALASZ ( 1 9 9 2 ) aus W i e g a n d s Kolloquiumsbericht ( 1 9 9 2 )
herangezogen, um die Kompetenzbeispielangaben mit denen im HALÄSZ/FÖLDES/UZONYI (1998) zu vergleichen. Die zwei Wörterbuchartikel, die jetzt näher betrachtet werden, sind
befestigen und flammen. tetettgtn [h.] I. (vt.lvi.J I. hozz4-/meg-/fel-/odfierösit, rOgzit, hozziköt; er befestigte den Schirm mit einem Riemen an dem Koffer aζ emyöt szijjal odaerösitette a töröndre; den Faden am Ende ~ a fonalat a vigin odaerAsiti/tlvarrja/elcsomäzza 2. (Üv.) megerS* sit, megsziUrdit; jn im Glauben ~ megerösit valaklt abban a hitben; er hat seinen Ruhm befestigt öregbitette/megszilärditotta hfr(nev)it 3. (lud.) megerösft, erödftäi munkAIatolcat vtgez; die Stadt ~ megerösiti a virost II. (v. refl) sich ~ megerösftdlk, megszilirdul; die Preise ~ sieh aζ ärak megsziUrdulnalc b e f e s t i g e n h I. ts/tn i 1. hozzä-/meg-/fel-/odaerösit, rögzit, hozzäköt, er befestigte den Schirm mit einem Riemen an dem Koffer az ernyot szijjal odaerositette a böröndre; den Faden am Ende — a fonalat a vegen odaerösiti/elvarrja/ elcsomözza 2 . ätv megerösit, megszilirdit; jn im Glanben — megerösit valakit abban a hitben; er hat seinen Ruhm befestigt öregbitette/megszilärditotta hir(nev)et 3 . kat megerösit, eröditesi munkälatokat vegez; die Stadt — megerösiti a värost II. vh i s i c h — megerösödik, megszilirdul, die Preise — sich az ärak megszilärdulnak
Abb. 1: wa! aus HALASZ Dt.-Ung. ( 1 9 9 2 ) und wa2 aus HALASZ/FÖLDES/UZONYI Dt.-Ung. 5
(1998)
Wenn aus der Gesamtzahl der Lemmata von HALASZ/FÖLDES/UZONYI ( 5 8 ) die Zahl der weder im noch im 2Duw verzeichneten Lemmata ( 9 ) abzieht, bekommt man 4 9 . Diese Zahl stimmt mit der aus den zwei Lemmazahlen (17 und 37) zusammengerechneten Summe (54) minus 5 wegen der in beiden verzeichneten Lemmata - überein. HALASZ
11 Auf den ersten Blick ist es zu erkennen, dass die zwei Wörterbuchartikel, einerseits aus HALASZ und andererseits aus HALÄSZ/FÖLDES/UZONYI, abgesehen von der Typographie, 100% gleich sind. Eine konzeptionelle Änderung ist gleich am Anfang des Wörterbuchartikels zu beobachten. Die lateinischen Termini der grammatischen Angaben wurden ins Ungarische übersetzt. Die ehemalige Angabe in Form von (vL/vL), anhand derer die Information verbum transitivum / verbum intransitivum zu erschließen ist, wurde durch die gleiche ungarische Abkürzung ts/tn i (= tdrgyas/tärgyatlan ige) ersetzt. Für alle diasystematischen Angaben gilt, dass sich die Klammem bei ihnen erübrigt haben, weil die Textgestaltung der Wörterbuchartikel im neuen Wörterbuch durch die reichere Typographie viel anspruchsvoller wurde. Diese Erneuerung hat sich positiv auf die Benutzerfreundlichkeit ausgewirkt. Sonst wurde am Inhalt des Wörterbuchartikels nichts geändert, was umso erstaunlicher ist, weil Wiegand (1992) die Kompetenzbeispielangaben jn im Glauben ~ und er hat seinen Ruhm ~ als nicht übliche Verwendungen des Wortes einstuft. Den reflexiven Gebrauch (die Preise ~ sich) hält er für ein merkwürdiges Deutsch (vgl. Wiegand 1992, 348-349). All diese Verwendungsweisen stehen aber nach wie vor im neuen deutsch-ungarischen Großwörterbuch HALÄSZ/FÖLDES/UZONYI. Der andere Wörterbuchartikel, den Wiegand (1992) untersucht hat, ist flammen. tl-ammcn [Ii.] I. (vi.) 1. a) (dtv. is) lobog, längol, ig, izzik; b) csillog, villog, tündöklik; da flammte sein Gesicht erre Längba borult aζ area; die Leidenschaft flammt a szenvedäy perzsel/iget; Liebe flammt in meiner Brust längol a szivem a szerelemtöl; es hat die gaou Nacht geffammt egesz ejjel vilttralott; durch den Sinn ~ ätvillan az agyän 2. (ΜΛ.) IS II. (vt.) 1. leperael 2. (dtv.) sugäroz; Utre Augen ~ Liebe szeretem tüze ig scemiben 3. (lex.) habosit, moiri-mintival ellät 4. (sztnt) Zinkit
fl-ammen h. tn i; väl a) ätv is lobog, längol, eg, izzik b) csillog, villog, tündöklik; da flammte sein Gesicht erre längba borult az area; die Leidenschaft flammt a szenvedely perzsel/eget; Liebe flammt in meiner Brust längol a szivem a szerelemtöl; es hat die ganze Nacht geflammt egesz ejjel villämiott; durch den Sinn — ätvillan az agyän
Abb. 2: wa3 aus HALASZ Dt.-Ung. (1992) und wa4 aus HALÄSZ/FÖLDES/UZONYI Dt.-Ung. (1998) Bedeutung I I . wurde offensichtlich im neuen Wörterbuch HALASZ/FÖLDES/UZONYI getilgt, und das Lemma wurde mit der stilistischen Markierung väl (=välasztekos), auf Deutsch gehoben, versehen. Für die Kompetenzbeispielangaben da flammte sein Gesicht und Liebe flammt in meiner Brust sind sie auf jeden Fall zutreffend. Die Verwendungen: die Leidenschaft flammt, es hat die ganze Nacht geflammt oder durch den Sinn ~ gehören nicht zur deutschen Standardsprache (vgl. Wiegand 1992, 349-350). All diese Angaben sind weiterhin Teil des Datenangebots im Wörterbuchartikel flammen des neuen Großwörterbuchs HALÄSZ/FÖLDES/UZONYI.
Die obigen Wörterbuchartikel sind keine Ausnahmen. Diese Praxis zieht sich durch das ganze Wörterbuch hindurch. Abgesehen von quantitativen Unterschieden (Streichung und Aufnahme neuer Lemmata und/oder Bedeutungen), die sich notwendiger Weise gleichzeitig auch qualitativ auswirken, sind relevante Unterschiede qualitativer Art hinsichtlich der Äquivalenzstruktur und der Kompetenzbeispielangaben zwischen dem alten HALASZ und
12 dem neuen, überarbeiteten HALÄSZ/FÖLDES/UZONYI kaum zu beobachten. Da das deutsche Sprachmaterial im HALÄSZ/FÖLDES/UZONYI dem gegenwärtigen Standarddeutsch des Alltags nicht gerecht wird, kann dieses Wörterbuch in die Wörterbuchbasis des zu konzipierenden Wörterbuchs für Deutschlerner nicht aufgenommen werden.
1.2.2 Zwei neu konzipierte, deutsch-ungarische Handwörterbücher: HfiRAund HESSKY Die folgenden zwei, deutsch-ungarischen Handwörterbücher: Nimet-magyar szötär von I. H6ra (1996) und Nimet-magyar kiziszötär von R. Hessky (Hg.) (2000) zeichnet eine völlig neue Wörterbuchkonzeption aus. Das Vorwort der Verleger von HESSKY (2000) betont diese Tatsache gleich am Anfang: Zeitwende. Mit dem Deutsch-ungarischen Wörterbuch von Regina Hessky haben Nationaler Lehrbuchverlag und Grimm-Verlag die Verwirklichung eines neuen Wörteibuchpiogramms begonnen. Damit wird auf inhaltlich-konzeptioneller Ebene nach vierzig Jahren ein neues Programm in Ungarn in die Wege geleitet. (HESSKY 2000, VII) Die Verfasser des obigen Wörterbuchs stützten sich nicht auf bereits vorhandene, jedoch nicht mehr zeitgemäße, deutsch-ungarische Wörterbücher, sondern sie nahmen die wichtigsten einsprachigen, deutschen Bedeutungswörterbücher - neben vielen anderen ein- und zweisprachigen Nachschlagewerken - in ihre Wörterbuchbasis auf. Im deutsch-ungarischen Handwörterbuch HESSKY werden die wichtigsten Quellen beim Namen genannt und die Zielsetzungen klar formuliert: Bei der Erstellung des Wörterbuchs haben wir angestrebt, den Bereich des heutigen deutschen Wortschatzes, der am häufigsten in den gesprochenen und geschriebenen Texten vorkommt, aufgrund der zeitgemäßesten lexikographischen Prinzipien zu beschreiben. Bei der Zusammenstellung des Stichwortbestandes, sowie des lexikographischen Datenangebots haben wir uns auf die neuesten deutschen, einsprachigen Wörterbücher und andere Nachschlagewerke gestützt (unter anderem: DUDEN. Deutsches Universalwörterbuch. 21989, 31996, DUDEN. Die deutsche Rechtschreibung 211996, Langenscheidts GroBwörterbuch Deutsch als Fremdsprache. Neubearbeitung 1998). (HESSKY 2000, IX; Übersetzung - Z.H.) Darüber hinaus werden die Zielgruppe, die spezifischen Wörterbuchbenutzungssituationen und -gewohnheiten sowie die daraus resultierenden Funktionen des Wörterbuchs klar definiert: Wir empfehlen unser Wörterbuch vor allem denjenigen Benutzern mit ungarischer Muttersprache, die (bereits) deutsche Originaltexte lesen/übersetzen, bzw. die sich intensiv mit der Aneignung der deutschen Sprache beschäftigen. Bei der Erarbeitung der Organisationsprinzipien haben wir uns bemüht, die Ansprüche und Gebräuche hinsichtlich der Wörterbuchbenutzung in Ungarn weitgehend zu berücksichtigen. Der Wörterbuchbenutzer findet deshalb nicht nur die genaue Beschreibung der imgarischen Entsprechungen der deutschen Wörter, sondern auch viele grammatische, in gewissen Fällen phonetische Angaben. Wir haben auch die Darstellung derregionalenUnterschiede innerhalb des deutschen Sprachgebiets berücksichtigt, besonders die österreichischen Varianten der Alltagssprache. Auf diese Weise kann das Wörterbuch zur Wissenskontrolle gebraucht werden. (HESSKY 2000, IX; Übersetzung - Z.H.) Das Wörterbuch sieht in seinem Aufbau und hinsichtlich der darin berücksichtigten Angabetypen nicht nur konfliktbedingte Konsultationssituationen bei der Sprachrezeption vor wie es bereits aus dem vorigen Zitat ersichtlich wurde - , sondern es soll auch bei Konsulta-
13
tionssituationen bei der Produktion deutschsprachiger Texte, ja sogar bei nichtkonfliktbedingten Konsultationssituationen im Spracherlernungsprozess gute Hilfe leisten. Das deutsch-ungarische Wörterbuch HESSKY ist demzufolge in einem viel höheren Maße bidirektional und multifunktional, als die bisherigen deutsch-ungarischen Wörterbücher, insbesondere sein Parallelstück H£RA. Der Vergleich beider Werke wird diese Behauptung zufriedenstellend beweisen. Die Redakteure von HESSKY haben auf das Beispielangebot einen besonderen Wert gelegt: „Der Gebrauch der Äquivalente wird sehr häufig mit Beispielen verdeutlicht." (HESSKY 2000, X) Zum ersten Mal in der ungarischen Lexikographie wird der schwierige Versuch gewagt, die Kompetenzbeispielangaben in zwei Angabetypen Beispielangaben und Kollokationsangaben zu unterteilen.6 Kollokationen werden wie typische, in Rezeptionssituationen (wegen Übersetzungsschwierigkeiten) abweichende und deshalb fehleranfällige Wortverbindungen definiert. Sie sind also interlinguale linguistische Phänomene. * Auf die Beispiele - mit einem Doppelstrich (||) getrennt - können KoDokationen folgen. Unter Kollokationen verstehen wir solche für das Deutsche typischen Wortverbindungen, deren Übersetzung mit der angegebenen ungarischen Entsprechung der jeweiligen Bedeutung nicht möglich ist, oder eine ungewöhnliche Lösung darstellen würde. In den Kollokationen wird das Stichwort durch eine Tilde (-) ersetzt. (HESSKY 2000, X; Übersetzung - Z.H.)
Wir wollen im Folgenden unter den gleichen Aspekten wie bei HALASZ/FÖLDES/UZONYI (1998) die zwei neu konzipierten Wörterbücher - H£RA (1996) und HESSKY (2000) - miteinander vergleichen, wiederum um eine Wahl für die Wörterbuchbasis des zu konzipierenden Wörterbuchs für Deutschlerner treffen zu können. Die zwei Wörterbücher haben, was die Zahl der Lemmata betrifft, etwa die gleiche Größe. Auf der ersten, vorderen Einbandseite von HFIRA (1996) steht, dass das Wörterbuch mehr als 35.000 Stichwörter und etwa 30.000 Beispiele enthält. Auf der hinteren, vierten Einbandseite von HESSKY (2000) ist zu lesen, dass mehr als 40.000 Lemmata im Wörterbuch verzeichnet und ungefähr 60.000 Beispiele und ihre Übersetzungen angeführt sind. HESSKY zeichnet sich dementsprechend durch eine reichhaltigere Mikrostruktur aus. Ein einsprachiges deutsches Wörterbuch mit ähnlicher Größe, das zum Vergleich herangezogen werden kann, ist das erste deutsche Lernerwörterbuch von Langenscheidt (LGWDAF 1998). Nach der Zählung von Bergenholtz/Meder (1998) beträgt die Lemmazahl nur 33.000, und nicht - wie auf der hinteren, vierten Einbandseite steht - 66.000 (vgl. Bergenholtz/Meder 1998,287).
Im Folgenden betrachten wir die selbe Lemmateilstrecke wie vorher, also vom Lemma Böse bis zum Lemma Bote. Die Tabelle gibt einen schnellen Überblick über die Lemmateilstrecken in den drei Wörterbüchern:
6
Phraseologismen werden separat, im Postkommentar des Wörterbuchartikels verzeichnet und beschrieben.
14 HÜRA (1996)
Böse(r) Böse(s) Bösewicht boshaft Bosheit Bosnien bosnisch Boß böswillig Böswilligkeit bot -» bieten Botanik
HESSKY (2000)
LGWDAF (1998)
Bösewicht boshaft Bosheit
Bösewicht boshaft Bosheit
Boss böswillig
Boss böswillig
bot -* bieten
bot - * bieten Bot Botanik
botanisch Bote
Botanik Botaniker botanisch Bote
14
10
botanisch Bote 10
Tab. 2: Lemmateilstrecken ,,Β" im H£RA (1996), HESSKY (2000) und LGWDAF (1998), Erklärungen zur Tabelle: H£RA (1996): I. H6ra: Deutsch-ungarisches Wörtexbuch, HESSKY (2000): R. Hessky: Deutsch-ungarisches Handwörterbuch, LGWDAF (1998): Langenscheidts Großwörterbuch Deutsch als Fremdsprache, Zahlen: Zahl der insgesamt verzeichneten Stichwörter Es fällt gleich auf, dass die Lemmastrecke im HESSKY mit der im LGWDAF fast 1 0 0 % übereinstimmt. Was die Zahl der Lemmata anbelangt, führen beide 10 auf, während dessen H6RA fast doppelt so viele verzeichnet. Beide deutsch-ungarischen Wörterbücher enthalten - mit einer einzigen Ausnahme (Bot) - alle Stichwörter von LGWDAF in ihrem Lemmabestand. Die meisten Zusatzlemmata im H£RA findet man auch im LGWDAF vor. Sie stehen entweder als abgeleitete Wörter am Ende des Wörterbuchartikels oder eines semantischen Subkommentars mit der Markierung hierzu (z.B. Böswilligkeit bei böswillig) oder im Anhang (z.B. Bosnien, bosnisch im Anhang 1: Land/Gebiet/Region - Einwohner - Adjektiv). Die Anordnung der Lemmata ist auch unterschiedlich: im H£RA nischenalphabetisch, im HESSKY demgegenüber initialalphabetisch. Die Lemmaselektion von H£RA und HESSKY entspricht also der deutschen Standardsprache der Gegenwart. Eine Frage muss jedoch noch gestellt und beantwortet werden, und zwar: Wie adäquat und brauchbar ist das Beispielangebot der beiden Handwörterbücher für die Deutschlemer? Betrachten wir zunächst den substantivischen Wörterbuchartikel Boot im HFIRA und im HESSKY, um über die Kompetenzbeispielangaben der beiden Wörterbücher einige Aussagen machen zu können.
15 Boot das; -(e)s, -e 1 csönak; — f a h r e n csönakizik; in/mit einem - über den See fahren csönakkal ätkel a tavon • Boots-
B o o t das, -(e)s, -e csönak: einßinkes/langsamts Boot fürge/lassii csönak » Boot fahre» csönakäzik • i n e i n e m / i m g l e i c h e n — s i t z e n egy csonakban eveznek
A b b . 3 : w a 5 a u s H6RA D t . - U n g . ( 1 9 9 6 ) u n d wa« a u s HESSKY D t - U n g . ( 2 0 0 0 )
Beide Wörterbücher führen zwei Beispiele für die Verwendung des Wortes Boot auf. Im H 6 R A wird das Wort jedes Mal mit dem Verb fahren verwendet, jedoch in unterschiedlichen Konstruktionen: einmal ist das Substantiv Boot Akkusativergänzung (-fahren), ein andermal Adverbialbestimmung zum Verb (in/mit einem ~ über den See fahren). H E S S K Y demgegenüber verzeichnet zwei attribuierte Gebrauchsweisen des Stichwortes in Form einer verdichteten Kompetenzbeispielangabe (ein flinkes/langsames Boot) und dazu noch das gleiche Beispiel wie H £ R A : Boot fahren. Die Kompetenzbeispielangaben sind im H E S S K Y weniger verdichtet, da das Stichwort stets voll ausgeschrieben ist, was die Benutzerfreundlichkeit des Wörterbuchs erhöht. Die anderen Wörterbuchartikel, die zum Vergleich herangezogen und hier abgebildet werden, sind Verbartikel zu bombardieren. bombardieren V100·; hat 1 Mil bombiz 2 ätv jdn mit etw D — vkit vmivel bombäz, elhalmoz, ostromol
b o m j b a r j d l s i r e n A h bombäz vkit/ vmit: eine Stadt bombardieren värost bombäz » jn mit Fragen bombardieren kirdesekkel bombäz vkit
A b b . 4 : w a 7 a u s H£RA D t . - U n g . ( 1 9 9 6 ) u n d w a s a u s HESSKY D t . - U n g . ( 2 0 0 0 )
gibt ein Gebrauchsmuster zur Verwendung des Wortes an. Demgemäß verfügt das Verb über zwei Leerstellen: jn und mit etw D. Es wurde hier leider versäumt, zwischen obligatorisch oder fakultativ zu unterscheiden. Darüber hinaus wurde die Ergänzung etwas neben jemanden außer Acht gelassen. H E S S K Y sieht eine Unterscheidung zwischen obligatorischen und fakultativen Ergänzungen vor. Bei diesem Stichwort wurde jedoch neben dem Akkusativobjekt ( A ) das Präpositionalobjekt ( m i t + D ) nicht mitverzeichnet, obwohl in der zweiten Kompetenzbeispielangabe für die übertragene Bedeutung des Stichworts (jn mit Fragen bombardieren) beide Ergänzungen erforderlich sind. Die erste Kompetenzbeispielangabe (eine Stadt bombardieren) demonstriert, wie das angegebene Akkusativobjekt (A) realisiert werden kann. Die obigen Beispiele zeigen bereits, dass die angeführten Daten zu den Stichwörtera in den zwei neu konzipierten, deutsch-ungarischen Wörterbüchern einander ergänzen und erhellen, deshalb beide ihren Platz in der Wörterbuchbasis des zu konzipierenden zweisprachigen Wörterbuchs haben. Der Vollständigkeit halber seien hier noch die selben Wörterbuchartikel Boot und bombardieren auch aus dem Wörterbuch H A L Ä S Z / F Ö L D E S / U Z O N Y I zitiert: H£RA
s B o o t i~(e)s, —ei Jn 1. csönak, sajka; diagonal gebautes keresztpalinkozäsü csönak; ldinkeraitig gebautes — zsindelyszerüen epült csönak; zusammenlegbares — összeesukhatö csönak; aus dem Schiffe ins — bilen hajöböi csönakba szäll 2 . naszäd 3 . tref Inagy eipö] esuka, csönak b o m b a r d i e r e n h. ts i 1. bombäz; ju mit Vorwürfen - vkit szemrehänyäsokkal elhalmoz 2 . lövet/Ιό (tüzerseggel) A b b . 5 : wa» u n d w a 1 0 a u s HALÄSZ/FÖLDES/UZONYI D t . - U n g . ( 1 9 9 8 )
16 Die zwei ersten Verwendungen des Wortes Boot mit Adjektiven (diagonal gebautes klinkerartig gebautes ~) stellen sehr spezielle, fachsprachliche Gebrauchsweisen dar. Wenn der Benutzer kein Bootexperte oder -interessierter ist, wird er nie solche Kombinationen in deutschen allgemeinsprachlichen Texten vorfinden. Für den im dritten, ungewöhnlichen Beispiel (zusammenlegbares bezeichneten Gegenstand existiert im Deutschen ein gebräuchliches Kompositum: Schlauchboot. Niemand würde es so, wie es im Wörterbuch steht, nennen. Die ungarischen Übersetzungen der obigen drei Kompetenzbeispielangaben klingen genauso seltsam. Das vierte Beispiel (aus dem Schiffe ins ~ fallen) sollte laut ungarischer Übersetzung aus dem Schiff ins ~ steigen heißen. Es würde einen nicht wundern, wenn der Verfasser dieses Beispiels bei einem solchen Umsteigen auf den Kopf gefallen wäre. Diese Gebrauchsweise fällt auf jeden Fall aus dem Rahmen. Was soll ein potenzieller Benutzer mit solchen Kompetenzbeispielangaben anfangen? Genauso stellen die weiter unten angeführten Bedeutungen des Wortes keine allgemein gültigen Verwendungen dar. Ihre Quelle war nicht ausfindig zu machen. Im Falle des Wörterbuchartikels bombardieren sieht es anders aus. Es steht darin kein Verweis darauf, dass das Wort im übertragenen Sinne (ungarische Markierung: ätv) verwendet werden kann, es wird aber ein Beispiel gerade für diese Verwendung angeführt. Die Gebrauchsweise jn mit Fragen bombardieren ist gebräuchlicher als jn mit Vorwürfen deshalb ist das Beispiel im HESSKY m.E. gelungener. Diese zwei Wörterbuchartikel sprechen wiederum dafür, das deutsch-ungarische Großwörterbuch HALÄSZ/FÖLDES/UZONYI in die Wörterbuchbasis eines produktionsbezogenen Wörterbuchs für Deutschlerner nicht aufzunehmen, demgegenüber HßRA und HESSKY - vor allem das letztere wegen der verzeichneten, interlingualen Kollokationen - in der Wörterbuchbasis in hohem Maße zu berücksichtigen.
2.
Allgemeiner Teil der Wörterbuchkonzeption
2.1 Zweck und Benutzerbezug des Wörterbuchs Wörterbücher lassen sich nach unterschiedlichen Kriterien jeweils anders typologisieren, wobei je nach Hierarchie der Kriterien bestimmte Schnittmengen verschiedener Teilmengen entstehen. Das gängigste Unterscheidungskriterium ist die Zahl der im Wörterbuch berücksichtigten Sprachen. Man nimmt eine Einteilung zwischen einsprachigen bzw. zweioder mehrsprachigen Wörterbüchern vor, wobei die letztere Teilkategorie relativ selten und vor allem bei Fachwörterbüchern vorkommt. Des Weiteren lässt sich nach der jeweiligen Zweckbestimmung zwischen allgemeinen Wörterbüchern und Spezialwörterbüchern differenzieren. Innerhalb der Spezialwörterbücher kann man je nach dem behandelten sprachlichen Teilbereich von Rechtschreib-, Aussprache-, Fremd-, Synonym- oder Stilwörterbüchern usw. sprechen. Wenn vor allem der Benutzerkreis mitberücksichtigt werden soll und auf die Klasse der allgemeinen Wörterbücher unterschiedlicher Größe bezogen wird, kann zwischen den einsprachigen allgemeinen Wörterbüchern für Muttersprachler und denen für Fremdsprachenlerner unterschieden werden, wobei die letzteren auch einsprachige Lernerwörterbücher genannt werden, (vgl. Bahns 1993,138) Wie geht man vor, wenn einsprachige oder zweisprachige Spezialwörterbücher hinsichtlich ihres Benutzerbezugs differenziert werden sollen? Bei vielen einsprachigen oder zweisprachigen Spezialwörterbüchern hat die Unterscheidung des Benutzerkreises in Muttersprachler und Fremdsprachenlerner keinen Sinn. Was würde ein Rechtschreibwörterbuch für Deutschleraer bringen, geschweige denn ein zweisprachiges? Auch wenn sich bestimmte Eigenschaften des Wörterbuchs verändern würden, lohnte es sich nicht, ein solches Wörterbuch zu konzipieren und zu verwirklichen, weil der Arbeitsaufwand in keinem angemessenen Verhältnis zum Ergebnis stehen würde. Die Lage wäre aber im Falle eines Synonymwörterbuchs anders. Der Benutzerbezug im Bereich der einsprachigen Synonymiken müsste konzeptuelle Veränderungen mit sich bringen. Nicht umsonst wird an mehreren Stellen für eine distinktive Synonymik für Deutsch als Fremdsprache anstatt einer kumulativen plädiert. Die Relevanz eines zweisprachigen distinktiven Synonymwörterbuchs ist aber wiederum diskutabel. Betrachten wir zunächst eine besondere Art der Spezialwörterbücher, und zwar das Stilwörterbuch (Dictionary of Style), in Anlehnung an die englische Lexikographie auch Konstruktionswörterbuch genannt, weil der Gegenstand der vorliegenden Arbeit die Konzipierung eines so genannten Stilwörterbuchs ist.1 Bis dieser Typ des Spezialwörterbuchs in einem späteren Kapitel (Kapitel 2.5 „Der Wörterbuchtyp") begrifflich zunächst näher bestimmt und dann definiert wird, werde ich mich der Allgemeinverständlichkeit wegen des Ausdrucks Stilwörterbuch bedienen. Darunter wird der Wörterbuchtyp des Duden Stilwörterbuchs verstanden. Zur Zeit existieren nur wenige Stilwörterbücher für Einzelsprachen. Für das Deutsche gibt es beispielsweise ein älteres, zweibändiges Stilwörterbuch aus der ehemaligen DDR (Stilwörterbuch 1970) und zwei neuere: zum einen Das Stilwörterbuch aus der Duden-Reihe ( D U D E N - 2 71988) und zum anderen sein ostdeutsches Pendant Wörter und Wendungen von E. Agricola (WuW 141992). Das in ihnen dargebotene sprachliche 1
BENSON/BENSON/ILSON: The BBI Combinatory Dictionary of English. 1986.
18 Material lässt jedoch im Vergleich zu den allgemeinen Wörterbüchern nur quantitative, aber keine relevanten qualitativen Unterschiede erkennen. Der Stilduden kann kurz und bündig folgendermaßen charakterisiert werden: Die angesetzte Lemmazahl ist geringer, die Bedeutungsstruktur weniger differenziert und die Bedeutungserklärungen sind kürzer als in den allgemeinen Wörterbüchern des Deutschen; es fehlen bestimmte Angaben, z.B. solche zur Etymologie oder zur Aussprache. Demgegenüber ist die Zahl der Beispiele meistens erheblich größer. Die Kompetenzbeispielangaben unterliegen einem strikt grammatischen Ordnungsprinzip. „Einfache Beispiele und Beispielsätze wechseln sich dabei ab" (DUDEN2, 1988 , 8-9) und stehen den „festen Verbindungen und Wendungen (Phraseologismen)" (ebenda, 9) gegenüber. Ebenso wenig wie zwischen Beispielangaben in Form von Syntagmen oder von (Teil-)Sätzen im Wörterbuchartikel unterschieden wird, wird auch keine Differenzierung zwischen freien Wortkombinationen und Kollokationen vorgenommen. Im Vergleich zum ersten einsprachigen Lernerwörterbuch Langenscheidts Großwörterbuch Deutsch als Fremdsprache (LGWDAF, 1993) ist das keine zufriedenstellende Lösung. In dem erwähnten Wörterbuch wird zwischen Beispielsätzen und so genannten Kollokationen mikrostrukturell und auch typographisch ein Unterschied gemacht. Der Begriff Kollokation wird in Anlehnung an den Britischen Kontextualismus „relativ weit gefasst, sodass dazu auch durchaus lose Kombinationen zählen" (LGWDAF, 1998, XX). Für das Ungarische ist zur Zeit kein Stilwörterbuch vorhanden, und sogar die einsprachigen allgemeinen Wörterbücher sind, was das sprachliche Material betrifft, vor allem literarisch, deshalb mehr oder weniger veraltet und lückenhaft, obwohl sie in der Entstehungszeit als qualitativ hochwertig galten. Nach diesem kleinen Exkurs zu einsprachigen Stilwörterbüchern möchte ich im Folgenden das Augenmerk auf den potenziellen Benutzerkreis der Fremdsprachenlerner lenken und zusätzlich das Problem der Ein- und Zweisprachigkeit in Bezug auf das zu konzipierende Wörterbuch behandeln. Die Beantwortung folgender Fragen ist in diesem Zusammenhang von Relevanz: 1. Wie lässt sich die Notwendigkeit eines StilwörterbuchsfirFremdsprachenlerner begründen ? 2. Soll das produktionsbezogene StilwörterbuchfirDeutschlerner ein- oder zweisprachig konzipiert werden? 3. Welche Konsequenzenfirdie Wörterbuchkonzeption hat der Stichverhalt, dass das Wörterbuch vor allem bei der Textproduktion von Nutzen sein soll? 4. Ist es simwoll, wenn in einem zweisprachigen produktionsbezogenen Stilwörterbuch neben Kollokationen auch freie Wortkombinationen verzeichnet werden?
Die erste Frage lautet: Wie lässt sich die Notwendigkeit eines Stilwörterbuchs für Fremdsprachenlerner begründen? Bei der Beantwortung dieser Frage können pragmatische und didaktische Argumente angeführt werden. In der Wortschatzdidaktik hat man lange unter systematischer Wortschatzarbeit eine primär paradigmatisch orientierte Vorgehensweise verstanden. Man fragte nach Synonymen und Antonymen. Es wurde zu einem Hyperonym in Anlehnung an die Wortfeldtheorie (Basisebene) eine Reihe von Hyponymen gesammelt, oder, und das war etwas Neues, die Schüler mussten zu einem Stichwort thematisch damit zusammenhängende Wörter suchen. Auch die freien Wortassoziationen in Form eines so genannten Wortigels wiesen in eine neue Richtung, nämlich in die der Onomasiologie. Die Wortlisten in den Lehrbüchern jedoch blieben immer noch alphabetisch oder nach Lektionen geordnet, und mit einigen Ausnahmen, wie z.B. dem MEMO von Langenscheidt (1995), gibt es kaum fortschrittliche Lehrwerke für die Wortschatzarbeit. In den wenigen onomasiologischen
19 Sammlungen für Sprachlerner findet die Kombinierbarkeit des Wortes mit anderen keine Berücksichtigung („nackte" Wörter ohne irgendeinen sprachlich adäquaten Kontext). Weiterhin sind wenige onomasiologische Wörterbücher vorhanden, und selbst diese lassen diesen Aspekt meistens außer Acht. Wie sieht es demgegenüber mit den semasiologischen Wörterbüchern aus? Die allgemeinen einsprachigen semasiologischen Wörterbücher für Muttersprachler oder Sprachlerner befassen sich zwar mit syntagmatischen Relationen (die letzteren im Idealfall in einer stärker ausgeprägten Form), aber da sich diese Wörterbücher sowohl für die Rezeption als auch für die Produktion sowie für das Übersetzen eignen sollen, können sie sich nicht auf befriedigende Weise auf die syntagmatischen Relationen der Wörter konzentrieren. Demzufolge können sie innerhalb dieses Bereichs keine solche Differenzierung, wie sie die Wichtigkeit des Problems erfordert, vornehmen. Hier sollten Spezialwörterbücher wie das Stilwörterbuch ins Spiel kommen. Umso erstaunlicher ist die Tatsache, dass solche Wörterbücher bis jetzt nur für Muttersprachler konzipiert sind. Damit kann man zwar das ausschließlich formale Anordnungsprinzip der Beispielangaben innerhalb der einzelnen Bedeutungen erklären, aber nicht unbedingt das Versäumnis, wenigstens den Versuch einer Systematisierung und Differenzierung der Wortkombinationen mit ihren unterschiedlich stark ausgeprägten Restriktionen vorzunehmen. Genauso wenig kann so die grobe Handhabung der stilistisch-pragmatischen Markierungen in Bezug auf das Beispielangebot begründet werden. Darüber hinaus ist die Muttersprachlichkeit der Zielgruppe kein Grund für das Verschweigen der Selektionskriterien, foils solche überhaupt existieren. Hat man die spezifischen Bedürfnisse der Deutschlerner auf syntagmatischer Ebene beim Sprechen, Schreiben und Übersetzen bisher übersehen, weswegen es womöglich noch kein produktionsorientiertes Stilwörterbuch für Deutsch als Fremdsprache gibt? Oder hat man einfach angenommen, dass das Duden Stilwörterbuch und die wenigen Lernerwörterbücher des Deutschen für diese Zwecke ausreichen? In späteren Kapiteln dieser Arbeit soll die Naivität dieser Annahme nachgewiesen werden, vor allem in Anlehnung an COSMAS-I-Korpora, die ein Teil des IDS-Korpus - des größten elektronisch verfügbaren Korpus des Deutschen - sind. Die Argumentation für ein produktionsbezogenes Stilwörterbuch für Deutschlerner möchte ich mit Bezug auf Hausmann schließen: Differenziertes Verstehen und vor allem sprachrichtiges Sprechen und Schreiben steht und fällt mit der Kenntnis der Syntagmatik der Wörter. Gebrauchen muß man sie können! (Hausmann, 1984,406, Hervorhebung von Z.H.) Die zweite Frage lautet: Soll das produktionsbezogene Stilwörterbuch für Sprachlerner einoder zweisprachig konzipiert werden? Die Antwort auf diese Frage fällt deshalb schwer, weil je nach Wörterbuchkultur eines Landes - deren in diesem Zusammenhang relevantester Aspekt die Gesamtheit der Gewohnheiten der Wörterbuchbenutzung ist - , und vor allem je nach fremdsprachlicher Kompetenz und Alter der Benutzer verschiedene Antworten möglich sind. Deshalb ist die Bestimmung des spezifischen Benutzerkreises des zu konzipierenden Wörterbuchs an dieser Stelle für die weitere Argumentation unabdingbar. In Anbetracht der Tatsache, dass am Anfang des Spracherlernungsprozesses sehr viel rezipiert wird, und Sprechen und Schreiben sich in erster Linie auf reproduktive Tätigkeiten beschränken, können die Anfänger als Zielgruppe ausgeschlossen werden. Die nächste Gruppe der Sprachlerner von der Sprachprüfung der Grundstufe bis zu deijenigen der Mittelstufe kommt als Zielgruppe in Frage. Ihre Suchfragen vor allem bei der schriftlichen Produktion oder beim Übersetzen werden bei der Konzeption in gewissem Maße mitbe-
20
rücksichtigt. Als primäre Zielgruppe werden jedoch diejenigen Deutschlerner anvisiert, die bereits über eine mittlere oder höhere Kompetenz in der Fremdsprache, bezogen auf ein festgelegtes Niveau der Sprachprüfung mittlerer Stufe, verfügen. Von ihren Fähigkeiten und Bedürfnissen abhängig können sie die im Wörterbuch dargebotenen Daten zur Beantwortung einer spezifischen Suchfrage heranziehen. Daneben sollen sie das Wörterbuch aber auch zur Weiterentwicklung ihrer Sprachkenntnisse benutzen können. Da in Ungarn heute bereits in der Grundschule zwei Fremdsprachen unterrichtet werden (mittlerweile ohne Russisch als Pflichtfach), kann man davon ausgehen, dass das Alter der voraussichtlichen Benutzergruppe zwischen 16 und 24 Jahren liegt. Im ungarischen Schulsystem setzt sich dieser Adressatenkreis aus Schülern der letzten beiden Gymnasialklassen sowie aus Studierenden zusammen. Die untere Grenze kann sich bei Fachmittelschulen bisweilen nach oben verschieben, wie auch die obere Grenze unter Umständen (weit) höher liegen kann. Insofern wird bei dieser Wörterbuchkonzeption eine Benutzergruppe ungarischer Jugendlicher von durchschnittlich 16 und 24 Jahren angenommen. Kommen wir jetzt auf die Beantwortung der Frage der Ein- oder Zweisprachigkeit des geplanten Wörterbuchs vor dem Hintergrund der ungarischen Wörterbuchkultur zurück. Eine jüngere in Budapest durchgeführte Untersuchung von U. Langanke (1996) zeigt, dass nur 6% der Studenten der Fachhochschule Bdnki Dondt überhaupt ein einsprachiges deutsches Wörterbuch besitzen, obwohl sie Deutsch als erste Fremdsprache erlernen. Daraus folgt, dass - wenn überhaupt - zweisprachige Wörterbücher benutzt werden. Das ist eine aus der Realität gewachsene praktische Begründung für die Zweisprachigkeit des zu konzipierenden Wörterbuchs. Der Hauptgrund für die Zweisprachigkeit ist jedoch in dem dieser Arbeit zugrunde gelegten, pragmatisch motivierten Kollokationsbegriff zu suchen. Die bisherigen einsprachigen Wörterbücher leisten relativ gute Dienste beim Verstehen von Kollokationen, obwohl die Nuancierungen hinsichtlich der Bedeutung, der Stilschicht und der Gebräuchlichkeit kaum berücksichtigt werden und die interlingualen Unterschiede zwangsläufig nicht einbezogen werden können. Deshalb wird bei dieser Wörterbuchkonzeption ein Schwerpunkt auf die Sprachproduktion gelegt, mit dem Ziel, dass in der praktischen didaktischen Lexikographie endlich eindeutige Schritte in diese Richtung unternommen werden. Der Ausgangspunkt bei der Sprachproduktion ist - sehr vereinfacht - das Bedürfnis, etwas angemessen mitzuteilen. Das Ergebnis einer gelungenen Sprech- oder Schreibhandlung sind Propositionen in einer bestimmten sprachlichen Form, wobei die handelnde Person sich neben lexikalischen Einheiten der grammatischen Regeln bedient, beides jedoch nicht voneinander getrennt, weil sie sich gegenseitig beeinflussen und ergänzen. Erst durch den Vergleich mit einer anderen Sprache lassen sich die Besonderheiten des Deutschen darstellen, wie es Hausmann hervorhebt: Systematische Kollokationsarbeit kann, ja sollte, zweisprachig erfolgen. (Hausmann, 1984,405)
Die Zwischenbilanz der bisherigen Ausführungen lautet deshalb folgendermaßen: Die Notwendigkeit eines produktionsbezogenen Stilwörterbuchs ßr Fremdsprachenlerner wurde unter einigen Aspekten erläutert, und seine Relevanz grob umrissen. Weitere Argumente werden bei der Analyse der Ergebnisse aus den COSMAS-I-Korpora angeführt. Auf die Frage nach der Zweckmäßigkeit der Zweisprachigkeit wurde eine hypothetische positive Antwort gegeben, deren Hintergrund im Folgenden und detailliert im Kapitel 2.4 über den dem Wörterbuch zugrunde zu legenden Kollokationsbegriff erläutert wird. Bei der Problematik der Ein- oder Zweisprachigkeit wurde die Bestimmung des Benutzerkreises (ungarische Jugendliche im Alter von durchschnittlich 16 und 24 Jahren) geleistet. Auf die in diesem Zusammenhang wichtigen Ergebnisse und Annahmen aus der Wörterbuchbenutzungs-
21 forschung, darüber hinaus auf einige lernpsychologisch motivierte Thesen sowie Hypothesen aus der kognitiven Linguistik kann ich im Rahmen dieser Arbeit leider nicht eingehen. Nachdem die Relevanz eines zweisprachigen produktionsbezogenen Stilwörterbuchs im Umriss nachgewiesen wurde, kann die dritte Frage formuliert werden: Welche Konsequenzen für die Wörteibuchkonzeption hat der Sachverhalt, dass das Wörterbuch vor allem bei der Textproduktion von Nutzen sein soll? Diese Frage ist mit Hausmanns Kollokationstheorie zu beantworten, die er für das Französische entwickelt hat. Was schließlich die Unterscheidung in Basis und Kollokator angeht, so fehlt sie in der germanistischen Forschung ebenso wie in der anglistischen. (Hausmann 1985,129) Hausmann unterscheidet innerhalb der Kollokation zwischen zwei nicht gleichberechtigten Kombinationspartnern. Die semantisch autonome Komponente, die zur Semantisierung der anderen Komponente beiträgt, heißt Basis. Die andere Komponente, der Kolbkator ist zur Basis affin, was bedeutet, dass er dazu neigt, mit der Basis kombiniert aulzutreten und dass die Zahl der möglichen Basen begrenzt ist. Die Semantik der Kombinationspartner reicht zur Erklärung der Restriktionen nicht aus. Bei den Kollokatoren ist sogar eine vollständige Semantisierung ohne die zulässigen Basen nicht möglich. Verbindungen dieser Art nennt Hausmann im Sinne von ,,Halbfertigprodukte[n] der Sprache" Kollokationen, die eine „auffallende Üblichkeit" aufweisen, was nicht mit der Häufigkeit der Verbindung zu verwechseln ist. (vgl. Hausmann 1984,396-399) Wenn innerhalb einer Kollokation das bestimmende, semantisch autonome Wort die Basis ist, und wenn die Behauptung zulässig ist, dass sie den Kollokator evoziert, dann liegt die Annahme nahe, dass ein produktionsbezogenes Stilwörterbuch die Kollokationen unter dem Basiswort verzeichnen sollte. Sie [Kollokationswörteibücher (wie z.B. DUDEN-2: Stilwörterbuch) - Z.H.] sollten sich nicht nur auf spezifische Kombinationen, d.h. auf wirkliche Kollokationen beschränken, sie sollten sich auch darauf beschränken, die Kollokationen ausschließlich unter dem Basiswort einzutragen. Dort aber exhaustiv und auch mit stark erweitertem Lemmabestand. (Hausmann 1985,123) Diese Vorgehensweise, die Kollokationen von der Basis her zu bearbeiten, ist in der Wortschatzdidaktik die onomasiologisch ausgerichtete Methode, im Gegensatz zu einer Form der Wortschatzarbeit, die vom Kollokator ausgeht, der so genannten semasiologischen Methode. Das Ziel des Lernens von der Basis aus ist es, ein „banales Alltagswort, das semantisch keinerlei Schwierigkeiten aufwirft, das häufig gebraucht wird, überhaupt verwendungsfähig zu machen" (Hausmann 1984, 404). Bei einer zweisprachigen Kollokationsarbeit stellt die Übersetzung der Basis keinerlei Probleme dar, aber die Äquivalenzfindung für den Kollokator ohne die Basis ist meistens unmöglich. Nicht nur die Semantik, sondern auch das fremdsprachliche Äquivalent des Kollokators wird von der Basis her mitbestimmt, (vgl. Hausmann 1984,403-405) Die Tatsache, daB die Äquivalenzen für den Kollokator von Kollokation zu Kollokation wechseln, macht die zweisprachige Albeit zumindest teilweise erforderlich. (Hausmann 1984,405) Wenn jedoch aufgrund des Produktionsbezugs die Kollokationen nur unter der jeweiligen Basis aufgeführt werden, versäumt man die Möglichkeit dieser Kontrastierung, weil selbst mit einer gut durchdachten Verweisstruktur die Äquivalenzrelationen nicht auf einen Blick überschaubar sind. Eine vorstellbare Lösung wäre, die Kollokatoren im Falle der Sprachrichtung Ungarisch-Deutsch als Lemmata anzusetzen. Der Vorteil dieser Methode ist nicht
22 zu überschätzen, weil die (ungarischen) Benutzer, wenn sie mit dem vorrangigen Lemmaselektionskriterium (nur eine beschränkte Zahl von Basen) nicht vertraut sind, diese Kombinationen sehr wahrscheinlich, gerade wegen des fehlenden deutschen Äquivalents, unter der muttersprachlichen Entsprechung des Kollokators und nicht unter dem ungarischen Basiswort suchen würden. Wenn die Kollokatoren im engeren Sinne auch als Lemmata angesetzt wären, resultierte jedoch daraus ein sehr unausgewogener Lemmabestand.2 Die Sprachrichtung Ungarisch-Deutsch wäre insgesamt wegen der fehlenden Primärquelle und Kotextanalyse für das Ungarische nicht zu empfehlen, deshalb kann man für das zu konzipierende Wörterbuch als Sprachrichtung Deutsch-Ungarisch festlegen.3 Bei einem deutsch-ungarischen Stilwörterbuch sollte unbedingt darauf verzichtet werden, die Kollokatoren als Lemmakandidaten anzuerkennen, weil sonst ein seltsamer Wörterbuch-Mischtyp entstehen würde, der für die Beantwortung auf Suchfragen im Produktionsprozess hinsichtlich deutscher Basen konzipiert wurde, jedoch rezeptionsorientierte Charakteristika in Bezug auf die deutschen Kollokatoren aufweist. Weiterhin wäre dadurch die eindeutige Zweckbestimmung aufgehoben. Dies könnte dazu führen, dass das Wörterbuch in rezeptionsbezogenen Benutzungssituationen viel mehr als sinnvoll zu Rate gezogen würde, was wegen des begrenzten Lemmabestandes (ein paar Tausend Basen und eine bestimmte Zahl zugehöriger „echter" Kollokatoren) erfolglose Nachschlagehandlungen und eine enttäuschte Verurteilung des Wörterbuchs mit sich bringen könnte. Für den Lemmabestand würde dann auch die oben erläuterte Uneinheitlichkeit gelten. Es bleiben nur zwei Möglichkeiten, das Kollokationspotenzial eines Kollokators an einem Ort zu präsentieren. Die eine besteht in Form von Binnentexten, wobei man nach einem formalen oder korpusbasierten statistischen Prinzip (Alphabet vs. Ergebnisse der Kollokationsanalyse anhand von COSMAS I) eine der Basen auszeichnen muss. Die andere Möglichkeit wäre jedoch geeigneter und zweckmäßiger, nämlich die der Konzipierung eines zweiten Wörterverzeichnisses der deutschen Kollokatoren, in welchem das Kollokationspotenzial jedes einzelnen Kollokators verzeichnet werden könnte. In beiden Fällen muss die Vorgehensweise mit einer komplexen Mediostruktur einhergehen. Im ersten Fall muss bei jeder Basis diejenige Basis als Verweisadresse angegeben werden, bei welcher der Binnentext bezüglich des Kollokators auffindbar ist. Im zweiten Fall muss bei jedem Vorkommen des Kollokators unter der jeweiligen Basis deutlich auf den Kollokator als Teil eines zweiten Wörterverzeichnisses verwiesen werden. All die oben aufgeführten Gründe sprechen jedoch für die Konzipierung eines zweiten Wörterverzeichnisses für die deutschen Kollokatoren. Die vierte und in diesem Zusammenhang letzte Frage lautet folgendermaßen: Ist es sinnvoll, wenn in einem zweisprachigen produktionsbezogenen Stilwörterbuch neben Kollokationen auch freie Wortkombinationen verzeichnet werden? Die Bedeutung der freien Wortverbindungen bei der sprachlichen Produktion wird oft unterschätzt. Dies hängt oft mit einer anderen Terminologie zusammen, in welcher der Kollokationsbegriff viel weiter gefasst wird. Ich möchte an dieser Stelle im Voraus auf die relativ enge Beschaffenheit und kontrastive Orientiertheit des hier zugrunde gelegten Kollokationsbegriffs aufmerksam machen. Vor diesem Hintergrund ist verständlich, dass die meisten Kollokationen erst auf einer höheren Sprachstufe ins Spiel kommen, einerseits weil ihr Gebrauch mit einem gewissen Automatismus in der Fremdsprache und mit einem differenzierten, vor allem schriftlichen Formulieren, zusammenhängt. Sie signalisieren oft eine 2 3
Siehe Kapitel 2.4 Aber den zugrunde gelegten Kollokationsbegriff. Siehe Kapitel 2.4.5.
23 höhere Ebene der Sprachkultur (in Anlehnung an Wiegand 1981). Die Bestandteile einer Kollokation treten relativ oft zusammen auf, aber das bedeutet noch nicht, dass sie auch einzeln (vor allem der Kollokator) häufig vorkommen. Deshalb ist es gerade für weniger fortgeschrittene Lerner unerlässlich, dass das Wörterbuch auch die „banalen und häufigen" Kombinationen verzeichnet. Einerseits fördert diese Praxis mit der Zeit das Entstehen eines produktiven Automatismus im bereits vertrauten, häufig nur noch passiven Wortschatzbereich. Andererseits unterstützt sie durch die Aufzählung möglicher Kombinationspartner die Erweiterung der Formulierungskompetenz und trägt somit vor allem zur Verbesserung der Qualität der selbst erstellten Texte bei. Es ist sicher lempsychologischrichtig,audi Ko-Kreationen (alsofreieWortkombinationen - Z.H.) unter dem Basiswort zusammenzustellen, nur muß klar sein, daß damit der eigentliche Problembereich der Wortkombination, nämlich der Bereich der Kollokationen, überhaupt noch nicht angeschnitten ist. (Hausmann 1984,403) Die Richtigkeit dieser Aussage stellt sich auch in der lexikographischen Praxis heraus. Wörterbücher werden von den Vertretern eines engeren Kollokationsbegriffs oft gerade wegen der (nicht) verzeichneten Kollokationen stark kritisiert. In diesem Zusammenhang wird für mehr Kollokationen und weniger freie Wortkombinationen plädiert. Das Hauptproblem liegt bei den syntagmatischen Kompetenzbeispielangaben, jedoch nicht in der Verteilung der aufgeführten freien Wortkombinationen und Kollokationen - weil in den Wörterbüchern nicht einmal eine derartige Unterscheidung vorgenommen wurde - , sondern im Versäumnis einer praktikablen, theoretisch fundierten Differenzierung zwischen ihnen sowie in der Auswahl der syntagmatischen Beispielangaben. Nach welchen Kriterien ist die Selektion aus den (oft nicht) angegebenen Quellen erfolgt? Warum hat sich der Lexikograph für diese und nicht für jene Wortkombination entschieden? Jeder Wörterbucheintrag enthält eine große Anzahl von Hypothesen zu den Wortbedeutungen, den Kollokationen, zur Grammatik usw. Wie werden diese Tausenden von Hypothesen über die moderne deutsche Standardsprache geprüft und getestet? Der Lexikograph tut es an seinem Schreibtisch nicht durch (elektronische) Überprüfung der Hypothesen in einer lexikographischen Datenund Korpusbank, sondern er schlägt in den anderen Wörterbüchern nach. Dies ist das große empirische Problem der Lexikographie der deutschen Standardsprache. (Kromann 1995,512) Im vorliegenden Ansatz wird für dieses unbedingt zu lösende Problem ein korpusbasierter Lösungsvorschlag in Bezug auf die syntagmatischen Kompetenzbeispielanganben unterbereitet und damit auf die Nutzungsmöglichkeiten eines computerlesbar aufbereiteten und im Internet zugänglichen Korpus wie die COSMAS-I-Korpora aufmerksam gemacht.
2.2 Konzipierung einer Wörterbuchbasis Die Wörterbuchbasis definiert Wiegand (1998a) wie folgt: Unter einer Wörteibuchbasis verstehe ich das gesamte sprachliche Ausgangsmaterial für einen lexikographischen Prozeß, also die Menge aller primären, sekundären und tertiären sowie gegebenenfalls weiteren Quellen. (Wiegand 1998a, 139)
24 Zu den primären Quellen gehören Texte, die meistens schriftlich sind und aus natürlichen Kommunikationssituationen stammen. Diese Texte bilden das lexikographische Korpus oder das Textkorpus, das in der Phase der Materialaufbereitung exzerpiert wird, woraus letztendlich die Belegkartei, die lexikographische Kartothek entsteht. Sekundäre Quellen sind alle Wörterbücher, die im Laufe der Erstellung eines Wörterbuchs herangezogen werden. Welche bei der Materialbeschaffung obligatorisch, welche fakultativ konsultiert werden, legt das Instruktionsbuch fest. Zu den tertiären Quellen gehören alle anderen Sprachmaterialien, die verwendet werden, (vgl. Wiegand 1998a, 139-141) Bevor ich mich mit den primären Quellen für das zu konzipierende Wörterbuch ausführlich befasse, werde ich kurz auf die allgemeinen Kriterien für die Auswahl der sekundären Quellen, nämlich der einsprachigen deutschen Wörterbücher eingehen, da die Selektion der zweisprachigen Wörterbücher bereits im Kapitel 1.2 erfolgt ist.
2.2.1 Sekundärquellen Im Folgenden werden die in Frage kommenden deutschen Sekundärquellen exemplarisch mit Hilfe von zwei Stichproben miteinander verglichen und anschließend die geeignetesten festgelegt. Die zentrale sprachliche Eigenschaft, anhand derer die sprachlichen Ausdrücke in diesem geplanten Stilwörterbuch für Deutschlerner beschrieben werden, ist die der Syntagmatik. Da das Wörterbuch deutsch-ungarisch angelegt ist, wird die Kombinierbarkeit deutscher sprachlicher Einheiten beschrieben. Aus diesem Grund sind in erster Linie die einsprachigen deutschen Wörterbücher, aber auch die zweisprachigen deutsch-ungarischen Wörterbücher - die bereits behandelt wurden - von Bedeutung. Innerhalb der einsprachigen Wörterbücher kann der Kreis der in Frage kommenden Wörterbücher weiter auf die syntagmatischen Spezialwörterbücher (DUDEN-2 und WuW) und auf die Lernerwörterbücher (LGWDAF und DGWDAF) verengt werden. Eine Darstellung der im Wörterbuch verzeichneten Wortkombinationen zu den Wörtern Drohung und (sich) amüsieren kann bei der weiteren Selektion eine Hilfe sein.4 Zum Vergleich werden außer einem großen einsprachigen Wörterbuch, DUDEN-3Gw auch die COSMAS-I-Korpora mit der Anzahl der Belege herangezogen. Zusätzlich gehen auch die Ergebnisse der sog. Kollokationsanalyse anhand von COSMAS (Drohung: am 10.07.00, (sich) amüsieren: am 20.10.00) in die Tabellen ein. Belege
DUDEN-2
WUW
LGWDAF DGWDAF
(Sg/PL)
offen finster versteckt schrecklich leer wild wüst
4
6 (4/2) 0 8 (4/4) 2 (2/-) 12 (6/6) 3 (-/3) 1 (1/-)
+ + + + + -
-
+
-
-
-
-
+
+
+
+
-
-
-
-
-
+
-
+
-
-
-
-
-
-
+ +
+
DUDEN3 GW +
Bei Substantiven werden nur Adjektive und Verben, bei Veiben nur Adveibien entsprechend den Strukturtypen für Kollokationen (siehe Kapitel 2.4.1) angeführt. Die Reihenfolge orientiert sich zunächst an der von DUDEN-2, dann ist sie beliebig.
25 Belege
DUDEN-2
(Sgffi) Adjektive anhand von Cosmas: massiv 41 (7/34) anonym 19 (3/16) aussprechen ausstoßen ernst nehmen erhalten wahr machen einschüchtern äußern ausbrechen Σ
10 15 22 11 24 21 5 0
WVW
LGWDAF
DGWDAF
DUDEN3
GW
:
+ + + + + + -
;
-
+ +
+ +
+
-
-
-
-
-
-
-
-
+ +
+ +
+
-
-
-
:
-
+ +
;
-
-
+
+
+ 8(4)
-
-
-
11(9)
7
5
6
DUDEN-2
WUW
LGWDAF
DGWDAF
DUDEN3 GW
+ +
+
+
+
+ +
-
Tab. 3: DROHUNG
Belege
+ gut 25 köstlich + 132 großartig 0 königlich 37 glänzend 3 prächtig 68 Adverbien anhand von Cosmas: zu Tode 34 sichtlich 14 bestens 17 blendend 7 2 Σ -
+
-
-
+
-
+
-
+
-
-
-
+
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
6(4)
2
4(3)
Tab. 4: (SICH) AMÜSIEREN Erklärungen zu den Tabellen: Belege: Anzahl der Belege aus COSMAS public Korpora, DUDEN-2 Duden. Das Stilwörterbuch, W U W = E. Agricola: Wörter und Wendungen, L G W D A F = Langenscheidts Großwörterbuch Deutsch als Fremdsprache, D G W D A F = De Gruyter Wörterbuch Deutsch als Fremdsprache, DUDEN- 3 GW = Duden. Das große Wörterbuch der deutschen Sprache in 1 0 Bänden, Σ: Gesamtzahl der Beispiele (Zahlen in Klammern: in COSMAS mehr als 5-mal belegte Beispiele) Betrachten wir zuerst die erste Tabelle unter dem Aspekt der Gesamtanzahl der Kombinationspartner (Adjektiv, Verb). Die Reihenfolge der Wörterbücher ist die folgende: DUDEN-2: 1 1 ( 5 , 6 ) > W u W : 8 ( 3 , 5 ) > LGWDAF: 7 ( 3 , 4 ) > DUDEN- 3 GW: 6 (3, 3 ) > DGWDAF: 5
(2,3).
=
26 Das Stilwörterbuch fuhrt mit Abstand die meisten Wortverbindungen an. Im Mittelfeld liegen die Wörterbücher Wörter und Wendungen und Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In der zweiten Tabelle haben wir ein anderes Ergebnis, wobei das zweite Wörterbuch das Lemma amüsieren nicht enthält: LGwDÄF: 6 > DUDEN-3GW: 4 > DUDEN-2: 2 = DGWDAF:
2.
Die Reihenfolge nach der Anzahl der verzeichneten Kombinationen reicht jedoch nicht für die Auswahl der wichtigsten sekundären Quellen aus. Es ist zweckmäßig, die Kompetenzbeispielangaben der verschiedenen Wörterbücher anhand der ungefähren Anzahl der Belege in public Korpora geschriebener Sprache von COSMAS miteinander zu vergleichen. Wenn wir aus der ersten Tabelle die Kombinationspartner mit einem zu geringen Vorkommen relativ zu den anderen, also finster (0), wüst (1), schrecklich (2) und wild (3) sowie ausbrechen (1) und äußern (5) weglassen, ändert sich die Reihenfolge folgendermaßen: DUDEN-2: 9 (3, 6) > LGWDAF: 7 (3, 4) > DUDEN-3GW: 6 (3, 3) > DGWDAF: 5 (2, 3) > WUW: 4 (1,3).
Im Falle der zweiten Tabelle werden die Kombinationspartner großartig (0) und glänzend (3) weggelassen. Die Reihenfolge sieht dann wie folgt aus: LGWDAF: 4 > DUDEN-3GW: 3 > DUDEN-2: 2 = DGWDAF: 2.
Aufgrund der letzten Rangordnungen sind - was die Anzahl der relevanten Wortkombinationen anbetrifft - LGWDAF, DUDEN-2 und DUDEN- 3 GW die zuverlässigsten Wörterbücher hinsichtlich der Quantität. Des Weiteren wird aus den Tabellen ersichtlich, dass DUDEN3 GW - was die Übereinstimmung der verzeichneten Partner anbetrifft - keine Wortkombinationen enthält, die nicht im L G W D A F und/oder im DUDEN-2 verzeichnet gewesen wäre. Daraus folgt, dass Duden Stilwörterbuch und Langenscheidts Großwörterbuch Deutsch als Fremdsprache ausreichend sind. Sie bilden mit den zwei zweisprachigen, neu konzipierten deutsch-ungarischen Handwörterbüchern: HESSKY ( 2 0 0 0 ) und H£RA ( 1 9 9 6 ) die Sekundärquellen für die Wörterbuchbasis des geplanten Wörterbuchs. Oben wurden Aussagen über die Quantität der in den ausgewählten Wörterbüchern verzeichneten Wortkombinationen gemacht. Außer Acht blieb jedoch ihre Qualität. Unter Qualität wird an dieser Stelle die Repräsentativität der Kompetenzbeispielangaben in Bezug auf den Sprachgebrauch verstanden. Da der Sprachgebrauch ein abstrakter Begriff und als solcher nicht näher zu bestimmen ist, muss man sich mit den größten dokumentierten Ausschnitten aus bestimmten Sprachbereichen begnügen. Die public Korpora geschriebener Sprache in den CoSMAS-I-Korpora, worüber im nächsten Kapitel ausführlich berichtet wird, bilden zusammen mit den vorigen Tabellen die Grundlage für den Vergleich. Aus der ersten Tabelle ist anhand des Vergleichs der Anzahl der Belege mit dem Verzeichnetsein im Wörterbuch schnell zu erkennen, dass gerade die häufigsten adjektivischen Kombinationspartner in public Korpora (massiv, anonym) keinen Eingang in die Wörterbücher fanden. Die anderen Adjektive (leer, versteckt, offen), die hinsichtlich der Häufigkeit im Mittelfeld liegen, werden als Beispiele sowohl im DUDEN-2 als auch im L G W D A F angeführt. Die verbalen Kombinationspartner sind alle im DUDEN-2 sowie - mit einer einzigen Ausnahme (ernst nehmen) - im L G W D A F zu finden. Es muss der Vollständigkeit wegen erneut erwähnt werden, dass das DUDEN-2 auch solche Adjektive (finster, schrecklich) enthält, die in diesem Korpus sehr selten vorkommen. Die zweite Tabelle gibt über eine andere Praxis der beiden Wörterbücher Auskunft. Hier schneidet das L G W D A F besser ab, da es die häufigsten Adverbien anhand der Korpora
27 (köstlich, prächtig, königlich, gut) enthält, wenn auch solche, die kaum oder überhaupt nicht in den Korpora zu finden sind (glänzend, großartig). Im D U D E N - 2 werden der häufigste (köstlich) und ein anderer wichtiger Kotextpartner (gut) verzeichnet. Mit Hilfe von COSMAS-I-Korpora können zu der Liste der Adverbien zwei relativ häufige Wörter (sichtlich, bestens) und ein seltenes Adverb (blendend) hinzugefügt werden. Darüber hinaus kann eine phraseologische Einheit als häufige Adverbialbestimmung (zu Tode) zum Stichwort ermittelt werden. An dieser Stelle muss nochmals betont werden, dass nur die derzeitigen public Korpora geschriebener Sprache die Vergleichsgrundlage für die obigen Behauptungen bilden. Eine Überprüfung in den Korpora der gesprochenen Sprache oder in einem anders zusammengesetzten Korpus mit mindestens ähnlicher Größe könnte die Ergebnisse dieser Analyse leicht modifizieren. Die Anzahl der Textwörter in den Korpora der gesprochenen Sprache ist zur Zeit sehr gering, weshalb sie als entweder unbrauchbar oder für objektive Aussagen unzuverlässig gelten müssen. Aus den obigen Ausführungen sollte klar geworden sein, dass die Sekundärquellen ohne die Primärquelle COSMAS-I-Korpora für die Wörterbuchbasis nicht ausreichen. Im Folgenden werde ich auf die bereits verwendete Primärquelle näher eingehen.
2.2.2 Die Identifikation und Anordnung der Primärquellen Die Primärquellen bilden - wie bereits erwähnt - das lexikographische Korpus eines Wörterbuchs. Die Relevanz eines Textkorpus, das normalerweise oft noch exzerpiert werden musste, ist für die praktische Lexikographie eine Selbstverständlichkeit, wenn nicht sogar eine Notwendigkeit. Über die Größe, Zusammensetzung, Aktualität und Verfügbarkeit dieses Textkorpus wird jedoch in der Fachliteratur, in den lexikographischen Werkstattberichten sowie in den Wörterbüchern kaum, wenn überhaupt, berichtet.5 Die Frage nach dem Verhältnis der Primär- und Sekundärquellen, also in welchem Maße Textkorpora und/oder Wörterbücher bei der Erstellung eines Wörterbuchs benutzt werden, wird völlig außer Acht gelassen. Darüber könnten nur die „Eingeweihten" Auskunft geben. Eine bekannte und akzeptierte Tatsache ist, dass sich die neueren Wörterbücher auf die anderen (älteren) stützen. Es ist ein offenes Geheimnis, das manche Wörterbücher weitgehend mit anderen übereinstimmen. Die lexikographische Praxis bewegt sich leider nach wie vor, was die Quellen betrifft, auf alt eingefahrenen Gleisen. Dies liegt nicht zuletzt am enormen Arbeitsaufwand, der mit der Erstellung eines Textkorpus für ein bestimmtes Wörterbuchprojekt, oder auch mit der Nutzung eines schon existierenden, größeren Korpus einhergeht.
2.2.3 Vorstellung der COSMAS-I-Korpora Das Institut für Deutsche Sprache (IDS) in Mannheim verfügt über eine Arbeitsgruppe flir Korpustechnologie, welche u.a. die Textkorpora des IDS verwaltet. Die Textkorpora des IDS sind eine „computerlesbar aufbereitete und meist als Volltextdatenbank organisierte natürlichsprachliche Textmenge" (URL am 16.07.02: http://www.ids-mannheim.de/kt/ cosmas.html). Sie beinhalten deutschsprachige belletristische, populärwissenschaftliche und wissenschaftliche Texte, eine große Zahl von Zeitungstexten, darüber hinaus weitere ver5
D i e w e n i g e n m i r b e k a n n t e n K o r p u s a n a l y s e n sind JONES/SINCLAIR 1 9 7 4 , SINCLAIR 1 9 8 7 , BERGENHOLTZ 1 9 8 0 u n d d i e A r b e i t e n v o n STEYER 2 0 0 2 a - c .
28 schiedene Textarten sowohl aus der Vergangenheit als auch aus der Gegenwart. Die Beschaffung der Texte wird einerseits durch urheberrechtliche Beschränkungen erschwert, andererseits sind die älteren Texte bei den Verlagen oft nicht in einer vollautomatisch verarbeitbaren Form vorhanden. Daraus folgt, dass das Textmaterial „beliebig" zusammengesetzt ist, aber auch kontinuierlich weiterentwickelt wird. Die Korpora des IDS hatten nach dem Stand der Internetseite vom April 2002 (http://www.ids-mannheim.de/kt/textorg.html) bereits einen Gesamtumfang von mehr als 1736 Millionen Textwörtern bzw. 1440 Millionen Wortformen. Somit bildeten sie schon damals das mit Abstand größte deutsche Textkorpus „als empirische Basis für die linguistische Forschung" (ebenda), von dem ein Teil über die Online-Version COSMAS auch im Internet recherchiert werden kann. COSMAS (Corpus Storage, Maintenance and Access System) existiert seit Mitte 1992. Das Serviceangebot COSMAS I wurde allerdings ab Frühjahr 2003 schrittweise vom Nachfolgesystem COSMAS Π übernommen. Da die empirische Forschungsphase vom Sommer 2000 bis Sommer 2002 dauerte, wurden alle Recherchen und statistischen Analysen dementsprechend noch mit Hilfe von COSMAS I erstellt. Das Prinzip der Rechercheprozedur und die daraus resultierenden theoretischen Erkenntnisse sind jedoch vom jeweiligen COSMAS-System größtenteils unabhängig. Aus urheberrechtlichen Gründen war nur ein Teil der IDS-Korpora über COSMAS I - die so genannten COSMAS-I-Korpora - für das „breite Publikum" unter der Internetadresse „http://corpora.ids-mannheim.de" zugänglich. COSMAS-I-Korpora sind Sammlungen von Textmaterialien in elektronischer Form, die außerhalb von COSMAS erstellt und in COSMAS I eingespeist wurden. (URL am 16.07.02: http://www.idsmannheim.de/kt/textorg.html)
Jedes Korpus besteht aus einem oder mehreren Dokumenten. Unter Dokument versteht man die kleinste recherchierbare Einheit, wobei jedes Dokument wiederum aus einem oder mehreren Texten besteht. Text ist in COSMAS die kleinste bibliographisch dokumentierte Einheit. Nach dem Stand vom April 2002 waren dies ca. 28S0 Dokumente und mehr als 5,5 Millionen Texte (vgl. ebenda). Die über COSMAS I öffentlich zugänglichen Korpora hatten einen Gesamtumfang von ca. 1083 Millionen Textwörtern bzw. 980 Millionen Wortformen. Wortformen und Textwörter definiert COSMAS wie folgt: Wortformen: konkret realisierte grammatische Formen von Wörtern im Kontext [eines Satzes] Textwörter: neben Wortformen alle möglichen anderweitigen Zeichenfolgen und einzelne Zeichen im Korpustext, durch Leerzeichen voneinander separiert (z.B. besondere Markierungen für Überschriften, Bildtexte, Fußnoten usw. [...]) (URL am 16.07.02: http://www.ids-mannheim.de/ kt/textw-wf.html)
(vgl. URL am 16.07.02: http://www.ids-mannheim.de/kt/cosmas.html, ~/kt/textw-wf.html, ~/kt/textorg.html und ~/kt/corpora.shtml) Das größte wählbare „Korpuspaket" in den COSMAS-I-Korpora war das „W-PUB Archiv: Korpora der geschriebenen Sprache" (Größe im Februar 2002: 374.00 Mio. Wortformen). Das „GESPR-PUB Archiv: Korpora der gesprochenen Sprache" (Größe: 1.60 Mio. Wortformen), das die geschriebenen Korpora in der Wörterbuchbasis ergänzen sollte, galt leider für repräsentative Untersuchungen als unzureichend. Die Korpora der geschriebenen Sprache umfassten bereits im Oktober 2000 die folgenden Textmaterialien:
29 • Akquisitionen im Projekt Deutsches Referenzkorpus (DEREKO) • Mannheimer Morgen (mmm /1989,1991,1994-2000) • COMPUTER ZEITUNG (cz /1993-1998) • Süddeutsche Zeitung (sz /1995-1998) • Frankfurter Rundschau (£& /1997-1998) • Korpus Magazin Lufthansa Bordbuch (mld /1995-1997) • Mannheimer Korpora (mk) Mannheimer Korpus 1 (mkl), Mannheimer Korpus 2 (mk2) • Grammatik-Koφus (grl) • Bonner Zeitungskorpus (bzk) • Handbuchkorpora (hbk) gesondert nach Jahrgängen: h85, h86, h87, h88 • Wendekorpus (wk) Wendekorpus West (wkfo; Bundesrepublik Deutschland) Wendekorpus Ost (wkd; DDR) • LIMAS-Korpus (lim) • Korpus-Kartei der Gesellschaft für deutsche Sprache, Wiesbaden (gfds) • Goethe-Korpus (goe) • GRIMM-Korpus (gri) • Marx-Engels-Korpora Marx-Engels-Gesamtausgabe - ausgewählte Texte (meg) Marx-Engels-Werke - ausgewählte Texte (mew) Herausgeber-Anmerkungstexte zu mew (mwa) (URL am 20.10.00: http://www.ids-mannheim.de/kt/corpora.shtml) Die Korpora Mannheimer Morgen 1994-2000, COMPUTER ZEITUNG 1993-1998, Süddeutsche Zeitung 1995-1998, Frankfurter Rundschau 1997-1998 wurden im Rahmen des Projekts Deutsches Referenzkorpus (DEREKO) erstellt und im Juli 2000 aufgenommen. Inzwischen wurde die Ausgewogenheit des Textmaterials mit Hilfe des genannten Projekts erheblich verbessert. Wie sich die Größe und andere Parameter der Korpora der geschriebenen Sprache durch die ständigen Erweiterungen verändern, wird schließlich am Beispiel der Korpusstatistiken vom Oktober 2000 und Februar 2002 illustriert. Die genauen Zahlen sind aus der folgenden Tabelle zu entnehmen:
Größe Anzahl der Dokumente Anzahl der Texte Anzahl der Textwörter
public Korpora geschriebener W-PUB Archiv: Korpora geSprache vom Oktober 2000 schriebener Sprache vom Februar 2002 293.88 Mio. Wortformen 374.00 Mio. Wortformen 611 675 932739 1Ί65278 350'551'133 449Ό45Ί03
Tab. 5: Korpusstatistiken (URL am 18.10.00 u. 16.07.02: http://corpora.ids-mannheim.de/~cosmas)
30 2.2.4 Recherche mit COSMASI
Mit COSMAS I bietet sich die Möglichkeit, neben (un)flektierten Wortformen und Wortbestandteilen auch nach Flexionsmorphemen sowie nach Wortverbindungen zu recherchieren. Die Größe des Verknüpfungsabstands ist in der Suchanfrage mit Hilfe einer Suchabfragesprache zu bestimmen. Darüber hinaus verfügt das Programm über eine Kollokationsanalyse, die mit Hilfe eines statistischen Modells entwickelt wurde. liegen große Textmengen vor, so können statistische Methoden zur Kollokationsanalyse eingesetzt werden. (Belica 1995) Unter Kollokation wird in COSMAS etwas Anderes als in der vorliegenden Arbeit verstanden. In Anlehnung an die ursprüngliche Bedeutung des Wortes collocare im Sinne von am gleichen Ort werden alle Kontextpartner des Stichwortes, die viel häufiger nahe zueinander vorkommen, als es ein Zufall sein könnte, unabhängig von semantischen und diskursspezifischen Gesichtspunkten berücksichtigt und diese Wortverbindungen als Kollokationen identifiziert: Natürliche Sprachen sind voll von Kollokationen: Kombinationen von Wörtern, die häufiger nahe nebeneinander vorkommen, als man nach Zufallsprinzip erwarten würde, (ebenda) Da Kollokationen in Texten wiederholt vorkommen, darüber hinaus kohäsiv und domainabhängig, jedoch nicht vorhersagbar sind, haben sie eine besondere statistische Verteilung. Kollokationen können aber in großen Korpora durch eine Analyse der Häufigkeitsverteilung identifiziert werden, (vgl. ebenda) Die Algorithmen, die der Analyse des Gesamtkorpus zugrunde liegen, vergleichen nicht nur absolute Zahlenwerte, sondern setzen diese mittels statistischer Methoden zueinander in Beziehung, wie es im folgenden Modell deutlich wird: Datenerhebung ZAHLENWERTE Datenauswertung STATISTISCHE WERTE Abb. 6: Modell für die Analyse des Gesamtkorpus Die statistischen Werte in Bezug auf das Gesamtkorpus werden sodann mit denen der jeweiligen konkreten Kollokationsanalyse verglichen. Durch eine Kontingenzanalyse wird die Größe der Kohäsion zwischen dem Stichwort und dem jeweiligen Kollokator ermittelt. Das heißt, dass die häufigsten Wörter in der Umgebung des Stichworts keineswegs zu den Kombinationen von größter Kohäsion gehören müssen. Auf der Benutzeroberfläche erscheint schließlich eine Liste der Kollokatoren mit absteigender Stärke der lexikalischen Kohäsion, die der so genannte Gamma-Wert auch zahlenmäßig angibt.6
6
Bei seiner Berechnung wird u.a. die „log-likelihoodratio"-Statistikverwendet. Als weiterführende Literatur kann auf folgenden Titel verwiesen werden: T. DUNNING: Accurate Methods for the Statistics of Surprise and Coincidence. Computational Linguistics. Vol. 19,1.1993.
31
In der Kollokationsanalyse werden die Kontextpartner Kollokatoren genannt. Im Weiteren wird anstatt des Begriffes Kontext der entsprechende Terminus für den sprachlichen Kontext, also Kotext verwendet. Ebenso wird für das Wort Kontextpartner die Benennung Kotextpartner geprägt. Anstatt des Ausdrucks Kollokator wird ebenso der Terminus Kotextpartner gebraucht, um Missverständnisse in der Begrifflichkeit zu vermeiden. Demzufolge wird im Weiteren die Kollokationsanalyse in COSMAS umbenannt: Kotextanalyse. Die Kotextanalyse kann durch insgesamt neun Parameter beeinflusst werden. Die neun Parameter sind die folgenden: Analyse-Kontext: ... Wörter links ... Wörter rechts höchstens ein Satz: ja / nein mit / ohne Autofokus Granularität: grob / mittel / fein Zuveriässigkeit: hoch / normal / analytisch Clusterzuordnung: eindeutig / mehrfach Lemmatisierung: ja / nein Funktionswörter: mitberttcksichtigt / ignoriert [Gamma-Wert (γ): nicht anzeigen / anzeigen] Verschiedene Einstellungen der Parameter führen zum Teil zu verschiedenen Ergebnissen, jedoch kann - relativ zum spezifischen Zweck der hier durchgeführten Analysen - festgestellt werden, dass keine relevanten Unterschiede in Bezug auf das Endergebnis auftreten. Dies wird anhand der vergleichenden Kotextanalysen hinsichtlich des Stichworts Drohung am 10.07.00 aus den folgenden Tabellen plausibel: Die Standardeinstellungen für die Parameter in den durchzuführenden Analysen: Wortabstand links: 5 Wortabstand rechts: 5 höchstens 1 Satz ohne Autofokus Granularität: mittel Zuverlässigkeit: normal Klassenzuordnung: eindeutig Lemmatisierung: nein Funktionswörter: ignoriert Gamma-Wert (γ): anzeigen Standard Beschimpfungen massiven ernst wahrgemacht wahrmachen massive eingeschüchtert anonyme wahr Schläge ausgestoßen
Y 93 89 85 74 73 69 50 42 40 39 38
Β 14 22 32 8 8 15 8 9 17 10 5
Zuverlässigkeit: hoch Beschimpfungen massiven ernst wahrgemacht wahrmachen massive eingeschüchtert anonyme wahr statistisch unspezifisch
Υ 93 89 85 74 73 69 50 42 40
Β 14 22 32 8 8 15 8 9 17
32 Standard PKK-Drohungen ausgesprochenen anonymen
Υ 38 37 37
Β Zuverlässigkeit: hoch 3 6 6
Υ
Β
Tab. 6: Kotextanalysen; 1360 Wortformen zu Drohung in public Korpora geschriebener Sprac mit Autofokus massiven massive wahrgemacht Beschimpfungen ernst genommen ernst wahrmachen anonyme wahr ausgesprochenen Angst ausgesprochenen eingeschüchtert
Υ 153 120 112 106 86 86 82 72 66 65 65 56
Β 22 18 8 11 7 25 8 9 17 3 3 8
mit Lemmatisierung Drohung(Komposita) massiv wahrmachen Beschimpfung einschüchtern anonym wahrgemacht anonym Luftangriff ernst ausgestoßen Erpressimg
Υ 391 140 132 93 89 74 74 74 55 54 52 42
Β 30 44 14 11 15 15 8 2 6 39 7 10
Wortabstand: 3,3 massiven Beschimpfungen massive wahrgemacht ernst wahrmachen anonyme eingeschüchtert anonymen ausgesprochenen PKK-Drohungen wahr wahrmache wiederholte ···
γ 101 96 85 81 76 56 50 49 44 42 41 39 37 37
Β 21 13 15 8 25 6 9 7 6 6 3 14 3 9
Zuverlässigkeit: hoch massiven Beschimpfungen massive wahrgemacht ernst wahrmachen anonyme eingeschüchtert anonymen ausgesprochenen PKK-Drohungen statistisch unspezifisch
Υ 101 96 85 81 76 56 50 49 44 42 41
Β 21 13 15 8 25 6 9 7 6 6 3
Tab. 7: Kotextanalysen Erklärungen zu den Tabellen: γ: Gamma-Wert; B: Anzahl der Belege; fett: Kotextpartner mit der größten, statistisch ermittelten Kohäsion; fett kursiv: Kotextpartner mit der zweitgrößten Kohäsion; kursiv: Kotextpartner mit der drittgrößten Kohäsion Wie aus den Tabellen ersichtlich, wird die Standardanalyse im ersten Schritt mit einer anderen ergänzt, wobei der Parameter Zuverlässigkeit: normal für Zuverlässigkeit: hoch ausgetauscht wurde. Durch die Einstellung Zuverlässigkeit werden an der statistisch ermittelten
33 Verteilungskurve Grenzen hinsichtlich der Wahrscheinlichkeit, dass eine Wortverbindung zufällig ist, gezogen. Bei hoher Zuverlässigkeit liegt die Wahrscheinlichkeit des zufälligen Vorkommens nur bei 0,001%, und dementsprechend erscheint die Wortliste vor allem verkürzt. Die verschiedenen Analysen zusammen erlauben unter Umständen zuverlässigere Aussagen über die wichtigsten Kotextpartner.7 Es sei zusätzlich noch eine Kotextanalyse, durchgeführt am 20.10.00, für das Verb (sich) amüsieren vorgestellt, damit die Wahl für die Einstellung der Parameter, die in der vorliegenden Arbeit als standard gelten, untermauert wird. Die Auszeichnung einer Einstellungsmöglichkeit („Standardanalyse" genannt) hat den Vorteil, dass die Ergebnisse der Kotextanalysen zu den verschiedenen Stichwörtern miteinander verglichen werden können. In Fällen, in denen diese Einstellung zu kaum verwertbaren Wortlisten führt - sei es aufgrund der Länge der Listen oder der detaillierten Aufführung der Kotextpartner - kann man sich einer der bereits erprobten und demonstrierten Einstellungen bedienen.8 Die Zweckmäßigkeit sowie die Validität einer jeden Einstellung ist jedoch von Fall zu Fall zu prüfen. Es sollte eine Systemhaftigkeit angestrebt werden, deren Grundlage beispielsweise das Maß der absoluten Häufigkeit des Stichworts im Korpus und/oder seine Zugehörigkeit zu einem bestimmten Lemmazeichentyp bilden könnten. Standard köstlich prächtig Gäste prächtig königlich Publikum halb Tode sichtlich Köstlich Gäste Bolle teils Zuschauer bestens blendend Erwachsenen
...
y 1446 506 506 353 331 177 149 122 94 89 82 65 57 57 45 44
Β 121 7 52 33 84 22 33 22 7 27 7 8 28 15 5 8
Zuverlässigkeit: hoch köstlich prächtig königlich Publikum halb Tode sichtlich Köstlich Gäste Bolle teils bestens Zuschauer blendend Erwachsenen ehren statistisch unspezifisch
Β Y 1446 121 506 59 353 33 331 84 177 22 149 33 122 22 94 7 89 27 82 7 65 8 57 15 57 28 45 5 44 8 43 8 0 1942
Tab. 8: Kotextanalysen; 2429 Wortformen zu (sich) amüsieren in public Korpora geschriebener Sprache
7 8
Sie erlauben diese Aussagen ausschließlich in Bezug auf das Korpus, und sie erlauben keinerlei Aussagen über die Reihenfolge. Die Veränderung des jeweiligen Parameters in Bezug auf die Standardeinstellung ist im Kopf der Tabelle abzulesen. Nur im Falle der Parameter Wortabstand: (links und rechts) 3 bezieht sich die Option Zuverlässigkeit: hoch logischerweise auf die eben genannten Parameter.
34 mit Autofokus köstlich prächtig Gäste prächtig königlich Publikum halb Tode sichtlich Köstlich
Y 1494 548 548 366 345 213 182 143 137
Β 121 7 52 33 84 22 33 22 7
mit Lemmatisierung köstlich prächtig Gast prächtig Publikum königlich halb Tod sichtlich Gast
Β Y 1549 132 506 7 52 506 323 89 276 30 189 22 149 33 138 25 86 30
Wortabstand: 3,3 köstlich prächtig Gäste prächtig königlich Publikum hörte Publikum Tode halb
Y 1394 491 491 329 311 311 179 178
Β 110 4 49 29 3 69 33 22
Zuverlässigkeit: hoch köstlich prächtig königlich Publikum Tode halb sichtlich Köstlich
Β Y 1394 110 491 53 329 29 72 311 179 33 178 22 128 22 102 7
Tab. 9: Kotextanalysen Erklärungen zu den Tabellen: γ: Gamma-Wert; B: Anzahl der Belege; fett: Kotextpartner mit der größten, statistisch ermittelten Kohäsion; fett kursiv: Kotextpartner mit der zweitgrößten Kohäsion; kursiv: Kotextpartner mit der drittgrößten Kohäsion Die Kotextanalyse gibt ebenso - wie aus den Tabellen ersichtlich wird - über die Anzahl der Belege, in denen das Stichwort und sein jeweiliger Kotextpartner vorkommen, Auskunft. Da die Wortliste der Kotextpartner stark von der Zusammensetzung der Korpora (z.B. Textsorten) und deren textspezifischen Eigenschaften (z.B. häufig vorkommende, korpusspezifische Wörter) abhängt, ist die Überprüfung der Kotexte unerlässlich, um die für ein einziges Dokument charakteristischen, diskursspezifischen Kotextpartner aus dem Datenmaterial auszuschließen. In den folgenden Tabellen werden diese auszuschließenden Wörter kursiv erscheinen. Die Anzahl der Belege steht in keinem direkt proportionalen Zusammenhang mit dem Gamma-Wert. Die statistisch ermittelten Gamma-Werte erlauben keine weiteren Aussagen über die genaue Reihenfolge der Kotextpartner. Deshalb können im Weiteren nur die Größenordnungen der Gamma-Werte der ermittelten Kotextpartner relativ zueinander berücksichtigt werden, und die Systematisierung der bereits bewährten Kotextpartner erfordert eine genaue linguistische Analyse. Sie erfolgt anhand des aus den primären und sekundären Quellen gewonnenen, gesamten Sprachmaterials in der nächsten Phase des lexikographischen Prozesses, in der der Materialaufbereitung. Die detaillierte linguistische Analyse der Wortkombinationen bedarf eines theoretischen Hintergrunds, in dessen Rahmen die Systematisierung der empirisch gewonnenen, syntagmatischen Wortverbindungen geleistet wird. Diese Terminologie wird - nach einem kurzen Exkurs bezüglich verschiedener Korpora - im nächsten Kapitel über den Wörterbuchgegenstand umrissen.
35 Ein kleiner Exkurs in eine der größten Belegkarteien Deutschlands bei der Dudenredaktion in Mannheim und deren Vergleich mit dem größten computerverfügbaren Korpus COSMAS zeigen, welche Perspektiven die systematische Nutzung des letzteren für die praktische ein- und zweisprachige Lexikographie eröffnet. Die exemplarische Überprüfung zweier Lemmazeichen in verschiedenen Wörterbüchern hat bereits einige Vorteile bei der Konsultation eines Korpus gezeigt. Im Folgenden werden anhand derselben Wörter (Drohung, (sich) amüsieren) die Duden-Kartei und die CosMAS-I-Korpora unter verschiedenen Gesichtspunkten verglichen. Die Sammeltätigkeit der Papierkartei der Dudenredaktion hat in den 50er Jahren angefangen und wurde Ende des Jahrhunderts abgeschlossen, weil seit 1996-97 mit dem Aufbau eines elektronischen Korpus (Duden Sprachkartei) begonnen wurde, das im Herbst 2000 ca. 70.000 Belegstellen (oder Exzerpte) umfasste. Die Papierkartei der Redaktion enthält Texte des 20. Jahrhunderts. Ungefähr 50% der Duden-Belegkartei stammt aus Zeitungen (Spiegel, Hörzu, FAZ, Süddeutsche Zeitung, Die Zeit und weitere regionale Zeitungen wie z.B. Saarbriicker Zeitung, sowie ehemalige DDR-Zeitungen), die über einen bestimmten Zeitraum exzerpiert wurden. Die andere Hälfte des Korpus hat in ca. 1200 Büchern ihre Quelle. Die COSMAS-I-Korpora weisen demgegenüber einen viel größeren Anteil an Zeitungstexten auf. Die für die Dudenredaktion erstellten Exzerpte wurden in zwei alphabetische Karteien nach der Entstehungszeit der Texte aufgeteilt. Der eine Teil umfasst Texte vom Anfang des 20. Jahrhunderts bis zum Jahre 1975. Der zweite Teil enthält Karteien ab 1976 bis zum Ende des Jahrhunderts. Das Gesamtkorpus hat eine Größe von 1,8 Millionen Karteikarten. Diese Zahl könnte theoretisch den 2,6 Millionen Texten in den COSMAS-I-Korpora - als kleinste bibliographisch dokumentierte Einheit - fast entsprechen. Dies ist jedoch nicht der Fall, weil diese Texte einen viel größeren Umfang haben. Andererseits sind die Texte in COSMAS nicht unter einem Stichwort oder eventuell unter zwei/drei Stichwörtern - wie in einer Kartothek - eingetragen, sondern sie sind nach allen Wortformen, Wortbestandteilen oder Wortverbindungen in den verschiedensten Kombinationen recherchierbar. Durch die vielen hypothetischen „Eintragsmöglichkeiten" e j n e s Textes in den COSMAS-I-Korpora entstehen im virtuellen Sinne unendlich viele „Mehrfacheinträge". Darüber hinaus erlaubt die Recherche nach Wortkombinationen wiederum einen anderen Zugriff auf die sprachlichen Daten. Aus den vielen Zugriffsmöglichkeiten auf die Daten folgt, dass sich die Zahl der scheinbar 2,6 Millionen Exzerpte in den COSMAS-I-Korpora in hohem Maße vermehrfacht. Es entstehen in der Folge des elektronischen Mediums Computer - theoretisch gesehen - unendlich viele „Karteien" desselben Exzerptenmaterials, die nach vielen verschiedenen Gesichtspunkten geordnet sind, und nicht nur nach Entstehungszeit der Textausschnitte als Exzerpte und nach Alphabet der Stichwörter, wie es in einer Papierkartei der Fall ist. Die folgenden Übersichtstabellen informieren über den Umfang und die Beschaffenheit der sprachlichen Daten zu zwei Stichwörtem (Drohung, (sich) amüsieren) in der DudenKartei und in den COSMAS-I-Korpora: DROHUNG Duden-Kartei
COSMAS: public K.
Belege
76
1360
Adjektive
bis 75: 7 3 ab 76: 3 leer dunkel politisch
2 12 2 0 2 0
36
Verben
Duden-Kartei erpresserisch 1 1 1 0 wahr machen ausstoßen hervorstießen 1 1 0 0
S. AMÜSIEREN Duden-Kartei 36 Belege bis 75:33 ab 76:3 Adverbien sehr großartig gut königlich gern 1 0 0 0 0
COSMAS: public K . 2 0 41 massiv 19 anonym versteckt 8 6 offen 5 24 4 15 2 0 ernst nehmen 22 einschüchtern 21 erhalten 11 10 aussprechen
COSMAS:
public
IL
2429 3 ? 2 0 2 25 2 37 2 ? köstlich prächtig zu Tode bestens sichtlich
132 68 34 17 14
Tab. 10-11: Vergleich der Belege für zwei Stichwörter in der Duden-Kartei und in den COSMAS-IKorpora, Erklärungen zu den Tabellen: Reihenfolge der Kotextpartner innerhalb des jeweiligen Korpus: nach absteigender Häufigkeit; Zahlen neben den Kotextpartnern: Anzahl der Belege für die Kombination; Zahlen an und für sich: Anzahl der Belege für die Kombination im Vergleichkoipus; ?: manuell zu aufwendig überprüfbare hohe Zahl
Die Zahl der Belege ist in den CoSMAS-I-Korpora erheblich höher. Wegen der fast unbegrenzten Zugriffsmöglichkeiten auf die Daten ist der Unterschied zwischen dem Umfang der Belege in den zwei Korpora weitaus bedeutender, als er sich nach den Zahlen vermuten lässt. Andererseits enthält die Duden-Kartei nach 1976 kaum Belege hinsichtlich der untersuchten Wörter. Wenn man die Beschaffenheit der Belege untersucht, wird leicht ersichtlich, dass gerade solche Kotextpartner in der Kartei - mit einigen Ausnahmen (z.B. leer; königlich, gut) mehr als einmal belegt sind, die im elektronischen Korpus vom Gamma-Wert her nicht sehr signifikant sind. Die relevanten Kotextpartner in den CoSMAS-I-Korpora sind in der Kartei in der Mehrzahl der Fälle höchstens einmal vertreten (massiv, anonym; ernst nehmen, einschüchtern bzw. köstlich). Einige sehr wichtige Kotextpartner kommen sogar überhaupt nicht vor (prächtig, zu Tode). Dass ein Kotextpartner in der Kartei mehrfach vorkommt,
37 und dieses Ergebnis auch mit den COSMAS-I-Korpora eine Korrelation zeigt (wahr machen, ausstoßen), scheint eher ein seltener Zufall zu sein. Diese Tatsachen sollten jedoch keinen überraschen, wenn man sich die Methode des Exzerpierens vor Auge hält. Die Willkürlichkeit und Subjektivität der Exzerpte erscheint anhand der zwei Stichproben plausibel, deshalb ist die Nutzung großer computerverfügbarer Korpora wegen der Repräsentativität der sprachlichen Daten in Wörterbüchern unerlässlich.
2.3 Der Wörterbuchgegenstand Der Wörterbuchgegenstand eines bestimmten Wörterbuchs ist alles, was darin lexikographisch bearbeitet wird. Er ist also eine konkrete Menge von Daten, die in Form von lexikographischen Angaben dargeboten werden. Wenn ein Wörterbuch wegen seines genuinen Zwecks einen Typ von Angabe und evtl. stützende Angaben enthält (z.B. Rechtschreibwörterbuch), ist es monoinformativ. Ein solches Wörterbuch stellt einen eher seltenen Typ dar. Wenn im Wörterbuch jeweils mehrere Angaben zu den einzelnen Lemmazeichen angeführt werden, dann handelt es sich um ein polyinformatives Wörterbuch, wobei bei der Wörterbuchkonzeption auf einen oder sogar auf mehrere Angabetypen der Schwerpunkt gelegt werden kann. In diesem Fall kann man von einem polyinformativen Wörterbuch mit einem bestimmten/besonderen Profil reden, (vgl. Wiegand 1998a, 301) Der Wörterbuchgegenstand kann wie folgt definiert werden: Der Wörterbuchgegenstand eines bestimmten Wörterbuches ist die Menge der in diesem Wörterbuch lexikographisch bearbeiteten Eigenschaftsausprägungen von wenigstens einer, höchstens aber von endlich vielen sprachlichen Eigenschaften bei einer bestimmten Menge von im Wörterbuch erwähnten sprachlichen Ausdrücken, die zu einem bestimmten Wörteibuchgegenstandsbereich gehören. (Wiegand 1998a, 302) Damit der Wörterbuchgegenstand des zu konzipierenden Wörterbuchs näher bestimmt werden kann, muss zunächst der Wörterbuchgegenstandsbereich definiert und dann festgelegt werden: Der Wörterbuchgegenstandsbereich ist der sprachliche Bereich, aus dem diejenigen sprachlichen Ausdrücke stammen, die hinsichtlich bestimmter Eigenschaftsausprägungen in einem Wörteibuch lexikographisch bearbeitet sind. (Wiegand 1998a, 303) Für das zu konzipierende Lernerwörterbuch ist der eine Wörterbuchgegenstandsbereich die deutsche Standardsprache der Gegenwart und der andere Bereich stellt die Standardvariante des gegenwärtigen Ungarischen dar. Die Menge der sprachlichen Ausdrücke, die zu diesem Wörterbuchgegenstandsbereich gehören, ist zu begrenzen. Der deutsche Teil des Gegenstandsbereichs wird einerseits durch die Lemmaselektion und andererseits durch das aus der Wörterbuchbasis gewonnene Datenmaterial und dessen Selektion eingeschränkt. Der ungarische Teil wird durch den deutschen sprachlichen Bereich, der im Wörterbuch erarbeitet wird, bestimmt. Die Anzahl und Auswahl der sprachlichen Eigenschaften, deren Ausprägungen bei einer bestimmten Menge von Lemmazeichen lexikographisch beschrieben werden, hängt vom jeweiligen Wörterbuchtyp ab. Bei einer genaueren Untersuchung erkennt man, dass die Anzahl der sprachlichen Eigenschaften auch vom Ergebnis der Lemmaselektion, also von
38 den einzelnen zu beschreibenden sprachlichen Ausdrücken, beeinflusst wird. Im Folgenden werden die relevanten sprachlichen Eigenschaften des zu konzipierenden Wörterbuchs kurz umrissen. Die detaillierte Beschreibung erfolgt im Kapitel 4, welches dem Mikrostrukturenprogramm gewidmet ist. In einem deutsch-ungarischen produktionsbezogenen Stilwörterbuch ist die zentrale sprachliche Eigenschaft, die präzise bearbeitet werden muss, die Syntagmatik der sprachlichen Ausdrücke des konkreten Wörterbuchgegenstandsbereichs. Bei der Syntagmatik muss zwischen der lexikalischen und der grammatischen Ebene unterschieden werden. Bei dieser Konzeption gilt ein besonderes Augenmerk dem lexikalischen Bereich. Umfang und Vielfalt der syntagmatischen Wortverbindungen erfordern neben der oben ausgeführten, in erster Linie korpusbasierten, Methode für die Datenerhebung und -Selektion auch eine theoretisch fundierte Systematisierung für die lexikographische Datenaufbereitung.9 Sie wird im nächsten Kapitel 2.4 über den Kollokationsbegriff geleistet. Neben der Beschreibung der syntagmatischen Relationen auf der lexikalischen Ebene stellt die Beschreibung der Regelmäßigkeiten auf der grammatischen Ebene eine nicht weniger wichtige Aufgabe dar, deren Bearbeitung in Form von Valenz- oder Strukturmustern in das zu konzipierende Wörterbuch Eingang finden. Der Produktionsbezug erfordert auch weitere grammatische Angabetypen, die über die Flexion der Stichwörter Auskunft geben. Darüber hinaus sind die adäquaten Verwendungsweisen eines sprachlichen Ausdrucks ohne stilistisch-pragmatische Angaben zu den markierten Fällen nicht zu präsentieren. Im Kapitel 4 über die Mikrostruktur werden die oben skizzierten Eigenschaften sprachlicher Ausdrücke vollständig beschrieben.
2.4 Bestimmung des zugrunde gelegten Kollokationsbegriffs Die Methoden der Korpuslinguistik eröffnen ungeahnte Möglichkeiten nicht nur für die Ermittlung der statistisch signifikanten Kotextpartner und damit für die objektivere Dokumentation des Sprachgebrauchs, sondern sie können auch zur präziseren Beschreibung und Bestimmung sprachlicher Phänomene, wie z.B. der Kollokationen, auf einer empirischen Basis verhelfen. Das „kollektive Beispielgedächtnis von Forschern und Lexikographen" (Steyer 2000, 106) kann durch die Ergebnisse der computergestützten Analysen von Massendaten ersetzt werden. In den späteren Überlegungen über Kollokationen sollte gezeigt werden, dass die Kookkurrenzanalyse ein heuristisches Instrument zur linguistischen Analyse darstellt, ein Instrument, das der Methode der reinen Introspektion weit überlegen ist. (Steyer 2002,234) Dabei darf man nicht vergessen, dass die linguistische Kompetenz nie durch die Analyseergebnisse des Computers ersetzbar ist, sondern beide müssen einander gegenseitig unterstützen und ergänzen.
9
Phraseologismen werden dabei nicht mitberücksichtigt, weil - wie schon die allgemeinsprachliche Benennung verfestigte Wortverbindung verrät - es sich dabei nicht um (relativ) freie Kombinationen von lexikalischen Einheiten handelt, auch wenn sie bestimmte Variationsmöglichkeiten zulassen. Sie gelten dennoch semantisch als eine Einheit.
39 Bei der Typologisierung der Wortkombinationen wird in dieser Arbeit eine neue Vorgehensweise vorgezeichnet, die sowohl die Erkenntnisse der Korpuslinguistik als auch die der Kollokationsforschung miteinzubeziehen versucht. Da die Ergebnisse der auf das Deutsche bezogenen Kollokationsforschung sowie eine angebrachte Kollokationsdidaktik für Deutsch als Fremdsprache, die bei der Konzeption eines zweisprachigen syntagmatischen Lernerwörterbuchs Anwendung finden könnten, zur Zeit als unzulänglich gelten, musste ein eigenständiger Kollokationsbegriff - als Kernproblem bei der Bestimmung des Wörterbuchgegenstandes - entwickelt werden. Der Kollokationsbegriff kombiniert die englischen, vorwiegend strukturell orientierten und die deutschen, vorwiegend semantisch orientierten Theorien der Wortkombinationen mit der empirischen systematischen Methode der bereits vorgestellten statistischen Kotextanalysen. In den folgenden Teilkapiteln werden die theoretische und empirische Basis des entwickelten Kollokationsbegriffe vorgestellt. Aus der unzureichenden Forschungslage ergeben sich für diesen pragmatisch orientierten Kollokationsansatz folgende theorie- und empiriebezogene Fragestellungen: Theoriebezogene Fragestellungen: • Unterscheidung zwischen Basis und Kollokator • Strukturtypen für Wortkombinationen Empiriebezogene Fragestellungen: • Ermittlung der usuellen Kotextpartner mit Hilfe der Kotextanalyse in COSMAS: - mit Hilfe der Standardkotextanalyse und/oder anderer Kotextanalysen, bei denen die Einstellungsmöglichkeiten der Standardparameter (vor allem Zuverlässigkeit) geändert werden • Bestimmung des Status Kollokator => intralingualer Kollokationsbegriff • Miteinbeziehung des kontrastiven Aspekts => interlingualer Kollokationsbegriff Im Laufe der nächsten Kapitel werden alle obigen Themenbereiche Schritt für Schritt behandelt.
2.4.1 Die theoretische Basis des Kollokationsbegriffe Bei der Auseinandersetzung mit der einschlägigen Literatur über Kollokationen kann man schnell feststellen, dass die Extension dieses Terminus stark variiert. E. Zöfgen (1996) führt zwei Gründe dafür an. Der erste Grund liegt darin, dass es sich um zwei verschiedene Ebenen der Sprachbeschreibung handelt. Im ersten Fall versteht man unter Kollokation eine bestimmte Kategorie von Zweierverbindungen, woraus folgt, dass sich der Begriff Kollokation auf der gleichen Ebene wie Phraseologismus oder freie Wortkombination befindet. Im zweiten Fall steht der Begriff Kollokation für das Zusammenvorkommen sprachlicher Elemente in bestimmten Kotexten. Kollokation wird dementsprechend ähnlich wie die Termini Distribution, Kookkurrenz, Kompatibilität oder Selektion verwendet. Als zweiter Grund für die unterschiedliche Begriffiichkeit kann die Vielfalt der modifizierenden Adjektive zur Präzisierung des Phänomens Kollokation genannt werden. Cowie (1981) benutzt z.B. die Termini restricted collocations vs. open collocations und Benson (1985) bedient sich der Bezeichnungen grammatical and lexical collocations.(yg)i. Zöfgen 1996,1-2) Die theoretischen Grundvoraussetzungen für den entwickelten Kollokationsansatz bilden die Kollokationsbestimmungen von Benson (1985), BBI (1986), Hausmann (1984) und Kromann (1989). Im nächsten Abschnitt wird mit Hilfe der erwähnten Arbeiten der theoretische Bezugsrahmen für den hier verwendeten Kollokationsbegriff skizziert.
40
Benson (1985) berücksichtigt innerhalb der Syntagmatik nur die lexikalische Ebene, deshalb werden im BBI (1986) - The BBI Combinatory Dictionary of English - nur lexikalische Kombinationen verzeichnet. Im Bereich der lexikalischen Kombinationen für das Englische unterscheidet er vier Kategorien: 1. Freie Kombinationen 2. Idiome 3. Kollokationen 4. Komposita
Die letzte Kategorie Komposita kann in diesem Zusammenhang außer Acht gelassen werden, da im Deutschen Komposita eine Schreibweise ohne Leerstelle aufweisen, also graphisch eine Einheit darstellen, deshalb können sie nicht als lexikalische Kombinationen betrachtet werden. Wie oben erläutert, lassen sich Idiome (in der vorliegenden Arbeit Phraseologismen genannt), nicht als (freie) lexikalische Kombinationen behandeln, weil sie sowohl semantisch als auch syntaktisch als eine relativ feste Einheit gelten. Ihre Produktion unterliegt keiner freien Selektion aus einer begrenzten Menge lexikalischer Elemente, sondern sie sind in ihrer Form mehr oder weniger verfestigt. Als Vergleichsgröße für die Bestimmung der (lexikalischen) Kollokationen ist jedoch die Kategorie Phraseologismus von Nutzen. Bei den Kollokationen handelt es sich nur um die lexikalischen, die nach Benson aus gleichberechtigten Gliedern bestehen, im Gegensatz zu den grammatischen Kollokationen, die sich aus einem dominierenden Teil (wie Verb, Substantiv oder Adjektiv) und einem beigeordneten Teil (wie z.B. Präposition oder Partikel) zusammensetzen.10 Kollokationen werden bei ihm als „loosely fixed combinations" (Benson 1985, 4) definiert. Im Gegensatz zu den Idiomen ergibt sich die Gesamtbedeutung aus der Bedeutung der einzelnen Teile.11 Im Vergleich zu den freien Kombinationen, die einen geringen Grad an Kohäsion aufweisen, kann das durch eine bestimmte Kollokation realisierte semantische Konzept mit Hilfe von anderen Kombinationen nur begrenzt ausgedrückt werden. Im BBI werden die letzten drei Kategorien erschöpfend erfasst und beschrieben. In der hier vorliegenden Konzeption für ein produktionsbezogenes Wörterbuch werden jedoch, wie aus den bisherigen Argumentationen ersichtlich, nur die Kategorien Freie Kombinationen und Kollokationen berücksichtigt und unter lernerlexikographischem Gesichtspunkt behandelt, wobei der Schwerpunkt auf Kollokationen liegt. Aus diesem Grund muss noch über die Typologie der lexikalischen Kollokationen im BBI berichtet werden, in deren Hintergrund der Ansatz von Mel'Cuk (1981) über die lexikalischen Funktionen auf syntagmatischer Ebene steht. Benson/Benson/Ilson verwenden sie mit beträchtlichen Einschränkungen und unterscheiden im BBI sieben Haupttypen (LI - L7) je nach Struktur der Verbindung: LI: Veib (CA) + Substantiv 12: Verb (EN) + Substantiv L3: Adjektiv + Substantiv LA: Substantiv + Veib L5: Substantiv + Substantiv L6: Adverb + Adjektiv L7: Verb + Adveib 10
(V + S) (V + S) (Adj + S) (S + V) (S + S) (Adv + Adj) (V + Adv)
In dieser Arbeit wird HAUSMANNS Theorie vertreten (siehe unten), der inneitialb einer Kollokation zwischen zwei nicht gleichberechtigten Komponenten Basis und Kollokator unterscheidet, (vgl. HAUSMANN 1 9 8 4 )
macht gerade in Bezug auf die Semantik einen Unterschied zwischen den zwei Teilen: semantisch autonom vs. nicht autonom, (vgl. HAUSMANN 1984)
HAUSMANN
41
Der Unterschied zwischen der Kategorie LI und L2 besteht in der Funktion des Verbs. „CA" steht für 'creation' und 'activation' (z.B. compose - music, wind - watch). „EN" drückt die Funktionen 'eradication' und/oder "nullification' aus (z.B. cancel - performance). In der Kategorie L4 verbindet sich das Substantiv mit einem Verb, das für die durch das Substantiv bezeichnete Person oder Sache charakteristische Tätigkeit ausdrückt (z.B. cat miaow). Der Typ S + S in der Kategorie L5 steht für Verbindungen von Substantiven, die durch of verbunden sind, und ein Mitglied/eine Einheit einer größeren Menge bezeichnen (z.B. loaf-bread), (vgl. Bahns 1996,17-21) Um den dieser Arbeit zugrunde gelegten Kollokationsbegriff nachvollziehen zu können, muss man noch auf Hausmanns Typologie von Wortverbindungen und auf die darin vertretene Kollokationsauffassung näher eingegangen (Hausmann 1984) sowie Kromanns funktionale Beschreibung von Kollokationen referiert werden (Kromann 1989). Hausmann (1984) teilt die Wortverbindungen in fixierte (Wortbildung, Redewendung) und in nicht fixierte so genannten K O M B I N A T I O N E N auf. Innerhalb der nicht fixierten Kombinationen unterscheidet er drei Kategorien, wobei er sich des Unterscheidungskriteriums Grad der Kombinierbarkeit und des Begriffs Affinität im Sinne von „Neigung zweier Wörter, kombiniert aufzutreten" (Hausmann 1984, 398) bedient. Die drei dabei entstehenden Kategorien sind: KONTER-KREATION (konter-affin) KOLLOKATION (affin) KO-KREATION (frei)
Für das Forschungsvorhaben ist die erste Kategorie nicht von Interesse, weil es dabei um Wörter mit begrenzter Kombinierbarkeit geht, die aber wiederum mit Wörtern kombiniert werden, die außerhalb ihres Kombinationsbereichs vorkommen. Solche Verbindungen stellen einen kreativen Gebrauch der Sprache dar, der hauptsächlich für literarische Texte typisch ist und für die Sprachproduktion der Fremdsprachenlemer keine Relevanz besitzt. Die anderen zwei Kategorien stellen den eigentlichen Gegenstand der vorliegenden Arbeit dar. Wenn begrenzt kombinierbare Wörter mit ähnlichen Wörtern zusammen auftreten, handelt es sich nur dann um eine Kollokation, wenn dabei differenzierte semantische Regeln beachtet wurden und zusätzlich sich die Wortkombination durch eine „auffallende Üblichkeit" (Hausmann 1984, 399) auszeichnet. Die Verbindung von Wörtern mit wenig begrenzter Kombinierbarkeit entspricht der freien Kombination, in Hausmanns Terminologie der Ko-Kreation. Die eigentliche Schwierigkeit stellt die Abgrenzung der beiden Kategorien gegeneinander dar. Die Definition der Kollokation als „typische, spezifische und charakteristische Zweierkombination von Wörtern zur langue" (Hausmann 1985,118) ohne die Untersuchung des Status der Kombinationspartner kann zur Lösung des Problems nicht viel beitragen. Deshalb ist Hausmanns Unterscheidung innerhalb der Kollokation zwischen einer Basis und einem Kollokator von Bedeutung. Die Basis ist semantisch autonom, aber bei der vollständigen und präzisen Semantisierung des Kollokators muss auf die Basis zurückgegriffen werden. Der Kollokator ist zur Basis affin, also neigt dazu, mit ihr zusammen aufzutreten. Die Anzahl der möglichen Basen ist begrenzt. Auf die Tatsache, dass bei einer kontrastiven Analyse die Basen ohne Probleme äquivalenzfähig sind, die Kollokatoren aber erst in der Kollokation selbst, soll hier erneut verwiesen werden.12 (vgl. Hausmann 1984, 398-399) 12
Diese Problematik wurde bereits im Kapitel 2.1 erwähnt, und wird später im Kapitel Uber den interlingualen Kollokationsbegriff eingehend untersucht und anhand von Beispielen dargestellt.
42 Nachdem die Typologie von lexikalischen Kollokationen von BBI (1986) und die Kollokationsauffassung von Hausmann (1984) erläutert worden sind, kann ein Muster für die Strukturtypen der syntagmatischen Verbindungen im geplanten Wörterbuch entworfen werden. Wegen des Produktionsbezugs werden bei den Basen, die ausschließlich den Lemmabestand des ersten Wörterverzeichnisses bilden, außer Kollokationen auch freie Wortkombinationen angeführt.13 Noch ein letztes Argument sollte sowohl für die Wahl der Basen als ausschließliche Lemmakandidaten des primären Wörterverzeichnisses als auch für die Verzeichnung freier Wortkombinationen an dieser Stelle eingebracht werden: Hat es überhaupt Sinn, Kollokationen unter der Basis zusammenzustellen? Ja, denn jegliches Formulieren geht von der Basis zum Kollokator und nicht umgekehrt, d.h. in den meisten Fällen vom Substantiv zum Adjektiv oder Veib, nicht umgekehrt. (Hausmann 1984,401) Da die produktionsorientierte Erfassung von Kollokationen innerhalb einer Sprache (im Deutschen) und im Kontrast mit einer anderen Sprache (mit dem Ungarischen) im Mittelpunkt des Forschungsvorhabens steht, werden die syntagmatischen Verbindungen dementsprechend bei der Basis - d.h. bei dem Substantiv, Verb und Adjektiv - verzeichnet. Deshalb müssen auch die Strukturtypen für die Wortkombinationen in Bezug auf den BasisLemmabestand entwickelt werden. Daraus folgt, dass die Typologie von BBI (1986) zunächst leicht vereinfacht werden muss, damit nur diejenigen bleiben, deren Erstkomponente für ein Basiswort steht. Wenn man Kollokationen sowie freie Wortkombinationen einheitlich und systematisch darstellen und beschreiben möchte, müssen folgende grundlegende Strukturtypen für beide gelten: Substantiv + Substantiv Substantiv + Adjektiv Substantiv + Veib Verb + Adverb Adjektiv + Adverb
(S + S) (S + Adj) (S + V) (V + Adv) (Adj + Adv)
Bei den obigen Strukturtypen ist jeweils die erste Komponente das Basiswort und die zweite der Kombinationspartner. Im Falle einer Kollokation werden sie Basis und Kollokator genannt. Wenn es sich um eine freie Wortkombination handelt, wird anstatt der Bezeichnung Basiswort für den ersten Bestandteil auch weiterhin die Benennung Basis vorgeschlagen. 4 Die zweite Komponente sollte jedoch als Kombinationspartner (oder in Bezug auf die Wörterbuchbasis Kotextpartner) bezeichnet werden. Mit den obigen, primär für Kollokationen entwickelten Strukturtypen können nicht alle freien Kotextpartner zu den drei verschiedenen Wortarten als Basis-Lemmakandidaten erfasst werden. Die Basen gehen auch andere Verbindungen mit Wörtern oder Syntagmen ein, wie z.B. Verben mit ihren verschiedenen Valenzrealisierungen oder Adjektive attributiv zu Substantiven oder adverbial zu Verben. Aus dieser Vielfalt der verschiedenen Ko13
14
Der Wortgebrauch Basis (im Sinne von HAUSMANN 1984) für die Lemmata resultiert aus der empirisch überprüfbaren Annahme, dass nahezu bei allen im Wörterbuch aufgenommenen Wörtern, deren Zahl wegen der Zweckbestimmung und des Benutzerbezugs stark begrenzt ist, auch Kollokationen (intra- oder/und interlingual) verzeichnet sind. Die Bezeichnung für das Lemma als Grundbestandteil einer Kombination hängt vom Status der jeweiligen Wortkombination (Kollokation vs. freie Wortkombination) ab. Diese Tatsache muss betont werden, aber im Weiteren wird kein Unterschied mehr zwischen Basis und Basiswort gemacht, wenn es nicht unvermeidbar ist. Wegen des primären Wörterbuchprofils in Hinblick auf Kollokationen werden die Lemmazeichen als Teil einer Kombination wie zuvor Basen genannt.
43 textpartnerklassen resultieren dementsprechend genauso viele Angabeklassen auf der Ebene der Wörterbuchform, worauf man bei der Planung des Mikrostrukturenprogramms achten muss. Im Kapitel 4 über die Mikrostruktur werde ich diese Problematik wieder aufgreifen und detailliert erläutern. Als Nächstes kann die Frage gestellt werden: Woher und wie gewinnt man die für den Sprachgebrauch typischen und für den anvisierten Benutzerkreis relevanten freien Wortkombinationen und Kollokationen, wenn man nicht nur punktuell, sondern systematisch einen bestimmten sprachlichen Bereich untersucht und zu beschreiben versucht? Auf dem Weg zur Beantwortung dieser Frage hilft der Ansatz von Kromann (1989) einen Schritt weiter. Er bezieht bei seiner Gliederung der Wortkombinationen Viehwegers Arbeit (1982), Coserius Trichotomie (1971) und als operationales Verfahren die Kommutation bzw. Substitution ein. Ein großer Teil der Wortverbindungen im Sprachsystem ist laut Kromann (1989) in der Rede frei produzierbar, deshalb auch vorhersagbar. Sie werden bei ihm regelrechte Wortverbindungen oder regelrechte Kollokationen in Anlehnung an Viehweger (1982) und an den Britischen Kontextualismus genannt. Sie sind regelrecht, weil sie einerseits grammatischen Satzbauplänen, andererseits semantischen Verknüpfungsregeln unterliegen. Auch die semantischen Verknüpfungsrestriktionen sind als regelrecht aufzufassen, da „die Lexeme innerhalb der Grenzen der 'semischen' und der 'sememischen1 Kompatibilität des Feldes frei kommutierbar sind" (Kromann 1989, 266). Bei der anderen Gruppe der Kollokationen ist eine Substitution der Kollokatoren aus der Sicht des Sprachsystems zwar möglich, aus der Sicht der Sprachnorm aber nicht mehr.15 Ein Teil der Kollokatoren ist usuell, also normbedingt, ein anderer Teil jedoch nicht usuell, also pragmatisch bedingt. Die eingeschränkte Substituierbarkeit innerhalb der Norm sieht Kromann als eine Folge von einer von der Sprachgemeinschaft geförderten Präferenz, wodurch also andere aus der Sicht des Sprachsystems denotativ sachgerechte und somit potentielle Kollokatoren aus dem Zentrum des Kollokationsfeldes verdrängt werden. In den Parole-Vorkommen der Einzelsprache sind also - relativ zu usuellen Texten - bestimmte Kollokatoren hochfrequent und somit präferiert [...]. (Kromann 1989,267)
Einige seiner Beispiele, die die obigen Aussagen verdeutlichen sollen, seien hier erwähnt: Bads
Kollokator
Kaffee Kaffee
trinken / genießen / nehmen machen / kochen / zubereiten / (auf)brühen
(vgl. Kromann 1989,265-267)
In meiner Interpretation gehören zu den usuellen Kollokatoren einerseits trinken, andererseits machen und kochen. Die nicht usuellen Kollokatoren wären dementsprechend genießen und nehmen bzw. zubereiten und (auf)brühen. Ihre Wahl ist sehr kontextspezifisch, also pragmatisch bedingt. Vor dem bisher skizzierten, gesamten theoretischen Rahmen kann schließlich eine Typologie der Wortkombinationen, die mindestens zwei Autosemantika als Bestandteile aufweisen, in Bezug auf das zu konzipierende Wörterbuch unterbereitet werden. Dabei spielt neben dem Aspekt usuell vs. nicht usuell - im Sinne von „gebräuchlich, präferiert" (!) - noch 15
Der Begriff Kollokation ist bei ihm weiter gefasst als er im hier vorliegenden Ansatz betrachtet wird (siehe weiter unten).
44 die Unterscheidung zwischen Sprachsystem und Sprachnorm als bestimmende Faktoren eine Rolle: Sgrachebene Pragmatik^ usuell nicht usuell
regelgerecht systembedingt freie Wortkombinationen
nicht nur regelgerecht normbedlngt Kollokationen („,,„)
Tab. 12: Verteilung der Wortkombinationen Wie aus der Darstellung ersichtlich ist, wird die Aufmerksamkeit bei der Erfassung des syntagmatischen Potenzials hinsichtlich eines Wortes nur auf den usuellen (i.S.v. präferierten) Bereich gerichtet. Dies ist vor allem die Folge des anvisierten Benutzerkreises Deutschlerner und des Produktionsbezugs. Wenn es um die Produktion fremdsprachiger Texte geht, gewinnt deijenige sprachliche Bereich, der den usuellen Sprachgebrauch darstellt, für den Wörterbuchgegenstand viel mehr an Bedeutung als sonst. Aus der Tabelle geht auch die übliche Unterscheidung zwischen freien Wortkombinationen und Kollokationen hervor. Ob eine Wortverbindung als Kollokation gelten kann, entscheidet die Art der Beziehung zwischen den Kombinationspartnern, die mit Hilfe der fünf definierten Strukturtypen und der Unterscheidung in Basis und Kollokator zu beurteilen ist. Dabei ergeben sich jedoch folgende drei Fragestellungen, deren Beantwortung im nächsten Teilkapitel erfolgt: 1. Woher und wie sind alle möglichen Wortkombinationen zu gewinnen? 2. Wie lässt sich die Zahl aller möglichen Wortkombinationen so beschränken, dass nur die usuellen zum Gegenstand einer weiteren Analyse werden? 3. Wie kann der Status als „Kollokation" bestimmt werden, um unter den Wortkombinationen Kollokationen von freien Wortkombination unterscheiden zu können?
2.4.2 Die empirische Basis des Kollokationsbegriffs Die erste Frage lautete: Woher und wie sind alle möglichen Wortkombinationen zu gewinnen? Auf diese Frage hat die konzipierte Wörterbuchbasis mit der Primärquelle COSMAS-IKorpora bereits eine zufriedenstellende Antwort gegeben, da mit Hilfe der darin integrierten statistischen Kotextanalyse eine früher unvorstellbar enorme Menge an sprachlichen Daten zu ermitteln ist. Die Antwort auf die zweite Frage Wie lässt sich die Zahl aller möglichen Wortkombinationen so beschränken, dass nur die usuellen zum Gegenstand einer weiteren Analyse werden? ist komplizierter. Den sprachlichen Usus versuchte man bisher in den Wörterbüchern meistens mit Hilfe der Sprachkarteien, der bereits existierenden Nachschlagewerke und der individuellen Sprachkompetenz wiederzugeben, ohne die ernsthafte, methodologische und systematische Nutzung maschinenlesbarer Korpora. Zur Zeit kann man relativ objektive sprachliche Daten allerdings nur anhand der Korpora und deren statistischen Auswertungen gewinnen. Die Überprüfung und Bearbeitung der Daten ist jedoch mittels linguistischer Kompetenz unerlässlich. Die im Kapitel 2.2.4 abgebildeten Recherchetabellen mit den Standardparametern sowie mit veränderten Parametern demonstrierten einige Möglichkeiten, wie die z.T. enorme Menge sprachlicher Daten begrenzbar ist, wobei sowohl Quantität
45 als auch Qualität der zu eruierenden Daten vom jeweiligen Wörterbuchtyp abhängt. Für das geplante zweisprachige syntagmatische Lernerwörterbuch kann man nach exemplarischen Sondierungen folgende strategische Annäherungswerte angeben: Wenn nach einer Standardanalyse die Anzahl der Kombinationspartner groß (etwa über 50) ist, kann sie durch den Parameter Zuverlässigkeit: hoch weiter verringert werden. Wenn dieses Verfahren immer noch nicht ausreicht, eine überschaubare Menge an Kotextpartner für die geplanten Wörterbuchartikel zu selektieren, kann im Endergebnis der Median (die Hälfte aller Fälle) oder ein bestimmtes Quartil ermittelt werden. Um die liste der Kotextpartner zu beschränken, kann auch der Analyse-Kontext: Wortabstand verengt werden, aber nur wenn die syntaktischen Eigenschaften der Wortverbindung dies zulassen (z.B. Substantiv + Adjektiv). Zur Beantwortung der dritten Frage Wie kann der Status als „Kollokation" bestimmt werden, um unter den Wortkombinationen Kollokationen von freien Wortkombination unterscheiden zu können? liefern die bisherigen theoretischen Differenzierungen und Präzisierungen nichts weiter, deshalb muss im folgenden Kapitel ein praktischer und operationalisierbarer Lösungsansatz für die Abgrenzungsproblematik und damit für die Feststellung des Kollokationsstatus gefunden werden. 2.4.3 Der Kollokationsbegriff intralingual Das Hauptproblem bei jeder ausschließlich theoretisch orientierten Unterscheidung zwischen freier Wortkombination und Kollokation liegt darin, dass man bei der Abgrenzung mit objektiv kaum definierbaren Begriffen wie z.B. „loosely fixed" und „semantisches Konzept" (Benson) oder „Affinität" und „auffallende Üblichkeit" (Hausmann) operiert. Mit Hilfe solcher Begriffe und der individuellen Sprachkompetenz kann man keine genaue und praktikable Unterscheidung zwischen freien Wortkombinationen und Kollokationen machen. Die auf diese Weise entstandenen Erklärungsversuche sind empirisch kaum oder gar nicht überprüfbar und in dieser Form für die praktische Lexikographie ebenso wenig verwertbar. Aus der Sicht der Praxis muss die Frage gestellt werden: Lassen sich diese vagen Begriffe für die praktische Lexikographie irgendwie operationalisieren? Und wenn ja, wie? Mit welchen Methoden kann eine relativ objektive Unterscheidung zwischen den beiden Phänomenen erreicht werden? Im Folgenden wird versucht, diese Fragen mit einer kombinierten, theoretischen und empirischen Methode für die Feststellung des Kollokationsstatus zu beantworten. Dabei wird der Terminus Kollokation zunächst intralingual, d.h. innerhalb des Deutschen bestimmt. Drei Hypothesen bilden den Ausgangspunkt zu den weiteren Überlegungen: Hl: Wenn sich der Kollokator innerhalb einer so genannten Kollokation theoretisch durch seine begrenzte Kombinieibarkeit auszeichnet, dann könnte diese begrenzte Kombinieibarkeit durch eine angemessene Kotextanalyse des Kollokators empirisch nachgewiesen werden. H2: Wenn die Zahl der Basen zum Kollokator des selben Strukturtyps, die durch eine Kotextanalyse ermittelt wurde, sehr begrenzt ist, dann kann der so genannte Kollokator als „echter" Kollokator gelten. => Das ganze Kollokationspotenzial des Kollokators kann in solchen Fällen ermittelt werden. H3: Wenn der Kollokatorstatus mit dieser Methode erfolgreich nachgewiesen werden kann, müsste die Kollokation vom Kollokator her bestimmt werden. => Auf diese Weise entsteht der dieser Arbeit zugrunde gelegte (intralinguale) Kollokationsbegriff.
46 Ob eine Wortverbindung als Kollokation eines der fünf definierten Strukturtypen einzustufen ist, entscheidet demnach der Grad der Kombinierbarkeit des zur Basis gehörenden Kotextpartners. Wenn der Kotextpartner stark begrenzt kombinierbar ist, ist er ein Kollokator und damit gilt die Wortverbindung als (intralinguale) Kollokation. Zur Bestimmung des Status Kollokator wird die Kotextanalyse von COSMAS herangezogen. Wenn bei einer Standardkotextanalyse und/oder bei einer Kotextanalyse mit hoher Zuverlässigkeit die Anzahl der Kotextpartner eines bestimmten Strukturtyps sehr begrenzt, also niedrig ist, liegt ein Kollokator und somit eine Kollokation vor.16 Den obigen Hypothesen wird mit Hilfe von Kollokationsbeispielen aus der einschlägigen Fachliteratur nachgegangen, um sie darauf hin zu überprüfen, ob sie in der obigen Terminologie als Kollokationen gelten könnten oder nicht. Die Quelle der Kollokationen ist eine selbst erstellte Kartei so genannter Kollokationen. Sie werden vom so genannten Kollokator her normalerweise einer Standardkotextanalyse (beschrieben im Kapitel 2.2.4) unterzogen. Die dadurch gewonnenen Kotextpartner müssen mit Hilfe der Key-Word-in-ContextBelege (KWICs) auf ihre vollständigen Kotexte geprüft werden, damit die diskursspezifischen Kotextpartner, die nicht in den Strukturtyp passenden Kotextpartner und die Phraseologismen (in den Tabellen alle kursiv) außer Acht gelassen werden können. Die bewährten Kotextpartner werden schließlich fett markiert, weil sie als Basen zum KollokatorSuchwort einzustufen sind. Das Ergebnis dieser Vorgehensweise entscheidet, ob das untersuchte Wort tatsächlich als Kollokator und damit die Wortkombination als Kollokation gelten kann. Intralinguale Kollokationen können dann, wie folgt, näher bestimmt werden: Kollokatioiiintn: Zu den intralingualen Kollokationen zählen solche usuellen (im Sinne von gebräuchlich) Wortkombinationen eines bestimmten Strukturtyps (von den fünf definierten Strukturtypen), die aus mindestens zwei Autosemantika bestehen, und innerhalb derer einer der Kombinationspartner als semantisch autonome Basis gilt, die zur Semantisierung des von ihr abhängigen KoUokators beiträgt (in Anlehnung an Hausmann 1984,1985), der mit Hilfe einer angemessenen statistischen Kotextanalyse in CosMAS-I-Korpora bestimmt werden kann und somit den Kollokationsstatus der Wortkombination (d.h. die statistisch signifikante Häufigkeit des „ZusammenAuftretens" der Kombinationspartner) festlegt. Die Verkniipfbarkeit der Basis mit dem Kollokator lässt sich nicht (allein) mit semantischen Regeln begründen, sondern ihre eingeschränkte Substituierbarkeit ist (auch) auf die pragmatisch eingespielte Sprachnorm zurückzuführen (in Anlehnung an Kromann 1989). Die Kollokationen aus der Fachliteratur werden im Folgenden nach Strukturtypen sortiert und dann - wie oben beschrieben - untersucht. Die folgenden Analysebeispiele (durchgeführt im Juli 2000) sind eindeutige Fälle für Kollokationen des Strukturtyps „Substantiv + Adjektiv". Sie weisen stereotype Kollokatoren und damit mit ihren Basen Kollokationen als Ergebnis auf, weil die Zahl der zulässigen Basen eindeutig begrenzt und niedrig (s5) ist.
16
Die Indexierung intra ist nur unter kontrastivem Aspekt erforderlich. Unter Kollokation muss hier logischerweise intralinguale Kollokation verstanden werden.
47 r triftig (104) 340 198 198 11 0
[Grund/Beweis/Erklärung] Grund Gründe vorliegen Gründe Gründen statistisch unspezifisch
Β 55
7 20 4 18
y schallend (107) 626 431 45 0
[Gelächter/Ohrfeige] (über schallen) Ohrfeige Gelächter Ohrfeigen statistisch unspezifisch
Β 46 36 4 21
Tab. 13: Kotextanalyse für triftig und schallend
r unumstößlich (111)
41 20 17 16 13 13 11 8 8 0
[fest]/[Tatsache/Entscheidung/Gesetz/ Prinzipien] Gründungsdatum Fakten anscheinend Grundsatz Regel Tatsache Wahrheit galt endgültig (e. undu.) statistisch unspezifisch
Β
r uenetrant (133)
Β
[Geruch/Geschmack]/ [riechen/schmecken]
3 4 3 3 3 4 4 3 3
81
64 34 19 0
Geruch Gestank allzu statistisch unspezifisch
penetrant* Geschmack penetrant + riechen penetrant + schmecken
8 4 5
116
0 3
0
Tab. 14: Kotextanalyse für unumstößlich und penetrant Erklärungen zu den Tabellen: Nennform des Kollokators: Adjektiv / Adverb, (Zahl der Vorkommnisse), [mögliche Basen laut Wörterbücher]; fett: relevante Basen (innerhalb eines bestimmten Strukturtyps), normal: Wiederholung der relevanten Kotextpartner, kursiv: diskursspezifische Kotextpartner oder dem Strukturtyp nicht entsprechende Kotextpartner Wenn man die Basen, die im Wörterbuch verzeichnet waren, mit denen der Analyse vergleicht, muss die Auswahl der syntagmatischen Kompetenzbeispielangaben als nicht sehr zufriedenstellend gelten. Zum gleichen Ergebnis hat im Kapitel 2.2.1 der Vergleich des Datenangebots verschiedener Wörterbücher mit dem von COSMAS-I-Korpora geführt. Mit Hilfe der folgenden Beispiele wird nicht nur die Bestimmung des Kollokatorstatus geleistet, sondern auch die Frage stichprobenartig beantwortet, welche relevanten Basen in einem Kollokator-Wörterbuchartikel im Wörterverzeichnis der Kollokatoren des zu konzipierenden Wörterbuchs zu verzeichnen wären. Die ersten zwei Analysen für triftig und schallend wurden im Dezember 2000 wiederholt. Inzwischen hat sich der Umfang des Korpus mehr als verdreifacht. Die Zahl der Belege für die untersuchten Kollokatoren ist dementsprechend in den meisten Fällen ca. um das Dreifache gestiegen. Dadurch treten in den Standardanalysen weitere, seltenere Kotextpartner auf:
48 Y triftig (344) 1015 830 830 830 50 34 20 18 17 17 14 12 11 0
Grund Gründe vorliegen Gründe sprechen Gründe Gründen Argument Einwand Argumenten durchaus Argumente gibt Ansatz gebe statistisch unspezifisch
Β 141 9 6 78 12 7 2 3 2 4 4 3 1 72
Y Zuverlässigkeit: hoch 1015 830 50 0
Grund Gründe Gründen statistisch unspezifisch
Β 141 93 12 98
Tab. 15: Kotextanalyse für triftig Y schallend Ϊ348Ϊ (über schallen) 2613 Ohrfeige & 2613 Ohrfeige 1444 Gelächter 138 Ohrfeigen 35 Lachen 33 ausbrechen 32 erntet 19 Heiterkeit 17 weiterhin 9 Beifall 9 1 7 & 0 statistisch unspezifisch
Β 20 149 107 11 6 1 2 3 2 1 4 3 39
Y Zuverlässigkeit: hoch 2613 1444 138 0
Ohrfeige Gelächter Ohrfeigen statistisch unspezifisch
Β 169 107 11 61
Tab. 16: Kotextanalyse für schallend Diese im Vergleich zu dem kleineren Korpus neuen Kotextpartner haben einen niedrigen (absoluten und) relativen Gamma-Wert, vgl. z.B. Grund (1015) mit Argument (34), Einwand (20) oder Ansatz (12). Die Zahl der Belege ist bei den zwei letzteren Kotextpartnern gering (s3), deshalb können sie in einem Lernerwörterbuch außer Acht gelassen werden. Der Kotextpartner Argument dagegen erscheint sogar dreimal, deshalb ist seine Aufnahme in die Liste der relevanten Basen begründet. Bei der Einstellung Zuverlässigkeit: hoch stimmen jedoch die Ergebnisse der zwei (früheren bzw. späteren) Analysen miteinander völlig überein. Die neuen Kotextpartner sprechen für die Erweiterung der bisherigen Korpora. In Hinblick auf die Zweckbestimmung eines Lernerwörterbuchs und auf das durch die
49 bisherigen Analysen gewonnene Datenangebot kann die derzeitige Größe der public Korpora geschriebener Sprache bereits als ausreichend angesehen werden. Die letzten zwei wiederholten Analysen für penetrant und unumstößlich werfen jedoch einige Probleme auf. Hier reichen die Analysen mit Zuverlässigkeit: hoch allein nicht aus, da die Differenzen unter den relativen Gamma-Werten wesentlich geringer sind. Aus diesem Grund muss untersucht werden, in welchem Maße bestimmte Daten der Standardanalyse auch mit herangezogen werden könnten oder sogar sollten: γ penetrant ί352ϊ
191 137 45 34 32 31 25 25 23 22 21 17 15 14 14 14 12 10 9 0
Geruch Gestank Fischgeruch Regelmäßigkeit aufdringliche Freundlichkeit Hartnäckigkeit Beharren Wiederholung genervt manchmal geradezu Zeitgenossen derart Weise zuweilen allzu extrem Nase statistisch unspezifisch
Β
r Zuverlässigkeit: hoch
Β
20
191 Geruch 137 Gestank 45 Fischgeruch 0 statistisch unspezifisch
20
13 3 4 3 4 3 3 4 3 7 4
13 3 316
2 4 6 3
4 1 1
260
fab. 17: Kotextanalyse für penetrant Υ unumstößlich (240)
74 66 61 47 41 36 35 35 34 32 25
Wahrheiten Tatsache Wahrheit scheinbar Gründungsdatum Regel Fakten Fakt Gesetzen Grundsatz anscheinend
Β
8 12 11
7 3
8 6 4 4 5 2
r Zuverlässigkeit: hoch
74 66 61 47 41 0
Wahrheiten Tatsache Wahrheit scheinbar Gründungsdatum statistisch unspezifisch
Β
8 12 11
7 3 199
50 Y 25 24 23 22 16 12 9 9 9 8 0
unumstößlich (240) Dogma Beweise Bedingung Regeln Feststellung Notwendigkeit bislang Prinzip Auffassung Tradition statistisch unspezifisch
Β 3 3 4 4 3 3 4 3 1 1 141
Tab. 18: Kotextanalyse für unumstößlich Erklärungen zu den Tabellen: Nennform des Kollokators: Adjektiv, (Zahl der Vorkommnisse); fett: relevante Basen (innerhalb eines bestimmten Strukturtyps), normal: Wiederholung der relevanten Kotextpartner, kursiv: diskursspezifische Kotextpartner oder dem Strukturtyp nicht entsprechende Kotextpartner Welche weiteren Basen mitberücksichtigt werden könnten, entscheidet außer den relativen Gamma-Werten vor allem die Relevanz der Wortverbindung für den anvisierten Benutzerkreis. Beim Kollokator penetrant stellt sich die Frage, ob die weiteren Basen wie z.B.: Regelmäßigkeit und Freundlichkeit in einem Wörterbuch auch verzeichnet werden sollten oder nicht. Nach den Gamma-Werten und wegen der kleinen Relevanz für die Fremdsprachenlerner kann man auf sie in einem Lemerwörterbuch verzichten. Im Falle des Kollokators unumstößlich wären weitere Basen wie z.B.: Regel, Fakt(en), Gesetzen usw. eventuell anzuführen, da die Gamma-Werte im Vergleich zu dem größten Wert (74) relativ hoch (36,35, 34, 32) liegen. Auch hier sollte der entscheidende Faktor die Wichtigkeit der Wortverbindung für Deutschlerner sein. Aus den obigen Beispielen für „echte" Kollokatoren wurde bereits ersichtlich, wie schwierig die Begrenzung der relevanten Basen für die Kollokator-Wörterbuchartikel zu leisten ist. Die Entwicklung einer Methode für die Grenzziehung erfordert eine detaillierte Analyse, die über den Rahmen dieser Arbeit hinausgehen würde. Im Folgenden werden auch zwei Beispiele für den Strukturtyp „Verb + Adverb" angeführt. Es werden die „kollokatorverdächtigen" Adverbien köstlich und ausgiebig verschiedenen Kotextanalysen - mit Standardeinstellung und/oder mit Zuverlässigkeit: hoch - unterzogen: Y 568 568 375 254 250 218 119 101
köstlich (634) amüsiert Publikum amüsiert amüsieren amüsierten schmeckt amüsierte Einfach schmecken
Β 4 46 33 19 27 18 15 12
Y 568 375 254 250 218 119 101 68
Zuverlässigkeit: hoch amüsiert amüsieren amüsierten schmeckt amüsierte Einfach schmecken schmeckte
Β 50 33 19 27 18 15 12 7
51
γ köstlich C634) 68 Luxeuil 68 schmeckte 67 duftendes 45 munden 41 duftende 38 duftenden 36 schmeckende 36 duftet 35 frisch 30 schmeckten 21 Wein 21 speisen
Β 4 7 5 4 4 4 3 4 4 3 5 3
y Zuverlässigkeit: hoch 68 Luxeuil 67 duftendes 45 munden 41 duftende 0 statistisch unspezifisch
Β 4 5 4 4 436
#··
(keine Verben mehr)
Tab. 19: Kotextanalyse für köstlich
Υ ausgiebig (1452) Zuverlässigkeit: hoch 503 gefeiert 276 Gelegenheit (haben) 273 feiern 160 Gebrauch (machen) 131 diskutiert 95 zitiert 79 genutzt 74 getanzt 62 genießen 62 frönen 45 feierte 43 genossen 42 testen 41 nutzten 0 statistisch unspezifisch
Β 77 56 50 29 31 21 22 11 15 8 12 8 9 6 1097
Tab. 20: Kotextanalyse für ausgiebig Erklärungen zu den Tabellen: Nennform des Kollokators: Adverb, (Zahl der Vorkommnisse); fett: relevante Basen (innerhalb eines bestimmten Strukturtyps), normal: Wiederholung der relevanten Kotextpartner, kursiv: diskursspezifische Kotextpartner oder dem Strukturtyp nicht entsprechende Kotextpartner
Bei dem Adverb köstlich liefert die zweite Kotextanalyse eine begrenzte und niedrige Zahl an relevanten Basen (amüsieren, schmecken und munden), also handelt es sich in diesem Fall auch um einen Kollokator. Da der letzte Kotextpartner laut LGWDAF veraltet ist, sollte er im geplanten Wörterbuch nicht bei dem Kollokator köstlich verzeichnet werden. Bei dem
52 Wort ausgiebig wurde wegen der langen Liste der Standardanalyse nur die Kotextanalyse mit hoher Zuverlässigkeit abgebildet. Die gewonnenen Basen können ohne Weiteres im Kollokator-Wörterbuchartikel ausgiebig angeführt werden. Es sei außerdem noch ein weniger eindeutiger Fall für eine Kotextanalyse angeführt, bei dem sich über den Status Kollokator nicht so einfach entscheiden lässt. Wegen der größeren Zahl der Vorkommnisse wurde nach der Überprüfung der Standardanalyse, die im Vergleich zu den obigen Analysen viel länger ausfiel, gleich die Analyse mit hoher Zuverlässigkeit für die Untersuchung herangezogen. r heikel (2695) Zuverlässigkeit: hoch 1886 Thema 444 Themen 398 Angelegenheit 332 Frage 277 Punkt 268 Aufgabe 266 Situationen 260 Fragen 207 Mission 175 Situation 172 Missionen 135 Unterfangen 118 Sache 109 Idquor; heiklen 98 Themas 86 Gratwanderang
Β
r
396 99 70 148 80 78 45 93 42 68 22 22 54 5 17 12
76 73 71 66 64 59 58 57 56 54 48 48 44 42 0
Β besonders Terrain Balance Balanceofc Aufgaben äußerst Phase Kapitel Lage Problem Punkte politisch solch Steuerfall statistisch unspezifisch
32 16 14 9 27 14 20 15 38 37 31 14 8 5 1164
Tab. 21: Kotextanalyse für heikel Erklärungen zur Tabelle: Nennform des Kollokators: Adjektiv, (Zahl der Vorkommnisse); fett: relevante Basen (innerhalb eines bestimmten Strukturtyps), normal: Wiederholung der relevanten Kotextpartner, kursiv: diskursspezifische Kotextpartner oder dem Strukturtyp nicht entsprechende Kotextpartner
Wenn man die Tabelle genau betrachtet, sieht man, dass die Zahl der relevanten Basen recht hoch ist, genauer bei 17 liegt. Ist dieses „kollokatorverdächtige" Adverb auch noch sehr begrenzt kombinierbar und kann somit als Kollokator anerkannt werden? Können die Wortkombinationen mit ihm immer noch als Kollokationen gelten? Nach den bisherigen Rechercheerfahrungen kann das Wort heikel anhand der obigen Kotextanalyse, weil sie eine begrenzte und noch ohne Weiteres überschaubare Menge an Basen liefert, als Kollokator eingestuft werden. Diese Einstufung entspricht auch der Sprachintuition, was die Richtigkeit der Entscheidung untermauert. Anhand der Analyseergebnisse für heikel und weiteren exemplarischen Sondierungen sowie aus praktischen Gründen hinsichtlich der erforderlichen Datenmenge und der benutzerfreundlichen Datenrepräsentation für den anvisierten Benutzerkreis von Deutschlernern könnte die Grenze der Basen bei einer Standardkotextanalyse mit hoher Zuverlässigkeit ca. bei 15 liegen, um das untersuchte Wort als Kollokator anzuerkennen. Somit würden alle Kombinationen - gemäß den Strukturtypen - mit dem
53 untersuchten Wort als Kollokationen gelten. Im geplanten Wörterbuch müssen jedoch aus den bereits erwähnten Gründen (Benutzerbezug und Wörterbuchtyp) nicht unbedingt alle verzeichnet werden. Die Selektion kann sich, wie bisher, an der Relevanz für die Benutzergruppe orientieren. Da Kollokatoren sich nicht immer präzise abgrenzen lassen und dadurch graduelle Abstufungen auftreten können, wäre die genaue Untersuchung der Übergangsfälle eine wichtige Forschungsaufgabe, die für die Wörterbuchkonzeption nicht relevant ist und deshalb nicht geleistet wird. Die Kollokationen der anderen Strukturtypen werden an dieser Stelle nicht weiter behandelt, da sie nachher anhand konkreter Kotextanalysen für verschiedene Lemmazeichen des geplanten Wörterbuchs vorgestellt werden.
2.4.4 Datenerhebung und -Selektion für die Basis- und Kollokator-Wörterbuchartikel Nachdem die Methode zur Festlegung des Kollokatorstatus und damit zur Bestimmung der Kollokation vorgestellt wurde, kann man die Datenerhebung und -Selektion sowohl für die Basis- als auch für die Kollokator-Wörterbuchartikel anhand von konkreten Lemmazeichen demonstrieren. Die empirischen Daten liefern immer die jeweiligen konkreten statistischen Kotextanalysen in den Korpora geschriebener Sprache der CoSMAS-I-Korpora als die Primärquelle der Wörterbuchbasis. Im ersten Schritt erfolgt eine spezifische Kotextanalyse für das Basis-Lemmazeichen, damit die erforderlichen Daten für den Basis-Wörterbuchartikel ermittelt werden. Im zweiten Schritt wird eine reziproke Analyse für einige Kotextpartner der Basis durchgefühlt, um zu überprüfen, welche derselben als Kollokatoren im Sinne dieser Arbeit gelten können, für die dann auf diese Weise das ganze Kollokationspotenzial gewonnen werden kann. In der ersten Kotextanalyse für das Basiswort sind durch eine Kotextanalyse die möglichen Kotextpartner der Basis nahezu vollständig zu erfassen. Jede Kotextanalyse ermittelt im festgelegten Sprachausschnitt diejenigen Kotextpartner, die im Vergleich zum Vorkommen im Gesamtkorpus überproportional häufig miteinander korrelieren - häufiger, als nach dem statistischen Zufallsprinzip zu erwarten gewesen wäre. Sie erscheinen als Wortliste nach dem berechneten Grad der lexikalischen Kohäsion. Durch die Konzentration auf den usuellen Bereich gehen folglich viele freie Wortkombinationen und bestimmte seltenere Kollokationen verloren. Da dieser Umstand der Zweckbestimmung des Wörterbuchs nicht widerspricht, kann er getrost hingenommen werden. Wenn die Standardanalyse zu viele Kotextpartner liefert, kann die Liste - wie bereits erwähnt - durch die Einstellung Zuverlässigkeit: hoch verkürzt werden. Wenn das noch nicht ausreicht, kann eine weitere Einschränkung des usuellen Bereichs durch den Median oder durch irgendein Quartil unter der Berücksichtigung der relativen Gamma-Werte erfolgen. In einem weiteren Schritt der Datenerhebung für die Basis-Lemmazeichen müssen die gewonnenen Kotextpartner darauf hin überprüft werden, ob sie tatsächlich Wortkombinationen eines bestimmten Strukturtyps im System bzw. in der Norm sind oder diskursspezifischen Gebrauch präsentieren. Eine Kontrolle der Kotexte durch die KWIC-Belege gibt darüber in den fraglichen Fällen Auskunft. Wenn die Summe der Kotextpartner - durch die Eliminierung der diskursspezifischen Kotextpartner (in der Tabelle kursiv), durch die Einschränkung des gültigen Strukturtyps/der gültigen Strukturtypen (in der Tabelle fett) und eventuell durch die Herausfilterung weiterer Klassen von möglichen Kotextpartnern außer der Strukturtypen (in der Tabelle recte) - eingegrenzt wurde, können die Wortkombinationen einzeln vom Kotextpartner her untersucht werden.
54
Die zweite, reziproke Kotextanalyse bezieht sich dementsprechend nur auf diejenigen Kategorien der Kotextpartner, die dem jeweiligen Strukturtyp relativ zur Basis entsprechen. In dieser Kategorie von Kotextpartnem sucht man also nach solchen, die sehr begrenzt mit anderen Basiswörtera kombiniert werden können, also sowohl der strukturellen und semantischen Bedingung der Basis-Kollokator-Unterscheidung als auch der der begrenzten Kombinierbarkeit entsprechen. In dieser zweiten Analyse kristallisieren sich die Kollokatoren und damit die (intralingualen) Kollokationen heraus. Da die vollständige Analyse jedes einzelnen Kotextpartners zeit- und arbeitsaufwendig ist, können im Vorhinein linguistisch begründete Hypothesen aufgestellt werden, welche Kotextpartner überhaupt als „Kollokatorkandidaten" in Frage kommen. Diese Kotextpartner werden weiterhin „kollokatorverdächtige" Kotextpartner genannt. Im Folgenden wird die oben beschriebene Methode anhand der drei Basis-Kotextanalysen für die drei Lemmazeichentypen Verb, Substantiv und Adjektiv und der zugehörigen reziproken Kotaxtanalysen exemplarisch vorgestellt. Als Beispiel für den Lemmazeichentyp Verb kann die Kotextanalyse des BasisLemmazeichens (sich) amüsieren (durchgeführt im Oktober 2000) für den Strukturtyp „Verb + Adverb" abgebildet werden: Standard
köstlich prächtig Gäste prächtig königlich Publikum halb Tode (zu Tode) sichtlich Köstlich Gäste Bolle teils Zuschauer bestens blendend Erwachsenen ···
Β Zuverlässigkeit: hoch Y 1446 121 köstlich 506 7 prächtig 506 52 königlich 353 33 Publikum 84 halb 331 177 22 Tode 149 33 sichtlich 122 22 Köstlich 94 7 Gäste 89 27 Bolle 82 7 teils 65 8 bestens 28 Zuschauer 57 57 15 blendend 45 5 Erwachsenen 44 8 ehren statistisch unspezifisch
Β Y 1446 121 59 506 353 33 84 331 177 22 149 33 122 22 94 7 89 27 82 7 8 65 57 15 57 28 45 5 44 8 8 43 0 1942
Tab. 22: Kotextanalyse; 2429 Wortformen zu (sich) amüsieren in public Korpora geschriebener Sprache
Erklärungen zur Tabelle: y: Gamma-Wert; B: Anzahl der Belege; fett: relevante Kotextpartner (eines bestimmten Strukturtyps); normal: Wiederholung der relevanten Kotextpartner; kursiv: diskursspezifische Kotextpartner Die relevanten Kotextpartner des Strukturtyps „Verb + Adverb" in Bezug auf (sich) amüsieren sind: köstlich, prächtig, königlich, zu Tode, sichtlich, bestens und blendend. Das sind die anhand der Primärquelle erhobenen Daten, die mit denen der Sekundärquellen (DUDEN2, LGWDAF) ergänzt werden. Auf diese Weise werden alle Daten, die später lexikographisch aufbereitet werden, bereitgestellt. Zur Veranschaulichung dieser Datenerhebung und -Selektion sei hier ein Ausschnitt aus der Tabelle des Kapitels 2.2.1 nochmals abgebildet,
55 die alle Adverbien zum Verb (sich) amüsieren enthält, die als Kollokatoren überhaupt in Frage kommen: Belege gut 25 köstlich 132 großartig 0 königlich 37 glänzend 3 prächtig 68 hervorragend 7 Adverbien anhand von Cosmas: zu Tode 34 sichtlich 14 bestens 17 blendend 7
DUDEN-2
LGWDAF
+
+
+
+
-
+
-
+ +
-
+
-
-
-
-
-
-
-
-
-
-
Tab. 23: (SICH) AMÜSIEREN Erklärungen zur Tabelle: Belege: Anzahl der Belege aus COSMAS public Korpora, DUDEN-2 = Du-
den. Das Stilwörterbuch, LGWDAF = Langenscheidts Großwörterbuch Deutsch als Fremdsprache In einer reziproken Analyse werden die „kollokatorverdächtigen" Kotextpartner untersucht. Da die Adverbialbestimmung zu Tode eine phraseologische Einheit ist, stellt sich die Frage, ob sie als Kotextpartner innerhalb eines bestimmten Strukturtyps gelten kann. Anhand der signifikanten Ergebnisse der Kotextanalysen für (sich) amüsieren und zu Tode (siehe unten) wird dieses Syntagma in seiner Funktion als Adverbialbestimmung als komplexes Adverb betrachtet und als Kotextpartner anerkannt. (durchgeführt im Juli 2000) r köstlich Γ1139Ϊ adverbial (370) 187 amüsierten 158 amüsiert 128 amüsierte Publikum 128 amüsierte 105 schmeckt 84 Einfach 73 amüsieren 39 duftende 31 schmecken 23 schmeckt 20 frisch 13 Erwachsenen 11 mitgebracht 10 reichlich 10 Komödie
(durchgeführt im Dezember 2000) Β 16 18 4 8 14
12 9 4 5
3 3 1 3 3 4
γ köstlich ί2143ϊ adverbial (634) 568 amüsiert Publikum 568 amüsiert 375 amüsieren 254 amüsierten 250 schmeckt 218 amüsierte 119 Einfach 101 schmecken 68 Luxeuil 68 schmeckte 67 duftendes 45 munden 41 duftende 38 duftenden 36 schmeckende
Β 4 46 33 19 27 18 15
12 4
7 5 4 4 4
3
56 Y köstlich Zusammenfassung Bei der Konzipierung des vorliegenden, zweisprachigen syntagmatischen Lernerwörterbuchs sollen in erster Linie die textproduktionsunterstützende Funktion und die sprachbezogene Studierfunktion des Wörterbuchs betont werden. Die Datendistribution auf zwei Wörterverzeichnisse trägt der freien ProduktionfremdsprachigerTexte und besonders dem Spracherleraungsprozess, in beiden Fällen auf der Grundlage bereits erworbenen Sprachguts, Rechnung. Die Benutzung des Wörterbuchs bei der Textproduktion wird durch das ungarisch-deutsche Register, das den Zugriff ausschließlich auf die Lemmata und Daten des Basis-Wörterverzeichnisses ermöglicht, in einem hohen Maße erleichtert und gefördert. Wegen der Sprachrichtung Deutsch-Ungarisch wird in einigen realen Benutzungssituationen auch eine starke textrezeptionsunterstützende Funktion vom Wörterbuch erwartet, die aber in der Wörterbuchkonzeption fast ausschließlich für das Kollokator-Wörterverzeichnis vorgesehen ist. Solche Benutzungssituationen bleiben jedoch wegen der niedrigen Lemmazahlen beider Wörterverzeichnisse und des reichhaltigen produktionsbezogenen Datenangebots in den Wörterbuchartikeln oft erfolglos. Das Wörterbuch kann aus denselben Gründen nur in beschränktem Maße in Übersetzungssituationen, und dann eher bei der Herübersetzung, benutzt werden. Bei der Hinübersetzung kann das Wörterbuch nur in bestimmten Fällen und unter erschwerten, bereits vorgestellten Benutzungsbedingungen zur Rate gezogen werden. Das Wörterbuch verfügt also beschränkt auch über eine translationsunterstützende Funktion. Dem vorliegenden Wörterbuch kommt demzufolge keine Funktion ausschließlich zu, sondern es vereint in sich alle vier: Produktions-, Rezeptions-, Translations- und Studierfunktion, allerdings mit einer starken konzeptuellen Gewichtung auf die Produktions- und Studierfunktion als primäre Wörterbuchfunktionen. Das Wörterbuch gilt dementsprechend als polyfunktional, aber dennoch produktionsbezogen.
4.2 Überblick über die verschiedenen Arten von Mikrostrukturen Dem Wörterbuchartikel als Text können verschiedene textuelle Strukturen zugeordnet werden. Wenn auf alle funktionalen Textsegmente des Artikeltextes eine partitive und eine Präzedenzrelation definiert werden, entsteht eine Ordnungsstruktur, nämlich die hierarchische Artikelkonstituentenstruktur, die die Distribution aller lexikographischen Daten in einem Wörterbuchartikel festlegt. Sind die Elemente einer Trägermenge ein Artikeltext und alle seine methodisch ermittelten funktionalen Textsegmente (also alle Angaben und alle nichttypographische Mikrostrukturanzeiger) und wurde auf der Trägermenge sowohl eine partitive als auch eine Präzedenzrelation definiert, dann ist die damit gegebene textuelle Struktur eine besondere Art einer Textkonstituentenstruktnr, nämlich die konkrete hierarchische Artikelkonstituentenstruktur. (Wiegand 2001,35) Wenn bei der funktional-positionalen Segmentation eines Artikeltextes nur die Angaben berücksichtigt werden, bekommt man eine Teilstruktur der konkreten hierarchischen Artikelkonstituentenstruktur, nämlich die konkrete hierarchische Artikelmikrostruktur, im Weiteren kuiz Mikrostruktur. Die Konstituenten der konkreten hierarchischen Mikrostruktur sind (konkrete) Angaben, während die Konstituenten der abstrakten hierarchischen Mikrostruktur Klassen von Angaben mit gleichem allgemeinen genuinen Zweck und damit abs-
102 trakte Entitäten sind. Diese Strukturen können zweidimensional durch Baum- oder Strukturgraphen dargestellt werden, (vgl. Wiegand 2001,32-38) Mikrostrukturen sind komplizierte Textkonstituentenstrukturen. Die hierarchische Mikrostruktur eines Wörterbuchartikels eines initialalphabetischen Sprachwörterbuches ist eine Struktur, die aus zwei Teilstrukturen besteht: der paititiven und der präzedentiven Mikrostruktur. (Wiegand 2000b, 918) Auf der höchsten Ebene besteht ein Wörterbuchartikel aus Kommentaren als unmittelbare Textkonstituenten des Artikeltextes, die für solche Angaben stehen, die aus sprachtheoretischer Sicht als zusammengehörig betrachtet werden können. Ein Wörterbuchartikel aus einem allgemeinen einsprachigen Wörterbuch weist normalerweise zwei Kommentare auf: einen Formkommentar (FK) und entweder einen semantischen Kommentar (SK) oder einen Kommentar zur Form und Semantik (KFS). Der Formkommentar weist eine hierarchische linke Kernstruktur auf, genauso wie dem semantischen Kommentar eine hierarchische rechte Kernstruktur zugeordnet werden kann. Im Falle eines Kommentars zur Form und Semantik handelt es sich um eine gemischte rechte Kernstruktur. Der semantische Kommentar sowie der Kommentar zur Form und Semantik weisen bei polysemen Lemmazeichen zwei oder mehr Subkommentare (semantischer Subkommentar: SSK bzw. Subkommentar zur Form und Semantik: SKFS) auf, denen als Teilstrukturen der hierarchischen Mikrostruktur hierarchische Integrate zugewiesen werden. Mikrostrukturen mit Integraten heißen integrierte Mikrostrukturen. Die Bestimmung der jeweiligen Mikrostruktur erfolgt mit Hilfe einer Typologie der Mikrostrukturen, die durch die Anwendung von zwei Typologiekriterien entsteht. Im Folgenden werden diese zwei Typologiekriterien ausführlich vorgestellt, einschließlich der dadurch entstandenen Mikrostrukturen. Das erste Typologiekriterium enthält drei Parameter: Anzahl, Art und Reihenfolge der Kommentare. Dieses Kriterium unterscheidet zwischen einfachen und erweiterten Mikrostrukturen. Für den basalen Wörterbuchartikel, der eine einfache Mikrostruktur aufweist, sind zwei Kommentare - Formkommentar und semantischer Kommentar bzw. Kommentar zur Form und Semantik - charakteristisch. Wenn die Anzahl der Kommentare größer als zwei ist, dann weist der Wörterbuchartikel eine erweiterte Mikrostruktur auf. Die Erweiterung kann extern und/oder intern erfolgen. Abhängig davon, ob es sich um einen Prä- oder Postkommentar (PräK bzw. PostK) handelt, kann man von einer links- oder rechtserweiterten Mikrostruktur sprechen. Wenn beide gleichzeitig vorhanden sind, ist die Mikrostruktur extern vollständig erweitert. Im Falle eines mittleren Zwischenkommentars (zwischen Formkommentar und semantischem Kommentar) wird die Mikrostruktur des zugehörigen Artikels binnenerweitert genannt. Die Erweiterung kann aber auch in einem der zwei Kommentare erfolgen. Wenn sie im Formkommentar vorliegt, handelt es sich um eine Mikrostruktur mit linkserweiterter Basisstruktur (* linkserweiterte Mikrostruktur). Das zweite Typologiekriterium betrifft die Verteilung der Bedeutungsangaben und der von den Bedeutungen des Lemmazeichens mitbestimmten Angaben im semantischen Kommentar eines Artikels zu polysemen Lemmazeichen. Hier wird die rechte Kernstruktur genau analysiert. Wenn die Anzahl der angesetzten Bedeutungen die Zahl der semantischen Subkommentare bestimmt und die formkommentarexternen Angaben (z.B.: pragmatische Angaben) mit den Bedeutungsangaben zu einem semantischen Subkommentar integriert sind, entsteht eine integrierte Mikrostruktur. Ein weiterer Subtyp ist die teilintegrierte Mikrostruktur mit einem Präintegrat vor der ersten Polysemieangabe oder mit einem Postintegrat nach dem letzten semantischen Subkommentar. Ein anderer Typ ist die nichtintegrierte
103 Mikrostruktur. Bei dieser Struktur werden die Angaben grundsätzlich anders verteilt. Der erste semantische Subkommentar enthält alle Bedeutungsangaben. Er heißt demzufolge Subkommentar zur lexikalischen Bedeutung. Die darauf folgenden Subkommentare des semantischen Kommentars enthalten Angaben zu jeweils verschiedenen Kotextklassen, unabhängig von der jeweiligen Bedeutung des Lemmazeichens. Wörterbuchartikel aus dem WAHRIG-Wörterbuch weisen solche nichtintegrierten Mikrostrukturen auf. Eine andere Art der Mikrostrukturen, die semiintegrierte Mikrostruktur, weist die selben Subkommentare auf, die Angaben der Subkommentare zu den verschiedenen Kotextklassen stehen jedoch im Skopus einer bestimmten Bedeutung.3 (vgl. Wiegand 2000,42-48) Für die Basis-Artikel im geplanten Wörterbuch sind einfache Mikrostrukturen vorgesehen, d.h. es liegt immer ein semantischer Kommentar vor. Wörterbuchartikel zu monosemen Lemmazeichen haben in der Regel eine einfache Mikrostruktur. Wörterbuchartikel zu polysemen Lemmazeichen weisen entweder eine einfache integrierte Mikrostruktur oder eine einfache teilintegrierte Mikrostruktur mit Postintegrat (kurz: einfache annexierte Mikrostruktur) auf. Das folgende allgemeine Mikrostrukturbild zeigt eine abstrakte hierarchische einfache integrierte Mikrostruktur: ABSTRAKTE HIERARCHISCHE EINFACHE INTEGRIERTE MIKROSTRUKTUR
Abb. 8: Kommentierter Strukturgraph zur abstrakten hierarchischen einfachen Mikrostruktur; Abkürzungen: WA - Wörterbuchartikel, FK = Formkommentar, SK = semantischer Kommentar, SSK= semantischer Subkommentar.
Mit dem dargelegten Instrumentarium ist es bereits möglich, die Mikrostruktur konkreter Wörterbuchartikel zu verschiedenen Lemmazeichentypen im Rahmen des nächsten Kapitels zu beschreiben. 3
Ein Entwurf zu semiintegrierten Mikrostrukturen in ein- und zweisprachigen Wörterbüchern ist in WIEGAND 1 9 9 6 zu f i n d e n .
104 4.3 Der Formkommentar zu verschiedenen Lemmazeichentypen im BasisWörterverzeichnis Innerhalb eines Artikeltextes ist der Formkommentar deijenige, der weniger umfangreich und zum Teil deshalb weniger problematisch zu behandeln ist, aber auch weil man darin wegen der Bedürfnisse des anvisierten Benutzerkreises - in erster Linie fortgeschrittene Deutschlerner - auf bestimmte Datentypen, wie z.B. Ausspracheangabe, verzichten kann. Die Formkommentare zu verschiedenen Lemmazeichentypen (Substantiv, Verb und Adjektiv) weisen relativ kleine strukturelle Unterschiede auf, deshalb können sie gemeinsam analysiert werden. Dabei werden verschiedene Angabeklassen mit Klassensymbolen (z.B. LZGA) vorgestellt und durch eine konkrete Angabe aus Beispielartikeln veranschaulicht. Die Wörterbuchartikel gehören zu monosemen Lemmazeichen, um möglichst viele Angabetypen im Formkommentar exemplarisch verdeutlichen zu können, da bei polysemen Lemmazeichen einige Formangaben im semantischen Kommentar unter den einzelnen Bedeutungen zu finden sind. Die folgenden Wörterbuchartikel gehören zu verschiedenen Lemmazeichentypen. Für Substantivlemmata steht der Wörterbuchartikel Drohung (wai), für Verblemmata der Artikel reinigen (wa2) und für Adjektivlemmata der Artikel höflich (waj): wai:
Dro|hung
wa*
die -en
(gegen jemanden/etwasA) (vkivel/vmivel szembeni) fenyegetis, fenyegetözes SUBS Beschimpfungen und D.en szitkok is fenyegetdzisek ADJ massive, schreckliche sulyos, szörnyü * anonyme, offene nevtelen, nyilt * leere üres i burkolt fenyegetis versteckte Drohung VERB FERNST nehmen komolyan veszi * φ wahr machen valöra vältja/ bevälija * jn durch/mit D.en ^einschüchtern f.ekkel megfelemlit vkit & megfenyeget, (sülyosan) megfenyeget eine Drohung aussprechen < 'tausstoßen * megfenyegetik eine Drohung erhalten
reijniigen reinigte, hat gereinigt etwasA
reinigen;
Lemmazeichengestaltangabe (z.B. aus wai: Drgjhung G LZGA) > Morphologieangabe (z.B. aus wai: die, -en E MorA)
Lemmazeichengestaltangaben sind die kompliziertesten Angaben, weil sie erstens gleichzeitig Wortformangaben und Rechtschreibangaben sind. Zweitens sind sie oft mehrfach um Silbentrennungsangaben und noch um eine Wortakzentkennzeichnung erweitert. In der vorliegenden Wörterbuchkonzeption wird folgende Lemmazeichengestaltangabe für alle nennlexikalischen Lemmata vorgesehen: um eine/zwei/... Silbentrennungsangabe(n) binnen- und um eine Wortakzent- und Vokalquantitätskennzeichnung (für Kürze/Länge) unten erweiterte Lemmazeichengestaltangabe, die zugleich eine Wortformangabe und Rechtschreibangabe ist. Die Abkürzung für die Angabe sieht, wie folgt, aus: LZG[l/2/...-STrA]AlWAk | VQK | WFA | RA Wortformangaben sind bei Substantivlemmata der Nominativ Singular (WFA.NSg), bei Verblemmata der Infinitiv (WFA.Inf) bzw. bei Adjektivlemmata die unflektierte Form (WFA.unfF). Morphologieangaben können bei Substantiven (MorA.S), bei Verben (MorA.V) und schließlich bei Adjektiven (MorA.Adj) stehen. Im Folgenden werden die verschiedenen Morphologieangabeklassen einzeln auf weitere zulässige Angabeklassen untersucht. In Substantivartikeln (z.B. wai) bestehen Morphologieangaben aus weiteren Teilangaben, die zu folgenden Angabeklassen gehören: > Artikelangabe (z.B. die G ArtA) > Deklinationsklassenangabe (z.B. -en E DekKA)
106 Deklinationsklassenangaben können auch um Frequenzangaben (z.B. Ε FreqA-Pl) erweitert werden. Deklinationsklassenangaben weisen weiterhin verschiedene verdichtete Teilangaben auf, die zu den folgenden Angabeklassen gehören: > Singularbildungsangabe (z.B. jABj E SgbA) > Pluralbildungsangabe (z.B. -en G PlbA) > Singularetantumangabe (SgtA) > Pluraletantumangabe (PltA)
Da feminine Substantive keine Endung im Genitiv Singular aufweisen, d.h. die Wortform über das ganze Paradigma unverändert bleibt, wird zu femininen Substantiven eine Singularbildungsangabe als Nullangabe, die durch ein Angabeblank realisiert wird (jABj Ε SgbA), angesetzt.4 Unter den obigen Angaben muss man immer relativ zum Lemmazeichen bestimmte auswählen, sie sind jedoch voneinander abhängig. Die Wahl oder Nicht-Wahl einer Angabe determiniert die Wahl der anderen möglichen Angaben. In Verbartikeln (z.B. wa2) sind Morphologieangaben zugleich Angaben, die zur folgenden Angabeklasse gehören: > Konjugationsklassenangabe (z.B. reinigte, hat gereinigt € KonjKA)
Konjugationsklassenangaben sind immer obligatorisch und voll ausgeschrieben, unabhängig davon, ob das Verb regelmäßig oder unregelmäßig konjugiert wird. Sie bestehen aus zwei Teilangaben, die zu den folgenden Angabeklassen gehören: > Präteritumbildungsangabe (z.B. reinigte € PräbA) > Perfektbildungsangabe (z.B. hat gereinigt G PbA)
In Adjektivartikeln (z.B. waa) bestehen Morphologieangaben aus weiteren Teilangaben, die zu den folgenden Angabeklassen gehören: > Graduierungsangabe (GradA)
> Wortklassenangabe (z.B. Adj/Adv e WKA) Graduierungsangaben werden nur dann gegeben, wenn das Adjektiv unregelmäßig graduiert wird. Daraus folgt, dass bei regelmäßiger Graduierung eine Angabe der regelmäßigen Graduierung als Nullangabe, die durch ein Angabeblank realisiert wird (jABj Ε A.regG), anzusetzen ist. Wortklassenangaben Adjektiv und/oder Adverb sind immer obligatorisch, um damit kenntlich zu machen, dass unter Adjektivlemmata in vielen Fällen auch Adjektivadverbien mitbehandelt werden. Graduierungsangaben bestehen aus zwei Angaben, die zu den folgenden Angabeklassen gehören: > Komparativangabe (KomparA) > Superlativangabe (SupA)
4
Für solche und ähnliche Fälle wird im Metatext festgelegt, dass beim Fehlen einer bestimmten Angabe eine entsprechende Nullangabe anzusetzen ist.
107 Wenn das Adjektiv nicht deklinierbar ist, steht nur eine Angabe zur Undeklinierbarkeit (AUndekl) im Formkommentar. Auf der gleichen Hierarchieebene wie Morphologieangaben stehen verschiedene Arten von Konstruktionsangaben. Bei substantivischen und adjektivischen Lemmazeichen sind Konstruktionsangaben optional und sie gehören zur Angabeklasse: > Konstruktionsangabe mit Präposition (z.B. aus wa1: (gegen jemanden/etwas^) G KonstAPräp) Bei verbalen Lemmazeichen gibt es zwei Arten von Konstruktionsangaben. Der erste Typ ist obligatorisch, der zweite optional. Sie gehören zu den folgenden Angabeklassen: > Aktantenklassenangabe (z.B. etwas* reinigen G AktKA) > Angabe zum syntaktischen Muster (z.B. etwas" wird gereinigt; etwas14 reinigen lassen Ε A-syntM) Aktantenklassenangaben stehen nur bei monosemen Lemmazeichen direkt im Formkommentar. Bei polysemen Lemmazeichen sind sie Teil des semantischen Subkommentars. Der kundige Benutzer kann anhand Aktantenklassenangaben auf die Valenz der Verben schließen, die zur Formulierung syntaktisch korrekter Sätze erforderlich ist. Nun ist es möglich - vor dem Hintergrund der für die Wörterbuchkonzeption relevanten Angabeklassen - im Formkommentar eines bestimmten Wörterbuchartikels die verschiedenen konkreten Angaben genau zu bestimmen. Es werden zu jedem Lemmazeichentyp jeweils zwei Wörterbuchartikel abgebildet. Der erste Artikel hat immer einen einfacheren Formkommentar als der zweite, bereits bekannte Artikel. Aus diesem Grund wird die linke Kernstruktur, die zum Formkommentar des zweiten Wörterbuchartikels gehört, zusätzlich durch einen Strukturgraphen veranschaulicht. Als Erstes seien hier zwei Substantivartikel zu monosemen Lemmazeichen aufgeführt, um die dazugehörigen Formkommentare konkret analysieren zu können: wa* wa1: W o r | t e r | b u c h das -(e)s, +er DroShung die -en szotär (gegen jemanden/etwasA) (vkiSUBS erster/zweiter Band des W.s a vel/vmivel szembeni) fenyegetis, szötär elsö/mäsodik hütete || fenyegetözes W.-s-er und Lexika szötärak is SUBS Beschimpfungen und D.en szitlexikonok || W. der deutschen kokesfenyegetözesek Sprache a nemet nyelv szötära ADJ massive, schreckliche sülyos, ADJ deutsches/ungarisches/... nimetl szömyü * anonyme, offene ηένmagyar/... * einsprachiges, zweitelen, nyilt * leere üres sprachiges egynyelvu, ketnyehü 4 burkolt fenyegetis versteckte * englisch-deutsches angolDrohung nimet * elektronisches elektroVERB fernst nehmen komolyan veszi nikus * historisches törteneti || * l^wahr machen valöra vältja/ Grimmsche W+er/Grimms W-s-er bevältja * jn durch/mit D.en Grimm sz.ak ^einschüchtern f.ekkel megfiVERB megnez (vmit) α szotärban (etw) lemlit vkit im Wörterbuch ^nachschlagen 4 megfenyeget, (sulyosan) megfenyeget eine Drohung aussprechen < ^ausstoßen * megfenyegetik eine Drohung erhalten
108 Der Wörterbuchartikel wa4 zum Lemma Wörterbuch hat einen einfachen Formkommentar, der vor der ungarischen Äquivalentangabe szötär endet. Der Formkommentar weist eine um zwei Silbentrennungsangaben binnen- und um eine Wortakzent- und Vokalquantitätskennzeichnung für Kürze unten erweiterte Lemmazeichengestaltangabe auf, die zugleich eine Wortformangabe Nominativ Singular und eine Rechtschreibangabe ist. Die Morphologieangabe besteht aus einer Artikelangabe „das" und aus einer Deklinationsklassenangabe ,,-(e)s, -rer", die sich in die folgenden Angaben funktional-positional segmentieren lässt: in eine verdichtete Singularbildungsangabe ,,-(e)s" - anhand derer man zwei Genitivformen erschließen kann - und in eine verdichtete Pluralbildungsangabe „+er". Der bereits bekannte Wörterbuchartikel wa} zum Lemma Drohung weist mehr Angaben im Formkommentar auf. Die Lemmazeichengestaltangabe ist um eine Silbentrennungsangabe binnen- und um eine Wortakzent- und Vokalquantitätskennzeichnung für Länge unten erweitert. Sie ist zugleich eine Wortformangabe Nominativ Singular und auch eine Rechtschreibangabe. Die Morphologieangabe ist komplizierter als die im Artikel zu Wörterbuch. Sie weist eine Artikelangabe „die" und eine Deklinationsklassenangabe „iABji -en" auf. Die Deklinationsklassenangabe besteht aus einer Singularbildungsangabe als Nullangabe, die durch ein Angabeblank „iABj" realisiert wird, und aus einer verdichteten Pluralbildungsangabe „-en". Die Deklinationsklassenangabe ist weiterhin um eine Frequenzangabe zum Plural rechtserweitert. Im Formkommentar steht auch eine Konstruktionsangabe mit Präposition (gegen jemanden/etwasA), anhand derer der kundige Benutzer erschließen kann, dass das Substantiv mit der Präposition gegen, sowohl mit Personen als auch mit (abstrakten) Objekten im Akkusativ verwendbar ist. Der folgende Strukturgraph zeigt die linke Kernstruktur der abstrakten und dazu isomorphen konkreten Mikrostruktur von wai:
WA
LZG[l-STrA]AlWAk | VQK..L | WFA.NSg | RA AkSAlWAk I VQK.L
Dro
STrA
SA
hüng
ArtA
die
KonstAPräp'
MorA.S
^DdcK^Fr«!^!]^ SgbA
v.PlbA
[iABj]
-el
FreqA-Pl (gegen jemanden/etwas*)
Abb. 9: Strukturgraph zur linken Kernstruktur der abstrakten und dazu isomorphen konkreten hierarchischen Mikrostruktur von wa 1; Abkürzungen: WA = Wörterbuchartikel, FK - Formkommentar, SK = Semantischer Kommentar, LZG[ 1-STrA]A-LWAk | VQK.L | WFANSg | RA = um eine Silbentrennungsangabe binnen- und um eine Wortakzent- und Vokalquantitätskennzeichnung für Länge unten erweiterte Lemmazeichengestaltangabe, die gleichzeitig eine Wortformangabe Nominativ Singular und eine Rechtschreibangabe ist, AkSALWAk | VQK.L = um eine Wortakzent- und Vokalquantitätskennzeichnung für Länge unten erweiterte Akzentsilbenangabe, STrA = Silbentrennungsangabe, SA = Silbenangabe, MorAS = Morphologieangabe bei Substantiven, ArtA = Artikelangabe, Dek-
109 KA[FreqA-Pl] = um eine Frequenzangabe zum Plural rechtserweiterte Deklinationsklassenangabe, SgbA = Singularbildungsangabe, v.PlbA = verdichtete Pluralbildungsangabe, FreqA-Pl = Frequenzangabe zum Plural, KonstAJPräp = Konstruktionsangabe mit Präposition Die nächsten Verbartikel verdeutlichen, wie der Lemmazeichentyp Verb im geplanten Wörterbuch bearbeitet wird. Bei Verblemmata wird die Gliederung des Artikels nicht ausschließlich anhand semantischer Gesichtspunkte entschieden, wie bei Substantiven oder Adjektiven, vielmehr spielt die Valenz der Verben eine wichtige Rolle bei der Gliederung des semantischen Kommentars. Mit den verschiedenen strukturellen Eigenschaften gehen jedoch meistens auch semantische Unterschiede einher, wobei auch bei gleichbleibendem Valenzmuster - abhängig von den semantischen Eigenschaften der Valenzrealisierungen die Bedeutungen unterschiedlich sein können (siehe wa5). Da für die meisten Verblemmata mindestens zwei oder mehr Bedeutungen und damit meistens unterschiedliche Valenzmuster angesetzt werden können, scheint es angebracht zu sein, einen Artikel zu einem polysemen Lemmazeichen neben dem bereits bekannten Verbartikel reinigen anzuführen: wa5: verjmjslsen vermisste, hat vermisst Ο jemanden/etwasA vermissen hiänyzik vfänek vki/vmi, hidnyol vkit/vmit s Konzept koncepciö * e Sorgfalt alapossäg * s Engagement elkötelezettsig * e Aggressivität, e Konzentration, e Entschlossenheit agresszivitäs, koncenträciö, eltökiltsig * e Durchschlagskraft, r Kampfgeist, r Siegeswille ätütöerö, hard szellem, gyozni akards ADV sehr nagyon * Φ schmerzlich fäjdalmasan, fdjön * ^gänzlich ~ borzasztoan Ο jemanden/etwasA vermissen nem taläl vkit/vmit, jemand/etwas** wird vermisst vki/ vmi eltunt Menschen emberek * Personen szemifyek * e Schülerin didk(ldny)
wa* reijnilgen reinigte, hat gereiA · · etwas reinigen; Angabe äquivalenter Aktanten (z.B. aus wa2:5 Wasser νίζ E AäAkt)
Angaben äquivalenter Aktanten bestehen weiterhin aus Angaben, die zu den folgenden Angabeklassen gehören: > Aktantenangabe (z.B. aus wa2: s Wasser E AktA) > übersetzte Aktantenangabe (z.B. aus wa2: νίζ Ε ü.AktA)
Nichtelementare Angaben der Kotexte mit Adverb können in zwei weitere Angaben segmentiert werden, die zu den folgenden Angabeklassen gehören: > Angabe äquivalenter Kotextpartner (z.B. aus wa2: regelmäßig rendszeresen E AäKop) > Angabe äquivalenter interlingualer Kollokationen (AäKol.inter)
Angaben äquivalenter Kotextpartner können in jeweils zwei elementare Angaben - abhängig vom Status des Kotextpartners - zerlegt werden, die zu den folgenden Angabeklassen gehören: > Kotextpartnerangabe (z.B. aus wa2: regelmäßig E KopA) > übersetzte Kotexpartnerangabe (z.B. aus wa2: rendszeresen Ε ü.KopA) > Kotextpartnerangabe, gleichzeitig Verweisangabe (z.B. aus wa5: φ schmerzlich Ε KpA| VerwA) > übersetzte Kotextpartnerangabe (z.B. aus wa5: fäjdalmasan, fäjön Ε ü.KopA)
Angaben äquivalenter interlingualer Kollokationen bestehen aus elementaren Angaben, die bereits bei den Substantivlemmata eingehend erörtert wurden und zu folgenden Angabeklassen gehören: > ungarische interlinguale Kollokationsangabe (ung.KolA.inter) > übersetzte interlinguale Kollokationsangabe (ü.KolAinter)
Der folgende Strukturgraph zeigt die rechte Kernstruktur der abstrakten und dazu isomorphen konkreten Mikrostruktur von wa2, wobei einige Konstituenten des Strukturgraphen der Übersichtlichkeit halber keine terminalen Knoten sind, d.h. sie könnten weiter funktional-positional segmentiert werden:
123
124
125 Bei Wörterbuchartikeln zu polysemen Lemmazeichen gibt es zwei verschiedene Arten von Mikrostrukturen: einfache integrierte Mikrostrukturen oder annexierte Mikrostrukturen. Anhand der folgenden zwei Wörterbuchartikel was und wag zu polysemen Lemmazeichen kann der Unterschied zwischen den beiden Mikrostrukturen gezeigt werden: wa5: wa8: verjmjsisen vermisste, hat d y i j t e n duftete, hat geduftet vermisst Ο etwasN duftet vmi illajemanden/etwasA vermissen hitoäk änyzik vkinek vki/vmi, hiänyol Blüten, Blumen virägok * Rovkit/vmit sen, Flieder rözsa, orgona s Konzept koncepciö * e Sorg* Mandeln mandula * s falt alapossäg * s Engagement Brot kenyir elkötelezettseg * e Ag© jemand/etwasN duftet nach etgressivität, e Konzentration, e was® vminek vmilyen ilEntschlossenheit agressüvitäs, lata van koncenträciö, eltökeltsig * Kaffee, Glühwein Μνέ, forralt e Durchschlagskraft, r bor »Waffeln, Lebkuchen, PlätzKampfgeist, r Siegeswille, ätüchen gofri, mäzeskaläcs, töerö, hard szellem, gyözni aaprösütemeny * Gewürze , karäs Zimt, Lavendel, füszerek, fahej, levendula * Parfüm parßm * ADV sehr nagyon * ^schmerzlich Bratwürste sültkolbäsz fäjdalmasan, fäjön * ^gänzlich ADV ~ borzasztöan ^verlockend csäbit6(an) * jemanden/etwasA vermissen nem ^köstlich felsiges(en) # ^herrtaläl vkit/vmit, je14 lich csodäs(an) * angenehm mand/etwas wird vermisst vkil kellemes(en) * stark erös(en) vmi eltunt 4) inycsilclandoz0(an) ^verführeMenschen emberek * Perrisch sonen szemilyek * e Schülerin diäk(läny)
Im ersten Wörterbuchartikel waj zu vermissen gibt es nur eine Angabe der Kotexte mit Adverb, und sie ist Teil der ersten semantischen Subkommentars. Der zweite semantische Subkommentar enthält keine solche Angabe. Im Artikel wag zu duften sind die adverbialen Kotextpartnerangaben für beide Bedeutungen des Wortes relevant, deshalb müsste die Angabe der Kotexte mit Adverb zweimal, sowohl im ersten als auch im zweiten semantischen Subkommentar aufgeführt werden. Da eine solche Integration zu einer unnötigen Wiederholung der Daten führen würde, wird dieser Teil der beiden Subkommentare in einem eigenständigen Subkommentar nach rechts ausgelagert. Dieser rechtsausgelagerte Subkommentar heißt auch Annex. Die Mikrostruktur ist in diesem Fall unterannexiert, weil es nur einen Annex gibt, obwohl der Wörterbuchartikel zwei semantische Subkommentare hat. Dieser Annex ist jedoch verdichtet, weil er sowohl zum ersten als auch zum zweiten semantischen Subkommentar gehört, wie es aus der skopussichernden Angabe der semantischen Zugehörigkeit ersichtlich ist. Durch die Auslagerung ist ein schnellerer Zugriff auf die Daten bezüglich der Kotextpartner gemäß der Strukturformel Verb + Adverb möglich.
126 Ein wesentlicher Unterschied besteht in der Form der Angabe äquivalenter interlingualer Kollokationen in den Annexen. Da das Adverb zu einem polysemen Basiswort verzeichnet wird, müssten immer alle ungarischen Äquivalente für das Basiswort mit aufgeführt werden, was zu einer sehr umständlichen Notation führen würde. Aus diesem Grund werden nur die interlingualen Kollokatoren und nicht die Kollokationen aufgeführt, wenn die ungarische Äquivalentangabe nicht für die ganze Kollokation steht. Beide Fälle sind in wa9 in der mikrostrukturellen Subsuchzone der interlingualen Kollokationen (4) zu beobachten: wa®: iijberjlejgen überlegte, hat Ο (etwas ) überlegen gondolkodik 0
(sicn etwasA) überlegen meggondol, megfontol vmit
ADV
gut < (sehr) genau jöl, (nagyon) alaposan * gründlich » sorgfältig alaposan * lange hosszasan, sokat * zweimal ketszer (is) $ alaposan / töviröl hegyire ^reiflich * komolyan ernsthaft * rövid ideig / egy kicsit kurz || meggondofja magät (sich) anders überlegen * merlegel(i) hin und her überlegen Die Angaben variieren dementsprechend in der Subsuchzone der interlingualen Kollokationen von wa9. Sie gehören zu den folgenden Angabeklassen: > ungarische interlinguale Kollokatorangabe (z.B. aus wa$: komolyan ε ung.KolrA.inter) > übersetzte interlinguale Kollokatorangabe (z.B. aus wa* ernsthaft E ü.KolrA.inter) > ungarische interlinguale Kollokationsangabe (z.B. aus wa* meggondofja magät e ung.KolA. inter) > übersetzte interlinguale Kollokationsangabe (z.B. aus wa* (sich) anders überlegen 6= ü.KolA. inter)
127 4.4.3 Der semantische Kommentar zu Adjektivlemmata In Wörterbuchartikeln zu Adjektivlemmata wird in den meisten Fällen außer der attributiven Verwendung auch eine mögliche adverbiale Verwendung des Wortes - in beiden Fällen mit Hilfe der Kotextpartnerangaben - demonstriert; der prädikative Gebrauch wird jedoch außer Acht gelassen. Auf der höchsten Hierarchieebene treten Angaben - wie bei Substantiv- und Verblemmata - aus den folgenden Angabeklassen auf: > Pragmatisch-semantische Angabe (PragsemA) > Angabe zu Kotexten (A-Ko) Teilangaben von pragmatisch-semantischen Angaben gehören zu den folgenden Angabeklassen: > Pragmatische Angabe (pragA) > Konstruktionsangabe mit Präposition (KonstAPräp) > Äquivalentangabe (ÄA) Pragmatische Angaben und Konstruktionsangaben mit Präposition stehen nur bei polysemen Lemmazeichen im semantischen Kommentar (genauer: Subkommentar), ansonsten müssen sie bei monosemen Lemmazeichen im Formkommentar verzeichnet sein. Äquivalentangaben entsprechen - grob gesprochen - den Bedeutungsangaben im einsprachigen Wörterbuch. Sie sind in der Regel Wortäquivalentangaben (z.B. aus wa& rözsaszinfu) Ε WÄA), die durch semantische Glossate oder durch übersetzte Konstruktionsangaben mit Präposition kommentiert werden können. Nichtelementare Angaben zu Kotexten enthalten bei Adjektivlemmata einen neuen Angabentyp. Ahnlich wie bei Verblemmata Angaben der Aktanten eine andere Art von Angaben neben Angaben der Kotexte darstellen, sind die entsprechenden Angaben bei Adjektivlemmata Angaben der Kotextpartner. Angaben zu Kotexten weisen dementsprechend weitere Angaben auf, die zu den folgenden Angabeklassen gehören: > Angabe der Kotextpartner (Α,Κορ) > Angabe der Kotexte (A.Ko) Angaben der Kotextpartner können verschieden sein, abhängig davon, in welcher Verwendung das Adjektiv zu dem jeweiligen Kotextpartner in Beziehung steht. Gemäß der attributiven Verwendung bei Substantiven und der adverbialen Verwendung bei Verben und Adjektiven können Angaben der Kotextpartner aus drei verschiedenen Angabeklassen auftreten: > Angabe substantivischer Kotextpartner (AKop.Subs) > Angabe verbaler Kotextpartner (AKop.Veib) > Angabe adjektivischer Kotextpartner (A.Kop.Adj) Bei Adjektivlemmata ist genauso wie bei Verblemmata nur eine Angabe der Kotexte gemäß der festgelegten Strukturformeln möglich, die zur folgenden Angabeklasse gehört: > Angabe der Kotexte mit Adverb (A.KoJVdv) Anhand der folgenden adjektivischen Wörterbuchartikel können alle obigen Angaben der Kotextpartner sowie Angaben der Kotexte mit Adverb, die eigene mikrostrukturelle Such-
128 zonen bilden, veranschaulicht werden. Für die weitere Beschreibung werden aus den Artikeln Angaben als Beispiele für weitere Angabeklassen herangezogen. wa3:
wa«:
hofjlich (zu jemandem) Adj/Adv udvarias (vkivel) +SUBS: r Mensch, r Mann ember, firfi * r Applaus, r Beifall taps, tetszisnyilvänitäs * τ Ton, e Umgangsform hang(nem), modor * r Brief, e Antwort levil, välasz * s Interesse irdeklddis * e Umschreibung körüliräs * e Geste gesztus +VERB: fragen, antworten kirdez, välaszol * bitten, s. bedanken kdr, megköszön * grüßen köszönt * s. entschuldigen bocsänatot kir +Ani: formulierter Brief) hangvetelu (levil) * ausgedrückt fogalmazva ADV kifejezetten/rendkivülien udvarias ^ausgesucht höflich
rojsa Adj / selten Adv r0zsaszin(ü) +SUBS: Blüten, Rosen virägok, rözsäk * e Farbe sztn * s Schweinchen malacka * r Tüll, e Seide füll, selyem * s Hemd, s Kleid ing, ruha * Flamingos flamingök * r Riese (Telekom) öriäs +VERB: braten süt ADV Φ zart lägy * ^leuchtend vilägitö
Der folgende Strukturgraph zeigt einen Ausschnitt der abstrakten rechten Kernstruktur zum semantischen Kommentar, der zum Lemmazeichen h ö f l i c h gehört und alle drei Angaben der Kotextpartner und außerdem eine Angabe der Kotexte mit Adverb aufweist:
Abb. 17: Strukturgraph zur rechten Kernstruktur der abstrakten hierarchischen Mikrostruktur von wa3, Abkürzungen: PragsemA = Ρragmatisch-semantische Angabe, A-Ko = Angabe zu Kotexten, A-Kop.Subs = Angabe substantivischer Kotextpartner, AKop.Veib = Angabe veibaler Kotextpartner, A.Kop.Adj = Angabe adjektivischer Kotextpartner, A.Ko.Adv = Angabe der Kotexte mit Adveib
129 Angaben der Kotextpartner weisen weitere nichtelementare Angaben auf, die zur folgenden Angabeklasse gehören: > Angabe äquivalenter Kotextpartner (z.B. aus wa3: e Geste gesztus Ε AäKop) Angaben äquivalenter Kotextpartner weisen die gleichen elementaren Angaben wie Angaben der Kotexte mit Adverb auf und gehören zu zwei verschiedenen Angabeklassen: > Kotextpartnerangabe (z.B. aus wa3: e Geste G KopA) > übersetzte Kotexpartnerangabe (z.B. aus wa3: gesztus εϋ.ΚορΑ) Der Unterschied ist, dass solche Kotextpartnerangaben auf keinen Fall gleichzeitig Verweisangaben und damit Kollokatoren sein können, weil die Kotexte mit der Strukturformel Adjektiv (Basis) + Adverb nicht übereinstimmen. Nichtelementare Angaben der Kotexte mit Adverb weisen Teilangaben auf, die aus den folgenden zwei Angabeklassen auftreten: > Angabe äquivalenter Kotextpartner (z.B. aus wa& ^zart Idgy G AäKop) > Angabe äquivalenter interlingualer Kollokationen (z.B. aus wa3: kifejezettenl rendktvülien udvarias ^ausgesucht höflich € AäKol.inter) Angaben äquivalenter Kotextpartner können, abhängig vom Status des Kotextpartners, in jeweils zwei elementare Angaben zerlegt werden die zu folgenden Angabeklassen gehören: > Kotextpartnerangabe (KopA) > Übersetzte Kotexpartnerangabe (tt.KopA) > Kotextpartnerangabe, gleichzeitig Verweisangabe (z.B. aus wa^ φ zart G KopA|VerwA) >fibersetzteKotextpartnerangabe (z.B. aus wa^ Idgy G ü.KopA) Angaben äquivalenter interlingualer Kollokationen bestehen aus elementaren Angaben, die bereits bei den Substantivlemmata eingehend erörtert wurden. Sie gehören zu folgenden zwei Angabeklassen: > ungarische interlinguale Kollokationsangabe (z.B. aus wa3: Iqfejezettenlrendkxvülien udvarias G ung.KolA. inter) > Übersetzte interlinguale Kollokationsangabe (z.B. aus wa3: ^ausgesucht höflich G ü.KolA. inter) Der folgende Strukturgraph zeigt die rechte Kernstruktur der abstrakten und dazu isomorphen konkreten Mikrostruktur von wa3, wobei einige Konstituenten des Strukturgraphen der Übersichtlichkeit halber keine terminalen Knoten sind, d.h. sie könnten weiter funktional-positional segmentiert werden:
130
131
132 Ähnlich wie bei Verbartikeln können auch bei Adjektivartikeln zu polysemen Lemmazeichen einfache annexierte Mikrostrukturen auftreten, wie bei dem Adjektivartikel waio zu grell: waio: g i f 1 1 Adj/Adv
Ο
(feny) vakitö, (tül) erös 5 Licht, s Sonnenlicht fitly, napfiny * e Sonne nap * Blitze villämok * s Scheinwerferlicht, r Scheinwerfer finysz6r6 * e Beleuchtung megvilägitäs * s Neonlicht, s Rampenlicht neonßny, rivaldafiny * s Gegenlicht ellenfiny +VERB: beleuchten megvilägit +ADJ: beleuchtet megvilägitott * ausgeleuchtet- - erleuchtet- kivil&gitott * leuchtend- vildgitö Ο (szin) rikito, ilink-, feltünö +SUBS:
+SUBS: e Farbe szin * s Orange/Rot/Gelb/Weiß/... narancs/piros/särga/fehir/... • e Farbigkeit, e Buntheit szinessig, tarkasäg * e Schminke smink * Kontraste, Bilder kontrasztok, kdpek +ADJ: gelb-/... särga/... * geschminkt kisminkelt * bemaltkifestett (hang) dies, äthatö +SUBS: r Ton, Töne hang(ok) * r Pfiff, Pfiffe fiitty(ök) * r Schrei, Schreie idältäs(ok) * e Stimme (beszed)hang
θ
ADV
allzu tulsägosan * ^schreiend ~ borzasztöan In Annexen treten auch Angaben äquivalenter Kotextpartner auf, die um eine Verweisbeziehungsangabe erweitert werden können, anhand derer der kundige Benutzer erschließen kann, dass bestimmte Kotextpartnerangaben vom Status her (intralinguale) Kollokatoren und somit die entsprechenden Kombinationen (intralinguale) Kollokationen sind. In Annexen können weiterhin neben interlingualen Kollokationsangaben auch Angaben stehen, die zu folgenden Angabeklassen gehören: > ungarische interlinguale Kollokatorangabe (ung.KolrA-inter) > übersetzte interlinguale Kollokatorangabe (ü.KolrAinter)
133 Beispiele für beide Typen von Angaben wurden bereits aus dem Verbartikel wa9 vorgestellt, deshalb kann die Analyse des semantischen Kommentars hiermit abgeschlossen werden.
4.5 Der Formkommentar und der semantische Kommentar zu verschiedenen Lemmazeichentypen im Kollokator-Wörterverzeichnis Das konzipierte syntagmatische Wörterbuch weist zwei Wörterverzeichnisse auf, deshalb ist es erforderlich - nachdem die Basis-Artikel eingehend untersucht worden sind - , sich mit den Eigenschaften der Kollokator-Artikel näher zu beschäftigen. In den Kollokator-Artikeln wird das ganze Kollokationspotenzial - gewonnen aus den COSMAS-Recherchen - präsentiert. Die Auflistung aller deutschen Kollokationen mit ihren ungarischen Äquivalenten, die denselben Kollokator enthalten und zu einem bestimmten Strukturtyp gehören, ermöglicht eine unmittelbare Kontrastierung der (intralingualen) Kollokationen beider Sprachen. Die verschiedenen Lemmazeichentypen des Kollokator-Wörterverzeichnisses resultieren aus den unterschiedlichen Strukturtypen, die den verschiedenen (strukturellen) Typen von Kollokationen zugrunde liegen. Außerdem spielen bei der Festlegung des Kollokatorbegriffs neben den strukturellen Eigenschaften auch die aus den COSMAS-Recherchen gewonnenen relativen Häufigkeiten - sowohl in Hinblick auf das Basiswort als auch auf die Kotextpartner - eine wichtige Rolle. Der für das KollokatorWörterverzeichnis etablierte Kollokatorbegriff entspricht dem im Kapitel 2.3.2.1, im Rahmen des intralingualen Kollokationsbegriffs erarbeiteten. Die Bereicherung des Kollokationsbegriffs durch den kontrastiven Aspekt, aus der der interlinguale Kollokationsbegriff resultiert, ist für die „Entstehung" des Kollokator- Wörterverzeichnisses nicht relevant.6 Ein wiederholter Blick auf die Strukturtypen für Kollokationen lässt erkennen, welche Wortarten für die Kollokatorlemmata (fett hervorgehoben) in Frage kommen. Weiterhin legen die Strukturtypen auch die Kotextklasse, zu der die im jeweiligen Kollokator-Artikel verzeichneten Basen gehören müssen, fest. [Substantiv + Substantiv Substantiv + Adjektiv Substantiv + Verb Veib + Adverb Adjektiv + Adverb
(S + S) - selten] (S + Adj) (S + V) (V + Adv) (Adj + Adv)
Die Lemmata des Kollokator-Wörterverzeichnisses sind in der Mehrzahl monoseme Wörter. Polyseme Wörter werden in den Wörterbuchartikeln nur auf eine Bedeutung eingeschränkt, nämlich auf diejenige, in welcher sie als Kollokator eines bestimmten Strukturtyps zu anderen Wörtern fungieren. Es geht in solchen Fällen um lexikalsemantische Einheiten und nicht um Wörter als Lemmata. Die Wortartenzugehörigkeit der Kollokatoren muss allerdings im Folgenden weiter spezifiziert werden. Im ersten Strukturtyp Substantiv + Adjektiv gehören die Kollokatoren zur Wortklasse Adjektiv. Sie werden attributiv zum jeweiligen Basis-Substantiv verwendet. Während bei den Adjektivlemmata des Basis-Wörterverzeichnisses sowohl Adjektiv als auch AdjektivZur „Entstehung" oder indirekten Selektion der Kollokator-Lemmata siehe Kapitel 6.2.
134 adverb in demselben Wörterbuchartikel behandelt werden, wird die Verwendung bei den Lemmata des Kollokator-Wörterverzeichnisses auf das eine oder das andere eingeschränkt. Wenn das Lemma in beiden Lesarten als Kollokator vorkommen kann, werden zwei separate Einträge angesetzt: ein Adjektivlemma und ein Adjektivadveib-Lemma. Der folgende Kollokator-Artikel ist ein Beispiel für den Lemmazeichentyp Adjektiv:
pajnisch Adj p-e Angst d p-er Schreckend p-e Reaktion[en]d p-e Furcht p-e Flucht
pänifilelem päni rimület pänikszerü reakciößj pänifilelem pänikszerü/fejvesztett menekülis
In den zwei letzten Strukturtypen Verb + Adverb und Adjektiv + Adverb werden die Kollokatoren Adverbien genannt, obwohl es hier oft um Adjektivadverbien handelt. Es seien hier jeweils zwei Kollokator-Artikel der beiden Strukturtypen als Beispiel aufgeführt:
ver|fühirejrisch Adv v. duftend v. klingend v. wirkend
inycsiklandozö illata van csäbitöan hangzik csäbitölag hat
v e r l o c k e n d Adv v. klingen φ v. erscheinend v. duftend
csäbitöan hangzik csäbitönak tmik/lätszik csäbitö illata van
wag* ausjgeisucht Adv a. höflich d a. schön d
kifejezetten/rendkivülien udvarias välogatottan szip
waig: leuchltend Adv 1. rotd 1. gelbd 1. blaud 1. orange 1. buntd 1. gründ 1. helld 1. farbigd 1. weißd 1. rosad
ilinkpirosl-vörös rüdtö särga/ilinksärga csillogö kek vilägito narancsszirm eldnktarka elenkzöld vakitöan vilägos Hinken szines vilägitöan fehir vilägito rozsaszin
135
Der zweite Strukturtyp Substantiv + Verb enthält ein Verb als Kollokator. Es muss jedoch nicht unbedingt ein Verb sein, sondern kann auch ein verbaler Ausdruck sein. Der zweite Kollokator-Artikel der folgenden Probeartikel (waK7) stellt einen solchen Fall dar: wa^: eln[ja!gen jagte ein, hat eingejagt jemandem etwasA einjagen jm Schreck[en]^ e. jm Ängste e.
megränit/megyeszt vkit megrimit vkit
wa
H2; e r n s t n e h j m e n nahm ernst, hat ernst genommen etwasA ernst nehmen js Sorgend e. n. komolyan vesd vkinek a gondjait js Ängste^ e. n. komolyan vesd vkinek a felelmeit eine Drohung^ e. n. komolyan vesz vmely fenyegetist eine Warnung e. n. komolyan vesz vmely figyelmeztetest
Nachdem einige Kollokator-Probeartikel, die zu verschiedenen Lemmazeichentypen gehören, aufgeführt worden sind, kann eine genauere Analyse der Wörterbuchartikel erfolgen. Für die Anordnung der Kollokator-Lemmata gilt - wie auch für die der Basis-Lemmata das alphabetische Prinzip.7 Die Mikroarchitektur der Artikel ist demgegenüber grundsätzlich anders, weil sie eine tabellarische Form aufweist. Bei der Analyse tabellarischer Wörterbuchartikel geht man aus der visuell wahrnehmbaren inneren Gliederung der zweidimensionalen textuellen Gestalt des Wörterbuchartikels aus. Erst danach wird die linguistisch basierte Zusammengehörigkeit der lexikographischen Daten in den Wörterbuchartikeln, die als abgegrenzte textuelle Suchbereiche aufgefasst werden, untersucht, (vgl. Wiegand 2000d, 219) Ein tabellarisches Wörterverzeichnis weist die Struktur einer Tabelle auf. Es besteht aus senkrecht verlaufenden Tabellenspalten (kurz: Spalten) und waagrecht verlaufenden Tabellenzeilen (kurz: Zeilen). Nach der Breite der Tabellenspalten unterscheidet man zwischen spaltenhomogenen und spaltenheterogenen Tabellen. In spaltenhomogenen Tabellen sind die Spalten gleich breit, in spaltenheterogenen unterschiedlich breit. Die Tabellenzeilen verlaufen von der linken bis zur rechten Tabellengrenze, sie können durch mehrere Spalten vertikal in spalteninterne Abschnitte, in so genannten Spaltenzeilen aufgeteilt werden. Die Tabellen- bzw. Spaltenzeilen können auch horizontal, durch Zeilentrennungsmarken in Form von waagrechten Strichen oder größeren Durchschüssen, voneinander getrennt und zugleich als zusammengehörig markiert werden. Auf diese Weise entstehen Teiltabellen als Wörterbuchartikel. Teiltabellen bestehen normalerweise aus Tabellenfeldern, im Falle eines Wörterbuchartikel aus Artikelfeldern, sie können aber selbst ein Tabellenfeld sein. Nach der Anzahl der Zeilen gibt es ein- oder mehrzellige Tabellenfelder. Wenn die Anzahl der Spaltenzeilen des Tabellenfeldes für die gesamte Tabelle festgelegt ist, liegt ein zeilenkonstantes Tabellenfeld vor, ansonsten ein zeileninkonstantes, (vgl. Wiegand 2000d, 223-224) Anhand der Wörterbuchartikel wa^ und wa^ wird im Folgenden die Struktur der tabellarischen Kollokator-Artikel beschrieben: 7
Zur Makrostruktur siehe Kapitel 6.
136 wara v e r j f u h | r e | r i s c h Adv v. duftend v. klingen^ v. wirkend waicft e i n ^ a l g e n jagte ein, hat eingejagt jemandem etwas A einjagen jm Schreck[en]^ e. jm A n g s t s e.
inycsiklandozö illata van csäbitöan hangzik csäbitölag hat
megrimit/megijeszt megrimit vkit
vkit
Alle Wörterbuchartikel weisen die gleiche tabellarische Form mit bestimmten Abweichungen auf. Die tabellarischen Wörterbuchartikel des Kollokator-Verzeichnisses bestehen aus zwei Artikelfeldern, die durch eine Zeilentrennungsmarke (durch einen waagrechten Strich) voneinander getrennt sind. Das obere Artikelfeld besteht aus e i n e r Tabellenspalte, das untere aus zwei gleichgroßen Spalten. Den beiden Artikelfeldern ist gemeinsam, dass sie zeileninkonstant sind: bei w a ^ hat das obere Artikelfeld 1 bzw. 3 Zeüen und bei w a ^ jeweils 2 Zeilen. Das obere Artikelfeld ist dementsprechend einspaltig und zeileninkonstant, das untere zweispaltig und ebenfalls zeileninkonstant. Die zwei Spalten des unteren Artikelfeldes werden durch einen vertikalen Zwischenraum in zwei gleichgroße Teilfelder geteilt. Bei waKe wird weiterhin ersichtlich, dass das obere Artikelfeld vertikalarchitektonisch ausgebaut ist, da auf die Lemmazeichengestaltangabe zusammen mit der Morphologieangabe und auf die Aktantenklassenangabe eine oberhalb-unterhalb-Relation definiert ist. Bei beiden Artikeln sind die unteren Artikelfelder ebenfalls vertikalarchitektonisch ausgebaut. Damit weisen die Kollokatorartikel eine spaltenheterogene und zeileninkonstante Tabellenform auf und dementsprechend vertikal und horizontal Variante Tabellenfelder, die auch vertikalarchitektonisch ausgebaut werden können. Die lexikographischen Daten werden auf die Spalten und damit auch auf die Tabellenfelder verteilt; erstere nennt man spaltenspezifische Daten, letztere feldspezifische Daten. Bei tabellarischen Wörterbuchartikeln wird durch das Tabellenprogramm, das sich auf alle spaltenspezifischen lexikographischen Daten bezieht [...], für jeden tabellarischen Wörterbuchartikel vorgängig festgelegt, welche Angaben aus einer Klasse von Angaben mit gleichem allgemeinen genuinen Zweck oder aus mehreren Klassen dieser Art in welcher Weise in einem Tabellenfeld, das im Falle von tabellarischen Wörterbuchartikeln Artikelfeld heißt, stehen dürfen. (Wiegand 2000d, 224) Wenn die spaltenspezifischen Daten zu wenigen bzw. zusammengehörigen Angabeklassen gehören, können die Artikelfelder nach der wichtigsten Angabenklasse bzw. nach der Angabeklasse auf der höchsten Hierarchieebene benannt werden. Tabellarische KollokatorArtikel bestehen auch aus zwei Kommentaren, aus einem Formkommentar und einem semantischen Kommentar, die auf zwei Artikelfeldern verteilt sind. Dem oberen Artikelfeld ist der Formkommentar, dem unteren Artikelfeld der semantische Kommentar zugewiesen. Aufgrund der verzeichneten Angaben im jeweiligen Artikelfeld kann das erste Zugriffsund Formfeld und das zweite (intralinguales) Kollokationsfeld genannt werden.
137 Um die zwei Kommentare analysieren und die feldspezifischen Daten bestimmen zu können, seien hier vier Kollokator-Artikel zu drei verschiedenen Lemmazeichentypen (Adjektiv, Veib, Adverb) aufgeführt, die jeweils einem anderen Strukturtyp angehören: waicfc
pajnisch Adj p-e Angst φ p-er Schreckend p-e Reaktionen] φ p-e Furcht p-e Flucht
ράηί filelem päni rimület pänikszerü reakciöß] pänifilelem pcmikszerü/fejvesztett menekülis
wai» d u r c h j z y j c k e n durchzuckte, hat durchzuckt etwasN durchzuckt jemanden ein Gedanked d. jn egy gondolat ötlik fei vkiben ein Blitz d. jn villäm nyilall vkibe ein Schmerz 1 s d. jn fäjdalom nyilall vkibe ein Schreckend d. jn rimület nyilall vkibe wax*. hgrrjlich Adv h. findend h. duftend h. schmeckend
csoddsnak taldl(ja) csodäs illata van csodäs (ze van
wa
KÜ£ schreijend Adv s. buntd s. grelld
rikitöan tarka, szines ~ borzasztöan (1) vakitö, (2) rüdtö, (3) iles
Dem oberen Artikelfeld ist - wie aus den Artikeln ersichtlich - der Formkommentar zugewiesen. Adjektivlemmata und Adverblemmata (wie wam, waia und wajao) weisen einen einfachen Formkommentar auf, weil er nur wenige Angaben enthält. Zu (Uesen Angaben gehören Lemmazeichengestaltangaben (z.B. aus wa^: pajnisch Ε LZGA), die um eine bestimmte Anzahl von Silbentrennungsangaben binnen- und um eine Wortakzent- und Vokalquantitätskennzeichnung für Kürze/Länge unten erweitert sind. Zugleich sind sie Wortformangaben unflektierte Form und Rechtschreibangaben. Als obligatorische Teilangabe der Morphologieangabe sind Wortklassenangaben Adjektiv oder Adverb (z.B. aus waics: Adv Ε WKA) anzusehen. Da adjektivische oder adverbiale Kollokatoren im Normalfall kaum graduiert verwendet werden, ist eine Graduierungsangabe im Mikrostrukturenprogramm für den Formkommentar der Kollokator-Artikel nicht vorgesehen. In einzelnen Fällen kann jedoch eine Graduierungsangabe oder eine Angabe zur Undeklinierbarkeit im Formkommentar stehen.
138 Verblemmata (wie wa^) haben einen reichhaltigeren Formkommentar, in dem außer Lemmazeichengestaltangaben (z.B. aus wa^: durchjzujcken Ε LZGA) auch Konjugationsklassenangaben (durchzuckte, hat durchzuckt ε KonjKA) und Aktantenklassenangaben (etwas14 durchzuckt jemanden Ε AktKA) stehen. Weitere Teilangaben von Konjugationsklassenangaben sind: Präteritumbildungsangaben (z.B. aus wa^: durchzuckte Ε PräbA) und Perfektbildungsangaben (z.B. aus w a ^ hat durchzuckt Ε PbA). Die Angabeform der Angaben im Formkommentar stimmt mit der der Angaben in Basis-Artikeln überein, deshalb werde ich hier darauf nicht erneut eingehen. Dem unteren Artikelfeld ist der semantische Kommentar zugewiesen. Als Teilangaben des semantischen Kommentars werden nur Kollokationsangaben und keine Bedeutungsangaben in Form von Äquivalentangaben vorgesehen. Das Artikelfeld ist zweispaltig: die linke Spalte steht für die deutschen intralingualen Kollokationen, in der das ganze Kollokationspotenzial des Kollokators abgebildet wird. Die rechte Spalte enthält die zugehörigen ungarischen Äquivalente. Da die Übersetzung für den Kollokator oder für die Kollokation von Fall zu Fall variieren kann, reichen reine (intralinguale) Kollokatorangaben im semantischen Kommentar nicht aus. Die im Kollokator-Artikel verzeichneten Angaben sind also vollständige Angaben äquivalenter intralingualer Kollokationspaare (z.B. aus waK9: h. duftend csodäs illata van Ε A.äKolP.intra) und nicht nur Angaben äquivalenter Kotextpartner wie größtenteils in den Basis-Artikeln. Angaben äquivalenter intralingualer Kollokationspaare bestehen aus verdichteten intralingualen Kollokationsangaben (z.B. aus w a ^ h. duftend Ε v.KolA-intra) und aus Kollokationsäquivalentangaben (z.B. aus wa^ csodäs illata van Ε KoLÄA). Letztere Angaben sind aus dem bereits erwähnten Grund voll ausgeschrieben. Der Grad der Verdichtung der deutschen Kollokationsangaben ist vom Lemmazeichentyp abhängig. Allen ist jedoch gemeinsam, dass der Kollokator mit dem Anfangsbuchstaben abgekürzt wird. Deutsche Kollokationsangaben in Adverbartikeln (z.B. wa ra oder wamo) sind im Vergleich zu den anderen die unkompliziertesten und im kleinsten Grade verdichtet. Nach dem verdichteten Kollokator steht die jeweilige Basis der Kollokation eines bestimmten Strukturtyps: ein Verb (in wagg) oder ein Adjektiv (in waKio). wa^ h$rrjlich Adv h. findend h. duftend h. schmeckend waicjo: schreijend Adv s. bunt φ s. grelle
csodäsnak taläl(ja) csodäs illata van csodäs ize van
rikxtöan tarka, sztnes ~ borzasztöan (1) vakiki, (2) rikitö, (3) eles
Der zweite Beispielartikel wa^o zeigt jedoch wie polyseme (deutsche) Basis-Lemmazeichen, wie z.B.: grell, behandelt werden. Wenn sie in allen Bedeutungen als Basis der Kollokation fungieren können, müssen die Kollokationsäquivalentangaben alle Äquivalente für die Basis enthalten. Die Äquivalente werden dann durchnummeriert.
139 In Adjektivartikeln (z.B. wa&i) werden die Kollokatoren innerhalb der Kollokationsangaben nicht nur abgekürzt, sondern auch dekliniert, d.h. sie bekommen eine Endung, abhängig von der Basis: waj^ pajnisch Ad] p-e Angst φ p-er Schreckend p-e Reaktion[en]d p-e Furcht p-e Flucht
pänifilelem päni rämület pänikszerü reakeiöfi] pänifdlelem pänikszeru/fejvesztett menekülis
Falls die jeweilige Basis oft im Plural verwendet wird, wird entweder die Kollokation zusätzlich in Plural dargeboten oder die Basis durch eine eingeklammerte Pluralendung rechtserweitert, wie z.B. bei Reaktion[en] in waiu. An dieser Stelle muss noch auf den semantischen Kommentar der Verbartikel kurz eingegangen werden, weil er komplexer als der der anderen Artikeltypen ist. Die Syntax der Kollokationsangaben in waxe entspricht der Aktantenklassenangabe im Formkommentar. Im Falle des Wörterbuchartikels durchzucken werden mögliche Basen für den Aktanten „etwas14" eingesetzt. Daraus resultiert eine Reihe von Kollokationen mit demselben Konstruktionsmuster. In den einzelnen Kollokationsangaben werden jedoch nicht nur die Kollokatoren verdichtet, sondern auch die weiteren, nicht ausgefüllten Aktanten, in diesem Fall das Akkusativobjekt .jemanden": waRg; d u r c h j z y j c k e n durchzuckte, hat durchzuckt etwasN durchzuckt jemanden ein Gedanke^ d. jn egy gondolat ötlikfel vkiben ein Blitz d. jn villäm nyilall vkibe ein Schmerzt d. jn fäjdalom nyilall vkibe ein Schreckend d. jn remület nyilall vkibe Im obigen Kollokator-Artikel waicg sind die verzeichneten Basen zum Kollokator durchzukken Aktantenrealisierungen. Diese Praxis ist der Normalfall. Unterschiede können insoweit auftreten, als die Aktanten obligatorisch oder fakultativ sind. Ein Beispiel für den letzteren Fall stellt der nächste Kollokator-Artikel wajai dar: waicn: einjschüchjtern schüchterte ein, hat eingeschüchtert jemanden (durch etwasA/ mit etwas0) einschüchtern jn durch eine / mit einer Drohungd fenyegetisekkel megfilemlit vkit [durch Drohungen] e. jn mit einer Waffed e. löfegyverrel megfenyeget vkit jn mit einer Pistole e. pisztollyal megfenyeget vkit Einen eher selteneren Fall zeigt der nächste Verbartikel waiu2. Das Wort nachschlagen ist Kollokator zu seiner fakultativen Angabe irgendwo. Die Realisierungen für diese Angabe
140 sind keine Wörter, sondern Syntagmen, d.h. Präpositionalphrasen, die die jeweilige Basis enthalten: WaKI2:
nach|schla!geil schlug nach, hat nachgeschlagen (etwasA) (irgendwo) nachschlagen megniz (egy cimszöt) a lexikonban (ein Stichwort) im Lexikon^ n. megniz a Dudenban im Duden n. megniz (egy szämot) α telefonkönyvben (eine Nummer^) im Telefonbuch n. megniz (egy szöt) α szötärban (ein Worft·) im Wörterbuch^ n. in einem Handbuch n. megniz vmely kezikönyvben in einem Buch^ n. megniz vmely könyvben Eine wichtige Eigenschaft von Kollokationsangaben muss noch kurz erläutert werden. Deutsche verdichtete elementare Kollokationsangaben werden oft um eine Verweisbeziehungskennzeichnung erweitert. Der nichtikonische Hochpfeil, der unmittelbar auf bestimmte Basen innerhalb einer Kollokation folgt, ist eine Verweisbeziehungskennzeichnung, anhand derer der kundige Benutzer einen Verweis erschließen kann. Der Wörterbuchbenutzer erkennt daran, dass die innerhalb der Kollokation verzeichnete Basis Teil des BasisLemmabestandes ist. Wenn er eine erfolgreiche Nachschlagehandlung ausführt, kann er das ganze syntagmatische Potenzial des Basiswortes anhand des Basis-Artikels erarbeiten. Auf die gegenseitige Vernetzung der Daten mit Hilfe der Kollokatoren und bestimmter Basen werde ich noch im Kapitel 7 über die mediostrukturellen Komponenten des Wörterbuchs ausführlich eingehen.
5.
Weitere artikelinterne textuelle Strukturen anhand von Probeartikeln aus dem Basis-Wörterverzeichnis
Im vorigen Kapitel wurden die Mikrostrukturen, die durch Segmentation nach sprachtheoretischen Kategorien entstehen, am Beispiel der relevanten Angabeklassen eingehend analysiert. Aus der Benutzerperspektive ist jedoch eine zweite Art der Segmentationsstruktur für Wörterbuchartikel von größerer Bedeutung, weil sie durch den „visuell wahrnehmbaren inneren Aufbau der zweidimensionalen textuellen Gestalt von Wörterbuchartikeln" (Wiegand 2001, 50) bestimmbar ist. Erst danach spielen die sprachtheoretischen Kategorien bei der weiteren Segmentation eine Rolle. In diesem Sinne kann der Wörterbuchartikel als ein textueller Suchbereich, der aus verschiedenen Suchzonen und Subsuchzonen besteht, betrachtet werden. Dem Wörterbuchartikel kann dementsprechend eine Suchbereichsstruktur zugeordnet werden, die eine hierarchische Textkonstituentenstruktur ist. Die geordneten Mengen von Angaben werden durch Strukturanzeiger voneinander abgegrenzt, wodurch die Suchzonen, die unmittelbaren Textkonstituenten des Suchbereichs entstehen. Die Strukturanzeiger können zeilenungebunden (wie z.B. graue Unterlegung) oder zeilengebunden (wie Komma, Doppelstrich ...) sein. Weiterhin kann man zwischen typographischen und nichttypographischen Suchbereich-, Suchzonen- und Subsuchzonenanzeigern unterscheiden. Ein Suchbereich besteht also aus mehreren Suchzonen, die wiederum Subsuchzonen aufweisen können. Inhaltlich homogene Suchzonen werden in der Regel nach dem Inhalt benannt, inhaltlich inhomogene durchnummeriert. Sie bilden einen Textblock und haben meistens einen speziellen Suchzonenanzeiger, durch den sie gekennzeichnet werden, (vgl. Wiegand 2001,50-52) Die Suchbereichsstruktur berücksichtigt nur die Textblöcke, aber nicht ihre Lage zueinander. Diese Zusammenhänge können mit Hilfe von texttopologischen oder textarchitektonischen Relationen beschrieben werden. Innerhalb der architektonischen Relationen unterscheidet man zwischen vertikalen und horizontalen Relationen. Vertikale Relationen sind die oberhalb- und unterhalb-RchAomn, zu den horizontalen gehören die links- und rechtsRelationen. Abhängig davon, auf welche (mikro-, artikel- oder suchbereichsstrukturellen) Textkonstituenten die obigen Relationen definiert werden, gibt es drei verschiedene Textarchitekturen: • Mikroarchitektur • Artikel(konstituenten)architektur • Suchbereichsarchitektur
Wenn die strukturprägende Relation die vertikale Relation ist, dann liegt eine vertikale Textarchitektur vor, somit eine vertikalarchitektonisch ausgebaute Mikrostruktur. Da die Textblöcke nicht nur aus selbstständigen mikrostrukturellen Textkonstituenten, sondern oft auch aus einer Folge von ihnen bestehen, werden solche gemischte Architekturen hybride Textarchitekturen genannt. Die Darstellungsmittel der verschiedenen Architekturen sind Architekturbilder.
142 S.l
Konkrete Suchbereichsstrukturen sowie Suchbereichs- und Mikroarchitekturen zu verschiedenen Lemmazeichentypen
Die Darstellung von Suchbereichsstrukturen, -architekturen und Mikroarchitekturen kann mit einem Substantivartikel ansetzen. Der Wortartikel wai zum Lemma Drohung weist eine reichhaltige Mikrostruktur und deshalb viele verschiedene Suchzonen und Subsuchzonen auf, deshalb eignet er sich gut, die komplexe Suchbereichsstruktur, Suchbereichs- und Mikroarchitektur zu monosemen substantivischen Lemmazeichen vorzustellen: wai·. Drojhung die -en (gegen jemanden/etwasA) (vkivellvnüvel szembeni) fenyegetis, fenyegetözäs SUBS Beschimpfungen und D.en satkok 6s fenyegetözesek ADJ massive, schreckliche sülyos, szörnyü * anonyme, offene ηένtelen, nyilt * leere üres 4 burkolt fenyegetis versteckte Drohung VERB FERNST nehmen komolyan veszi * 1 s wahr machen valöra vältja/ bevältja * jn durch/mit D.en ^einschüchtern f.ekkel megfilemlit vkit 4 megfenyeget, (sülyosan) megfenyeget eine Drohung aussprechen < "tausstoßen * megfenyegetik eine Drohung erhalten Der ganze Wörterbuchartikel als Suchbereich weist vier Suchzonen (Z) auf: 1. 2. 3. 4.
Formzone (FZ) Kotextzone mit Substantiv (KoZ.Subs) Kotextzone mit Adjektiv (KoZ.Adj) Kotextzone mit Verb (KoZ.Verb)
Die erste Suchzone, die Formzone, die relativ zu den Kotextzonen benannt wurde, wird durch den typographischen Suchzonen-, gleichzeitig Suchbereichsanzeiger, nämlich durch den Fettdruck des Lemmas gekennzeichnet. Die Kotextzonen werden durch nichttypographische Strukturanzeiger, durch verdichtete Kotextidentifizierungsangaben (SUBS, ADJ, VERB) kenntlich gemacht. Die letzten zwei Suchzonen (Kotextzone mit Adjektiv bzw. Verb) bestehen aus zwei Subsuchzonen: 1. Subsuchzone der Kotextpartner (SZ.Kop) 2. Subsuchzone der interlingualen Kollokationen (SZ.Kol.inter)
143 Die zweite Subsuchzone wird jeweils durch einen nichttypographischen Strukturanzeiger (4) und zusätzlich durch einen typographischen Anzeiger fett-kursiv von der ersten Subsuchzone unterschieden. Die detaillierte Suchbereichsstruktur zum wai zeigt die nächste Darstellung:
Abb. 19: Allgemeines Suchbereichsstrukturbild zu wa,, Abkürzungen: WA|SB = Wörterbuchartikel als Suchbereich, FZ = Formzone, KoZ.Subs = Kotextzone mit Substantiv, KoZ.Adj = Kotextzone mit Adjektiv, SZ.Kop = Subsuchzone der Kotextpartner, SZ.Kol.inter = Subsuchzone der interlingualen Kollokationen, KoZ.Verb = Kotextzone mit Verb Die dazugehörige Suchbereichsarchitektur sieht wie folgt aus:
WA|SB FZ
t KoZ.Subs KoZ.Adj SZ.Kop SZ.Kol.inter
Abb. 20: Allgemeines Suchbereichsarchitekturbild zu wa*, Darstellungskonventionen: χ tet soviel wie χ ist oberhalb von y undy ist unterhalb von χ
y bedeu-
144 Die folgende Darstellung zeigt das dazugehörige Mikroarchitekturbild: WA|SB FK SK
t
A.Ko.Subs
t A.Ko.Adj A.äKop A.äKol.inter
t A.Ko.Verb A.äKop A.äKol.inter
Abb. 21: Allgemeines Mikroarchitekturbild zu wa b Abkürzungen: FK = Formkommentar, SK = Semantischer Kommentar, A.Ko.Subs = Angabe der Kotexte mit Substantiv, A.Ko.Adj = Angabe der Kotexte mit Adjektiv, A.äKop = Angabe äquivalenter Kotextpartner, A.äKol.inter = Angabe äquivalenter interlingualer Kollokationen, A.Ko.Verb = Angabe der Kotexte mit Verb, Darstellungskonventionen: χ bedeutet soviel wie χ ist oberhalb von y und y ist unterhalb von χ
Der nächste Wörterbuchartikel ist ein Beispiel fllr Verbartikel. Da die meisten Verben polysem sind und zu polysemen verbalen Lemmazeichen oft eine einfache annexierte Mikrostruktur gehört, stellt der folgende Wörterbuchartikel wa8 zum Lemma duften diesen typischen Fall dar.
145
wag; d y f j t e n duftete, hat geduftet Ο etwasN duftet vmi illatoäk Blüten, Blumen virägok * Rosen, Flieder rozsa, orgona * Mandeln mandula * s Brot kenyir © jemand/etwas" duftet nach etwas0 vkmeklvminek vmilyen Hiatalszaga van Kaffee, Glühwein Μνέ, forralt bor »Waffeln, Lebkuchen, Plätzchen gofri, mizeskaläcs, aprösüteminy * Gewürze , Zimt, Lavendel, fltszerek, fahij, levendula * Parfüm parfim * Bratwürste sült kolbäsz ADV ^verlockend csdbit0(an) * ^köstlich felsigeren) * ^herrlich csodäs(an) * angenehm kellemes(en) * stark erös(en) 4 inycsikIandoz0(an) ^verführerisch Als Suchbereich weist der obige Wörterbuchartikel wag vier Suchzonen auf: 1. Formzone (FZ) 2. Bedeutungszone 1 (BZ1) 3. Bedeutungszone 2 (BZ2) 4. Kotextzone mit Adverb (KoZ Adv)
Der typographische Strukturanzeiger Fettdruck ist der Suchbereichs- und zugleich der erste Suchzonenanzeiger. Die Bedeutungszonen werden durch nichttypographische, ikonische Strukturanzeiger in Form von Nummern (O) gekennzeichnet. Die letzte Suchzone erkennt man an den nichttypographischen Strukturanzeigern „ADV" und „". Der erste Anzeiger ist eine verdichtete Kotextidentifizierungsangabe, der ohne den zweiten Strukturanzeiger ein Subsuchzonenanzeiger wäre. Anhand beider Strukturanzeiger kann der kundige Benutzer diesen Teil der Wörterbuchartikel als eine selbstständige Suchzone identifizieren. Die zwei Bedeutungszonen haben zwei Subsuchzonen: 1. Subsuchzone der Aktantenklasse (SZ.AktK) 2. Subsuchzone der Aktanten (SZAkt)
Die letzte Suchzone, die Kotextzone mit Adverb stellt den Annex innerhalb der Mikrostruktur des Wörterbuchartikels dar. Sie hat wiederum zwei Subsuchzonen: 1. Subsuchzone der Kotextpartner (SZ.Kop) 2. Subsuchzone der interlingualen Kollokatoren (SZ.Kolr.inter)
146 Die letztere Subsuchzone zeigt der nichttypographische Struktruanzeiger „