278 35 4MB
German Pages 267 [268] Year 2018
Wörterbuchstrukturen zwischen Theorie und Praxis
LEXICOGRAPHICA Series Maior
Supplementary Volumes to the International Annual for Lexicography Suppléments à la Revue Internationale de Lexicographie Supplementbände zum Internationalen Jahrbuch für Lexikographie Edited by Rufus Hjalmar Gouws, Ulrich Heid, Thomas Herbst, Oskar Reichmann, Stefan J. Schierholz and Wolfgang Schweickard
Volume 154
Wörterbuchstrukturen zwischen Theorie und Praxis Herausgegeben von Vida Jesenšek und Milka Enčeva
ISBN 978-3-11-059630-4 e-ISBN (PDF) 978-3-11-059865-0 e-ISBN (EPUB) 978-3-11-059432-4 ISSN 0175-9264 Library of Congress Control Number: 2018937505 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2018 Walter de Gruyter GmbH, Berlin/Boston Druck und Bindung: CPI books GmbH, Leck www.degruyter.com
Inhalt Vida Jesenšek, Milka Enčeva Wörterbuchstrukturen zwischen Theorie und Praxis. Einführung
1
Herbert Ernst Wiegand† Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform in der akademischen Lehre. Eine Serie von Einblicken 11
Teil I: Theorie der Wörterbuchform und ihre empirische Anwendung in der einsprachigen Lexikographie des Deutschen Rufus H. Gouws Accessibility, access structures and access procedures
35
Milka Enčeva Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich Monika Bielińska Einige Überlegungen zu lexikographischen Kohärenzstrukturen
57
73
Diana Stantcheva Zur Darstellung von Phraseologismen im Duden Online im Vergleich zur Neuauflage Duden Das große Wörterbuch der deutschen Sprache (42012) 85
Teil II: Theorie der Wörterbuchform und ihr Einsatz in der zweisprachigen Lexikographie Peter Ďurčo Vom Nutzen der vergleichbaren Korpora bei der kontrastiven lexikographischen Erfassung von Mehrworteinheiten 107 Vida Jesenšek Wörterbuchstrukturen in der zweisprachigen Internetlexikographie Alenka Vrbinc Absence of dictionary equivalents: Problems and solutions
141
119
VI
Inhalt
Zita Hollós Datendistribution relativ zum Webdesign. Der erste Prototyp des E-KolleX
151
Tamás Kispál Print- und Onlinewörterbuchmikrostrukturen und Kollokationen aus der DaF-Lerner-Perspektive 173 Janusz Taborek Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern. Korpusbasierte Analyse – syntagmatische Muster – Äquivalenz 197 Marjeta Vrbinc The structure of label strings in a phraseological dictionary
215
Teil III: Wörterbuchstrukturen in der einsprachigen Lexikographie der slowenischen Standardsprache Marko Snoj Etymologie und Wörterbücher
227
Nataša Jakop The role and position of phraseological units in the General monolingual dictionary of Slovene: Macro- and microstructural aspects 237 Simona Štavbar Wie lässt sich die lexikographische Terminologie darstellen?
247
Vida Jesenšek, Milka Enčeva
Wörterbuchstrukturen zwischen Theorie und Praxis. Einführung 1 Vorbemerkung Den Beiträgen zu theoretischen und praktischen Aspekten der Wörterbuchstrukturen in diesem Band ist der Bezug zur enormen und großen Respekt gebührenden metalexikographischen Forschung von Herbert Ernst Wiegand gemeinsam. Sie wurden am 9. internationalen Kolloquium zur Lexikographie und Wörterbuchforschung vorgetragen, das dem 80. Jubiläum von Prof. Dr. Dr. h. c. mult. Herbert Ernst Wiegand gewidmet war. Die Veranstaltung fand am 21. und 22. Oktober 2016 in Maribor statt und wurde zum dritten Mal von der Abteilung für Germanistik an der Philosophischen Fakultät der Universität Maribor organisiert. Kolloquien zur Lexikographie und Wörterbuchforschung in Südost- und Mitteleuropa werden seit 2000 traditionell alle zwei Jahre durchgeführt. Der Jubilar gilt zusammen mit dem bulgarischen Germanisten Pavel Petkov als Mitbegründer dieser Veranstaltungsreihe. Leider mussten wir uns von beiden Initiatoren des Kolloquiums verabschieden; Pavel Petkov verstarb 2011 und Herbert Ernst Wiegand verließ uns während der Vorbereitung dieser Publikation. Im Laufe der Jahre hat sich eine kleine internationale Gemeinschaft von Forscherinnen und Forschern herausgebildet, die regelmäßig zu den lexikographischen Kolloquien zusammenkam, vor allem, weil die Veranstaltung fachlich fördernd wirkte und menschlich zu manchen Freundschaften führte. Bisher wurden Kolloquien in Sofia (2000, 2002 und 2012), Varna (2004), Maribor (2006, 2010, 2016), Bratislava (2008) und Szeged (2014) abgehalten. Das Hauptziel bleibt unverändert: Austausch von Wissen und Förderung der Zusammenarbeit auf dem kulturell und gesellschaftlich bedeutenden Gebiet der theoretischen und praktischen Lexikographie. Herbert Ernst Wiegand, auch Ehrengast des Kolloquiums, ist für seine umfangreiche wissenschaftliche Leistung zur Theorie und Praxis der Lexikographie und Wörterbuchforschung in den letzten 40 Jahren bekannt. Er hat mit seinen über 20 000 Seiten umfassenden systematischen und empirisch fundierten wissenschaftlichen Veröffentlichungen hohe Standards gesetzt und sowohl in theoretischer als auch in terminologischer Hinsicht den Bereich der Wörterbuchforschung im deutschsprachigen Raum maßgeblich geprägt. Seine Theorie zur Wörterbuchform ist eine formal ausgearbeitete Theorie der Strukturen lexikographischer Texte und als Rahmenthema des Kolloquiums wurden in diesem Zusammenhang Wörterbuchstrukturen gewählt. Trotz der Vielfalt klassischer Wörterbücher und einer ständig steigenden Zahl digitahttps://doi.org/10.1515/9783110598650-001
2
Vida Jesenšek, Milka Enčeva
ler bzw. internetbasierter lexikographischer Produkte bleiben manche Aspekte der Wörterbuchstrukturen nach wie vor ungeklärt, was noch insbesondere an der Internetlexikographie sichtbar ist. Das Kolloquium widmete sich somit einer Thematik, die für die Entwicklung und Erstellung moderner lexikographischer Produkte weiterhin wichtig ist. Im vorliegenden Sammelband werden die Beiträge der aus sieben Ländern kommenden Teilnehmerinnen und Teilnehmer am Kolloquium veröffentlicht. Behandelt werden Aspekte der Wörterbuchstrukturen in ein- und mehrsprachigen Printwörterbüchern wie auch solche Aspekte in der Internetlexikographie. Die bestehende Theorie zu den Wörterbuchstrukturen wird kritisch anhand empirischer Daten überprüft und/oder ergänzt, das Letztere besonders im Hinblick auf die Internetlexikographie. Darüber hinaus wird in einigen Beiträgen auf methodisch-methodologische Aspekte der empirischen Sprachdatenermittlung in Relation zu den Wörterbuchstrukturen eingegangen.
2 Thematische Schwerpunkte Im einführenden Plenarvortrag am Kolloquium und ebenso einführenden Beitrag in diesem Sammelband steckt Herbert Ernst Wiegand (Heidelberg) den theoretischen Rahmen, der seine Theorie zur Lexikographie und Wörterbuchforschung darstellt, für die folgenden 14 Beiträge ab. Wie der Titel des Beitrags ankündigt (Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform in der akademischen Lehre. Eine Serie von Einblicken), gibt Wiegand Einblicke in grundlegende Begrifflichkeit, die in seiner Theorie der Wörterbuchform als zentral gelten und für die er annimmt, dass sie das absolute Minimum sind, das in der akademischen Lehre zu behandeln wäre. Die Einblicke sind so konzipiert, dass sie dem Leser Ausschnitte der Wörterbuchform nahebringen und auf die zugehörigen Theorieausschnitte sowie auf formbezogene metalexikographische Methoden unterschiedlicher Art hinweisen. Der erste Einblick betrifft die Konzeptualisierung von Wörterbüchern in der Theorie der Wörterbuchform. Es werden Wörterbuchgegenstandsbereich, Wörterbuchgegenstand und Wörterbuchform begrifflich festgelegt. Der zweite Einblick ist der Einblick in hierarchische Artikelmikrostrukturen. Es werden alle wichtigen Gründe genannt, warum die Form von Wörterbuchartikeln aller Typen mit Hilfe des modernen mathematischen Strukturbegriffs analysiert werden kann. Eine hierarchische Artikelmikrostruktur ist in der Lexikographieforschung einmalig und zentral, denn sie ist segmentierbar, sie ermöglicht die Strukturbildung bzw. Strukturdarstellung und sie regelt die Verteilung aller artikelinternen Textsegmente mit Angabefunktion. Der dritte Einblick betrifft Zugriffsstrukturen und Zugriffspfade, die Datenakzessivität also, die laut Wiegand so viel wie Zugriffsbereitschaft lexikographischer Daten heißt und die das Hauptanliegen der lexikographischen Tätigkeit darstellt: dass nämlich der Lexikograph seine
Wörterbuchstrukturen zwischen Theorie und Praxis. Einführung
3
Daten systematisch-strukturiert so präsentiert, dass der Wörterbuchbenutzer auf sie zugreifen kann. Die weiteren Beiträge im Sammelband werden auf drei Themenschwerpunkte verteilt: –– Theorie der Wörterbuchform und ihre empirische Anwendung in der einsprachigen Lexikographie des Deutschen –– Theorie der Wörterbuchform und ihr Einsatz in der zweisprachigen Lexikographie –– Wörterbuchstrukturen in der einsprachigen Lexikographie der slowenischen Standardsprache.
2.1 Theorie der Wörterbuchform und ihre empirische Anwendung in der einsprachigen Lexikographie des Deutschen (Teil I) Mit diesem thematischen Schwerpunkt setzen sich Rufus H. Gouws, Milka Enčeva, Monika Bielińska und Diana Stantcheva auseinander. Rufus H. Gouws (Stellenbosch), auch Plenarvortragender am Kolloquium, wendet sich in seinen Überlegungen lexikographischen Zugriffstrukturen zu. Zumal die moderne elektronische bzw. Internetlexikographie neue Ansätze für den Zugriff auf Daten in Wörterbüchern fordert, werden im Beitrag einige solcher Möglichkeiten betrachtet und es wird versucht, bestimmte Aspekte der betreffenden Metalexikographie entsprechend anzupassen. Der Autor geht von der bedeutenden Frage aus, nämlich, ob anhand der modernen Internetlexikographie auch neue theoretische Ansätze in der Lexikographieforschung notwendig sind oder ob eine einheitliche, Print- und Online-Wörterbücher deckende Theorie ausreichen würde. Im Beitrag wird das Letztere befürwortet, denn es müssten nicht alle Aspekte der bestehenden Theorie verändert werden, um neuen medientechnischen Gegebenheiten Rechnung tragen zu können. Ein solcher Ansatz erfordert jedoch eine Neubewertung von Wörterbuchstrukturen, einschließlich der Zugriffsstrukturen. Die Online-Lexikographie ermöglicht den Lexikographen, eine Vielzahl neuer Zugriffsmöglichkeiten einzuführen. Dies führte bisher nicht nur zu neuen Zugriffsstrukturen und -pfaden, sondern auch zu neuen Arten von Zugriffsdomänen, welche die Zugänglichkeit der Daten in Wörterbüchern unweigerlich positiv beeinflussen. Der Beitrag von Milka Enčeva (Maribor) stellt eine kritisch-analytische Auseinandersetzung mit Makrostrukturen in ausgewählten einsprachigen Print- und OnlineWörterbüchern der deutschen Sprache dar (Makrostrukturen von Print- und OnlineWörterbüchern. Ein Vergleich). Den Ausgangspunkt ihrer Überlegungen bildet die Feststellung, dass in Bezug auf die tradierte alphabetische makrostrukturelle Anordnung Konzepte zur Gestaltung von Online-Wörterbüchern neu überdacht werden sollten, um sicherzustellen, dass die Lexikographie mit den neusten Entwicklungen der Informations- und Kommunikationstechnologien Schritt halten kann. Basierend
4
Vida Jesenšek, Milka Enčeva
auf der Wiegand’schen Theorie der Wörterbuchform geht die Autorin der Frage nach, ob diese Theorie auch für die Beschreibung der Form von Wörterbüchern auf digitalen Darstellungsmedien geeignet ist. Anschließend werden Möglichkeiten gezeigt, die vorherrschende Abhängigkeit von der alphabetischen Anordnung der Makrostrukturen in Online-Wörterbüchern zu überwinden, um Beziehungen zwischen einzelnen Lemmata auf verschiedenen sprachlichen Ebenen besser und deutlich zum Ausdruck zu bringen. Als dafür gut geeignet wird vor allem eine modular aufgebaute Mikrostruktur der Wörterbuchartikel verstanden. Monika Bielińska (Katowice) befasst sich mit dem Problem der lexikographischen Kohärenz (Einige Überlegungen zu lexikographischen Kohärenzstrukturen). Eingangs legt sie fest, dass die Kohärenz zwar einer der wichtigsten Begriffe der Textlinguistik ist und dort eingehend, obgleich auch uneinheitlich und zum Teil kontradiktorisch behandelt wird, dass aber die Textlinguistik sich so gut wie nie mit Wörterbüchern befasst. Nach einem kurzen Überblick über Kohärenzauffassungen in der Textlinguistik und Wörterbuchforschung konzentriert sie sich auf wörterbuchspezifische Probleme der Kohärenzherstellung sowie auf die Frage, ob Kohärenzstrukturen wörterbuchartikelinterne Strukturen sind. Im Hinblick auf den gesamten Textverbund können laut Bielińska diverse Typen von Ordnungsstrukturen im Wörterbuch als kohärenzfördernd angesehen werden. Eine Hilfsfunktion erfüllten auch Metatexte, die dem Benutzer den Aufbau des Wörterbuches, des Artikels sowie die Funktionen der einzelnen Typen von Textsegmenten erklären, dadurch die Kohärenzherstellung erleichtern und demnach effektive Wörterbuchbenutzung unterstützen. Bildung von Kohärenzstrukturen ist somit untrennbar mit der Benutzung eines Wörterbuchs verbunden. Schließlich unterscheidet die Autorin einige Typen der Kohärenzstrukturen, welche die Grundlage für die weitere Erforschung der vielschichtigen lexikographischen Kohärenz bilden können. Diana Stantcheva (Blagoevgrad) untersucht die Darstellung von Phrasemen im den beiden letzten Ausgaben des Duden-Wörterbuchs (Zur Darstellung von Phraseologismen im Duden Online im Vergleich zur Neuauflage Duden Das grosse Wörterbuch der deutschen Sprache (42012)). Zwei digitale Wörterbücher werden mit den vorherigen Printwörterbuchauflagen hinsichtlich der lexikographischen Behandlung von Phraseologie verglichen. Es wird vor allem untersucht, inwiefern es Neuerungen gibt und inwiefern die neuen Wörterbücher Erkenntnisse der Phraseologieforschung widerspiegeln. Darüber hinaus wird der Frage nachgegangen, ob und wie das elektronische Medium dabei eine Rolle spielt. Die Schwerpunkte des Vergleichs liegen auf der makro- und mikrostrukturellen Zuordnung der phraseologischen Einheiten mit dazugehörigen lexikographischen Angaben im jeweiligen Wörterbuch, auf der im Wörterverzeichnis zur Kennzeichnung dieser sprachlichen Phänomene verwendeten Terminologie sowie auf der so genannten phraseologischen Nennform. In Bezug darauf wird der Umgang der untersuchten Wörterbücher mit Fragen der externen Valenz und der Bestimmung des eigentlichen Komponentenbestandes einer phraseologischen Einheit näher beleuchtet. Die Autorin kommt zum Schluss, dass sich alle
Wörterbuchstrukturen zwischen Theorie und Praxis. Einführung
5
beobachteten Duden-Wörterbücher in Sachen Phraseologie kaum voneinander unterscheiden, dass die bisher bekannten und oft diskutierten Problemstellen bestehen geblieben sind und Erkenntnisse der inzwischen recht umfangreichen Phraseologieforschung in der Regel nicht einbezogen wurden.
2.2 Theorie der Wörterbuchform und ihr Einsatz in der zweisprachigen Lexikographie (Teil II) In den Beiträgen von Peter Ďurčo, Vida Jesenšek, Alenka Vrbinc, Zita Hollós, Tamás Kispál, Janusz Taborek und Marjeta Vrbinc werden die empirische Sprachdatenermittlung sowie verschiedene Aspekte der Theorie der Wörterbuchform in der zweisprachigen Lexikographie mit Deutsch diskutiert. Computereinsatz eröffnet in der Lexikographie neue methodisch-methodologische Aspekte der empirischen Sprachdatenermittlung, auch in Bezug auf Erhebung und Untersuchung von sprachparallelen Strukturen und Phänomenen. Peter Ďurčo (Trnava) (Vom Nutzen der vergleichbaren Korpora bei der kontrastiven lexikographischen Erfassung von Mehrworteinheiten) thematisiert neue sprachtechnologische Werkzeuge und dadurch gewonnene Daten, die ein anderes Licht auf die traditionellen Fragen der (bilingualen) Lexikographie werfen. Er plädiert für die so genannten vergleichbaren Korpora und Analyseinstrumente, die im Unterschied zu älteren Parallelkorpora den Kriterien der Vergleichbarkeit im technischen und inhaltlichen Sinne viel mehr entsprechen. Vergleichbare Korpora sind Korpora mit gleichen Charakteristiken (mit gleichem Umfang, gleichen Domänen, bearbeitet in der gleichen Zeit, aufbereitet mit derselben Methodologie und mit sprachlich unabhängigen identischen Tools, mit kompatibler formaler Suchanfragesprache und kompatiblen formalen Grammatiken). Auf der Basis von Aranea Gigaword Web Korpora, einer Familie vergleichbarer Korpora, die für den Einsatz in der kontrastiven Sprachforschung, in der mehrsprachigen Lexikographie sowie für den Unterricht von Fremdsprachen und Übersetzungsstudien gedacht ist, werden Vor- und Nachteile derartiger Korpora im Gegensatz zu monolingualen und parallelen Korpora für die Analyse von Mehrworteinheiten diskutiert. Der Beitrag von Vida Jesenšek (Maribor) behandelt ausgewählte strukturelle Aspekte in der zweisprachigen Internetlexikographie (Wörterbuchstrukturen in der zweisprachigen Internetlexikographie). Im Vordergrund der Überlegungen steht das Verhältnis zwischen der Theorie der Wörterbuchform, der Potenziale des Mediums, d. h. der Internetumgebung und der lexikographischen Praxis renommierter Wörterbuchverlage. Die empirische Basis bildet eine exemplarische Analyse der Gesamtstruktur des zweisprachigen deutsch-slowenischen Online-Wörterbuchs des PONSVerlags (makro , mikro , mediostrukturelle Aspekte, Wörterbuchaußentexte), die theoretische Basis stellen metalexikographische Konzepte der Wörterbuchstrukturen in gedruckten und elektronischen Wörterbüchern dar. Hauptsächlich wird der Frage
6
Vida Jesenšek, Milka Enčeva
nachgegangen, auf welche Art und Weise sich unter Berücksichtigung von metalexikographischer Theorie, Wörterbuchfunktionen, Wörterbuchbenutzern und Möglichkeiten der Internetumgebung die gängige weniger optimale Gesamtstruktur zweisprachiger Online-Wörterbücher von PONS positiv ändern ließe. Das Thema des Beitrags von Alenka Vrbinc (Ljubljana) betrifft das wesentliche Problem der zweisprachigen Lexikographie, nämlich die Suche nach zielsprachiger Äquivalenz und die Entscheidungen über ihre optimale Präsentation im Wörterbuch (Absence of dictionary equivalents: Problems and solutions). Die Komplexität zwischensprachlicher Äquivalenzrelationen erschwert die lexikographische Arbeit an sich, insbesondere aber immer dann, wenn in der Zielsprache kein Äquivalent für ein ausgangssprachliches Lemma gefunden wird. Die Autorin überlegt Möglichkeiten, wie man fehlende Äquivalente in einem allgemeinen zweisprachigen Rezeptionswörterbuch kompensieren kann. Anhand eines solchen Wörterbuchs mit Englisch und Slowenisch illustriert sie konkrete lexikographische Lösungen, wenn vollständige Abwesenheit eines zielsprachigen Äquivalents vorliegt. U. a. sind das übersetzte Anwendungsbeispiele, die kontrastreiche Unterschiede zwischen zwei Sprachen zeigen und Differenzen zwischen dem im Wörterbuch angebotenen Wörterbuchäquivalent und der Übersetzung des Lemmas im Kontext veranschaulichen. Zita Hollós (Budapest) berichtet über die Entwicklung einer online Version ihres gedruckten Kollokationswörterbuchs KolleX (Datendistribution relativ zum Webdesign. Der erste Prototyp des E-KolleX). Mit dem Beitrag will sie in der Fachliteratur bereits diskutierte lexikographische Potenziale zukünftiger Online-Wörterbücher anhand des neu entwickelten Protoyps von E-KolleX nachweisen. Einblicke in bestimmte Strukturen von E-KolleX – wie z. B. in die Zugriffs- und Suchbereichsstruktur werden gegeben, die geplanten Module und die Datendistribution der neu konzipierten Datentypen werden beschrieben, das Design und die Funktionsweise werden detailliert und illustriert vorgestellt. Parallel mit der Präsentation des Protoyps von E-KolleX hinterfragt die Autorin lexikographische Potenziale von OnlineWörterbüchern, darunter die multimediale Aufbereitung lexikographischer Daten und die Verlinkung mit bestehenden externen Ressourcen. Die richtige Verwendung von Kollokationen gehört zur Wortschatzkompetenz bei Fremdsprachenlernern, so auch bei DaF-Lernern. Auch in neueren Ansätzen der gegenwärtigen Phraseologieforschung bilden Kollokationen einen Schwerpunkt, wobei in der Regel auch ihre stärkere Berücksichtigung in Wörterbüchern verlangt wird. Da die lexikographische Erfassung von Kollokationen in deutschen Wörterbüchern lange Zeit kaum wahrgenommen wurde und die vielen Kritikpunkte, die die Phraseologieerfassung in (deutschen) allgemeinen Wörterbüchern betreffen, auch für die Erfassung von Kollokationen gelten, stellt der Beitrag von Tamás Kispál (Göttingen) mit dem Titel Print- und Onlinewörterbuchmikrostrukturen und Kollokationen aus der DaF-Lerner-Perspektive willkommene Überlegungen zu dieser Problematik dar. Der Autor untersucht, inwieweit die Mikrostruktur ausgewählter einsprachiger Print- und Online-Wörterbücher des Deutschen den Anforderungen an die erfolgrei-
Wörterbuchstrukturen zwischen Theorie und Praxis. Einführung
7
che Wörterbuchbenutzung in Bezug auf die Kollokationen seitens der Lerner entsprechen kann. Ist die Artikelstruktur in den meisten untersuchten deutschen Printwörterbüchern aus der Sicht der kollokationslernenden Wörterbuchbenutzer weniger benutzerfreundlich, so können beide beobachteten Online-Wörterbücher (Elexiko, Duden Online) bei der kollokationsbezogenen Wörterbuchverwendung durch ihre Mikrostruktur wirksamere Nachschlagewerke darstellen. Für die weitere benutzerfreundlichere lexikographische Erfassung von Kollokationen sollte empirische Wörterbuchbenutzungsforschung bedeutende Ergebnisse hervorbringen. Schließlich hebt Kispál hervor, dass eventuelle Erfolgslosigkeit bei der Suche nach Kollokationen nicht nur an ihrer lexikographischen Erfassung, sondern auch am Fehlen der kollokationsbezogenen Nachschlagekompetenz liegt. In der Arbeit von Janusz Taborek (Poznan) wird ein lexikographisches Beschreibungsmodell für Funktionsverbgefüge (FVG) präsentiert (Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern. Korpusbasierte Analyse – syntagmatische Muster – Äquivalenz). Das Modell ist korpusbasiert, kontrastiv und lexikographisch orientiert, d. h. es sieht sowohl eine metalexikographische Kritik der bestehenden Wörterbücher als auch die Suche nach empirisch gesicherten Informationen zum Gebrauch des jeweiligen FVG voraus. Die Analyse verläuft jeweils in drei Schritten: Kookkurrenzanalyse des deutschen FVG in monolingualen Korpora, metalexikographische Analyse mit dem Ziel, das potenzielle anderssprachige Äquivalent aufzustellen sowie Kookkurrenzanalyse der lexikographischen Äquivalente. Die Kookkurrenzanalyse umfasst jeweils die Ermittlung der Kookkurrenzen, das Erstellen der syntagmatischen Muster, das Erstellen der Strukturformen (Patterns) und im Falle der Zielsprache auch das Ermitteln des passenden Funktionsverbs. Den Reichtum der aus Korpora gewonnenen lexikalisch-grammatischen, pragmatischen, stilistischen und domänenbezogenen Daten zu einzelnen FVG gewährleistet nach Meinung des Autors eine detaillierte und zuverlässige lexikographische Bearbeitung von FVG in zweisprachigen Wörterbüchern. Der Beitrag von Marjeta Vrbinc (Ljubljana) thematisiert Markierungen in phraseologischen Wörterbüchern, die Konnotationen betreffen (The structure of label strings in a phraseological dictionary). Da phraseologische Wortschatzeinheiten sich in der Regel mit vielfältigen konnotativen Inhalten auszeichnen, welche Einschränkungen bei der Verwendung zur Folge haben, ist die Thematik phraseographisch von besonderer Bedeutung. In vielen Fällen ist nämlich mehr als eine Markierung notwendig, um einen Ausdruck lexikographisch adäquat zu beschreiben. Ausgehend von der Hausmann’schen Klassifikation diasystematischer Markierungen und anhand der Praxis in Oxford Idioms Dictionary for Learners of English (OIDLE2) zielt der Beitrag darauf ab, die Mehrfachmarkierung im gewählten Wörterbuch zu untersuchen, um zu sehen, welche Markierungen oft in Kombination miteinander verwendet werden, ob ihre Klassenzugehörigkeit dabei eine Rolle spielt und wie der Benutzer mehrfache Markierung wahrnimmt. Anschließend werden Vor-
8
Vida Jesenšek, Milka Enčeva
schläge für Verbesserung der zukünftigen Markierungspraxis in phraseologischen Wörterbüchern gegeben.
2.3 Wörterbuchstrukturen in der einsprachigen Lexikographie der slowenischen Standardsprache (Teil III) Drei Beiträge zur gegenwärtigen lexikographischen Praxis und Forschung in Slowenien, dem Gastgeberland des Kolloquiums, runden den Sammelband ab. Marko Snoj und Nataša Jakop gehen auf die mikrostrukturelle Verortung und Präsentation einzelner Angaben in der zurzeit entstehenden 3. Auflage des allgemeinen einsprachigen Wörterbuchs der slowenischen Standardsprache (SSKJ) ein, während Simona Štavbar in ihren Ausführungen begründen will, warum eine systematische Ausarbeitung und lexikographische Aufbereitung der slowenischen lexikographischen Terminologie nötig ist. Der Etymologie, den etymologischen Wörterbüchern und etymologischen Angaben ist der Aufsatz von Marko Snoj (Ljubljana) gewidmet. Nach einführenden Gedanken zum Wesen der etymologischen Disziplin und Methoden wird eine kurze historische Übersicht über die lexikographische Behandlung und Präsentation etymologischer Erkenntnisse zu slawischen Sprachen und im slawischen Raum gegeben. Etymologische Wörterbücher, die er auflistet, sind in ihrer Grundbestimmung Produkte historisch bedingter wissenschaftlicher Arbeit, d. h., dass darin die zur jeweiligen Entstehungszeit bekannten etymologischen Erkenntnisse detailliert angeführt, interpretiert und argumentiert sind und dementsprechend, d. h. zeitbezogen auch betrachtet werden sollten. Dem Interesse an Erkenntnissen der etymologischen Disziplin bei sprachwissenschaftlichen Laien zufolge entstanden jedoch auch populärwissenschaftliche Konzeptionen etymologischer Wörterbücher; zugleich erfolgte eine verstärkte Einbeziehung etymologischer Sprachdaten in allgemeine einsprachige Wörterbücher. Beides gilt auch für den slowenischen Sprachraum bzw. für Wörterbücher mit Slowenisch. Hierzu präsentiert der Autor Prinzipien zur Einbeziehung etymologischer Daten in die zurzeit entstehende 3. Auflage des allgemeinen einsprachigen Wörterbuchs der slowenischen Standardsprache (SSKJ), zugänglich über das slowenische Wörterbuchportal Fran (www.fran.si). Auf dasselbe Wörterbuch bezogen ist auch der Beitrag von Nataša Jakop (Ljubljana). Sie bespricht die lexikographische Behandlung der Phraseologie und diskutiert dabei drei phraseographische Fragenkomplexe: Selektionsprinzipien, Definition der phraseologischen Wortschatzeinheit und ihre mikrostrukturelle Anordnung. Die Auswahl des phraseologischen Materials für das Wörterbuch ist korpusbasiert; bestimmend ist der nachgewiesene Gebrauch anhand der zwei großen Korpora der slowenischen Standardsprache (Gigafida und Kres). Dabei wird das Verständnis der Phraseologie im weiteren Sinn vertreten. Dies hat zur Folge, dass sowohl Phraseme mit Wortgruppenstatus als auch satzwertige phraseologische Einheiten, wie
Wörterbuchstrukturen zwischen Theorie und Praxis. Einführung
9
etwa Sprichwörter oder satzwertige kommunikative Routineformeln im Wörterbuch kodifiziert werden. Zudem wird zwischen den so genannten festen Wortverbindungen (stalna besedna zveza) und der so genannten Phraseologie (frazeologija) definitorisch sowie durch separate mikrostrukturelle Positionen unterschieden. Mit konkreten Beispielen werden im Beitrag Prinzipien der mikrostrukturellen Anordnung der Phraseologie ausführlich illustriert. Man bemüht sich bei diesem großen lexikographischen Vorhaben, die bisher eher mangelhafte lexikographische Behandlung der Phraseologie in slowenischen Wörterbüchern zu verbessern und bekannte neue theoretische phraseologisch-lexikographische Ansätze praktisch anzuwenden. Simona Štavbar (Maribor) präsentiert schließlich ein Konzept zur Erarbeitung, Systematisierung und lexikographischer Bearbeitung – etwa in Form eines elektronischen Wörterbuchs – der slowenischen lexikographischen Terminologie (Wie lässt sich die lexikographische Terminologie darstellen?). Es gibt mehrere und verschiedene Gründe, warum ein solches Vorhaben in Slowenien benötigt wird. Zum einen fehlen bisher lexikographische Produkte (Fachwörterbücher, Datenbanken, Glossare usw.), in denen die slowenische lexikographische Terminologie entsprechend gesammelt, beschrieben, kommentiert und folglich den interessierten Benutzern zugänglich wäre; es gibt auch keine Lehrwerke oder sonstige Lernmaterialien für Studierende zum genannten Themenbereich. Zum anderen herrscht eine gewisse terminologische Unordnung, zumal die aktuelle slowenische lexikographische Terminologie zahlreiche synonyme und kaum standardisierte Fachausdrücke nachweist und, etwa im Vergleich zum Deutschen, relativ viele terminologische Lücken festgestellt werden. Im Beitrag wird an einem mehrdimensionalen Modell des elektronischen Fachwörterbuchs seine Struktur, besonders die Mikrostruktur, vorgestellt. Am Beispiel eines Terminus (Wörterbuchartikel) wird gezeigt, wie man in einem elektronischen Fachwörterbuch unter Berücksichtigung der lexikographischen Funktionstheorie die lexikographische Terminologie benutzergerecht fachlexikographisch behandeln und darstellen könnte. Die Herausgeberinnen danken allen Beitragenden aus Slowenien, Deutschland, Polen, Ungarn, Bulgarien, Slowakei und Südafrika für die Teilnahme am Kolloquium und für die Mitwirkung bei der Vorbereitung dieses Sammelbandes. Dass sie unserer Einladung zum traditionellen Kolloquium gefolgt sind, bezeugt nicht nur das jeweils individuelle Interesse an der lexikographischen Theorie und Praxis; sie spricht genauso für die Hochschätzung des Ehrengastes Herbert Ernst Wiegand als Wissenschaftler, Lehrer, Mentor, Kollegen und Freund. Wir, Autorinnen und Autoren der Beiträge verdanken ihm viel und fühlen uns verbunden und verpflichtet, die theoretische Forschung und praktische Lexikographie, die uns zusammengebracht hat, weiter zu führen. Wir danken dem Rektorat der Universität Maribor und der Abteilung für Germanistik an der Philosophischen Fakultät Maribor für die finanzielle Unterstützung der Veranstaltung. Gedankt sei auch dem Verlag und den Herausgebern für die Aufnahme in die Reihe Lexicographica. Series Maior.
10
Vida Jesenšek, Milka Enčeva
Den Band widmen wir Herbert Ernst Wiegand, der als Mitbegründer und exzellenter Forscher das Kolloquium entscheidend geprägt hat und seiner Frau Cornelia Paulus Wiegand, die ihn in den letzten Jahren liebevoll unterstützt und begleitet hat.
Literatur Aranea = A Family of Comparable Gigaword Web Corpora. [Unter: ; letzter Zugriff 1. 2. 2017]. Duden Online = Duden Online-Wörterbuch. [Unter: ; letzter Zugriff 1. 2. 2017]. Duden-GWB4 = DUDEN Das große Wörterbuch der deutschen Sprache. 4., vollständig überarb. Aufl., 2012. E-KolleX = Online Kollokationslexikon: deutsch-ungarisch. [Unter: ; letzter Zugriff 1. 2. 2017]. Elexiko = Ein Online-Wörterbuch zur deutschen Gegenwartssprache. [Unter: ; letzter Zugriff 1. 2. 2017]. Fran = Fran portal, slovarji Inštituta za slovenski jezik Frana Ramovša ZRC SAZU. [Unter: ; letzter Zugriff 1. 2. 2017]. Gigafida = Korpus Gigafida. [Unter: ; letzter Zugriff 1. 2. 2017]. Kres = Korpus Kres. [Unter: ; letzter Zugriff 1. 2. 2017]. OIDLE2 = Oxford Idioms Dictionary for Learners of English. 2nd ed. 2006. PONS = Pons Online-Wörterbuch. [Unter: ; letzter Zugriff 1. 2. 2017]. SSKJ3 = Slovar slovenskega knjižnega jezika. 3. Aufl., 2016. [Unter: ; letzter Zugriff 1. 2. 2017].
Herbert Ernst Wiegand
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform in der akademischen Lehre. Eine Serie von Einblicken Oskar Reichmann zum 80sten Geburtstag gewidmet
1 Vorbemerkung Die Vorbemerkung besteht aus folgenden drei Statements: –– Erstens: Unter akademischer Lehre verstehe ich ein Haupt- oder Oberseminar zur Lexikographie oder eine Folge von Unterrichtsstunden im Rahmen des European Master in Lexicography. –– Zweitens: Wenn ich hier verkürzt von Wörterbüchern spreche, sind stets solche Printwörterbücher gemeint, die zur Sprachlexikographie gehören. –– Drittens: Es erwartet Sie eine kleine Serie von drei exemplarischen Einblicken. Sie sind so konzipiert, dass sie einen Blick auf Ausschnitte der Wörterbuchform ermöglichen sowie auf die zugehörigen Theorieausschnitte und weiterhin auf formbezogene metalexikographische Methoden unterschiedlicher Art. Ausdrücklich sei festgestellt: Die Serie von Einblicken ist weder eine Einführung in die Theorie der Wörterbuchform (wie z. B. Wiegand/Fuentes Móran 2009) noch eine solche in deren Didaktik. Die drei Einblicke sind so ausgewählt, dass nur einige der Essentials zur Sprache kommen, die in der Theorie der Wörterbuchform als zentral gelten; es sind die, von denen ich annehme, dass sie das absolute Minimum sind, das in der akademischen Lehre zu behandeln wäre, wenn auch dort in einer ausführlicheren und vertieften Weise als es hier möglich ist.
Herbert Ernst Wiegand (1936–2018) https://doi.org/10.1515/9783110598650-002
12
Herbert Ernst Wiegand
2 Erster Einblick: Zur Konzeptualisierung von Wörterbüchern in der Theorie der Wörterbuchform Fast alle Wörterbücher auf dieser Erde verdanken ihre Existenz dem anthropologischen Sachverhalt, dass niemand alle Sprachen kennt, dass niemand über das gesamte Wissen zu Sprachen verfügt und dass weiterhin sogar gilt: Niemand kennt alle lexikalischen Einheiten seiner Muttersprache sowie alle deren Eigenschaften. Wäre ich nicht Wissenschaftler, sondern irgendein religiöser Guru, dann würde ich behaupten: Wörterbücher verdanken ihre Existenz der babylonischen Sprachverwirrung! Ihre erstaunliche globale Verbreitung, die nur von der Bibel und dem Koran übertroffen wird, beruht wohl auf der historischen Erfahrung, dass es besonders in alphabetisierten Gesellschaften verschiedene Lebenssituationen gibt, in denen fehlendes sprachbezogenes Wissen möglichst schnell erworben sowie Sprachkenntnislücken möglich rasch geschlossen werden müssen. In Situationen der gestörten Textrezeption, in solchen der gestörten Textproduktion und damit auch bei Übersetzungsschwierigkeiten sind Wörterbücher Hilfsmittel. Sie lassen sich als eine besondere Form der textuellen Wissensrepräsentation verstehen und damit als statisches Informationssystem (vgl. z. B. Wiegand 2000, 2009). Sie sind Textträger, und zwar Träger von Texten verschiedener Textsorten, darunter kondensierte Wörterbuchartikel mit einem genuin lexikographischen Textformat; diese sind gemäß historisch-pragmatisch eingespielten Anordnungsgepflogenheiten so in einer bestimmten Weise zu einem Textverbund zusammengeordnet, dass jeweils fragliche sprachliche Daten, anhand derer sprachbezogenes Wissen erschlossen werden kann, im Wörterverzeichnis als dem zentralen Datenspeicher eines Wörterbuchs gezielt gesucht und möglichst schnell gefunden werden können. Zu jedem Wörterbuch gehören: –– ein Wörterbuchgegenstandsbereich –– ein Wörterbuchgegenstand und –– eine Wörterbuchform (Wiegand 1998: 301ff.). Der Wörterbuchgegenstandsbereich ist der sprachliche Bereich, aus dem diejenigen Ausdrücke stammen, die hinsichtlich bestimmter Eigenschaftsausprägungen in einem Wörterbuch lexikographisch bearbeitet sind. Wörterbuchgegenstandsbereiche sind z. B.: eine Sprache, mehrere Sprachen, eine Varietät, wie beispielsweise ein Dialekt oder eine Fachsprache, oder in der Textlexikographie z. B. ein bestimmtes literarisches Werk oder das Gesamtwerk eines Autors. Der Wörterbuchgegenstand ist eine Menge von Daten: Die Elemente dieser Menge sind die im Wörterbuch lexikographisch bearbeiteten Eigenschaftsausprägungen von einer oder von mehreren sprachlichen Eigenschaften bei einer bestimmten Anzahl von in den Wörterbuchartikeln genannten sprachlichen Ausdrücken aus dem Wörterbuchgegenstandsbereich. Das klingt ein wenig kompliziert; deswegen
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
13
dazu ein einfaches Beispiel: Man unterscheidet bekanntlich zwischen mono- und polyinformativen Wörterbüchern (Wiegand 1998: 301ff. u. 349ff.). Beispielsweise ein Aussprachewörterbuch mit dem Neuhochdeutschen als Wörterbuchgegenstandsbereich ist gerade deswegen ein monoinformatives Wörterbuch, weil in seinem Wörterverzeichnis gemäß seinem genuinen Zweck nur zu genau einer Eigenschaft systematisch lexikographische Daten angeboten werden, nämlich zur Aussprache. Die jeweilige mit einer artikelinternen Ausspracheangabe genannte Aussprache zu einer lexikalischen Einheit ist dann eine der spezifischen Eigenschaftsausprägungen der Eigenschaft „Aussprache“. Die Menge dieser Eigenschaftsausprägungen bildet den Wörterbuchgegenstand. Es handelt sich hierbei um eine Menge im mengentheoretischen Sinne, weil in jedem möglichen Fall eindeutig entscheidbar ist, was zur Menge, hier also zum Wörterbuchgegenstand, gehört oder nicht. bereich und was ein Wir wissen jetzt grob, was ein Wörterbuchgegenstands Wörterbuchgegenstand ist. Ich hoffe, dass nach der Lektüre dieses Beitrages auch deutlich ist, was die Wörterbuchform ist. Da alle weiteren Einblicke solche zur Wörterbuchform sind, mache ich an dieser Stelle zu dieser nur eine kurze Bemerkung: Ausschließlich Elemente der Wörterbuchform ermöglichen es, dass ein Wörterbuch in dem Sinne benutzbar ist, dass ein Benutzer-in-actu nach einer lexikalischen Einheit gezielt suchen und nach deren Auffinden nach mindestens einer ihrer Eigenschaften, z. B. einer ihrer Bedeutungen, gezielt weitersuchen kann. Jedes Wörterbuch weist daher – im Lichte der Theorie der Wörterbuchform – folgende drei Formelemente auf: (a) mindestens eine äußere Zugriffsstruktur, deren direkter oder indirekter Zugriffsbereich das Wörterverzeichnis ist, dessen Lemmata den externen Zugriff auf die akzessiven Einträge vom Typ des Wörterbuchartikels eröffnen (vgl. Wiegand 2008; Wiegand/Beer 2013), (b) hierarchische Ordnungsstrukturen unterschiedlicher Typen, die zu den Wörterbuchartikeln erhältlich sind (vgl. z. B. Wiegand/Smit 2013) und schließlich, (c) mindestens einen Metatext, der in deutschen Wörterbüchern z. B. Benutzungshinweise heißt (vgl. Bielińska 2010).
14
Herbert Ernst Wiegand
3 Zweiter Einblick: Hierarchische Artikelmikro strukturen: ein einfaches Analyse- und Darstellungsbeispiel wa1 Smoking, der; -s, -s meist schwarzes Herrenjackett mit seidenen Rockaufschlägen für festliche Anlässe: im S. erscheinen wa2 Sonate, die; -, -n Komposition mit meist drei od. vier Sätzen für ein od. mehrere Soloinstrumente: sie spielten eine S. für Violine und Klavier von Beethoven wa3 Granulat, das; -(e)s, -e durch Granulieren gekörnte Substanz: dieses Düngemittel kommt als G. in den Handel
Die drei kurzen Wörterbuchartikel wa1 bis wa3 aus dem Handwörterbuch der deutschen Gegenwartssprache (Kempcke 1984) sind standardisiert und kondensiert. Nach dem Artikeltypologiesystem der Theorie der Wörterbuchform, in der über 500 Artikeltypen unterschieden werden, gehören die drei Artikel zum Typ des nichtkomplexen basalen Wörterbuchartikels (vgl. Wiegand/Feinauer/Gouws 2013, Wiegand/ Gouws 2011, Wiegand 2003). Kondensierte Wörterbuchartikel sind instruktionsdeterminierte Artefakte und bestehen aus Segmenten unterschiedlicher semiotischer Systeme. Sie sind damit nichtnatürliche Texte, denn sie haben keine natürlichsprachliche Syntax. Vielmehr bestehen sie aus Zeichenketten, die auf Zeilen geschrieben sind und deren Segmente, wie z. B. erwähnte sprachliche Ausdrücke, Zahlen, phonetische Zeichen u. a. – regulär nach lexikographischen Instruktionen geordnet – aufeinander folgen. Dadurch ist auch eine genuin lexikographische „Ersatzsyntax“ gegeben, die Adressierung heißt, sowie ein genuin lexikographisches Textformat, das weder strikt formalsprachlich noch natürlichsprachlich ist (zur Adressierung vgl. Wiegand 2007a und Wiegand/Gouws 2013). Ein Wörterbuchartikel, verstanden als textuelles Artefakt, kann durch die Anwendung unterschiedlicher metalexikographischer Segmentationsmethoden systematisch in seine „Artefaktteile“ zerlegt werden. Bei diesen handelt es sich um Textsegmente unterschiedlicher Typen. Sie werden dann – gemäß ihren wechselseitigen Beziehungen – zu hierarchischen Strukturen unterschiedlicher Typen zusammen gesetzt. Damit sind alle wichtigen Gründe genannt, warum die Form von Wörterbuchartikeln aller Typen mit Hilfe des modernen mathematischen Strukturbegriffs analysiert werden kann. Entsprechendes gilt auch für die vollständige Wörterbuchform, wenn man sie als ein Geflecht von Strukturen unterschiedlichen Typs auffasst. In der Theorie der Wörterbuchform werden zwei Segmentationsstrategien für Wörterbuchartikel unterschieden. Die erste geht von der Gestaltwahrnehmung des Benutzers-in-actu aus und fasst Wörterbuchartikel als Suchbereiche auf. Die zweite
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
15
berücksichtigt in erster Linie sprachtheoretische Kategorien und erst in zweiter Linie die Textgestaltwahrnehmung (Wiegand 2000). Nur die zweite Strategie kann hier berücksichtigt werden. Wir analysieren jetzt die hierarchische Artikelmikrostruktur des Artikels wa3. Eine hierarchische Artikelmikrostruktur regelt die Distribution aller artikelinternen Textsegmente mit Angabefunktion. Ausdrücklich sei auf das Folgende hingewiesen: Es ist alles andere als selbstverständlich, dass man einem Wörterbuchartikel eine hierarchische Struktur zuordnet. Vor meinen frühen Arbeiten zur Wörterbuchform (vgl. u. a. Wiegand 1989, 1989a, 1989b) hat dies m. W. auch niemand unternommen; auch nicht die französischen Metalexikographen, die wohl die ersten waren, die sich wissenschaftlich mit der Wörterbuchform beschäftigt haben (vgl. vor allem Rey-Debove 1971).
3.1 Zum Segmentationsprozess Zunächst wird die konkrete hierarchische Artikelmikrostruktur von wa3 konstruiert. Konkret heißt hier: Die Segmentationsergebnisse, also die Segmente des Artikels, die keine nichttypographischen Mikrostrukturanzeiger sind, werden zu Elementen der Struktur. Von den sechs zur Verfügung stehenden Segmentationsmethoden wird MS1, die Methode der nichtexhaustiven funktional-positionalen Segmentation angewandt. Das Minimum des Vorwissens, das für eine korrekte Methodenanwendung benötigt wird, ist das fachliche Wissen, was genau eine Angabe ist, im Unterschied zu anderen Textsegmenten eines Wörterbuchartikels (vgl. Wiegand 2005). Bei der Anwendung von Segmentationsmethoden können spezifische Segmentationskonventionen (K) eingeführt werden; hiermit wird die Konvention K1 in Kraft gesetzt, die lautet: K1 = nichtelementare Angaben sind nicht zugelassen.
Zu jeder Anwendung einer der Segmentationsmethoden gehört mindestens eine Korrektheitsbedingung (KB). Hier lautet sie: KB1 = Das Segmentationsergebnis darf ausschließlich elementare Angaben aufweisen. Es hat folgende Form: Granulat | das | -(e)s | -e | durch Granulieren gekörnte Substanz | dieses Düngemittel kommt als G. in den Handel
Der Artikel besteht mithin aus sechs verschiedenen elementaren Angaben, die die Angabennamen a, b, c, d, e und f erhalten; sie sind durch einen senkrechten Strich, eine Segmentationsfugenmarkierung, voneinander getrennt. Elementare Angaben sind solche, die nicht weiter funktional-positional segmentierbar sind. Nichtelementare Angaben sind dagegen mindestens ein weiteres Mal funktional-positional segmentierbar. Weil im Strukturbildungsprozess mit Mengen gearbeitet wird, erhalten
16
Herbert Ernst Wiegand
die Angaben, um die extensionale Notation der Mengen zu verkürzen, Kleinbuchstaben als Individuennamen, wobei eine eineindeutige Namenrelation vorausgesetzt ist. Bevor kurz der Strukturbildungsprozess in verkürzter Weise erläutert wird, sei das Folgende besonders betont: In der Theorie der Wörterbuchform wird ausschließlich mit Formelementen gearbeitet, die durch die Anwendung einer der genau beschriebenen sechs verschiedenen Segmentationsmethoden erhältlich sind. Ad hoc erfundene Formelemente werden dadurch systematisch ausgeschlossen.
3.2 Zum Strukturbildungsprozess Im Folgenden wird verkürzt und deutlich vereinfacht der Strukturbildungsprozess charakterisiert. Er folgt auf den Segmentationsprozess. Jeder Strukturbildungsprozess durchläuft mindestens drei Schritte. Erster Schritt: Zunächst wird eine Trägermenge gebildet für die hierarchische Struktur, die konstruiert werden soll; sie heiße M(wa3) und ist elementenhomogen, weil nur eine Segmentationsmethode angewandt wurde. Sie kann wie folgt mit einer Mächtigkeit von |7| notiert werden: M(wa3) = {a, b, c, d, e, f. wa3}. Die Elemente der Trägermenge sind die konkreten Segmentationsergebnisse, also hier die sechs Angaben, sowie wa3 selbst. Dass wa3, der Wörterbuchartikel als Ganzes, ein Element der Trägermenge M(wa3) ist, ist erforderlich, weil sonst keine Teil-Ganzes-Relation auf der Trägermenge definiert werden kann; dies ist notwendig, wenn eine hierarchische Struktur konstruiert werden soll. Zweiter Schritt: Auf der Trägermenge wird eine binäre, irreflexive und transitive Relation vom Typ der Präzedenzrelation mit dem Relationsterm RT = x geht y voraus definiert. Dritter Schritt: Im dritten Schritt geschieht das Gleiche mit einer binären, reflexiven, antisymmetrischen und transitiven Relation vom Typ der partitiven Relation mit dem Relationsterm: RT = x ist ein Teil von y. Die Relationen sind Teilmengen des Kartesischen Produkts ihrer Trägermenge mit sich selbst, so dass folgende Aussagen gelten: Rp(wa3) ⊆ M(wa3) × M(wa3). Auch geschrieben: Rp(wa3) ⊆ wa3))². Rpart(wa3) ⊆ M(wa3) × M(wa3). Auch geschrieben: Rpart(wa3) ⊆ (M(wa3))². Weiterhin gilt: Rp(wa3) ⋂ Rpart(wa3) = ⌀; d. h.: Rp(wa3) und Rpart(wa3) sind disjunkte Relationen. Die Artikelmikrostruktur von wa3 ist damit eine Ordnungsstruktur.
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
17
Spätestens an dieser Stelle ist nun der kritische Punkt erreicht – so meine langjährige Erfahrung – an dem die meisten Studierenden und leider auch so mancher Kollege Verständnisprobleme haben, weil einfache mathematische und logische Sachverhalte kognitiv nicht zur Verfügung stehen. Das Minimum dessen was hier den Studierenden erklärt werden muss, bilden binäre Relationen und ihre Eigenschaften, das Kartesiche Produkt, und was es heißt, wenn eine Relation auf einer Menge definiert wird (vgl. z. B. einführend und gut verständlich Klabunde 1998, 12ff.).
3.3 Strukturdarstellungsprozess Der Strukturdarstellungsprozess folgt auf den Strukturbildungsprozess. Zur Theorie der Wörterbuchform gehören mehrere formale Strukturdarstellungsmethoden. Ihre Anwendung führt zwar zu relativ anschaulichen Strukturdarstellungen. Diese sind aber keine bloßen didaktischen Veranschaulichungen. Vielmehr gelten sie deswegen als formal, weil sie eindeutige Rückschlüsse auf die dargestellten formalen Strukturen zulassen. Beispiele für Strukturdarstellungsmethoden sind die Folgenden (vgl. Wiegand 2010: 290ff.): –– die Methode der Konstruktion allgemeiner Strukturbilder, wie z. B. Mikrostruktur-, Makrostruktur- und Zugriffsstrukturbilder in einfacher, erweiterter und expandierter Form –– die Methode der Konstruktion allgemeiner Zugriffspfadbildern –– die Methode der Konstruktion allgemeiner Architekturbilder, wie z. B. Angabearchitektur-, Artikelarchitektur- und Wörterverzeichnisarchitekturbilder –– die Methode der Konstruktion allgemeiner Adressierungskonstellationsbilder –– die Methode der Konstruktion von Artikelstrukturschemata –– die Pfeildiagrammmethode zur Darstellung von Adressierungsstrukturen und –– die Methode der Konstruktion von Baumgraphen für hierarchische Strukturen aller Typen. Die letztgenannte Methode wird nun zur Darstellung der konkreten hierarchischen reinen Artikelmikrostruktur von wa3 angewandt. Es empfiehlt sich, den Studierenden vor der Anwendung die mathematischen Eigenschaften von Baumgraphen zu erläutern (vgl. z. B. Klabunde 1998: 32ff.). Aufgrund der Geltung der Segmentationskonvention K1 verfügen wir bisher nur über die elementaren Angaben des Wörterbuchartikels wa3. Daher kann die hierarchische konkrete hierarchische (strukturell reduzierte) reine Artikelmikrostruktur zunächst nur als flache Struktur, wie in Abb. 1, dargestellt werden; sie weist mithin eine Baumhöhe mit dem Wert 1 auf.
18
Herbert Ernst Wiegand
Granulat, das; -(e)s, -e durch Granulieren gekörnte Substanz: dieses Düngemittel kommt als G. in den Handel (= wa3)
Granulat (= a)
das (= b)
-(e)s (= c)
-e (= d)
durch Granulieren gekörnte Substanz (= e)
dieses Düngemittel kommt als G. in den Handel (= f)
Abb. 1: Erster einfach kommentierter Strukturgraph: Konkrete hierarchische (strukturell reduzierte) reine Artikelmikrostruktur von wa3 als flache Struktur mit einem Baumhöhenwert 1 (als Folge der Inkraftsetzung der Segmentationskonvention K1).
Die einfache Kommentierung des Strukturgraphen besteht aus den sechs als Kleinbuchstaben realisierten Angabenamen sowie dem Artikelnamen in den runden Klammern. Dass die dargestellte Struktur strukturell reduziert ist, heißt: Die subvertikale Angabearchitektur der Lemmazeichengestaltangabe, die durch ein lexikographisches Subscript, nämlich den Unterstrich unter dem Angabeformsegment a, induziert wird, ist nicht berücksichtigt. Die Struktur in Abb. 1 ist zwar nicht falsch, aber sie ist trivial. Denn man erfährt wenig mehr als man intuitiv ohnehin wahrnimmt. Alle sechs Artikelteile werden gleichrangig behandelt; es wird nicht unterschieden, ob bestimmte Teile, inhaltlich und sprachtheoretisch betrachtet, näher zusammen gehören als andere Teile, so dass gegebenenfalls Teilganze angesetzt werden können. Im Rahmen der zweiten Segmentationsstrategie werden daher flache hierarchische Strukturen von Wörterbuchartikeln nur aus didaktischen Gründen konstruiert, um zu demonstrieren, worin die Vorteile tiefer hierarchischer Strukturen liegen. Im Folgenden wird die Segmentationskonvention K1 durch K2 ersetzt, die lautet: Nichtelementare Angaben sind zugelassen. Nach dem aufeinander folgenden regulären Durchlaufen des Segmentations-, des Strukturbildungs- und des Strukturdarstellungsprozesses ist der Strukturgraph in Abb. 2 erhältlich, der eine tiefe hierarchische Struktur darstellt. Im Folgenden kann ich nur andeuten, was es heißt, wenn man im Rahmen der zweiten Segmentationsstrategie sprachtheoretische Kategorien berücksichtigt (vgl. dazu ausführlich Wiegand 2009, 256 ff., Wiegand 2010, 254ff.). Sprachliche Zeichen, wie dass Lemmazeichen Granulat, haben eine Form und mindestens eine Bedeutung. Im Artikel wa3 werden mit dem Textsegment a lexiko graphische Aussagen zur Form von Granulat gemacht und unmittelbar anschließend mit dem Textsegment b solche zur Bedeutung. Aus diesem Grund wird die erste Segmentationsfuge zwischen a und b gelegt; a ist mithin eine nichtelementare Angabe zur Form von Granulat. Sie ist die erste unmittelbare Textkonstituente des gesamten Artikeltextes und gehört zur Klasse der Formkommentare. Die zweite unmittelbare Textkonstituente des Artikels gehört zur Klasse der semantischen Kommentare. Alle unmittelbaren Textkonstituenten eines Wörterbuchartikels, soweit sie keine nichttypographischen Mikrostrukturanzeiger sind, sind Kommentare. In der Theorie der
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
19
Wörterbuchform werden über 30 Kommentartypen unterschieden. Kommentare sind also Angaben in einer bestimmen strukturellen Position mit einer bestimmten genuinen Funktion. Ihre Einführung hat eine große ordnungsprägende Kraft, wie man z. B. an den verschiedenen Typen der allgemeinen Strukturbilder und der Artikelschemata erkennen kann (vgl. z. B. Wiegand 2010). Granulat, das; -(e)s, -e durch Granulieren gekörnte Substanz: dieses Düngemittel kommt als G. in den Handel (= wa3)
durch Granulieren gekörnte Substanz: dieses Düngemittel kommt als G. in den Handel (= b)
Granulat, das; -(e)s, -e (= a)
Granulat (= c)
das; -(e)s, -e (= d)
das (= g)
durch Granulieren gekörnte Substanz (= e)
dieses Düngemittel kommt als G. in den Handel (= f)
-(e)s, -e (= h)
-(e)s (= i)
-e (= j)
Abb. 2: Zweiter einfach kommentierter Strukturgraph: Konkrete hierarchische (strukturell reduzierte) reine Artikelmikrostruktur als tiefe Struktur mit einem Baumhöhenwert 4 als Folge der Inkraftsetzung der Segmentationskonvention K2.
An dieser Stelle breche ich aus Zeitgründen die Erläuterung dazu ab, wie die Segmentation von wa3 sprachtheoretisch zu begründen ist und möchte das Folgende feststellen: Wenn man Studierenden Strukturen von Wörterbuchartikeln erklären möchte, ist es zwar didaktisch zweckmäßig, wenn man mit Beispielen und konkreten Strukturen beginnt. Es ist aber nicht das Anliegen der Theorie der Wörterbuchform, dass mit ihrer Hilfe nur einzelne Wörterbuchartikel untersucht und konkrete Artikeltextstrukturen konstruiert werden können. Vielmehr geht es auf allen Analyseebenen und bei allen Formelementen vor allem um abstrakte Strukturen.
3.4 Zur Rolle von abstrakten Artikeltextstrukturen Der Terminus Artikeltextstruktur wird oberbegrifflich verwendet für die Strukturen aller Strukturtypen, die zu Wörterbuchartikeln gehören. Abstrakte Artikeltextstrukturen sind erhältlich, wenn man die Elemente einer konkreten Struktur ihren Klassen zuordnet, und zwar am Beispiel von wa3 wie folgt:
20
Herbert Ernst Wiegand
wa3 ∈ WA; (= Wörterbuchartikel) a ∈ FK; (= Formkommentar) b ∈ SK; (= semantischer Kommentar) c ∈ LZGA; (= Lemmmazeichengestaltangabe) d ∈ MorA.S; (= Morpholgieangabe bei Substantiven) e ∈ BPA; (= Bedeutungsparaphrasenangabe) f ∈ KBeiA; (= Kompetenzbeispielangabe) g ∈ ArtA; (= Artikelangabe) h ∈ DekKA; (= Deklinationsklassenangabe) i ∈ v.Sgb²A; (= verdichtete Singularbildungsangabe) j ∈ v.PlbA; (= verdichtete Pluralbildungsangabe). Mit den hier aufgeführten Klassensymbolen WA, FK, …, v.PlbA bildet man für die abstrakte (a) hierarchische Artikelmikrostruktur die Trägermenge Mᵃ(wa3), die eine Mächtigkeit von |11| hat. Auf Mᵃ(wa3) werden sodann die binären Relationen Rp(wa3) und Rpart(wa3) definiert; dieses Vorgehen entspricht dem bei der Bildung der konkreten Struktur. Nach der Ausführung der Definitionsoperationen ist der Strukturgraph in Abb. 3 erhältlich. Die Theorie der Wörterbuchform verfügt über 2500 Typen von elementaren Angaben und im jeweiligen Analyserahmen um die zugehörigen Angabeklassen. Ihre Aussagen über abstrakte Artikeltextstrukturen gelten für alle Sprachen mit einer Alphabetschrift im engeren Sinn, für die gilt: (1) Das zentrale Schriftzeicheninventar ist ein Alphabet. (2) Es wird auf Zeilen von links nach rechts und von oben nach unten geschrieben. (3) Die Schrift gehört zu einer Sprache, bei deren schriftlicher Realisierung die bedeutungsunterscheidenden Elemente in systematischen Beziehungen zu den bedeutungsunterscheidenden Elementen der gesprochenen Sprache stehen. Die Theorie der Wörterbuchform ist inzwischen anhand von Wörterbüchern zu 12 Sprachen erprobt. Wir betrachten nun die abstrakte Artikelmikrostruktur, die zum Artikel wa3 gehört. Zu einer abstrakten Artikelmikrostruktur, wie die in Abb. 3, können endlich viele konkrete Artikelmikrostrukturen in dem Sinne isomorph (also strukturgleich) sein, dass sie zu ein und demselben Isomorphietyp gehören. Zu einer abstrakten Struktur sind daher zahlreiche konkrete Strukturen verschiedener Wörterbuchartikel isomorph. Das gilt z. B. für die Wörterbuchartikel wa1, wa2 und wa3. Die Strukturaussagen, die anhand einer abstrakten Struktur gemacht werden, gelten daher für zahlreiche isomorphe konkrete Strukturen, wobei die zugehörigen Wörterbuchartikel keineswegs zu ein und demselben Wörterbuch gehören müssen. In dem Strukturgraphen in Abb. 3 sind die drei wichtigsten Teilstrukturen der Artikelmikrostruktur durch namentragende Umrandungszeichen gekennzeichnet, die die formalen Eigenschaften des Strukturgraphen nicht verändern. Beispielsweise
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
21
gehört die abstrakte linke Kernstruktur immer zu einem Formkommentar und die abstrakte rechte Kernstruktur immer zu einem semantischen Kommentar. Den über 30 Kommentartypen, die die Theorie der Wörterbuchform kennt, ist eine Struktur mit einem festen Namen zugeordnet. a. h. (strukturell reduzierte) reine artikelmikrostruktur a.h. basisstruktur/amis
a.h. linke kernstruktur/amis
WA
FK
SK
MorA.S
lzga ╨ wak|vqk.l| wfa.nsg|ra ArtA ─|G|WAr
BPA
a. h. rechte kernstruktur/amis
DekKA
v.Sgb2A
v.KBeiA
v.PlbA
Abb. 3: Dritter einfach kommentierter Strukturgraph: Abstrakte hierarchische (strukturell reduzierte) Artikelmikrostruktur; Abkürzungen als Klassensymbole: WA = Wörterbuchartikel; FK = Formkommentar; SK = semantischer Kommentar; LZGA Wak|VQk.L|WFA.NSg|RA = Lemmazeichengestaltangabe unten erweitert durch eine Wortakzentkennzeichnung, die zugleich eine Quantitätskennzeichnung zur Länge (des Vokals) ist und eine Wortformangabe für den Nominativ Singular sowie eine Rechtschreibangabe; MorA.S = Morphologieangabe bei Substantiven; ArtA⊢G|WAr = Artikelangabe, anhand derer das Genus erschließbar ist; DekKA = Deklinationsklassenangabe; v.Sgb²A = verdichtete Singularbildungsangabe, anhand derer zwei verschiedene Singularendungen erschließbar sind; v.PlbA = verdichtete Pluralbildungsangabe; BPA = Bedeutungsparaphrasenangabe, v.KBeiA = verdichtete Kompetenzbeispielangabe; Darstellungskonventionen: /AMIS ist zu lesen wie als Teilstruktur der Artikelmikrostruktur.
Weiterhin kann man den Strukturgraph für eine konkrete hierarchische Struktur auf den Strukturgraphen für eine isomorphe abstrakte Struktur ein und desselben Wörterbuchartikels so abbilden, dass der Strukturgraph in Abb. 4 entsteht. Von dem Strukturgraphen für die konkrete hierarchische Struktur sind in Abb. 4 nur die terminalen Konstituenten sichtbar; die nichtterminalen können anhand der abstrakten Struktur systematisch erschlossen werden. Die Schweifklammern markieren eine erweiterte Kommentierung des Strukturgraphen und bezeichnen die wichtigsten Positionen, in der präzedentiven Artikelmikrostruktur, die zu wa3 gehört. Bei
22
Herbert Ernst Wiegand
dieser handelt es sich um die lineare Struktur der terminalen Textkonstituenten mit Angabefunktion, die hier nicht behandelt wird. a. h. (strukturell reduzierte) reine artikelmikrostruktur a.h. basisstruktur/amis
a.h. linke kernstruktur/amis
WA
FK
SK
MorA.S
lzga ╨ wak|vqk.l| wfa.nsg|ra ArtA ─|G|WAr
Granulat
lemmaposition
das
BPA
a.h. rechte kernstruktur/amis
DekKA
v.Sgb2A
v.PlbA
-(e)s
-s
morphologieposition
v.KBeiA
durch Granulieren gekörnte Substanz prag.sem.position
dieses Düngemittel kommt als G. in den Handel kotextposition
Abb. 4: Vierter Erweitert kommentierter Strukturgraph: Abstrakte (und isomorphe konkrete) strukturell reduzierte reine Artikelmikrostruktur, die wa3 aufweist. Abkürzungen: wie in Abb. 3.
3.5 Hierarchische hybride Artikelmikrostrukturen vom Typ der architektonisch angereicherten Artikelmikrostruktur Im Folgenden wird die Aufhebung der strukturellen Reduzierung sowie der Übergang zur abstrakten hierarchischen hybriden Artikelmikrostruktur erläutert. Jedem Wörterbuchartikel, der mindestens einen funktionalen Angabezusatz aufweist, kann sowohl eine reine (strukturell reduzierte) als auch eine hybride Artikelmikrostruktur eines bestimmten Typs zugewiesen werden. Hier wird von den funktionalen Angabezusätzen nur der Typ des lexikographischen Subscripts berücksichtigt (vgl. Wiegand 2015). Die jeweilige hybride Struktur ist dann erhältlich, wenn man die durch den funktionalen Angabezusatz bedingte interne Angabestruktur und/oder die interne Angabearchi tektur berücksichtigt; wa3 hat eine sub-vertikale Angabe architektur,
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
23
weil wa3 einen unten erweiternden und damit hinaufadressierten funktionalen Angabezusatz aufweist, der ein lexikographisches Subscript ist, das zum Typ der Wort akzentkennzeichnung gehört, die zugleich („|“) eine Vokalquantitätskennzeichnung zur Länge des Vokals ist (WAk|VQK.L; vgl. Wiegand 2015). Lexikographische Subscripte dürfen nicht mit phonetischen Subscripten verwechselt werden. Das Subscript in wa3 ist realisiert durch den Unterstrich unter a in Granulat, der unten erweiterten Lemmazeichengestaltangabe, die zugleich eine Wortformangabe für den Nominativ Singular (WFA|NSg) und eine Rechtschreibangabe (RA) ist. Der Unterstrich wird durch eine Anwendung der Methode der funktionalen segmentativen Isolierung abgetrennt, so dass Granulat und der Unterstrich „_“ gegeben sind. Sodann wird Granulat nichtfunktional-positional segmentiert, so dass sich folgendes Segmentationsergebnis ergibt: Granul|a|t. Granul ist das vordere Angabeformsegment (vAFSeg), a ist das mittlere Angabeformsegment (mAFSeg), t ist das hintere Angabeformsegment (hAFSeg). Bildet man dann eine elementenheterogene Trägermenge, deren Elemente alle Klassen der bei den Segmentationen beteiligten Segmente von wa3 sind, und definiert auf dieser eine Präzedenzrelation, eine partitive Relation sowie eine textarchitektonische Relation vom Typ der unterhalb-Relation mit dem Relationsterm x ist unterhalb von y, ist die abstrakte hierarchische architektonisch angereicherte Angabestruktur für die unten erweiterte Lemmazeichengestaltangabe als Teilstruktur der Artikelmikrostruktur erhältlich, die folgende Form aufweist (Abb. 5). a. h. subscriptbedingt internlemmatisch architektonisch angereicherte Angabestruktur/aMIS lzga ╨ wak| vqk.l|wfa.nsg|ra lzga|wfa.nsg|ra vaFSeg
maFSeg
haFSeg
wak|vqk.l
a. SUB-VERTIKALE AngabearchitektUR
Abb. 5: Fünfter erweitert kommentierter Strukturgraph: Abstrakte hierarchische subscriptbedingt internlemmatisch architektonisch angereicherte Angabestruktur; Darstellungskonventionen: x y bedeutet so viel wie x ist unterhalb von y.
24
Herbert Ernst Wiegand
Die gepunkteten Kanten verbinden solche textuelle Segmente, die keine Textkonstituenten sind, weil sie durch die Anwendung einer anderen Segmentationsmethode als die der funktional-positionalen Segmentation erhältlich sind. Die architektonisch angereicherte Angabestruktur wird dann in die abstrakte reine hierarchische Artikelmikrostruktur integriert, so dass die hybride Artikelmikrostruktur vom Typ der subscriptbedingt architektonisch angereicherten Artikelmikrostruktur gegeben ist. Die Integration wird hier nur auf der Ebene der Strukturdarstellung vollzogen. Zu dem Strukturgraph für die abstrakte hierarchische hybride Artikelmikrostruktur in Abb. 6 sind sehr viele Strukturgraphen für konkrete hierarchische hybride Artikelmikrostrukturen „deckungsgleich“, weil die zugehörigen Strukturen isomorph sind. Abstrakte Strukturen, und zwar nicht nur die von Wörterbuchartikeln, sondern auch die zu ganz unterschiedlichen Formteilen eines Wörterbuchs sowie die dazugehörigen Strukturgeflechte sind der zentrale Gegenstand der Theorie der Wörterbuchform (vgl. Wiegand 2016). a. h. subscriptbedingt internlemmatisch architektonisch angereicherte Artikelmikrostruktur a.h. basisstruktur/amis
WA FK
SK
lzga ╨ wak| vqk.l|wfa.nsg|ra
MorA.S BPA
lzga|wfa.nsg|ra
vaFSeg
maFSeg
haFSeg
ArtA─| G|WAr
v.Sgb2A wak|vqk.l a. SUB-VERTIKALE AngabearchitektUR
v.KBeiA a. h. rechte kernstruktur/amis
DekKA
v.PlbA a.h. hybride linke kernstruktur/amis
a. h. subscriptbedingt internlemmatisch architektonisch angereicherte Angabestruktur/aMIS
Abb. 6: Sechster erweiter kommentierter Strukturgraph: Abstrakte hierarchische subscriptbedingt internlemmatisch architektonisch angereicherte Artikelmikrostruktur; Abkürzungen und Darstellungskonventionen: wie bisher.
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
25
4 Dritter Einblick: Zugriffsstrukturen und Zugriffspfade 4.1 Externe Datenakzessivität und glattalphabetische Haupfzugriffsstrukturen Datenakzessivität heißt so viel wie Zugriffsbereitschaft lexikographischer Daten. Man unterscheidet die externe von den internen Datenakzessivität; letztere ist innerhalb von akzessiven Einträgen, wie z. B. Wörterbuchartikeln gegeben. Die externe ist obligatorisch; sie erlaubt extern adkurrente Zugriffe. Die interne ist fakultativ und wird hier nicht behandelt (vgl. Wiegand 2005a). Die externe Datenakzessivität wird durch textuell implementierte äußere Zugriffsstrukturen gewährleistet. Die Theorie der Wörterbuchform kennt mehr als 80 Typen (vgl. Wiegand 2008, Wiegand/Beer 2013). Bei der Typenbildung spielt nicht nur die jeweilige lineare Ordnung der Zugriffstextelemente (wie z. B. die der Lemmata) eine Rolle, sondern auch ihre Lage im zweidimensionalen Druckraum. Dies ist z. B. bei glattalphabetischen Hauptzugriffsstrukturen der Fall. Glattalphabetische Hauptzugriffsstrukturen sind lineare Ordnungsstrukturen, für die außer den üblichen mathematischen Ordnungsaxiomen für lineare Strukturen folgende metalexikographischen Axiome gelten: (a) Sie haben nur gerade einen direkten Zugriffsbereich. (b) Alle Lemmata stehen am Zeilenanfang, und auf ihrer Menge ist eine oberhalbRelation definiert. (c) Sublemmata treten nicht auf. Im Folgenden wird ein einfaches Beispiel (Abb. 7), und zwar eine glattalphabetische Hauptzugriffsstruktur behandelt. Dieser Zugriffsstrukturtyp ist im Schriftkulturraum der Alphabetschriften wohl der bekannteste. Die zugehörigen Zugriffsstrukturen sind die benutzerfreundlichsten mit den kürzesten äußeren Zugriffszeiten. Angenommen, für einen Benutzer-in-actu ist das Wort Montage ein konfliktäres Textsegment in einem Text, den er liest, und er führt eine externe Zugriffshandlung aus, um die Wortbedeutung zu finden. Dann nutzt er die Wortform als Leitelement, um das Lemma Montage in der glattalphabetischen Hauptzugriffsstruktur zu finden. Die Voraussetzung für eine erfolgreiche externe Zugriffshandlung ist die Kenntnis des Zugriffsalphabets sowie die der allgemeinen Wörterbuchbenutzungspraxis (i. S. v. Wiegand 1998: 370).
26
Herbert Ernst Wiegand
Zugriffsbereich der Zugriffsstruktur (hier: das Wörterverzeichnis) A : B : M
Ausschnitt aus der glattalphabetischen Hauptzugriffsstruktur Mona
4 glattalphabetisch geordnete Zugriffstextelemente, und zwar Leitelementträger, die Lemmata sind
Monist
4 akzessive Wörterbucheinträge, die Wörterbuchartikel sind, auf die das Lemma direkten externen Zugriff eröffnet
Monster
Montage EXTERNE ZUGRIFFSHANDLUNG
N : Z
Montage = Leitelement (L)
Montage = deutsches Wort
Verschriftung
Lat. Alphabet im deutschen Schriftsystem (wörterbuchexterne lineare Ordnungsstruktur) a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, x, y, z
Abb. 7: Veranschaulichung zu einem kleinen Ausschnitt aus einer glattalphabetischen Hauptzugriffsstruktur mit vier Wörterbuchartikeln mit den Lemmata Mona, Monist, Monster und Montage im direkten Zugriffsbereich.
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
27
4.2 Alphabete und Zugriffsalphabete als lineare Ordnungsstrukturen 4.2.1 Alphabete und Alphabetisierung Das lateinische Alphabet hat eine Verschriftungsfunktion und eine Ordnungsfunktion. Letztere ist für alle Alphabettypen gegeben; die Ordnungsfunktion ist damit universell und damit für alle alphabetischen Zugriffsstrukturen relevant. Die kanonische Schreibweise des lateinischen Alphabets, das nur eines von vielen Beispielen für ein Alphabet ist, ist bekanntlich wie folgt: a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t, u, v, w, y, z. Das lateinische Alphabet ist damit eine lineare Ordnungsstruktur von 26 verschiedenen Buchstaben und damit eine Menge, auf der eine Präzedenzrelation mit dem Relationsterm x vor y definiert ist und für die die Ordnungsaxiome transitiv, asymmetrisch (damit auch irreflexiv) und konnex gelten. Die heute übliche Methode der exhaustiven Alphabetisierung, bei deren Anwendung alle Buchstaben aller Zeichenketten berücksichtigt werden, die alphabetisch sortiert werden sollen, besteht darin, aus einer Menge von Zeichenketten, die aus den Buchstaben des jeweiligen Alphabets bestehen (wie z. B. aus einer Menge von Wörtern), eine lineare Ordnung dieser Zeichenketten herzustellen (wie z. B. eine initialalphabetische Liste von Wörtern).
4.2.2 Zugriffsalphabete als geregelte Alphabeterweiterungen Eine alphabetische Zugriffsstruktur für ein neuhochdeutsches Wörterbuch – gleichgültig zu welchem Typ sie gehört – kann nicht alleine auf der Basis des lateinischen Alphabets textuell implementiert werden, denn es fehlen die vier alphabetexternen Umlautbuchstaben ä, ö und ü sowie ß. Für diese müssen Einsortierungsregeln formuliert oder die bereits vorhandenen einer DIN-Norm berücksichtigt werden. Weiterhin gibt es viele Fachwörter, die mit Zahlen, wie z. B. 3-D-Drucker, geschrieben werden, oder auch Hochzahlen bei Lemmata für homonyme Lemmazeichen. Auch muss die Reihenfolge von Klein- und Großbuchstaben festgelegt werden: Gilt großes A vor kleinem a oder umgekehrt kleines a vor großem A? Weiterhin muss gegebenenfalls der Ort von Buchstaben mit Diakritika bestimmt werden und manches andere mehr. Durch solche und andere Regelungen entstehen wörterbuchspezifische Zugriffsalphabete. Diese müssen in den Benutzungshinweisen erläutert werden, woran man erkennen kann, dass Metatexte für Wörterbücher obligatorisch sind (vgl. oben unter 2). Ein geregelter äußerer Zugriff eines Benutzers (für alle möglichen Benutzungsfälle) ist daher nur auf der Basis der Kenntnis des jeweiligen Zugriffsalphabets möglich.
28
Herbert Ernst Wiegand
4.3 Artikeladkurrente äußere Zugriffspfade Zugriffsstrukturen müssen von Zugriffspfaden unterschieden werden: Letztere sind individuelle Wege eines Benutzers-in-actu bei der Ausführung von Benutzungshandlungen, und ihre Untersuchung erfolgt durch die Anwendung der Methode der periaktionalen Benutzungskommentierung (Wiegand 1998: 1015). Man unterscheidet adkurrente, inkurrente, binnenkurrente und exkurrente sowie einfache und zusammengesetzte Zugriffspfade. In der Theorie der Wörterbuchform sind ca. 60 Typen von Zugriffspfaden anhand von unterschiedlichen Zugriffsstrukturtypen untersucht (vgl. Wiegand 2007). Im Folgenden wird kurz nur ein Typ, und zwar der des artikeladkurrenten äußeren Zugriffspfades erläutert. Der Terminus adkurrent ist gebildet nach dem lat. Verb adcurrere ‚bis zu einen bestimmten Punkt laufen‘. Zu jedem Zugriffspfadtyp gibt es ein allgemeines Zugriffspfadbild. Für den Typ des artikeladkurrenten äußeren Zugriffspfads hat es die folgende erweiterte Form: artikeladkurrenter äusserer zugriffspfad
externer erstzugriff
Lemma |Montage| = Leitelement Lemma
Montage = konfliktäres Wort
pfadanfang
ausschnitt aus der lemmastrecke m
Lemma
externer finaler erstzugriff
Montage
pfadende
Lemma
Abb. 8: Erweitertes allgemeines Zufriffspfadbild zum Typ des artikleadkurrenten äußeren Zugriffspfads.
Jeder Zugriffspfad hat einen Pfadanfang und ein Pfadende. Bei adkurrenten äußeren Zugriffspfaden ist der Pfadanfang wörterbuchextern und das Pfadende zugriffsstrukturintern.
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
29
Jede Wortform eines konfliktären Wortes (im Beispiel Montage) ist für einen Benutzer-in-actu ein Leitelement. Mit diesem sucht er das formgleiche Lemma und macht im Zuge der Ausführung einer externen Zugriffshandlung einen externen Erstzugriff auf irgendein Lemma in möglichst großer Nähe des gesuchten Lemmas. Dann sucht er sein erstes Suchziel, hier das Lemma Montage, wobei er einen individuellen Suchpfad vom Typ des artikeladkurrenten äußeren Zugriffspfads etabliert. Das Auffinden des gesuchten Lemmas ist zugleich der finale externe Erstzugriff und der Abschluss einer erfolgreichen externen Zugriffshandlung. Dadurch wird dem Benutzer-in-actu der Zugriff auf alle Daten des zugehörigen Wörterbuchartikels eröffnet, und wenn artikelinterne Verweisungen gegeben sind, auch auf Daten anderer Teiltexte, wenn er eine Verweisbefolgungshandlung erfolgreich ausführt. Um die Antwort auf seine Suchfrage zu erhalten, muss er weitere Benutzungshandlungen ausführen, wobei er dann innere Zugriffspfade unterschiedlichen Typs etabliert bis er dasjenige Textsegment erreicht hat, anhand dessen er eine Antwort auf seine Suchfrage erschließen kann.
5 Schlussbemerkung Wenn man zeitgebunden über Ergebnisse langjähriger eigener Forschung einen Vortrag hält, hat man – selbst wenn man nur einige Einblicke geben möchte – stets ein Auswahl- und damit verbunden ein Zeitproblem. Sicherlich haben viele diese Erfahrung auch schon gemacht. Für mich sind wenigstens diese beiden Probleme nun gelöst. Denn dieser Vortrag, wie er hier niedergeschrieben ist – so meine derzeitige Einschätzung – war wohl mein letzter.
Literatur Monografien und Aufsätze Bielińska, Monika (2010): Lexikographische Metatexte. Eine Untersuchung nichtintegrierter Außentexte in einsprachigen Wörterbüchern des Deutschen als Fremdsprache. Frankfurt am Main [etc.]: Peter Lang. Klabunde, Ralf (1998): Formale Grundlagen der Linguistik. Ein Arbeitsbuch. Tübingen: Narr. Rey-Debove, Josette (1971): Étude linguistique et sémiotique de dictionnaires français contemporains. The Hague/Paris: Mouton. Wiegand, Herbert Ernst (1989): Aspekte der Makrostruktur im allgemeinen einsprachigen Wörterbuch: alphabetische Anordnungsformen und ihre Probleme. In: Hausmann, Franz Josef et al. (Hrsg): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie […]. 1. Teilbd. Berlin/New York: De Gruyter, 371–409.
30
Herbert Ernst Wiegand
Wiegand, Herbert Ernst (1989a): Der Begriff der Mikrostruktur: Geschichte, Probleme, Perspektiven. In: Hausmann, Franz Josef et al. (Hrsg): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie […]. 1. Teilbd. Berlin/New York: De Gruyter, 409–469. Wiegand, Herbert Ernst (1989b): Arten von Mikrostrukturen im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef et al. (Hrsg): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie […]. 1. Teilbd. Berlin/New York: De Gruyter, 462–502. Wiegand, Herbert Ernst (1998): Wörtbuchforschung. Untersuchungen zur Wörterbuchbenutzung, zur Theorie, Geschichte, Kritik und Automatisierung der Lexikographie. 1. Teilband. Mit 159 Abbildungen im Text. Berlin/New York: De Gruyter. Wiegand, Herbert Ernst (2000): Über Suchbereiche, Suchzonen und ihre textuelle Strukturen in Printwörterbüchern: Ein Beitrag zur Theorie der Wörterbuchform. In: Wiegand, Herbert Ernst (Hrsg.): Wörterbücher in der Diskussion IV. Vorträge aus dem Heidelberger Lexikographischen Kolloquium. Tübingen: Niemeyer, 233–301. Wiegand, Herbert Ernst (2003): Überlegungen zur Typologie von Wörterbuchartikeln in Printwörterbüchern. Ein Beitrag zur Theorie der Wörterbuchform. In: Lexicographica 19, 169–313. Wiegand, Herbert Ernst (2005): Angaben, funktionale Angabezusätze, Angabetexte, Angabestrukturen, Kommentare und mehr. Ein Beitrag zur Theorie der Wörterbuchform. In: Lexicographica 21, 202–279. Wiegand, Herbert Ernst (2005a): Über die Datenakzessivität in Printwörterbüchern. Einblicke in neuere Entwicklungen einer Theorie der Wörterbuchform. In: Lexikos 15, 1–35. Wiegand, Herbert Ernst (2007): Über Zugriffspfade in Printwörterbüchern. Ein Beitrag zur Schnittstelle von Benutzungshandlungen und Wörterbuchform. In: Lexikos 17, 180–211. Wiegand (2007a): Zur Adressierung in Printwörterbüchern. Präzisierungen und weiterführende Überlegungen. In: Lexicographica 22, 187–261. Wiegand, Herbert Ernst (2008): Zugriffsstrukturen in Printwörterbüchern: Ein zusammenfassender Beitrag zu einem zentralen Ausschnitt aus einer Theorie der Wörterbuchform. In: Lexicographica 24, 209–315. Wiegand, Herbert Ernst (2009): Nichtnatürlich über natürliche Sprache schreiben. Zu einigen formalen Aspekten von Wörterbuchartikeln. In: Heidelberger Jahrbücher 53, 247–285. Wiegand, Herbert Ernst (2010): Zur Methodologie der Wörterbuchforschung. Ausgewählte Untersuchungs- und Darstellungsmethoden für die Wörterbuchform. In: Lexicographica 26, 249–350. Wiegand, Herbert Ernst (2015): Funktionale Angabezusätze und hybride textuelle Strukturen in Wörterbuchartikeln. Korrigierende Ergänzungen, weiterführende Vertiefungen, zusammenfassende Übersichten und mehr. In: Lexicographica 31, 249–351. Wiegand, Herbert Ernst/Beer, Sandra (2013): Access structures in printed dictionaries. In: Gouws, Rufus H. et al. (Hrsg): Dictionaries: An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/Boston: De Gruyter Mouton, 110–149. Wiegand, Herbert Ernst/Feinauer, Ilse/Gouws, Rufus H. (2013): Types of dictionary articles in printed dictionaries. In: Gouws, Rufus H. et al. (Hrsg): Dictionaries: An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/Boston: De Gruyter Mouton, 314–366. Wiegand, Herbert Ernst/Fuentes Morán, Maria Teresa (2009): Estructuras lexicographicas. Aspectos centrales de una teoría de la forma del diccionario. Granada: Ediciones Tragacanto. Wiegand, Herbert Ernst/Gouws, Rufus H. (2011): Theoriebedingte Wörterbuchformprobleme und wörterbuchformbedingte Benutzerprobleme I. Ein Beitrag zur Wörterbuchkritik und zur Erweiterung der Theorie der Wörterbuchform. In: Lexikos 21, 232–297.
Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform
31
Wiegand, Herbert Ernst/Gouws. Rufus H. (2013): Adressing and adressing structures in printed dictionaries. In: Gouws, Rufus H. et al. (Hrsg): Dictionaries: An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/Boston: De Gruyter Mouton, 273–314. Wiegand, Herbert Ernst/Smit, Maria (2013): Microstructeres in printed dictionaries. In: Gouws, Rufus H. et al. (Hrsg): Dictionaries: An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/Boston: De Gruyter Mouton, 149–214.
Wörterbücher Kempcke = Handwörterbuch der deutschen Gegenwartssprache in zwei Bänden. Hrsg. v. Kempcke, Günther [als Leiter eines Autorenkollektivs]. Berlin: Akademie-Verlag, 1984.
Teil I: Theorie der Wörterbuchform und ihre empirische Anwendung in der einsprachigen Lexikographie des Deutschen
Rufus H. Gouws
Accessibility, access structures and access procedures 1 Introduction Dictionaries are containers of knowledge, as suggested by McArthur (1986: 19), and these containers have to be accessible to their target users. Over many years various aspects of access and accessibility played a significant role in both practical and theoretical lexicography. Practical dictionaries were planned and compiled in such a way that their intended target users could easily access these reference sources. Already in 1615 and 1631 William Bathe and Amos Komensky respectively published their dictionaries Ianua Linguarum (The gate of tongues) and Ianua Linguarum Reserata (The gate of tongues unlocked) with titles that reflect the aim of providing access. This approach remains prevalent in recent online lexicography, e. g. with Merriam Webster producing The Open Dictionary and making this open container of knowledge freely available, and by doing so adhering to a significant assignment of any lexicographer. Due to the interactive relation between theory and practice in lexicography metalexicographic research has also focused on access and access structures, as can be seen in many publications, among others Hausmann/Wiegand (1989), Gouws/Prinsloo (2005), Engelberg/Lemnitzer (2009), Svensen (2009), Bergenholtz/Gouws (2010) and especially Wiegand (2008) and Wiegand/Beer (2013). Development in modern-day lexicography, both dictionaries and metalexicography, demands new approaches to the accessing of data in dictionaries. This paper looks at some of the possibilities and tries to adapt certain aspects of metalexicography in order to successfully provide enhanced access procedures.
2 Towards a single theory Lexicographic theory has primarily been formulated for printed dictionaries. Albeit that printed dictionaries today still play an important role, one has to take cognizance of the emergence and rapid development of online dictionaries. Lexicographers, both practical lexicographers and scholars in the field of metalexicography, need to pay
Rufus H. Gouws: Stellenbosch University, Department of Afrikaans and Dutch, Private Bag X1, Matieland 7602, South Africa, [email protected] https://doi.org/10.1515/9783110598650-003
36
Rufus H. Gouws
attention to the changing environment and its potential impact on all aspects of the discipline and its practical implementation. Tarp (2008: 103) rightly says: “There are so many theoretical articles that freely discuss various types of structure in electronic dictionaries as if they were the same as those found in printed dictionaries.” Important questions that need to be answered by lexicographers are whether a completely new theory is needed, resulting in two different theories for printed and online dictionaries, or whether one unified theory will suffice. Such a unified theory will be stronger than two separate theories and should make provision for both mutual and unique issues with to regard the two mediums of dictionaries in its scope. Some aspects of the current theory can remain intact, some will have to be changed and new matters will come to the fore. This paper adheres to the assumption that one unified theory is the preferred way to go. Such an approach demands a re-assessment of dictionary structures, including the access structure. However, structures, also the access structure, should not be discussed in isolation. There are interactive relations holding between different structures, e. g. between the access structure, the article structure and the mediostructure, whilst the access structure and the macrostructure often coincide, cf. Hausmann/ Wiegand (1989). Although access structures are the primary focus of this paper frequent references will be made and some attention will also be given to other relevant lexicographic structures.
3 The access domain Wiegand/Beer (2013: 110) use the term data accessibility to refer to “the access willingness and thereby to the possibility to look up textual and illustrative lexicographical data”. They make the important comment that data accessibility prevails because the specific data “are in the access domain of an access structure”. The access capability of the data in the access domain plays a significant role in determining data accessibility. Different types of dictionaries offer different types of accessibility. Accessibility in the printed medium can also differ from accessibility in the electronic medium. One could also interpret the term access domain as the broad domain to which specific access routes lead the user, i. e. not necessarily the access domain of access structures but the access domain of accessing as a lexicographic procedure. In a printed dictionary the central list is the most typical access domain. It could be argued that the dictionary as a whole constitutes an access domain where users can also access data presented in the outer texts of the dictionary. Dictionaries often display a central list bias. They eschew the significant role of outer texts in the lexicographic presentation and treatment. In many dictionaries the term dictionary is only used to refer to the alphabetical section of the dictionary – with the table of contents containing an entry Dictionary to guide the user to the alphabetical list, see for example the entry in
Accessibility, access structures and access procedures
37
the table of contents of the Macmillan English Dictionary for Advanced Learners. When planning and compiling dictionaries where a frame structure is employed lexicographers should pay much more attention to ways and means for their target users to also access the data presented in the outer texts. Additional and alternative types of access structures could be put in place to help determining search routes that users could follow to reach the data in these texts – both integrated and non-integrated outer texts. Enabling successful access to the data in these texts should be a primary concern of lexicographers. Metalexicographic assistance is needed to expand the scope of access structures in order to target all components of a comprehensive access domain, representing the full dictionary as a text compound and a carrier of a variety of text types. Access to outer texts in printed dictionaries or outer features in online dictionaries, see Klosa/Gouws (2015), will not be discussed in this paper. In online lexicography the access domain can also, as in printed dictionaries, be a dictionary as a whole or a given dictionary article. However, the access domain can also have a more comprehensive nature than what one finds in a printed dictionary. This is the result of the access a user sometimes has during a single consultation not only to a single dictionary but to a dictionary portal or a group of dictionaries. When a user needs to consult the online dictionary Pharos English-Afrikaans Dictionary to find the lemma sign beoordeel (to judge/evaluate/assess) the first phase of the search will lead to the opening screen of Pharos dictionaries where all the online dictionaries of the publisher are listed, as seen in Figure 1.
Fig. 1: Partial opening screen of Pharos Dictionaries.
38
Rufus H. Gouws
The user can then enter the required search word (here beoordeel) and the search will result in the occurrence of this word in different dictionaries, as seen in Figure 2.
Fig. 2: The word beoordeel in different dictionaries.
Fig. 3: Selecting a specific dictionary from the Pharos list.
Accessibility, access structures and access procedures
39
The user can also select a specific dictionary, e. g. the Pharos English-Afrikaans Dictionary (Figure 3), and then find the required word both as a lemma and as a translation equivalent in the selected dictionary (Figure 4).
Fig. 4: The word beoordeel in the Pharos English-Afrikaans Dictionary.
In this consultation it is clear that accessibility, that is the access capability and the possibility to look something up, differs from the corresponding capability in a printed dictionary. The occurrence of a specific word as guiding element in different dictionaries can come to the fore, and this offers the user access to one or more dictionaries because of a more comprehensive access domain. Finding the word beoordeel as lemma in, say, the Pharos English-Afrikaans Dictionary, can be done via different search routes that negotiate both a comprehensive and a more restricted access domain. When formulating a general theory of lexicography that is not medium-specific one has to negotiate the different structures prevailing in printed dictionaries in order to see whether they also are relevant to online dictionaries. This will lead to, among others, the question whether access structures also occur in online dictionaries.
40
Rufus H. Gouws
4 Access and macrostructures in online dictionaries Wiegand/Beer (2013: 113) define an outer access structure (in printed dictionaries) as follows: An outer access structure is a linear textual structure, whose elements are outer access text elements, which can be accessed externally through the knowledge of general dictionary-external and specifically defined dictionary-internal principles for the linear sequence of the access text elements.
An access structure is a linear sequence of access text elements. Arrangement and ordering are significant features of structures. In printed dictionaries outer and inner access structures consist of different textual elements. In printed dictionaries the outer access structure often coincides with the macrostructure. When trying to determine whether online dictionaries display an outer access structure it could help to see whether these dictionaries have a macrostructure. Macrostructural elements are the main outer access elements that help users to reach the required dictionary article. A dictionary structure presupposes a linear ordering of textual elements. Users typically don’t see an ordered lemma stretch when consulting an online dictionary. Online dictionaries can have rapid access possibilities, as seen in the following screenshots from Elexiko (Figures 5–7). The user does not employ a macrostructure but accesses the article via its guiding element, cf. also Gouws (2017; 2018). In Figure 5 the search word Kopf (head) is entered into the search input box provided in the opening screenshot:
Fig. 5: Elexiko’s opening screen.
Accessibility, access structures and access procedures
41
This leads to the screenshot presented in Figure 6 where different results of the search are indicated and where the user has the option to proceed to the article of the required word by clicking on the word Kopf underneath the button Siehe Artikel (see article):
Fig. 6: Results of search for Kopf in Elexiko.
Opting to see the article the user is directed to the screenshot presented in Figure 7, i. e. an article with the word Kopf as guiding element:
Fig. 7: Article in Elexiko with Kopf as guiding element.
42
Rufus H. Gouws
4.1 Access structure and access route Wiegand/Beer (2013: 141) distinguish between an access structure and an access route: Outer access structures are textual structures /…/ In contrast, outer access routes are no textual structures /…/ They can be described systematically within the context of an imagery space if the executed acts of usage are considered movements to and in a dictionary, whereby the movements can be seen as a set of successive stages which mark a unique user route, which is called access route …
The screenshots in Figure 5–7 illustrate an access route, a set of successive stages, the specific user has followed to reach the lemma sign Kopf. This is not the only possible route to reach that destination. Instead of having typed the required word, i. e. Kopf, into the search input box on the opening screen, the user could have negotiated the alphabet bar that gives the first letters of the different article stretches as seen in Figure 8.
Fig. 8: Alphabet bar in Elexiko.
Clicking on the letter K the user will be guided to a screenshot with k as first lemma in the specific article stretch and a partial article stretch of the letter k given on the left of the screenshot, as can be seen in Figure 9. Scrolling down the items given in the lemma selection in the column on the left the user will eventually reach the word Kopf (Figure 10) and by clicking on this word
Accessibility, access structures and access procedures
43
in the partial article stretch the user will be guided to the article of the lemma Kopf as seen in Figure 11, a screenshot comparable to that of Figure 7.
Fig. 9: Partial article stretch of k in Elexiko.
Fig. 10: Partial article stretch containing Kopf in Elexiko.
44
Rufus H. Gouws
Fig. 11: Article with Kopf as guiding element in Elexiko.
The approaches as seen in Figures 5–7 and 8–11 respectively represent different access routes. Online dictionaries offer a cumbersome possibility as in Figures 8–11 but users also have a rapid access possibility as seen in the screenshots in Figures 5–7. Employing this rapid search route users do not rely on the macrostructure coinciding with an access structure but negotiates possibilities offered by the online medium. However, this does not mean that the dictionary does not have a macrostructure.
5 A type of access structure The alphabet bar and the partial lemma stretches (Figures 8–11) support the idea of an outer access structure – that can determine different access or search routes. One significant omission as access element in Elexiko is that of alphabetized lemmatical running titles, giving the first and last lemma on a given page of a printed dictionary in the top left and right corner respectively. This is a medium-determined difference between the access elements in printed and online dictionaries, following from the use of a page versus a screenshot presentation. The higher a user’s degree of familiarity with the system of a dictionary, the better the chances of rapid access to the required article or item. When a printed dictionary has well-devised access structures the knowledgeable user may follow a search route that negotiates the full sequence of access structural elements as determined by the complete access structure. A user may instead opt for a search route that employs
Accessibility, access structures and access procedures
45
only some of the elements of the access structure and still achieves a successful dictionary consultation procedure.
5.1 A partial access structure When a user of a printed dictionary reaches the page indicated by the running titles as the appropriate target page of the specific consultation, the user may decide not to search vertically down from the top of the page to the bottom in order to find the required lemma sign, but he/she may, for example, immediately jump to the second half of the second column on the page and then focus the search on a shortened version of the partial lemma stretch, compared to following the partial stretch from top to bottom on that page. Such a search route is not determined by the full access structure but only by those access elements that play a role in the specific consultation. Although the user cannot change the access structure he/she may employ only a section of the access structure and the search route determined by that part of the access structure. A distinction can therefore be made between a full or complete access structure and a partial access structure. A partial access structure consists of at least two but not all access elements of the complete access structure. The use of a partial access structure requires the presence of a full access structure, albeit that the full structure will not be utilised. A partial access structure includes a partial stretch of access elements which form part of a full access structure. This partial access structure presents a sequence of linearly ordered elements. A partial access structure may determine a search route that might display certain gaps where the user has refrained from utilising certain access elements.
5.2 Systematic and punctual access Haussmann (1977: 144) distinguished between a learning dictionary, i. e. a dictionary that one reads systematically, and a consultation dictionary, i. e. a dictionary which is consulted to find an answer to a specific question. Comparably a distinction between systematic and punctual can be introduced when discussing the search routes determined by the outer access structure of an online dictionary. A systematic or sequential search route will be determined by the full access structure where a user employs the full linearly ordered series of access elements to move from an access starting point to the lemma sign – as witnessed when using many printed dictionaries, or in the second access route employed in searching for the word Kopf in Elexiko (Figures 8–11) – and then within the specific article to the required item. Punctual access, a type of access utilising a partial access route, implies rapid access, made possible in online dictionaries to reach the required lemma sign without negotiating a macrostructure or a set of linearly ordered access elements.
46
Rufus H. Gouws
Punctual access prevails when a user looking for the word catastrophe in the online version of the American Heritage Dictionary types the required word into the search input box on the opening screen (Figure 12) without negotiating any macrostructure or access elements. A rapid and punctual access possibility that does not occur in the same way in printed dictionaries immediately guides the user to the article of the word catastrophe (Figure 13).
Fig. 12: Opening screen when consulting the American Heritage Dictionary.
Fig. 13: Article of the lemma catastrophe in the American Heritage Dictionary.
Accessibility, access structures and access procedures
47
Systematic access as determined by a full outer access structure prevails in both printed and online dictionaries. Punctual access is a form of access that typically occurs in online dictionaries and only incidentally and highly infrequently in printed dictionaries – it would be a coincidence to open the printed dictionary on exactly the right page and focus the eyes immediately on exactly the right lemma sign in the partial article stretch of the specific page. Metalexicography has to provide new ways of describing outer access in online dictionaries.
6 Article structures 6.1 Static and dynamic article structures Whilst printed dictionaries have a static article structure online dictionaries typically display a dynamic and often multi-layered article structure. The lexicographic treatment of a single lemma is often presented in a variety of screenshots. Depending on the specific dictionary the different screenshots can contain either full or partial articles or a bunch of articles with the same guiding element that jointly function as treatment of the lemma. Access within the article of a printed dictionary goes via the microstructural ordering, with the structural indicators helping to identify certain search zones or item types. Some online dictionaries have a similar approach, cf. the Afrikaans dictionary HAT (Handwoordeboek van die Afrikaanse Taal) that displays an article structure of the lemma sign droog (dry) (Figure 14) which is not unlike that of a printed dictionary and with an access structure that is similar to that of the printed dictionary.
Fig. 14: Article of the lemma droog in HAT.
48
Rufus H. Gouws
Contrary to this static article structure where a single search route could suffice to guide the user to any and to all the search zones, dynamic article structures in many online dictionaries allow different search routes, each with its own destination. Different layers of an article are displayed and accessed individually. This can yet again be illustrated by means of some aspects of the treatment of the lemma Kopf in Elexiko. The opening screen for the treatment of Kopf (Figure 15) shows that the article is divided into two main sections – one for Lesartenübergreifende Angaben (items relevant to all senses of the word) and one for Lesartenbezogene Angaben (items for specific senses). This screenshot shows some typical features of a distinction between a comment on form and a comment on semantics. A user looking for data on the origin of the word can click on the button Anzeigen (‘show’) underneath the search zone indicator Herkunft und Wandel (origin and change), and a specific access route for this search will take the user to the relevant data, as seen in Figure 16. A user interested in word formation products will click on Weiter (further/more) underneath the search zone indicator Wortbildungsprodukte (word formation products) (Figure 15). He/she will then be guided to the display in a screenshot where there is a further choice between compounds and derivations (Figure 17). This search route can only be used to reach the data on word formation products and not to venture to any other search zone.
Fig. 15: The guiding element Kopf in Elexiko.
Accessibility, access structures and access procedures
Fig. 16: Etymological data for the lemma Kopf in Elexiko.
Fig. 17: Word formation in the article of Kopf in Elexiko.
49
50
Rufus H. Gouws
The user in search of items presented in the section Lesartenbezogene Angaben has to follow yet again a search route unfamiliar to that prevailing in printed dictionaries in order to open and access items presented as hidden data in terms of the opening screenshot of the article. By clicking on Weiter of the first subcomment on semantics ‘Teil des Körpers’ (part of the body), cf. Figure 15, the user accesses a following screenshot which offers, besides a paraphrase of meaning of the word Kopf, the option to proceed to further screenshots to which specific data types have been allocated, e. g. collocations, constructions, related words, grammar, examples, illustrations, as seen in Figure 18. These buttons are elements of an inner access structure – they are systematically presented in a screenshot dedicated to a specific sense of the word represented by the lemma sign. The user cannot retrieve information regarding the subject matter of the dictionary from these buttons – therefore they are not items but rather data-identifying indicators that co-constitute the article structure of the specific article and they are not part of the microstructure. They are access structure elements that define a search route a user could follow to reach a specific type of item.
Fig. 18: First subcomment on semantics of the lemma Kopf in Elexiko.
Clicking on the button Grammatik (Grammar) opens the access route to a part of the comment on form for the word represented by the lemma sign Kopf, as seen in Figure 19. Clicking on Belege anzeigen (Show examples) takes the user to another screenshot, given as Figure 20. The retrieval of each type of information in this dictionary is achieved by reaching the desired item by means of a search route exclusively determined to have the
Accessibility, access structures and access procedures
51
specific item or search zone as destination whilst other data included as part of the treatment of the relevant word remain hidden at that stage of the consultation and access process.
Fig. 19: Screenshot for Grammatik in the article of Kopf in Elexiko.
Fig. 20: Screenshot for Belege anzeigen in the article of Kopf in Elexiko.
52
Rufus H. Gouws
In an online dictionary like Elexiko the inner access structure does not define search routes that follow a traditional vertical direction, from the top of the article towards the bottom. It rather defines search routes that guide the user to screenshots representing different layers of the article structure by employing access structure elements that occur in a systematic and for the knowledgeable user predictable ordering within the article structure. From both an article structure and an access structure perspective such a multi-layered article structure is metalexicographically interesting. It has implications for the way in which the formulation of both article and access structures need to be adapted in the theoretical discussions of online lexicography.
6.2 Defining dictionary articles Wiegand/Feinauer/Gouws (2013: 317) define a dictionary article as follows: A dictionary article is an accessible dictionary entry characterized by the following three definitive features: (a) It shows at least one external access text element. (b) It is a constituent of a wordlist. (c) It consists of lexicographic data made accessible, including at least one such part, by means of which the dictionary user can unlock lexicographic information mentioned by the access text element.
Applying this definition to the examples from Elexiko the question arises as to what exactly qualifies as an article? Each screenshot contains a part of the entries, both items and indicators, employed in the treatment of the word presented by the lemma sign occurring in that specific screenshot which is also the word given as macrostructural item in the relevant partial article stretch that can be accessed via the alphabet bar. In terms of the definition given by Wiegand/Feinauer/Gouws the display in each one of these screenshots qualifies as an article because each one contains an external access element, is a constituent of a wordlist and contains lexicographic data regarding the word represented by the lemma sign.
6.3 Restricted and comprehensive articles One can consequently maintain that each screenshot with the lemma as guiding element functions as a fully-fledged article in its own right. In a dictionary like Elexiko each one of these articles contain only a part of the treatment of the lemma sign. The data-presentation in any article here is typically restricted to one or more but not all data types prevailing in the default treatment of the lemma candidates of the specific dictionary. These articles can therefore be regarded as restricted articles. The complete lexicographic treatment of the word Kopf in Elexiko can never be viewed in a single screenshot as single article. Together the restricted articles presented in these different screenshots display the full lexicographic treatment allocated to the specific
Accessibility, access structures and access procedures
53
word. Together all these restricted articles with the same lemma as guiding element constitute a comprehensive article, i. e. an abstract structure consisting of different restricted articles with the same guiding element that collectively present the full lexicographic treatment of the specific word. A typical feature of a comprehensive dictionary article is its multi-layerdness and the fact that only the data presented in a single restricted article can be viewed at any given moment. Access to any single restricted article implies that the other restricted articles are hidden. The occurrence of comprehensive dictionary articles has an impact on both the notion of the article structure and of the access structure. From the opening screenshot the access structure functioning within the comprehensive article structure defines different search routes by means of which the knowledgeable user can move from one layer to another, i. e. from one restricted article to the other, or can punctually access only the restricted article presenting the search zone with the required data. A traditional inner access structure does not work here. A comprehensive dictionary article demands a new kind of inner access structure where data-identifying indicators are access elements, helping a user on a specific search route that leads to a screenshot displaying one of the articles of the comprehensive dictionary article.
7 Heterogeneous approaches Where no single screenshot in Elexiko displays the full article, i. e. a lemma sign with all the items included in the treatment of the lemma sign and addressed at that lemma sign, or allows the user to use the opening screenshot as a point of departure to scroll down the remainder of the article that does not fit onto the opening screenshot, other online dictionaries have other ways of presenting their data, e. g. by showing a full article, accessible by scrolling-down options, or the biggest part of an article with buttons to access certain types of hidden data in a single screenshot. These different approaches, different article structures and different access procedures will not be discussed in this paper. It is therefore important to note that such diverse access possibilities and the varying degrees of accessibility necessitate the acknowledgement of heterogeneous approaches to access procedures in online dictionaries. Accessibility, access structures and access procedures as found in Elexiko represent but those of a single dictionary. However, it shows that online dictionaries employ innovative access strategies and procedures.
54
Rufus H. Gouws
8 In conclusion Dictionaries have a long tradition of functioning as accessible containers of knowledge and metalexicographic research has had a strong focus on the improvement of access procedures in dictionaries by means of enhanced access structures and unambiguous access routes. However, the emergence of online lexicography enabled lexicographers to introduce a variety of new types of access possibilities. This did not only result in new access structures and access routes but also in new types of access domains that inevitably influences accessibility in dictionaries. Metalexicographers unfortunately failed to adapt the theoretical discussions of access structures and accessibility to sufficiently provide for the challenges and possibilities of the new medium. This paper shows some of the innovative procedures already employed in the lexicographic practice and indicates aspects of the influence it could have on the metalexicographical discussion of access and access structures – but also on other lexicographic structures. A unified general theory of lexicography should negotiate a re-assessment of all dictionary structures to ensure a better way of planning and compiling both printed and online dictionaries.
Acknowledgement This research is supported in part by the National Research Foundation of South Africa (grant specific unique reference number (UID) 85434). The Grantholder acknowledges that opinions, findings and conclusions or recommendations expressed in any publication generated by the NRF supported research are that of the author, and that the NRF accepts no liability whatsoever in this regard.
Bibliography Monographs and articles Bergenholtz, Henning/Gouws, Rufus. H. (2010): A new perspective on the access process. In: Hermes 44, 103–127. Engelberg, Stephan/Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchforschung. Tübingen: Stauffenburg. Gouws, Rufus H. et al. (eds.) (2013): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/New York: De Gruyter. Gouws, Rufus H. (2017 in press): Metalexicographic models for multilingual online dictionaries in emerging e-societies. In: Domínguez Vázquez, María José et al. (eds.): Studies on multilingual internet lexicography. Berlin/New York: De Gruyter.
Accessibility, access structures and access procedures
55
Gouws, Rufus H. (2018): Dictionaries and Access. In: Fuertes-Olivera, P. (ed.): Routledge Handbook on Lexicography. London: Routledge: 43–58. Gouws Rufus H./Prinsloo, Daniel J. (2005): Principles and Practice of South African Lexicography. Stellenbosch: African SunMedia. Hausmann, Franz J. (1977): Einführung in die Benutzung der neufranzösischen Wörterbücher. Tübingen: Niemeyer. Hausmann, Franz J./Wiegand, Herbert E. (1989): Component parts and structures of general monolingual dictionaries: A survey. In: Hausmann, Franz J. et al. (eds.): Wörterbücher. Dictionaries. Dictionnaires. An International Encyclopedia of Lexicography. Berlin/New York: De Gruyter, 328–360. Klosa, Annette/Gouws, Rufus H. (2015): Outer features in e-dictionaries. In: Lexicographica 31, 142–172. McArthur, Tom (1986): Worlds of Reference. Cambridge: Cambridge University Press. Svensén, Bo (2009): A Handbook of Lexicography. Cambridge: Cambridge University Press. Tarp, Sven (2008): Lexicography in the Borderland between Knowledge and Non-knowledge. General Lexicographical Theory with Particular Focus on Learner’s Lexicography. Tübingen: Niemeyer. Wiegand, Herbert E. (2008): Zugriffsstrukturen in Printwörterbüchern. Ein zusammenfassender Beitrag zu einem zentralen Ausschnitt einer Theorie der Wörterbuchform. In: Lexicographica 24, 209–315. Wiegand, Herbert Ernst/Beer, Sandra (2013): Access Structures in Printed Dictionaries. In: Gouws, Rufus H. et al. (eds.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/New York: De Gruyter, 110–149. Wiegand, Herbert Ernst/Feinauer, Ilse/Gouws, Rufus. H. (2013): Types of dictionary articles in printed dictionaries. In: Gouws, Rufus H. et al. (eds.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/New York: De Gruyter, 314–366.
Dictionaries Printed dictionaries Ianua Linguarum = Ianua Linguarum. Ed. by Bathe, William. 1615. Inua Linguarum Reserata = Ianua Linguarum Reserata. Ed. by Komensky, Amos. 1631. Macmillan = Macmillan English Dictionary for Advanced Learners. Ed. by Rundell, Michael. Oxford: Macmillan Education, 2002.
Online dictionaries Algemeen Nederlands Woordenboek. [; last access: 21 February 2017]. The American Heritage Dictionary of the English language. [; last access: 21 February 2017]. Elexiko = Ein Online-Wörterbuch zur deutschen Gegenwartssprache. [; last access: 21 February 2017].
56
Rufus H. Gouws
HAT = Handwoordeboek van die Afrikaanse Taal. [; last access: 22 February 2017]. Merriam Webster = The Open Dictionary. [; last access: 28 February 2017]. Pharos = Pharos Afrikaans-Engels/English-Afrikaans Woordeboek/Dictionary. [; last access: 30 September 2016].
Milka Enčeva
Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich 1 Einleitung Seit etwa 20 Jahren gehören Computer und Internet genauso wie Online-Wörterbücher zu unserer alltäglichen Praxis. Damit die Lexikografie mit den neusten Entwicklungen der Informations- und Kommunikationstechnologien Schritt halten kann, mussten und müssen Konzepte zur Gestaltung von Online-Wörterbüchern neu überdacht werden. Der vorliegende Beitrag setzt sich zum Ziel, durch den Vergleich von ausgewählten Print- und Online-Wörterbüchern Anregungen für neuartige Konzepte zu geben. Die in den 1970er Jahren geprägten Begriffe der wörterbucheigenen Makro- und Mikrostruktur sind zum wichtigen Instrument der Wörterbuchanalyse geworden; es ist dadurch möglich, Wörterbücher unter einheitlichen formalen Kriterien zu behandeln, bestimmte Strukturmuster festzustellen und zu beschreiben und ebenso nach der Konzipierung neuer, möglicherweise effizienterer Wörterbuchstrukturen zu forschen. Auch der vorliegende Beitrag arbeitet mit der tradierten Begrifflichkeit: Gegenstand der Ausführungen sind Makrostrukturen in ausgewählten einsprachigen Print- und Online-Wörterbüchern der deutschen Sprache. Zuerst werden Begriffe der Makrostruktur, der Zugriffsstruktur und der Wörterbuchaußentexte festgelegt. Sodann erfolgt der Vergleich der Bauteile außerhalb des zentralen Wörterverzeichnisses und der makrostrukturellen Anordnung in Printwörterbüchern (PWB) und OnlineWörterbüchern (OWB). Anschließend wird auf Möglichkeiten zur Überwindung von vorherrschender alphabetischer Anordnung der Makrostrukturen eingegangen.
2 Festlegung wichtiger Begriffe Nach Engelberg/Lemnitzer (2009: 134) besteht ein Wörterbuch aus vier zentralen Strukturen: der Makrostruktur bzw. dem Wörterverzeichnis, der Mikrostruktur bzw. der dem Lemma zugeordneten Menge von Angaben, dem Verweissystem und den Wörterbuchaußentexten. Wichtig in diesem Beitrag sind die Begriffe der Makrostruktur, der Zugriffsstruktur und der Wörterbuch(außen)texte.
Milka Enčeva: Universität Maribor, Philosophische Fakultät, Abteilung für Germanistik, Koroška c. 160, 2000 Maribor, Slowenien, [email protected] https://doi.org/10.1515/9783110598650-004
58
Milka Enčeva
PWB werden als Textverbunde mit interner Intertextualität ihrer Teiltexte betrachtet, weil sie aus Textträgern mit aufeinander bezogenen Texten bestehen. Eine Übersicht über die wichtigsten Texte bzw. Bauteile eines modernen PWB findet man in Wiegand et al. (2010: 25 ff.); die Diskussion bezieht sich vor allem auf allgemeine einsprachige Wörterbücher. Auf der obersten Ebene der textuellen Zerlegung wird zwischen Wörterbuchverzeichnis(sen) und Umtexten unterschieden. Die Umtexte vor dem zentralen Wörterverzeichnis bzw. vor den Wörterverzeichnissen werden als Vorspann und nach ihm bzw. nach ihnen als Nachspann bezeichnet. Mit Ausnahme des Vorwortes wird nicht festgelegt, welche Umtexte eines PWB im Vorspann und welche im Nachspann platziert werden sollen. Wenn ein Wörterbuch sowohl einen Vorspann als auch einen Nachspann hat, verfügt es über einen textuellen Rahmen und die dazugehörigen Umtexte werden auch Rahmentexte genannt. Zu den obligatorischen Teilen eines PWB gehören der Vorspann und mindestens ein Wörterverzeichnis. Eine Einteilung der Umtexte, die für die weiteren Ausführungen in diesem Beitrag von Bedeutung ist, wird nach deren Verhältnis zur genuinen Funktion eines PWB vorgenommen. Die genuine Funktion von Vorspanntexten wie jene der Inhaltsübersicht, des Vorworts und der Benutzungshinweise besteht darin, die Benutzer allgemein über das jeweilige Wörterbuch zu informieren. Demzufolge sind sie nicht direkt in die genuine Funktion des PWB integriert, die darin besteht, Informationen über sprachliche Ausdrücke des Wörterbuchgegenstands zu vermitteln. Solche Texte nennt man nichtintegrierte Umtexte. Im Gegensatz dazu werden Umtexte wie z. B. die Wörterbuchgrammatik in die genuine Funktion des PWB integriert, weil der Benutzer damit Informationen über sprachliche Ausdrücke des Wörterbuchgegenstandes erschließen kann; dementsprechend bezeichnet man sie als integrierte Umtexte (vgl. Wiegand 2010: 26 f.). Der Zugang zu den lexikographischen Daten und damit die Nachschlagbarkeit werden durch Zugriffsstrukturen ermöglicht. Die äußeren Zugriffsstrukturen sind ein obligatorischer Bauteil eines Wörterbuchs. Die alphabetische Makrostruktur bestimmt die äußere Ordnung im Wörterverzeichnis eines alphabetischen Wörterbuchs. Wenn ein alphabetisch geordnetes Wörterbuch über nur eine äußere Zugriffsstruktur verfügt, fallen die alphabetische Makrostruktur und die äußere Zugriffstruktur zusammen und die Makrostruktur wird als monoalphabetisch bezeichnet. Gibt es in einem Wörterbuch mehrere Wörterverzeichnisse, bestimmt die alphabetische Makrostruktur die äußere Ordnung in mehreren Wörterverzeichnissen. Diese Makrostruktur weist mehrere alphabetische äußere Zugriffsstrukturen als ihre makrostrukturellen Teilstrukturen auf und wird als polyalphabetisch bezeichnet (ebenda: 63). Das Forschungsinteresse im vorliegenden Beitrag gilt den alphabetischen Makrostrukturen, die im Kulturraum der Alphabetschriften die verbreitetsten Makrostrukturen sind. Ihre allgemeine genuine Funktion, die sie von alphabetischen äußeren Zugriffsstrukturen unterscheidet, besteht darin, dass „sie die wörterbuchtypspezifische makrostrukturelle Abdeckung des Wörterbuchs vollständig anzeigt“ (ebenda). Im Gegensatz zu der mikrostrukturellen Abdeckung weist die makrostrukturelle
Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich
59
Abdeckung einen wesentlich größeren Anteil der lexikographischen Abdeckung auf. Die alphabetische Makrostruktur wird verstanden als „die geordnete Menge aller derjenigen alphabetischen äußeren Zugriffsstrukturen, deren äußere Zugriffstextelemente zur wörterbuchtypspezifischen makrostrukturellen Abdeckung einen Beitrag leisten“ (ebenda). Neben dem alphabetisch geordneten Wörterverzeichnis kann in einem PWB z. B. ein alphabetisch geordnetes Verzeichnis der Affixe auch eine makrostrukturelle Zugriffsstruktur aufweisen, weil Letzteres einen Beitrag zur wörterbuchtypspezifischen makrostrukturellen Abdeckung leistet. Eine Wörterbuchgrammatik stellt zwar einen integrierten Umtext dar, weil sie Informationen über die sprachlichen Ausdrücke des Wörterbuchgegenstands enthält, verfügt aber über eine nichtmakrostrukturelle (numerische) Umtextzugriffsstruktur, denn sie dient nicht der wörterbuchtypspezifischen makrostrukturellen Abdeckung. In Kunze/Lemnitzer (2007) und Engelberg/Lemnitzer (2009) wird die Makrostruktur nicht als geordnete Menge bestimmter Zugriffsstrukturen wie in WLWF (2010) definiert, sondern als „die Menge seiner Lemmata und die Ordnung, die über sie gelegt wird“ (Engelberg/Lemnitzer 2009: 143). Diese Definition bezieht sich hauptsächlich auf das Wörterverzeichnis bzw. auf die Wörterverzeichnisse und wird von Kunze/Lemnitzer (2007: 79) damit begründet, dass sie für die Computerlexikographie angemessener sei. Es ginge in diesem Fall um lexikalische Ressourcen, bei denen die Verbindung des Wörterverzeichnisses zu anderen Bestandteilen weniger klar sei. Im vorliegenden Beitrag wird die Makrostruktur gemäß WLWF (2010) als geordnete Menge von bestimmten Zugriffsstrukturen behandelt und nicht etwa als geordnete Menge von Lemmata. Lemmata sind Elemente von Zugriffsstrukturen und die geordnete Menge von Zugriffsstrukturen macht die Makrostruktur aus. Es mag stimmen, dass die Beziehungen zwischen Wörterverzeichnis(sen) und anderen Bestandteilen eines digitalen Wörterbuchs noch nicht gut erforscht sind, dennoch ist das kein Grund dafür, die Makrostruktur anhand der Lemmata zu definieren. U. E. ist es sinnvoll, bei der Definition der Makrostruktur von ihrer genuinen Funktion auszugehen und somit die wörterbuchtypspezifische makrostrukturelle Abdeckung des Wörterbuchs anzuzeigen (vgl. Wiegand 2010: 63). Außerdem kann aufgrund dieser Funktion zwischen Makro- und Zugriffsstruktur klar unterschieden werden.
3 Bauteile von PWB und OWB außerhalb des zentralen Wörterverzeichnisses Da die vorliegende Untersuchung keine Repräsentativität anstrebt, werden die Bauteile von PWB und OWB außerhalb des zentralen Wörterverzeichnisses exemplarisch anhand des Printwörterbuchs PONS Grosswörterbuch Deutsch als Fremdsprache (2015) und des PONS Online-Wörterbuchs Deutsch als Fremdsprache behandelt und miteinander verglichen.
60
Milka Enčeva
3.1 Bauteile des Printwörterbuchs PONS Grosswörterbuch Deutsch als Fremdsprache (2015) außerhalb des zentralen Wörterverzeichnisses PONS Grosswörterbuch Deutsch als Fremdsprache (2015) weist eine für ein PWB typische Struktur mit linearer Anordnung der Wörterbuchumtexte auf. Es besteht aus einem Vorspann, einem zentralen Wörterbuchverzeichnis und einem Nachspann. Der Vorspann besteht aus vier vorangestellten nichtintegrierten Umtexten (Titel, Inhaltsübersicht, Vorwort und Hinweise für die Benutzung), aus zwei vorangestellten integrierten Umtexten (Streifzug durch die deutsche Sprache und Regelteil zur Rechtschreibung und Zeichensetzung). Im Rahmen des Streifzugs durch die deutsche Grammatik gibt es ein alphabetisch geordnetes Verzeichnis der aus dem Griechischen und dem Latein entlehnten Wortbildungselemente, das über eine alphabetische makrostrukturelle äußere Zugriffsstruktur verfügt. Man kann dieses Verzeichnis als einen Einschub mit makrostruktureller äußerer Zugriffsstruktur betrachten, weil es innerhalb eines Umtextes vorliegt. Der Regelteil zur Rechtschreibung und Zeichensetzung weist eine nichtmakrostrukturelle numerische äußere Zugriffsstruktur auf. Die integrierten Umtexte mit äußerer Zugriffsstruktur ermöglichen dem Benutzer, gezielt nach lexikographischen Daten zu suchen. Darauf folgt das Wörterverzeichnis1 mit der alphabetischen Hauptzugriffsstruktur, das in einem PWB der wichtigste lexikographische Teiltext ist. Auf die Anordnungsform innerhalb der makrostrukturellen Zugriffsstrukturen wird im folgenden Kapitel näher eingegangen. Im Nachspann liegen zwei nachgestellte integrierte Umtexte (Deutsche Kurzgrammatik und Liste der wichtigsten unregelmäßigen Verben) vor. Die alphabetischen Listen mit Aufzählung der Bundesländer und deren Hauptstädte in Deutschland und Österreich sowie die Liste mit Aufzählung der Kantone und deren Hauptorte in der Schweiz können als nachgestellte alphabetische makrostrukturelle Zugriffsstrukturen betrachtet werden. Das PWB PONS Grosswörterbuch Deutsch als Fremdsprache (2015) weist eine polyalphabetische Makrostruktur auf, weil es mehrere Wörterverzeichnisse mit alphabetischen äußeren Zugriffsstrukturen als makrostrukturellen Teilstrukturen der alphabetischen Makrostruktur enthält. Da die Umtexte mit Zugriffsstrukturen nicht unmittelbar vor bzw. nach dem Wörterverzeichnis mit der Hauptzugriffsstruktur
1 An dieser Stelle muss darauf hingewiesen werden, dass das Wörterverzeichnis eines PWB nicht nur Wörter enthalten kann, sondern auch Affixe, Abkürzungen, Buchstaben, Mehrwortlexeme; aus diesem Grund ist es nicht wortwörtlich zu verstehen. Nach Wiegand (2010: 27) lässt sich diese Bezeichnung damit rechtfertigen, dass die meisten Eintragseingänge der Wörterbuchartikel Wörter sind.
Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich
61
stehen, wird die polyalphabetische Makrostruktur in diesem Wörterbuch als diskontinuierlich bezeichnet und durch Abbildung 1 schematisch dargestellt.2
vorangestellter nichtintegrierter Umtext (Titel) vorangestellter nichtintegriert Umtext (Inhaltsübersicht)
VORSPANN
vorangestellter nichtintegrierter Umtext (Vorwort) vorangestellter nichtintegrierter (Hinweise für die Benutzung) vorangestellter integrierter Umtext Einschub mit makrostruktureller Zugriffstruktur vorangestellter integrierter Umtext mit nicht makrostruktureller numerischer Zugriffsstruktur
Wörterverzeichnis mit Hauptzugriffsstruktur
nachgestellter integrierter Umtext (Deutsche Kurzgrammatik) NACHSPANN
nachgestellter integrierter Umtext (Liste der wichtigsten unregelmäßigen Verben) drei nachgestellte integrierte Umtexte mit makrostrukturellen Zugriffsstrukturen
Abb. 1: Bauteile des Printwörterbuchs PONS Grosswörterbuch Deutsch als Fremdsprache (2015) mit diskontinuierlicher polyalphabetischer Makrostruktur.
2 Die Abbildung lehnt sich an die Abbildung eines allgemeinen Makrostrukturbildes zum Typ der diskontinuierlichen polyalphabetischen Makrostruktur in Wiegand (2010: 65) an, sie unterscheidet sich aber in bestimmten Punkten davon, weil sie die Bauteile eines konkreten PWB veranschaulicht.
62
Milka Enčeva
3.2 Bauteile von PONS Online-Wörterbuch Deutsch als Fremdsprache außerhalb des zentralen Wörterverzeichnisses Ein Online-Wörterbuch ist in eine Benutzeroberfläche eingebunden, auf der gleichzeitig sowohl die in den PWB als Umtexte bezeichneten Wörterbuchtexte als auch das Wörterverzeichnis präsentiert werden. Dadurch wird die Linearität eines PWB aufgelöst und die Einteilung in Vorspann, Wörterverzeichnis und Nachspann erübrigt sich. Die Benutzeroberfläche stellt keine textuelle Rahmenstruktur dar, weil sie kein Text ist. Sie kann als nichttextuelle Rahmenstruktur angesehen werden. Statt einer Präsentation der Texte außerhalb des zentralen Wörterverzeichnisses in linearer Abfolge wie im PWB werden in einem OWB diese Texte bzw. die Verweise zu diesen Texten gleichzeitig auf der Benutzeroberfläche präsentiert. Wie die Benutzeroberfläche gestaltet wird, welche und wo die Texte außerhalb des zentralen Wörterverzeichnisses präsentiert werden, ist von Wörterbuch zu Wörterbuch unterschiedlich. Im OWB Elexiko werden auf der Benutzeroberfläche, wenn ein Wörterbuchartikel präsentiert wird, auch ein Teil der Lemmaliste als Laufleiste, die Suchmaske, Links zu Texten wie Benutzungshinweisen, Glossar u. a. simultan angezeigt. In PONS Online-Wörterbuch Deutsch als Fremdsprache erscheinen bei der Präsentation eines Wörterbuchartikels auf der Bildschirmoberfläche auch die Suchmaske und mehrere Rubriken, unter ihnen die als Hilfe bezeichnete Rubrik zu den Benutzungshinweisen. Es sei anzumerken, dass die Benutzeroberfläche in diesem OWB nicht als benutzerfreundlich verstanden werden kann. Die Rubrik zu den Benutzungshinweisen ist ganz unten auf der Benutzeroberfläche neben Datenschutzerklärung und Nutzungsbedingungen platziert, was in anderen Wörterbüchern nicht der Fall ist und was wegen ihrer wichtigen Funktion bei der Benutzung eines Wörterbuchs nicht zu erwarten ist. Ihre zu allgemeine Bezeichnung als Hilfe macht sie noch schwer auffindbar. Dies ist umso erstaunlicher, weil das beobachtete Wörterbuch als Lernwörterbuch konzipiert ist. Durch die simultane Präsentation von Texten bzw. Links zu jeweiligen Texten bieten die OWB mehrere und benutzerfreundlichere Gestaltungsmöglichkeiten als PWB an. Man kann eine allgemeine Übersicht über die im OWB angebotenen Texte, Listen und andere Nachschlagewerke bekommen, wenn man sich am Anfang die Benutzeroberfläche genau ansieht. Während im PWB das Blättern in einer alphabetisch geordneten Lemmaliste die einzige mögliche Nachschlagehandlung ist und eine hohe Nachschlagekompetenz erforderlich ist, stehen in einem OWB dem Benutzer verschiedene Suchmodi zur Verfügung, die die Suche leichter und effizienter machen. Untersuchungsergebnisse der Wörterbuchbenutzungsforschung zeigen, dass das Nachschlagen in PWB unbeliebt ist (vgl. Hulstijn/Hollander/Greidanus 1996) und die Wörterbuchbenutzer öfter in einem Wörterbuch nachschlagen, wenn eine elektronische Version vorliegt (vgl. Guillot/Kenning 1994; Nesi 2000). Texte, die im Vor- und Nachspann eines PWB zu finden sind, sind auch in OWB enthalten. Die entsprechenden Inhalte sind in PWB und OWB sehr ähnlich. Darauf
Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich
63
wird im Folgenden nicht näher eingegangen, weil dies den Rahmen des Beitrags sprengen würde. Außerdem kommen in OWB möglicherweise Benutzerforen, Blogs (so z. B. in PONS Wörterbuch Deutsch als Fremdsprache), Rubriken wie Wort des Tages (so z. B. in DWDS, Duden Online) vor, die nur über Internet und in einem Ausbauwörterbuch möglich sind. So können Wörterbücher aber flexibel und aktuell sein.
4 Makrostrukturelle Anordnung Die Makrostrukturen können in formgeprägte und nichtformgeprägte eingeteilt werden (vgl. WLWF 2010). Wie der Bezeichnung zu entnehmen ist, werden formgeprägte Makrostrukturen nach Eigenschaften schriftlich festgelegter sprachlicher Formen angeordnet. Die meist verbreiteten unter ihnen sind die alphabetischen Makrostrukturen. Wörterbücher, die solche Makrostrukturen aufweisen, heißen alphabetische Wörterbücher. Die Anordnung der nichtformgeprägten Makrostrukturen erfolgt nicht aufgrund der Eigenschaften der schriftlichen sprachlichen Formen, sondern aufgrund ihres Gebrauchs. Es geht um nichtalphabetische Makrostrukturen, die als systembezogene, semantische, begriffliche oder thematische Makrostrukturen oder als Makrostrukturen nach Sachgruppen bezeichnet werden. Wörterbücher, in denen sie vorkommen, werden begrifflich-semantische Wörterbücher, onomasiologische Wörterbücher oder Sachgruppenwörterbücher genannt (vgl. Wiegand 2010: 67, 87). Wenn sich die makrostrukturelle Anordnung der Lemmata nach der Abfolge der Buchstaben im jeweiligen Lemma in Schriftrichtung orientiert, geht es um initialalphabetische Makrostrukturen. Wenn sich die makrostrukturelle Anordnung der Lemmata nach der Abfolge der Buchstaben im jeweiligen Lemma entgegen der Schriftrichtung orientiert, werden die Makrostrukturen als finalalphabetisch bezeichnet (vgl. Engelberg/Lemnitzer 2009: 146). Die meisten PWB weisen eine initialalphabetische Makrostruktur auf. Wenn bei der makrostrukturellen Anordnung die festgelegte alphabetische Reihenfolge ohne Ausnahmen befolgt wird, werden die Makrostrukturen als striktinitialalphabetisch bezeichnet. Striktinitialalphabetische Makrostrukturen, deren Lemmata ständig am Anfang der ersten Zeile eines Wörterbuchartikels stehen, werden glattalphabetisch genannt. Dank dieser Positionierung der Lemmata entsteht eine vertikale Gesamtlemmastrecke, die die Suche erleichtert, sodass die entsprechenden Wörterbücher durch kurze Benutzungsdauer und hohen Grad an Auffindbarkeit der gesuchten Daten gekennzeichnet sind und als benutzerfreundlich gelten. Jedes Lemma verfügt über seinen eigenen Textblock, wodurch aber viel Druckplatz ungenutzt bleibt. Demzufolge steigen die Kosten und die Wörterbücher werden zu teuer. Die Verlage versuchen zu sparen, indem Informationen in der Mikrostruktur ausgelassen werden, was sich nachteilig auf die Qualität der Wörterbücher auswirkt. Der größte Nachteil der glatt-
64
Milka Enčeva
alphabetischen makrostrukturellen Anordnung besteht darin, dass dabei inhaltliche Zusammenhänge von aufeinander folgenden Lemmata nicht berücksichtigt werden. Diese können jedoch durch Nischen- oder Nestbildung veranschaulicht werden. Bei der Nischenbildung geht es auch um eine striktalphabetische makrostrukturelle Anordnung wie bei der glattalphabetischen. Wörterbuchartikel zu Lemmata, die aufeinander folgen und inhaltlich zusammengehören, werden zu einem Textblock zusammengeschlossen und dadurch für den Benutzer kenntlich gemacht. Im Vergleich zu der glattalphabetischen makrostrukturellen Anordnung ist die nischenalphabetische nicht so platzaufwändig, die Suche nach den lexikographischen Daten dauert aber länger und der Grad an Auffindbarkeit ist niedriger. Als ihr größter Vorteil gilt die Kennzeichnung inhaltlicher Beziehungen zwischen aufeinander folgenden Lemmata. Bei der Nestbildung werden Wörterbuchartikel auch zu einem Textblock wie bei der Nischenbildung zusammengerückt, dennoch bleibt die striktalphabetische Anordnung der Lemmata innerhalb des Artikelnestes nicht erhalten. Im Vordergrund stehen die inhaltlichen Beziehungen zwischen den Lemmata im Nest. Dies ist neben der durch die Nestbildung gesparten Druckfläche ihr größter Vorteil. In einem PWB mit nestalphabetischer makrostruktureller Anordnung suchen die Benutzer nach lexikographischen Daten am längsten und der Grad an Auffindbarkeit ist am niedrigsten, sodass sie als nicht besonders benutzerfreundlich angesehen werden (vgl. Wiegand 1989). An den Änderungen der makrostrukturellen Anordnung des Duden GrossWör terbuch in den Auflagen von 1976 bis 1999 kann man feststellen, welche Prioritäten bei der Erstellung des Wörterbuchs über die Jahre gesetzt wurden. Während die sechsbändige Auflage 1976 eine nestalphabetische makrostrukturelle Anordnung aufweist, liegt in der achtbändigen zweiten Auflage 1993 eine nischenalphabetische makrostrukturelle Anordnung vor, die in der zehnbändigen Auflage 1999 durch eine glattalphabetische makrostrukturelle Anordnung ersetzt wurde. Offensichtlich gilt die Benutzerfreundlichkeit (kurze Benutzungsdauer und hoher Grad an Auffindbarkeit lexikographischer Daten) als oberste Priorität. So kann auch die Tatsache erklärt werden, dass die Lernerwörterbücher für Deutsch als Fremdsprache der großen deutschen Verlage, wie etwa PONS Kompaktwörterbuch Deutsch als Fremdsprache (2005), PONS Grosswörterbuch Deutsch als Fremdsprache (2015) und Langenscheidt Grosswörterbuch Deutsch als Fremdsprache (2015) eine glattalphabetische makrostrukturelle Anordnung aufweisen.3 Die Ausführungen in Kapitel 4 beziehen sich auf die bislang bestehende Theorie der Wörterbuchform, die zum größten Teil printorientiert ist. Da drängt sich die Frage auf, ob diese Theorie der Wörterbuchform auch für die Beschreibung der Form von Wörterbüchern auf digitalen Darstellungsmedien geeignet ist. Nach Wiegand (2010:
3 Auf die glattalphabetische makrostrukturelle Anordnung in PONS Kompaktwörterbuch Deutsch als Fremdsprache (2005) wird in Kapitel 5 näher eingegangen.
Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich
65
81) „dürfte in Bezug auf digitale Wörterbücher das Konzept der Makrostruktur [problematisch] werden“. Dies wird damit begründet, dass bei der Präsentation der lexikographischen Daten eine Anordnung von Lemmata keine Rolle mehr spielen müsse, denn eine Ordnung zugriffsrelevanter Einheiten bestehe nur auf dem elektronischen Datenträger. Auf diese Daten greife nicht der Benutzer direkt zu, wie dies beim Nachschlagen in einem PWB der Fall sei, sondern darauf werde durch Suchwerkzeuge zugegriffen. Dem kann man zustimmen, wenn es darum geht, bei der Wörterbucherstellung die Daten von ihrer konzeptionellen Printfixierung zu lösen und sie für geeignete Präsentationsformen auf digitalen Medien aufzubereiten. Aus Benutzersicht ist es wichtig, wie die lexikographischen Daten auf der Benutzeroberfläche präsentiert werden können. Dank des digitalen Darstellungsmediums kann die Anordnung der Daten variieren. Möglich wären etwa initialalphabetische, finalalphabetische, phonologische und inhaltlichen Kriterien folgende Makrostrukturen, so Engelberg/Lemnitzer (2009: 149). Es erfolgt eine exemplarische Auseinandersetzung mit den Suchzielen und Suchmöglichkeiten in PONS Online-Wörterbuch Deutsch als Fremdsprache, um zu überprüfen, inwieweit in diesem OWB von den Möglichkeiten des digitalen Mediums Gebrauch gemacht wird. Während in einem PWB der Benutzer nachschlagen muss, um den Wörterbuchartikel zu finden, dessen Leitelement das von ihm gesuchte Lemma ist, tippt der Benutzer eines OWB nur das gesuchte Lemma in eine Suchmaske ein und das Ergebnis wird auf der Benutzeroberfläche präsentiert. In PONS OnlineWörterbuch Deutsch als Fremdsprache kann außer nach Lemmata auch nach Phrasemen gesucht werden. Möglich sind noch eine schreibungstolerante, eine flexionsformbasierte und eine inkrementelle Suche. Man kann sich auch die Liste mit den Lemmata ansehen, die sich in der Umgebung des Suchbegriffs befinden. Unter dem Fenster mit dem Suchbegriff werden der Anfangsbuchstabe und eine Buchstabenkombination vom Lemmaanfang angegeben. Mit dem Klick auf eine der beiden Möglichkeiten erhält man die entsprechende Liste. Sog. Beispielsätze aus dem Internet kann man potentiell einblenden. Jeder Wörterbuchartikel ist mit entsprechenden Artikeln in kostenlosen Wörterbüchern und Enzyklopädien verlinkt, sodass man direkt vom PONS-Artikel zum Artikel in einem anderen Nachschlagewerk gelangt, um dort weiter nach sachlichen oder sprachlichen Informationen suchen zu können. Trotz der aufgezählten neuen Suchmöglichkeiten wird im OWB PONS Deutsch als Fremdsprache von wichtigen, bereits etablierten Techniken kein Gebrauch gemacht, wie z. B. die Volltextsuche, die textbasierte wörterbuchexterne Suche, die bildbasierte onomasiologische Suche u. a. Im Weiteren werden Möglichkeiten gezeigt, die vorherrschende Abhängigkeit von der alphabetischen Anordnung der Makrostrukturen in PWB und OWB zu überwinden.
66
Milka Enčeva
5 Möglichkeiten zur Überwindung der Abhängigkeit von der alphabetischen Anordnung der Makrostrukturen Die meisten PWB in der deutschsprachigen Lexikographie weisen eine Makrostruktur auf, die auf dem formalen Kriterium der alphabetischen Reihenfolge der Buchstaben beruht und keine gute Abbildung unseres lexikalischen Wissens ermöglicht (vgl. Engelberg/Lemnitzer 2009). Aus diesem Grund weist Wiegand auf die „totale Herrschaft des Alphabets“ hin, wodurch Wortschatzstrukturen zertrümmert würden und schlägt vor, die „onomasiologische Blindheit der alphabetischen Wörterbücher“ durch passende Kodifikationsverfahren zu beseitigen (Wiegand 1977: 102). In PWB wurde versucht, die alphabetische Anordnung der Makrostruktur zu durchbrechen, indem am Ende der Wörterbuchartikel oder am Ende jeder Bedeutungsposition Wortbildungsprodukte des entsprechenden Lemmas angeführt wurden. So wird z. B. im PWB Langenscheidt Grosswörterbuch Deutsch als Fremdsprache (1993), Wörterbuch Deutsch als Fremdsprache (Kempcke 2000), PWB PONS Kompaktwörterbuch Deutsch als Fremdsprache (2005) und PWB PONS Grosswörterbuch Deutsch als Fremdsprache (2015) vorgegangen.
Abb. 2: Wörterbuchartikel zum Lemma Abfall aus PONS Kompaktwörterbuch Deutsch als Fremdsprache (2005).
Abb. 3: Wörterbuchartikel zum Lemma Abfall aus PONS Online-Wörterbuch Deutsch als Fremdsprache.
Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich
67
Wie aus Abb. 2 und Abb. 3 ersichtlich, werden am Ende des Wörterbuchartikels zum Lemma Abfall Komposita mit diesem Lemma als Bestimmungs- und/oder als Grundwort angeführt.
Abb. 4: Wörterbuchartikel zum Lemma Abfall in der 2. Version der DWDS-Webseite.
Abb. 5: Wörterbuchartikel zum Lemma Abfall in der 3. Version der DWDS-Webseite.
68
Milka Enčeva
Ähnlich wie in PONS Online-Wörterbuch Deutsch als Fremdsprache wurden in der 2. Version der DWDS-Webseite (Abb. 4) am Ende eines Wörterbuchartikels Komposita mit dem entsprechenden Lemma als Bestimmungs- und als Grundwort angeführt. In der neusten 3. Version (2016) (Abb. 5) wird zwischen den Angaben zur Grammatik und Worttrennung am Anfang des Wörterbuchartikels und der Bedeutungsangabe eine Angabe zur Wortbildung eingeführt. Es werden je ein Kompositum mit dem entsprechenden Lemma als Erst- und Zweitglied angeführt, alle weiteren Komposita werden ausgeblendet und auf sie wird nur mit der Angabe ihrer Zahl verwiesen. Die Darstellung der Komposita am Ende des entsprechenden Wörterbuchartikels erinnert an die Vorgehensweise in PWB, in denen das Printmedium keine weiteren Möglichkeiten anbieten konnte. Wie dies mit den durch das digitale Medium geschaffenen Möglichkeiten geändert werden kann, wird in der 3. Version (2016) der DWDS-Webseite gezeigt (Abb. 5). In die Mikrostruktur werden Daten aufgenommen, ohne dass sie überlastet wird, weil der Benutzer Angaben, die in der realen Mikrostruktur vorhanden sind, in der virtuellen Mikrostruktur einblenden bzw. ausblenden kann. Im OWB Elexiko ist die Mikrostruktur modular aufgebaut. Die Wortbildungsprodukte werden in einem gleichnamigen Modul präsentiert.
Abb. 6: Wörterbuchartikel zum Lemma Abfall im OWB Elexiko.
In der virtuellen Mikrostruktur sind nur die Namen der bestehenden Module aufgeführt und mit dem Klick auf den entsprechenden Namen kommt man zu den Daten des Moduls. Im Modul Wortbildungsprodukte werden sowohl Komposita als auch Derivate präsentiert. Während die Zugehörigkeit von Wortbildungsprodukten zur Wortfamilie
Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich
69
des Artikellemmas in PWB durch nischen- und nestalphabetische Anordnung der Makrostruktur angezeigt wird, wird dies in OWB wie Elexiko dank des modularen Aufbaus der Mikrostruktur innerhalb der Mikrostruktur vorgenommen. Daraus lässt sich schließen, dass in OWB bei der Überwindung der vorherrschenden alphabetischen Anordnung nicht unbedingt die Makrostruktur geändert werden sollte. Eine weitere Möglichkeit der „totalen Herrschaft“ der alphabetischen Anordnung entgegenzuwirken besteht darin, der alphabetischen Zugriffsstruktur noch eine zusätzliche semantisch basierte Zugriffsstruktur anzuschließen. In Kempcke (2000) wird die semantisch basierte Zugriffsstruktur in die Wörterbuchaußentexte ausgelagert. Die Lemmata der Hauptzugriffsstruktur werden auch semantischen Wortfeldern zugeordnet. Von den glattalphabetisch geordneten Wörterbuchartikeln der Lemmata wird auf die gleichen Lemmata in einer nach zwölf Themenbereichen geordneten Zugriffsstruktur verwiesen. Die Themenbereiche werden dann weiter in 80 Wortfelder gliedert. Die einzelnen Felder werden in Gruppen nach der Wortartzugehörigkeit der Lemmata eingeteilt. Problematisch kann sich die Einteilung des Wortschatzes nach Themen erweisen, da es nicht nur eine einzige Einteilung, sondern mehrere geben kann, je nachdem, welche Kriterien der jeweiligen Einteilung zugrunde gelegt wurden. Die Suche im Wörterbuch ist zwar zeitaufwändig, dennoch werden bei deren Erstellung sowohl formale als auch inhaltliche Kriterien berücksichtigt. Die glattalphabetische makrostrukturelle Anordnung ermöglicht einen schnellen Zugriff zu den gesuchten Daten, weswegen das Wörterbuch besonders für die Textrezeption geeignet ist. Durch die begrifflich-thematische Anordnung der Makrostruktur kann man es auch bei der Textproduktion und der Erweiterung der sprachlichen Kompetenz gebrauchen. Darum kann Kempckes (2000) Wörterbuch Deutsch als Fremdsprache als polyfunktional betrachtet werden. Von der Möglichkeit, auf die Haß-Zumkehr (2001) vor Jahren hingewiesen hat, wird nur in Elexiko Gebrauch gemacht: Denkbar, aber m. W. noch nirgends ausprobiert oder ins Auge gefasst wäre die gleichzeitig semasiologische und onomasiologische Anordnung eines Wörterbuchs, wo Nutzer nach Bedarf zwischen beidem hin- und herschalten (Haß-Zumkehr 2001: 366).
Es gibt eine alphabetisch geordnete Liste aller Lemmata und Listen der Lemmata, deren Wörterbuchartikel redaktionell bearbeitet wurden, eine alphabetische Liste der Lemmata, deren Wörterbuchartikel redaktionell bearbeitet wurden und mit Illustrationen versehen sind, eine alphabetische Liste der Lemmata, deren Lesart(en) bestimmten Sachgruppen zugeordnet wurden, und eine alphabetische Liste der Wortgruppenartikel. In redaktionell bearbeiteten Wörterbuchartikeln weist die modular aufgebaute Mikrostruktur das Modul Gebrauchsbesonderheiten auf, wo die jeweilige Lesart einer der 13 im Elexiko enthaltenen Sachgruppen zugeordnet wird. Der Zugriff auf die begrifflich-thematische Zuordnung eines Lemmas bzw. dessen Lesart(en) ist über die jeweilige Mikrostruktur möglich. Es gibt außerdem eine Liste, wo man über
70
Milka Enčeva
die einzelnen Sachgruppen zu den ihnen zugeordneten Lemmata gelangen kann. Die Position des Lemmas im nach der alphabetischen Ordnung nacheinander folgenden Wörterbuchartikel und die Position desselben Lemmas innerhalb der jeweiligen Sachgruppe sind miteinander verlinkt, sodass man zwischen beiden hin- und herschalten kann, wie es Haß-Zumkehr (2001) beschreibt. Es ist zu erwarten, dass die semasiologische und onomasiologische Anordnung der Lemmata im selben Wörterbuch von den meisten OWB übernommen wird, denn so erweitern Wörterbücher ihre Funktionalität. In den Elexiko-Wortgruppenartikeln werden bestimmte Lesarten von zwei oder mehr redaktionell bearbeiteten Lemmata vergleichend beschrieben. Dargestellt werden sowohl Gemeinsamkeiten als auch Unterschiede ihrer Kollokationen, syntaktischer Konstruktionen und sinnverwandter Wörter. Die Gestaltung von Wortgruppenartikeln wäre besonders für Lernerwörterbücher und für Wörterbücher für Hinübersetzung geeignet, weil man solche Wörterbücher für die Erweiterung der Sprachkompetenz bzw. für die Textproduktion in der Fremdsprache gebraucht. Im Folgenden wird auf alphabetische Makrostrukturen mit zusätzlichem illustrationsbasierten Zugriff eingegangen. In PWB, darunter die Lerner-PWB der deutschen Verlage, werden Illustrationen in die Hauptzugriffsstruktur integriert (so z. B. im Langenscheidt Grosswörterbuch Deutsch als Fremdsprache 2015) oder als zusätzliche Zugriffsstruktur im Anhang ausgelagert (wie z. B. im Basiswörterbuch Deutsch als Fremdsprache 2013). In beiden Fällen führen Verweise von den entsprechenden Artikeln auf die in den Abbildungen illustrierten Lemmata. In den OWB bestehen noch bessere technische Möglichkeiten, die Bedeutungen nicht nur visuell, sondern multimedial, d. h. durch Bild, Ton und Videosequenzen zu veranschaulichen. In den Lerner-OWB gehören die Audiopräsentationen der Aussprache von Lemmata bereits zum Standard. In PONS Online-Wörterbuch Deutsch als Fremdsprache gibt es zurzeit4 leider nur Audiopräsentationen. In Elexiko dagegen gibt es auch mehrere Bilder bzw. Fotos zu ein und demselben Lemma. Der Zugriff auf die Bilder ist über die Mikrostruktur des jeweiligen Lemmas bzw. der jeweiligen Lesart des Lemmas möglich.
6 Zusammenfassung Makrostrukturen in PWB und OWB können nicht gleichgesetzt werden, denn die PWB-eigene Linearität wird in OWB aufgelöst. Auf der Benutzeroberfläche werden simultan verschiedene funktionale Elemente wie Suchmasken, Schaltflächen u. a. präsentiert, die Lemmaanordnung kann in verschiedener Weise variieren. Sowohl in 4 Früher war im Wörterbuchportal PONS auch ein Bildwörterbuch integriert, der nicht mehr zur Verfügung steht.
Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich
71
PWB als auch in OWB wurde bisher verschiedentlich versucht, der „totalen Herrschaft des Alphabets“ entgegenzuwirken. Dabei bieten die OWB neben der alphabetischen Anordnung viel mehr Möglichkeiten für die Gestaltung lexikographischer Daten an, um Beziehungen zwischen den einzelnen Lemmata auf verschiedenen sprachlichen Ebenen zum Ausdruck zu bringen. In der modular aufgebauten Mikrostruktur der Wörterbuchartikel werden z. B. Module für die Wortbildungsprodukte, für die sinnverwandten Wörter, für die Zuordnung des jeweiligen Lemmas bzw. seiner Lesarten einer begrifflich-thematischen Gruppe und für deren multimediale Illustrationen verwendet. Solche Veränderungen bei der Gestaltung der lexikographischen Daten führen dazu, dass eine klare Trennung zwischen Makro-, Mikrostruktur und Umtexten, die PWB kennzeichnet, in OWB nicht immer erkennbar ist.
Literatur Monografien und Aufsätze Engelberg, Stefan/Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4., überarbeitete und erweiterte Auflage. Tübingen: Stauffenburg. Guillot, Marie-Noëlle/Kenning, Marie-Madeleine (1994): Electronic monolingual dictionaries as language learning aids: A case study. In: Computers Education 23, 63–73. Haß-Zumkehr, Ulrike (2001): Deutsche Wörterbücher – Brennpunkt von Sprach- und Kulturgeschichte. Berlin/New York: De Gruyter. Hulstijn, Jan H./Hollander, Merel/Greidanus, Tine (1996): Incidental vocabulary learning by advanced foreign language students: The Influence of marginal glosses, dictionary use, and reoccurrence of unknown words. In: The Modern Language Journal 80, 327–339. Kunze, Claudia/Lemnitzer, Lothar (2007): Computerlexikographie. Eine Einführung. Tübingen: Narr. Nesi, Hilary (2000): Electronic dictionaries in second language vocabulary comprehension and acquisition: the state of the art. In: EURALEX 9, 839–847. Wiegand, Herbert Ernst (1977): Nachdenken über Wörterbücher: aktuelle Probleme. In: Drosdowski, Günther/Henne, Helmut/Wiegand, Herbert Ernst (Hrsg.): Nachdenken über Wörterbücher. Mannheim/Wien/Zürich: Bibliographisches Institut, 51–102. Wiegand, Herbert Ernst (1989): Aspekte der Makrostruktur im allgemeinen einsprachigen Wörterbuch: alphabetische Anordnungsformen und ihre Probleme. In: Hausmann, Franz Josef et al. (Hrsg.): Wörterbücher. Dictionaries. Dictionnaires. Ein Internationales Handbuch zur Lexikographie. 1. Teilband. Berlin/New York: De Gruyter, 371–409. Wiegand, Herbert Ernst (2010): Systematische Einführung. In: Wiegand, Herbert Ernst et al. (Hrsg.): Wörterbuch zur Lexikographie und Wörterbuchforschung. Bd. 1: Systematische Einführung, A–C. Berlin/New York: De Gruyter, 1–105.
72
Milka Enčeva
Wörterbücher Basiswörterbuch Deutsch als Fremdsprache = Duden – Basiswörterbuch Deutsch als Fremdsprache. Hrsg. von der Dudenredaktion. Berlin: Cornelsen/Duden, 2013. Duden-GWB1 = Duden Das große Wörterbuch der deutschen Sprache. In sechs Bänden. Hrsg.und bearb. vom Wissenschaftlichen Rat und den Mitarbeitern der Dudenredaktion unter Leitung von Günther Drosdowski. Mannheim/Wien/Zürich: Bibliographisches Institut, 1976–1981. Duden-GWB2 = Duden Das große Wörterbuch der deutschen Sprache. In acht Bänden. Hrsg. und bearb. vom Wissenschaftlichen Rat und den Mitarbeitern der Dudenredaktion unter Leitung von Günther Drosdowski. Mannheim/Wien/Zürich: Bibliographisches Institut, 1993–1995. Duden-GWB3 = Duden Das große Wörterbuch der deutschen Sprache. In zehn Bänden. Hrsg. und bearb. vom Wissenschaftlichen Rat und den Mitarbeitern der Dudenredaktion unter Leitung von Günther Drosdowski. Mannheim etc.: Bibliographisches Institut, 1999. DWDS = Digitales Wörterbuch der deutschen Sprache. 3. Version. Hrsg. von der BerlinBrandenburgischen Akademie der Wissenschaften, Berlin, 2016. [Unter: ; letzter Zugriff 1. 2. 2017]. Elexiko = Elexiko, ein Online-Wörteruch zur deutschen Gegenwartssprache. In: OWID – Online Wortschatz-Informationssystem Deutsch. Hrsg. von Institut für Deutsche Sprache, Mannheim. [Unter: ; letzter Zugriff 1. 2. 2017]. Wörterbuch Deutsch als Fremdsprache = Wörterbuch Deutsch als Fremdsprache. Hrsg. von Günter Kempcke. Berlin/New York: De Gruyter, 2000. Langenscheidt Grosswörterbuch Deutsch als Fremdsprache = Langenscheidt Großwörterbuch Deutsch als Fremdsprache: Deutsch-Deutsch (Einsprachige Wörterbücher). Hrsg. von Dieter Götz und der Redaktion Langenscheidt. München: Langenscheidt, 2015. Langenscheidt Grosswörterbuch Deutsch als Fremdsprache = Langenscheidt Großwörterbuch Deutsch als Fremdsprache – Buch mit Online-Anbindung: Deutsch-Deutsch (Einsprachige Wörterbücher). Auflage: Har/Psc. Hrsg. von Dieter Götz und der Redaktion Langenscheidt. München: Langenscheidt, 2015. PONS Grosswörterbuch Deutsch als Fremdsprache = PONS Großwörterbuch Deutsch als Fremdsprache – Mit Online-Wörterbuch und Drehscheibe „unregelmäßige Verben“. Bearbeitet von Prof. Dr. Werner Wolski unter Mitwirkung und Leitung der Redaktion PONS Wörterbücher. Stuttgart: PONS, 2015. PONS Kompaktwörterbuch Deutsch als Fremdsprache = PONS Kompaktwörterbuch Deutsch als Fremdsprache. Hrsg. von Susanne Balhar und Andreas Cyffka. Stuttgart: PONS, 2005. PONS Online-Wörterbuch Deutsch als Fremdsprache = PONS Online-Wörterbuch Deutsch als Fremdsprache. [Unter: ; letzter Zugriff 1. 2. 2017]. WLWF = Wörterbuch zur Lexikographie und Wörterbuchforschung. Bd. 1 A–C. Hrsg. v. Wiegand, Herbert Ernst et al. Berlin/New York: De Gruyter, 2010.
Monika Bielińska
Einige Überlegungen zu lexikographischen Kohärenzstrukturen 1 Einleitendes Selbst eine kurze Literaturrecherche ergibt, dass manche Wörterbuchstrukturen, wie etwa Makro-, Mikro-, Zugriffs- oder Mediostrukturen, oft Gegenstand metalexikographischer Überlegungen sind. Dies ist auch verständlich, weil gerade diese Strukturen traditionell zu den wichtigsten gerechnet werden, sowohl aus der Perspektive des Lexikographen als auch der des Benutzers. Die Kohärenzstruktur wird ausgesprochen selten in der Wörterbuchforschung behandelt. Die Kohärenz ist zwar einer der wichtigsten Begriffe der Textlinguistik und wird dort eingehend behandelt, aber die Textlinguistik befasst sich so gut wie nie mit Wörterbüchern. Das mangelnde Interesse an der Kohärenzproblematik in der Lexikographie scheint im Wiederspruch zu der Komplexität dieses Themas zu stehen. Im Folgenden wird eine skizzenartige Darstellung des Problems der lexikographischen Kohärenz angestrebt. Vorwegzuschicken ist, dass die grundlegenden Erkenntnisse zur lexikographischen Kohärenz nicht medienspezifisch sind. Sie betreffen die Print- und die online-Wörterbücher. Das bedeutet aber nicht, dass eine umfassendere Theorie – sollte es zukünftig eine solche geben – völlig medienunabhängig wäre. Den Ausgangspunkt der Überlegungen bildet die Feststellung, dass Wörterbuchartikel Texte und Wörterbücher Textverbunde sind. Danach wird ein kurzer Überblick über textlinguistische Kohärenzauffassungen gegeben und anschließend präsentiert, wie die Kohärenzproblematik in der Wörterbuchforschung behandelt wird. Die nächsten Teile des Beitrags konzentrieren sich auf wörterbuchspezifische Probleme der Kohärenzherstellung sowie auf die Frage, ob Kohärenzstrukturen wörterbuchartikelinterne Strukturen sind. Der Beitrag endet mit einem Schlusswort, das u. a. im Laufe der Diskussion nach dem Vortrag am Kolloquium zur Lexikographie und Wörterbuchforschung 2016 geäußerte Gedanken mit einbezieht.
Monika Bielińska: Uniwersytet Śląski, Instytut Filologii Germańskiej, ul. gen. St. Grota-Roweckiego 5, 41-205 Sosnowiec, Polen, [email protected] https://doi.org/10.1515/9783110598650-005
74
Monika Bielińska
2 Wörterbuchartikel als (Teil)Text und Wörterbuch als Textverbund Wörterbuchartikel sind Texte bzw. (Teil)Texte, und Wörterbücher sind Textverbunde (diese Feststellung bleibt hier unkommentiert, vgl. dazu Kammerer/Wiegand 1998: 224, Viehweger 1990: 139, Wiegand 1983: 49, 1988, 1996: 11). Demzufolge lassen sich Wörterbuchartikel und Wörterbücher nicht nur aus der lexikographischen, sondern auch aus der textlinguistischen Perspektive betrachten. Wörterbuchartikel und Wörterbücher sind strukturiert, (Teil)Texte des Verbundes stehen nicht nur in einer Präzedenzrelation zueinander, vielmehr beziehen sie sich aufeinander, bilden ein Gefüge (oder – um bei textlinguistischen Assoziationen zu bleiben – ein Gewebe), sie sind inhaltlich und funktional miteinander verbunden und in Bezug auf den Zweck des Wörterbuchs komplementär zueinander. Durch das Wörterbuch kommuniziert der Lexikograph mit dem Benutzer, und der Benutzer liest im Wörterbuch um Informationen zu gewinnen, die wiederum bei der Produktion oder Rezeption von anderen Texten, also weiterhin in der Kommunikation, nützlich sind. Wörterbücher werden jedoch nicht nur als Nachschlagewerke in konfliktbedingten Situationen verwendet, sondern auch als Lernwörterbücher zur Kompetenzerweiterung, d. h. als Hilfe beim Spracherwerb. Aber selbst beim üblichen, typischen Nachschlagen, wo nur auf ganz bestimmte Daten zugegriffen wird, ist das Verständnis des Zusammenhangs, in dem die gesuchten Daten stehen, für eine korrekte und effektive Nutzung des Wörterbuchs von Bedeutung. Die bewusste Wahrnehmung der Daten-Vernetztheit und die Fähigkeit zu einer umfassenderen, globalen Betrachtung der Wörterbuchinhalte sind eine Voraussetzung, eine Bedingung sine qua non für einen reflektierten und gekonnten Umgang mit dem Wörterbuch. Dies können nur der Lexikograph und der Benutzer zusammen gewährleisten. Der Erstere muss als Textproduzent dafür sorgen, den Text so zu gestalten, dass das Verständnis der Zusammenhänge möglichst leicht ist. Der Wörterbuchbenutzer dagegen hat bei der Wörterbuchbenutzung intellektuelle Arbeit zu leisten, deren Resultate u. a. von allgemeiner intellektueller Kapazität, Sprachkultur und -bewusstsein, Interesse, Motivation und nicht zuletzt von der Ausbildung, darunter auch von der Schulung in der Wörterbuchbenutzung, abhängen.
3 Kohärenzbegriff in der Textlingustik. Ein Überblick Der Begriff der Kohärenz gilt als einer der zentralen Begriffe der Textlinguistik. Seine Bestimmung erweist sich aber als recht problematisch, was die Vielfalt der Auffassungen deutlich erkennen lässt. Rickheit/Schade (2000: 277) weisen auf zwei potentielle Gefahren bei der Abgrenzung des Kohärenzbegriffs hin, nämlich dass er einerseits zu eng gefasst und dadurch mit dem Kohäsionsbegriff gleichgesetzt wird und ande-
Einige Überlegungen zu lexikographischen Kohärenzstrukturen
75
rerseits dass er „so allgemein gehalten wird, daß sein sprachlicher Charakter verloren geht“ (ebenda). Dies kann vorkommen, „wenn Kohärenz auf die Sachverhalte bezogen wird, die durch einen Text oder eine Äußerung behandelt werden“ (ebenda) oder wenn die kognitiven Aspekte der Sprachproduktion und -rezeption als vorrangig betrachtet werden und demzufolge der Kohärenzbegriff kein linguistischer, sondern ein psychologischer Begriff ist. Aber auch im linguistischen Rahmen unterscheiden sich die einzelnen Konzeptionen voneinander. Sie lassen sich drei Phasen zuordnen: der textgrammatischen, semantisch-thematischen und pragmatisch-funktionalen Phase (mehr dazu in Rickheit/Schade 2000: 277–278). Von grundlegender Bedeutung scheint in der Kohärenzdiskussion die Frage zu sein, ob man von Kohärenz im Text sprechen kann. In der Textlinguistik wird das Problem schon länger diskutiert (vgl. Vater 2001: 54). Es ist aber ebenfalls für lexikographische Untersuchungen von Belang. Zum einen wird Kohärenz als inhärente Eigenschaft von Texten betrachtet (vgl. Rickheit/Schade 2000: 275). Nach de Beaugrande/Dressler (1981: 5) „betrifft [Kohärenz] die Funktionen, durch die die Komponenten der Textwelt, d. h. die Konstellation von Konzepten (Begriffen) und Relationen (Beziehungen), welche dem Oberflächentext zugrundeliegen, für einander gegenseitig zugänglich und relevant sind.“ Als textimmanent sieht Kohärenz auch Harweg (1989) an. Zum anderen, wie etwa in Viehweger (1989) gilt Kohärenz als „Ergebnis der interpretativen Verarbeitung eines Textes innerhalb der Kognition eines Rezipienten“ (Vater 2001: 142). Gernsbacher/Givón (1995: vii) beziehen den Terminus Kohärenz auf die Sprachproduktion und -rezeption. In anderen Konzeptionen (vgl. Scherner 1994: 318, nach Vater 2001: 142) werden die genannten Auffassungen als komplementär, vereinbar betrachtet (Vater 2001: 142). Probleme in der terminologischen und begrifflichen Hinsicht bereitet auch der Umstand, dass die Textlinguistik nicht nur von der Bezeichnung Kohärenz, sondern auch von Kohäsion Gebrauch macht, also zwei Lexemen, die auf lateinisches cohaerere (dt. zusammenhängen) zurückgehen. Halliday/Hasan (1976) verwenden nur den Terminus cohesion, mit dem sie sich auch auf Phänomene beziehen, die von anderen Textlinguisten zur Kohärenz gerechnet werden (vgl. Rickheit/Schade 2000: 278, Vater 2001: 30). Givón (1995) und Kintsch (1995) sprechen dagegen nur von Kohärenz. Sie unterscheiden dabei lexikalisch bestimmte und strukturgeleitete Kohärenz, was der von Rickheit und Schade vorgenommenen Differenzierung zwischen Kohärenz und Kohäsion entspricht (vgl. Rickheit/Schade 2000: 280). Auch Brinker/Cölfen/Pappert (2014) gehen „von einem umfassenden Kohärenzkonzept“ aus mit der Begründung: „Der enge Zusammenhang zwischen expliziten (morphologisch-syntaktischen) und impliziten (semantisch-kognitiven) Formen textueller Kohärenz ist von Anfang an gesehen worden […]“ (ebenda: 18). Eine Unterscheidung zwischen Kohärenz und Kohäsion halten sie für unnötig. Nach Vater (2001: 30) dagegen „ist unbedingt zwischen Kohäsions- und Kohärenzbeziehungen zu unterscheiden“. Kohäsion wird als Zusammenhang von Textteilen definiert, der über die linguistischen Merkmale (die morphologischen, syntaktischen, seltener die phonologischen) vermittelt wird (vgl.
76
Monika Bielińska
Rickheit/Schade 2000: 276, Vater 2001: 31–36, de Beaugrande/Dressler 1981: 3–4, Hellwig 1984a: 54). Sie wird also als grammatische Abhängigkeiten aufgefasst, wobei es nach Vater „vorwiegend um satzübergreifende Relationen geht“ (Vater 2001: 30). In den Auffassungen, wo die Kohärenz und Kohäsion unterschieden werden, haben diese Phänomene nicht den gleichen Status bei der Bestimmung, ob ein gegebenes sprachliches Produkt Text ist, und auch nicht dieselbe Bedeutung für das Textverstehen. Als wichtigstes Textualitätskriterium gilt Kohärenz, die auch „trotz fehlender Kohäsion auftreten (kann)“ (Vater 2001: 40). Nach Vater sind „Kohäsionsmittel […] weder notwendig noch hinreichend für das Zustandekommen von Textstruktur. Notwendig und hinreichend für das Zustandekommen eines Textes sind Kohärenz-Beziehungen […]“ (Vater 2001: 54). Brinker/Cölfen/Pappert, die sich, wie oben erwähnt, nur des Begriffes der Kohärenz bedienen, behaupten, dass grammatische Verknüpfungssignale die Herstellung der Kohärenz unterstützen und steuern, dass sie aber „für das Textverstehen sogar weitgehend entbehrlich sein (können), wenn der Rezipient über ein ausreichendes thematisches und kontextuelles Hintergrundwissen verfügt. Das Kohärenzproblem ist somit nicht auf die grammatischen Verknüpfungsverfahren zu reduzieren. Die Herstellung der Kohärenz ist letztlich ein kognitiver Prozess. Diese Erkenntnis darf aber nicht dazu führen, dass die sprachlichen und kommunikativen Aspekte der Textkohärenz gänzlich aus dem Blickfeld geraten“ (Brinker/Cölfen/Pappert 2014: 43; vgl. auch Hellwig 1984a: 59). Textverstehen lässt sich in diesem Kontext als „ein Prozeß der mentalen Kohärenzbildung“ auffassen (Schnotz 2000: 497).
4 Zur Kohärenz in der Wörterbuchforschung Wie eingangs angedeutet, nimmt die Kohärenzproblematik einen äußerst bescheidenen Platz in der Wörterbuchforschung ein. Die wohl erste Behandlung dieses Themas enthält der Beitrag Wörterbuchartikel als Text von Herbert Ernst Wiegand (1988). Die Kohärenz wird hier als eine Art des Textzusammenhangs bestimmt, der aus Themen und Expositionen besteht (ebenda: 80). Das Thema wird „als das implizit Fragliche definiert […], das durch eine satzverbindende Frage Fi -> j explizit gemacht werden kann. Die Ausführungen zu einem Thema werden dann also in dem Satz j gemacht, und j zusammen mit den Sätzen, die Antworten sind auf Fragen, die sich ihrerseits aus dem Satz j ergeben, heißen Expositionen“ (ebenda). Die Zuordnung von Ausführungen zu Themen bildet die Kohärenz. Wiegand entwickelt seine Konzeption in Anlehnung an Hellwig (1984a), der „ein Fragliches“ als Ausgangspunkt für die Textherstellung ansieht (vgl. auch Quaestio in Klein/von Stutterheim 1987, 1991, nach Vater 2001: 125). Die Überlegungen zur Kohärenz, denen Betrachtungen über kohäsive Zusammenhänge im Wörterbuchartikel vorangehen (dies lässt sich als eine notwendige Vorstufe ansehen), beginnen mit der Fortführung des vorher geäußer-
Einige Überlegungen zu lexikographischen Kohärenzstrukturen
77
ten Gedankens, dass sich Lemmata als Titel1 auffassen lassen. Die enge Verbindung zwischen Titel und Textkohärenz macht die Einbeziehung des Lemmabegriffs in die Kohärenzdiskussion notwendig (vgl. Wiegand 1988: 85). Danach präsentiert Wiegand anhand zweier Wörterbuchartikel Methoden der Kohärenzanalyse. Die Kohärenzstrukturen werden mit Hilfe von Themabäumen dargestellt, zu denen es Legenden gibt, d. h. Liste der Fragen jeweils mit der Kennzeichnung der Angabe, die Antwort auf die Frage liefert (vgl. Wiegand 1988: 88–103). An die Arbeit von Wiegand (1988) knüpft Heidrun Gerzymisch-Arbogast (1989) an, die sich ebenfalls mit der Texthaftigkeit von standardisierten Wörterbuchartikeln und damit mit deren Kohärenz beschäftigt. Sie stützt sich auf de Beaugrandes und Dresslers (1981) Textbegriff und ihre Kriterien der Textualität. Kohärenz und Kohäsion versteht sie grundsätzlich im Sinne von de Beaugrande und Dressler (vgl. Gerzymisch-Arbogast 1989: 947), weist aber „der TRG [Thema-Rhema-Gliederung] eines Textes als textregulierendem und textkonstituierendem Prinzip eine vorrangige Stellung im Rahmen der Kohärenz“ (ebenda) zu. Daher versucht sie, Merkmale für die Texthaftigkeit von standardisierten Wörterbuchartikeln auf der Grundlage von Thema-Rhema-Analysen zu erarbeiten. Als Basis für die Analyse von zwei standardisierten Wörterbuchartikeln aus einsprachigen Wörterbüchern des Deutschen dienen hier das pragmatisch-formale Fächerfixierungsmodell von Mudersbach (1981) und das Modell der Hyperthema-Progression von Gerzymisch-Arbogast (1987) (vgl. Gerzymisch-Arbogast 1989: 947–948). In zwei weiteren Artikeln von Wiegand (1993, 1998a) wird zwar ebenfalls die Problematik des Textzusammenhanges aufgegriffen, jedoch gilt die Aufmerksamkeit vor allem Elementen des Oberflächentextes, d. h. dem, was man – trennt man Kohärenz und Kohäsion voneinander – Kohäsion nennt. In Wiegand (1993) werden unter diesem Aspekt die Beleggruppierung und der Belegtextschnitt in der Textlexikographie (am Beispiel des Fackel-Redensartenwörterbuchs) behandelt. Es wird erläutert, wann Belegtextschnitte kohäsionssensitiv sind und wann Belegtexte kohäsionsbeschränkend geschnitten sind sowie welche Belegtexte als kohäsiv gesättigt gelten (vgl. Wiegand 1993: 248–252). In Wiegand (1998a: 693–698) wird das Kohäsionsproblem bei der Exzerption bei historischen Sprachstadienwörterbüchern analog besprochen. Kohärenz wird in den erwähnten Artikeln nicht thematisiert.2 Dazu äußert sich Wiegand (1993) wie folgt: „Zum Belegschnitt und seinen Ergebnissen und insbesondere zum Thema ‚Belegtextschnitt und Textkohärenz‘, das ich bisher bewußt weitgehend ausgeklammert habe, wäre noch viel zu sagen“ (ebenda: 252). Für einen spannenden und schwierigen Bereich hält der Autor auch den „Aufbau von kohäsiven und
1 Wiegand beruft sich dabei auf Hellwig (1984b). 2 Es wird nur kurz darauf hingewiesen, dass die Beleggruppierung so erfolgen sollte, dass „ein Benutzer eine Beleggruppe als ein zwangloses aber kohärentes und zugleich möglichst spannendes Beieinander von Teiltexten und/oder Textteilen erlebt“ (Wiegand 1993: 243).
78
Monika Bielińska
kohärenten Zusammenhängen durch Beleggruppierung und ihre Kommentierung in Textwörterbüchern“ (ebenda).
5 Wörterbuchspezifische Probleme der Kohärenzherstellung Kohärenz wird bei der Wörterbucherstellung und bei der Wörterbuchbenutzung hergestellt. Sie wird – wie bereits aus dieser Feststellung ersichtlich – nicht als eine textinhärente Eigenschaft betrachtet, was bedeutet, dass sie nicht nur im Wörterbuch zu suchen ist. Kohärenz wird als mehrschichtiges Phänomen betrachtet, das nicht nur auf sprachimmanenten und textimmanenten Elementen und Strukturen basiert, sondern auch in hohem Grade textrezipientenbedingt ist, in diesem Falle also wörterbuchbenutzerbedingt. Das, was in gängigen Auffassungen dem Begriff der Kohäsion subsumiert wird, wird als eine der Kohärenzebenen angesehen und nicht als eine separate Art des Textzusammenhangs (und überhaupt nicht als ein Textualitätskriterium neben der Kohärenz, wie in de Beaugrande/Dressler 1981). Wörterbücher in der Hand der Benutzer, d. h. also jeder konsultierte Wörterbuchartikel oder ein anderer (Teil)Text, sind zu betrachten als Gebilde aus 1) statisch Gegebenem (vom Lexikographen), also für alle Benutzer Vorhandenem, wohl aber wegen der Unterschiede zwischen den Benutzern, ihren Bedürfnissen, Kompetenzen etc. nicht für alle gleich Zugänglichem und nicht von allen gleich Rezipiertem und 2) dynamisch Hinzugefügtem, Interpretiertem (vom Benutzer). Der geschriebene Text und das Verstandene stimmen nicht überein. Das lässt uns Wörterbuchtexte ähnlich wie andere Texte betrachten.3 Jeder Benutzer baut eigene Brücken zwischen dem Fraglichen und den Antworten, bildet Zusammenhänge im konsultierten Text. Diese (Benutzer-)Strukturen basieren aber zu großem Teil auf den vorhandenen Wörterbuchstrukturen. Ihre Beschaffenheit ist also ebenfalls vom Wörterbuch selbst abhängig. In Texten, die als Satzfolgen gebaut sind, helfen v. a. morpho-syntaktische Mittel (Proformen, Tempora etc.) bei der Kohärenzherstellung. In Texten, die nicht aus Sätzen bestehen, wie z. B. in standardisierten Wörterbuchartikeln (narrative Wörterbuchartikel lassen wir hier außer Acht), muss die Oberfläche andere Elemente und Strukturen aufweisen, die die Aufgaben der Morphosyntax in natürlichsprachlichen Texten übernehmen. Die Bedeutung der Standardisierung, deren eine der Folgen für die Gestaltung der Wörterbuchtexte gerade erwähnt worden ist, beschränkt sich nicht
3 Vgl. dazu Hellwig (1984a: 69): „Schon die Bedeutungen, die verschiedene Leser mit den Ausdrücken verbinden, sind möglicherweise nicht dieselben, denn sie hängen von der Erfahrung mit der Welt und der Kommunikationsgeschichte ab.“
Einige Überlegungen zu lexikographischen Kohärenzstrukturen
79
darauf, dass die Lexikographen einheitlich vorgehen (dieselben Typen von Daten berücksichtigen usw.) und dass sich dank dessen die Wörterbuchartikel in einem Wörterbuch nicht voneinander unterscheiden. Die Standardisierung hat noch einen kommunikativen Mehrwert, gerade in Hinblick auf die Kohärenzbildung. Der schematische Charakter der lexikographischen Beschreibung, die Wiederholbarkeit der Strukturen, Methoden und Mittel, die Voraussehbarkeit – dies alles verbessert die artikelinterne Auffindbarkeit der Daten,4 erleichtert aber auch dem Benutzer die Herstellung der Zusammenhänge, folglich also das Textverstehen. Voraussetzung dafür ist natürlich die Kenntnis der Konvention, der Funktionen der einzelnen Elemente etc., also die Wörterbuchbenutzungskompetenz. In Bezug auf die Wörterbuchartikel stellt Wiegand fest: „Wer die Mikrostruktur kennt, kann einen standardisierten kohärenten Textzusammenhang herstellen, so daß man auch von standardisierter Kohärenz sprechen kann“ (Wiegand 1988: 91). Sehr deutlich sieht man die Abhängigkeit der Fähigkeit des Benutzers zur Kohärenzbildung von seiner Wörterbuchbenutzungskompetenz am Beispiel der Strukturanzeiger, die als kohäsionsanweisende Textsegmente im Wörterbuch eingesetzt werden. Nach Gerzymisch-Arbogast (1989: 948) kann „ohne Kenntnis der Funktion der Strukturanzeiger […] u. U. vom Benutzer im Wörterbuchartikel keine Sinnkontinuität, also Kohärenz, hergestellt werden. Als Gliederungssignale oder Verstehenssignale, die den Weg durch den WA [Wörterbuchartikel] ‚programmieren‘, haben die Strukturanzeiger daher eine für Wörterbuchartikel typische kohäsive Funktion […]“. Ähnliches gilt allerdings auch für die Angaben. Die Standardisierung betrifft verschiedene Aspekte der Wörterbuchform. Wird die Beschreibungssprache standardisiert, so bedeutet das gleichzeitig eine Textverdichtung,5 die wiederum mit der Tilgung natürlichsprachlicher kohärenzfördernder Mittel (darunter werden gemäß dem Obigen auch kohäsionsstiftende Mittel verstanden) verbunden ist (vgl. dazu Wiegand 1988: 35–36, 2000: 36–42). Der Benutzer muss im Stande sein, anhand eines verdichteten Artikels, also eines Textkondensats, einen Volltext zu konstruieren (vgl. Wiegand 1988: 81–82). Er sollte Zusammenhänge herstellen können, und dies nicht nur innerhalb eines Wörterbuchartikels, sondern auch zwischen einem Artikel und einem anderen (Teil)Text, er muss also Kohärenzstrukturen bilden, basierend – wie bereits erwähnt – auf Strukturen, die von Lexikographen geschaffen worden sind. Je verdichteter, kondensierter die lexikographische Darstellung im Wörterbuch ist, desto mehr Unterstützung, d. h. kohärenzfördernde Elemente braucht der Benutzer vom Lexikographen. In Bezug auf die Wörterbuchartikel nennt Wiegand Adressierungsstrukturen als „Ersatz für die syntaktischen Funktionen und kohäsive Bezüge“ (Wiegand 2000: 32), die im verdichteten Text nicht erkennbar sind. Auch die Einteilung der Artikel in textuelle Suchbereiche, wo Mengen von Angaben Suchzonen bilden und die Strukturanzeiger als
4 Das ist auch einer der Gründe für die Standardisierung; zu anderen vgl. Wiegand (1988: 36–37). 5 Zu Verfahren der Textverdichtung vgl. Wolski (1989: 961–966) und Wiegand (1998b).
80
Monika Bielińska
Suchzonenanzeiger „das Erkennen der Angaben […] unterstützen“ (Wiegand 1988: 42; vgl. auch Wiegand 1999: 267) hilft bei der Kohärenzbildung. Im Hinblick auf den gesamten Textverbund können diverse Typen von Ordnungsstrukturen als kohärenzfördernd angesehen werden (sei es präzedentive oder hierarchische oder aber hypertextuelle Anordnung). Eine Hilfsfunktion erfüllen auch Metatexte, die dem Benutzer den Aufbau des Wörterbuches, des Artikels sowie die Funktionen der einzelnen Typen von Textsegmenten erklären. Dadurch erleichtern sie ihm die Kohärenzherstellung und demnach effektive Wörterbuchbenutzung. Geht man von einem Kohärenzbegriff aus, wie er den vorangehenden Überlegungen zugrunde gelegt wurde, kann man einige Typen der Kohärenzstrukturen unterscheiden. Es wird hier allerdings keine vollständige Typologie angestrebt. Diese Einteilungen betreffen immer die Kohärenz in allen ihren Ebenen, es wird nicht zwischen expliziten und impliziten Formen der Kohärenz (sensu Brinker 1971, nach Brinker/ Cölfen/Pappert 2014: 18) unterschieden. So lässt sich z. B. zwischen aktuellen und potentiellen Kohärenzstrukturen unterscheiden. Aktuelle Kohärenzstrukturen sind als Kohärenzstrukturen zu verstehen, die von einem Benutzer-in-actu in einer gegebenen Wörterbuchbenutzungssituation hergestellt werden. Das unterscheidet sie von der Menge potentieller Strukturen, die von potentiellen Benutzern in allen Benutzungssituationen gebildet werden können. Ferner ist zwischen der wörterbuchstrukturgebundenen und wörterbuchstrukturunterstützten Kohärenz zu unterscheiden, wobei hier die Art der Wörterbuchbenutzungssituation (und damit auch die Art des Fraglichen/Quaestio) maßgeblich den Kohärenzstrukturtyp beeinflusst. Man könnte ganz grob wörterbuchstrukturgebundene Kohärenz mit dem einfachen, punktuellen Nachschlagen in einer konfliktbedingten Benutzungssituation (vor allem bei der Textrezeption) verbinden. Mit Kohärenz, die durch Wörterbuchstrukturen nur unterstützt, aber nicht determiniert wird, können wir es eher bei der Benutzung des Wörterbuchs als Lesebuch bzw. Lernwörterbuch beim Spracherwerb zu tun haben, wenn die Benutzer oft eigene Zusammenhänge konstruieren. Und schließlich lassen sich lokale und globale Kohärenzstrukturen unterscheiden. Diese Dichotomie wird auch in der Textliguistik behandelt (vgl. etwa Rickheit/ Schade 2000: 281 oder Schnotz 2000: 497). In Bezug auf Wörterbücher kann man lokale Kohärenzstrukturen als solche definieren, die innerhalb einer Wörterbuchkonstituente etabliert werden und globale als (teil)textübergreifende, also mindestens zwei Wörterbuchkonstituenten verbindende.
Einige Überlegungen zu lexikographischen Kohärenzstrukturen
81
6 Sind Kohärenzstrukturen wörterbuchartikelinterne Strukturen? Wiegand (2005) unterscheidet zwei Typen von textuellen Strukturen: zum einen wörterbuchinterne textuelle Strukturen außerhalb von Wörterbuchartikeln (Textverbundstrukturen, Makrostrukturen, Mediostrukturen, äußere Zugriffsstrukturen etc.), zum anderen textuelle Strukturen von Wörterbuchartikeln. Zu den Letzteren zählt Wiegand die Kohärenzstruktur (neben der Artikelkonstituentenstruktur, Angabenstruktur, Kohäsionsstruktur u. a.) (vgl. ebenda 296–297; auch Wiegand 1993: 253). Geht man von der im vorliegenden Beitrag vertretenen Kohärenzauffassung aus, so kann man die Kohärenzstrukturen nicht als artikelinterne Strukturen ansehen und zwar aus zwei Gründen, die bereits angesprochen worden sind: (1) Die Beschaffenheit von o. g. Strukturen (wie Artikelkonstituentenstruktur usw.) ist anders als die der Kohärenzstruktur. Kohärenz ist keine textinhärente Eigenschaft, sie ist also nicht (nur) im Text – also auch nicht in einem Wörterbuchartikel – zu lokalisieren. (2) Das Wörterbuch als Textverbund ist – im Gegensatz dazu, was Sager (2000: 588) behauptet – kein Textkonglomerat, das „isoliert nebeneinander stehende und ebenso isoliert rezipierbare Subtexte in sich [vereint]“. Der Textverbund zeichnet sich z. T. dadurch aus, was für Hypertexte charakteristisch ist, nämlich „ein qualitatives Mehr, das sich in der Verknüpfung dieser Teiltexte manifestiert“ (ebenda: 587). Die Zusammenhänge, d. h. die Sinnkontinuität erstreckt sich im Wörterbuch über die Grenzen der einzelnen Wörterbuchartikel hinaus.
7 Schlusswort Zusammenfassend ist Folgendes festzuhalten: Lexikographische Kohärenz ist ein vielschichtiges Phänomen, das sowohl im Rahmen der Wörterbuchbenutzungsforschung als auch der systematischen Wörterbuchforschung zu erforschen ist. Bildung von Kohärenzstrukturen ist untrennbar mit der Benutzung eines Wörterbuchs verbunden. Die oft thematisierte Handlung SUCHEN bzw. FINDEN (man spricht ja von Suchzielen, von Auffindbarkeit der Daten etc.) wäre um FRAGEN zu erweitern. Fragen bilden geht immer der Suche voran, so dass die folgende Kette entsteht: fragen – nach einer Antwort suchen – einen Zusammenhang zwischen der Frage und der Antwort, d. h. Kohärenz, herstellen. Kohärenz lässt sich unter dem quantitativen Aspekt betrachten, sie ist graduierbar. Lexikographisch untersuchen und quantitativ bestimmen lässt sich allerdings nur die Ebene der Kohärenz, die mit der Gestaltung der Textoberfläche verbunden ist. Die kognitive, benutzerabhängige Ebene ließe sich wohl kaum bemessen, man kann sie aber empirisch untersuchen.
82
Monika Bielińska
Im Zusammenhang mit der lexikographischen Kohärenz, so wie sie im vorliegenden Beitrag bestimmt worden ist, wäre noch ein terminologisches Problem zu überlegen, nämlich ob man bei dermaßen individuell geprägten und selbst in Wörterbuchbenutzungssituationen desselben Typs unterschiedlich verlaufenden Nachschlagehandlungen von Kohärenzstrukturen sprechen sollte. Herbert Ernst Wiegand hat während der sich dem Vortrag anschließenden Diskussion eine adäquatere Bezeichnung vorgeschlagen: Kohärenzpfade. Zum Schluss sei noch auf einen Umstand hingewiesen. Schon im Laufe der Untersuchungen bei der Lektüre textlinguistischer Arbeiten ist ersichtlich geworden – und das hat auch während der Diskussion eine Bestätigung gefunden – dass sich die Textlinguistik, von der man sich bei der wissenschaftlichen Beschäftigung mit Wörterbüchern als Textverbunden Unterstützung erhoffen könnte, für die lexikographische Forschung als wenig ergiebig erweist.
Literatur Beaugrande, Robert-Alain de/Wolfgang Ulrich Dressler (1981): Einführung in die Textlinguistik. Tübingen: Niemeyer. Brinker, Klaus/Cölfen, Hermann/Pappert, Steffen (82014/1985): Linguistische Textanalyse: Eine Einführung in Grundbegriffe und Methoden. Berlin: Schmidt. Gernsbacher, Morton Ann/Givón, Talmy (1995): Introduction: Coherence as a mental entity. In: Gernsbacher, Morton Ann/Givón, Talmy (Hrsg.): Coherence in Spontaneous Text. Amsterdam: John Benjamins Publishing Company, vii–x. Gerzymisch-Arbogast, Heidrun (1989): Standardisierte Wörterbuchartikel des allgemeinen einsprachigen Wörterbuches als Texte: Probleme der Kohärenz und der Thema-Rhema-Struktur. In: Hausmann, Franz Josef et al. (Hrsg.): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. Berlin/New York: De Gruyter, 946–956. Givón, Talmy (1995): Coherence in text vs. coherence in mind. In: Gernsbacher, Morton Ann/ Givón, Talmy (Hrsg.): Coherence in Spontaneous Text. Amsterdam: John Benjamins Publishing Company, 59–115. Halliday, Michael A. K./Hasan, Ruqaiya (1976): Cohesion in English. London: Longman. Harweg, Roland (1989): Is Coherence a Pragmatic Phenomenon? Comments on D. Viehweger’s Paper. In: Heydrich, Wolfgang et al. (Hrsg.): Connexity and Coherence. Analysis of Text and Discourse. Berlin/New York: De Gruyter, 283–290. Hellwig, Peter (1984a): Grundzüge einer Theorie des Textzusammenhanges. In: Rothkegel, Annely/ Sandig, Barbara (Hrsg.): Text – Textsorten – Semantik. Linguistische Modelle und maschinelle Verfahren. Hamburg: Buske, 51–79. Hellwig, Peter (1984b): Titulus oder über den Zusammenhang von Titeln und Texten. Titel sind ein Schlüssel zur Textkonstitution. In: Zeitschrift für Germanistische Linguistik 12, 1–20. Kammerer, Matthias/Wiegand, Herbert Ernst (1998): Über die textuelle Rahmenstruktur von Printwörterbüchern. Präzisierungen und weiterführende Überlegungen. In: Lexicographica 14, 224–238.
Einige Überlegungen zu lexikographischen Kohärenzstrukturen
83
Kintsch, Walter (1995): How readers construct situation models for stories. The role of syntactic cues and causal interferences. In: Gernsbacher, Morton Ann/Givón, Talmy (Hrsg.): Coherence in Spontaneous Text. Amsterdam: John Benjamins Publishing Company, 130–160. Rickheit, Gert/Schade, Ulrich (2000): Kohärenz und Kohäsion. In: Brinker, Klaus et al. (Hrsg.): Textund Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung. Bd. 1. Berlin, Boston: De Gruyter, 275–283. Sager, Sven F. (2000): Hypertext und Hypermedia. In: Brinker, Klaus et al. (Hrsg.): Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung. Bd. 1. Berlin, Boston: De Gruyter, 587–603. Scherner, Maximilian (1994): Textverstehen als „Spurenlese“ – Zur texttheoretischen Tragweite dieser Metapher. In: Canisius, Peter/Herbermann, Clemens-Peter/Tschauder, Gerhard (Hrsg.): Text und Grammatik. Festschrift für Roland Harweg zum 60. Geburtstag. Bochum: Brockmeyer, 317–340. Schnotz, Wolfgang (2000): Das Verstehen schriftlicher Texte als Prozeß. In: Brinker, Klaus et al. (Hrsg.): Text- und Gesprächslinguistik. Ein internationales Handbuch zeitgenössischer Forschung. Bd. 1. Berlin, Boston: De Gruyter, 497–506. Vater, Heinz (2001): Einführung in die Textlinguistik: Struktur und Verstehen von Texten. München: Fink. Viehweger, Dieter (1989): Coherence – Interaction of Moduls. In: Heydrich, Wolfgang et al. (Hrsg.): Connexity and Coherence. Analysis of Text and Discourse. Berlin/New York: De Gruyter, 256–274. Viehweger, Dieter (1990): Haben Wörterbucheinträge Textualität? In: Lexicographica 6, 127–140. Wiegand, Herbert Ernst (1983): Überlegungen zu einer Theorie der lexikographischen Sprachbeschreibung In: Hyldgaard-Jensen, Karl/Zettersten, Arne (Hrsg.): Symposium on Lexicography. Proceedings of the Symposium on Lexicography, September, 1-2 1982, at the University of Copenhagen. Hildesheim, Zürich: Olms, 35–72. Wiegand, Herbert Ernst (1988): Wörterbuchartikel als Text. In: Harras, Gisela (Hrsg.): Das Wörterbuch: Artikel und Verweisstrukturen. Jahrbuch 1987 des Instituts für deutsche Sprache. Düsseldorf: Schwann, 30–120. Wiegand Herbert Ernst (1993): Kritische Lanze für Fackel-Redensartenwörterbuch. Bericht und Diskussion zu einem Workshop in der Österreichischen Akademie der Wissenschaften am 14. 2. 1994. In: Lexicographica 9, 230–271. Wiegand, Herbert Ernst (1996): Über die Mediostrukturen bei gedruckten Wörterbüchern. In: Zettersten, Arne/Pedersen, Viggo Hjørjager (Hrsg.): Symposium on Lexicography VII. Proceedings of the Seventh Symposium on Lexicography, May 5-6, 1994 at the University of Copenhagen. Tübingen: Niemeyer, 11–43. Wiegand, Herbert Ernst (1998a): Historische Lexikographie. In: Besch, Werner et al. (Hrsg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. Bd. 1. Berlin/New York: De Gruyter, 643–715. Wiegand, Herbert Ernst (1998b): Lexikographische Textverdichtung. Entwurf zu einer vollständigen Konzeption. In: Zettersten, Arne/Pedersen, Viggo Hjørnager (Hrsg.): Symposium on Lexicography VIII. Proceedings of the Eighth Symposium on Lexicography, May 2-4, 1996 at the University of Copenhagen. Tübingen: Niemeyer, 1–35. Wiegand, Herbert Ernst (1999): Artikel einsprachiger Lernerwörterbücher, Textgestaltwahrnehmung und Suchsbereichstrukturen. Plädoyer für übersichtliche Printwörterbücher im Zeitalter der Neuen Medien. In: Skibitzki, Bernd/Wotjak Barbara (Hrsg.): Linguistik und Deutsch als Fremdsprache. Festschrift für Gerhard Helbig zum 70. Geburtstag. Tübingen: Niemeyer, 259–281.
84
Monika Bielińska
Wiegand Herbert Ernst (2000): Adressierung in der ein- und zweisprachigen Lexikographie. Eine einführende Übersicht über die Forschungs- und Problemlage. In: Lexikos 10, 32–74. Wiegand, Herbert Ernst (2005): Über die textuellen Strukturen im GWDS. In: Wiegand, Herbert Ernst (Hrsg.): Untersuchungen zur kommerziellen Lexikographie der deutschen Gegenwartssprache II. Tübingen: Niemeyer, 295–335. Wolski, Werner (1989): Formen der Textverdichtung im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef et al. (Hrsg.): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. Berlin/New York: De Gruyter, 956–967.
Diana Stantcheva
Zur Darstellung von Phraseologismen im Duden Online im Vergleich zur Neuauflage Duden Das große Wörterbuch der deutschen Sprache (42012) 1 Einleitung Der vorliegende Beitrag untersucht die Darstellung von Phraseologismen im Duden Online-Wörterbuch (Duden Online) im Vergleich zur im Jahre 2012 erschienenen Neuauflage von Duden Das große Wörterbuch der deutschen Sprache auf CD-ROM (Duden-GWB4). Diese zwei allgemeinen einsprachigen Wörterbücher stammen von der Dudenredaktion (Mannheim) und stellen momentan die neueste Kodifizierung des deutschen Wortschatzes der Gegenwart in elektronischer Form dar. Das Duden-GWB4 ist, wie im Impressum der CD-ROM zu lesen, eine „vollständig überarbeitete Auflage“ des gedruckten Wörterbuchs Duden Das große Wörterbuch der deutschen Sprache. Dieses Bedeutungswörterbuch hat bislang drei Auflagen als Printwörterbuch1 sowie ein paar CD-ROM-Versionen2 erfahren. Das Duden Online ist ein kostenfreies, im Internet frei zugängliches und auf dem Dudenkorpus basierendes Wörterbuch. Nach Aussagen der Dudenredaktion enthält das Korpus zwischen drei und vier Milliarden Wortformen3 aus unterschiedlichen Textsorten (Romanen, Sachbüchern, Zeitungen, Zeitschriften u. a.) und wird ständig erweitert. In Stantcheva (1999, 2002 und 2003) wurde die lexikographische Behandlung von Phraseologismen in den drei Auflagen des Printwörterbuchs Duden Das große Wör-
1 Duden-GWB1 (1976–1981) in sechs Bänden, Duden-GWB2 (1993–1995) in acht Bänden und DudenGWB3 (1999) in zehn Bänden. 2 Vgl. Duden-GWB3 (2000), das auf der Buchausgabe des Duden-GWB3 (1999) basiert, und DudenGWB4 (2012), das eine vollständig überarbeitete Auflage der Buchausgabe von Duden-GWB3 (1999) darstellt. 3 Angaben über den Umfang des Dudenkorpus sind auf verschiedenen Internetseiten des Wörterbuchs nicht aufeinander abgestimmt, vgl. z. B. die Aussagen der Redaktion auf http://www.duden.de/hilfe und auf http://www.duden.de/hilfe/typische-verbindungen [letzter Zugriff: 2. 2. 2017]. Diana Stantcheva: Department of Arts, Languages, and Literature, Modern Languages – German, American University in Bulgaria, 1 Georgi Izmirliev Sq., Blagoevgrad 2700, Bulgaria, [email protected] https://doi.org/10.1515/9783110598650-006
86
Diana Stantcheva
terbuch der deutschen Sprache (Duden-GWB1, Duden-GWB2 und Duden-GWB3) ausführlich behandelt. Der vorliegende Beitrag setzt da an und vergleicht die zwei digitalen Wörterbücher mit den vorherigen Printwörterbuchauflagen hinsichtlich der Darstellung von Phraseologismen. In diesem Zusammenhang wird vor allem zu untersuchen sein, inwiefern es Neuerungen in Sachen Phraseologie gibt und inwiefern die neuen Wörterbücher Erkenntnisse der Phraseologieforschung widerspiegeln. Darüber hinaus wird die Frage berücksichtigt, ob und wie das jeweilige elektronische Medium bei der Darstellung der Phraseologismen eine Rolle spielt. Die Schwerpunkte des Vergleichs liegen auf der makro- und mikrostrukturellen Zuordnung der phraseologischen Einheiten mit den dazugehörigen lexikographischen Angaben im jeweiligen Wörterbuch, auf der im Wörterverzeichnis zur Kennzeichnung dieser sprachlichen Phänomene verwendeten Terminologie sowie auf der phraseologischen Nennform. In Bezug auf die Nennform wird der Umgang der untersuchten Wörterbücher mit Fragen der externen Valenz und der Bestimmung des eigentlichen Komponentenbestandes näher beleuchtet.
2 Makrostrukturelle Zuordnung der Phraseologismen Unter makrostruktureller Zuordnung der Phraseologismen wird im vorliegenden Beitrag die Entscheidung verstanden, diejenige Stelle innerhalb des Wörterverzeichnisses auszumachen, wo eine phraseologische Einheit mit den dazugehörigen lexikographischen Daten zu verzeichnen ist. Schwierigkeiten bereitet dabei die mehrgliedrige Struktur der Phraseologismen. An der Bewältigung dieses Problems wird die Benutzerfreundlichkeit eines gedruckten Wörterbuches hinsichtlich der Phraseologie gemessen – schnelles und problemloses Auffinden phraseologischer Einheiten bei gering gehaltenem Suchaufwand und benötigtem theoretischen Vorwissen (vgl. Petermann 1983: 185f.; Worbs 1994: 82). Das makrostrukturelle Prinzip haben die Autoren in den Wörterbuchzusätzen zum Duden-GWB4 im Abschnitt 4.11 (Die Anwendungsbeispiele) der Informationen zu Inhalt und Struktur des Wörterbuchs wird unter dem Unterpunkt 4.11.5 kurz beschrieben. Das Prinzip ist das Gleiche wie in den vorherigen gedruckten Wörterbuchauflagen, und es kann als Mischung aus einem grammatisch-alphabetischen und einem semantischen Zuordnungsprinzip bestimmt werden. „Idiomatische Wendungen“, wie Phraseologismen hier genannt werden, „stehen in der Regel unter dem ersten auftretenden Substantiv bzw. unter dem ersten semantisch signifikanten Wort. So findet sich z. B. frieren wie ein Schneider unter Schneider, durch dick und dünn unter dick und Dritte Welt unter Welt“. Dieses Prinzip wird allerdings auch im DudenGWB4 nicht konsequent eingehalten. Wie aus den folgenden Beispielen ersichtlich ist, werden die Phraseologismen manchmal unter dem zweiten auftretenden Substantiv und manchmal auch mehrfach lemmatisiert. In den letzteren Fällen sind die einzel-
Zur Darstellung von Phraseologismen im Duden Online
87
nen Einträge nicht aufeinander abgestimmt, Unterschiede in der Kennzeichnung des Phraseologismus und in der Angabe der Nennform fallen dabei auf: unter Strafe etwas ist bei Strafe verboten, unter verbieten Durchfahrt [bei Strafe] verboten!; unter Gesetz eine Lücke im Gesetz finden, unter Lücke eine Lücke im Gesetz; unter anrechnen *jemandem etwas hoch anrechnen, unter hoch jemandem etwas hoch anrechnen; unter Gott *[…] Gott soll mich strafen, wenn [nicht] …, unter strafen R Gott strafe mich, wenn ich lüge; unter Arbeit *[…] von seiner Hände Arbeit leben, unter leben von seiner Hände Arbeit leben, unter Werk er lebt von seiner Hände Werk. Die makrostrukturelle Zuordnung der Phraseologismen im Duden Online ist die gleiche wie im Duden-GWB4. Neu ist hingegen, dass Phraseologismen auch als Synonyme zu Wörtern und Wendungen im Rahmen der neuen Angabeklasse Synonyme zu … aufgelistet werden. Der Phraseologismus gang und gäbe wird z. B. als Synonym zu gebräuchlich genannt. Oft werden auch Phraseologismen zusammen mit Wörtern als Beispiele für grammatische oder orthographische Regeln angeboten, wie etwa die Dritte Welt steht nicht nur unter Welt, sondern zusammen mit anderen Wortverbindungen unter dritte, dritter, drittes als Beispiel für die „Großschreibung in Namen und bestimmten namenähnlichen Fügungen“. Mit anderen Worten: Die traditionelle makrostrukturelle Zuordnung der Phraseologismen wird im Duden Online um weitere Zuordnungsmöglichkeiten ergänzt. Insgesamt spielt jedoch die gewählte makrostrukturelle Zuordnung der Phraseologismen sowohl im Duden-GWB4 als auch im Duden Online für den Wörterbuchbenutzer keine wesentliche Rolle mehr. Bedingt durch das jeweilige elektronische Medium wird die Benutzerfreundlichkeit des elektronischen Wörterbuchs hinsichtlich der Auffindbarkeit der phraseologischen Einheiten an anderen Kriterien gemessen. Viel wichtiger sind hierbei z. B. Suchmodalitäten, die die Nachschlagewerke bieten. So kann man durch die erweiterte Suche im Duden-GWB4 nach Wendungen bzw. nach Kombinationen von Wörtern im Volltext (inkl. Stichwörter) suchen. Die Suchanfrage „Hab und Gut“ liefert neun Treffer für die phraseologische Einheit Hab und Gut, einer davon ist das Stichwort Hab, und weitere acht Treffer finden sich im Volltext des Wörterverzeichnisses, wo der Phraseologismus Hab und Gut in verschiedenen Funktionen (als Bedeutungserläuterung, als etymologische Angabe oder als Kontextbeispiel) verwendet wird. Anhand dieser Daten erfährt man auch die mögliche Verbumgebung des substantivischen Phraseologismus: verlieren, hinüberretten, retten, verprassen, verlottern. Mit solchen Suchmöglichkeiten kann man das Wörterverzeichnis des Duden-GWB4 wie ein kleines Textkorpus geschriebener Sprache benutzen. Die gleiche Suchanfrage „Hab und Gut“ liefert im Duden Online elf Treffer für die phraseologische Einheit Hab und Gut. Einer davon ist das Stichwort Hab und Gut. In den zehn weiteren Treffern wird der Phraseologismus Hab und Gut entweder als Synonym (unter Habe, Gut, Möbel, Eigen, Eigentum, Besitzstand, Besitz, Vermögen) angegeben oder in einer typischen Verwendung illustriert (unter verlottern, abbrennen). Die Suche wird allerdings nicht auf Wortverbindungen eingeschränkt,
88
Diana Stantcheva
und die Anfrage „Hab und Gut“ bringt auch sieben weitere Treffer, wo die Lexeme Hab und Gut als Einzelwörter im selben Wörterbuchartikel vorkommen (unter achthaben, selig, Acht, dagegen, sagen, Gott, haben). Die Suchfunktion wird darüber hinaus durch die lästige Online-Werbung zusätzlich verlangsamt.
3 Mikrostrukturelle Zuordnung der Phraseologismen Auch das lexikographische Konzept hinsichtlich der mikrostrukturellen Zuordnung der „idiomatischen Wendungen“ im Duden-GWB4 ist im Wesentlichen unverändert geblieben – auch hier werden Phraseologismen, ähnlich wie in den vorherigen gedruckten Ausgaben, zur Kontextsphäre der einzelnen Stichwörter, zu den Anwendungsbeispielen gerechnet und dort unter dem jeweiligen Bedeutungspunkt (bei polysemen Lemmata) erfasst. Zur mikrostrukturellen Zuordnung ist in den Wörterbuchzusätzen zum DudenGWB4 (Informationen zu Inhalt und Struktur des Wörterbuchs, 4.11 Die Anwendungsbeispiele, Unterpunkt 4.11.5) die gleiche Information wie im Duden-GWB3 enthalten, nämlich, dass die „idiomatischen Wendungen […] hinter den Anwendungsbeispiele [sic!] eines Stichworts“ stehen. Die Zuordnung der phraseologischen Einheiten erfolgt hier nach semantischen Kriterien. Dabei geht man entweder von der Gesamtbedeutung des Phraseologismus oder von der Bedeutung einer seiner Komponenten aus. Diese Darstellungsweise ist bei vollidiomatischen Phraseologismen sehr problematisch, denn sie haben keine gemeinsamen semantischen Merkmale (mehr) mit den Stichwörtern, unter denen sie verzeichnet werden. Die obige Formulierung befindet sich aber auch im Widerspruch zu den vorangehenden Ausführungen der Wörterbuchzusätze, denn die „idiomatischen Wendungen“ werden darin zu den Anwendungsbeispielen gerechnet (ebenda). Erst aus dem Beispiel, welches diese Formulierung illustrieren soll – dem Artikel zu Bein –, wird die eigentliche Aussageabsicht der zitierten Passage deutlich, nämlich, dass die „idiomatischen Wendungen“ im Wörterbuchartikel am Ende aller Anwendungsbeispiele stehen sollen. Im Duden-GWB4 sind aber, ähnlich wie in den gedruckten Duden-Wörterbüchern, auch Ausnahmen von diesem Konzept der mikrostrukturellen Zuordnung der „idiomatischen Wendungen“ zu beobachten: Einige Phraseologismen haben nämlich einen eigenen Bedeutungspunkt zugewiesen bekommen, wie z. B. 4. *[tief] in jemandes Schuld sein/stehen (gehoben; jemandem sehr zu Dank verpflichtet sein) unter Schuld. Dies geschieht in der Regel dann, wenn die phraseologischen Einheiten semantisch unter keinem der vorhandenen Bedeutungspunkte untergebracht werden können. Manche Phraseologismen mit unikalen Komponenten fungieren im Duden-GWB4 darüber hinaus als selbständige Lemmata, z. B. Hab und Gut unter Hab oder gang und gäbe sein unter gang. Die Probleme der mikrostrukturellen Zuordnung werden allerdings durch die Suchmodalitäten des elektronischen Mediums kompen-
Zur Darstellung von Phraseologismen im Duden Online
89
siert. Durch die Suchfunktion Suche im aktuellen Artikel können Phraseologismen schnell und sicher auch in längeren Wörterbuchartikeln gefunden werden. Die mikrostrukturelle Zuordnung der Phraseologismen im Duden Online ist die gleiche wie im Duden-GWB4: Auch hier werden die Phraseologismen zur Kontextsphäre der einzelnen Stichwörter gerechnet und meistens unter dem jeweiligen Bedeutungspunkt (bei polysemen Lemmata) erfasst. Einige Phraseologismen haben einen eigenen Bedeutungspunkt zugewiesen bekommen, wie z. B. 4. Wendungen, Redensarten, Sprichwörter [tief] in jemandes Schuld sein/stehen (gehoben: jemandem sehr zu Dank verpflichtet sein) unter Schuld. Manche Phraseologismen mit unikalen Komponenten fungieren auch hier als selbständige Einträge, wie z. B. Hab und Gut oder Murphys Gesetz. Die Probleme der mikrostrukturellen Zuordnung der Phraseologismen im Duden Online können jedoch durch die Suchfunktion des benutzten Internetbrowsers aufgehoben werden. Als besonders störend wird dagegen die Werbung empfunden, die sich immer bei der Wörterbuchbenutzung einblendet. Durch die Werbung wirken besonders längere Artikel ziemlich unübersichtlich. Neu ist im Duden Online die Angabeklasse Typische Verbindungen, von der Redaktion auch Wortwolken genannt, welche ebenfalls einen Teil der Wörterbuchartikelstruktur darstellt. Es handelt sich um nach dem Frequenzprinzip ermittelte Kookkurrenzpartner zum jeweiligen Stichwort. Sie sind auf der Basis des Dudenkorpus computergeneriert und dokumentieren, „in welchem Kontext Wörter in Texten verwendet werden“.4 Die Kookkurrenzen sind nach den Wortarten Adjektiv, Verb und Substantiv gruppiert. Die Schriftgröße der Kookkurrenzpartner in den einzelnen Gruppen zeigt „den Grad der Typizität zwischen dem […] Stichwort und den […] Kontextwörtern [an]. Größer dargestellte Kontextwörter gehen dabei eine typischere Verbindung mit dem Stichwort ein als Wörter in kleinerer Schriftgröße“ (ebenda), wobei mit Typizität eigentlich die Häufigkeit des Vorkommens im Dudenkorpus gemeint ist. Unter den einzelnen Kookkurrenzen befinden sich auch Wörter, die zusammen mit dem jeweiligen Stichwort Phraseologismen bilden. Diese werden aber leider nicht gesondert gekennzeichnet, und es setzt einen Wörterbuchbenutzer voraus, der die Phraseologismen unbedingt kennen muss, um die Kookkurrenzpartner als eine phraseologische Einheit erkennen zu können.
4 Siehe unter http://www.duden.de/hilfe/typische-verbindungen [letzter Zugriff: 2. 2. 2017].
90
Diana Stantcheva
4 Phraseologische Termini als Lemmata Im Hinblick auf die phraseologischen Termini als Bestandteile des Wörterverzeichnisses sind im Duden-GWB4 keine Veränderungen zu den vorhergehenden Printwörterbüchern Duden-GWB3 und Duden-GWB25 festzustellen. Hierzu wurden die Lemmata Phraseologie, Idiomatik, Phraseologismus, Idiom, Phraseolexem, Redensart, Redewendung, Wendung, Kollokation, Phrase, Formel und deren Bedeutungserläuterungen verglichen. Die einzigen Unterschiede sind formaler, typographischer Natur: Die CD-ROM-Ausgabe verwendet im Unterschied zu Duden-GWB3 und DudenGWB2 keine Abkürzungen und keine Tilden (plus Suffixendung) zur Textverdichtung und macht, unterstützt durch das digitale Medium, Gebrauch von Verweisen bei Synonymen. Dadurch, dass es keine Unterschiede zwischen dem Duden-GWB4 und den vorhergehenden Auflagen gibt, sind auch die Probleme, auf die in Stantcheva (2003) hingewiesen wird, ins Duden-GWB4 mit übernommen. Beispielsweise ist der Begriff Phrasem, der in den vergangenen dreißig Jahren zum Hauptkonkurrenten von Phraseologismus als Oberbegriff in der deutschsprachigen Phraseologieforschung avanciert ist, nach wie vor nicht verzeichnet. Dagegen findet man auch hier den Terminus Phraseolexem, eine Bezeichnung allerdings, die sich als Oberbegriff der Phraseologie nicht durchzusetzen vermochte. Das Lemma Phraseolexem wird erneut als ‚phraseologische Einheit, die durch Idiomatizität, Stabilität und Lexikalisierung gekennzeichnet ist‘, bestimmt. Diese Bedeutungserläuterung enthält das Merkmal der Polylexikalität nicht. Ihr fehlt darüber hinaus ein Hinweis auf den fakultativen Charakter der Kriterien Idiomatizität und Stabilität, worüber in der Phraseologieforschung seit Jahren ebenfalls Konsens besteht. Die Termini Phraseologismus und Idiom sind im Wörterverzeichnis des DudenGWB4 immer noch nach einer veralteten Auffassung in der Phraseologie als Synonyme aufgeführt, wobei man eine Bedeutungsangabe nur unter Idiom (2) findet. Ein Idiom ist demnach eine ‚eigentümliche Wortprägung, Wortverbindung oder syntaktische Fügung, deren Gesamtbedeutung sich nicht aus den Einzelbedeutungen der Wörter ableiten lässt‘. Wenn jedoch diese Bedeutungserläuterung, die sich auf Idiomatizität und zum Teil auf Polilexikalität stützt, und die anderen konstitutiven Merkmale des Phraseologismus außer Acht lässt, der Erläuterung von Phraseolexem gegenübergestellt wird, drängt sich unvermeidlich die Frage auf, in welcher Beziehung die Synonyme Phraseologismus und Idiom zu Phraseolexem stehen sollen (ebenfalls in Synonymie oder in Subordination). Diese Frage bleibt auch im Duden-GWB4 offen. Die zitierte Bedeutungserläuterung von Idiom (2) wird mit der Formulierung eine ‚eigentümliche Wortprägung‘ eingeleitet und endet nach wie vor mit dem Bei-
5 Duden-GWB3 und Duden-GWB2 sind hinsichtlich der Darstellung der phraseologischen Terminologie im Wörterverzeichnis absolut identisch (vgl. Stantcheva 2003).
Zur Darstellung von Phraseologismen im Duden Online
91
spiel Angsthase = sehr ängstlicher Mensch, das illustrieren soll, was unter Idiom bzw. Phraseologismus zu verstehen ist. In der Phraseologieforschung ist bereits eindeutig entschieden, dass metaphorische Komposita (Einwortlexeme) vom Typ Angsthase nicht zum Objektbereich der Phraseologie gehören. Aus diesem Grunde ist es unzulässig, dass eines der neuesten umfangreichen Wörterbücher des Deutschen das Lemma Idiom weiter auch als Wortprägung beschreibt und Angsthase als illustrierendes Beispiel anführt. Nach Duden-GWB4 gibt es auch keine sprachwissenschaftliche Disziplin, die Phraseologie heißt. Unter dem Lemma Phraseologie findet man lediglich die Bedeutungsangabe für den phraseologischen Bestand einer Sprache – ‚Gesamtheit typischer Wortverbindungen, fester Fügungen, Wendungen, Redensarten einer Sprache‘ – mit einem Hinweis auf das Synonym Idiomatik (2b) und eine weitere Unterbedeutung, die als ‚Darstellung, Zusammenstellung der Phraseologie (a)‘ umschrieben ist und durch den Zusatz in Klammern ‚(bes. zu einem Stichwort in einem Wörterbuch)‘ näher erläutert werden soll. Dieser Zusatz erschwert aber nur das Verständnis der Bedeutung. Das Lemma Idiomatik (1) wird als ‚Teilgebiet der Lexikologie, das sich mit Idiomen befasst‘ bestimmt, eine Auffassung, die der Entwicklung der eigenständigen sprachwissenschaftlichen Disziplin Phraseologie nicht Rechnung trägt. In dieser Bedeutungserläuterung wird auch nicht spezifiziert, welche von den beiden Bedeutungen (1) oder (2) von Idiom oder vielleicht sogar beide hier gemeint sind. Wenn man darüber hinaus die Lemmata Lexikologie und Wortschatz nacheinander nachschlägt, kommt man unvermeidlich zu der Schlussfolgerung, dass sich die Idiomatik mit Wörtern und nicht mit Wortverbindungen beschäftigt: Lexikologie: Bereich der Sprachwissenschaft, der sich mit der Erforschung des Wortschatzes (besonders mit der Struktur des Wortschatzes) befasst [und die theoretischen Grundlagen für die Lexikografie schafft] Wortschatz: 1. Gesamtheit der Wörter einer Sprache; Lexik […] 2. Gesamtheit der Wörter, über die ein Einzelner verfügt.
Mit anderen Worten, auch hier ist keine Veränderung im Vergleich zu Duden-GWB2 und Duden-GWB3 zu beobachten. Ähnlich sieht es bei dem Stichwort Redensart aus, das jeweils mit zwei Bedeutungen aufgelistet ist: Zum einen als ‚formelhafte Verbindung von Wörtern, die meist als selbständiger Satz gebraucht wird‘ und zum anderen im Plural als ‚leere, nichtssagende Worte, Phrasen‘. Der ersten Teilbedeutung fehlen Illustrationsbeispiele, durch welche die Bedeutungserläuterung generell an Eindeutigkeit gewonnen hätte. Bei der zweiten Teilbedeutung vermisst man den Vermerk 1. a) hinter dem Synonym Phrasen, denn das Lemma Phrase ist seinerseits auch mit zwei Bedeutungen aufgenommen und die erste davon hat zwei Unterbedeutungen. Unter Phrase (1) versteht man in allen drei Duden-Wörterbüchern einerseits abwertend eine ‚abgegriffene, nichtssagende Aussage, Redensart‘ (wobei hinter Redensart umgekehrt der Vermerk b) stehen sollte) und andererseits veraltend ‚Formel (1), Formulierung‘ (vgl. Abb. 1. und 2).
92
Diana Stantcheva
Abb. 1: Wörterbuchartikel zum Lemma Redensart im Duden-GWB4.
Abb. 2: Wörterbuchartikel zum Lemma Phrase im Duden-GWB4.
Zur Darstellung von Phraseologismen im Duden Online
93
Beim Stichwort Formel listet das Duden-GWB4, ähnlich wie die gedruckten DudenWörterbücher, als Erste von vier Bedeutungen die in den Bereich des Phraseologischen fallende ‚fester, sprachlicher Ausdruck, feste Formulierung für etwas Bestimmtes‘ auf. Diese Bedeutungsangabe betont vor allem die Festigkeit bzw. Stabilität des Begriffs und die zum Schluss angegebenen Beispiele eine herkömmliche, stereotype Formel; die Formel des Eides sprechen weisen durch die Attribute herkömmlich und stereotyp auf eine abwertende Komponente in der Bedeutung hin. Die Bedeutungserläuterung und die Illustrationsbeispiele lassen jedoch keine eindeutige Entscheidung darüber zu, ob der Terminus Formel gemäß Duden-GWB4 als Synonym für den phraseologischen Oberbegriff angesehen werden kann oder eine phraseologische Klasse (z. B. die der Routineformeln) bezeichnen soll. Die Umschreibung von Sprichwort hat sich im Duden-GWB4 ebenfalls nicht geändert und berücksichtigt die Kürze, den satzwertigen Charakter und die Lehrhaftigkeit von Sprichwörtern und gibt als Synonym dazu das „ältere“ Proverb an. Bei dem Lemma Redewendung findet man nach wie vor die Erläuterung ‚feste Verbindung von Wörtern, die zusammen eine bestimmte, meist bildliche Bedeutung haben‘. Dies erinnert an die Begriffsbestimmung von Idiom (2), woraus sich schlussfolgern lässt, dass die Autoren beide Begriffe für synonym halten, ohne es zu vermerken. Als Synonym zu Redewendung wird im Wörterbuchartikel Wendung angegeben. Unter Wendung 4. a) findet man jedoch lediglich das Synonym Redewendung, was einen typischen Fall von Zirkularität darstellt (vgl. Neubauer 1980: 2–10). Das Lemma Kollokation hat, ähnlich wie in den anderen zwei Duden-Wörterbüchern, lediglich eine nicht phraseologische Bedeutung, obwohl sich dieser Terminus schon längst als Bezeichnung für eine phraseologische Klasse etabliert hat und eine ganze Reihe von phraseologischen Untersuchungen sich den Kollokationen widmet. Dieselben Lemmata wurden auch im Duden Online überprüft. Auch hier ist Phrasem als Lemma nicht verzeichnet und Kollokation hat keine phraseologische Bedeutung. Inhaltlich gesehen unterscheiden sich die Bedeutungserläuterungen kaum von den oben beschriebenen. Neu ist hier zum einen typographisch, dass die Bedeutungserläuterungen nicht kursiviert werden, und bedingt durch das Medium Internet, dass die Verknüpfung zwischen den inhaltlichen Texteinheiten mit Hilfe von Links funktioniert. Zum anderen werden unter den einzelnen Lemmata Synonyme angeboten, was ebenfalls eine Neuheit darstellt. Die unter den einzelnen Lemmata angegebenen Synonymien sind allerdings nicht immer unproblematisch, wie die folgenden Beispiele demonstrieren sollen: Zu Phraseologismus Fügung, Idiom, Redewendung, Sprichwort, Wendung; zu Idiom feste Verbindung, feste Wendung, [Rede]wendung, Wortgruppe, (Sprachwissenschaft) Fügung, idiomatische Wendung, Kollokation, Phraseologismus, Wortfügung, Wortgruppenlexem; zu Redensart Formel, Idiom, Sprichwort, Wendung; (Sprachwissenschaft) [feste] Fügung, Idiotismus, Phraseologismus; zu Redewendung Formel, Idiom, Redensart, Sprichwort, Wendung; (Sprachwissenschaft) [feste] Fügung, Idio tismus, Phraseologismus; zu Wendung Formel, Idiom, Redensart, Redewendung,
94
Diana Stantcheva
Sprichwort; (Sprachwissenschaft) [feste] Fügung, Idiotismus, Phraseologismus; zu Sprichwort Ausspruch, Formel, [geflügeltes] Wort, Idiom, Lebensweisheit, Redensart, Satz, Sinnspruch, Weisheit, Wendung; (bildungssprachlich) Sentenz; (norddeutsch) Schnack; (veraltet) Proverb; (Sprachwissenschaft) [feste] Fügung, Idiotismus, Phraseologismus. Auf die problematische Synonymie zwischen Idiom und Phraseologismus und zwischen Idiomatik und Phraseologie habe ich bereits oben hingewiesen. Hier sind aber Phraseologismus, Idiom, Sprichwort, Redensart, Redewendung, Wendung als Synonyme dargestellt. Auch Idiomatismus wird als Synonym zu Sprichwort, Redensart, Redewendung und Wendung angegeben, hat aber als Lemma keine phraseologische Bedeutung, genauso wie Kollokation ein Synonym von Idiom sein soll, aber als Lemma keine phraseologische Bedeutung aufweist. Problematisch ist auch die Synonymie zwischen Idiom und Fügung, Wortfügung bzw. Wortgruppe, weil die Bedeutungserläuterungen der letzteren lediglich die formale Festigkeit und nicht die Idiomatizität der sprachlichen Einheiten berücksichtigen. Der Link zum Lemma Fügung ist darüber hinaus nicht ganz korrekt, weil das Lexem Fügung zwei Unterbedeutungen hat, von denen nur die zweite in den Bereich der Sprachwissenschaft fällt. Umgekehrt sollte unter Fügung der Link zu den Synonymen auf die zweite Unterbedeutung von Idiom verweisen. Aus dem gleichen Grund benötigt der Link, der auf die Synonymie zwischen Sprichwort, Lebensweisheit und Weisheit hinweist, eine Spezifizierung auf die Unterbedeutung 2) bei Lebensweisheit und Weisheit.6 Das Lemma Phraseolexem ist mit der gleichen Bedeutung wie im Duden-GWB4 aufgelistet, dem Lemma wurde aber auch ein Beispiel dafür hinzugefügt, was ein Phraseolexem ist, nämlich das Idiom jemandem platzt der Kragen. In dem Wörterbucheintrag zu Phraseolexem fehlen jedoch Synonyme. Die Zirkularität, dass eine Wendung eine ‚Redewendung‘ sein soll, ist auch hier zu finden. Bei der folgenden Bedeutungserläuterung von Phraseologie ist auch der Verweis in der zweiten Unterbedeutung falsch: Es gibt ja keine Unterbedeutung (a), und es sollte Phraseologie (1) stehen (vgl. Abb. 3).
6 Bei Weisheit kann auch nicht die ganze Unterbedeutung 2), sondern nur der letzte Teil davon als Synonym von Sprichwort angesehen werden: Weisheit: 2. (durch Weisheit gewonnene) Erkenntnis, Lehre; weiser Rat, Spruch.
Zur Darstellung von Phraseologismen im Duden Online
95
Abb. 3: Ausschnitt aus dem Wörterbuchartikel zu Phraseologie im Duden Online.
5 Kennzeichnung der Phraseologismen im Wörterverzeichnis Was die Kennzeichnung der Phraseologismen als besondere sprachliche Phänomene betrifft, ist das Bild im Duden-GWB4 nicht anders als im Duden-GWB2 und DudenGWB3. Auch hier lässt sich kein einheitliches Prinzip erkennen, sowohl was die Vielfalt der benutzten Kennzeichnungsmittel als auch die Tatsache betrifft, dass nicht sämtliche aufgenommenen phraseologischen Einheiten als solche ausgewiesen sind. Auch hier gibt es keine plausible Erklärung dafür, warum einige Phraseologismen gekennzeichnet worden sind, andere dagegen nicht und welche Kriterien für das unterschiedliche Herangehen der Lexikographen relevant waren. Bevorzugte Marker sind auch im Duden-GWB4: das Zeichen *7, die Abkürzungen R (für Redensart), Ü (für Übertragung, bildlichen Gebrauch)8, S (für Sprichwort)9 und
7 Laut Abkürzungsverzeichnis kennzeichnet das Sternchen idiomatische Ausdrücke (*in einem/im gleichen Boot sitzen). 8 Im Unterschied zu Duden-GWB2 und Duden-GWB3, wo Ü lediglich für Übertragung steht. 9 Im Unterschied zu Duden-GWB2 und Duden-GWB3, wo die Abkürzung Spr lautet.
96
Diana Stantcheva
die metasprachlichen Kommentare (nur)/(meist) (noch) in der Verbindung, (nur)/ (meist) in der Wendung/in den Wendungen, (nur)/(meist) in der Fügung, die ihrer Position nach in der Regel vor dem Identifikationsteil10 und nur in seltenen Fällen danach stehen. Die metasprachlichen Kommentare werden allerdings in den Wörterbuchzusätzen nicht erwähnt. Nicht erläutert bleibt auch der Unterschied zwischen den einzelnen Markern, ob damit lediglich terminologische Vielfalt gegeben ist oder unterschiedliche phraseologische Phänomene bezeichnet worden sind. Besonders problematisch sind in dieser Hinsicht die Abkürzungen R, Ü sowie die metasprachlichen Kommentare in Korrelation zu dem Zeichen * und zur Abkürzung S. Auf die Tatsache, dass viele Sprichwörter im Duden-GWB3 fälschlicherweise mit R statt mit Spr gekennzeichnet worden sind, was auch auf Duden-GWB4 zutrifft, macht Mieder (2002) aufmerksam. Ein zusätzliches Mittel zur Kennzeichnung der Phraseologismen im Duden-GWB4, ähnlich wie in den gedruckten Wörterbüchern, ist der halbfette Druck des Identifikationsteils mancher phraseologischer Einheiten. Leider ist diese Kennzeichnungsart nicht bei allen phraseologischen Einheiten angewandt worden, sondern lediglich bei denen, die ohnehin durch den Asteriskus oder durch manche der metasprachlichen Kommentare hervorgehoben sind. Auch im Duden Online gibt es phraseologische Einheiten, die nicht als solche gekennzeichnet worden sind (vgl. z. B. Abb. 4, Beispiele, jemandem nicht in die Augen sehen können). Meistens sind es solche, die auch in vorherigen Ausgaben der Duden-Wörterbücher nicht markiert worden sind. Wenn phraseologische Einheiten als Synonyme für ein Wort oder für eine Wortverbindung im Duden Online fungieren, werden sie ebenfalls nicht gekennzeichnet. Werden Phraseologismen markiert, geschieht dies jedoch im Vergleich zum Duden-GWB4 und zu den gedruckten DudenWörterbüchern unterschiedlich. Auf das typographische Mittel, phraseologische Einheiten durch halbfetten Druck zu kennzeichnen, wurde erstens gänzlich verzichtet. Die zweite Änderung ist die Gruppierung der Marker zu einem kettenartigen metasprachlichen Kommentar. Dieser ist in den Einträgen optisch von den restlichen Wörterbuchangaben abgehoben und leitet ganze Reihen von phraseologischen Einheiten ohne Differenzierung ein. Man vergleiche das Beispiel aus dem Wörterbucheintrag zu Auge (Abb. 4). Die Aufzählung der Marker Wendungen, Redensarten, Sprichwörter ist als Indiz zu werten, dass die einzelnen Begriffe für die Lexikographen unterschiedliche sprachliche Phänomene bezeichnen. Unklar bleibt es jedoch, welche von den verzeichneten phraseologischen Einheiten als welche zu bestimmen sind. Da aber die Begriffe Wendung, Redensart, Sprichwort als Lemmata für synonym gehalten werden, bleibt es
10 Unter Identifikationsteil wird im vorliegenden Beitrag die festgelegte Ausgangsform des phraseologischen Lemmas (i. e. die Nennform jmdm. Brief und Siegel auf etw. geben) bzw. ein aktualisiertes Beispiel (darauf gebe ich dir Brief und Siegel) verstanden, wenn keine neutrale Nennform vorhanden ist.
Zur Darstellung von Phraseologismen im Duden Online
97
für den Wörterbuchbenutzer unklar, worin der Unterschied zwischen den drei aufgezählten Termini in den Wörterbuchartikeln bestehen sollte. Neu ist diese Kennzeichnungsmethode nicht, sie wird auch in älteren gedruckten Nachschlagewerken des Deutschen verwendet, wie z. B. in den Wörterbüchern von Sanders und Grimm, auch in ihrer Neubearbeitung (vgl. Stantcheva 2003, 2012 und 2015). Neu ist hier nur, dass der kettenartige metasprachliche Kommentar Wendungen, Redensarten, Sprichwörter phraseologische Einheiten kennzeichnet, die im Duden-GWB4 und in den alten Duden-Wörterbüchern durch die platzökonomischeren Marker *, R, S, Spr markiert wurden. Auf diese Marker wurde im Duden Online verzichtet. Ein weiterer metasprachlicher Kommentar im Duden Online ist in übertragener Bedeutung. Damit werden Phraseologismen gekennzeichnet, die im Duden-GWB4 und
Abb. 4: Ausschnitt aus dem Wörterbuchartikel zu Auge im Duden Online.
98
Diana Stantcheva
in den alten Duden-Wörterbüchern mit dem Marker Ü versehen wurden. So gekennzeichnete Phraseologismen werden im Duden Online zu den Beispielen gerechnet, man vergleiche den folgenden Auszug aus dem Wörterbucheintrag zu Strafe (Abb. 5).11
Abb. 5: Ausschnitt aus dem Wörterbuchartikel zu Strafe im Duden Online.
11 Auffällig ist die Kursivierung der Bedeutungserläuterungen der Phraseologismen, die mit in übertragener Bedeutung markiert wurden, im Unterschied zu den Bedeutungserläuterungen der Phraseologismen unter Auge, Wendungen, Redensarten, Sprichwörter (siehe oben Abb. 4), die nicht kursiv gesetzt sind.
Zur Darstellung von Phraseologismen im Duden Online
99
6 Behandlung der externen Valenz Die externe Valenz12 wird in allen beobachteten Duden-Wörterbüchern sehr ähnlich gehandhabt. Sie wird zum Teil durch den Identifikationsteil der phraseologischen Wörterbucheinträge zum Ausdruck gebracht, zum Teil aber auch außer Acht gelassen. Eine Regelmäßigkeit lässt sich dabei nicht erkennen. In den Wörterbuchartikeln stehen phraseologische Einheiten nebeneinander, in denen die externe Valenz gekennzeichnet ist, und solche ohne Angabe der Valenz. Die Valenz wird in beiden Wörterbüchern in der Regel wie folgt dargestellt: (1) Durch die Strukturformeln jemanden, jemandem, jemand, die den Kasus signalisieren. Die Strukturformeln jemandes, etwas (als Platzhalter für Präpositionalobjekte) und sich geben dagegen keine Auskunft über die Valenz (vgl. Tab. 1). Der einzige Unterschied dieser zwei Wörterbücher im Vergleich zu deren gedruckten Vorgängern besteht hierzu darin, dass die Strukturformeln in den beiden elektronischen Wörterbüchern nicht abgekürzt werden. Dadurch aber, dass sie ausgeschrieben werden, ist keine präzise Unterscheidung zwischen Phraseologismen möglich, in denen etwas als obligatorische Komponente vorkommt (z. B. sich etwas antun), und Phraseologismen, in denen etwas Platzhalter ist und nie als indefinites Nomen im Gebrauch des Phraseologismus realisiert wird (z. B. etw. ist gang und gäbe). Über eine solche nutzerorientierte Unterscheidung besteht in der Phraseologieforschung seit Jahren Konsens (vgl. Fellbaum/Kramer/Stantcheva 2004). (2) Die externe Valenz wird in den aktualisierten Beispielen durch die Deklination zum Ausdruck gebracht (vgl. Tab. 1 unter Gerechtigkeit und Strafe). (3) Gelegentlich wird der Kasus auch explizit (in Klammern) angegeben (vgl. Tab. 1 unter 1Hals und antun). Unvollständige Identifikationsteile, in denen die externe Valenz weggelassen wird, sind in den beiden elektronischen Wörterbüchern auch zu finden (vgl. Tab. 1 unter gang). In Tabelle 1 ist die externe Valenz durch Fettdruck und deren Fehlen durch ein fettgedrucktes Fragezeichen markiert.
12 Mit dem Begriff externe Valenz werden im vorliegenden Beitrag die syntaktischen Leerstellen bezeichnet, welche beliebig in einem semantischen Rahmen ausgefüllt werden können und durch die allgemeinen Formeln (auch Strukturformeln genannt, vgl. Gouws 1998) jemand, jemanden, jemandem, jemandes, etwas (mit Kasus), sich (mit Kasus) in der Nennform signalisiert werden (vgl. Burger 2010).
100
Diana Stantcheva
Tab. 1: Behandlung der externen Valenz von Phraseologismen im Duden-GWB4 und Duden Online. Duden-GWB4 1
Duden Online 1
unter Hals sich jemanden, etwas vom Hals[e] schaffen
unter Hals sich jemanden, etwas vom Hals[e] schaffen
unter Brief jemandem Brief und Siegel [auf etwas (?)] geben
unter Brief jemandem Brief und Siegel [auf etwas (?)] geben
unter Schuld [an etwas (?)] Schuld haben sich (?) etwas zu Schulden kommen lassen [tief] in jemandes (?) Schuld sein/stehen
unter Schuld [an etwas (?)] Schuld haben sich (?) etwas zu Schulden kommen lassen [tief] in jemandes (?) Schuld sein/stehen
unter gang ? gang und gäbe sein, (landschaftlich auch:) gäng und gäbe sein
unter gang ? gang und gäbe sein, (landschaftlich auch:) gäng und gäbe sein
unter antun sich etwas antun
unter antun sich etwas antun
unter Gerechtigkeit einen Verbrecher den Händen der Gerechtigkeit übergeben
unter Gerechtigkeit einen Verbrecher den Händen der Gerechtigkeit übergeben
unter Strafe auf dieses Delikt steht eine hohe Strafe (es wird hart bestraft)
unter Strafe auf dieses Delikt steht eine hohe Strafe (es wird hart bestraft)
7 Zur phraseologischen Grenze Beim Problem der Grenze der phraseologischen Einheiten handelt sich um die lexikographisch wichtige Frage, welche Wörter zum unmittelbaren Komponentenbestand eines Phraseologismus zählen und welche nur Kontextelemente sind (die letzteren können zwischen den Komponenten, vor und nach der phraseologischen Einheit stehen, vgl. Nitcheva 1987: 72): Ob z. B. in sich vor den Schranken des Gerichts verantworten und vor den Schranken des Gerichts erscheinen die Verben verantworten und erscheinen zur Nennform gehören oder die eigentliche phraseologische Einheit vor den Schranken des Gerichts lautet.13
13 In Stantcheva (2003) habe ich die Frage der phraseologischen Grenze ausführlich behandelt und festgestellt, dass in der deutschen Lexikographie seit Adelung diesem lexikographischen Problem kaum Beachtung geschenkt wird und dass die phraseologischen Einheiten dem subjektiven Ermessen der Lexikographen nach unterschiedlich dargestellt werden.
Zur Darstellung von Phraseologismen im Duden Online
101
Was die Grenze phraseologischer Einheiten und die Probleme ihrer Darstellung im Wörterverzeichnis betrifft, ist die Situation in allen Duden-Wörterbüchern vergleichbar. Es können traditionelle Verfahrensweisen nachgewiesen werden, obwohl es heutzutage anhand der Korpora geschriebener Sprache viel einfacher sein dürfte, den unmittelbaren Komponentenbestand eines Phraseologismus zu ermitteln:14 (1) Lemmatisiert wird der Phraseologismus im engeren Sinne (vgl. Tab. 2, das Gesetz des Dschungels, ein ungeschriebenes Gesetz). (2) Der Identifikationsteil stellt die phraseologische Einheit in ihrer „obligatorischen lexikalischen Umgebung“ (Worbs 1994: 103f.) dar (Phraseologismus im weiteren Sinne, vgl. Tab. 2, von Tisch und Bett getrennt sein, leben). (3) Dem Identifikationsteil (Phraseologismus im engeren Sinne) folgen bei dieser Methode Bedeutungserläuterung und Illustrationsbeispiele (authentische Belege und vom Lexikographen konstruierte Beispiele im Duden-GWB4 und nur vom Lexikographen konstruierte Beispiele im Duden Online15, die die obligatorische lexikalische Umgebung des Phraseologismus zum Ausdruck bringen, vgl. Tab. 2 unter Hab bzw. unter Hab und Gut). Tab. 2: Darstellung der phraseologischen Grenze im Duden-GWB4 und Duden Online. Duden-GWB4
Duden Online
unter Gesetz das Gesetz des Dschungels ein ungeschriebenes Gesetz
unter Gesetz das Gesetz des Dschungels ein ungeschriebenes Gesetz
unter Tisch von Tisch und Bett getrennt sein, leben
unter Tisch von Tisch und Bett getrennt sein, leben
unter Hab Hab und Gut (gehoben; alles, was jemand besitzt): sein ganzes Hab und Gut verschenken; Alec … akzeptierte …, dass … sie ihren vollen Anteil an seinem Hab und Gut verdiente (Ruark [Übers.], Honigsauger 473).
unter Hab und Gut Hab und Gut alles, was jemand besitzt Beispiel sein ganzes Hab und Gut verschenken
14 Ein solches Verfahren zur Ermittlung des unmittelbaren Komponentenbestandes von Idiomen und zur Abgrenzung der Komponenten von wendungsexternen Elementen anhand von Korpora geschriebener Sprache wurde z. B. in Stantcheva (2004) präsentiert. 15 Wahrscheinlich aus urheberrechtlichen Gründen verzichtet Duden Online im Unterschied zum Duden-GWB4 ganz auf authentische Belege im Wörterverzeichnis.
102
Diana Stantcheva
8 Fazit Die Darstellung von Phraseologismen im Duden-GWB4 und Duden Online unterscheidet sich kaum voneinander und von der Darstellung von Phraseologismen in den vorherigen Auflagen des Printwörterbuchs. Die Erkenntnisse aus der Phraseologieforschung wurden leider in den lexikographischen Prozess erneut nicht einbezogen. Während die Probleme der makro- und mikrostrukturellen Zuordnung der Phraseologismen durch die Suchmodalitäten der elektronischen Medien ausgeglichen werden, wirken sich die Unzulänglichkeiten bei der Kennzeichnung der phraseologischen Einheiten, bei der verwendeten phraseologischen Terminologie, beim Umgang mit Fragen der externen Valenz und der Bestimmung des eigentlichen Komponentenbestandes negativ auf die Qualität der zwei elektronischen Wörterbücher aus. Als besonders problematisch in diesem Zusammenhang erweisen sich die Synonymien bei den phraseologischen Termini und die Gruppierung der Marker zu einem metasprachlichen Kommentar im Duden Online, durch den ganze Reihen von phraseologischen Einheiten ohne eine Ausdifferenzierung eingeleitet werden.
Literatur Monografien und Aufsätze Burger, Harald (2010): Phraseologie: Eine Einführung am Beispiel des Deutschen. 4., neu bearb. Aufl. Berlin: Erich Schmidt. Fellbaum, Christiane/Kramer, Undine/Stantcheva, Diana (2004): Eins, einen und etwas in deutschen VP-Idiomen. In: Steyer, Kathrin (Hrsg.): Wortverbindungen – mehr oder weniger fest. Jahrbuch des Instituts für Deutsche Sprache 2003. Berlin/New York: De Gruyter, 167–193. Gouws, Rufus Hjalmar (1998): Das System der sogenannten Strukturformeln in Langenscheidts Grosswörterbuch Deutsch als Fremdsprache: eine kritische Übersicht. In: Wiegand, Herbert Ernst (Hrsg.): Perspektiven der pädagogischen Lexikographie des Deutschen: Untersuchungen anhand von „Langenscheidts Großwörterbuch Deutsch als Fremdsprache“. Tübingen: Max Niemeyer, 63–76. Mieder, Wolfgang (2002): Sprichwörter im GWDS. In: Wiegand, Herbert Ernst (Hrsg.): Untersuchungen zur kommerziellen Lexikographie der deutschen Gegenwartssprache 1. Duden. Das große Wörterbuch der deutschen Sprache in zehn Bänden. Tübingen: Max Niemeyer, 413–436. Neubauer, Fritz (1980): Die Struktur der Explikationen in deutschen einsprachigen Wörterbüchern: Eine vergleichende lexiko-semantische Analyse. Hamburg: Helmut Buske. Nitcheva, Keti Najtchova (1987): Българска фразеология. (Bulgarische Phraseologie). Sofija: Nauka i izkustvo. Petermann, Jürgen (1983): Zur Erstellung ein- und zweisprachiger phraseologischer Wörterbücher: Prinzipien der formalen Gestaltung und der Einordnung von Phrasemen. In: Matešić, Josip (Hrsg.): Phraseologie und ihre Aufgaben. Beiträge zum 1. Internationalen PhraseologieSymposium vom 12. bis 14. Oktober 1981 in Mannheim. Heidelberg: Julius Groos, 172–191.
Zur Darstellung von Phraseologismen im Duden Online
103
Stantcheva, Diana (1999): Zum Stellenwert der Phraseologie im einsprachigen deutschen Bedeutungswörterbuch des 20. Jahrhunderts. In: Linguistik online 3, 2. [Unter: ; letzter Zugriff: 2. 2. 2017]. Stantcheva, Diana (2002): Tradition und/oder Dynamik in der Kennzeichnung von Phraseologismen im allgemeinen einsprachigen Wörterbuch des Deutschen. In: Kramer, Undine (Hrsg.): Archaismen – Archaisierungsprozesse – Sprachdynamik: Klaus-Dieter Ludwig zum 65. Geburtstag. Frankfurt am Main etc.: Peter Lang, 263–296. Stantcheva, Diana (2003): Phraseologismen in deutschen Wörterbüchern. Ein Beitrag zur Geschichte der lexikographischen Behandlung von Phraseologismen im allgemeinen einsprachigen Wörterbuch von Adelung bis zur Gegenwart. Hamburg: Dr. Kovač. Stantcheva, Diana (2004): Ermittlung des Komponentenbestandes von Idiomen. Versuch eines Modells. In: Williams, Geoffrey/Vessier, Sandra (Hrsg.): Proceedings of the 11th EURALEX International Congress, EURALEX 2004, Lorient (France). Volume II, Lorient : Lorient Université de Bretagne-Sud, 767–778. Stantcheva, Diana (2012): Angaben zu phraseologischen Phänomenen im Deutschen Wörterbuch von Jacob Grimm und Wilhelm Grimm. In: Filatkina, Natalia et al. (Hrsg.): Aspekte der historischen Phraseologie und Phraseographie. Heidelberg: Universitätsverlag Winter, 245–261. Stantcheva, Diana (2015): Phraseologische Terminologie im „Deutschen Wörterbuch“ der Brüder Grimm – die Erstausgabe (1854–1971) und die Neubearbeitung (1965–2013) im Vergleich. In: Grozeva-Minkova, Maria et al. (Hrsg.): Germanistik in Bulgarien. Band 1. Sofija: Nov blgarski universitet, 139–158. Worbs, Erika (1994): Theorie und Praxis der slawisch-deutschen Phraseographie. Mainz: Liber Verlag.
Wörterbücher Adelung = Grammatisch-kritisches Wörterbuch der Hochdeutschen Mundart, mit beständiger Vergleichung der übrigen Mundarten, besonders aber der Oberdeutschen. In vier Theilen. Von Adelung, Johann Christoph. Zweyte vermehrte und verbesserte Ausgabe. Leipzig: J. G. I. Breitkopf und Compagnie, 1793–1801. (2. Nachdruck dieser Ausgabe 1990. Mit einer Einführung und Bibliographie von Helmut Henne. Hildesheim/Zürich/New York: Georg Olms). Duden-GWB1 = Duden Das große Wörterbuch der deutschen Sprache. In sechs Bänden. Hrsg. und bearb. vom Wissenschaftlichen Rat und den Mitarbeitern der Dudenredaktion unter Leitung von Günther Drosdowski. Mannheim/Wien/Zürich: Bibliographisches Institut, 1976–1981. Duden-GWB2 = Duden Das große Wörterbuch der deutschen Sprache. In acht Bänden. 2., völlig neu bearb. und stark erw. Aufl. Hrsg. und bearb. vom Wissenschaftlichen Rat und den Mitarbeitern der Dudenredaktion unter Leitung von Günther Drosdowski. Mannheim etc.: Dudenverlag, 1993–1995. Duden-GWB3 = Duden Das große Wörterbuch der deutschen Sprache. In zehn Bänden. 3., völlig neu bearb. und erw. Aufl. Hrsg. vom Wissenschaftlichen Rat der Dudenredaktion. Mannheim etc.: Dudenverlag, 1999. Duden-GWB3 = DUDEN Das große Wörterbuch der deutschen Sprache. In zehn Bänden auf CD-ROM. 3., völlig neu bearb. und erw. Aufl. Hrsg. vom Wissenschaftlichen Rat der Dudenredaktion. Mannheim: Bibliographisches Institut & Brockhaus, 2000. Duden-GWB4 = DUDEN Das große Wörterbuch der deutschen Sprache: In zehn Bänden auf CD-ROM. 4., vollständig überarb. Aufl. Hrsg. von der Dudenredaktion. Mannheim: Bibliographisches Institut, 2012.
104
Diana Stantcheva
Duden Online = Duden Online-Wörterbuch. [Unter: ; letzter Zugriff: 2. 2. 2017]. Grimm = Deutsches Wörterbuch. In 32 Bänden sowie Quellenverzeichnis. Von Grimm, Jacob/Grimm, Wilhelm. Fotomechanischer Nachdruck der Erstausgabe 1854–1971. München: Deutscher Taschenbuchverlag, 1984. Grimm Neubearbeitung = Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm. Neubearbeitung. Hrsg. von der Berlin-Brandenburgischen Akademie der Wissenschaften und der Akademie der Wissenschaften zu Göttingen. Stuttgart: Hirzel Verlag, 1965–2013. Sanders = Wörterbuch der Deutschen Sprache. Mit Belegen von Luther bis auf die Gegenwart. Von Sanders, Daniel. Leipzig: Otto Wigand. Bd. 1. A–K 1860; Bd. 2.1 L–R 1863; Bd. 2.2 S–Z 1865.
Teil II: Theorie der Wörterbuchform und ihr Einsatz in der zweisprachigen Lexikographie
Peter Ďurčo
Vom Nutzen der vergleichbaren Korpora bei der kontrastiven lexikographischen Erfassung von Mehrworteinheiten 1 Einleitung Computereinsatz in der Lexikographie eröffnet viele neue methodisch-methodologische Aspekte für die empirischen Sprachdatenermittlungen bezüglich der Extraktion und Untersuchung von parallelen Sprachstrukturen und Phänomenen. Die neuen Werkzeuge und gewonnenen Daten werfen ein anderes Licht auf die traditionellen Fragen der (bilingualen) Lexikographie. Um große mehrsprachige Korpora bei der kontrastiven Analyse effizient einsetzen zu können, müssen sie in vergleichbarer Weise und mit geeigneten vergleichbaren Instrumenten erstellt werden. Im Unterschied zu Parallelkorpora bieten die sog. vergleichbaren Korpora Daten und Analyseinstrumente, die den Kriterien der Vergleichbarkeit im technischen und auch im inhaltlichen Sinne viel mehr entsprechen. Vergleichbar (comparable) sind Korpora mit gleichen Charakteristiken, d. h. mit gleichem Umfang, gleichen Domänen, bearbeitet in der gleichen Zeit, aufbereitet mit derselben Methodologie mit sprachlich unabhängigen identischen Tools, mit kompatibler formalen Suchanfragesprache und kompatiblen formalen Grammatiken. Ein neues Werkzeug stellen die sogenannten bilingualen Wortskizzen dar, die die Analyse von Ähnlichkeiten (oder Differenzen) der Kollokationsprofile für die Lexeme und ihre Äquivalente anbieten. An Beispielen der kollokationellen Parallelen, kollokationellen Präferenzen und Divergenzen, kollokationeller Kompatibilität und des kollokationellen Verhaltens wollen wir die Nutzung der vergleichbaren Korpora bei der Untersuchung der typischen, usuellen und lexikalisierten Einheiten demonstrieren. Auf der Basis von Aranea Gigaword Web Korpora,1 einer Familie vergleichbarer Korpora, die für den Einsatz in der kontrastiven Sprachforschung, der mehrsprachigen Lexikographie sowie für den Unterricht von Fremdsprachen und Übersetzungsstudien gedacht ist, diskutieren wir die Vor- und Nachteile vergleichbarer Korpora im Gegensatz zu monolingualen und parallelen Korpora für die Analyse
1 http://ucts.uniba.sk/aranea_about. Peter Ďurčo: Univerzita sv. Cyrila a Metoda v Trnave, Filozofická fakulta, Námestie Jozefa Herdu 2, 917 01 Trnava, Slovenská republika, [email protected] https://doi.org/10.1515/9783110598650-007
108
Peter Ďurčo
von Mehrworteinheiten (MWE). Wir zeigen, dass durch die Verwendung von großen Korpora für zwei oder mehr Sprachen, bestehend aus nicht verwandten Texten, die in vergleichbarer Weise erstellt wurden, parallele Sprachstrukturen und Phänomene wie MWE identifiziert werden können, wenn entsprechende Werkzeuge beteiligt sind. Mit den Aranea Korpora ist die zweisprachige Skizze-Funktionalität (bilingual sketch) in Sketch Engine ein solches Werkzeug, das einen neuen Ansatz für Analysen von Ähnlichkeiten (oder Unterschieden) von Kollokationsprofilen (Wortskizzen) für Wörter und deren Übersetzungsäquivalente bietet.
2 Vergleichbare Korpora Textkorpora können in Bezug auf Sprache einsprachig oder zwei- und mehrsprachig sein. Bei bi- oder multilingualen Korpora gibt es zwei Grundtypen: parallele Korpora (gegenseitige Übersetzungen von Texten) und vergleichbare Korpora (Texte mit gemeinsamen Merkmalen wie die gleichen Domänen, Genres, Register, gleiche Entstehungszeit, gleiche Größe, kompatible Strategie der Annotation etc.). Alle Arten von Korpora können auch für einen Vergleich von Sprachdaten verwendet werden. Wir können ähnliche Phänomene in monolingualen Korpora unabhängig analysieren und vergleichen und die Ergebnisse introspektiv bewerten. Eine weitere Vergleichsqualität ermöglichen zwei- und mehrsprachige Korpora mit unterschiedlichem Vergleichsgrad. Wir können zum Beispiel als völlig parallel die lokalisierten Übersetzungen von Benutzerhandbüchern betrachten. Als stark vergleichbar können die Nachrichten über dieselben Ereignisse oder Wikipedia-Artikel in verschiedenen Sprachen betrachtet werden, als annähernd/schwach vergleichbar sind Texte aus derselben Domäne und Genre, die verschiedene Ereignisse beschreiben, z. B. Parlamentarische Debatten über die gleiche Frage aus verschiedenen Ländern. Sicherlich können wir auch nicht verwandte Texte wie Internettexte in kontrastiver Forschung nutzen. Das zentrale Problem ist die Schwäche des Konzepts der Vergleichbarkeit in mehrsprachigen Korpora unter Experten. Es gibt noch keine Einigkeit über die Art der Ähnlichkeit, denn es gibt nur wenige Beispiele für vergleichbare Korpora. Die Möglichkeiten eines vergleichbaren Korpus sind, verschiedene Sprachen oder Textsorten unter ähnlichen Umständen der Kommunikation zu vergleichen und die unvermeidliche Verzerrung, die durch die Übersetzung eines parallelen Korpus eingeführt wird, zu eliminieren. Es ist auch schwierig, Texte zu finden, die nicht durch anglo-amerikanische Terminologie und Textkonventionen kontaminiert wurden. Gegenwärtig gibt es viele Zentren, die Textmaterial in mehreren Sprachen gesammelt haben, aber solange sich die Sammlungen nicht gemeinsame Merkmale der Auswahl, zumindest auf der Ebene des vergleichbaren Korpus teilen, dann sind sie nur Textressourcen in verschiedenen Sprachen. Es erscheint daher nicht sinnvoll, den Begriff mehrsprachiges Korpus zu verwenden.
Vom Nutzen der vergleichbaren Korpora
109
Um die Frage zu beantworten, inwieweit Texte „ähnlich“ und Korpora „vergleichbar“ sein können, betont Maia (2003) die Bedeutung der Entscheidung über die Idee der Ähnlichkeit in Bezug auf Form und Inhalt. Mit anderen Worten: Idealerweise sollten sie eine ähnliche Struktur, die Größe des Korpus, die Natur der einzelnen Texte in Bezug auf Wörter, Sätze und Paragraphen, Formate, Sprachbereiche (allgemeine oder spezialisierte Sprache), Themenbereiche, Modi, Dialekte, geographische Faktoren, zeitliche Faktoren oder auch soziale Faktoren berücksichtigen. Maia unterscheidet weiterhin die vergleichbaren Korpora (ähnlich in der Größe und konstruiert nach gleichen Kriterien) von „konkurrierenden“ Korpora, also von den Korpora, die zum demselben Thema oder Nachrichten in mehreren Zeitungen zu einem Thema gesammelt werden (ebenda). In der jüngsten Übersicht über die Erforschung vergleichbarer Korpora (vgl. Sharoff/Rapp/Zweigenbaum 2016) beschreiben die Autoren die zwanzigjährige Entwicklung der Verwendung vergleichbarer Korpora für die Extraktion von zweisprachigen Wörterbüchern und für statistische Maschinenübersetzung. Es gibt viele verschiedene Algorithmen, die übereinstimmende Wörter in vergleichbaren Korpora identifizieren, wie Häufigkeit des Auftretens, Kovorkommenszählungen, Zählungen von lexiko-morphologischen und syntaktischen Mustern oder von Abhängigkeitsbeziehungen, Assoziationsmaßen, Ähnlichkeitsmaßen, hierarchischen Informationen, Kovorkommen in vergleichbaren Dokumenten etc. Die Autoren betonen, dass es für die Forschung nicht notwendig ist, zu durchsuchen, welcher Algorithmus besser ist. Sie versuchen stattdessen, alle miteinander zu kombinieren und auf die Stärken jeder Art von Information und Funktion zu bündeln. Das kann eine Möglichkeit sein, die Informationen zu gewichten und sie in einer optimalen Weise zu kombinieren, um Wortübersetzungen in vergleichbaren Korpora zu identifizieren, wobei man das Beste aus jeder Methode wählt (vgl. Sharoff/Rapp/Zweigenbaum 2016: 12). Um zu verallgemeinern, ist die Vergleichbarkeit in mehrsprachigen Korpora immer noch ein unscharfes Konzept, das alternative Definitionen erhalten hat, ohne einen allgemeinen Konsens zu erreichen.
2.1 Aranea Vergleichbare Korpora Korpora der gleichen Größe, die in gleicher Weise geschaffen wurden, könnten die Bezeichnung „vergleichbar“ weitgehend verdienen. Aranea ist eine Familie von Webkorpora, die für den Einsatz in kontrastiver Sprachforschung, mehrsprachiger Lexikographie sowie für Fremdsprachen und Übersetzungsstudien gedacht ist. Das Aranea-Projekt ist ein fortlaufendes Experiment, das darauf abzielt, eine Familie von Milliarden-Token-Web-Korpora zu schaffen, die von der gleichen Größe sind. Die Korpora enthalten Daten aus ähnlichen web-spezifischen Domänen, Genres und Register, die durch das Crawling des Internets bei ungefähr der gleichen Zeit gesammelt wurden. Die Daten wurden weiter vorverarbeitet, gefiltert und durch dieselbe
110
Peter Ďurčo
Werkzeuge dedupliziert, morphologisch durch (ggf.) denselben Tagger annotiert und über Sketch Engine zur Verfügung gestellt. Die Daten wurden aus dem Internet heruntergeladen und von denselben Open-Source- und Free-Tools (SpiderLing und jusText für Crawling und Preprocessing, Unitok für Tokenisierung, Onion für Deduplizierung und Tree Tagger für die Tagging der meisten Sprachen) verarbeitet (vgl. Benko 2013, 2014a). Die sprachunabhängige Bearbeitung erfolgt durch dieselben Werkzeuge und beinhaltet kompatible Tokenisierung, Satzsegmentierung von Dokumenten, Absatzund Satz-Deduplizierung, PoS-Tagging (morphologische Annotierung) durch (ggf.) freie Werkzeuge. Die nativen Tagsets wurden in Araneum Universal Tagset (AUT) abgebildet und die Word Sketch-Option arbeitet mit kompatiblen Sketch Grammatiken (CSG) (vgl. Benko 2014b). Um das Problem der großen Unterschiede in den vorhandenen Sketch-Grammatiken für die jeweiligen Sprachen zu überwinden, wurde ein Set von „kompatiblen“ Sketch-Grammatiken, für die kontrastive sprachliche Forschung und zweisprachige lexikographische Projekte geschrieben. Die Sketch-Grammatiken verwenden einen einheitlichen Satz von Regeln für alle Wortkategorien (Wortarten) und der daraus resultierende Satz von Tabellen wird in einer festen Reihenfolge in allen Sprachen angezeigt. Die Motivation für die Gründung eines neuen Korpusprojektes war der Mangel an geeigneten Korpora, die von Studenten der Fremdsprachen und Übersetzstudien an Universitäten in der Slowakei genutzt werden könnten. Die positive Motivation für die Schaffung neuer Art von Korpora ist, dass neue (Open-Source-)Werkzeuge verfügbar wurden. Die negative Motivation ist, dass die vorhandenen Web-Korpora-Familien, die zum Download zur Verfügung stehen, nicht alle benötigten Sprachen abdecken und unterschiedliche Benutzeroberflächen haben. Die Korpora, die auf der Sketch Engine-Website gespeichert sind, sind nicht zum Download verfügbar, sind meist zu groß für den Unterricht und haben zu verschiedene Sketch-Grammatiken. Das macht es schwierig, diese Korpora in einem gemischten Klassenzimmer zu verwenden. Eine Reihe von Korpora für mehrere Sprachen gleicher Größe und erbaut durch eine standardisierte Methodik kann nicht nur für Lehrzwecke, sondern auch in anderen Bereichen der sprachlichen Forschung (kontrastive Studien) und in der Lexikographie (sowohl ein- als auch zweisprachig) verwendet werden.
2.2 Die kompatible Sketch-Grammatik Die kompatible Sketch-Grammatik (CSG), die in der Sketch Engine (SkE) Installation verwendet wurde, wurde für eine lexikographische Verwendung optimiert und unterscheidet sich in mehreren Aspekten von den meisten „traditionellen“ Grammatiken für Korpora, die auf der SkE-Website gespeichert sind. Die Regelnamen sind nicht syntaktisch motiviert (d. h. sie geben nicht die syntaktische Beziehung zwischen dem Schlüsselwort und dem Kollokator an), sondern eher kollokationelle Relatio-
Vom Nutzen der vergleichbaren Korpora
111
nen. Die rechte oder linke Position des Kollokators zum Schlüsselwort wird explizit im Regelnamen angegeben. Die Wortart des Schlüsselwortes in der jeweiligen Regel ist nicht spezifiziert, d. h. es deckt alle Wortarten ab. Recall wird vor Präzision bevorzugt, einige Tabellen sind möglicherweise nicht für alle Wortklassen relevant, somit kann Output viel Geräusch enthalten. Die Anzahl der Regeln und die Reihenfolge der resultierenden Tabellen sind festgelegt. Da alle „nativen“ Tag-Sets auf AUT abgebildet wurden, war es möglich, kompatible Sketch-Grammatiken für die Sketch Engine für alle beteiligten Sprachen zu erstellen. Die CSG verwendet das Symbol X für das Schlüsselwort, Y für die Kollokatoren eines beliebigen PoS, mit Ausnahme von Konjunktion, Präposition und Interpunktion und Z für Kollokatoren von PoS, die durch explizite Regeln nicht abgedeckt sind. Eine kollokationsspezifische Sketch-Grammatik hat (gegenüber einer traditionellen) mehrere Vorteile. Sie kann symmetrisch alle Beziehungen zwischen Schlüsselwörtern und Kollokatoren aller Wortklassen (Wortarten) abdecken. Leider bildet die CSG keine getrennten Wörter wie trennbare Präfixe und ihre Wortstämme im Deutschen ab.
3 Mehrworteinheiten in vergleichbaren Korpora Vergleichbare Korpora können für die Extraktion und den Vergleich von Mehrworteinheiten (MWE) effektiv verwendet werden. Im Workshop über Mehrworteinheiten in der maschinellen Übersetzungstechnik (MUMTTT 2015) in Malaga haben wir einige Ergebnisse unserer Analysen und Beobachtungen vorgestellt (vgl. Benko/Ďurčo 2015: 40–42). Zunächst ist es möglich, Sketch-Differenz-Tool zur Identifizierung der Präferenzen in der üblichen und festen Kollokabilität von Wörtern in verglichenen Sprachen zu verwenden, zweitens können wir die Kollokationsprofile separat extrahieren, Kollokationen unabhängig voneinander in verglichenen Sprachen berechnen und die Fälle von Identitäten, Inklusionen verschiedener Art und Inkompatibilitäten der verglichenen Schlüsselwörter auswerten. Eine andere Möglichkeit besteht darin, nach geeigneten oder bevorzugten Äquivalenten zu suchen.
3.1 Konkurrenz von monolingualen und vergleichbaren Korpora Die erste Frage ist, ob sich die Ergebnisse der Analyse von MWE in monolingualen Korpora signifikant von den Ergebnissen in vergleichbaren Korpora unterscheiden. Bei der Analyse der markantesten Phänomene der Sprache sollte dies nicht der Fall sein, wenn die Korpora in Ausgewogenheit und Repräsentativität gleich sind. Wir können diese Annahme am Beispiel der Kollokationen mit dem englischen Schlüsselwort foreigner in verschiedenen Korpora verifizieren.
112
Peter Ďurčo
3.1.1 Intralinguale Skizzen im monolingualen vs. vergleichbaren Korpus Ein einfacher intralingualer Vergleich zweier unterschiedlicher Webkorpora zeigt das ausschlaggebende Problem der Vergleichbarkeit verschiedener Korpora. Trotz der Tatsache, dass die Korpora unterschiedliche Größen, unterschiedliche Quellen und unterschiedliche Markierungssysteme haben, sollten die markantesten Sprachphänomene in der allgemeinen Sprache im Grunde identisch sein, aber dies ist nicht der Fall. Die folgende Tabelle zeigt die links liegenden Modifikatoren für das Lemma foreigner. Wir können in den verschiedenen Korpora ein völlig anderes Bild der Präferenzen in der Kollokabilität beobachten (Abb. 1). Es gibt nur drei identische Kollokatoren unter den ersten 15 markantesten Attributen. Was ist die Konsequenz dieser Tatsache für die sprachliche Forschung? Zunächst müssen wir uns vor Augen halten, dass es kein völlig repräsentatives Korpus einer Sprache gibt und Linguisten und Lexikographen hybride Methoden, hybride Ansätze und viele verschiedene Quellen zum Gewinnen der repräsentativen Daten verwenden müssen. Araneum Anglicum 1. transient 2. wealthy 3. unauthorized 4. young 5. rich 6. Mexican 7. white 8. bloody
enTenTen13 1. non-resident 2. wealthy 3. diligent 4. skinned 5. resident 6. undocumented 7. english-speaking 8. ignorant
Araneum Anglicum 9. dark 10. perpetual 11. undocumented 12. poor 13. illegal 14. famous 15. HIV-positive
enTenTen13 9. unsuspecting 10. perpetual 11. non-eu 12. kidnapping 13. HIV-positive 14. untried 15. gullible
Abb. 1: Linke Modifikatoren zum Lemma foreigner in zwei englischen Web-Korpora.
3.1.2 Interlinguale Skizze aus monolingualen Korpora Der Vergleich des englischen Lemmas foreigner und des deutschen Lemmas Ausländer im englischen Web 2013 (enTenTen13) (Häufigkeit 167 281; 7,31 pro Million) und des deutschen Web 2013 (deTenTen13) (Häufigkeit 257 571; 12,78 pro Million) zeigt eine erstaunliche ungleichmäßige Dispersion der häufigsten Kollokatoren in den Rängen der ersten zwanzig Kollokationen (Abb. 2). Abgesehen davon, dass es praktisch keine gemeinsamen Kollokatoren gibt und die Kollokationsprofile im Bereich von den ersten zwanzig Kollokatoren disjunkt sind, beobachten wir auch einen spürbaren axiologischen Unterschied. Während die meisten englischen Kollokatoren konnotativ positiv oder neutral sind, hat fast die Hälfte der Kollokatoren im Deutschen negative Konnotationen.
Vom Nutzen der vergleichbaren Korpora
113
Neben trockenen Fakten über statistisch signifikante Kollokationen können wir auch das reale Bild über den axiologischen Status von Kollokationen mit dem jeweiligen Schlüsselwort im Diskurs erhalten. Kollokationen der Schlüsselwörter foreigner und Ausländer mit Verb Y + Nomen X als Objekt dokumentieren auffällig diese Tatsache (Abb. 3). Modifikatoren für foreigner 1. non-resident 2. wealthy 3. diligent 4. skinned 5. resident 6. undocumented 7. english-speaking 8. ignorant 9. unsuspecting 10. perpetual
Modifikatoren für Ausländer 1. kriminell 2. geduldet 3. lebend 4. ausreisepflichtig 5. straffällig 6. heimatlos 7. eingebürgert 8. eingereist 9. feindlich 10. arbeitslos
Modifikatoren für foreigner 11. non-eu 12. kidnapping 13. hiv-positive 14. speaking 15. untried 16. gullible 17. swarthy 18. dark-skinned 19. enterprising 20. bearded
Modifikatoren für Ausländer 11. unwillig 12. überzählig 13. zugewandert 14. einreisend 15. illegal 16. willig 17. wohnhaft 18. aufhaltend 19. hochqualifiziert 20. eingewandert
Abb. 2: Linke Modifikatoren zu den Lemmata foreigner und Ausländer im englischen und deutschen Web-Korpus.
foreigner 1. deport 2. expel 3. kidnap 4. marry 5. naturalize 6. persecute 7. detain 8. bar 9. abduct 10. blame 11. lure 12. domicile 13. forbid
Ausländer 1. hetzen 2. verprügeln 3. bürgern 4. überfremden 5. wettern 6. schimpfen 7. zusammenschlagen 8. hassen 9. herziehen 10. diskriminieren 11. beschimpfen 12. schüren 13. einwandern
foreigner 14. arrest 15. overcharge 16. despise 17. target 18. welcome 19. prohibit 20. attract 21. hire 22. permit 23. hate 24. import 25. ban
Ausländer 14. abschieben 15. prügeln 16. vermieten 17. heiraten 18. überfallen 19. dulden 20. verüben 21. attackieren 22. beleidigen 23. unterrichten 24. anbelangen 25. jagen
Abb. 3: Verbale Kollokatoren für foreigner und Ausländer als Objekte.
Die auffällige Tatsache ist, dass die verbalen Kollokatoren in englischer und deutscher Sprache vor allem den negativen Werten wie VIOLENCE, FORCE, HATE, DISKRIMINATION zugeordnet werden können.
114
Peter Ďurčo
3.1.3 Intralingualer Sketch Unterschied und kollokationelles Äquivalent Ein weiterer Fall der Vergleichbarkeit ist die Funktion von „sketch difference“. Der Vergleich von Kollokationsprofilen im monolingualen Korpus kann bei der Wahl der korrekten Kompatibiltät bei abweichender Äquivalenz, d. h. „eins zu mehr“ helfen. Ein großes Problem zwischen dem Slowakischen und dem Deutschen ist zum Beispiel die Entscheidung, wie man in Kollokationen des Typs Präposition + Nomen für die slowakische Präposition na die deutschen Präpositionen an oder auf verwendet. Die Profile veranschaulichen Präferenzen und Unterschiede in der Nutzung dieser interlingual ambigen Präpositionen. Dies erlaubt es, ganz klar die Fälle der verteilten Verwendung der interlingual semantisch vagen und zweideutigen Präpositionen zu verdeutlichen. Abgesehen von den „gemeinsamen Mustern“ erhalten wir auch Ergebnisse für die „nur Muster“, was gibt uns die Antwort, wie man Fälle von Poly- oder Semiäquivalenz disambiguiert, vgl.: PräpX SubstYDat 1. Ebene 2. Internetseite 3. Rang 4. Erden 5. Spur 6. Mio. 7. Startseite 8. Sofa
VerbY PräpX 1. basieren 2. beruhen 3. belaufen 4. beschränken 5. vertrauen 6. spezialisieren 7. schwören 8. fokussieren
PräpX SubstYDat 9. Leinwand 10. Hochtour 11. Bundesebene 12. Rückweg 13. Kontinent 14. Festplatte 15. Couch
VerbY PräpX 9. abstimmen 10. reduzieren 11. besinnen 12. fußen 13. beharren 14. verkürzen 15. lasten
PräpX SubstYDat 9. Institut 10. Sonnabend 11. Himmel 12. Freitagabend 13. Eingang 14. Samstagabend 15. Bedeutung
VerbY PräpX 9. klammern 10. anlehnen 11. verfassen 12. lehren 13. basteln 14. erkranken 15. klingeln
Abb. 4: Beispiele für „nur auf Muster“.
PräpX SubstYDat 1. Nachmittag 2. Bord 3. Hochschule 4. Schluss 5. Besten 6. Vormittag 7. Spieltag 8. Küste
VerbY PräpX 1. appellieren 2. grenzen 3. mangeln 4. knüpfen 5. zweifeln 6. gewöhnen 7. versterben 8. kratzen
Abb. 5: Beispiele für „nur an Muster“.
Wir können die Analyse erweitern und vertiefen und diese Daten in der Beschreibung der Grammatik und des Lexikons verwenden, aber auch diese im Fremdsprachenunterricht nutzen und die Schüler diese Analyse durchführen und die Ergebnisse bewerten lassen.
Vom Nutzen der vergleichbaren Korpora
115
3.2 Interlinguale Skizzen in vergleichbaren Korpora Aranea Vergleichbare Korpora bieten einheitliche und in gewissem Maße homogene experimentelle Plattform für die Analyse solcher Sprachphänomene wie Kollokationspräferenzen, Kollokationskompatibilität, Kollokationsäquivalenz, Kollokationsverhalten von MWE und viele andere Optionen.
3.2.1 Kollokationspräferenzen Kollokationspräferenzen können als Beweis für die unterschiedliche Verteilung von Kollokatoren durch äquivalente Schlüsselwörter in verglichenen Sprachen dienen, die (i) durch verschiedene Polysemie oder (ii) durch die Tatsache der unterschiedlichen Präsenz im Diskurs in jeder Sprache verursacht werden. Die Analyse der vergleichbaren Word Sketch (CWS) hat z. B. ganz eindeutig die Präferenzen in der Kollokabilität der verglichenen Schlüsselwörter im Deutschen und Slowakischen für Krise / kríza gezeigt: Unter den ersten 50 adjektivischen Kollokatoren gibt es nur 13, die identisch sind: (existentiell / existenčný, humanitär / humanitárny, gegenwärtig / súčasný, ökonomisch / ekonomický, innenpolitisch / vnútropolitický, derzeitig / súčasný, tief / hlboký, global / globálny, zyklisch / cyklický, systemisch / systémový, wirtschaftlich / hospodársky, jetzig / terajší, fiskalisch / fiškálny). Verschiedene erstaunliche Präferenzen können in diesem CWS entdeckt werden. Für Deutsch sind die bevorzugten Adjektive suizidal, humanitär, kapitalistisch, verschärfend, zuspitzend, existenzbedrohend, akut, überstanden. Im Vergleich zu deutschen Adjektiven, die den mentalen Zustand wie psychotisch, seelisch, psychisch, psychosozial, spirituell ausdrücken, sind die slowakischen Adjektive dieses semantischen Feldes entweder überhaupt nicht vorhanden oder sie treten sehr selten im Korpus auf. Die Erklärung für das am meisten bevorzugte slowakische Adjektiv dlhový (‚in der Schuld, Schulden‘) ist die einfache Tatsache, dass in der deutschen Sprache alle diese Fälle durch ein Kompositum, wie dlhová služba / Schuldendienst, dlhová kríza / Schuldenkrise ausgedrückt werden. Solche Befunde wie der Unterschied zwischen den Fällen, in denen für das slowakische determinative Syntagma auch ein determinatives Syntagma oder ein zusammengesetztes Wort in deutscher Sprache stehen, sind für die Bestimmung der entsprechenden Äquivalente sehr wichtig.
3.2.2 Kollokationelle Kompatibilität Die assoziative Kombinatorik von Wörtern aus einem gemeinsamen semantischen Paradigma in MWE ist willkürlich und uneben in verglichenen Sprachen. CWS erlaubt es, solche Fälle zu indizieren und zeigt die gemeinsame, bevorzugte und gespaltene Distribution in Fällen, in denen die Basis zwei oder mehr Äquivalente in der anderen
116
Peter Ďurčo
Sprache hat. Z. B. das slowakische Verb spáchať hat im Deutschen zwei Äquivalente – begehen und verüben. CWS hat gezeigt, dass die Verben begehen und verüben im Sinne ‚etw. Böses, eine schlechte, gewalttätige Tat ausführen‘ außer den gemeinsamen Kollokatoren (z. B. Mord, Straftat) auch spürbare Unterschiede in den kollokationellen Präferenzen aufweisen, z. B. bei begehen gibt es bevorzugte Kollokatoren Delikt, Harakiri, Schweinerei, Verrat, Verbrechen, …; bei verüben dagegen sind es die Kollokatoren Anschlag, Attentat, Massaker, Selbstmord, oder die Austauschbarkeit ist ausgeschlossen, vgl. Inzest, Sünde, ein Verstoß ist nur mit begehen vereinbar. Diese Tatsache hat direkte Konsequenzen für die kontrastive Beschreibung.
3.2.3 Kollokationelles Verhalten von MWE Vergleichbare Korpora erlauben auch die Analyse des kollokationellen Verhaltens von MWE, z. B. des kontextuellen kombinatorischen Potentials von Kollokationen. Das folgende Beispiel veranschaulicht das Maß der Identität, Einbeziehung und Disjunktion des sogenannten Minimalphrasems nach Belieben und des slowakischen Äquivalents podľa ľubovôle. Die deutsche MWE nach Belieben hat zwei grundlegende Bedeutungen: 1. eigenwillig, eigensinnig, 2. beliebig, willkürlich. Zunächst bemerken wir den Unterschied in der Kollokabilität von nach Belieben und podľa ľubovôľe. Das Kollokationspotential der deutschen MWE mit Verben ist viel höher als bei der slowakischen MWE. Zweitens hat die Analyse der Kollokation nach Belieben gezeigt, dass die Fälle von (In)Kompatibilität mit Verben die jeweiligen semantischen Gruppen quer durch diese durchlaufen. In der semantischen Gruppe DOMINIEREN haben wir folgende Beziehungen der (In)Kompatibilität von verbalen Kollokatoren festgestellt (0 = nicht kompatibel, + = kompatibel, ++ = andere bevorzugte Kollokatoren): dominieren deklassieren degradieren beherrschen diktieren kontrollieren
0 dominovať 0 deklasovať 0 degradovať + ovládať/vládnuť/panovať + diktovať + kontrolovať
In der Domäne SPORT zeigen sich nur die Fälle der Inkompatibilität von parallelen äquivalenten Verben im Slowakischen: punkten treffen einnetzen kontern
0 0 0 0
bodovať triafať vsietiť kontrovať
Vom Nutzen der vergleichbaren Korpora
scoren gewinnen
0 0
117
skórovať zvíťaziť
Sehr spezifisch ist die verbale Domäne KOCHEN, wo wir ziemlich komplizierte Beziehungen der (In)Kompatibilität beobachten, vgl.: garnieren + bestreuen + variieren + abschmecken + verzieren + dazugeben + überziehen + hinzugeben + zusammenmischen + zuckern 0 salzen 0 würzen 0 pfeffern 0 verfeinern 0 pürieren 0
obložiť posypať veriovať dochutiť ozdobiť pridať potrieť, natrieť pridať zmiešať cukrovať soliť koreniť koreniť zjemniť robiť pyré
Diese Tatsachen haben ernsthafte Konsequenzen für die Bestimmung der Äquivalente in der Zielsprache. Im Falle der Kompatibilität gibt es sehr oft komplementäre Äquivalente und in Fällen von Inkompatibilität gibt es viele andere gleichwertige Kandidaten im Slowakischen, vgl.: podľa ľubovôle (nach Belieben) do ľubovôle, do vôle (‚bis Belieben‘) podľa chuti (nach Geschmack) podľa uváženia (nach Abwägung/Erwägung) podľa (svojej/vlastnej) vôle (nach (seinem/eigenem) Willen) podľa (svojho/vlastného) želania (nach Wunsch) podľa slobodnej vôle (nach freiem Willen).
4 Fazit Im Beitrag haben wir versucht, verschiedene Ansätze für das Phänomen der Vergleichbarkeit in verschiedenen Arten von Korpora zu demonstrieren. Moderne einsprachige und mehrsprachige Korpora bieten neue Werkzeuge für den Vergleich von Daten mit großen Korpora für zwei Sprachen, bestehend aus unabhängigen Texten. Wir haben auch versucht, den Einsatz von Korpora in vergleichbarer Weise zu demonstrieren, wo parallele Sprachstrukturen und Phänomene identifiziert werden können, wenn entsprechende Werkzeuge beteiligt sind. Mit den Aranea Korpora ist die „billin-
118
Peter Ďurčo
gual sketch“-Funktionalität der Sketch Engine eines dieser Werkzeuge, die Analysen von Ähnlichkeiten (oder Differenzen) von Kollokationsprofilen für Wörter und deren Äquivalente ermöglicht. Der Vergleich der Ergebnisse in verschiedenen Arten von Korpora, konstruiert in unterschiedlicher Weise mit verschiedenen Werkzeugen, hat die Notwendigkeit von kombinierten und hybriden Ansätzen wegen der begrenzten Ausgewogenheit und Repräsentativität der bestehenden Korpora gezeigt.
Literatur Benko, Vladimír (2013): Data Deduplication in Slovak Corpora. In: Gajdošová, Katarína/Žáková, Adriána (eds.): Slovko 2013: Natural Language Processing, Corpus Linguistics, E-learning. Lüdenscheid: RAM-Verlag, 27–39. [Unter: ; letzter Zugriff: 24. 4. 2017. Benko, Vladimír (2014a): Aranea: Yet Another Family of (Comparable) Web Corpora. In: Sojka, Petr et al. (eds.): Text, Speech and Dialogue. 17th International Conference, TSD 2014, Brno, Czech Republic, September 8–12, 2014. Proceedings. LNCS 8655. Cham: Springer International Publishing, 257–264. [Unter: ; letzter Zugriff: 24. 4. 2017. Benko, Vladimír (2014b): Compatible Sketch Grammars for Comparable Corpora. In: Abel, Andrea/ Vettori, Chiara/Ralli, Natascia (eds.): Proceedings of the XVI EURALEX International Congress: The User In Focus. 15–19 July 2014. Bolzano/Bozen: Eurac Research, 417–430. [Unter: ; letzter Zugriff: 24. 4. 2017. Benko, Vladimír/Ďurčo, Peter (2015): Aranea. Comparable Gigaword Web Corpora. In: Corpas Pastor, Gloria et al. (eds.): Workshop on Multi-word Units in Machine Translation and Translation Technology (MUMTTT2015). ©LEXYTRAD, Research Group in Lexicography and Translation. 2nd ed., 40–42. [Unter: ; letzter Zugriff: 24. 4. 2017]. Maia, Belinda (2003): What are comparable Corpora? In: Proceedings of the Corpus Linguistics workshop on Multilingual Corpora: Linguistic requirements and technical perspectives. [Unter: ; letzter Zugriff: 24. 4. 2017]. Sharoff, Serge/Rapp, Reinhard/Zweigenbaum, Pierre (2016): Overviewing Important Aspects of the Last Twenty Years of Research in Comparable Corpora. In: BUCC, 9th Workshop on Building and Using Comparable Corpora. Co-located with LREC 2016 Portorož (Slovenia), 23 May 2016. [Unter: ; letzter Zugriff: 24. 4. 2017].
Vida Jesenšek
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie 1 Einleitung Der Beitrag1 setzt sich mit einigen Aspekten der Wörterbuchstrukturen in der zweisprachigen Internetlexikographie auseinander. Empirisch basieren Überlegungen auf einer exemplarischen Analyse ausgewählter Aspekte der Gesamtstruktur des zweisprachigen Online-Wörterbuchs mit Deutsch und Slowenisch vom Verlag PONS,2 die theoretische Grundlage stellen theoriegeleitete Konzepte der Wörterbuchform nach Wiegand (1998) dar. Hauptsächlich wird der Frage nachgegangen, auf welche Art und Weise sich die gängige Praxis zweisprachiger Online-Wörterbücher von PONS, darunter insbesondere jene deutsch-slowenischen Wörterbuchs, die man zurzeit wohl als weniger optimal beurteilen muss, unter verbindender Berücksichtigung der lexikographischen Theorie zur Wörterbuchform, der Wörterbuchfunktionen, der Wörterbuchbenutzer und der medienspezifischen Möglichkeiten positiv ändern ließe. Da sich das beobachtete Wörterbuch durch kollaborative Züge auszeichnet – es kann nämlich als Produkt der nichtwissenschaftlichen (halb)kollaborativen Internetlexikographie (vgl. Jesenšek 2016) bzw. als Internetwörterbuch mit Nutzerpartizipation (vgl. Storrer 2010) betrachtet werden – wirft sich zudem die Frage auf, welcher Stellenwert der Lexikographie als Fachbereich und Profession und dem Wörterbuchbenutzer als aktiv mitwirkendem „Lexikographen“ in der zukünftigen Internetlexikographie zukommen wird.
1 Dieser Beitrag entstand im Zusammenhang mit den von der Slowenischen Forschungsagentur (ARRS) finanzierten Untersuchungen zur slowenischen Identität und Kultur in Sprachkontakträumen (P6-0372, Leiter der Forschungsgruppe Prof. Dr. M. Klemenčič). 2 PONS Online-Wörterbuch, zugänglich unter http://de.pons.com/. Die zweisprachigen Wörterbücher mit Deutsch als Ausgangssprache stellen nur ein Segment der Plattform pons.com dar; dem Benutzer stehen dazu mehrere sprachtechnologische und sprachdidaktische Inhalte bzw. deren Applikationen zu Verfügung, darunter maschinelle Textübersetzung, Vokabeltrainer, Sprachkurse, Inhalte zur deutschen Jugendsprache. Die Adresse funktioniert im Wesentlichen als verlagseigene Handel- und Werbungsplattform.
Vida Jesenšek: Universität Maribor, Philosophische Fakultät, Abteilung für Germanistik, Koroška c. 160, 2000 Maribor, Slowenien, [email protected] https://doi.org/10.1515/9783110598650-008
120
Vida Jesenšek
Um in das Thema einzusteigen, wird vorerst das berücksichtige Online-Wörterbuch knapp dargestellt (Abschnitt 2). Im darauffolgenden Abschnitt 3 werden lexikographische Metatexte, genauer wörterbucheigene Hinweise zur Benutzung näher betrachtet. Sodann folgen im Abschnitt 4 Überlegungen zu ausgewählten strukturellen Aspekten des Wörterbuchs hinsichtlich seiner Funktionalität. Der Beitrag schließt mit einem Fazit und Ausblick auf weiteren Forschungsbedarf ab (Abschnitt 5).
2 PONS Online-Wörterbuch (Deutsch-Slowenisch) Das zweisprachige PONS Online-Wörterbuch trägt den Untertitel Einfach nachschlagen und richtig übersetzen.3 Daran lassen sich zwei Annahmen festhalten: (1) das Nachschlagen im Wörterbuch sei einfach und setze somit beim Benutzer keine besondere Nachschlagekompetenz voraus und (2) das Wörterbuch ist vor allem als Hilfe bei der Übersetzung gedacht. In Bezug darauf, dass die Ausgangssprache in allen zweisprachigen Online-Wörterbüchern von PONS in der Regel Deutsch ist, wäre es zunächst als passives Übersetzungswörterbuch einzustufen (Engelberg/Lemnitzer 2009: 125), d. h. dass der Benutzer zielsprachlicher Muttersprachler ist und in diese Sprache auch übersetzt. Da aber das Wörterbuch jederzeit einen Wechsel von Sprachrichtungen ermöglicht, wird es zum aktiven Wörterbuch, falls der Benutzer beim Nachschlagen von seiner Muttersprache ausgeht. Die potenziellen Benutzer des beobachteten Wörterbuchs sind also deutsche und/oder slowenische Muttersprachler, die zwischen den beiden Sprachen übersetzen. Die Übersetzung versteht man dabei – im Unterschied zum Wörterbuch – als einen Prozess, „der aus der komplexen Verflechtung der Rezeption eines ausgangssprachlichen Textes mit der Produktion eines zielsprachlichen Textes besteht“ (ebenda: 124). Um für solche Benutzungszwecke geeignet zu sein, d. h. um sowohl in aktiven als auch in passiven Benutzungszusammenhängen fungieren zu können, muss das Wörterbuch komplexen Bedingungen gerecht werden. Prinzipiell soll es eine umfassende Mikrostruktur für aktive Benutzungszwecke voraussehen und eine umfangreiche Makrostruktur für passive Benutzungszwecke anbieten.4 An die sog. Einfachheit der Suche (gemäß dem Untertitel) unmittelbar gebunden ist der lexikographische Begriff der Auffindbarkeit von Sprachdaten. Laut Bogaards (1996) misst man den Grad der Auffindbarkeit nach mehreren verschiedenen Kriterien, die sowohl rezeptive (passive) wie auch produktive (aktive) Nutzung von Wörterbüchern decken. Für die Zwecke dieser Überlegungen und in Bezug auf das
3 Entsprechende Übersetzungen findet man zu allen Sprachkombinationen. 4 Zu Unterschieden zwischen aktivem und passivem Wörterbuch vgl. Engelberg/Lemnitzer (2009: 125ff.).
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
121
beobachtete Wörterbuch werden in Anlehnung an Bogaards vier Fragestellungen genannt, deren Beantwortung Aussagen zum Grad der Auffindbarkeit lexikalischer Daten zulässt: (1) Sind alle Wörter leicht auffindbar? (2) Wo findet man komplexe Mehrworteinheiten wie z. B. feste und phraseologische Wortverbindungen verschiedenster Art? (3) Was erleichtert dem Benutzer die Orientierung in längeren Artikeln? (4) Was hilft dem Benutzer zwischen alternativen Ausdrücken den angemesseneren zu wählen? (vgl. hierzu Engelberg/Lemnitzer 2009: 201ff.). Offensichtlich ist, dass die gestellten Fragen mehrere und verschiedene Aspekte der wörterbucheigenen Gesamtstruktur betreffen. Bezieht sich die Frage 1 auf makround mediostrukturelle lexikographische Entscheidungen, z. B. Lemma-Positionierung und entsprechende Verweisung von verschiedenen Wortformen (etwa Formen von unregelmäßigen Verben im Deutschen oder Formen unregelmäßiger adjektivischer Komparation im Deutschen und Slowenischen), so geht es bei der Frage 2 um ein komplexes Gefüge von makro-, mikro- und mediostrukturellen Entscheidungen zur Erfassung von Mehrworteinheiten in einem Wörterbuch.5 Zur Länge und Komplexität einzelner Wörterbuchartikel tragen vor allem polyseme Ausdrücke bei und es ist für die Auffindbarkeit einzelner Daten nicht unwichtig, wie einzelne Lesarten mikrostrukturell positioniert und präsentiert werden.6 Des Weiteren ist für Benutzer zweisprachiger Wörterbücher das Auffinden von unbekannten und angemessenen Ausdrücken zentral, denn sowohl in passiven als auch in aktiven Benutzungszusammenhängen hat man mit einer unbekannten Größe zu tun: entweder sucht der Benutzer nach einem Übersetzungsäquivalent, das der Benutzer bisher nicht kennt oder der Benutzer interessiert sich für die Gebrauchsüblichkeiten bzw. Gebrauchsspezifik eines Ausdrucks oder der Benutzer sucht nach Bedeutungserklärung eines unbekannten Wortes. Findet er mehrere verschiedene Ausdrucksalternativen, so sucht er weiterhin nach Informationen, anhand derer er sie voneinander unterscheiden kann. Es ist wichtig, dass er sie ohne einen besonderen Aufwand auch findet. Offensichtlich ist, dass die Auffindbarkeit von Sprachdaten in einem Wörterbuch (einfach nachschlagen nach der Redeweise des beobachteten Wörterbuchs) unmittelbar von der Qualität der Auswahl (richtig übersetzen im Redestil des beobachte-
5 Das Problem wurde bisher oft thematisiert, bezogen auf das hier untersuchte Wörterbuch äußerte sich dazu Jesenšek (2014, 2015 u. 2016). 6 Hinsichtlich der mikrostrukturellen Anordnung von Sprachdaten in umfangreichen Wörterbuchartikeln der Internetwörterbücher befürworten Gouws und Enčeva (in diesem Band) eine modulare Mikrostruktur; eine solche kann z. B. in Elexiko verfolgt werden. In unsere Überlegung wird sie jedoch nicht einbezogen, zumal das beobachtete Wörterbuch mikrostrukturelle Modularität in derselben Ausprägung nicht vorsieht.
122
Vida Jesenšek
ten Wörterbuchs) und der Organisation von Sprachdaten in der Gesamtstruktur des Wörterbuchs abhängig ist. Zur Gesamtstruktur gehören aber auch Bauteile, deren primäre Funktion darin besteht, den Benutzer in Sachen Wörterbuchbenutzung zu instruieren. Die theoriegeleitete Lexikographie spricht hierbei über lexikographische Metatexte, genauer über nichtintegrierte Außentexte, die nicht dem genuinen Zweck des Wörterbuchs dienen, deren Rolle bei der Wörterbuchbenutzung aber wichtig ist, da sie dem Benutzer helfen, das Wörterbuch richtig zu benutzen (vgl. Bielińska 2010). Traditionellerweise zählen dazu Hinweise zur Wörterbuchbenutzung, die unter verschiedenen Namen und im unterschiedlichen Umfang Bestandteile von Wörterbüchern sind. In der Internetlexikographie tragen sie oft den Titel Hilfe, so auch im PONS Online-Wörterbuch (vgl. hierzu Abschnitt 3). Es bietet sich an, bei der Beurteilung der Auffindbarkeit von lexikographischen Daten gerade von diesen Texten auszugehen, da sie die Aussagen über Nachschlagehandlungen erlauben. Beobachtet und beurteilt man andererseits das Sprachdatenangebot, welches die jeweiligen Wörterbuchfunktionen sinnvoll unterstützt und seine Auffindbarkeit im Wörterbuch, so interessieren vor allem Zugriffsstrukturen und Zugriffspfade, also Datenakzessivität, die laut Wiegand (in diesem Band) so viel wie Zugriffsbereitschaft lexikographischer Daten heißt und die das Hauptanliegen der lexikographischen Tätigkeit darstellt: dass nämlich der Lexikograph seine Daten systematisch-strukturiert so präsentiert, dass der Wörterbuchbenutzer auf sie zugreifen kann (vgl. Wiegand und Gouws in diesem Band). Dazu ausführlicher im Abschnitt 4.
3 Hinweise zur Wörterbuchbenutzung im PONS Online-Wörterbuch Hinweise zur Benutzung findet man im PONS Online-Wörterbuch unter dem Titel Hilfe. Platziert sind sie sehr ungünstig, nämlich in der Fußzeile der WörterbuchStartseite, was ihre Zugänglichkeit bestimmt erschwert (vgl. hierzu Enčeva in diesem Band). Dazu kommt, dass man auf sie nicht unimittelbar durch das Anklicken von Hilfe zugreifen kann, denn sie stellen nur ein Segment der sog. Footer-pages dar, vgl. Abb. 1.7 Was ist ihr Inhalt? Mit Klicken auf Hilfe kommt man in einem ersten Schritt zu relativ ausführlichen Erläuterungen zum Suchbegriff (Handhabung mit Umlaut- und diakritischen Zeichen, Festlegung des Suchbegriffs – man kann nach Einzelwörtern, typischen
7 Beobachtungen und Aussagen zu den Benutzungshinweisen in diesem Kapitel betreffen das Wörterbuch zur Zeit der Verfassung dieses Textes (April 2017). Inzwischen (März 2018) wurde das Segment Hilfe zum Teil graphisch, jedoch nicht inhaltlich geändert, zudem kommt, dass einige Inhalte nicht mehr zugänglich sind.
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
123
Wortverbindungen, Redewendungen, idiomatischen Wendungen suchen,8 Umgang mit Flexionsformen flektierbarer Wörter u. a.), zur typographischen Praxis im gegebenen Wörterbuch (Markierung mit fetter/kursiver/farbiger Schrift), zu Abkürzungen und zu einigen Möglichkeiten der individuell-personalisierten Anpassung von Benutzeroberfläche (Ein- und Ausblenden von Beispielangaben), vgl. Abb. 2 und Abb. 3.
Abb. 1: Hilfe (Hinweise zur Benutzung); Platzierung im PONS Online-Wörterbuch (April 2017).
Abb. 2: Hilfe: Suche im Wörterbuch; Teilausschnitt aus dem PONS Online-Wörterbuch (April 2017).
8 Es sei dahingestellt, dass phraseologiebezogene Terminologie (typische Wortverbindungen, Redewendungen, idiomatische Wendungen u. a.) im PONS-Wörterbuch unreflektiert, uneinheitlich und inkonsequent verwendet wird (vgl. Jesenšek 2015 u. 2016).
124
Vida Jesenšek
Abb. 3: Hilfe: Suche im Wörterbuch; Teilausschnitt aus dem PONS Online-Wörterbuch (April 2017).
Will man sich über die Suchmöglichkeiten näher informieren, so gibt es eine tiefer liegende Seite unter dem Titel Ausführliche Hinweise zum Online-Nachschlagen bei PONS;9 diese ist allerdings nur über die deutsche Startseite des Wörterbuchs erreichbar. Gelangt man durch einen weiteren Klick dorthin, so bekommt man zusätzliche, reichlich illustrierte und schrittweise präsentierte Instruktionen zur Benutzung des Wörterbuchs. Durch die Auswahl der Optionen im links platzierten Menü kann man sich über die Benutzung weiter informieren, vgl. Abb. 4.
Abb. 4: Ausführliche Hinweise zum Online-Nachschlagen bei PONS; Ausschnitt aus dem PONS Online-Wörterbuch (April 2017).
9 Zur Zeit der Erstellung dieser Buchpublikation (März 2018) nicht mehr auffindbar.
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
125
Die Option Der Weg ins Wörterbuch informiert den Benutzer, wie man das OnlineWörterbuch im Internet erreicht, das gewünschte Sprachenpaar wählt und die gewünschte Oberflächensprache einstellt. – Die Option Ein Stichwort suchen sollte als didaktisch besonders aufbereitet verstanden werden, zumal mit drei sog. Schülerübungen zum Suchen versehen;10 man erfährt auch, wie man die Funktion der Autovervollständigung bei der Angabe von Suchbegriffen nutzt. – Die Option Die Stichwortliste ansehen gibt einen Teilblick in die Makrostruktur des Wörterbuchs, es können jedoch nicht alle Stichwörter angesehen werden (was man in Bezug auf die Betitelung dieser Option annehmen würde), sondern nur solche, die sich in der Umgebung des gesuchten Begriffs befinden. – Die Option Eine Wendung suchen sollte ebenso didaktisch aufbereitet verstanden werden, zumal mit mehreren sog. Schülerübungen versehen, allerdings nicht in Funktion (vgl. Anm. 9). Man erfährt, dass die Suche nach sog. Wendungen im Wörterbuch möglich ist, mit dem Ausdruck Wendung ist jedoch Verschiedenes gemeint (nichtsatzwertige und satzwertige Phraseme, Kollokationen, pragmatische Phraseologie und ebenso verschiedenartige Satzrealisierungen der vielfältigen Phraseologie).11 Offensichtlich benennt das Wörterbuch mit Wendung syntagmatisch-grammatikalische Konstruktionen an sich, denn es „können spielend einfach und schnell grammatikalische Konstruktionen mitsamt ihrer Übersetzung in langen Einträgen angesprungen werden, die im herkömmlichen Wörterbuch mühsam gesucht werden müssten“ (Ausführliche Hinweise/Eine Wendung suchen). – Die Option Eine Eintragsübersicht anzeigen lassen meint die Möglichkeit, die sog. Beispiele bzw. Beispielsätze aus- bzw. einzublenden und die sog. Zusammenfassung (i. e. „eine Übersicht über die Wortarten und verwandten Stichwörter“) abzurufen; das Letztere sei besonders bei langen Einträgen vom Nutzen. In der Tat geht es um eine Ergebnis-Übersicht über makrostrukturelle Erweiterungen der Mikrostruktur z. B. zum Lemma denken im deutsch-englischen Wörterbuch, wie anhand der Abb. 5 nachvollziehbar. Über die Option Informationen über die Stichwörter und Wendungen besser verstehen gelangt man zu Erläuterungen verwendeter Abkürzungen. Obgleich diese an eine medienspezifische Tradition gebunden sind (Printwörterbücher), werden sie im PONS Online-Wörterbuch beibehalten, denn „dies dient nicht nur der besseren Übersichtlichkeit der gebotenen Informationen, es verbessert auch die Kompetenz im Umgang mit Printwörterbüchern, die auf diese Abkürzungen aus Platzgründen nicht verzichten können. Denn Online-Wörterbücher verstehen wir als sinnvolle Ergänzung unseres Wörterbuchprogramms und nicht als Ersatz für herkömmliche Wörterbücher“ (Ausführliche Hinweise / Informationen über die Stichwörter und Wendungen
10 Leider haben hypertextuell organisierte Übungen zurzeit der Präsentation dieses Beitrags am Kolloquium und Vorbereitung der Publikation (Oktober 2016 und Januar 2017) nicht funktioniert. 11 Über die Problematik der Behandlung von Phraseologie in diesem Wörterbuch ausführlich in Jesenšek 2015 u. 2016.
126
Vida Jesenšek
besser verstehen). Die Möglichkeiten des elektronischen Mediums werden hierbei doch ausgenutzt, indem alle Abkürzungen und Symbole per Mausover aufgelöst werden. – Die Option Technische Tipps betrifft zum einen Hinweise zum eventuellen Kopieren von „Informationen“ aus PONS in die Textverarbeitung per Copy und Paste und zum anderen Hinweise darauf, wie man die Schriftgröße verändern und Sonderzeichen über virtuelle Tastaturen eingeben kann. – Die letzte Option namens Weiterführende Links nutzen gibt sehr allgemeine Hinweise auf verlinkte Ressourcen, woraus man weitere Sach- und Sprachinformationen zum jeweils nachgeschlagenen Ausdruck beziehen kann.12
Abb. 5: Ergebnis-Übersicht zum Lemma denken im deutsch-englischen Wörterbuch; Teilausschnitt aus PONS Online-Wörterbuch (April 2017).
Bei der Überprüfung der gegebenen Hinweise zur Benutzung hat es sich herausgestellt, dass die gegebenen Suchinstruktionen und -vorschläge nicht generell für alle Sprachkombinationen gelten und dass sie in Bezug darauf, dass das Wörterbuch inhaltlich und technisch permanent ausgebaut wird, nicht konsequent aktualisiert werden. So muss man festlegen, dass sie nur stellenweise bzw. nur innerhalb einzelner Sprachkombinationen zuverlässig sind. Am ehesten gelten sie für die Sprachkombination Deutsch und Englisch, während für die Sprachkombination Deutsch und Slowenisch sie nicht immer zutreffen, zumal Suchergebnisse zu äquivalenten
12 Wie die Auswahl der vorgeschlagenen Ressourcen für einzelne Sprachen getroffen wird, bleibt hier dahingestellt; es sei jedoch bemerkt, dass anhand der Liste angebotener Quellen zum Slowenischen sehr willkürliche Selektionskriterien zugrunde liegen, zumal neben hochprofessionellen auch völlig amateurhaft erstellte Ressourcen genannt werden.
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
127
Ausdrücken picture, Bild und slika im Wörterbuch mit Deutsch und Englisch bzw. Deutsch und Slowenisch sich von der Illustrierung in den Benutzerhinweisen unterscheiden; abgesehen von differenter Artikelstruktur werden die in den Benutzerhinweisen angesprochenen Suchpfade im Wörterbuch nicht mehr gezeigt, vgl. Abb. 6, Abb. 7 und Abb. 8:
Abb. 6: Ergebnis der Suche zum Lemma picture; Teilausschnitt aus Ausführliche Hinweise zum Online-Nachschlagen bei PONS/Ein Stichwort suchen (April 2017).
Abb. 7: Ergebnis der Suche zum Lemma Bild im deutsch-slowenischen Wörterbuch; Teilausschnitt aus PONS Online-Wörterbuch (April 2017).
128
Vida Jesenšek
Abb. 8: Ergebnis der Suche zum Lemma slika im slowenisch-deutschen Wörterbuch; Teilausschnitt aus PONS Online-Wörterbuch (April 2017).
Zudem kommt, dass Hilfe-Texte in slowenischer Sprache gar nicht vorliegen – über die slowenische PONS-Seite (http://sl.pons.com/prevod) gelangt man nur zur englischen Version der Benutzerhinweise.13 Des Weiteren scheinen einige Informationen und Hinweise überflüssig zu sein (etwa wie man zum Online-Wörterbuch überhaupt gelangt, zumal man sich auf der entsprechenden Seite bereits befindet) und man würde sich mehr Systematizität sowie eine konsequente und vor allem eine fachgerechte Redeweise wünschen. Die mangelnde Verwendung von Fachterminologie fällt insbesondere bei inkonsistentem und stellenweise fachlich fraglichem Gebrauch der linguistisch-lexikographischen Terminologie ins Auge („grammatischer Aufbau der Einträge“, um nur ein Beispiel zu nennen). Hinsichtlich der Phraseologie wurde darauf in Jesenšek (2015 u. 2016) ausführlich eingegangen.
13 Für ein Wörterbuch, welches vorrangig für Übersetzungszwecke gedacht ist, ist sowas recht sonderbar und wäre dringend zu korrigieren.
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
129
Im obigen Kapitel wurde auf Kriterien zur Beurteilung der Datenauffindbarkeit in einem Wörterbuch hingewiesen. In den Benutzerhinweisen des beobachteten Wörterbuchs findet man lediglich einige knappe und ausschließlich technikbezogene Aussagen dazu, was dem Benutzer die Orientierung in längeren Artikeln erleichtert, während andere strukturelle Qualitäten, die die Datenauffindbarkeit fördern, nicht angesprochen werden. Nachfolgend wird darauf näher eingegangen.
4 Strukturen im PONS Online-Wörterbuch im Lichte der Datenauffindbarkeit 4.1 Sind alle Wörter leicht auffindbar? Einen schnellen Zugriff unterstützen in der Printlexikographie glattalphabetische Makrostrukturen, die in elektronischen Wörterbüchern zwar nicht mehr im Vordergrund stehen, jedoch weiterhin eine Rolle spielen, z. B. auch im beobachteten OnlineWörterbuch bei der alphabetisch geordneten Auflistung der Lemmata als Ergebnis der Suchbegriffsangabe. Eventuelle Schwierigkeiten bereiten, wie angedeutet, z. B. die Lemma-Positionierung und entsprechende Verweisung von verschiedenen Formen eines Ausdrucks (etwa Formen von deutschen unregelmäßigen Verben und Verweise auf den Infinitiv oder Formen unregelmäßiger adjektivischer Komparation im Deutschen und Slowenischen und Verweise auf entsprechende Positiv-Formen). Soweit man bei einer selektiven Beobachtung sehen kann, behandelt das PONS-Wörterbuch solche Ausdrücke konsequent, d. h. sie sind lemmatisiert und mit Verweis auf die Ausgangs- bzw. Grundform versehen. Das Gesagte gilt für beide beobachteten Sprachen. Schlägt der Wörterbuchbenutzer nach solchen Ausdrücken nach, so sind sie leicht auffindbar und er kann auf sie direkt zugreifen, vgl. Abb. 9. Eine Ausnahme stellt vorläufig die Präsentation aspektunterscheidender slowenischer Verben dar, falls sie verschiedene Stämme aufweisen, etwa vprašati/spraševati (fragen); diese werden im Wörterbuch zurzeit nicht zusammenhängend präsentiert.
130
Vida Jesenšek
Abb. 9: Ergebnis der Suche zum Ausdruck sah im deutsch-slowenisch Wörterbuch; Teilausschnitt aus PONS Online-Wörterbuch (April 2017).
4.2 Wo findet man komplexe Mehrworteinheiten? Über die lexikographische Behandlung von Mehrworteinheiten, vorrangig sind hier phraseologische Wortschatzeinheiten verschiedenster Art gemeint, wurde bisher viel und oft diskutiert; eine Übersicht dazu bietet Jesenšek (2014, 2015 u. 2016). Identifiziert wurden mehrere Problembereiche, betreffend makro-, mikro- und mediostrukturelle lexikographische Lösungen. Meines Wissens wurden viele davon bis dato weitgehend noch nicht erhoben, obgleich dazu reichlich Literatur mit vielen Verbesserungsvorschlägen vorliegt. Als zu wenig reflektiert und methodisch-methodologisch fraglich gilt in vielen Fällen die äußere Selektion; unbekannt bzw. schwer nachvollziehbar sind das jeweilige wörterbucheigene Verständnis der Phraseologie und Kriterien für die Auswahl. Die wichtigste Beobachtung dazu ist, dass deutliche Zusammenhänge zwischen Selektion und angestrebter Funktionalität des jeweiligen Wörterbuchs nicht identifizierbar sind und ebenso, dass die erfasste Phraseologie eher zufällig-willkürliche Auflistung darstellt. Auch vorhandene strukturidentische Äquivalentpaare tragen nicht unbedingt dazu bei, sie systematisch zu erfassen (vgl. u. a. Korhonen 2004 u. 2009; Jesenšek 2014, 2015 u. 2016). – Zu einem weiteren Problembereich zählt die Lemmatisierung, d. h. die Festlegung der lexikographischen Nennform phraseologischer Wortschatzeinheiten und die Entscheidung über ihre mikrostrukturelle Einordnung zu einem oder zu mehreren Einzellexemen aus der Lemmaliste des Wörter-
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
131
buchs, die als phraseologische Komponenten auftreten. Hierzu stellt man fest, dass die Nennformen auch im selben Wörterbuch uneinheitlich sein können, dass sonst die usuelle Variabilität eher zufällig dokumentiert wird und ebenso, dass die Zuordnung zu den lemmatisierten Komponenten sowie die artikelinterne Positionierung und Anordnung in der Regel unsystematisch und uneinheitlich erfolgen. Schließlich sprechen methodologisch arbiträre und manchmal fragliche anderssprachige Äquivalentangaben dafür, dass die lexikographische Erfassung von Mehrworteinheiten auch in semantischer Hinsicht zu wünschen übrig lässt. Das Gesagte trifft auch für das beobachtete Wörterbuch vollständig zu. Der Aspekt der Auffindbarkeit von lexikographischen Daten in den zweisprachigen PONS-Wörterbüchern wurde am Beispiel der Mehrworteinheiten (Phraseme und Sprichwörter) in Jesenšek (2014) dargelegt. Die Beobachtung ist nicht zufriedenstellend; die lexikographische Behandlung von polylexikalen Einheiten ist inkonsequent und von der Redaktion offensichtlich weniger reflektiert, was man primär auf die Nichtberücksichtigung fachlicher (linguistischer, phraseologischer) und lexikographischer Kenntnisse und folgerichtig auf die mangelnde Verantwortung für das Wörterbuchkonzept und Wörterbuchqualität zurückzuführen ist. In den Benutzerhinweisen (Hilfe, vgl. Abschnitt 3) liest man über sog. Wendungen, die definitorisch (und entsprechend terminologisch) nicht weiter spezifiziert werden. Artikelintern sind Mehrworteinheiten (vor allem Sprichwörter und hochgradig idiomatische Wortverbindungen) stellenweise mit Markierungen ausgestattet (Spr, fig, ekspr…), jedoch inkonsistent und auch unreflektiert (für Sprichwörter vgl. Jesenšek 2016). – Lemmatisierungsprinzipien stellen im PONS ein weiteres Problem dar. Die Festlegung lexikographischer Nennform bei festen Mehrworteinheiten und ihre Zuordnung zu einem oder zu mehreren Einzellexemen als Komponenten setzt genaue methodologisch-methodische redaktionelle Richtlinien voraus. Beobachtet man die Praxis bei PONS, so muss man annehmen, dass diese entweder nicht vorliegen oder sie werden nicht konsequent berücksichtigt. – Eine der systemhaften Eigenschaften der Phraseologie ist die Neigung zur Varianz; Varianten kommen im PONS vor, jedoch offensichtlich zufällig und unreflektiert, vgl. z. B. variante Sprichwörter in der ausgangssprachlichen bzw. zielsprachlichen Position: Ausnahmen bestätigen die Regel / Izjema potrjuje pravilo (PONS de-sl), Izjema potrjuje pravilo / Eine/Die Ausnahme bestätigt die Regel (PONS sl-de); Die Zeit heilt alle Wunden / Čas celi rane (PONS de-sl), Čas celi vse rane / Zeit heilt alle Wunden (PONS sl-de). Die Beobachtung mag auf den ersten Blick weniger relevant sein, jedoch können derartige Inkonsequenzen Verlässlichkeit der Sprachdaten im Wörterbuch in Frage stellen und den Benutzer (etwa einen Übersetzer) verwirren, zumal er vorrangig nach anderssprachigen usuellen Äquivalenten sucht. – Die Zuordnung von Mehrworteinheiten zu einem oder zu mehreren lemmatisierten Einzellexemen als Komponenten erfolgt ebenso weniger systematisch. Die empfohlene Regelung, Mehrworteinheiten nach dem morphologischen Kriterium unter dem ersten Substantiv, Adjektiv, Adverb, Verb einzuordnen (vgl. u. a. Korhonen 2004 u. 2009), wird nur stellenweise befolgt und zudem ist eine
132
Vida Jesenšek
Mehrfachlemmatisierung möglich, vgl. Kleider machen Leute (unter Kleid) / Obleka naredi človeka (unter dem zweiten Subst. človek ‚Mensch‘); Viele Köche verderben den Brei (unter Koch) / Veliko babic, kilavo dete (unter dem Adj. kilav, obgleich das Sprichwort zwei substantivische Komponenten (babica, dete) enthält); Übung macht den Meister (unter Übung) / Vaja dela mojstra (unter den beiden Subst. vaja und mojster); Wer zuerst kommt, mahlt zuerst (unter zuerst und kommen). Aus der Benutzerperspektive und da der Platz in einem elektronischen Wörterbuch nicht beschränkt ist, wäre eine konsequent durchgeführte Mehrfachlemmatisierung die benutzerfreundlichste Entscheidung; sie würde die Auffindbarkeit optimieren sowie eine intuitive Suche beim Benutzer ermöglichen. Eine einheitliche Nennform in allen Wörterbuchpositionen wäre dafür allerdings die notwendige Voraussetzung. Auf hauptsächliche Mängel der lexikographischen Behandlung von Mehrworteinheiten wurde oben nur skizzenhaft eingegangen, die Abb. 10 und 11 sollen das Gesagte veranschaulichen. Willkürlich-zufällige Selektion der Mehrworteinheiten, uneinheitliche Lemmatisierung und Markierung, undifferenzierte Äquivalentangaben, differente mikrostrukturelle Anordnungen u. a. kommen zum Vorschein.
Abb. 10: Ergebnis der Suche zum Lemma Auge im deutsch-slowenisch Wörterbuch; Teilausschnitt aus PONS Online-Wörterbuch (April 2017).
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
133
Abb. 11: Ergebnis der Suche zum Lemma oko im slowenisch-deutschen Wörterbuch; Teilausschnitt aus PONS Online-Wörterbuch (April 2017).
4.3 Was erleichtert dem Benutzer die Orientierung in längeren Artikeln? Zur Länge und Komplexität einzelner Wörterbuchartikel tragen vor allem polyseme Ausdrücke bei und es ist für die Auffindbarkeit einzelner Daten nicht unwichtig, wie einzelne Bedeutungen bzw. Lesarten mikrostrukturell positioniert und präsentiert werden. Wie anhand Abb. 10 und 11 nachvollziehbar, sind Artikelstrukturen im beobachteten Wörterbuch nicht einheitlich. Dies mag daran liegen, dass sich das Wörterbuch in permanenter Ausarbeitung und Weiterentwicklung befindet. Dies mag jedoch kein Grund dafür sein, dass man sich mit der Frage konzeptuell nicht auseinandersetzt. Vergleicht man die Wörterbuchartikel zum Lemma Auge bzw. Hand im deutschslowenischen PONS-Wörterbuch, vgl. Abb. 10 und Abb. 12, so stellt man fest, dass
134
Vida Jesenšek
einerseits durch typographisch markierte Positionen ein schneller Überblick über die Lesarten gewährleistet wird (so bei Auge: 1 Auge (Sehorgan) usw.) und dass andererseits der hochpolyseme Ausdruck Hand (DWDS verzeichnet 4 Bedeutungen, Duden Online 5 und Elexiko sogar 9 Lesarten dieses Wortes) ohne eine artikelinterne semantische Gliederung präsentiert wird. Dies erschwert die Auffindbarkeit sehr, insbesondere bei zahlreichen phraseologischen und Beispielangaben zu einzelnem Lemma (zu unserem Beispiel Hand werden zurzeit insgesamt 50 verschiedene ausgangssprachliche Angaben gegeben). Einigermaßen trägt der Übersichtlichkeit von Artikelstrukturen eine teils tabellarische Art der Datenpräsentation (horizontale Markierung einzelner Zeilen durch Striche) bei, jedoch wäre dazu eine systematische, konsequente und durch typographische Mittel unterstützte artikelinterne semantische Gliederung als Orientierungshilfe ein Qualitätsgewinn für das Wörterbuch.
Abb. 12: Ergebnis der Suche zum Lemma Hand im deutsch-slowenischen Wörterbuch; Teilausschnitt aus PONS Online-Wörterbuch (April 2017).
4.4 Was hilft dem Benutzer zwischen alternativen Ausdrücken den angemesseneren zu wählen? Die Frage betrifft produktive Wörterbuchbenutzungszusammenhänge, in unserem Fall und laut dem Wörterbuchmotto (Einfach nachschlagen und richtig übersetzen) vorrangig Übersetzungszusammenhänge. Der Benutzer schlägt demnach im Wörterbuch vorrangig dann nach, wenn er nach einem zielsprachlichen, bisher unbekannten Übersetzungsäquivalent sucht. Diesen Nachschlagebedarf decken in der Regel Äquivalenzanagaben in zweisprachigen Wörterbüchern. Das beobachtete Wörterbuch
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
135
operiert allerdings nicht mit dem Begriff der zwischensprachlichen Äquivalenz, denn konsequent ist die Rede nur von sog. Übersetzungen, so in Bezug auf die Wörterbuchartikelstruktur als auch hinsichtlich der sog. Beispielsätze, die man sich als Benutzer anzeigen lassen kann. Zwei bedeutende Aspekte der lexikographischen Behandlung von Wörtern sind hier zu nennen: diasystematische Markierung einzelner Ausdrücke und Auseinanderhaltung alternativer bzw. synonymer Ausdrücke. Es ist bekannt, dass sich zwischensprachlich denotativ äquivalente Ausdrücke durch ihren Markiertheitsstatus unterscheiden können, womit Gebrauchpräferenzen und/oder Gebrauchsrestriktionen verbunden sind. Diasystematische Markierungssysteme und -techniken sind in verschiedenen Wörterbüchern in der Regel unterschiedlich, denn ein jedes Wörterbuch legt das Markierungssystem, d. h. die Arten und die Anzahl verschiedener Marker selbst fest. Leider vermisst man in den meisten Fällen eine theoretische Fundierung des jeweiligen Markierungssystems. Trotzdem sind diasystematische Markierungen von großem Nutzen und vor allem für nichtmuttersprachliche Wörterbuchbenutzer gelten sie als eine Art der Orientierung bei der Auswahl und beim Gebrauch eines (fremdsprachlichen) Ausdrucks. Das gesagte trifft auch für das beobachtete Wörterbuch zu. Wie bereits angedeutet (Abschnitt 3), operiert PONS mit einer Anzahl diasystematischer Markierungen, allerdings werden sie in den Außentexten (so auch in Benutzerhinweisen) nicht erläutert; die entsprechenden Abkürzungen und Symbole werden lediglich per Mausover aufgelöst. Problematisch in produktiven Benutzungszusammenhängen sind unsystematische und inkonsequente Markierungspraktiken bei zwischensprachlicher Äquivalenz, vgl. hierzu Abb. 10. Eine auffällig häufige diaevaluative Markierung der ausgangssprachlichen Ausdrücke mit dem Marker fig (figurativ) und generell fehlende Markierung bei zielsprachlicher Äquivalenz ist etwa für einen Benutzer mit Deutsch als Muttersprache insofern verwirrend, da er daran gar keine Information zu Stilwerten slowenischer (hier fremdsprachlicher) Ausdrücke bekommen kann. Andererseits erfährt der slowenischsprechende Benutzer nicht, ob und wie die Markierung fig den Gebrauch betreffender Ausdrücke in der Fremdsprache beschränkt. Ein weiteres Problem bereitet eine deutliche Auseinanderhaltung alternativer bzw. synonymer Ausdrücke, d. h. ihre semantische und pragmatische Disambiguierung. Interessiert man sich für die sog. Übersetzung von sl. vprašati (fragen), so gibt das Wörterbuch undifferenziert zwei Möglichkeiten an, und zwar fragen und eine Frage stellen; die Suche in umgekehrter Richtung für das dt. fragen leitet den Benutzer zum sl. spraševati (i. e. imperfektive Form zum perfektiven Verb vprašati) hin. Kurzum: für produktive Zusammenhänge wenig aussagende Suchergebnisse. Eine mögliche Lösung dieser problematischen Praxis wäre eine systematische Verlinkung mit illustrierenden Beispielsätzen, die das Wörterbuch bereits anbietet, die aber zurzeit keine systematischen Zusammenhänge mit dem Wörterbuchartikel zeigen; mehr noch, denn wie Abb. 13 zeigt, werden zum Verb fragen sog. Beispielsätze präsentiert, die die Plural-Form von Substantiv Frage illustrieren.
136
Vida Jesenšek
Abb. 13: Ergebnis der Suche zum Lemma fragen im deutsch-slowenischen Wörterbuch; Teilausschnitt aus PONS Online-Wörterbuch/Beispielsätze (April 2017).
5 Fazit und Ausblick Eingangs wurde die Frage gestellt, auf welche Art und Weise sich die gängige Praxis zweisprachiger online Wörterbücher von PONS, die man wohl als weniger optimal beurteilen muss, positiv ändern ließe. Berücksichtigt man Relationszusammenhänge zwischen Theorie (vor allem die Theorie der Wörterbuchstrukturen), Gegebenheiten der Internet-Umgebung und lexikographischer Praxis, so ist festzuhalten, dass reale Möglichkeiten gegeben sind, die Qualität des Wörterbuchs bedeutend zu erhöhen. Stellt die Theorie einen fachgerechten Rahmen für die Konzeption und Durchführung aller Phasen in der Erarbeitung eines Wörterbuchs dar, so bietet die Internet-Umgebung das Potential für eine medien-, benutzungs- und funktionsgerechte Präsentation lexikographischer Daten. Das Verbesserungspotential des beobachteten Wörterbuchs liegt im Bereich der Außentexte: zentrale und sichtbare Positionierung und Integration in die Benutzeroberfläche, systematische Ausarbeitung instruktiver Aussagen zur Benutzung des Wörterbuchs in situativ verschiedenen Benutzungszusammenhängen, Verständlichkeit und fachgerechter Gebrauch linguistisch-lexikographischer Terminologie würden den Zugriff auf und somit die Auffindbarkeit der Benutzungshinweise erhöhen. Dies ist auch deshalb von Bedeutung, da man inzwischen weiß, dass Unzufriedenheit mit gängigen Wörterbüchern sehr oft mit mangelnder Wörterbuchbenutzungskompetenz zusammenhängt (vgl. hierzu Kispál in diesem Band).
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
137
Derartig erweiterte und verbesserte Benutzungsinstruktionen setzen jedoch unausweichlich ein durchdachtes Konzept und eine im Detail herausgearbeitete wörterbucheigene Gesamtstruktur voraus. Wie anhand einiger struktureller Aspekte gezeigt wurde, wäre in dieser Hinsicht Einiges zu überlegen und auf solide fachgerechte (i. e. lexikographietheoretische) Füße zu stellen: angefangen mit der genaueren Bestimmung des Gegendstandsbereichs – vgl. hierzu das aktuelle Phraseologie- und Angabeverständnis – wäre es vom Vorteil, die Begrifflichkeit der zwischensprachlichen Übersetzung von der Begrifflichkeit der zwischensprachlichen Äquivalenz deutlich zu unterscheiden. Dies würde zu weiteren fachlich korrekteren Entscheidungen auf der mikro-, makro- und mediostrukturellen Ebene führen und ermöglichen, technisch-technologische Gegebenheiten der Internet-Umgebung besser auszunutzen. Da das beobachtete zweisprachige Online-Wörterbuch auf dem (halb)kollaborativen Wege entsteht (vgl. Melchior 2012 u. 2014; Jesenšek 2014), stellt sich erneut die Frage danach, welche Rolle bei seiner Erarbeitung die professionelle Redaktion hat bzw. haben sollte. Man liest zwar in der Werbung für das Wörterbuch, dass die Einträge redaktionell bearbeitet und geprüft werden, um dadurch die Qualität sicher zu stellen, im Impressum des PONS-Portals findet sich aber auch die Aussage, woran nachvollziehbar, dass die Redaktion keine Verantwortung für die Richtigkeit von Angaben, Daten etc. übernimmt. Eine solche Position ist innerhalb des Fachbereichs Lexikographie wohl schwer vertretbar. Ein jeder Lexikograph trägt nämlich verschiedene Verantwortlichkeiten für sein Produkt; er haftet vor allem für die Richtigkeit und Korrektheit der Sprachdaten und der Benutzer ist vor allem zu einem zuverlässigen und qualitätsvollen Wörterbuch berechtigt (vgl. Wiegand/Jesenšek, 2006). Somit wäre es notwendig und vom allgemeinen Gewinn, für die prinzipiell zu begrüßende Mitwirkung der Sprachinteressierten bei der Erstellung des Wörterbuchs eine verbindliche theoretisch-methodische Basis festzulegen, die Mitwirkenden entsprechend auszubilden und ihre Arbeit redaktionell intensiv zu betreuen. Und nicht zuletzt könnten kollaborativ mitwirkende Wörterbuchbenutzer in die Wörterbuchbenutzungsforschung systematisch einbezogen werden. Da Erfahrungen aus dem DaF-Bereich europaweit zeigen, dass gerade zweisprachige Online-Wörterbücher von PONS von den DaF-Lernenden in Lernsituationen am meisten konsultiert werden – es geht also nicht ausschließlich um Übersetzung, wie das Wörterbuch suggeriert – wäre aus Verantwortlichkeitsgründen eine solche empirische Überprüfung der bisherigen Wörterbuchpraxis dringend notwendig.
138
Vida Jesenšek
Literatur Monografien und Aufsätze Bielińska, Monika (2010): Lexikographische Metatexte. Eine Untersuchung nichtintegrierter Außentexte in einsprachigen Wörterbüchern des Deutschen als Fremdsprache. Frankfurt am Main [etc.]: Peter Lang. Bogaards, Paul (1996): Dictionaries for Learners of English. In: International Journal of Lexicography 9, 277–320. Enčeva, Milka (in diesem Band): Makrostrukturen von Print- und Online-Wörterbüchern. Ein Vergleich. Engelberg, Stefan/Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4., überarb. u. erw. Aufl. Tübingen: Stauffenburg. Gouws, Rufus H. (in diesem Band): Accessibility, access structures and access procedures. Jesenšek, Vida (2014): Slovarji nove dobe ali Ni vse zlato, kar se sveti. In: Jesenšek, Marko (Hrsg.): Jeziki, literature in kulture v stiku. Ob 200-letnici M. J. Lermontova, 110-letnici Srečka Kosovela in 100-letnici Vitomila Zupana. Maribor: Univerza, 85−102. Jesenšek, Vida (2015): Sprichwörter in einem allgemeinen elektronischen Wörterbuch: theoretische und methodische Überlegungen anhand deutsch-slowenischer Sprachdaten in mehrsprachigen Online-Wörterbüchern von PONS. In: Grandl, Christian/McKenna, Kevin J. (Hrsg.): Bis dat, qui cito dat: Gegengabe in paremiology, folklore, language, and literature: honoring Wolfgang Mieder on his seventieth birthday. Frankfurt am Main (etc.): Peter Lang, 189–198. Jesenšek, Vida (2016): Über die gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie. In: Schierholz, Stefan J. (Hrsg.): Wörterbuchforschung und Lexikographie. Berlin/Boston: De Gruyter, 259–273. Kispál, Tamás (in diesem Band): Print- und Onlinewörterbuchmikrostrukturen und Kollokationen aus der DaF-Lerner-Perspektive. Korhonen, Jarmo (2004): Zur lexikografischen Erfassung von Sprichwörtern in einsprachigen deutschen Wörterbüchern. In: Palm-Meister, Christine (Hrsg.): EUROPHRAS 2000: Internationale Tagung zur Phraseologie vom 15.–18. Juni 2000 in Aske/Schweden. Tübingen: Stauffenburg, 233–244. Korhonen, Jarmo (2009): Sprichwörter und zweisprachige Lexikografie: Deutsch-schwedische und deutsch-finnische Wörterbücher im Vergleich. In: Földes, Csaba (Hrsg.): Phraseologie disziplinär und interdisziplinär. Tübingen: Narr, 537–549. Melchior, Luca (2012): Halbkollaborativität und Online-Lexikographie. Ansätze und Überlegungen zu Wörterbuchredaktion und Wörterbuchforschung am Beispiel LEO Deutsch-Italienisch. In: Lexicographica 28, 337−372. Melchior, Luca (2014): Ansätze zu einer halbkollaborativen Lexikographie. In: Abel, Andrea / Klosa, Annete (Hrsg.): Der Nutzerbeitrag im Wörterbuchprozess. 3. Arbeitsbericht des wissenschaftlichen Netzwerks Internetlexikografie. OPAL 4, 27−48. Storrer, Angelika (2010): Deutsche Internet-Wörterbücher. Ein Überblick. In: Lexicographica 27, 155−164. Wiegand, Herbert Ernst (1998): Wörterbuchforschung. Untersuchungen zur Wörterbuchbenutzung, zur Theorie, Geschichte, Kritik und Automatisierung der Lexikographie. Berlin etc.: De Gruyter. Wiegand, Herbert Ernst (in diesem Band): Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform in der akademischen Lehre. Eine Serie von Einblicken.
Wörterbuchstrukturen in der zweisprachigen Internetlexikographie
139
Wiegand, Herbert Ernst/Jesenšek, Vida (2006): O družbeni odgovornosti znanstvene leksikografije. In: Jesenšek, Marko/Zorko, Zinka (Hrsg.): Jezikovna predanost. Akademiku prof. dr. Jožetu Toporišiču ob 80-letnici. Maribor: Slavistično društvo; v Ljubljani: SAZU, 361−378.
Wörterbücher DWDS = Digitales Wörterbuch der deutschen Sprache. Hrsg. von der Berlin-Brandenburgischen Akademie der Wissenschaften, Berlin, 2016. [Unter: ; letzter Zugriff 1. 2. 2017]. Duden Online = Duden Online-Wörterbuch. [Unter: ; letzter Zugriff 1. 2. 2017]. Elexiko = Ein Online-Wörterbuch zur deutschen Gegenwartssprache. [Unter: ; letzter Zugriff 1. 2. 2017]. PONS = PONS Online-Wörterbuch. [Unter: ; letzter Zugriff 1. 2. 2017].
Alenka Vrbinc
Absence of dictionary equivalents: Problems and solutions 1 Introduction In bilingual lexicography, target language (TL) equivalents are of the utmost importance. Therefore, lexicographers working on a bilingual dictionary should strive to find the most suitable TL equivalents for all senses of the lemmata and to present these in the dictionary as clearly as possible. Dictionary users expect to find translation equivalents of the source language (SL) items which are real lexical units of the TL and which produce a smooth translation when inserted into the context (Zgusta 1984: 147). However, as Gouws (2002: 195) rightly establishes, dictionary users should be aware that a specific equivalent offered by a dictionary may arbitrarily be regarded as the meaning of the lemma, since an equivalent is a TL item which can substitute the SL item in a specific occurrence, depending on specific contextual and cotextual restrictions. It should, however, be stressed that the perfect translation of an SL word is rare in general language and as Atkins/Rundell (2008: 467–468) state, the equivalence relationship between an SL word and a TL word varies from exact to very approximate or from perfect to just-adequate. The reason for partial or relative equivalence should be sought in three properties of natural languages: i. e., vagueness of meaning, polysemy and anisomorphism (Adamska-Sałaciak 2013: 222). Šipka (2015: 51) discusses three established types of cross-linguistic lexical anisomorphism: multiple equivalence, zero equivalence and partial equivalence. Among solutions which can be adopted in the case of zero equivalence, Svensén (2009: 261, 274–275) enumerates direct borrowing, loan translation, new coinage, encyclopaedic explanations, etc., whereas Šipka (2015: 52–53) stresses the importance of explanatory glosses combined with an SL word. Since zero equivalence in the case of culture-specific words can be solved in a bilingual dictionary in the ways mentioned by Svensén and Šipka, the treatment of culture-specific words in a bilingual dictionary is not the subject of our research. Apart from zero equivalence in culture-specific lexical items, Zgusta (1971: 323– 325; 1984: 149) enumerates other types of lexical items that often lack equivalents in other languages: onomatopoeia, interjections, functional words, particles and similar lexical units. Here, functional or grammatical words should be especially highlighted, Alenka Vrbinc: University of Ljubljana, Faculty of Economics, Kardeljeva ploščad 17, 1000 Ljubljana, Slovenia, [email protected] https://doi.org/10.1515/9783110598650-009
142
Alenka Vrbinc
since these often prove to be problematic when trying to establish equivalence. This can be explained by the distinct function performed by grammatical words in a sentence and by the fact that they are used differently in different languages. Among the grammatical words that are problematic from the dictionary-making perspective, Atkins/Rundell (2008: 164–165) enumerate the following: prepositions, conjunctions, pronouns, auxiliary verbs and the modals, determiners including the definite and indefinite articles, demonstratives, possessives, numerals, negatives, quantifiers and predeterminers. Many of these grammatical words are also identified in our study as being difficult to treat in an English-Slovene dictionary. The aim of this study is to investigate how to compensate for absent equivalents in the TL in a decoding English-Slovene dictionary (hereafter referred to as ESD) which is in its final stages of completion. Special attention is paid to different methods employed by the lexicographers compiling a bilingual dictionary to provide acceptable solutions when dictionary equivalent(s) do not exist in the TL. The ESD uses two symbols, i. e., Ø and #, to mark the absence of equivalents in the TL. The importance of explicitly marking zero equivalence in a bilingual dictionary is also stressed by Wiegand (2002: 248–249), who proposes the use of the symbol 0. Cases of true zero equivalence are rare in the ESD, because the lexicographers tried to mark the fewest possible lemmata or their senses with the symbol Ø indicating a complete absence of any equivalent, but instead used the hash symbol. The symbol # implies no equivalence at the word level, but if the untranslatable SL lexical item is used in an example illustrating its use, it can be rendered into the TL, which means that equivalence is reached at the level of the entire message. This article focuses on the use of the symbol Ø only and addresses individual cases marked by this symbol in the ESD in more detail.
2 Methodology The ESD investigated in this research contains 53,233 lemmata and 16,274 secondary lemmata and belongs to the group of more comprehensive bilingual English-Slovene dictionaries; at the same time, it is also pedagogically- and didactically-oriented. Since the study focused on zero equivalence which is marked with a special symbol (Ø), the entire dictionary was taken as a base for extracting cases of zero equivalence. Altogether, 29 lemmata were extracted, but one lemma can contain one or more senses with zero equivalence. The material collected was first analysed as to the part-of-speech of the lemmata and then each lemma or sense of the lemma with zero equivalence was investigated more thoroughly to identify any potential features that may be considered a reason for zero equivalence. Possible solutions offered by the lexicographers were also studied more closely.
Absence of dictionary equivalents: Problems and solutions
143
3 Lemmata with zero equivalence The greatest number of lemmata characterized by zero equivalence are verbs (9 out of 29). They are followed by adverbs (7), pronouns (4) and nouns (3). Other parts of speech are even more poorly represented in our database: a preposition and the definite article (2), the indefinite article and a short form. The short form ’s has two senses; sense 2, which is characterized by zero equivalence, is a short form of the auxiliary verb does and is therefore treated under verbal entries.
3.1 Verbal entries With the exception of one sense of the full lexical verb have, the verbal lemmata with at least one sense where no equivalent can be found in Slovene are either auxiliary verbs (3) or modal verbs (5). We should focus on each of these groups of verbs separately in order to address the issue of zero equivalence more precisely. The auxiliary verb be does not have an equivalent in Slovene when it combines with the present participle to form the progressive tenses and when it is used in archaic or literary constructions to form the perfect tense. The same holds true for have, which combines with the past participle to form either the present perfect or the past perfect. The auxiliary verb do does not have an equivalent in Slovene when it functions as operator: do is used to form negative and interrogative clauses as well as negative imperative clauses; it occurs in reduced clauses; it functions as an emphatic operator in the persuasive imperative; it is used in sentences including inversion after an initial negative element. Apart from the symbol Ø, some senses of the auxiliary verbs are also equipped with short descriptions of the function of the auxiliary verb, e. g., (the verb be) s sedanjim deležnikom za tvorbo opisnih časov ‘with the present participle to form progressive tenses’; (the verb do) pri obrnjenem besednem redu ‘in inverted word order’. All three auxiliary verbs may have different functions in the verb phrase, but their ability to act as operators seem to cause most problems for lexicographers when they try to provide dictionary equivalents. This may be explained by the differences in the tense formation, since tenses in Slovene are formed in a way completely different from how tenses are formed in English. The primary reason for that is that these two languages belong to different types of languages: English is an analytic language, while Slovene is a synthetic language. As for other specific functions of the auxiliary verbs, a contrastive analysis shows that no parallel can be drawn between these two languages, since in Slovene the same content is expressed by using completely different structures or specific lexical items. In the ESD, five out of nine verbs with at least one sense where zero equivalence can be observed belong to modal verbs, i. e., can, should, used to, will and would. In the ESD, only one out of four senses of can is characterized by zero equivalence, i. e.,
144
Alenka Vrbinc
the use of can with verbs of perception and with mental-state verbs. As can be seen from the (translated) examples provided in the ESD (I can’t hear you / Ne slišim te; I can’t understand you / Ne razumem te), the Slovene translation contains only the full verb (i. e., slišati ‘hear’, razumeti ‘understand’), whereas the modal verb can remains untranslated. The entry for the modal verb should has five senses in the ESD, but only one sense cannot be rendered into Slovene. The examples of use included for this particular sense show that the lexicographers gathered examples illustrating the use of different senses of the verb should that have no equivalent in Slovene and translated them under this specific sense. For example, should used after that after many adjectives that describe feeling (e. g., I find it strange that they should be so rude to me / Zdi se mi čudno, da so do mene tako nevljudni). In the modal verbs will and would, only one sense they both have in common is characterized by zero equivalence, i. e., descriptions of personal habits or characteristic behaviour. As is evident from examples illustrating the use of will and would in this sense (She will spend hours on the telephone / Cele ure preživi na telefonu; Her grandparents would take care of her / Zanjo so skrbeli stari starši), only the full verbs are translated into Slovene, whereas the modal verbs are left out in the Slovene translations. Similarly, the modal verb used to expresses habitual and state meanings. In the examples illustrating the use of used to in the ESD (e. g., Did he use to work here? / Ali je delal tukaj?; He didn’t use to smoke / Ni kadil), Slovene translations contain the imperfective form of the full verb in the past tense, but no modal verb is used in the translation. Since a repetitive action expressed by these modal verbs has no direct equivalent in Slovene, the only option left to a lexicographer is to resort to examples of use. In some cases, however, a theoretical explanation is essential apart from examples of use to help the user to more fully understand the use of the auxiliary verb in question. The ESD includes explanations that are short, precise, to the point, and above all, characterized by the use of very simple language. The metalanguage used in the ESD is Slovene, which also holds true for the short descriptions, since the dictionary is primarily intended for native speakers of Slovene. Short descriptions represent a short comment on the specific use dealt with in a specific sense (e. g., can: z glagoli, ki izražajo čute in mišljenje ‘with verbs expressing perception and the mind’). In the ESD, they are provided in brackets, are typographically distinct from dictionary equivalents and precede the symbol Ø. Have is the only full lexical verb where one out of fourteen senses is characterized by zero equivalence. This is the causative use meaning ‘to cause something to be done for you by somebody else’. In the ESD, the use of have in this sense is illustrated by means of the translated examples (e. g., He had his head cut off / Obglavili so ga; We have had our request refused / Zavrnili so nam prošnjo). The translation into Slovene contains the translation of the full lexical verbs in the English example (obglaviti ‘cut
Absence of dictionary equivalents: Problems and solutions
145
off’; zavrniti ‘refuse’); these verbs are (usually) in the third person plural, which here suggests generic or impersonal use.
3.2 Adverbial entries When studying the senses of the adverbs where no equivalent can be found in Slovene, it becomes obvious that the adverb is sometimes part of a multi-word verb. For example, in the ESD, the sense of along, which cannot be translated into Slovene without the accompanying verb, is illustrated by the following examples: come along ‘napredovati’; How are things coming along at work? / Kako gre delo?; The new computer helped us along enormously / Novi računalnik nam je izredno pomagal. As to the first two examples, along is part of the multi-word verb come along meaning ‘to improve or develop in the way that you want’ (OALD9). Similarly, help along used in the third example is also a multi-word verb meaning ‘to make something happen more quickly or easily’ (MED2). The same use of the adverb can be observed in away used in the following example included in the ESD: The water boiled away / Voda je povrela. It should be pointed out that multi-word verbs, which are a peculiarity of English with no parallel in Slovene, are usually included and treated under verbal lemmata in a special section. In adverbial lemmata, we can also come across examples of multi-word verbs since lexicographers try to define (in monolingual dictionaries) or translate (in bilingual dictionaries) the meaning of a particle that is a constituent element of a multi-word verb. If multi-word verbs were not included under adverbial lemmata, the problem of zero equivalence would be resolved, since the comprehension of the adverb does not contribute to the comprehension of the multi-word verb. It is therefore advisable to include multi-word verbs under verbal lemmata only and to avoid listing them under adverbial lemmata. The spatial meaning of out (‘a long or a particular distance away from a place or from land’, OALD9), up (‘to or at an important place, especially a large city’, OALD9) and through (‘travelling through a place without stopping or without people having to get off one train and onto another’, OALD9) represented in the examples in the ESD remains untranslated in Slovene (e. g., live out in the country / živeti na deželi; go up to New York / iti v New York; go straight through to / iti naravnost v). Existential there is also marked with the symbol Ø indicating zero equivalence. In this sense, its function can only be made clear to the users of a bilingual English-Slovene dictionary by including examples translated into Slovene, e. g., Has there been an accident? / Ali se je zgodila nesreča?; There’s a cinema around the corner / Kino je za vogalom. The meaning of the adverb very is divided into three senses, one being characterized by zero equivalence, i. e., the sense defined in OALD9 as ‘used to emphasize a superlative adjective or before own’. Very as an intensifier here premodifies the
146
Alenka Vrbinc
nonperiphrastic superlative (e. g., the very best quality / najboljša kakovost) or the emphatic determinative own (her very own car / čisto njen avtomobil). The Slovene translation may also contain the superlative, although the superlative in Slovene is not premodified by any word, e. g., the superlative of the adjective dober ‘good’, i. e., najboljši ‘the best’. Čisto njen avtomobil is translated literally as ‘an entirely her car’, which means that an intensifier is also used in Slovene as a premodifier of the possessive pronoun njen ‘her’.
3.3 Nominal and pronominal entries Zero equivalence can also be found in three nominal lemmata in the ESD. In the sense ‘a single item’, which is one out of nine senses of the noun piece, piece is used in a partitive construction and its use is illustrated by the following examples: an interesting piece of research / zanimiva raziskava; a piece of advice / nasvet. The noun piece is not translated into Slovene, since its only function is to express the quantity and thus countability of English uncountable nouns such as research and advice. The nouns raziskava ‘research’ and nasvet ‘advice’ are countable in Slovene; therefore, no additional lexical item is needed in Slovene to express plurality. A partitive use can also be observed in one out of fourteen senses of the noun round, which remains untranslated in Slovene. In this sense, round is used with applause and cheers to mean ‘a short period during which people show their approval of somebody/something by clapping, etc.’ (OALD9). The only way of showing the users that round in this sense does not have an equivalent in Slovene is to include translated examples (round of applause / aplavz, ploskanje; round of cheers / vzklikanje, pozdravljanje). In one out of eight senses (i. e., when it is defined as ‘a period of time’), the noun space is characterized by zero equivalence, owing to the contrastive differences between English and Slovene. It is evident from the examples included in the ESD that space is omitted rather than translated into Slovene (e. g., in a short space of time / v kratkem času). Four pronominal lemmata (i. e., any, it, this, these) included in the ESD are also characterized by zero equivalence and their use is illustrated by examples: –– The indefinite pronoun any used as a non-assertive pronoun in negative sentences (e. g., We got home without any difficulty / Domov smo prišli brez težav; I haven’t any idea / Pojma nimam). –– The personal pronoun it when used anaphorically (e. g., Stop it! / Nehaj! (the Slovene translation contains the imperative of the verb nehati ‘stop’); What about/of it? / Zakaj sprašuješ? (the Slovene translation can be glossed as ‘Why are you asking?’). The personal pronoun it is the most neutral and semantically unmarked of the personal pronouns (Quirk et al. 1985: 348–349), and this is also reflected in Slovene translations of the examples in the ESD.
Absence of dictionary equivalents: Problems and solutions
147
–– The demonstrative pronouns this and these (e. g., this house of yours / vaša hiša; these trousers of mine / moje hlače). The demonstrative pronoun functions as a premodifier in a nominal phrase which is postmodified by of + independent possessive. In the Slovene translation, the demonstrative pronoun is dropped and the whole structure is translated by means of the possessive pronoun followed by the noun (vaša hiša ‘your house’, moje hlače ‘my trousers’). It should be pointed out that Slovene does not distinguish between determinative and independent possessives and therefore, the translation of the above examples corresponds to the translation of the combination determinative possessive + noun, which is also the reason for zero equivalence in this sense of this/these in the ESD.
3.4 Other parts of speech In the ESD, two prepositions with zero equivalence in at least one sense are included, i. e., at and of. Their use is illustrated by translated examples, e. g. at large / na prostosti; at least / vsaj; be at its best / biti najlepši; the role of the teacher / učiteljeva vloga; a woman of genius / genialna ženska; some of my friends / nekateri moji prijatelji. In the entry for at, the examples included in the ESD are idiomatic expressions, which is the reason why at is not translated into Slovene, and its absence in the Slovene translation is indicated to make the user aware of zero equivalence. It is much more appropriate to include such idiomatic expressions under the first full lexical word in the expression rather than under the preposition. Of is frequently used as a postmodifier in noun phrases in a function similar to that of the genitive (Quirk et al. 1985: 703). In this function, the noun in the genitive is often used in the Slovene translation, but this is not the only possibility for translating of followed by a noun phrase. As can be seen from the examples included in the ESD, the following two options exist: translation by means of an adjective (the role of the teacher / učiteljeva vloga; a woman of genius / genialna ženska) and translation by means of a determinative possessive (a friend of mine / moj prijatelj). Three dictionary entries treating either the definite (the, ye) or indefinite article (a) can be found in the ESD. The use of the article poses problems for native speakers of Slovene, because articles are not used in Slovene at all and consequently, no parallels can be drawn between English and Slovene as regards articles. The English articles can sometimes be rendered into Slovene, but in most cases, the English articles are simply dropped in rendering a translation in Slovene. This is illustrated by some typical contexts in the ESD: Do you have a car? / Ali imate avto?; the house at the end of the street / hiša na koncu ulice; (pred imeni restavracij, da zvenijo starinsko):1 Ye Olde
1 The use of ye is described by means of a short explanation ‘pred imeni restavracij, da zvenijo starinsko’, which can be translated into English as ‘in the names of restaurants to make them seem old’.
148
Alenka Vrbinc
Bull / (ime) Stari bik. The Slovene nouns avto ‘car’, hiša ‘house’ and bik ‘bull’ are not premodified by any determiner, and the kind of reference a particular noun phrase has in English (i. e., indefinite reference or definite reference) is lost in the Slovene translation. It should also be stressed that the use of articles in English is often idiomatic and therefore highly unpredictable for non-native speakers.
4 Conclusion As can be seen from our study, the lexicographers are mostly faced with the problem of zero equivalence when dealing with grammatical words. These words are language-specific and many of their functions in one language are carried out in another language in a completely different way. The semantic content of grammatical words may not even be mentioned in a bilingual dictionary; instead, lexicographers include a description of the function of the lemma in a particular sense, which is also the case in the ESD. Since the dictionary users do not find an equivalent in such cases, the lexicographers need to employ other means to show how the lemma or one of its senses can be translated in specific types of contexts. They include translated examples of use which show contrastive differences between two languages and illustrate the differences between the dictionary equivalent(s) offered in the dictionary and the translation of the lemma in context. Untranslated examples are of no help to the dictionary user who is not familiar with the meaning of the lemma in question; the translation of examples is therefore an absolute must (Vrbinc/Vrbinc 2016: 308). To conclude, the main objective of the compilers of any bilingual dictionary is to offer the users dictionary equivalents. In cases where no equivalents exist, the users should be offered workable solutions which enable them to deal successfully with the absence of dictionary equivalents.
Bibliography Monographs and articles Adamska-Sałaciak, Arleta (2013): Issues in compiling bilingual dictionaries. In: Jackson, Howard (ed.): The Bloomsbury Companion to Lexicography. London etc.: Bloomsbury, 213–231. Atkins, B. T. Sue/Rundell, Michael (2008): The Oxford Guide to Practical Lexicography. Oxford: Oxford University Press. Gouws, Rufus H. (2002): Equivalent relations, context and cotext in bilingual dictionaries. In: Hermes Journal of Linguistics 28, 195–209. Quirk, Randolph et al. (1985): A Comprehensive Grammar of the English Language. London, New York: Longman. Svensén, Bo (2009): A Handbook of Lexicography. Cambridge: Cambridge University Press.
Absence of dictionary equivalents: Problems and solutions
149
Šipka, Danko (2015): Lexical Conflict: Theory and Practice. Cambridge: Cambridge University Press. Vrbinc, Alenka/Vrbinc, Marjeta (2016): Illustrative examples in a bilingual decoding dictionary: An (un)necessary component? In: Lexikos 26, 296–310. Wiegand, Herbert Ernst (2002): Equivalence in bilingual lexicography: Criticism and Suggestions. In: Lexikos 12, 239–255. Zgusta, Ladislav (1971): Manual of Lexicography. Prague: Academia; The Hague, Paris: Mouton. Zgusta, Ladislav (1984): Translational Equivalence in the Bilingual Dictionary. In: Hartmann, Reinhard Rudolf Karl (ed.): LEXeter ’83 Proceedings. Papers from the International Conference on Lexicography at Exeter, 9–12 September 1983. Tübingen: Niemeyer, 147–154.
Dictionaries OALD9 = Oxford Advanced Learner’s Dictionary of Current English. Ed. by Deuter, Margaret/Bradbery, Jennifer/Turnbull, Joanna. Oxford: Oxford University Press, 9th edition, 2015. MED2 = Macmillan English Dictionary for Advanced Learners. Ed. by Rundell, Michael. Oxford: Macmillan Education, 2nd edition, 2007.
Zita Hollós
Datendistribution relativ zum Webdesign. Der erste Prototyp des E-KolleX 1 Einleitung Auf dem Weg von SZÓkapTÁR/KolleX (2014) (im Weiteren KolleX) zu einem online Kollokationswörterbuch, E-KolleX, wurde zuerst in Hollós (2016) die lexikographische Praxis der allgemeinen Onlinewörterbücher in Bezug auf die Kollokationen beschrieben. Das Anliegen des früheren Beitrages war die Relevanz von E-KolleX vor dem Hintergrund der vorhandenen Onlinewörterbücher (Elexiko, DWDS oder Duden Online) und Analysetools (DW, DWDS) aufzuzeigen sowie sein neues Datenbankmanagementsystem samt der Datenbank, dem webbasierten User-Interface und der detaillierten Datenstruktur vorzustellen. Auch erste Überlegungen zur Erweiterung des Datenangebots im Hinblick auf den zentralen Wörterbuchgegenstand, den der Kollokationen, sind dabei entstanden. In einem nächsten Beitrag (Hollós [erscheint]) folgte die notwendige Auseinandersetzung mit den elektronischen ein-, zwei und mehrsprachigen phraseologischen Spezialwörterbüchern, in erster Linie mit Deutsch für DaF-Lerner, damit die Datenpräsentation für E-KolleX auf der Basis der best practices entstehen kann.1 Ziel dieses Beitrags ist es, die früher bereits angesprochenen lexikographischen Potenziale zukünftiger Onlinewörterbücher in Lemberg (2001: 73) am neu entwickelten Protoyp von E-KolleX nachzuweisen. Die entsprechenden Screenshots gewähren nicht nur die ersten Einblicke in bestimmte Strukturen von E-KolleX – wie die Zugriffs- und Suchbereichsstruktur –, sondern auch sein Webdesign und seine Funktionsweise werden mit ihrer Hilfe detailliert vorgestellt. Danach werden die geplanten Module von E-KolleX und die Datendistribution der neu konzipierten Datentypen beschrieben. Letzteres geschieht relativ zu den Wörterbuchfunktionen und zu den Sprachniveaus der Wörterbuchbenutzer. Erst wenn ein optimales Datenangebot, das jedoch für den konkereten Wörterbuchtyp ein möglichst maximales bedeutet, erreicht wurde, können die ersten theoretischen Vorschläge für vordefinierte Benut-
1 Die dabei berücksichtigten elektronischen Wörterbücher und Ressourcen sind u. a. EPHRAS, SprichWort-Plattform und DiCE.
Zita Hollós: Károli Gáspár Universität der Reformierten Kirche, Lehrstuhl für Deutsche Sprache und Literatur, Reviczky u. 4, 1088 Budapest, Ungarn, [email protected] https://doi.org/10.1515/9783110598650-010
152
Zita Hollós
zerschnittstellen unterbreitet werden. Auf dem Weg der modernen online Phraseographie könnte der vorliegende Beitrag eine erste Station darstellen.
2 Lexikographische Potenziale des E-KolleX Dank der dynamischen Datenbank und Datenstruktur von KolleX konnten fast alle der folgenden internetlexikographischen Vorzüge bereits umgesetzt werden (vgl. Lemberg 2001: 73): –– Aufhebung des begrenzten Druckumfangs, –– Hypertextualisierung, –– multimediale Aufbereitung lexikographischer Daten, –– mehrfache äußere Zugriffsstrukturen und vielfältige Suchmöglichkeiten, –– Interaktivität, –– Aufhebung eines statischen zugunsten eines dynamischen Wörterbuchs, –– Kooperation und Interaktion zwischen Lexikograph und Benutzer. Die obigen Potenziale kann man mehr oder weniger ausgeprägt bereits am ersten Prototyp nachweisen. Es gibt nur eine einzige Ausnahme, nämlich die Kooperation und Interaktion zwischen Lexikograph und Benutzer, die noch nicht realisiert wurde. Diesem Aspekt muss in der Konzeption von E-KolleX eine eigenständige Komponente, ein eigenes interaktives Modul mit social media gewidmet werden. Da die ersten zwei der oben genannten Potenziale bei einem Onlineprodukt selbstverständlich sind, werde ich im Folgenden nur den übrigen Punkten, also vier Vorzügen im E-KolleX nachgehen.
2.1 Multimediale Aufbereitung lexikographischer Daten Der erste Screenshot zeigt den Wörterbuchartikel zum Lemmazeichen Bäckerei (wa1). Daran ist bereits die Möglichkeit der Integration von Audio- und Bilddateien im E-KolleX erkennbar. Das blaue Lautsprecher-Symbol direkt am rechten Rand der oberen hellgrün unterlegten Subsuchzone zur Form wird in der vollentwickelten und datengesättigten Version des E-KolleX eigenproduzierte Audiodateien enthalten. Die Bilddatei etwas links darunter, bereits in der weißen Subsuchzone zur Semantik, stammt aus der freien Bildressource pixelio.de. Die weitere Integration von Bildern auf einer tieferen Ebene der Datenstruktur, etwa zu einzelnen Kollokationen, ist auch geplant. Sie ist erforderlich, wenn die bildliche Darstellung zur Erschließung der Bedeutung der Kollokationen beiträgt oder kulturspezifische Aspekte der Verwendung verdeutlicht.
Datendistribution relativ zum Webdesign
153
Abb. 1: wa1 zu Bäckerei im E-KolleX.
Die Erstellung von Videodateien für lexikographische Zwecke ist technisch mühsam und auch zum Einsatz von kurzen Videos in online Wörterbüchern gibt es m. W. noch keine umfassenden Untersuchungen. Sie bieten sich bei SUBS+VERB-Kollokationen oder bei ADV+VERB-Kollokationen an, da Handlungen, Vorgänge, Geschehnisse etc. mit bewegten Bildern am besten darzustellen sind.
2.2 Mehrfache äußere Zugriffsstrukturen und vielfältige Suchmöglichkeiten Im E-KolleX stehen dem Benutzer verschiedene Suchmöglichkeiten und damit verschiedene äußere Zugriffsstrukturen auf die Wörterbuchartikel zur Verfügung. Neben der lemmabasierten Suche gibt es auch die indexbasierte und eingabebasierte Suche. Bei diesen letzteren Suchmöglichkeiten wird bei erfolgreicher Suche, ähnlich wie mithilfe der alphabetischen Makrostruktur des Wörterbuchs, direkt auf die einzelnen Wörterbuchartikel durch den Leitelementträger Lemmazeichen zugegriffen. Der Benutzer muss allerding aus einer Reihe von Lemmata, die die Treffer zur Suchanfrage darstellen, unter den ersten zwei das gesuchte Lemma auswählen und anklicken, damit der dazugehörige Wörterbuchartikel angezeigt wird. Die Treffer werden bei der indexbasierten Suche zunächst auf 10 eingeschränkt. Das ist eine vordefinierte Menge, die eine konkrete Lemmateilstrecke bei jeder solchen Suchanfrage bildet und mit einem Klick auf die ganze Lemmastrecke erweitert werden kann. Aus dieser Stecke kann dann mit Hilfe der lemmabasierten Suche auf jeden im E-KolleX verzeichneten Wortartikel zugegriffen werden.
154
Zita Hollós
Abb. 2 zeigt die ersten zehn Treffer zur a/A-Lemmastrecke und gleichzeitig erfährt man oberhalb der Trefferliste in der hellblau unterlegten Subsuchzone der Trefferzahl, dass die gesamte Lemmazahl, die der Suchanfrage entspricht, 179 beträgt. Mit dem Betätigen des Buttons Alle anzeigen kann man alle 179 Lemmata mit a/A in einem Fenster mit Scrollfunktion anzeigen lassen.
Abb. 2: Suchergebnisse zu a/A im E-KolleX.
Die Suchergebnisse der A/a-Lemmastrecke mit dem Filter Beachte Groß-/Kleinschreibung ergibt einen kleinen Ausschnitt; zunächst die ersten zehn Treffer, wobei die gesamte Zahl der Substantivlemmata mit A nur noch 78 beträgt. Als Ergebnis der Suche nach Lemmata mit dem Anlaut Ar- bleiben insgesamt 14 Lemmata. Die inkrementelle Suche, in der die Suchergebnisse beim fortschreitenden Eintippen des Suchwortes automatisch verringert werden sowie verschiedene filterbasierte Suchfunktionen z. B. anhand stilistisch-pragmatischer Angaben zu den Lemmata oder nach Sachgruppen stehen dem Benutzer noch nicht zur Verfügung. Damit wäre aber die nächste Version von E-KolleX erweiterbar und diese Weiterentwicklung der äußeren Zugriffstruktur ist bei einem online Lernerwörterbuch wie E-KolleX auch sehr wünschenswert.2
2 Die innere Zugriffsstruktur wird an dieser Stelle nicht behandelt. Sie müsste auch mithilfe der Datendistribution relativ zum Webdesign vorgestellt werden, da sie nicht nur mit der Selektion, sondern auch mit der zwei- bzw. dreidimensionalen (durch Links realisierten) Präsentation der Daten am Bildschirm eng zusammenhängt.
Datendistribution relativ zum Webdesign
155
2.3 Interaktivität Der Begriff der ‚Interaktion‘ wurde in den 1980er-Jahren aus der Sozialwissenschaft als Metapher in die Informatik und Informationswissenschaft übertragen. Als interaktiv bezeichnet man in diesem Kontext Software, die auf Eingaben eines Anwenders in vorprogrammierter Weise reagiert, d. h. es geht um die Interaktion zwischen Mensch und Computersystem […]. (Storrer 2008: 321f.)
Im Sinne des Zitats gehören hierher auch die obigen, bereits beschriebenen interaktiven Suchfunktionen im E-KolleX, aber vor allem die wörterbuchexternen Links, die den entsprechenden Ausschnitt zum jeweiligen Lemma aus den ins User-Interface integrieren online Ressourcen wie Deutsches Wörterbuch der Deutschen Sprache (DWDS) und Deutscher Wortschatz (DW) zeigen. Ein Zugriff auf diese Seiten ist zweifach möglich (siehe Abb. 1 zu Bäckerei): entweder direkt, im unteren, dynamischen Teil der Webseite des E-KolleX integriert, oder in einem neuen Tab, außerhalb des online Kollokationswörterbuchs, durch das Klicken auf den Button Open in new tab.3 Beide Male sind die Fenster, ob sie neu geöffnete oder Fenster-inFenster-Darstellungen sind, interaktiv und adaptiv, demzufolge mit einer Scrollfunktion versehen, also nach dem gesuchten Datum leicht durchsuchbar. Das Ziel der Integration dieser beiden lemmabezogenen Portale4 ist es, den fortgeschrittenen DaF-Lernern ganz bestimmte Datentypen bereitzustellen.5 Im Folgenden werden die drei Datentypen aus den integrierten Ressourcen mit ihrer im E-KolleX zugewiesenen Funktion vorgestellt. Wenn ein Wörterbuchartikel aus der Trefferliste ausgewählt und geöffnet wird, werden die Daten, die in Abb. 1 zu Bäckerei ablesbar sind, präsentiert. Im zweiten, unteren Teil des Suchbereichs zum Wörterbuch, in der mediostrukturellen Suchzone zu externen Ressourcen, wird automatisch die Webseite zum jeweiligen Lemma, in diesem Fall zu Bäckerei, aus dem DW aufgerufen. Zur korpusbasierten Datenselektion für die Wörterbuchartikel im KolleX/E-KolleX dienten die statistisch ermittelten Kookkurrenzdaten aus dem DW und damit bildete diese Ressource die wichtigste Primärquelle bei der Erstellung der Datenbank. Aus diesem Grund wird die passende, lemmabezogene Webseite des Portals im untersten Bereich des Startbildschirms mit dem jeweiligen Wörterbuchartikel aus E-KolleX verlinkt und in einem integrierten Fenster eingeblendet.6 Ein gezielter und deshalb programmierbarer Zugriff auf den Graph im DW ist leider nicht möglich, obwohl der Benutzer – wie der Tab-Name Asso-
3 Hier allerdings muss die Metasprache in der nächsten Version auf Deutsch umgestellt werden. 4 Zur Terminologie siehe Klosa/Müller-Spitzer (2016: 57). 5 Ein nicht intendierter, aber nützlicher Effekt dabei ist allerdings, dass im E-KolleX nicht geplante, aber nützliche weitere Daten für die fortgeschrittenen Lerner nun auch zur Verfügung stehen und genutzt werden können. 6 Ein weiterer Grund ist, dass DW eine korpusbasierte, sprachtechnologisch erstellte deutsche online Ressource ist, ohne den Anspruch ein Nachschlagewerk bzw. Wörterbuch zu sein.
156
Zita Hollós
ziogramm aus DW besagt – mit einer graphischen Darstellung rechnet. Der Benutzer muss also im integrierten zweiten Fester mithilfe der Scrollfunktion auf die Suche nach dem Assoziogramm gehen.7 Wenn er beim gesuchten Datum angekommen ist, sieht er folgendes Bild:
Abb. 3: Assoziogramm zu Bäckerei aus DW, integriert im E-KolleX.
Die nächste Möglichkeit in der mediostrukturellen Suchzone ist es, wenn auf den ersten Tab Belege aus DWDS-Korpora geklickt wird. Hier können dann mithilfe der Scrollfunktion Belege zum Stichwort (im DWDS Verwendungsbeispiele genannt) gefunden werden:
Abb. 4: Belege zu Bäckerei aus DWDS, integriert im E-KolleX.
7 Dasselbe gilt auch, wenn Bäckerei im DW in einem neuen Fenster geöffnet wird.
Datendistribution relativ zum Webdesign
157
Wenn dieser Link in einem neuen Fenster geöffnet wird, hat man sofort den Zugriff auf die beabsichtigten Daten, wie in der nächsten Abbildung sichtbar:8
Abb. 5: Belege zu Bäckerei aus DWDS im neuen Fenster.
Die letzte Möglichkeit auf externe Ressourcen zuzugreifen ist etwas Spezifisches, aber für Fortgeschrittene Deutschlerner ein echter Gewinn in Sprachproduktionssituationen. Der mittlere Tab integriert das Wortprofil aus DWDS ins E-KolleX, wie es teilweise auf der Abb. 6 erkennbar.
Abb. 6: Wortprofil zu Bäckerei aus DWDS, integriert im E-KolleX.
8 Es ist noch zu prüfen, ob bei der integrierten Sicht nicht etwa ein Programmierfehler vorliegt. Denn wenn die Ressource im neuen Fenster geöffnet wird, werden sofort die Belege (Verwendungsbeispiele) angezeigt.
158
Zita Hollós
In einem neuen Fenster geöffnet hat man zum Wort Bäckerei durch das größere Format eine viel bessere Übersicht über die möglichen Partner in verschiedenen Funktionen:9
Abb. 7: Wortprofil zu Bäckerei aus DWDS im neuen Fenster.
Ein eigenes, für das E-KolleX erstelltes Korpusanalysewerkzeug mit dem entsprechenden Korpus wäre auf lange Sicht möglicherweise die ideale Lösung. Es stellt sich allerdings die Frage, ob dieses bessere Daten liefern würde und ob sie benutzerfreundlicher gestaltbar wären. Die Verlinkung mit bereits existierenden deutschen wissenschaftlichen Sprachressourcen zum Zweck der Erstellung eines zweisprachigen online Kollokationswörterbuchs für DaF hat mehrere Vorteile: –– Zuverlässigkeit der Daten, –– Ökonomie im Hinblick auf die menschlichen und finanziellen Ressourcen, –– gesteigerte Interaktivität durch durchdachte Vernetzung, –– gezielte komplementäre Effekte zwischen den Ressourcen, –– Synergieeffekte zwischen den Ressourcen, –– gesteigerte Nutzungshäufigkeit der verlinkten Ressourcen.10
9 Durch Anklicken der Partner erhält man Belege für die Verwendung des Wortes Bäckerei mit dem jeweiligen Partner, z. B. Bäckerei – elterlich: Ernst Tessloff übernimmt mit seinem Bruder die elterliche Bäckerei (Die Zeit, 21. 11. 2013, Nr. 47). 10 Vor allem dann, wenn – wie geplant – sukzessive auch das einsprachige E-KolleX und möglicherweise weitere zweisprachige E-KolleX-Ressourcen entstehen.
Datendistribution relativ zum Webdesign
159
2.4 Aufhebung eines statischen zugunsten eines dynamischen Wörterbuchs Dynamik ist zwar sehr wichtig beim Hypertextkonzept, aber eigentlich eine optionale Eigenschaft und muss nicht unbedingt genutzt werden, wie z. B. bei Wörterbüchern, die der Sprachdokumentation dienen und deshalb meistens retrodigitalisiert werden (vgl. Storrer 2008: 321). Dynamik bedeutet also: Ein online Wörterbuch „wird kontinuierlich um neue Artikel erweitert. Auch der Inhalt der Artikel ist nicht statisch, sondern kann bei Bedarf jederzeit verändert und aktualisiert werden“ (ebenda). Dies trifft in vollem Maße bei E-KolleX zu und noch viel mehr, da die Datenbank nicht nur mit neuen Artikeln bzw. Daten, sondern auch mit neuen Datentypen erweiterbar ist, deren Formspezifikation auf der Präsentationsebene im webbasierten Datenbankmanagementsystem individuell bestimmbar ist. Abb. 8 zeigt einen Ausschnitt aus der Datenbank, die um einen neuen Datentyp Image erweitert wurde (rechts unten am Rande).
Abb. 8: Ausschnitt aus der Datenbank des E-KOLLEX mit neuem Datentyp Image.
Der neue Datentyp 344 zeigt, dass nicht nur bei den Sememen der jeweiligen Lemmazeichen im E-KolleX Bilder vorgesehen sind, sondern auch bei den einzelnen Kotextpaaren (303) solche geplant sind und später hochgeladen werden können. Dank der dynamischen Datenstruktur kann E-KolleX auch im Hinblick auf weitere ein- und zweisprachige (Teil-)Wörterbücher durch neue Angaben- bzw. Datentypen erweitert werden und ist damit ein dynamischeres Nachschlagewerk als je zuvor.
160
Zita Hollós
3 Datendistribution im E-KolleX relativ zu den Wörterbuchfunktionen Bei der Planung der Datendistribution für die Onlineversion des KolleX sind mehrere relevante Aspekte zu nennen. Wörterbuchfunktionen: –– Produktions-, Rezeptions-, Translationsfunktion, –– mit DaF-Perspektive: Studierfunktion; Wörterbuchbenutzer: –– auf Anfänger- und mittlerem Niveau, –– Fremdsprachenlerner mit verschiedenen Muttersprachen (einsprachige bzw. weitere zweisprachige Versionen); Wörterbuchtyp: –– korpusbasiert, –– online (mit externen korpusbasierten Ressourcen und/oder mit Korpusanbindung samt Korpusanalysewerkzeugen). Wenn diesen Anforderungen bei der Planung der Onlineversion Rechnung getragen wird, kann über eine E-Ressource der Kollokationen für DaF – E-KolleX – gesprochen werden. Die geplante online Kollokationsressource für DaF weist dementsprechend mehrere Module auf, wie die Abb. 9 zur zukünftigen Startseite zeigt:
Korpus mit spezifischen Analysetools Kollokationsdidaktik mit Übungen
Externe Ressourcen
KolleX
Lernerwörterbuch
Interaktivität
Umtexte
Abb. 9: Geplante Module im E-KolleX.
Datendistribution relativ zum Webdesign
161
Auf dem Weg der Realisierung müssen die geplanten Wörterbuchfunktionen mitbedacht werden, da nur mit einem maximalen Datenangebot eine optimale Selektion und Distribution der Daten für mehrere Wörterbuchbenutzungssituationen und damit für vordefinierte Wörterbuchfunktionen bzw. für unterschiedliche Sprachniveaus der Benutzer möglich ist. Folglich sind Datenkomplexität und ein spezifisches Informationsangebot durchaus auch von linguistischer Seite erwünscht. Der wissenschaftlichen Lexikographie bleibt vor diesem Hintergrund deshalb vor allem der Auftrag, neue Arten der Datenmodellierung und des Informationsangebots auszuprobieren und auch neue, bisher unbekannte Arten des Zugriffs anzubieten. Eine Modellierung sollte möglichst ein Maximum des Darzustellenden vorsehen und anstreben. (Klosa/Müller-Spitzer 2011: 6) Die primären Wörterbuchfunktionen im KolleX waren die Produktions- und Studierfunktion. Im zukünftigen E-KolleX können jedoch durch die dynamische Datenpräsentation im Hypertext alle Wörterbuchfunktionen berücksichtigt werden, also die konfliktbedingten (Produktions-, Rezeptions- und Übersetzungsfunktion) sowie die Studierfunktion, wie in der Abb. 10 dargestellt wird: E-KolleX als E-Ressource für DaF-Lerner für die Sprachproduktion –– Präsentation der Kollokationen als ganze Einheiten –– einsprachige Version
für die Sprachrezeption
für die Translation
–– gemeinsame Lemmaliste der Basen und Kollokatoren –– alphabetische Umsortierung der Kollokatoren in den Wörterbuchartikeln
–– gemeinsame Lemmaliste der Basen und Kollokatoren –– Umkehrung der Sprachrichtung –– verschiedene Register (deutsch, ungarisch)
Abb. 10: Primäre Wörterbuchfunktionen im E-KolleX.
All diese Funktionen sollten mit der Erweiterung des Datenangebotes durch neuartige, korpusbasierte Daten weiter ausgebaut werden. Die geplante Anbindung eines Korpus mit eigens für diese Ressource entwickelter Kollokationsextraktion und/oder die Verlinkung mit externen korpusbasierten Ressourcen mit Korpusanalysewerkzeugen (wie z. B. DW, DWDS oder CCDB) dient gerade diesem Zweck. In der Abbildung 11 werden solche Daten relativ zu den Wörterbuchfunktionen exemplarisch genannt. Das E-KolleX hat auch eine Studierfunktion, die mit den geplanten Bild- und Audiodateien und der Teilintegration des deutsch-ungarischen Schulwörterbuchs (Holl-Suli 2001) stärker als beim KolleX ausgeprägt ist. In diesem Zusammenhang müssen die in der Abb. 1 zum Lemma Bäckerei (wa1) gut erkennbaren, bisher nicht thematisierten, grünen, deutsch-ungarischen Beispielsätze mit unterschiedlichen Kennzeichnungen, wie die Kennzeichnung des Lemmas oder die des Äquivalents, hervorgehoben werden.
162
Zita Hollós
E-KolleX als E-Ressource für DaF-Lerner für die Sprachproduktion –– Statistisch ermittelte Kookkurrenzen (sowohl für die Lemmata als auch für die Kollokationen) –– korpusbasierte stilistisch-pragmatische, morphosyntaktische Angaben
für die Sprachrezeption
für die Translation
Korpusbelege (sowohl für die Lemmata als auch für die Kollokationen)
Korpusbasierte Äquivalente und Belegsätze aus Parallel korpora
Abb. 11: Korpusanbindung oder Verlinkung mit externen Ressourcen im E-KolleX.
Die in Kapitel 2 als lexikographische Potenziale des E-KolleX vorgestellten, neuen Datentypen sowie die eben, in der Abb. 11 aufgelisteten Datentypen können nun zusammengefasst und relativ zu den Wörterbuchfunktionen und zum Sprachniveau der Wörterbuchbenutzer für die Datendistribution folgendermaßen dargestellt werden:11 E-KolleX
Anfängerniveau
mittleres Niveau
A1–A2
B1–B2
Produktion
Rezeption
Translation
Sprachlernen
neue Datentypen
neue Datentypen
neue Datentypen
neue Datentypen
Belege aus Parallelkorpora
Beispielsätze
Audiodateien
Belege zu Lemmata
Kookkurrenzen
Belege zu Kollokationen
Bilder zu Sememen
Wortprofile
dt. Bedeutungsparaphrasen
Bilder zu Kollokationen
Gebrauchsmuster
Sprichwörter, Phraseme
Assoziogramme
Abb. 12: Datendistribution relativ zu den Wörterbuchfunktionen und zum Sprachniveau der Wörterbuchbenutzer.
11 Das Sprachniveau wird an den Kästen der Datentypen mithilfe von Farbkodierungen gekennzeichnet (hell: Anfängerniveau, dunkel: mittleres Niveau). Der kleinere Schrifttyp bei den Datennamen markiert solche Datentypen, die in der Datenbank noch nicht vorhanden bzw. – im Falle der Audiodateien – besetzt sind.
Datendistribution relativ zum Webdesign
163
Auch die große Zahl der bereits in der Datenbank vorhandenen Datentypen sollte diesen Wörterbuchfunktionen und Sprachniveaus zugeordnet werden. So würde man allerdings eine zu komplexe Datendistribution erhalten, zu deren Darstellung neue Methoden zu entwickeln sind. Dies würde den Rahmen des Beitrages sprengen.
4 Webdesign des E-KolleX In Kapitel 2 konnte bereits ein erster Eindruck über das Webdesign und die Funktionsweise des E-KolleX gewonnen werden. Dieser noch in Entwicklung befindliche Prototyp wurde anhand der Ergebnisse der ersten, breitangelegten Benutzungsforschung zu Onlinewörterbüchern (vgl. Müller-Spitzer/Koplenig/Töpel 2012) und unter Berücksichtigung der Wörterbuchkritik von Onlineressourcen bei Kemmer (2010) u. a. erstellt.12 Im Folgenden möchte ich die wichtigsten Erkenntnisse nennen, die auch als Einflussfaktoren bei der Konzipierung des Webdesigns fungierten. Die Zielsetzung der Untersuchung von Müller-Spitzer/Koplenig/Töpel (2012) war, generelle Fragen zur Benutzung der Onlinewörterbücher zu beantworten und verschiedene Benutzerbedürfnisse in Hinblick auf die Onlinewörterbücher aufzudecken. Die Onlineuntersuchung wurde Anfang 2010 unter 390 Probanden durchgeführt. Ihre relevanten generellen Forschungsfragen lauteten: –– Was sind die wichtigsten Einflussfaktoren bei der Beurteilung der Qualität und Benutzerfreundlichkeit der Onlinewörterbücher? –– Haben verschiedene Benutzergruppen auch unterschiedliche Präferenzen im Hinblick auf solche Faktoren? –– Präferieren verschiedene Benutzergruppen (in derselben Benutzungssituation) eine spezielle oder eher alternative Präsentation von Wörterbucheinträgen in Onlinewörterbüchern? Die erste konkrete Forschungsfrage bezieht sich auf den Zugang zum Onlinewörterbuch, also mithilfe welcher Geräte sie konsultiert werden. Hier konnte man eine Präferenz für eine Großbildschirmformat feststellen und das Handy fungierte damals noch sehr selten (0,6 % der Fälle) als Benutzungsmedium. Die dritte Forschungsfrage zielte auf die Erwartungen an Onlinewörterbücher bei den Benutzern. Für sie sind Zuverlässigkeit der Daten, Übersichtlichkeit, aktualisierte Inhalte, Geschwindigkeit und problemloser Zugang am wichtigsten. Diese werden bei E-KolleX gewährleistet, obwohl die Aktualisierung der Inhalte jedes Onlineprodukt vor große Anforderungen stellt.
12 Zur Benutzungsforschung zu online Wörterbüchern ist unbedingt der Band von Müller-Spitzer (2014), zu den elektronischen Wörterbüchern bzw. online Informationssystemen sind die drei Sammelbände von Granger/Paquot (2012), Gouws et al. (2013) und Mann (2014) und der neulich erschienene Band zur Internetlexikografie von Klosa/Müller-Spitzer (2016) zu nennen.
164
Zita Hollós
5
Übersichtlichkeit Schnelligkeit Vernetztheit mit Korpus
Wichtigkeit
4
Verlässlichkeit
Aktualisierung
Erreichbarkeit
Adaptivität 3
Animation zum Stöbern
Vemetztheit mit Wbb. Multimedialität
2
1
1
2
3
4
5
6 Ranking
7
8
9
10
Abb. 13: Wichtigkeit bestimmter ausgewählter Kriterien guter Onlinewörterbücher (Klosa/MüllerSpitzer 2016: 315).
Als weniger wichtig schätzen die befragten Benutzer Multimedialität, Adaptivität und Vernetztheit mit Wörterbüchern als Eigenschaften guter Onlinewörterbücher ein. Auf die Frage warum gibt die vierte Forschungsfrage eine Antwort. Hier wurde nach der Notwendigkeit der Entwicklung von innovativen Ansichten bei Onlinewörterbüchern gefragt. In diesem Bereich hatten die Probanden kein Urteilsvermögen, weil sie zu wenig Erfahrung damit gemacht hatten. Man denkt unwillkürlich an die Anekdote in Tarp (2014). Als Henry Ford sein berühmtes Modell T, bei Tarp T Ford genannt, vorgestellt hatte, wurde er gefragt, ob er vor der Entwicklung des Modells seine „Nutzer“ gefragt hätte. „According to the legend, his laconic answer was that if he had asked the users what they wanted, they would have said ʻfaster horsesʼ“ (Tarp 2014: 248). Es machte also damals wenig Sinn, danach zu fragen, was für ein Onlinewörterbuch sich die Benutzer wünschen, da sie weder genug Erfahrung noch ausreichende Imaginationskraft besaßen, den Lexikographen eine brauchbare Antwort zu liefern. Vor allem Adaptivität und Vernetztheit sowohl mit anderen Wörterbüchern als auch mit Korpora sollten beim E-KolleX einem gut durchdachten Prinzip folgen. Ersteres steht noch aus, Letzteres ist ansatzweise im E-KolleX durch die Verlinkung mit DW und DWDS bereits vorhanden. Auch multimediale Inhalte müssen Teil der neuen Onlinewörterbuch-Konzeption sein, damit erklärt sich die Integration der Datentypen Bild- und Audiodatei im ersten Prototyp. Die zweite Forschungsfrage behandele ich am Schluss, da diese in Bezug auf das Webdesign des E-KolleX am relevantesten ist. Die Autoren untersuchen vier prototypische Präsentationsformen für Wortartikel in wissenschaftlichen Wörterbüchern mit
Datendistribution relativ zum Webdesign
165
intensiver Mikrostruktur, die sie anhand von konkreten Onlinewörterbüchern festlegen: – explorer view (dänisches Den danske Ordbog), – panel view (DWDS), – tab view (eleXico), – print view (French online dictionary). Die zweitbeliebteste Präsentationsform bei den Probanden ist mit Abstand (32,82 %) der sog. panel view (Abb. 14) und die beliebteste, ebenfalls mit Abstand (42,82 %), der sog. tab view (Abb. 15) (vgl. Müller-Spitzer/Koplenig/Töpel 2012: 429–445).
Abb. 14: Zweitbeliebteste Präsentationsform panel view (Müller-Spitzer/Koplenig/Töpel 2012: 438).
Abb. 15: Beliebteste Präsentationsform tab view (Müller-Spitzer/Koplenig/Töpel 2012: 438).
166
Zita Hollós
Aus diesem Grund wurde für die Präsentation der Wörterbuchartikel im E-KolleX – wie es in der Abb. 16 ersichtlich wird – die Reiter-Ansicht ausgewählt. Die Integration der lemmabezogenen Portale wie DW und DWDS in die Internetseite des E-KolleX erfolgt ebenfalls nach der Reiter-Ansicht, allerdings mit der Möglichkeit des Zugriffs auf die Ressource in einem neuen Fenster (open in new tab). Die lexikographischen Daten werden sememspezifisch, nach Reitern dargeboten. Der erste Reiter (Schulwörterbuch) trägt der Studierfunktion des Onlinewörterbuchs Rechnung, die weiteren den Strukturtypen der Kollokationen (hier: Baby+SUBS, Baby+ADJ, Baby+VERB). Reiter, die keine Daten enthalten, erscheinen auf der Seite grau und sind inaktiv (siehe in der Abb. 16 Baby+SUBS). Der letzte Reiter umfasst größere Einheiten, die z. T. durch die Kombination zweier Strukturtypen zustandekommen sind. Die Kombination zweier Strukturtypen nenne ich Kollexeme.13 Abb. 16 zeigt die Präsentationsform der Kollokationen des Typs SUBS+ADJ beim Lemmazeichen Baby.14
Abb. 16: wa2 zu Baby mit den Kollokationen Baby+ADJ im E-KolleX.
Im nächsten Kapitel gehe ich auf der Basis der bisherigen Ausführungen auf die Suchbereichsstruktur des E-KolleX näher ein.
13 Die Typen von Kollexemen sind im KolleX mit Beispielen aufgelistet (Hollós 2014: 970). 14 Im ersten Prototyp des E-KolleX werden die in der Datenbank vorhandenen, stilistisch-pragmatischen Markierungen, morphosyntaktischen Restriktionen sowie die Interferenzmarkierungen u. a. noch nicht präsentiert.
Datendistribution relativ zum Webdesign
167
5 Suchbereichsstruktur im E-KolleX Das vorangehende Kapitel wurde mit der allgemeinen Vorstellung des Webdesigns an einem konkreten Wörterbuchartikel zu Baby aus E-KolleX beendet. Im Folgenden nutze ich die entsprechende Abbildung (Abb. 16), um die Suchbereichsstruktur einer Standardwebseite zu einem online Substantivartikel zu beschreiben. Die für die systematische Wörterbuchforschung erarbeitete Theorie der Wörterbuchform ist m. E. nur begrenzt für Onlinewörterbücher adaptierbar. Am einfachsten zu adaptieren scheinen die Zugriffsstrukturen, größere Probleme bereiten die Makro- und Mikrostrukturen. Eine bestimmte Struktur könnte jedoch sicherlich nutzbringend adaptiert werden, nämlich die zweidimensionale Suchbereichsstruktur. Im elektronischen Medium werden die Strukturen dynamisch. Dank der Präsentationsform tab view entstehen dynamische und mehrschichtige Artikelstrukturen.15 Dank der Hyperlinks eröffnet sich außerdem eine neue Dimension, die der Tiefe. Die Tiefe der Datenstruktur sollte auch bei der Datendistribution beachtet werden, d. h. mehr und/oder genauere Daten, die in der Datenhierarchie und damit in der Datenmodellierung tiefer liegen, sollten nicht direkt auf der Oberfläche, sondern auf tieferen Ebenen der Datenpräsentation zugänglich gemacht werden. Die Suchbereichsstruktur im Onlinemedium sollte nicht auf einen Wörterbuchartikel, sondern auf die ganze dynamische Webseite definiert werden.16
zugriffstrukturelle SZ
mikrostrukturelle SZ
mediostrukturelle SZ
Abb. 17: Standard-Suchbereich im E-KolleX.
15 Ich übernehme den englischen Terminus von Rufus Gouws, der in diesem Zusammenhang über „dynamic multi-layered article structure“ (Gouws 2014: 165) spricht. 16 Im Gegensatz zu Gouws (2014), wo die Suchbereichstruktur – ähnlich wie bei Printwörterbüchern – ausschließlich auf den „Wörterbuchartikel“ definiert wird. Damit lässt man jedoch wichtige Aspekte der Datenpräsentation auf einer E-KolleX-Webseite außer Acht (siehe den neuen Vorschlag in Abb. 17).
168
Zita Hollós
Wenn eine Webseite im E-KolleX als Suchbereich näher betrachtet wird, dann können drei Suchzonen (SZ) voneinander unterschieden werden: die zugriffsstrukturelle, die mikrostrukturelle und die mediostrukturelle Suchzone. In der mikrostrukturellen Suchzone ist der „Wörterbuchartikel“ in einer neuen, dynamischen Präsentationsform auffindbar. Der horizontale Teil der zugriffstrukturellen Suchzone ist in zwei Subsuchzonen teilbar, in die Subsuchzone des Eingabefeldes (für die eingabebasierte Suche) und in die Subsuchzone des Indexes (für die indexbasierte Suche). Der vertikale Teil ist die Subsuchzone der Lemmata (für die lemmabasierte Suche). Die mediostrukturelle Suchzone weist z. Z. drei Subsuchzonen auf, die alle bedeutungsübergreifend sind. Die erste ist die Subsuchzone der Belege aus DWDS, die zweite die der Kookkurrenzen von DWDS in Form des Wortprofils und die dritte Subsuchzone, die jedoch sofort als Fenster im Fenster bei Aufruf eines Wörterbuchartikels erscheint, ist die des Assoziogramms, leider nicht direkt verlinkbar, sondern erst durch Scrollen erreichbar. Die letzte, aber wichtigste Suchzone ist die mikrostrukturelle. Der erste Reiter (Schulwörterbuch) trägt der Studierfunktion des Onlinewörterbuchs Rechnung, indem eine Angabe eines äquivalenten Beispielsatzpaares die Verwendung des Lemmazeichens präsentiert. Ein konkretes Beispiel für die mikrostrukturelle Suchzone zeigt Abb. 18.
Abb. 18: Konkrete mikrostrukturelle Suchzone mit drei Subsuchzonen zum E-KolleX.
Sie besteht aus drei großen Subsuchzonen, die weiter aufteilbar sind. Die oberste, horizontale Suchzone ist die Suchsuchzone zur Form, die linke, vertikale, ist die Subsuchzone zur Semantik oder zur Form und Semantik und die letzte, größte, ist die Subsuchzone zur Verwendung, ggf. mit Illustration. Dank der Reiter ist die Subsuchzone zur Verwendung dynamisch, d. h. in derselben Subsuchzone können verschiedene Daten präsentiert werden und der Bildschirm passt sich auch der Menge der Daten an, indem eine Scrollfunktion aktiviert wird. Die Adaptation der Suchbereichsstruktur kann m. E. nutzbringend für die Planung des Webdesigns eingesetzt werden. Deshalb wird sie in verstärktem Maße bei der Wei-
Datendistribution relativ zum Webdesign
169
terentwicklung des Prototyps miteinbezogen. Die neuen Ergebnisse werden in einer nächsten Publikation dargelegt.
6 Fazit Ziel dieses Beitrages war es, die lexikographischen Potenziale des neu entwickelten Protoyps des E-KolleX im Sinne von Lemberg (2001) vorzustellen. E-KolleX wird sukzessive zu einer online Kollokationsressource für DaF entwickelt. Die verschiedenen Module dieses Onlinewörterbuchs und der Stand ihrer Realisierung wurden anhand der geplanten Startseite zum Einstieg ins E-KolleX gezeigt. Des Weiteren wurde die Distribution der neu etablierten Datentypen vor dem Hintergrund des Printwörterbuchs KolleX und relativ zu den Wörterbuchfunktionen und der Sprachnieveaus der Benutzer beim E-KolleX mit Übersichtsdarstellungen vorgestellt. Wenn für den konkereten „Onlinewörterbuchtyp“ ein optimales, jedoch in diesem Sinne maximales Datenangebot erreicht wurde, können die ersten Vorschläge für die Kombination der wörterbuchfunktionsbedingten Selektion der Daten und der vordefinierten Benutzerschnittstellen unterbreitet werden. Das Webdesign und die Funktionsweise des neu entwickelten Prototyps des E-KolleX, das anhand der Benutzungsforschung für Internetwörterbücher und der Wörterbuchkritik der Onlinewörterbücher geplant und verwirklicht wurde, wurden illustriert dargestellt. Zuletzt wurde die für Printwörterbücher entwickelte Suchbereichsstruktur auf dieses Onlinewörterbuch adaptiert, da davon nutzbringende Erkenntnisse für die weitere Planung des Webdesigns zu erwarten sind. Ein wichtiges Ziel der weiteren Forschung ist es, eine umfassende Konzeption für ein didaktisch motiviertes, benutzerfreundliches, ein- sowie zweisprachiges online Nachschlagewerk der deutschen Kollokationen sukzessive zu entwickeln und im Projekt E-KolleX zu erproben.
Literatur Monographien und Aufsätze Gouws, Rufus H. et al. (2013) (eds.): Dictionaries. An international encyclopaedia of lexicography. Supplementary volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/Boston: De Gruyter. Gouws, Rufus H. (2014): Article Structures: Moving from Printed to e-Dictionaries. In: Lexikos 24, 155–177. Granger, Sylviane/Paquot, Magali (2012) (eds): Electronic Lexicography. Oxford: Oxford University Press.
170
Zita Hollós
Hollós, Zita (2016): E-KolleX. Überlegungen zu einem Online-Kollokationswörterbuch für DaF. In: Schierholz, Stefan J. et al. (Hrsg.): Wörterbuchforschung und Lexikographie. Berlin/Boston: De Gruyter, 3–34. Hollós, Zita (2017): Wörterbuchkritik – phraseologische Wörterbücher. In: Bielińska, Monika/ Schierholz, Stefan J. (Hrsg.): Wörterbuchkritik – Dictionary Criticism. Berlin/Boston: De Gruyter, 323–352. Kemmer, Katharina (2010): Onlinewörterbücher in der Wörterbuchkritik. Ein Evaluationsraster mit 39 Beurteilungskriterien. Mannheim: Institut für Deutsche Sprache. [Unter: ; letzter Zugriff: 6. 2. 2017]. Klosa, Annette/Müller-Spitzer, Carolin (2011) (Hrsg.): Datenmodellierung für Internetwörterbücher. 1. Arbeitsbericht des wissenschaftlichen Netzwerks „Internetlexikografie“. Mannheim: Institut für Deutsche Sprache. [Unter: ; letzter Zugriff: 6. 2. 2017]. Klosa, Anette/Müller-Spitzer, Carolin (2016) (Hrsg.): Internetlexikografie. Ein Kompendium. Berlin/ New York: De Gruyter. Lemberg, Ingrid (2001): Aspekte der Online-Lexikographie für wissenschaftliche Wörterbücher. In: Lemberg, Ingrid/Schröder, Bernhard/Storrer, Angelika (Hrsg.): Chancen und Perspektiven computergestützter Lexikographie. Tübingen: Niemeyer, 71–91. Mann, Michael (2014) (Hrsg.): Digitale Lexikographie. Ein- und mehrsprachige elektronische Wörterbücher mit Deutsch: aktuelle Eintwicklungen und Analysen. Hildesheim/Zürich/New York: Georg Olms Verlag. Müller-Spitzer, Carolin (Hrsg.) (2014): Using Online Dictionaries. Berlin/New York: De Gruyter. Müller-Spitzer, Carolin/Koplenig, Alexander/Töpel, Antje (2012): Online dictionary use: Key findings from an empirical research project. In: Granger, Sylviane/Paquot, Magali (Hrsg.): Electronic Lexicography. Oxford: Oxford University Press, 425–457. Storrer, Angelika (2008): Hypertextlinguistik. In: Janich, Nina (Hrsg.): Textlinguistik. 15 Einführungen. Tübingen: Narr, 315–331. Tarp, Sven (2014): Dictionaries in the Internet Era: Innovation or Business as Usual? In: Alicante Journal of English Studies 27, 233–261.
Wörterbücher Holl-Suli = Német-magyar Suliszótár. Második, javított és bővített kiadás. Hrsg. v. Hollós, Zita. Szeged: Grimm Kiadó, 22001. KolleX siehe unter SZÓkapTÁR/KolleX SZÓkapTÁR/KolleX = SZÓkapTÁR. Német–magyar SZÓkapcsolatTÁR. Korpuszalapú kollokációs tanulószótár. KolleX: deutsch-ungarisches KOLLokations-LEXikon. Korpusbasiertes Wörterbuch der Kollokationen. Deutsch als Fremdsprache. Szeged: Grimm Kiadó, 2014.
Links und elektronische Wörterbücher Ccdb = Kookkurrenzdatenbank CCDB. Eine korpuslinguistische Denk- und Experimentierplattform für die Erforschung und theoretische Begründung von systemisch-strukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs. Hrsg. v. Belica, Cyril. [Unter: ; letzter Zugriff: 1. 12. 2016].
Datendistribution relativ zum Webdesign
171
DiCE = Diccionario de colocaciones del español. [Unter: ; letzter Zugriff: 2. 5. 2016]. Duden Online = Duden Online-Wörterbuch. [Unter: ; letzter Zugriff: 1. 12. 2016]. DW = Deutscher Wortschatz. [Unter: ; letzter Zugriff: 1. 12. 2016]. DWDS = Das Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart. [Unter: ; letzter Zugriff: 1. 12. 2016]. E-KolleX = Online Kollokationslexikon: deutsch-ungarisch. [Unter: ; letzter Zugriff: 7. 2. 2017]. Elexiko = Das Online-Wörterbuch zur deutschen Gegenwartssprache. [Unter: ; letzter Zugriff: 1. 12. 2016]. EPHRAS (2006) = Ein mehrsprachiges phraseologisches Lernmaterial. Ljubljana: Rokus Verlag. SprichWort-Plattform = SprichWort-Plattform. [Unter: ; letzter Zugriff: 4. 3. 2017].
Tamás Kispál
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen aus der DaF-LernerPerspektive 1 Einführung Die richtige Verwendung von Kollokationen gehört zur Wortschatzkompetenz von Lernern des Deutschen als Fremdsprache. Im Beitrag wird untersucht, inwieweit die Mikrostruktur ausgewählter einsprachiger Print- und Onlinewörterbücher des Deutschen den Anforderungen an die erfolgreiche Wörterbuchbenutzung in Bezug auf die Kollokationen seitens der Lerner entsprechen kann.
2 Kollokationen in Printwörterbüchern Der Terminus Kollokation wird in den deutschsprachigen Wörterbüchern für Muttersprachler meistens nicht verwendet. Im Artikel Phraseologismen im allgemeinen einsprachigen Wörterbuch (Burger 1989) kommt das Wort Kollokation nicht vor; Viehweger (1989) verwendet in seinem Beitrag im selben Band den Terminus semantische Vereinbarkeitsrelationen. Steyer (2008) hebt hervor, dass die Kollokationsproblematik in deutschen Wörterbüchern lange Zeit kaum wahrgenommen wurde. Nur das Wörterbuch der deutschen Gegenwartssprache (WDG) bildete eine Ausnahme. Dieses Wörterbuch aus den 1960er/-70er Jahren zeichnet sich durch ein „Kollokationsreichtum“ aus (ebenda: 187). Wörterbücher, die seitdem erschienen sind, schenken jedoch den Kollokationen nicht so viel Beachtung. Erst Ende der 1990er bzw. Anfang der 2000er Jahre taucht das Wort Kollokation im Zusammenhang mit deutschen einsprachigen Wörterbüchern öfter auf. In neueren Ansätzen der deutschsprachigen Phraseologieforschung bilden Kollokationen bereits einen Schwerpunkt und auch ihre stärkere Berücksichtigung in Wörterbüchern wird häufiger verlangt. Die vielen Kritikpunkte, die die Phraseologieerfassung in deutschen allgemeinen Wörterbüchern betreffen, gelten laut Müller/Kunkel-Razum (2007: 944) auch für die Erfassung von Kollokationen in diesen Wörterbüchern.
Tamás Kispál: Georg-August-Universität Göttingen, Seminar für Deutsche Philologie, Käte-Hamburger-Weg 6, 37073 Göttingen, [email protected] https://doi.org/10.1515/9783110598650-011
174
Tamás Kispál
Hinsichtlich der Qualität von Kollokationsinformationen im Wörterbuch führen Herbst/Klotz (2003: 84–85) u. a. zwei wichtige Parameter auf: Verortung und Erkennbarkeit von Kollokationsinformation, d. h. unter welcher Komponente und an welcher Stelle sie im Wörterbuchartikel aufgeführt sind. Dazu stellen sich in Bezug auf lexikographische Erfassung von Kollokationen noch weitere Fragen: Welches Kollokationsverständnis vertritt ein Wörterbuch und wie wird dieses in den Außentexten dargestellt? Wie wird der Kollokationsbestand des Wörterbuches ermittelt? Mit welcher Markierung und in welcher Nennform werden Kollokationen im Wörterbuch kodifiziert? Welche Angaben finden sich bei den Kollokationen? Auch lässt sich eine allgemeinere Frage formulieren, die einige der oben erwähnten Fragestellungen einschließt: Inwieweit kann die Struktur der Wörterbücher den Anforderungen an die erfolgreiche Wörterbuchbenutzung in Bezug auf die Kollokationen entsprechen? Dieser Frage soll sich der Beitrag widmen. Methodisch-methodologische Fragen, wie Kollokationen für Wörterbücher ausgewählt werden und inwieweit im Wörterbuch präsentierte Kollokationsdaten korpusbasiert sind, werden hier nicht behandelt (vgl. dazu z. B. Steyer 2008). Ebenfalls werden makrostrukturelle Fragen, z. B. unter welcher Komponente Kollokationen im Wörterbuch erfasst werden, ausgeklammert. Im Folgenden konzentriere ich mich auf die DaF-Lerner als Wörterbuchbenutzer. Demgemäß wird untersucht, inwieweit die Mikrostruktur einiger ausgewählter einsprachiger allgemeiner Print- und Onlinewörterbücher des Deutschen den Anforderungen an die erfolgreiche Wörterbuchbenutzung in Bezug auf den Kollokationserwerb entsprechen kann. Oder anders ausgedrückt: Inwieweit können verschiedene Wörterbuchstrukturen bzw. Wörterbuchmikrostrukturen dem Wörterbuchbenutzer mit Deutsch als Fremdsprache bei kollokationsbezogenen Fragen behilflich sein und demzufolge als benutzerfreundlich verstanden werden? Aus der Perspektive der Wörterbuchbenutzer mit Deutsch als Fremdsprache werden bevorzugt DaF-Lernerwörterbücher, d. h. deutschsprachige allgemeine Lernerwörterbücher in Betracht gezogen. Kollokationswörterbücher als spezielle Wörterbücher (z. B. FWD, WKD) werden hier ausgeklammert. Was die Kollokationsbehandlung in Wörterbüchern allgemein anbelangt, kann man Bergenholtz (2008) zustimmen, wonach der Terminus Kollokation in der Linguistik und in der Lexikographie möglichst getrennt behandelt werden sollte. Wiegand (2010) formuliert folgendermaßen: Ein Laienbenutzer interessiert sich nicht dafür, ob sprachliche Ausdrücke Kollokationen, Kinegramme, Zwillingsformeln, onymische Phraseologismen, Phraseme mit unikaler Komponente etc. etc. sind. Vielmehr interessiert er sich ausschließlich dafür, was entsprechende Ausdrücke bedeuten, wie ihr Gebrauch ist und wie er sie schnellstmöglich findet. (Wiegand 2010: 174)
Das in der linguistischen Forschung verbreitete Hausmannsche Verständnis der Kollokation durch Basis und Kollokator steht mit der lexikographischen Auffassung von Kollokation als (nichtidiomatische) Wortverbindung einerseits häufig nicht im Einklang. Andererseits könnten der Terminus Kollokation und ihre Definition aufgrund
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
175
von Basis und Kollokator aus der L2-Perspektive begründet sein, weil sich viele Probleme beim Zweitspracherwerb und beim Übersetzen gerade durch die Zweierstruktur der Kollokationen beschreiben lassen. Die Probleme bei der Kollokationsverwendung entstehen nämlich oft durch die falsche Verwendung der Kollokatoren und nicht durch die der Basen (Engelberg/Lemnitzer 2009: 216). Lehr (1998) verwendet die Definitionskriterien Analysierbarkeit und Asynthetisierbarkeit. Durch die Analysierbarkeit lassen sich Kollokationen von Idiomen abgrenzen. Die Asynthetisierbarkeit beschreibt die lexikalische Beschränkung der Komponenten. Bei dieser Definition ist die Basis-Kollokator-Struktur weniger relevant. Wenn man den Untersuchungsgegenstand auf die in der deutschsprachigen Phraseologie traditionell nichtidiomatisch geltenden und häufig in Form von Zweierverbindungen bekannten Kollokationen einschränkt, bleiben viele andere mögliche feste Wortverbindungen, die eventuell eine andere Struktur haben, aber aus einer pragmatischen Sicht, bedingt durch Selektions- und Kombinationspräferenzen, genauso idiomatisch geprägt und auch für die Fremdsprachenlerner problematisch sind, außer Betracht, so z. B. Kaffee und Kuchen (Feilke 1998). Aus der Lernerperspektive sollen in einem Wörterbuch dazu auch die so genannten Redemittel behandelt werden, also Wortverbindungen, Konstruktionen, chunks, wie man sie in der Fremdsprachendidaktik nennt und die genauso wie Kollokationen oft eine typische Struktur aufweisen, jedoch nicht ins Zweierverbindungsmuster passen (z. B. zu einer Party eingeladen sein; Es war eine tolle Party; … [Zeitangabe] ist Party angesagt). Da Kollokationen in Wörterbüchern häufig zusammen mit anderen Anwendungsbeispielen ohne eine typologische Unterscheidung aufgeführt werden, stellt sich auch die Frage, ob Kollokationen eine besondere lexikographische Behandlung verdienen oder ob ihre gemeinsame Aufführung mit den lexikographischen Beispielen begründet ist und damit auch ausreicht. In der deutschsprachigen Kollokationsforschung wird in der letzten Zeit häufig nicht (nur) der Terminus Kollokation, sondern auch der auf der statistisch ermittelten Signifikanz basierende Terminus Kookkurrenz verwendet (Steyer 2008). Auch dieser Ansatz könnte die gemeinsame Aufführung begründen. Stellen wir uns die Situation vor, bei der der DaF-Lerner Thomas, der aus dem Lehrwerk Netzwerk A2 Deutsch lernt, folgende Aufgabe zur fremdsprachlichen Textproduktion bekommt. Er soll dabei über eine Party erzählen, zu der er eingeladen wurde.
Abb. 1: Aufgabe im Lehrwerk Netzwerk A2.1 (Dengler et al. 2012: 125).
176
Tamás Kispál
Falls Thomas allgemein eine Sammlung von Wortverbindungen zu einem Thema zusammenstellen möchte oder konkret die in der Aufgabe vorhandenen Redemittel mit weiteren Wortverbindungen ergänzen möchte, weiß er, dass er am besten Lernerwörterbücher konsultiert (Engelberg/Lemnitzer 2009: 120–123).1 Bei der Lexemverwendungfrage, in welchen Kollokationen das Wort Party oft auftritt, verwendet er mehrere Wörterbücher. Er findet in den Wörterbüchern Folgendes. Zum Verstehen und Verwenden des Wortes Party enthält das PGwDaF neben der Bedeutungsangabe ‚(privates) Fest (von informellem Charakter)‘ eine Beispielangabe eine Party feiern.
Abb. 2: Wörterbuchartikel zum Lemma Party im PGwDaF.
Dieses Wörterbuch macht keinen Unterschied zwischen Kollokations- und Beispielangaben. Als Beispiel steht in diesem Wörterbuch eine Kollokation in der typischen Form als Verbalphrase mit einem Infinitiv. Leider kann er den Unterschied zwischen der Bedeutungs- und der Beispielangabe kaum erkennen, weil sich die beiden Typen von Angaben nur durch die Schrift (Normal- bzw. Kursivschrift) unterscheiden. Es trennt sie kein Strukturanzeiger. Im WGwDaF findet er mehr Hilfe. Dort werden Kollokationen auch nur als ein Beispieltyp angegeben. Der Strukturanzeiger Pfeil hilft jedoch beim Auffinden dieses Angabentyps im Wörterbuchartikel.
Abb. 3: Wörterbuchartikel zum Lemma Party im WGwDaF.
Je zwei Kollokationen und Beispielsätze finden sich hier: eine Party geben, veranstalten; morgen Abend machen wir eine Party; gehst du auch auf die Party? Thomas sieht,
1 Auf der Niveaustufe A2 wird natürlich mit einem relativ eingeschränkt verfügbaren Wortschatz gerechnet, insbesondere bei der Sprachproduktion. Der Beitrag soll alle in Wörterbüchern kodifizierten einschlägigen Einträge berücksichtigen, von denen Lernende die meisten Kodifikationen auf der Niveaustufe A2 verständlicherweise noch nicht aktiv beherrschen müssen.
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
177
dass die einzelnen Beispiele durch ein Semikolon getrennt sind. Er fragt sich jedoch, warum die Beispielsätze nicht mit großem Anfangsbuchstaben geschrieben werden. Wenn er diesen Wörterbucheintrag mit dem Eintrag im Wahrig-DW vergleicht, stellt er mit Freude fest, dass das Lernerwörterbuch WGwDaF, das er bevorzugt, mehr Hilfe bei der Verwendung bietet als die Vorlage für dieses Wörterbuch, nämlich das Wahrig-DW, welches nur die zwei Kollokationsformen (eine Party geben, veranstalten), nicht aber die zwei Beispielsätze aufführt. Par . ty 〈[ˈpa:(r)ti] f.; -, -ties/〈künftig nur〉 -tys〉 zwanglose Gesellschaft, geselliges Beisammen sein (Cocktail~, Garten~); eine ~ geben, veranstalten [engl. < frz. parti „geteilt“; zu partir „teilen“]
Abb. 4: Wörterbuchartikel zum Lemma Party im Wahrig-DW.
Im DGwDaF findet er zwar die Bedeutungsangabe etwas umständlich (‚Treffen meist eingeladener Gäste in privaten Räumen, bei dem man essen, trinken, tanzen kann und sich amüsiert‘), aber die Bedeutung des Wortes kennt er eigentlich und er freut sich über die Beispiele und dass sie von der Bedeutungsangabe auch hier nicht nur durch den Schrifttyp getrennt werden.
Abb. 5: Wörterbuchartikel zum Lemma Party im DGwDaF.
Es gibt hier zwar keinen Strukturanzeiger in der Form eines Symbols wie im WGwDaF, sondern nur einen Doppelpunkt, aber das findet er in Ordnung. Es fällt ihm allerdings auf, dass hier zur Abwechslung die Bedeutungsangabe normal und die Beispiele kursiv gesetzt werden, im Gegensatz zu den zwei anderen Wörterbüchern. Auch in diesem Wörterbuch werden Kollokationen mit anderen Beispielangaben zusammen behandelt. Hier überwiegen die Strukturformeln mit Verben im Infinitiv, die durch ein Semikolon getrennt werden: eine Party geben, machen; zu einer Party eingeladen werden; zu einer/auf eine Party gehen. Es macht ihn nachdenklich, warum hier die Wortverbindungen eine Party machen und auf eine Party gehen in dieser für die Kollokationen typischen Nennform vorkommen, während sie im WGwDaF in einen
178
Tamás Kispál
Satz integriert werden (morgen Abend machen wir eine Party; gehst du auch auf die Party?). In dieser Form kann man sie bereits in der Sprachproduktion anwenden. Wenn Thomas das Wort Party im LGwDaF nachschlägt, findet er es toll, dass die Kollokationen hier als solche in eckigen Klammern markiert werden.
Abb. 6: Wörterbuchartikel zum Lemma Party im LGwDaF.
Die Kollokationen eine Party geben, auf eine Party/zu einer Party eingeladen sein, gehen heben sich deutlich hervor. Wenn Thomas das Wort Party schließlich im Duden-DUW nachschlägt, fällt ihm gleich auf, dass das Wort laut Duden ein polysemes Wort ist und zwei Bedeutungen hat: ‚privates Fest‘ und ‚öffentliches Fest‘.
Parǀty [ˈpa:ti, engl.: ˈpa:ti], die; -, -s [engl. party < frz. partie, ↑Partie]: 1. zwangloses, privates Fest
[mit Musik u. Tanz]: eine P. machen; eine P. verlassen; sich auf einer P. treffen. 2. [organisiertes] größeres zwangloses öffentliches Fest: am Strand fand eine riesige P. statt; heute Abend machen wir P.! (ugs.; feiern wir!)
Abb. 7: Wörterbuchartikel zum Lemma Party im Duden-DUW.
Das findet er nachvollziehbar, und er erkennt auch den Unterschied zwischen den beiden Kollokationen eine Party machen und Party machen (ohne Artikel). Letzteres wäre demnach keine Partyorganisation, sondern bloß Feiern.
2.1 Kollokationen als Beispielangaben in Wörterbüchern In der nichtintegrierten Mikrostruktur, wie im Wahrig-DW, stehen alle Bedeutungsangaben zum Lemma im ersten semantischen Subkommentar, unter der ersten Ziffer, und alle Beispiel- und Phrasemangaben in den weiteren semantischen Subkommentaren, unter den weiteren Ziffern, wenn sie mit Ziffern versehen sind (Wiegand 1989: 488–490). Kollokationen sind hier als Beispiel- oder Phrasemangaben als solche unmarkiert aufgeführt. Auf die Problematik, dass die Bedeutungsangaben in dieser
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
179
Struktur nicht immer auf die Beispiel- und Phrasemangaben beziehbar sind und diese Struktur auch für ausländische Benutzer Schwierigkeiten bereiten kann, wies bereits Wiegand (1990: 2147) hin (vgl. auch Mann 2013: 754–755). Im WGwDaF wurde der Versuch unternommen, die Mikrostruktur weiterzuentwickeln, indem die Bedeutungen eines polysemen Wortes zwar nicht alle unter einer Ziffer aufgeführt, aber alle Beispielangaben, zusammen mit den Phrasemangaben, weiterhin in einem Block am Ende des Wörterbuchartikels präsentiert werden, nach dem auffälligen Strukturanzeiger Pfeil (vgl. auch Abb. 3, Wörterbuchartikel zum Lemma Party).
Korb 〈m. Iu〉 (meist geflochtenes) Behältnis zu verschiedenen Zwecken: zum Tragen von Einkäufen (Einkaufs ~), Fortbewegen von Lasten (Förder ~, Trag~), zum Aufbewahren von kleinen Gegenständen (Handarbeits ~, Näh ~) u.a.; Handschutz an Degen u. Säbel (Degen ~, Säbel ~); 〈fig.〉 Abweisung, Abfuhr, Absage, 〈bes.〉 Ableh nung eines Heiratsantrages; einen ~ bekommen abgewiesen werden; jmdm. einen ~ geben jmdn. ab-, zurückweisen, jmds. Aufforderung ablehnen; ein ~ voll Beeren, Holz [ < ahd. chorp < lat. corbis „Korb“]
Abb. 8: Wörterbuchartikel zum Lemma Korb im Wahrig-DW.
Kọrb 〈der; -(e)s, Kör|be〉 I 〈zählb.〉 1 (meist gef lochtenes) Behältnis zu verschiedenen Zwecken 1.1 zum Tragen von Einkäufen; Abl körbeweise; Zus Einkaufskorb 1.2 zum Fortbewegen von Lasten; Zus Förderkorb 1.3 zum Aufbewahren von kleinen Gegenständen; Zus Handarbeitskorb, Nähkorb 2 〈übertr.〉 Abweisung, Abfuhr, Absage, (bes.) Ablehnung eines Heiratsantrages 3 〈Sp.; Korb-, Basketball〉 3.1 aufgehängter Eisenring mit Netz 3.2 Wurf in diesen Ring ► einen ~ bekommen abgewiesen werden; jmdm. einen ~ geben jmdn. ab-, zurückweisen; ein ~ voll Beeren, Holz II 〈unz.〉 Geflecht aus biegsamen Pflanzen; Zus Korbmöbel, Korbsessel, Korbstuhl
Abb. 9: Wörterbuchartikel zum Lemma Korb im WGwDaF.
Im Wörterbuchartikel zu Korb findet der Benutzer die Idiome einen Korb bekommen, jmdm. einen Korb geben und die Kollokation ein Korb voll Beeren, Holz direkt nebeneinander. Die gemeinsame Aufführung der Kollokationen und der Idiome könnte sich dadurch begründen, dass der Benutzer den jeweils nachfolgenden Informationen entnehmen kann, welche dieser Wortverbindungen idiomatisch verstanden werden sollen. Allen idiomatischen Wendungen (einen Korb bekommen, jmdm. einen Korb geben) folgt nämlich eine Bedeutungsangabe, während die Kollokation (ein Korb voll
180
Tamás Kispál
Beeren, Holz) nicht weiter erklärt wird. Die Bedeutung der Kollokation ergibt sich aus der summativen Bedeutung ihrer Komponenten. Welcher Bedeutung des polysemen Wortes Korb die Komponente Korb in der Kollokation zugeordnet werden kann, wird allerdings im Wörterbuchartikel nicht sichtbar. Dadurch erweist sich diese Methode aus der Benutzerperspektive als problematisch. Die Artikelstruktur des WGwDaF stellt übrigens eine verwirrende Mischung aus nichtintegrierter und integrierter Mikrostruktur dar, was den Wörterbuchbenutzern wahrscheinlich auch in anderen Situationen Schwierigkeiten bereitet (Rothenhöfer 2013: 420). In der integrierten (oder partiell integrierten) Mikrostruktur, wie im Duden-DUW, stehen die verschiedenen Bedeutungsangaben zum Lemma in verschiedenen Subkommentaren. Die verschiedenen Ziffern markieren hier meistens die verschiedenen Bedeutungen. Kollokationen stehen in dieser Mikrostruktur im Geltungsfeld einer bestimmten Bedeutungsangabe.
Kọrb, der: -[e]s, Körbe (als Maßangabe auch: Korb): 1. a) [mhd. korp, ahd. chorp, wahrsch. < lat. corbis = Korb, urspr. = Geflochtenes] aus biegsamem [von Pflanzen stammendem] Material geflochtener, meist offener Behälter (mit Griffen, Henkeln o. Ä.): ein K. aus Weide, Draht; Körbe flechten; ein K. Äpfel; ein K. reife Äpfel/ (geh.:) reifer Äpfel; zwei Körbe mit Eiern; die Wäsche in einen K. legen; b) korbartiger Behälter als Maßeinheit für gefangenen Fisch: 5 000 K. Kabeljau; c) 〈o.Pl.〉 Korbgeflecht: Gartenmö bel aus K.; d) (Fachspr.) Faschine. 2. a) Kurzf. von ↑Förderkorb; b) Gondel an einem Ballon (1 a) o.Ä.; c) Kurzf. von ↑Bienenkorb. 3. a) [LÜ von engl. basket] (Basketball) am Spielbrett aufgehängter Eisenring mit einem Netz: auf den K. werfen; b) (Korbball) an einem Ständer befestigter Eisenring mit einem Netz; c) [LÜ von engl. basket] (Basketball, Korbball) Treffer, bei dem der Ball durch den Ring des Korbes (3b) geworfen werden muss: einen K. schießen, erzielen; d) (Fechten) Gesichtsschutz: e) (Fechten) Handschutz am Degen u. Ä.; Glocke (6.), 4. [nimmt darauf Bezug, dass in früheren Zeiten Frauen gelegentlich ihren Liebhaber zu sich in einem Korb hochziehen ließen; war der Liebhaber ungebeten oder nicht genehm, bekam er einen Korb mit brüchigem Boden, durch den er auf die Erde zurückfiel; später wurde es auch üblich, einem abgewiesenen Freier einen kleinen Korb ohne Boden zu überreichen] ablehnende Antwort auf ein Angebot, einen [Heirats]antrag: einen K, bekommen; als er sie zum Tanzen aufforderte, holte er sich einen K.; die FDP gab der CDU in den Koalitionsverhandlungen einen K. Abb. 10: Wörterbuchartikel zum Lemma Korb im Duden-DUW.
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
181
Im Duden-DUW sind relativ viele Kollokationen unter der Bedeutung ‚Behälter‘ aufgeführt (ein Korb aus Weide, Draht; Körbe flechten; ein Korb Äpfel; ein Korb reife Äpfel/(geh.:) reifer Äpfel; zwei Körbe mit Eiern; die Wäsche in einen Korb legen). Sie zu finden ist allerdings nicht einfach. Der Wörterbuchartikel ist länger als in den anderen Wörterbüchern und die integrierte Mikrostruktur macht die Auffindung der Kollokationen schwieriger. Das in der DDR erstellte und seitdem in Printversion nicht wieder aktualisierte, allerdings dem DWDS-Portal zugrunde gelegte sechsbändige WDG bzw. das daraus entstandene zweibändige HWDG bieten durch die rechtserweiterte integrierte Mikrostruktur einen Fortschritt bei der Phrasembehandlung. Durch einen nichttypographischen Strukturanzeiger + markiert findet man alle Phraseme schnell am Ende des Wörterbuchartikels in einem Postkommentar (Wiegand 1990: 2150). Die Präsentation der Phraseme ist somit viel benutzerfreundlicher als in der nichtintegrierten Mikrostruktur, wie das auch Wiegand (2010: 171–174) beschreibt. Kollokationen werden hier allerdings als Beispielangaben der einzelnen Bedeutung derjenigen Komponente, unter der sie kodifiziert sind, zugeordnet. Ihre Position im Wörterbuchartikel, zusammen mit sonstigen Beispielangaben, wird auch hier, ähnlich wie im Duden-DUW, im Gegensatz zu der markierten Phrasemposition, nicht markiert. Korb, der; -(e)s, Körbe/- 1.1. /Pl. Körbe/ vorwiegend aus Weidenruten, Bast od. Draht geflochtener (oben offener) fester Behälter mit Griffen, Henkeln: ein runder, rechteckiger, flacher K.; ein K. mit Äpfeln; ein K. Eier 1.2. /PI. -/ F i s c h e r e i /alte Maßeinheit für 50 kg Frischfisch/: der Trawler hat 1 000 K. angelandet – 2. /o. PI./ Korbgeflecht: ein Sessel aus K. – 3. /Pl. Körbe/ S p o r t in bestimmter Höhe angebrachter Ring, an dem ein nach unten offenes Netz befestigt ist, in das der Ball beim Korbball, Basketball geworfen werden muß – 4. /Pl. Körbe/ gewölbter Handschutz am Griff von Degen, Säbeln + jmdm. einen K. geben: sie hat ihm einen K. ge geben (hat seine Werbungen abgewiesen); er hat ihm einen K. gegeben (hat sein Angebot, seine Bitte abgelehnt); sich einen K. holen, einen K. bekomen (bei seiner Werbung um die Gunst einer Frau, mit seinem Angebot abgewiesen werden); – Hahn im Korbe sein
Abb. 11: Wörterbuchartikel zum Lemma Korb im HWDG.
DGwDaF hat keine einheitliche Mikrostruktur, was bereits an mehreren Stellen kritisiert wurde (Wiegand 2002: 573–575, Rothenhöfer 2013: 420). Am Beispiel des Wörterbuchartikels zu Korb zeigt sich allerdings eine aus der Sicht der Kollokationen benutzerfreundliche Struktur, indem die Phrasemangaben von den Beispielangaben abgetrennt werden: Phraseme (z. B. jmdm. einen Korb geben) werden im Postkommentar
182
Tamás Kispál
und die Kollokationen (z. B. ein Korb mit Äpfeln) in Form von Beispielangaben den Bedeutungen zugeordnet.
Abb. 12: Wörterbuchartikel zum Lemma Korb im DGwDaF.
Ähnlich verhält es sich im PGwDaF. Im Wörterbuchartikel zu Korb findet man keine Kollokationen, sondern nur Beispielsätze. Kollokationen sind allerdings in den Beispielsätzen enthalten.
Abb. 13: Wörterbuchartikel zum Lemma Korb im PGwDaF.
Im Satz Hast du meinen Korb mit den Handarbeiten/mit dem Nähzeug gesehen? lassen sich die Kollokationen mein Korb mit den Handarbeiten und mein Korb mit dem Nähzeug erkennen. Ebenso kann man im Beispielsatz Soll ich den Korb oder die Tasche
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
183
zum Einkaufen mitnehmen? die Kollokation den Korb zum Einkaufen mitnehmen erkennen. Diese Kollokationsidentifikation ist den DaF-Lernern überlassen. Die Fähigkeit zur Kollokationsformenermittlung bei Beispielsätzen kann genauso als eine wichtige lexikographische Kompetenz betrachtet werden, wie die Fähigkeit zur Grundformenermittlung bei flektierten Wortformen. Das für den Fremdsprachenerwerb charakteristische Einprägen von typischen, musterhaften, lückenhaften chunks, Konstruktionen, Redemittel kann allerdings die gemeinsame Aufführung von Kollokationen unter den Beispielangaben begründen.
2.2 Markierte Wörterbuchartikelpositionen für Kollokationen Da den Kollokationen in der Fremdsprachendidaktik ein hoher Stellenwert beigemessen wird, wurden sie in der DaF-Lernerlexikographie am Anfang, im ersten DaFWörterbuch LGwDaF (erste Auflage 1993), stärker als in den anderen deutschen Wörterbüchern berücksichtigt. Das LGwDaF hat für die Kollokationen bekanntlich eine eigene Wörterbuchartikelposition eingeführt. Die mikrostrukturelle Markierung der Kollokationen war 1993 eine erfreuliche Erneuerung in der deutschsprachigen Lexikographie.
Abb. 14: Wörterbuchartikel zum Lemma Korb im LGwDaF.
184
Tamás Kispál
Im LGwDaF stehen die Kollokationen im Wörterbuchartikel zu Korb zwar in den einzelnen semantischen Subkommentaren, die viel differenzierter sind als in anderen Lernerwörterbüchern, ihre Auffindung wird aber durch die Markierung mittels eckiger Klammern erleichtert. Die markierte Wörterbuchartikelposition wurde im LGwDaF seit der ersten Auflage bis heute beibehalten. Die anderen DaF-Wörterbücher, die alle nach dem LGwDaF erschienen, übernahmen diesen Ansatz nicht, wie das auch bei den obigen Beispielen zu sehen ist. Die markierte Wörterbuchartikelposition erleichtert und beschleunigt die Nachschlagehandlung der Wörterbuchbenutzer, die gezielt nach Kollokationen im Wörterbuch suchen. Demgegenüber ist die Artikelstruktur in den anderen untersuchten deutschen Printwörterbüchern aus der Sicht der kollokationslernenden Wörterbuchbenutzer weniger benutzerfreundlich.
2.3 Vorschlag für benutzerfreundliche Wörterbuchartikelstrukturen mit Kollokationen Anhand von englischen Lernerwörterbüchern macht Wiegand (1999a) einen Vorschlag für eine benutzerfreundliche Wörterbuchartikelstruktur für deutsche Lernerwörterbücher (vgl. auch Rothenhöfer 2013: 420).
Lohn 1 das Geld, das bes Arbeiter für ihre Arbeit (jeden Tag, jede Woche od. jeden Monat) bekommen ǀ Er hat 3 Wochen gegen Lohn Holz gefahren 2 der L (für etw.) das, was man für seine Mühe od. für eine Leistung od. Tat bekommt; Sy: Belohnung ǀ Als L. für sein gutes Zeugnis bekam er ein Fahrrad ǀ Eine Ohrfeige war der L. für seine Frechheit 1R ohne / in L. und Brot sein / stehen keine / eine feste A nstellung haben ǀǀ jmdn. um L. und Brot bringen jmdn. seine Arbeit od. Erwerbs quelle nehmen 2R seinen L. bekommen seine verdiente Strafe bekommen
der; -(e)s. Löh-ne einen festen L. haben ǀ die Löhne aufbessern, erhöhen. kürzen, senken ǀ den L. drücken nur Sg [auch iron] ein königlicher, fürstlicher, angenehmer, schöner, reicher, angemessener, unverdienter L.
1W der Verdienst [Oberb.] Lohn (für Arbeiter) Gehalt (für Angestellte u. Beamte) Honorar (für freiberuflich Tätige) Gage (für Künstler) Einkommen (für jeden, der selbständig arbeitet) Sold, Wehrsold (für Wehrpflichtige) 1KK -: Lohn-, -abbau, -auszahlung, -buchhaltung, -empfänger, -erhöhung, -forderung, -fortzahlung, -kürzung, -niveau, -tarif, -verhandlungǀǀ -K: Akkord-; Arbeits-; Boten-; Eck-; Fuhr-; Finder-; Hunger-; Stück-; Real-; Tarif-; Tages-; Wochen-; Monats-; Brutto-; Netto2K -K: Gottes-; Judas-; Sieges1SP Guter L. macht hurtige Händeǀǀ Jede Arbeit verdient ihren Lohn 2SP Spott und Hohn trägt schlimmen Lohnǀǀ Undank ist der Welt Lohn
Abb. 15: Vorschlag von Wiegand (1999a) für eine benutzerfreundliche Mikrostruktur.
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
185
In der übersichtlichen tabellarischen Mikrostruktur bekommen die Kollokationen eine eigene Spalte, was ihre starke Hervorhebung zur Folge hat und damit zu ihrer schnelleren Auffindbarkeit führt. An der Darstellung der Beispiel- und Phrasemangaben, darunter auch der Kollokationsangaben in englischen Lernerwörterbüchern könnten DaF-Wörterbücher in der Tat ein Beispiel nehmen. Wenn sich die Übernahme von bewährten, musterhaften Wörterbuchstrukturen aus der englischen Lernerlexikographie noch lange hinauszögert, könnte es für die deutschsprachige Printlexikographie zu spät sein. Als Alternative oder teilweise auch als Ersatz von Printwörterbüchern setzen sich elektronische und insbesondere Onlinewörterbücher auch beim Fremdsprachenlernen durch.
3 Kollokationen in CD-Wörterbüchern Um eine Sammlung von Wortverbindungen zum Thema Party zusammenzustellen, recherchiert Thomas natürlich auch in elektronischen Wörterbüchern. Er sieht, dass die CD-ROM-Versionen der elektronischen Wörterbücher tatsächlich oft nur neuartige Mogelpackungen sind, wie das Wiegand (1999b) bereits festgestellt hat. Die CD-ROMVersionen der Wörterbücher bieten nämlich meistens den gleichen Inhalt wie die Printversionen, allerdings mit einem schnellen Zugriff. Ohne das Alphabet zu kennen, kommt man durch die Stichwortsuche schnell zum Wörterbuchartikel zu Party. Mit Freude stellt Thomas außerdem fest, dass die Beispielangaben mit den Kollokationen (z. B. eine Party feiern) im PGwDaF-CD im Gegensatz zu der Printversion, die er kennt (vgl. Abb. 2), blaue Farbe bekommen haben, was ihre Identifikation erleichtert. Par . ty die [ˈpa:ti] (privates) Fest (von informellem Charakter) eine Party feiern -keller ►
Abb. 16: Wörterbuchartikel zum Lemma Party im PGwDaF-CD.
Einen Vorteil gegenüber den Printversionen haben manche elektronischen Wörterbücher, indem sie die einzelnen Bedeutungspunkte und die dazugehörigen Informationen in den Wörterbuchartikeln in getrennten Absätzen präsentieren. Im Duden-DUW-CD findet sich jede einzelne Beispielangabe, d. h. auch die Kollokationen (eine Party machen; eine Party verlassen; sich auf einer Party treffen) in einer neuen Zeile, im Gegensatz zur Printausgabe (vgl. Abb. 7).
186
Tamás Kispál
Par ǀ ty [ˈp:ɐ̯ti
, engl.: ˈpa:ti], die; -, -s [engl. party < frz. partie, ↑Partie):
1. zwangloses, privates Fest [mit Musik u. Tanz]: eine P. machen; eine P. verlassen; sich auf einer P. treffen. 2. [organisiertes] größeres zwangloses öffentliches Fest: am Strand fand eine riesige P. statt; heute Abend machen wir P.! (ugs.; feiern wir!)
Abb. 17: Wörterbuchartikel zum Lemma Party im Duden-DUW-CD.
Im LGwDaF-CD werden Kollokationen und Beispiele von der Bedeutungsangabe, ähnlich wie im PGwDaF-CD (vgl. Abb. 16) nicht durch einen Zeilenumbruch getrennt. Die Markierung der Kollokationen in eckigen Klammern findet jedoch Thomas auch hier, wie in der Printversion des LGwDaF (vgl. Abb. 6) benutzerfreundlich (eine Party geben; auf eine/zu einer Party eingeladen sein, gehen).
Pạr . ty [-ti] die; -s; ein privates Fest mit Essen, Trinken, Misik usw || K-: Partykeller, Partyraum, Partyservice || -K: Cocktailparty, Dinnerparty, Gartenparty, Geburtstagsparty, Tanzparty || NB: ↑ Feier
Abb. 18: Wörterbuchartikel zum Lemma Party im LGwDaF-CD.
Ein weiterer Vorteil der elektronischen Wörterbücher ist die Volltextsuche. Die Volltextsuche zum Wort Party ergibt im PGwDaF 65 Treffer.
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
abhauen absehbar abseitsstehen abwinken angesagt Anhang aufdrehen Bedarf bei beschickert beschwingt bombig Bottleparty Bowle Brand cool dazugesellen Drive Ende fadisieren ganz geben gegeben geistlos genial Getränk großenteils größtenteils hergehen kennen kommen Liveband los Luft
187
Mangelware mitbekommen nachbarlich Nachschub namenlos nennen Oberflächlichkeit öd ordentlich Party Randfigur rasant Schnappschuss solo sonderlich spurlos stehen überhaupt überschäumen um Vergnügen vergnügungssüchtig verkatert verkünden verlassen vernaschen versprechen vertraut wegstehlen wie zu
Abb. 19: Volltextsuche für den Suchbegriff Party im PGwDaF-CD.
Dabei entdeckt Thomas einerseits bekannte Kollokationen aus dem Wörterbuchartikel zu Party bei den anderen Komponenten, d. h. bei den Kollokatoren, in Form von Beispielsätzen (Wir geben morgen eine große Party; Kommst du auf die Party?), andererseits neue Kollokationen bei einer Party sein, zu einer Party eingeladen sein. Bei den anderen Einträgen ist das Wort Party keine Komponente einer Kollokation, aber Stichwörter (z. B. angesagt, beschickert, beschwingt, bombig, Bowle, cool, dazugesellen, Getränk, öd, verkatert), bei denen das Wort Party in den Beispielsätzen vorkommt, könnten Thomas bei der Erstellung des Wortfeldes Party, also bei der Wortschatzerweiterung und damit auch bei der Produktionsaufgabe aus dem Lehrwerk (Abb. 1) helfen. Im LGwDaF-CD sind 53 Treffer zum Wort Party zu finden. Auch hier sind einige Kollokationen zum Wort Party bei Kollokatoren zu finden, auch wenn sie nicht alle als Kollokationen markiert sind: auf der Party sein, bei jmdm. eine Party feiern, zur Party gehen/kommen. Einige Kollokationen entnimmt Thomas auch in diesem Wörterbuch den Beispielsätzen: Ich habe ihm eine Einladung zu meiner Party geschickt; Wenn er hört, dass jemand eine Party gibt, ist er nicht (mehr) zu halten; eine Party schmeißen (‚organisieren und veranstalten‘); eine Party steigt (‚findet statt‘).
188
Tamás Kispál
Suche Suche:
Partyl
Meinten Sie? Part
Suchergebnis
Erweiterte Suche
anschleppen ansprechen ärgern auf ausmachen bei bekannt Bescheid Bombendabeihaben drücken durchgehen ebenfalls eigentlich Einladung Fete flau fremd für geben gehen Gemüse halten Hausherr heben hergehen Herzenslust hoch interessanterweise Klasse lauter Leute Mädchen mitgehen mitkommen Party
Abb. 20: Volltextsuche für den Suchbegriff Party im LGwDaF-CD.
4 Kollokationen in Onlinewörterbüchern Wie zwei ausgewählte Onlinewörterbücher (Online-Duden, Elexiko) die Kollokationsrecherche unterstützen, soll im Folgenden ebenfalls am Beispiel der Kollokationen mit dem Wort Party dargestellt werden. Im Online-Duden kann man Kollokationen unter Bedeutungen, Beispiele und Wendungen in einer printwörterbuchartigen Form wiederfinden, allerdings jede Bedeutung klar voneinander abgetrennt und die Beispiele ebenfalls einzeln in einer neuen Zeile. Hier finden sich die gleichen Kollokationen wie im Duden-DUW (vgl. Abb. 7, Abb. 17).
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
189
Abb. 21: Wörterbuchartikel zum Lemma Party im Online-Duden (Bedeutungen, Beispiele und Wendungen, letzter Zugriff: 18. 10. 2016).
Einen wesentlichen Mehrwert bietet die Duden-Website durch die Komponente Typische Verbindungen, in der die Kollokatoren zur Basis Party in einer Wortwolke nach Wortarten (Adjektive, Verben, Substantive) gruppiert aufgeführt sind (z. B. cool, fett, toll).
Abb. 22: Wörterbuchartikel zum Lemma Party im Online-Duden (Typische Verbindungen, letzter Zugriff: 18. 10. 2016).
190
Tamás Kispál
Diese Liste erweitert die Kollokationen, die unter Bedeutungen, Beispiele und Wendungen enthalten sind. Die Wortwolke stellt das Ergebnis einer computergenerierten Analyse dar und macht auch die Recherche in diesem Onlinewörterbuch für viele wahrscheinlich interessanter als in einem traditionellen Printwörterbuch. Bei der Benutzung dieses Tools ist allerdings Vorsicht geboten. Auch in den Benutzungshinweisen steht folgender Satz: Die Daten „sind kein Ergebnis redaktioneller Arbeit und stellen keine Handlungsempfehlung oder Wertung dar“. Das Onlinewörterbuch Elexiko ist durch die benutzerdefinierte Mikrostruktur gekennzeichnet. Wenn der Benutzer auf der Startseite des Wörterbuchartikels zu Party auf die Lesart klickt, ist von der realen elektronischen Mikrostruktur nur die virtuelle elektronische Mikrostruktur sichtbar (Engelberg/Lemnitzer 2009: 170–171).
Abb. 23: Wörterbuchartikel zum Lemma Party in Elexiko (Bedeutungserläuterung, letzter Zugriff: 18. 10. 2016).
Unter dem Reiter Kollokationen erscheint eine Liste von zahlreichen Kollokatoren, die in diesem Reichtum weder in den Printwörterbüchern noch im Online-Duden vorhanden sind.
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
Abb. 24: Wörterbuchartikel zum Lemma Party in Elexiko (Kollokationen, letzter Zugriff: 18. 10. 2016).
191
192
Tamás Kispál
Der Benutzer findet hier statistisch signifikante Kollokatoren, nach der semantischen Argumentstruktur gruppiert. Diese Kollokatorenliste kann dem Lerner zunächst helfen, Wörter zur Basis auszuwählen. Da jedoch die Kollokatoren in unflektierter Form aufgeführt sind, sollen sie im nächsten Schritt bei der Sprachverwendung mit der Basis richtig verbunden werden. Die Aufgabe des Lerners ist es, grammatisch richtige Kollokationen daraus zu bilden. Typische Wortverbindungen mit flektierten Wortformen finden sich in Elexiko unter dem Reiter Konstruktionen.
Abb. 25: Wörterbuchartikel zum Lemma Party in Elexiko (Konstruktionen, letzter Zugriff: 18. 10. 2016).
Diese Formen sind typische Konstruktionen, Strukturen, darunter auch chunks (z. B. …ist Party angesagt; die Party beginnt um …), die in den DaF-Lehrwerken Redemittel genannt werden. Erfahrene Lerner können auch diese Konstruktionen in den aktuellen Kommunikationskontext integrieren.
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
193
5 Zusammenfassung Im Beitrag wurde untersucht, inwieweit die Mikrostruktur einiger ausgewählter einsprachiger Print- und Onlinewörterbücher des Deutschen den Anforderungen an die erfolgreiche Wörterbuchbenutzung in Bezug auf die Kollokationen seitens der Lerner entsprechen kann. Die Kollokationen werden in Printwörterbüchern meistens zusammen mit anderen Beispielangaben als Verwendungsbeispiele kodifiziert. Da auch Beispiel sätze viele Kollokationen enthalten, könnte diese gemeinsame Aufführung begrün det sein. Es bleibt allerdings die Aufgabe des Benutzers, die Kollokationen in konkre ten Kommunikationssituationen den Beispielsätzen zu entnehmen, was eine entsprechende Kompetenz, besonders bei Lernenden des Deutschen als Fremdsprache voraussetzt. Die integrierte Mikrostruktur, charakteristisch für die meisten deutschen Printwörterbücher, hat den Vorteil, dass die Kollokationen im selben semantischen Subkommentar stehen, dem sich die Bedeutung ihrer Basis zuordnen lässt. Problematisch ist in dieser Mikrostruktur jedoch die Auffindung der Kollokationen in den einzelnen semantischen Subkommentaren. Einerseits reicht die Markierungspraxis durch den bloßen Schrifttypwechsel (z. B. Normalschrift/ Kursivschrift) zum schnellen Zugriff nicht aus (Duden-DUW, DGwDaF, PGwDaF). Einen möglichen Ausweg bieten dabei auffällige Strukturanzeiger, wie der Pfeil im WGwDaF zur Markierung der Beispiel- und Kollokationsangaben. Andererseits verursachen lange Wörterbuchartikel mit mehrfach polysemen Lemmata eine langwierige Nachschlagehandlung. Die durch einen Postkommentar rechtserweiterte integrierte Mikrostruktur ist für die Phrasemerfassung sehr vorteilhaft. Ein weites, auch die Kollokationen umfassendes Phraseologieverständnis könnte den schnellen Zugriff auch für Kollokationen ermöglichen. Der Bezug der Bedeutungsangaben auf die Beispielangaben wäre dabei wichtig. Das wurde im WGwDaF teilweise in die Praxis umgesetzt, allerdings nicht in der integrierten Mikrostruktur. Die nichtintegrierte Mikrostruktur im Wahrig-DW könnte aus der Sicht der Kollokationserfassung den Vorteil haben, dass alle Kollokationen zusammen an einer Stelle aufgeführt sind. Das Problem mit dieser Struktur ist, dass die Bedeutungsangaben nicht immer auf die Beispielangaben beziehbar sind und das auch für ausländische Be nutzer Schwierigkeiten bereiten kann. LGwDaF ist das einzige allgemeine deutsche Printwörterbuch, das die Kollokationen nicht mit den Beispielangaben zusammen aufführt und sie auch mit einem auffälligen Strukturanzeiger, mit eckigen Klam mern markiert. Der Nachteil bleibt hier auch, dass auch die Beispielangaben Kollokationen enthalten können. Das lässt sich aber allgemein kaum vermeiden, wenn die Wörterbücher beide Angabentypen verwenden. In der anhand von engli schen Wörterbüchern von Wiegand (1999a) vorgeschlagenen tabellarischen Mikro struktur ließe sich die Kollokationserfassung auch in deutschen Wörterbüchern benutzerfreundlicher realisieren als das in der jetzigen Praxis der Fall ist.
194
Tamás Kispál
In den CD-Versionen der untersuchten Wörterbücher ist die Mikrostruktur besser durchschaubar als in den Printwörterbüchern. Jeder semantische Subkommentar, darunter auch jedes Beispiel, jede Kollokation wird häufig in einer neuen Zeile aufgeführt, was den Zugriff wesentlich erleichtert. Die beiden untersuchten Onlinewörterbücher (Online-Duden, Elexiko) bieten aus der Sicht der kollokationslernenden Wörterbuchbenutzer eine benutzerfreundliche Struktur, indem sie eine eigene Position für Kollokationen enthalten. Die Angabe der typischen Verbindungen durch die graphische Gestaltung von Wortwolken ist im Online-Duden aus der Sicht der Nachschlagehandlung und Auffindbarkeit sehr benutzerfreundlich. In Elexiko finden sich viel mehr Kollokationen als in den Printwörterbüchern. Die statistisch signifikanten Kollokatoren sorgen für die Aktualität der Einträge. Die Verbindung von Basis und Kollokator bleibt allerdings Aufgabe des Wörterbuchbenutzers. Beide Onlinewörterbücher können bei der kollokationsbezogenen Wörterbuchverwendung durch ihre Mikrostruktur wirksamere Nachschlagewerke sein als die untersuchten Printwörterbücher. Ob sich die Ergebnisse dieser Untersuchung auch in der Praxis bestätigen, soll durch die empirische Wörterbuchbenutzungsforschung herausgestellt werden. An der obigen beispielhaften Darstellung einer möglichen Wörterbuchbenutzungssituation lässt sich allerdings ablesen, dass der Wörterbuchbenutzer Thomas vor eine schwierige Situation gestellt ist, wenn er die ausgewählte Produktionsaufgabe aus dem Lehrwerk mit Hilfe von Wörterbüchern machen möchte. Schließlich soll noch erwähnt werden, dass die Erfolglosigkeit nicht nur an der „nicht sehr informativen lexikographischen Erfassung der Kollokationen“, sondern auch am Fehlen „der Geübtheit und Nachschlagefreudigkeit der Wörterbuchbenutzer“ liegt (Reder 2012: 305f.) und dass daher auch eine Schulung der kollokationsbezogenen Nachschlagekompetenz notwendig ist (Kispál 2014: 222).
Literatur Monografien und Aufsätze Bergenholtz, Henning (2008): Von Wortverbindungen, die sie Kollokationen nennen. In: Lexicographica 24, 9–20. Burger, Harald (1989): Phraseologismen im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef et al. (Hrsg.): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. Berlin/New York: De Gruyter, 593–599. Dengler, Stefanie et al. (2012): Netzwerk Deutsch als Fremdsprache A2.1. Mit DVD und Audio-CDs. Kurs- und Arbeitsbuch A2. Teil 1. Berlin: Langenscheidt. Engelberg, Stefan/Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4. überarb. u. erw. Aufl. Tübingen: Stauffenburg. Feilke, Helmuth (1998): Idiomatische Prägung. In: Barz, Irmhild/Öhlschläger, Günther (Hrsg.): Zwischen Grammatik und Lexikon. Tübingen: Niemeyer, 69–80.
Print- und Onlinewörterbuchmikrostrukturen und Kollokationen
195
Herbst, Thomas/Klotz, Michael (2003): Lexikografie. Paderborn: Schöningh. Kispál, Tamás (2014): Kaffee oder Tee? Textkorpusbasierte Kollokationsforschung und ihre Realisierung in der Lernerlexikographie. In: Bassola, Péter et al. (Hrsg.): Zugänge zum Text. Frankfurt: Peter Lang, 217–245. Lehr, Andrea (1998): Kollokationen in Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Wiegand, Herbert Ernst (Hrsg.): Perspektiven der pädagogischen Lexikographie des Deutschen. Untersuchungen anhand von „Langenscheidts Großwörterbuch Deutsch als Fremdsprache“. Tübingen: Niemeyer, 256–281. Mann, Michael (2013): German II: Synchronic lexicography. In: Gouws, Rufus H. et al. (ed.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin: De Gruyter, 742–816. Müller, Peter O./Kunkel-Razum, Kathrin (2007): Phraseographie des Deutschen. In: Burger, Harald et al. (Hrsg.): Phraseologie. Ein internationales Handbuch der zeitgenössischen Forschung. 2. Halbband. Berlin: De Gruyter, 939–949. Reder, Anna (2012): Zur Auffindbarkeit von Kollokationen in Lernerwörterbüchern. In: Jahrbuch der ungarischen Germanistik 2011, 290–310. Rothenhöfer, Andreas (2013): New developments in learner‘s dictionaries II: German. In: Gouws, Rufus H. et al. (ed.) Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin: De Gruyter, 414–425. Steyer, Kathrin (2008): Kollokationen in deutschen Wörterbüchern und in der deutschen Wörterbuchforschung. In: Lexicographica 24, 185–207. Viehweger, Dieter (1989): Probleme der Beschreibung semantischer Vereinbarkeitsrelationen im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef et al. (Hrsg.): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. Erster Teilband. Berlin: De Gruyter, 888–893. Wiegand, Herbert Ernst (1989): Arten von Mikrostrukturen im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef et al. (Hrsg.): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. Erster Teilband. Berlin: De Gruyter, 462–501. Wiegand, Herbert Ernst (1990): Die deutsche Lexikographie der Gegenwart. In: Hausmann, Franz Josef et al. (Hrsg.): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. Zweiter Teilband. Berlin: De Gruyter, 2100–2246. Wiegand, Herbert Ernst (1999a): Artikel einsprachiger Lernerwörterbücher, Textgestaltwahrnehmung und Suchbereichstrukturen. Plädoyer für übersichtliche Printwörterbücher im Zeitalter der Neuen Medien. In: Skibitzki, Bernd/Wotjak, Barbara (Hrsg.): Linguistik und Deutsch als Fremdsprache. Festschrift für Gerhard Helbig zum 70. Geburtstag. Tübingen: Niemeyer, 259–281. Wiegand, Herbert Ernst (1999b): Neuartige Mogelpackungen: gute Printwörterbücher und dazu miserable CD-ROM-Versionen. Diskutiert am Beispiel des „Lexikons der Infektionskrankheiten des Menschen“. In: Lexicographica 14, 239–253. Wiegand, Herbert Ernst (2002): Über textuelle Strukturen der Wörterbuchartikel und Artikelnischen im De Gruyter Wörterbuch Deutsch als Fremdsprache. Zugleich ein Beitrag zur Weiterentwicklung einer Theorie der Wörterbuchform. In: Wiegand, Herbert Ernst (Hrsg.): Perspektiven der pädagogischen Lexikographie des Deutschen II: Untersuchungen anhand des De Gruyter-Wörterbuchs Deutsch als Fremdsprache. Tübingen: Niemeyer, 497–595. Wiegand, Herbert Ernst (2010): Makro- und mikrostrukturelle Präsentationsprobleme bei Phrasemen in allgemeinen einsprachigen Wörterbüchern. Vorschläge für ihre Lösung. In: Ďurčo, Peter
196
Tamás Kispál
(Hrsg.): Feste Wortverbindungen und Lexikographie. Kolloquium zur Lexikographie und Wörterbuchforschung. Berlin: De Gruyter, 161–180. Wiegand, Herbert Ernst/Smit, Maria (2013): Microstructures in printed dictionaries. In: Gouws, Rufus H. et al. (ed.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin: De Gruyter, 149–214. Wiegand, Herbert Ernst/Feinauer, Ilse/Gouws, Rufus H. (2013): Types of dictionary articles in printed dictionaries. In: Gouws, Rufus H. et al. (ed.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin: De Gruyter, 314–366.
Wörterbücher DGwDaF = Wörterbuch Deutsch als Fremdsprache. Hrsg. v. Kempcke, Günter. Berlin: De Gruyter, 2000. Duden-DUW = Duden Deutsches Universalwörterbuch. Mannheim: Bibliographisches Institut, 7. Aufl., 2011. Duden-DUW-CD = Duden Deutsches Universalwörterbuch. Mannheim: Bibliographisches Institut, 7. Aufl., 2011. [CD-ROM]. Elexiko = Elexiko. Online-Wörterbuch zur deutschen Gegenwartssprache. [Unter: ; letzter Zugriff: 18. 10. 2016]. FWD = Feste Wortverbindungen des Deutschen. Kollokationenwörterbuch für den Alltag. Hrsg. v. Häcki Buhofer, Annelies et al. Tübingen: Francke, 2014. HWDG = Handwörterbuch der deutschen Gegenwartssprache. 2 Bde. Hrsg. v. Kempcke, Günter. Berlin: Akademie, 1984. LGwDaF = Langenscheidt Großwörterbuch Deutsch als Fremdsprache. Neubearbeitung. Hrsg. v. Götz, Dieter et al. Berlin: Langenscheidt, 2010 [1. Aufl. 1993]. LGwDaF-CD = e-Großwörterbuch Deutsch als Fremdsprache 5.0. Berlin: Langenscheidt [CD-ROM]. Online-Duden = Duden-online-Wörterbuch. [Unter: ; letzter Zugriff: 18. 10. 2016]. PGwDaF = PONS Großwörterbuch Deutsch als Fremdsprache. Neubearbeitung. Hrsg. v. Wolski, Werner. Stuttgart: Klett, 2011. PGwDaF-CD = PONS Großwörterbuch Deutsch als Fremdsprache. Stuttgart: PONS, 2011. [CD-ROM]. WDG = Wörterbuch der deutschen Gegenwartssprache. Hrsg. v. Klappenbach, Ruth/Steinitz, Wolfgang. 6 Bde. Berlin: Akademie, 1977. WKD = Wörterbuch der Kollokationen im Deutschen. Hrsg. v. Quasthoff, Uwe. Berlin: De Gruyter, 2011. Wahrig-DW = Deutsches Wörterbuch. Hrsg. v. Wahrig-Burfeind, Renate. Gütersloh: Wissen Media, 7. Aufl., 2000. WGwDaF = Wahrig Großwörterbuch Deutsch als Fremdsprache. Hrsg. v. Wahrig-Burfeind, Renate. Berlin: Cornelsen, 2008.
Janusz Taborek
Funktionsverbgefüge in bilingualen deutschpolnischen Wörterbüchern. Korpusbasierte Analyse – syntagmatische Muster – Äquivalenz 1 Einleitung In dem vorliegenden Beitrag werden Funktionsverbgefüge (z. B. in Frage kommen, im Weiteren FVG) aus drei Perspektiven untersucht, und zwar aus der lexikografischen, kontrastiven und korpusbasierten Perspektive, wobei die letzte, die Ausdruck der empirischen und gebrauchbasierten Herangehensweise ist, im Vordergrund steht. Aus lexikografischer Perspektive (Polenz 1989) sind bei der Beschreibung und Präsentation der FVG nachstehende Fragen zu beantworten. Makrostrukturell ist es erstens die Frage nach der Lemmatisierung und der Position des FVG – im Eintrag für das Nomen, im Eintrag für das Funktionsverb oder als selbständiger Eintrag in einem Wörterbuch. Zweitens ist die Frage nach der Nennform bzw. Lemmagestalt aktuell – ist es Infinitiv Aktiv oder eine finite Form des Verbs, zumal finite Verbformen frequenter sind (vgl. weitere Analysen in diesem Beitrag). Aus mikrostruktureller Sicht sind folgende Fragen zu berücksichtigen: Position in der Struktur des Wörterbuchartikels, d. h. wird das FVG als verbales oder nominales Lemma veranschaulichendes Verwendungsbeispiel im Block der festen Verbindungen oder im Phraseologismenblock angegeben, morphosyntaktische Informationen, wie die Valenz des FVG, Präferenzen im Tempusgebrauch usw., pragmatische Informationen, wie die Präferenz in bestimmten Sprachregistern oder Textsorten, typische Sprachgebrauchsmuster des FVG in Verwendungsbeispielen, Äquivalent in der/den Zielsprache(n). Die genannten lexikografischen Fragen sind mit zwei weiteren Perspektiven zu verbinden, und zwar der kontrastiven und der empirischen, korpusbasierten. Die kon trastiven Studien zu den FVG sind u. a. wegen ihrem Potenzial vom Interesse, Aspek tualität und Aktionsarten zum Ausdruck zu bringen. Die Korpusperspektive eröffnet sowohl für die kontrastiven Studien als auch in der Beschreibung der FVG neue Möglichkeiten. Die von Storrer genannte „empirische Wende“ in der Erforschung der FVG markieren die Arbeiten von Seifert (2004), Heine (2008), Storrer (2006; 2007; 2013),
Janusz Taborek: Institut für Germanische Philologie der Adam-Mickiewicz-Universität, al. Niepodległości 4, PL 61-874 Poznań, Polen, [email protected] https://doi.org/10.1515/9783110598650-012
198
Janusz Taborek
Kamber (2006; 2008) u. a. Das Potenzial der Korpusanalysen für die lexikografische Darstellung der FVG liegt u. a. darin, dass mithilfe eines (einsprachigen) Korpus die Kookkurrenzen automatisch erstellt werden, syntagmatische Muster aufgestellt werden, Strukturformen, Konstruktionen bzw. Pattern abstrahiert werden. Die o. g. linguistischen Informationen liefern authentische Verwendungsbeispiele mit potenziellen Variationen und der Einsatz der Parallelkorpora bzw. eines einsprachigen Korpus der Zielsprache ermöglicht, die Zielsprachenäquivalente aufgrund der Vergleichbarkeit der Kookkurrenzen zu ermitteln.
2 Zur Bestimmung, Terminologie und semantischen Klassifikation Als FVG (Engelen 1968) gelten in der germanistischen Sprachwissenschaft Fügungen aus einem Verb und einem substantivischen Deverbativum, z. B. zur Aufführung bringen. Verallgemeinernd weisen diese Konstruktionen die Struktur Verb (+ Prä position + Determinativ) + Substantiv auf. Funktionsverben im FVG sind Verben, die „ihre lexikalische Bedeutung als Vollverb fast verloren haben“ (Bußmann 2008: 208). Als häufigste Funktionsverben des Deutschen gelten gemäß den Korpusanalysen bringen, sein, kommen, sich befinden, stehen, geraten, nehmen und stellen (Kamber 2006: 110). Das Substantiv, das u. U. durch ein Determinativ begleitet wird und im abhängigen Kasus – entweder direkt oder indirekt über eine Präposition – steht, ist ein abstraktes Deverbativum, vgl. aufführen – zur Aufführung bringen. Das Gefügenomen (Engel 1996: 407), in der Darskischen Grammatik auch Finitummodifikator (Darski 2010: 171) genannt, weist drei konstitutive Merkmale auf, die mit Operationali sierungsproben getestet werden. Es ist weder erfragbar (1a) noch ersetzbar (1b) noch weglassbar (1c), ohne dass eine Bedeutungsveränderung des Verbs erfolgt: (1) Er brachte das Stück zur Aufführung. (1a) *Wohin brachte er das Stück? (1b) *Er brachte das Stück dorthin. (1c) *Er brachte das Stück.
Weitere Eigenschaften der Funktionsverbgefüge und vor allem der syntaktischen Umgebung des Gefügenomens, wie etwa ihre Negierung mit der Negationspartikel nicht statt mit dem auf das Nomen bezogenen Determinativ kein bzw. keine oder begrenzte Attribuierung mit Relativsätzen, werden ausführlich in Helbig (2006) behandelt. Syntaktisch verhält sich ein FVG wie ein verbaler Phraseologismus, z. B. zur Welt bringen (3) und ein zusammengesetzes Verb, z. B. mitbringen (4), d. h. in einem Verbletztsatz. Im Falle einer analytischen Form des Funktionsverbs folgt dieses direkt
Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern
199
dem Finitummodifikator und die Partikel zu steht zwischen dem Finitummodifikator und dem Funktionsverb: (2) Sie hat das Stück zur Aufführung gebracht. (2a) Sie bringt das Stück zur Aufführung. (2b) … das Stück zur Aufführung zu bringen. (2c) …, dass sie das Stück zur Aufführung bringt. (3) Sie hat das Kind zur Welt gebracht. (3a) Sie bringt das Kind zur Welt. (3b) … das Kind zur Welt zu bringen. (3c) …, dass sie das Kind zur Welt bringt. (4) Sie hat das Buch mitgebracht. (4a) Sie bringt das Buch mit. (4b) … das Buch mitzubringen. (4c) …, dass sie das Buch mitbringt.
Zu der Abgrenzung von den Phraseologismen einerseits und Kollokationen andererseits ist auf Helbig (2006) zu verweisen. Die bereits als definitorisches Merkmal genannte Nicht-Erfragbarkeit des nominalen Gliedes ermöglicht die Unterscheidung zwischen den Funktionsverbgefügen und den freien Fügungen vom Typ Präpositio nalobjekt mit Verb. (5) Er hat das Kind zur Schule gebracht. (5a) Wohin hat er das Kind gebracht? (5b) Er hat das Kind dorthin gebracht.
FVG werden in Polenz (1987) als eine Untergruppe der Nominalisierungsverbgefüge aufgefasst, die eine kausative, inchoative, durative, aspektuale, passive „Eigenbe deutung“ aufweisen, vgl. verbinden – in Verbindung treten. Nominalisierungsverbge füge, die keine FVG sind, d. h. keine „Eigenbedeutung“ haben, nennt Storrer (2006) Streckverbgefüge, z. B. Frage stellen – fragen, Unterricht erteilen – unterrichten. Der im Weiteren verwendete Terminus Funktionsverbgefüge bezieht sich auf die engere Auffassung der Konstruktion, im Sinne von Polenz (1987) und Storrer (2006), aber im Unterschied zu Helbig (2006). Die als Gruppe nach dem definitorischen Merkmal Eigenbedeutung ausgesonderten FVG lassen sich nach eben dieser Eigenbedeutung semantisch subklassifizieren. Polenz (1987) unterscheidet kausative (in Frage stellen), inchoative (zu Vorschein kommen), durative (in Ordnung halten) und passivische FVG (Anerkennung finden), wobei die letzte Gruppe eine Quergruppe darstellt, weil die passivischen FVG auch unter den kausativen FVG (zur Aufführung bringen = aufgeführt werden) zu finden sind. Diese semantische Unterscheidung, ausgenommen die passivischen FVG, wird für die vorliegende korpusbasierte kontrastive Analyse übernommen.
200
Janusz Taborek
Im Folgenden werden die Korpusanalysen ausgewählter FVG präsentiert, die jeweils drei semantische Gruppen vertreten – die Gruppe der kausativen (in Frage stellen), der inchoativen (in Vergessenheit geraten) und der durativen FVG (zur Verfügung stehen). Die Analyse umfasst drei Etappen: –– Korpusanalyse der deutschen FVG hinsichtlich ihrer Kookkurrenz mit dem Ziel, ihre syntagmatischen Muster zu ermitteln. Zur Analyse werden die Belege aus dem Deutschen Referenzkorpus (DeReKo)1 des Instituts für deutsche Sprache in Mannheim herangezogen. –– Metalexikografische Analyse der deutsch-polnischen Großwörterbücher (siehe 2.2) mit dem Ziel, die potenziellen lexikografischen Äquivalente zu ermitteln. –– Korpusanalyse der potenziellen zielsprachlichen (polnischen) Äquivalente mit dem Ziel, die Kookkurrenz samt syntagmatischem Muster zu ermitteln und die lexikografische Äquivalenz zu verifizieren.
3 Fallstudie 1 zum kausativen FVG in Frage stellen 3.1 Das FVG in Frage stellen im einsprachigen Korpus Das FVG in Frage stellen bedeutet 1. ‚an jmdm. etw. zweifeln‘ und 2. ‚etw. gefährden, ungewiss, unsicher machen; etw. anzweifeln‘ (DUW). Die absolute Anzahl des Vor kommens im DeReKo beträgt 141 621 Treffer.2 Die automatische Kookkurrenzberech nung ergibt folgende Kookkurrenten als die häufigsten, wobei die Kookkurrenten in der nachstehenden Tabelle jeweils auf der ersten Ebene beibehalten werden, d. h. im Falle von Glaubwürdigkeit können im Einzelnen Glaubwürdigkeit Kreuzverhör und Glaubwürdigkeit Opfer mit den absoluten Häufigkeiten jeweils 10 und 31 Treffer ermittelt werden. Die ermittelten Kookkurrenten lassen sich nach der Zuordnung zur syntaktischen Funktion im Satz (Satzgliedfunktion) gruppieren. Als Objekt bzw. Passiv-Subjekt (Was wird in Frage gestellt?) kommen Glaubwürdigkeit, Existenz, Sinnhaftigkeit, Legitimität, Notwendigkeit, System, Autorität, als Adverbiale (Wie wird etwas in Frage gestellt?) grundsätzlich und ernsthaft vor. Die Analyse weiterer Kookkurrenzen zeigt das Negieren des FVG mit nicht (Position 38), Modifizierung und Modalität wird dagegen mit würde (24) und dürfte (27) ausgedrückt und die häufigste satzförmige Realisierung 1 Das Deutsche Referenzkorpus (DeReKo): http://www1.ids-mannheim.de/kl/projekte/korpora. html. 2 Alle Angaben – soweit nicht anderes vermerkt – beziehen sich auf Das Deutsche Referenzkorpus (DeReKo) des IDS Mannheim und zwar auf das Archiv der geschriebenen Sprache, auf alle öffentlichen Korpora des Archivs mit Neuaquisition mit Zugriff über Cosmas II auf http://cosmas2.ids-mannheim. de [letzter Zugriff: 2. 3. 2017].
Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern
201
des Subjektes/Objektes erfolgt mit einem ob-Satz (56). Die Systematisierung der Kook kurrenten nach den syntaktischen Funktionen ergibt das vereinheitlichte syntagma tische Muster (Tabelle 2), in dem die in Spalten präsentierten sprachlichen Formen jeweils derselben syntaktischen Funktion zugeordnet sind und über gemeinsame morphosyntaktische (z. B. Kasus) als auch semantische Merkmale verfügen. Tabelle 1: Syntagmatische Kookkurenzen des FVG in Frage stellen im DeReKo (Belica 1995; 2001). Pos.
LLR kumul. Häufigkeit
Kookkurrenzen
Syntagmatische Muster
1
14 109
3 489
3 489
grundsätzlich
49 % nicht grundsätzlich […] in Frage gestellt|zu|stellen
2
7 142
4 923
1 393
Glaubwürdigkeit
50 % Glaubwürdigkeit [… der …] in Frage gestellt
3
6 494
6 624
1 654
Existenz
58 % die Existenz [des/der …] in Frage gestellt
4
4 784
7 893
1 269
ernsthaft
62 % ernsthaft […] in Frage gestellt|stellen
5
3 833
8 421
528
Sinnhaftigkeit
44 % die Sinnhaftigkeit [… des|der …] in Frage gestellt
6
3 419
8 933
512
Legitimität
52 % die Legitimität [des|der …] in Frage gestellt
7
3 350
9 927
994
Notwendigkeit
46 % die Notwendigkeit [… der …] in Frage gestellt
8
3 072 11 521
1 556
System
48 % das System [… der …] in Frage gestellt|stellen
9
2 663 12 139
618
Autorität
57 % die Autorität [… der …] in Frage gestellt
10
2 571 12 609
331
Integrität
56 % die Integrität [… des|der …] in Frage gestellt|stellen
Tabelle 2: Kookkurrenzen des FVG in Frage stellen, geordnet nach syntaktischen Funktionen. Subjekt
Hilfsverb
Adverbial
Nominalgefüge
Funktionsverb
Glaubwürdigkeit Existenz Sinnhaftigkeit Legitimität Notwendigkeit System Autorität
wird ist
grundsätzlich ernsthaft
in Frage infrage
gestellt zu stellen
202
Janusz Taborek
Aus dem in Tabelle 2 dargestellten vereinheitlichten syntagmatischen Muster wird durch das Generalisieren und Ersetzen der einzelnen Paradigmen bildenden sprachlichen Formen durch die Variablen X, Y etc. (sog. Slots, vgl. Steyer 2013) eine Strukturform (Heine 2008: 17), syntagmatic pattern (Steyer 2016: 294) bzw. ein Pattern (Hunston/Francis 2000) gebildet: Y wird/wurde in Frage gestellt; X stellt Y in Frage; Y ist in Frage gestellt; Y ist in Frage zu stellen. Das Pattern Y wird/wurde in Frage gestellt gilt mit der absoluten Vorkommensanzahl (n = 33 989) und der mit Abstand höchsten Frequenz (p = 0,24) als Präferenz. Bezugnehmend auf die dahinter platzierten Kookkurrenten und auf morphosyntaktische Möglichkeiten der Realisierung der einzelnen Variablen wird bei dem letztgenannten Pattern das folgende Muster mit der satzförmigen Realisierung des Subjektes ausgesondert: Es ist in Frage zu stellen, ob-S. Zusammenfassend lässt sich also sagen, dass (1) mithilfe eines einsprachigen Korpus die Kookkurrenzen automatisch erstellt werden (können), (2) syntagmatische Muster nach der Systematisierung der Kookurrenten und mit Berücksichtigung der syntaktischen Funktionen aufgestellt werden, (3) Strukturformen, Konstruktionen bzw. Pattern abstrahiert werden. Der nächste Schritt aus der lexikographischen Perspektive und wichtig für die lexikografische Praxis ist das Erstellen der Verwendungsbeispiele, die die oben genannten Strukturformen und die häufigsten Kookkurrenten berücksichtigen. Auf die Verwendungsbeispiele wird in Kap. 2.3 eingegangen. Den nächsten Schritt des vorgeschlagenen Modells bildet die Analyse der deutsch-polnischen Wörterbücher, um die potenziellen Äquivalente zu ermitteln.
3.2 FVG in Frage stellen in zweisprachigen deutsch-polnischen Wörterbüchern Das Ziel der metalexikografischen Analyse der Einträge in deutsch-polnischen Wörterbüchern ist es, die potenziellen, hier als lexikografisch bezeichneten, Wörterbuchäquivalente3 zu ermitteln. Diese Äquivalente werden im dritten Schritt einer Korpusanalyse unterzogen (Kap. 2.3). Für die Analyse werden vier mittelgroße und große Wörterbücher herangezogen, die nach 2000 erschienen sind. Es handelt sich um PONS Kompaktwörterbuch Deutsch-Polnisch (2001, im Weiteren PONS DSNP),4 das Handwörterbuch Deutsch-Polnisch (2007, im Weiteren WP PSNP), PONS Grosswörterbuch Deutsch-Polnisch (2008, im Weiteren PONS WSNP) und PWN Grosswörterbuch Deutsch-Polnisch (2008, im Weiteren PWN WSNP).
3 Wörterbuchäquivalente sind die in einem Wörterbuch angegebenen Äquivalente und es handelt sich nicht um lexikographische Äquivalente, vgl. Wiegand (2005). 4 In Polen ist dieses Wörterbuch unter dem Titel Duży słownik… ‚Großwörterbuch‘ 2001 erschienen und das 2008 herausgegebene Wörterbuch trägt den polnischen Titel Wielki słownik… ‚Großwörterbuch‘.
Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern
203
Tabelle 3: Das FVG in Frage stellen in deutsch-polnischen Wörterbüchern. Wörterbuch \ Lemma
Frage
stellen
PONS DSNP (2001)
► etw in ~ stellen poddawać [perf poddać] coś w wątpliwość
–
WP PSNP (2007)
in ~ stellen kwestionować, pod(aw)ać w wątpliwość
in Frage ~ narażać na szwank, wątpić (o czymś), za|kwestionować coś
PONS WSNP (2008)
□ etw in ~ stellen (zweifeln) poddawać [perf poddać] coś w wątpliwość; (gefährden) zagrażać [perf zagrozić] czemuś
etw in Frage ~ poddać coś w wątpliwość, zakwestionować coś
PWN WSNP (2008)
□ etw +A in ~ stellen zakwestionować coś, stawiać coś pod znakiem zapytania
–
Die ersten Schlussfolgerungen sind, dass das FVG in Frage stellen in allen Wörter büchern unter dem Nomen Frage lemmatisiert ist, in PSNP und PWN WSNP wird das FVG auch unter der verbalen Komponente des FVG lemmatisiert, wobei die polnischen Äquivalente in ein und demselben Wörterbuch voneinander teilweise abweichen. Die Nennform stimmt in allen Einträgen überein und es ist Infinitiv Präsens. Die weiteren metalexikografischen Analysen werden hier außer Acht gelassen,5 weil unser Hauptziel war, die (potenziellen) lexikografischen Äquivalente in der Zielsprache Polnisch zu ermitteln. Als die zwei häufigsten Äquivalente des Polnischen gelten das FVG podawać (perfektiv podać) w wątpliwość und das einfache Verb kwestionować (perfektiv zakwestionować).
3.3 Wörterbuchäquivalente der Zielsprache im Korpus Die dritte Etappe der Analyse bildet die Ermittlung der Kookkurrenten, der syntagmatischen Muster und der Strukturformeln der Wörterbuchäquivalente. Das Ko-Vorkommen der deutschen und polnischen Formen in derselben Umgebung, d. h. mit den äquivalenten Kookkurrenzen, ist eine Bestätigung für die volle Äquivalenz. Für das Polnische
5 Es fallen Inkosequenzen und Fehler in den genannten deutsch-polnischen Wörterbüchern auf. Bei der Angabe der Äquivalente erscheinen differente Formen in ein und demselben Wörterbuch (WP PSNP und PONS WSNP). Das letztere Wörterbuch notiert das analysierte FVG im Wörterbuchartikel Frage im Phraseologismenblock, dagegen wird im Wörterbuchartikel stellen das FVG als Verwen dungsbeispiel betrachtet. In beiden Wörterbüchern von PONS wird das Äquivalent die FVG poddawać w wątpliwość angeführt, obwohl diese Form im Polnischen im Unterschied zu podawać als nicht normgerecht angesehen wird.
204
Janusz Taborek
wird das Nationalkorpus der polnischen Sprache6 mit dem Werkzeug Kolokator (Pęzik 2012) eingesetzt. Die Kookkurrenzen der Präpositionalphrase w wątpliwość (in Frage) werden in Tabelle 4 dargestellt, wobei die verbalen Kookkurrenten ausgelassen werden. Die Berechnung der Kollokationen erfolgte auf einer repräsentativen Probe von 50 000 Tokens mit Abstand von jeweils zwei Wörtern links und rechts und wurde nach der absoluten Anzahl der Vorkommen mit der Prozentangabe geordnet (vgl. Steyer 2016: 284). Der höchstfrequente Kollokator istnienie (Existenz) kommt in 7,25 % der Funde mit der Kollokationsbasis w wątpliwość vor und, falls die Basis mit einer Kollokation vorkommt, bildet der Kollokator istnienie (Existenz) 55,91 % der Vorkommen. Tabelle 4: Nicht-verbale Kollokationen der Präpositionalphrase w wątpliwość (in Zweifel) (n – Vorkommensfrequenz der Kollokationsbasis (w wątpliwość) im Korpus, m – Vorkommensfrequenz der Basis mit einem Kollokator). # 1 2 3 4 = 6 = = 9 = 11 = = = = 16 = 18 = =
Kollokation istnienie ‚Existenz‘ sens ‚Sinn, Sinnhaftigkeit‘ słowo ‚Wort‘ kwalifikacja ‚(fachliche)Qualifikation‘ prawo ‚Recht‘ wartość ‚Wert; Wertesystem‘ wszystko ‚alles‘ pan ‚Sie‘ zdolność ‚Fähigkeit‘ fakt ‚Fakt, Tatsache‘ słuszność ‚Recht, Richtigkeit‘ celowość ‚Zweckmäßigkeit; Sinn‘ intencja ‚Absicht‘ sposób ‚Art und Weise‘ informacja ‚Information‘ czystość ‚Klarheit, Reinheit‘ uczciwość ‚Ehrlichkeit, Rechtschaffenheit‘ autentyczność ‚Authentizität, Echtheit‘ szczerość ‚Ehrlichkeit‘ sąd ‚Recht‘
Frequenz
Prozent (n = 717)
Prozent (m = 93)
52 35 11 10 10 9 9 9 8 8 7 7 7 7 7 6 6 5 5 5
7,25 4,88 1,53 1,39 1,39 1,26 1,26 1,26 1,12 1,12 0,98 0,98 0,98 0,98 0,98 0,84 0,84 0,70 0,70 0,70
55,91 37,63 11,83 10,75 10,75 9,68 9,68 9,68 8,60 8,60 7,53 7,53 7,53 7,53 7,53 6,45 6,45 5,38 5,38 5,38
Beim Vergleich der in Tabelle 4 dargestellten Kollokatoren mit den vier hochfre quenten nominalen Kollokatoren des deutschen FVG in Frage stellen fallen folgende Parallelen auf: Glaubwürdigkeit (Position in der Rangliste der Kookkurrenten: 1) – uczciwość (16), autentyczność (18), szczerość (18); Existenz (2) – istnienie (1); Sinnhaf-
6 Narodowy Korpus Języka Polskiego (Nationalkorpus des Polnischen), http://www.nkjp.pl [letzter Zugriff: 20. 2. 2017].
Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern
205
tigkeit (3) – sens (2), wartość (6); Legitimität (4) – kwalifikacja (4), prawo (4), słuszność (11). Demzufolge ist festzustellen, dass zwischen den FVG podawać w wątpliwość und in Frage stellen – mindestens für ihre hochfrequenten Kollokatoren – eine Äquivalenzbeziehung vorliegt. Die Ergebnisse der Analyse hinsichtlich der Kookkurrenten des zweiten potenziellen lexikografischen Äquivalents, des Verbs kwestionować, werden in Tabelle 5 präsentiert. Tabelle 5: Kollokationen des Verbs kwestionować (in Frage stellen) (n – Vorkommensfrequenz der Kollokationsbasis (w wątpliwość), m – Vorkommensfrequenz der Basis mit dem Kollokator). #
Kollokation
1 2 = 4
istnienie ‚Existenz‘ prawo ‚Recht‘ wynik ‚Ergebnis‘ decyzja ‚Entscheidung‘
5 6 = = = = 11 = =
zamiar ‚Absicht‘ wysokość ‚Höhe‘ wartość ‚Wert‘ wola ‚Wille‘ sens ‚Sinn‘ fakt ‚Tatsache‘ wiarygodność ‚Glaubwürdigkeit‘ racja ‚Recht‘ tutaj ‚tutaj‘
Frequenz
Prozent (n = 574)
Prozent (m = 101)
16 13 13 10
2,79 2,26 2,26 1,74
15,84 12,87 12,87 9,90
8 6 6 6 6 6 5 5 5
1,39 1,05 1,05 1,05 1,05 1,05 0,87 0,87 0,87
7,92 5,94 5,94 5,94 5,94 5,94 4,95 4,95 4,95
Der Vergleich der vier hochfrequenten Kollokationen des deutschen FVG in Frage stellen erlaubt die nachstehenden Parallelen: Glaubwürdigkeit (1) – wiarygodność (11), Existenz (2) – istnienie (1), Sinnhaftigkeit (3) – sens (6) und Legitimität (4) – prawo (2). Die zwei potenziellen lexikografischen Äquivalente podawać w wątpliwość und kwestionować können nach der Analyse als Äquivalente bestätigt werden. Nach der Ermittlung bzw. Verifizierung der Äquivalenz ist der nächste Schritt im vorge schlagenen Beschreibungsmodell das Festlegen der kontrastiven syntagmatischen Muster mit Verwendungsbeispielen. Die Verwendungsbeispiele, die ein vorgegebenes syntagmatisches Muster veranschaulichen, lassen sich direkt in Korpora erfragen.7
7 Etwa mit der Suchanfrage $wird /s0 in /w1 Frage /w1 $gestellt, wobei die Form wird dann um die Flexionsformen für weitere Personen ergänzt werden kann. Die dritte Person Singular/Plural ist in diesem FVG die mit Abstand häufigste. Man könnte auch mit dem morphologisch annotierten und erfragbaren Subkorpus des DeReKo arbeiten und dann effizienter nach werden als 3. Person Plural etc. fragen.
206
Janusz Taborek
Die für das Deutsche ermittelten Strukturmuster mit zugehörigen, vorgeschlagenen Beispielen sind der Tabelle 6 zu entnehmen. Tabelle 6: Syntagmatische Muster des FVG in Frage stellen im Kontrast und mit Verwendungsbeispielen. Deutsch
Polnisch
X wird in Frage gestellt
X jest kwestionowane/podawane w wątpliwość
Die Glaubwürdigkeit des Politikers wird in Frage gestellt.
Wiarygodność polityka jest kwestionowana.
X stellt Y in Frage
X kwestionuje Y / X podaje Y w wątpliwość
Niemand stellt die Existenz dieser Schule in Frage.
Nikt nie kwestionuje istnienia tej szkoły. / Nikt nie podaje w wątpliwość istnienia tej szkoły.
X ist in Frage gestellt
X jest kwestionowane/podawane w wątpliwość
Seine Autorität als Lehrer ist in Frage gestellt.
Jego autorytet jako nauczyciela został podważony/zakwestionowany/podany w wątpliwość.
Y ist in Frage zu stellen
Y należy podać w wątpliwość
Es ist grundsätzlich in Frage zu stellen, ob…
Należy zasadniczo podać w wątpliwość, czy…
Die Füllung der Slots in syntagmatischen Mustern erfolgt jeweils mit den höchstfre quenten sprachlichen Formen. Die häufigsten Subjekte im Pattern X stellt Z in Frage sind niemand und Professor, von denen das erste im Verwendungsbeispiel vorgeschlagen wurde. Das Verwendungsbeispiel des Patterns X ist in Frage zu stellen illustriert zugleich die häufigste satzförmige Realisierung des Subjektes/Objektes, den ob-Satz, der auch im Polnischen (czy-Satz) als häufigste sententiale Realisierung laut Kookkurrenzanalyse im NKJP-Korpus gilt. Die auf diese Art und Weise ermittelten syntagmatischen Muster und Strukturformen mit der jeweiligen Slot-Füllung stellen fertiges Material für zweisprachige Wörterbücher und didaktische Materialien, z. B. für den DaF-Unterricht, dar. Die weiteren zwei Fallstudien zu einem inchoativen FVG und einem durativen FVG werden auf die Ermittlung der Äquivalenz und der syntagmatischen Muster, der Strukturformen (Pattern) und der häufigsten Füllung der Slots beschränkt. Die Analyse erfolgt ebenfalls in drei Schritten: Kookkurrenzanalyse der Ausgangssprache, metalexikografische Analyse der bilingualen Wörterbücher sowie Kookkurrenzanalyse der Zielsprache.
Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern
207
4 Fallstudie 2 zum inchoativen FVG in Vergessenheit geraten Das FVG in Vergessenheit geraten weist eine niedrigere Frequenz im Korpus auf (32 042 Vorkommen im DeReKo). Dies macht 22 % der Belege von in Frage stellen aus. Die Kookkurrenzanalyse ergibt das häufigste syntagmatische Muster X ist ADV in Verges senheit geraten mit den alternierenden Perfekt- und Präsensformen. Tabelle 7: Syntagmatisches Muster des FVG in Vergessenheit geraten. Subjekt
Hilfsverb / Funktionsverb
Adverbial
Nominalgefüge
Funktionsverb
Brauch Werk Tod Tradition Name Komponist Weltkrieg
ist gerät
fast schnell weitgehend zu Unrecht beinahe wieder völlig längst allmählich bald leider
in Vergessenheit
geraten
Zahlreiche Adverbiale lassen sich semantisch zu graduellen Adverbialen (fast, weit gehend, beinahe, völlig, allmählich), evaluativen Adverbialen (zu Unrecht, leider) und temporalen Adverbialen (schnell, wieder, längst, bald) gruppieren. Zu den weiteren Kookkurrenten zählen die Verben wiederentdecken, lassen (mit Frequenz 3,17 %) und drohen. Insgesamt lassen sich für in Vergessenheit geraten folgende Muster ermitteln: (1) X ist in Vergessenheit geraten (2) X gerät in Vergessenheit (3) X ist in Vergessenheit geraten und wird wiederentdeckt (4) X lässt Y in Vergessenheit geraten (5) X droht in Vergessenheit zu geraten Die Muster (1) und (2) können zu einem Muster zusammengezogen werden, weil sie sich nur durch die grammatische Kategorie Tempus unterscheiden. Das Pattern (3) wird sowohl im Perfekt als auch im Präteritum realisiert. Das Pattern (4) weist eine kausative Lesart auf, was auf die Möglichkeit hinweist, die fehlende Kausativität mit hilfe von lassen auszudrücken.
208
Janusz Taborek
Tabelle 8: Das FVG in Vergessenheit geraten in bilingualen Wörterbüchern.8 Wörterbuch \ Lemma
Vergessenheit / vergessen
geraten
PONS DSNP (2001)
in ~ geraten iść [perf pójść] w zapomnienie
–
WP PSNP (2007)
vergessen […] Sh in ~ geraten iść w zapomnienie 8
in Vergessenheit ~ pójść w zapomnienie
PONS WSNP (2008)
in ~ geraten popadać [perf popaść] w zapomnienie
das ist längst in Vergessenheit ~ to już dawno poszło w zapomnienie
PWN WSNP (2008)
in ~ geraten popaść w zapomnienie
in Vergessenheit ~ popaść w zapomnienie
Aufgrund der Wörterbucheinträge lassen sich potenzielle lexikografische Äqui valente, d. h. FVG ermitteln, die sich aus der Präpositionalgruppe w zapomnienie bzw. w niepamięć (Vergessenheit) und einem der Verben – iść (perfektiv pójść) (gehen) bzw. popadać (perfektiv popaść) (fallen) zusammensetzen. Damit lässt sich bereits nach der metalexikografischen Analyse ein vereinfachtes Muster erstellen: X idzie/ poszło w zapomnienie; popada/popadło w niepamięć. Mithilfe der Kookkurrenzanalyse werden verbale Kontextpartner zu den Präpositionalgruppen w zapomnienie und w niepamięć ermittelt und – der Einfachheit halber – in Paare der imperfektiven mit der perfektiven Variante verbunden. Die Präpositionalgruppe w zapomnienie (in Vergessenheit) kookkurriert mit den Verben (in Klammern wird jeweils nur die Position in der Rangliste der Verben angegeben): –– iść (4.) – pójść (1.) ‚gehen‘ –– odchodzić (3.) – odejść (2.) ‚weggehen‘ –– popadać (6.) – popaść (5.) ‚fallen‘ –– móc (7.) ‚können‘ (Modalverb), –– być (8.) ‚sein‘ (durative Lesart). Die Präpositionalgruppe w niepamięć (in Vergessenheit) steht mit folgenden Verben zusammen: –– puścić (1.) – puszczać (6.) ‚lassen‘ (kausative Lesart), –– móc (2.) ‚können‘ (Modalverb),
8 Die lexikografische Praxis in WP PSNP ist, deverbale Substantive auf heit, -keit, -ung unter dem entsprechenden Verb (oder Adjektiv) zu lemmatisieren. Die Abkürzung Sh verweist auf die Substantivierung des Verbs mit dem Suffix -heit, Sk auf das Substantiv mit dem Suffix -keit und Su auf das Substantiv mit dem Suffix ‑ung. In unserer Analyse wird diese Vorgehensweise als Lemmatisierung unter der „nominalen“ Komponente betrachtet, obwohl es – streng genommen – ein verbales Lemma ist.
Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern
209
–– odchodzić (5.) – odejść (3.) ‚weggehen‘, –– spychać (7.) – zepchnąć (4.) ‚schieben‘ (kausative Lesart), –– iść (8.) ‚gehen‘. Als Funktionsverben des polnischen Gefüges VERB + w zapomnienie gelten somit iść ‚gehen‘, odchodzić ‚weggehen‘ und popadać ‚fallen‘. Das Modalverb móc ‚können‘ modifiziert das ganze Funktionsverbgefüge und die Fügung mit być ‚sein‘ ist durativ. Die zweite Präpositionalgruppe, w niepamięć, bildet Funktionsverbgefüge mit den Verben odchodzić ‚weggehen‘ und seltener, aber auch, mit dem Verb iść ‚gehen‘. Demzufolge lassen sich korpusbasiert diese Funktionsverbgefüge als gebräuchlich festlegen: odchodzić/iść/popadać (selten) w zapomnienie und odchodzić/iść (selten) w niepamięć. Es fällt auf, dass in keinem der analysierten deutsch-polnischen Wörterbücher das häufigste FVG mit dem Verb odchodzić ‚weggehen‘ notiert wird, obwohl das FVG sowohl in monolingualen als auch in zweisprachigen polnisch-deutschen Wörterbüchern vorkommt. Der nächste Schritt der Analyse ist – analog zu der Darstellung unter 3.1 – die Kookkurrenzanalyse der polnischen lexikografischen Äquivalente. Als Endergebnis werden nachstehend die Strukturformen im Kontrast mit deutschen und polnischen Beispielen präsentiert. Tabelle 9: Syntagmatische Muster des FVG in Frage stellen im Kontrast und mit Verwendungsbeispielen. Deutsch
Polnisch
X ist (ADV) in Vergessenheit geraten
X (ADV) odszedł w zapomnienie/niepamięć
Der Brauch ist fast in Vergessenheit geraten.
(Ten) Zwyczaj prawie odszedł w zapomnienie.
X gerät (ADV) in Vergessenheit
X (ADV) odchodzi w niepamięć
Sein Werk gerät wieder in Vergessenheit.
Jego dzieło znów odchodzi w zapomnienie.
X geriet in Vergessenheit und wird wiederentdeckt
X odszedł w zapomnienie/niepamięć i został na nowo odkryty
Der Komponist geriet schnell in Vergessenheit und wurde nach Jahren wiederentdeckt.
Kompozytor szybko odszedł w zapomnienie i po latach został odkryty na nowo.
X droht in Vergessenheit zu geraten
X może odejść w zapomnienie/niepamięć
Die Geschichte droht in Vergessenheit zu geraten.
(Ta) Historia może odejść w zapomnienie.
X lässt Y in Vergessenheit geraten (kausativ)
X puszcza/spycha/pozwala_odejść Y w zapomnienie/niepamięć
Niemand lässt den Krieg in Vergessenheit geraten.
Nikt nie pozwoli wojnie odejść w zapomnienie.
210
Janusz Taborek
5 Fallstudie 3 zum durativen FVG zur Verfügung stehen Das durative FVG zur Verfügung stehen weist mit 486 502 Treffern im DeReKo die größte Vorkommens fre quenz auf. Aus der Kookkurrenzanalyse lassen sich zwei syntagmatische Muster des Funktionsverbgefüges ableiten. Tabelle 10: Das erste syntagmatische Muster des FVG zur Verfügung stehen. Quantifikator
Subjekt
Funktionsverb Dativobjekt
Nominalgefüge
nicht genügend ausreichend insgesamt
Raum/Räume Mittel (Park-)Plätze Fahrstreifen Quadratmeter Millionen Euro Kader/Spieler
steht stehen
zur Verfügung
Besuchern Bürgern
Tabelle 11: Das zweite syntagmatische Muster des FVG zur Verfügung stehen. Adverbial
Funktionsverb
Für weitere Fragen steht Für Rückfragen Für Auskünfte Für Informationen Zur Beantwortung Ihrer Fragen
Dativobjekt
Subjekt
Nominalgefüge
Ihnen
Prof. (Dr.)
zur Verfügung
Die Strukturformen (Patterns) für zur Verfügung stehen sind demzufolge: (QUANT) X steht Y zur Verfügung; ADV steht X Y zur Verfügung. Das FVG wird in allen analysierten deutsch-polnischen Wörterbüchern unter dem nominalen Lemma, in PSNP und PONS WSNP auch unter dem Funktionsverb stehen lemmatisiert. Tabelle 12: Das FVG zur Verfügung stehen in bilingualen Wörterbüchern. Wörterbuch \ Lemma
Verfügung
stehen
PONS DSNP (2001)
jmdm zur ~ stehen być do czyjejś dyspozycji
–
WP PSNP (2007)
zur ~ stehen być do dyspozycji
zur Verfügung ~ być do dyspozycji
PONS WSNP (2008)
jmdm zur ~ stehen być do czyjejś dyspozycji
jmdm zur Verfügung ~ stać [o być] do czyjejś dyspozycji
PWN WSNP (2008)
ich stehe Ihnen zur ~ oddaję się do pana/pani dyspozycji
–
Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern
211
Als (potenzielles) lexikografisches Äquivalent gilt das durative Funktionsverbgefüge być do dyspozycji mit dem Funktionsverb być ‚sein‘ mit zwei Alternativen – stać ‚stehen‘ (PONS WSNP) und oddawać się ‚sich bereitstellen‘ (PWN WSNP). Die Kookkurrenzanalyse der polnischen Präpositionalgruppe do dyspozycji ‚zur Verfügung‘ ergibt unter den zehn häufigsten Kookkurrenzen drei durative Funktionsverben – mieć ‚haben‘ (3.), być ‚sein‘ (7.) und das aspektuelle Paar pozostawać (10.) – pozostać (8.) ‚bleiben‘. Die syntagmatischen Muster und demzufolge die Strukturformen sind: X jest/pozostaje do (Y) dyspozycji (Y); X ma Y do swojej dyspozycji. Die weiteren, d. h. über das Funktionsverb hinausgehenden Analysen der Kookkurrenzen der polnischen Funktionsverbgefüge erlauben, folgende kontrastive Patterns aufzustellen. Tabelle 13: Syntagmatische Muster des FVG zur Verfügung stehen im Kontrast und mit Verwendungsbeispielen. Deutsch
Polnisch
X steht Y zur Verfügung
X jest/pozostaje do dyspozycji Y X ma Y do dyspozycji
Den Besuchern stehen nicht genügend Räume zur Verfügung.
Odwiedzający nie mają wystatczającej liczby pomieszczeń do dyspozycji.
Insgesamt stehen genug Mittel zur Verfügung.
Łącznie nie ma wystarczających środków do dyspozycji.
Den Bürgern stehen ausreichend Parkplätze zur Verfügung.
Mieszkańcy mają wystarczająco dużo miejsc parkingowych do dyspozycji.
Alle Spieler stehen dem Trainer zur Verfügung.
Wszyscy zawodnicy pozostają do dyspozycji trenera.
ADV steht X Y zur Verfügung
X jest/pozostaje do dyspozycji Y
Für weitere Frageb steht der Redner den Zuhörern zur Verfügung.
W przypadku dalszych pytań mówca pozostaje do dyspozycji słuchaczy.
6 Zusammenfassung und Ausblick Das vorgestellte Beschreibungsmodell der FVG ist korpusbasiert, kontrastiv und lexiko gra fisch orientiert, d. h. es enthält sowohl eine metalexikografische Kritik der bestehenden Wörterbücher als auch empirisch gesicherte Informationen zum Gebrauch des jeweiligen FVG. Die Analyse verläuft jeweils in drei Schritten – Kook kur renzanalyse des deutschen Funk tionsverbgefüges im monolingualen Korpus, metalexikografische Analyse mit dem Ziel, das lexikografische, potenzielle Äquivalent aufzustellen sowie Kookkurrenzanalyse der lexikografischen Äquivalente. Die
212
Janusz Taborek
Kookkurrenzanalyse umfasst jeweils die Ermittlung der Kookkurrenzen, das Erstellen der syntagmatischen Muster, das Erstellen der Strukturformen (Patterns) und – im Falle der Zielsprache – auch das Ermitteln des passenden Funktionsverbs, vgl. z. B. das FVG odchodzić w niepamięć ‚in Vergessenheit geraten‘. Die metalexikografischen Fragen über die Position des FVG in der Mikrostruktur eines Wörterbuchs wurden in diesem Beitrag nicht erörtert, allerdings spricht der Reichtum der aus Korpora gewonnenen lexikalisch-grammatischen, pragmatischen, stilistischen und domänenspezifikbezogenen Informationen für einen Sonderstatus des FVG im verbalen und/oder nominalen Wörterbuchartikel. Eine optimale Lösung wäre, FVG als separate Datenbankeinträge zu kodieren, um sie über ein Verweissystem sowohl mit dem Wörterbucheintrag für das Nomen (als Gefügenomen des FVG) als auch für das Verb (als Funktionsverb des FVG) zu verbinden.
Literatur Monographien und Aufsätze Belica, Cyril (1995): Statistische Kollokationsanalyse und -clustering. Korpuslinguistische Analysemethode. Mannheim: Institut für Deutsche Sprache. Belica, Cyril (2001): Kookkurrenzdatenbank CCDB. Eine korpuslinguistische Denk- und Experimentierplattform für die Erforschung und theoretische Begründung von systemischstrukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs. Mannheim: Institut für Deutsche Sprache. Bußmann, Hadumod (2008): Lexikon der Sprachwissenschaft. Stuttgart: Kröner. Darski, Józef (2010): Deutsche Grammatik. Ein völlig neuer Ansatz. Frankfurt am Main etc.: Peter Lang. Engel, Ulrich (1996): Deutsche Grammatik. Heidelberg: Groos. Engelen, Bernhard (1968): Zum System der Funktionsverbgefüge. In: Wirkendes Wort 18, 289–303. Heine, Antje (2008): Funktionsverbgefüge richtig verstehen und verwenden. Ein korpusbasierter Leitfaden mit finnischen Äquivalenten. Frankfurt am Main etc: Peter Lang. Helbig, Gerhard (2006): Funktionsverbgefüge – Kollokationen – Phraseologismen. Anmerkungen zu ihrer Abgrenzung – im Lichte der gegenwärtigen Forschung. In: Breuer, Ulrich/Hyvärinen, Irma (Hrsg.): Wörter – Verbindungen. Festschrift für Jarmo Korhonen zum 60. Gerburtstag. Frankfurt am Main: Peter Lang, 165–172. Hunston, Susan/Francis, Gill (2000): Pattern Grammar: A Corpus-driven Approach to the Lexical Grammar of English. Amsterdam/Philadelphia: Benjamins. Kamber, Alain (2006): Funktionsverbgefüge – empirisch (am Beispiel von kommen). In: Linguistik online 3, 109–132. Kamber, Alain (2008): Funktionsverbgefüge – empirisch. Eine korpusbasierte Untersuchung zu den nominalen Prädikaten des Deutschen. Tübingen: Niemeyer. Pęzik, Piotr (2012): Wyszukiwarka PELCRA dla danych NKJP. In: Przepiórkowski, Adam et al. (Hrsg.): Narodowy Korpus Języka Polskiego. Warszawa: PWN. Polenz, Peter von (1987): Funktionsverben, Funktionsverbgefüge und Verwandtes. Vorschläge zur satzsemantischen Lexikographie. In: Zeitschrift für germanistische Linguistik 15, 169–189.
Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern
213
Polenz, Peter von (1989): Funktionsverbgefüge im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Joseph et al. (Hrsg.): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. Berlin/New York: De Gruyter, 882–887. Seifert, Jan (2004): Funktionsverbgefüge in der deutschen Gesetzessprache (18. –20. Jahrhundert). Oldenburg: Olms. Steyer, Katrin (2013): Usuelle Wortverbindungen. Zentrale Muster des Sprachgebrauchs aus korpus analytischer Sicht. Tübingen: Narr. Steyer, Katrin (2016): Patterns. Phraseology in a state of flux. In: International Journal of Lexico graphy 28, 3, 279–298. Storrer, Angelika (2006): Funktionen von Nominalisierungsverbgefügen im Text. Eine korpusbasierte Fallstudie. In: Prost, Kristel/Winkler, Edeltraud (Hrsg.): Von der Intentionalität zur Bedeutung konventionalisierter Zeichen. Festschrift für Gisela Harras zum 65. Geburtstag. Tübingen: Narr, 147–178. Storrer, Angelika (2007): Corpus-based Investigations on German Support Verb Constructions. In: Fellbaum, Christiane (Hrsg.): Collocations and Idioms: Linguistic, lexicographic, and computational aspects. London: Continuum Press, 164–188. Storrer, Angelika (2013): Variation im deutschen Wortschatz am Beispiel der Streckverbgefüge. In: Reichtum und Armut der deutschen Sprache. Erster Bericht zur Lage der deutschen Sprache. Berlin/New York: De Gruyter, 171–209. Wiegand, Herbert (2005): Äquivalenz, Äquivalentdiffernezierung und Äquivalentptäsentation in zweisprachigen Wörterbüchern. Eine neue einheitliche Konzeption. In: Gottlieb, Henrik et al. (Hrsg): Symposium on lexicography XI. Tübingen: Niemeyer, 17–58.
Wörterbücher DUW = Duden. Deutsches Universalwörterbuch. Mannheim: Bibliographisches Institut, 2006. PONS DSNP = PONS. Duży słownik niemiecko-polski. Hrsg. v. Świrska, Marzena. Poznań: LektorkKlett, 2001. PONS WSNP = PONS. Wielki słownik niemiecko-polski. Hrsg. v. Dargacz, Anna. Poznań: LektorKlett, 2008. WP PSNP = Podręczny słownik niemiecko-polski. Hrsg. v. Kubica, Stefan/Chodera, Jan/Bzdęga, Andrzej. Warszawa: Wiedza Powszechna, 2007. PWN WSNP = PWN. Wielko słownik niemiecko-polski. Hrsg. v. Wiktorowicz, Józef/Frączek, Agnieszka. Warszawa: Wydawnictwo PWN, 2008.
Marjeta Vrbinc
The structure of label strings in a phraseological dictionary 1 Introduction In a dictionary, the connotative value of a lexical item is described by labels, and in many cases, more than one label is needed to describe all the connotations carried by a lexical item. In metalexicography, all the restrictions and constraints on the use of a lexical item are referred to as diasystematic information or diasystematic marking (Hausmann 1977, 1989; Svensén 2009: 315–332). The term diasystematic marking is defined by Svensén as describing information implying that “a certain lexical item deviates in a certain respect from the main bulk of items described in a dictionary and that its use is subject to some kind of restriction” (Svensén 2009: 315). The existing literature offers various taxonomies of diasystematic information proposed by various researchers, but the most detailed classification can be found in Hausmann (1989: 651), who identifies as many as eleven types of labels. His classification was also adopted by various other scholars, such as Bergenholtz/ Tarp (1995: 131–134) and Svensén (2009: 326–332) and is used as the theoretical background for our research: (1) diachronic information: this associates a word or one of its senses with a particular period in the history of language (old-fashioned, obsolete, archaic, old use or dated); (2) diatopic information: this associates a word or one of its senses with a particular regional dialect or national variety (regional, dialect); (3) diaintegrative information: this associates a word or one of its senses with the dimension of integration into the native stock of words of a language (Latin, French, Italian); (4) diamedial information: this associates a word or one of its senses with a particular medium of communication (written, spoken); (5) diastratic information: this associates a word or one of its senses with a particular social group, consequently referring to sociolects, such as slang and different kinds of jargon (slang, vulgar, taboo); (6) diaphasic information: this associates a word or one of its senses with a particular register of a language (formal, informal);
Marjeta Vrbinc: University of Ljubljana, Faculty of Arts, Aškerčeva 2, 1000 Ljubljana, Slovenia, [email protected] https://doi.org/10.1515/9783110598650-013
216
Marjeta Vrbinc
(7) diatextual information: this associates a word or one of its senses with a particular discourse type or genre (poetic, literary); (8) diatechnical information: this associates a word or one of its senses with a particular subject field (mathematics, business, law, medicine); (9) diafrequent information: this associates a word or one of its senses with a particular frequency of occurrence (less frequent, rare); (10) diaevaluative information: this associates a word or one of its senses with a particular attitude or evaluation or the speaker’s mood (appreciative, derogatory, offensive, humorous, ironic, euphemistic); (11) dianormative information: this associates a word or one of its senses with a certain degree of deviation from a cultural standard (non-standard, substandard, disputed). This contribution is aimed at studying multiple labelling in a specialized phraseological dictionary to see which labels are often used in combination with one another. We also wanted to establish whether labels belonging to one and the same category combine with one another, or whether multiple labelling consists of labels from many categories of labels. Multiple labelling was studied because one single label represents one piece of information which a user may find easier to process than information provided by a string of two or more labels. It should be stressed that not all the labels listed in the dictionary analysed for the purposes of our study were taken into consideration (a more detailed treatment of the labels studied and those omitted is provided in the Methodology section). Labelling was studied with the intended user in mind, since it is the user who should benefit from diasystematic information. Therefore, suggestions were advanced for further improving labelling strategies in phraseological dictionaries, since labelling can still be considered an area of lexicography where more work is to be done (cf. Atkins/Rundell 2008: 496) if we want users to put their phraseological dictionary to good use. As for the terminology, we use the term ‘idiom’ as a superordinate and a hyponymic term for all phraseological units included in the Oxford Idioms Dictionary for Learners of English, regardless of the level of semantic opacity. It should be pointed out that dictionaries in the Anglo-American tradition mostly use ‘idiom’ without making any further typological classification of phraseological units (Moon 1998: 4).
2 Methodology This study examines multiple labelling in a British phraseological dictionary, i. e., Oxford Idioms Dictionary for Learners of English (OIDLE2). All the labels used in this dictionary are enumerated on the reverse of the front cover, and some, though not all, are explained. However, not all the labels included in the lists of labels were
The structure of label strings in a phraseological dictionary
217
taken into consideration; therefore, some criteria had to be defined as to which labels to exclude from our research. The group of labels expressing diatopic information was disregarded, because diatopic information refers to regional or dialectal variation, but our intention was not to focus on inter- or intravarietal peculiarities of English. All the other labels were taken into consideration on condition that they appeared in combination with other labels. It is necessary to point out that not all the labels listed in the front matter were found in combination with another label (i. e., figurative, sport, technical). Consequently, these labels were not included in the database used for the analysis of multiple labelling in phraseological dictionaries. Apart from the labels proper, the symbol exclamation mark within a triangle (hereafter represented by !) has the same force as a label, as is evident from the reverse of the front cover of the OIDLE2, where the following explanation can be found: “! indicates a word or a phrase that is likely to be thought offensive or shocking by many people”. This symbol can be regarded as a label expressing diastratic information; therefore, we included it in our research as one of the labels. The database was compiled by searching manually through the dictionary. Since the size of the dictionary is manageable, it was not necessary to select one or several letters to represent the material for our analysis, neither was a random choice of a page range needed. The entire dictionary was analysed, which means that all the idioms with multiple labelling were keyed into our database. Altogether, 392 idioms or their senses with two or more labels were found in the OIDLE2. The database is assessed as being sufficiently representative for us to be able to extract multiple labels used in the dictionary under investigation. The aim of our research is to find combinations of labels rather than to perform a statistical analysis of the frequency of combinations as opposed to the use of a single label only.
3 Results In the whole dictionary, the combination of four labels is used only once to mark one of the senses of the polysemous idiom tough/bad luck. Both senses of this idiom are labelled informal and sense two is additionally labelled ironic. In sense two, variant forms of the idiom are provided, i. e., tough shit, tough titty, which are labelled !, slang (further explanation of the problematic interpretation of these four labels can be found under Issues related to multiple labels). The combination of three labels is only slightly more frequent than the combination of four labels, but still rather infrequent. In the entire dictionary, only ten idioms with three labels were identified. The combinations of labels used to mark restrictions on the use of certain idioms are as follows: –– informal, old-fashioned, ironic (the best of luck (to sb)); –– informal, old-fashioned, humorous (the boys in blue and be mother);
218
–– –– –– –– –– –– ––
Marjeta Vrbinc
informal, old-fashioned, business (talk through your hat); humorous, formal, Latin (be compos mentis); humorous, formal, French (the crème de la crème); humorous, formal, disapproving (a/the prodigal son); humorous, literary, Latin (in flagrante (delicto)); humorous, old use, less frequent (Heaven forfend (that)); humorous, spoken, law (I rest my case).
In the OIDLE2, however, the majority of label combinations consist of two labels. The label informal is the most frequently used label (229 occurrences in double combinations), and it combines with nine other labels (humorous, old-fashioned, disapproving, spoken, saying, ironic, business, !, written). The second most frequent label humorous (114 occurrences in double combinations) combines with eleven labels (informal, old-fashioned, formal, saying, spoken, literary, ironic, Latin, French, disapproving, slang), with varying degrees of frequency of occurrence. In terms of frequency, old-fashioned occupies the third place with 102 occurrences, 98 of them being combinations. It combines with nine labels (informal, spoken, humorous, formal, saying, written, disapproving, slang, literary). The label spoken combines with other labels in 81 cases, 69 of these being double combinations. The most frequent combinations are those with informal, old-fashioned and humorous, while as many as five labels (!, slang, offensive, approving, disapproving) are used only once in combination with spoken. The labels informal, humorous, old-fashioned and spoken are the ones most commonly used. All other labels are used much less frequently. Among the pairs of labels that appear with greater frequency, the combination slang, !, with 43 occurrences, should be mentioned. All other combinations of two labels are rarely used: –– formal, written (4 occurrences); –– formal, Latin (3 occurrences); –– formal, literary (3 occurrences); –– ironic, saying (2 occurrences); –– written, French (2 occurrences). Some combinations, however, appear only once in the entire dictionary. For further details, see Table 1 instead of Table 6, which does not include the labels informal, humorous, old-fashioned and spoken in the left-hand column.
The structure of label strings in a phraseological dictionary
219
Table 1: Infrequent pairs of labels used in a double combination. Label combination disapproving
slang
!
formal
saying
Frequency informal old-fashioned humorous spoken formal offensive Italian
48 1 1 1 1 1 1
! spoken old-fashioned offensive humorous
43 1 1 1 1
slang informal spoken
43 2 1
humorous written old-fashioned literary Latin spoken disapproving French
6 4 4 3 3 2 1 1
informal humorous old-fashioned ironic politics French
7 7 2 2 1 1
Label combination
Frequency
ironic
spoken informal saying humorous
8 6 2 1
written
formal old-fashioned French informal
4 2 2 1
French
written saying humorous approving formal
2 1 1 1 1
Latin
formal humorous
3 1
literary
formal humorous old-fashioned
3 1 1
offensive
spoken slang disapproving
1 1 1
business
informal
2
4 Discussion 4.1 Issues related to multiple labels As has been established in the Results section, the maximum number of labels in the OIDLE2 is four, but the combination of four labels is extremely rare and can be found for only one idiom, i. e., tough/bad luck and its variants tough shit and tough titty. The treatment of this idiom is extremely problematic, because it is difficult to decipher
220
Marjeta Vrbinc
which label refers to which specific form of the idiom listed within sense 2. A close observation shows two possible interpretations: –– sense 2 of tough/bad luck is labelled informal, ironic, while its variants tough shit and tough titty are labelled !, slang; –– tough shit and tough titty are labelled informal, !, slang, ironic, that means using four labels. The question that can rightly be posed here is whether such complex labelling would be understood and correctly interpreted by a dictionary user. The problem begins with the label informal, which appears right after the lemma tough/bad luck. Theoretically, the scope of this label is clear: it refers to the entire dictionary entry, i. e., to both senses of this polysemous idiom. However, in practice, one may wonder whether a dictionary user would be aware of this. A possible solution would be to have two separate dictionary entries: i. e., tough/bad luck and tough shit/titty. Although the issue is not within the scope of this article, one cannot but point out the way the variant of the lemma is given: tough shit, tough titty. The use of the comma is misleading, since the intended dictionary user might incorrectly interpret it as indicating one idiom (tough shit, tough titty), rather than as two variants (tough shit and tough titty). It should not be forgotten that the primary dictionary users are non-native speakers of English who should be given clear guidance about the exact structure of the idiom in question, rather than ambiguous variants that allow multiple interpretations as regards structure. The combination of three labels is also infrequent, since only ten idioms with three labels were identified in the whole dictionary. With the exception of the idioms the boys in blue and be mother, which are both labelled informal, old-fashioned, humorous, all other combinations of three labels are unique, since a comparison of the triple combinations shows no repetition, which may be due to the lack of any template concerning triple labelling in the dictionary under investigation. In the idioms with a combination of three labels, humorous is the label found in as many as eight idioms, being followed by informal and old-fashioned, which are found in four cases, formal in three cases and Latin in two cases. All other labels found in a combination of three labels appear only once. This is in line with the general frequency of labels found in multiple combinations, since informal, humorous and old-fashioned occupy the first three places in terms of frequency. At the same time, it clearly shows that idioms are often used in informal and spoken language as opposed to more formal occasions and in written language. If we compare the frequency of the labels informal and spoken, on the one hand, and that of formal and written, on the other, we can see that the former far exceed the latter (315 and 36, respectively) in combinations of three or two labels. The analysis of double combinations shows that slang and ! combine in as many as 43 instances, which means that slang is used in combination with another label in only 4 cases, whereas ! is used in combination with another label in only 3 cases. The
The structure of label strings in a phraseological dictionary
221
front matter explanation for ! suggests that a lemma or one of its senses marked by ! is thought to be very offensive in a way that many people find shocking, whereas there is no explication in the front matter of the OIDLE2 for the label slang; however, this label normally marks items used in very informal spoken English by a small group of people. The reason may be sought in the type of vocabulary items treated in this specialized dictionary, since in very informal language, an idiom or one of its senses often has a very rude and/or offensive connotation.
4.2 Combinations of labels expressing different types of diasystematic information As far as the combinations go, it is to be expected that labels expressing different types of diasystematic information be combined, since it seems logical to provide the user with different types of information. This assumption is proved by studying the combinations of labels in the OIDLE2, which are as follows: Diaphasic information (formal, informal) is combined with: –– diaevaluative information (disapproving, humorous, ironic), –– diachronic information (old-fashioned), –– diamedial information (written, spoken), –– diaintegrative information (Latin, French), –– diatextual information (literary), –– diatechnical information (business), –– diastratic information (!), –– the “label” saying. Diastratic information (slang, !) is combined with: –– diaevaluative information (humorous), –– diamedial information (spoken), –– diachronic information (old-fashioned). Diaevaluative information (humorous, disapproving, ironic, offensive) is combined with: –– diachronic information (old-fashioned, old use), –– diatextual information (literary), –– diamedial information (spoken), –– diaintegrative information (Italian, Latin, French), –– the “label” saying.
222
Marjeta Vrbinc
Diachronic information (old-fashioned, old use) is combined with: –– diamedial information (spoken, written), –– diatextual information (literary), –– the “label” saying. Diamedial information (spoken, written) is combined with: –– diaintegrative information (French). The “label” saying is combined with: –– diatechnical information (politics), –– diaintegrative information (French). Interestingly, different labels expressing diaevaluative information and therefore belonging to the same group of labels can also be combined. The use of the label humorous, for instance, which is the second most frequently used label marking 119 idioms in the OIDLE2, suggests that it is diaevaluative information that idioms often convey. Apart from humorous, other labels expressing diaevaluative information (approving, disapproving, ironic, offensive) are used to label 78 idioms, which means that as many as 197 idioms assigned two or more labels tend to communicate diaevaluative information. Given the nature of idioms, i. e., expressing evaluation on the part of the speaker/writer, this finding is more than expected and corresponds to Moon’s findings (1998: 219, 223–225). This is also confirmed by the fact that of all the labels expressing different types of diasystematic information, the ones expressing diaevaluative information are most numerous, since as many as five labels (humorous, approving, disapproving, ironic, offensive) from this group are represented in this dictionary. Similarly, labels expressing diastratic information, i. e., slang and !, can also be combined. The groups of labels expressing diaevaluative and diastratic information are the only groups of labels whose members combine with one another (at least in our database). This is, however, not surprising, especially if we consider the labels expressing diaevalutive information, since this group comprises various labels, or more precisely, it is the most heterogeneous group, with labels expressing different types of evaluation. On the other hand, if we take the labels expressing diaphasic information, we can see that they are represented by the labels formal and informal and the diamedial information is marked by spoken and written. These labels are beyond doubt labels expressing opposing stylistic levels, thus being mutually incompatible. The same observation can be made in connection with the labels approving and disapproving, expressing diaevaluative information, which are also mutually exclusive, but can freely combine with other labels belonging to this group and still provide different types of information about the use of one particular lexical item labelled in this way. The same holds true for the labels old-fashioned and old use, marking diachronic lemmata or senses and belonging to the group of labels expressing diachronic information.
The structure of label strings in a phraseological dictionary
223
5 Conclusion Multiple labelling can be regarded as being difficult for an average dictionary user to comprehend and interpret correctly. This especially holds true for those cases of multiple labelling with several labels listed one after the other. The problem is even more aggravated if some labels appear in brackets and refer to variants of the lemma, or when some are found outside the brackets and refer to the lemma and/or to the variant(s) given. Information provided in the form of labels is very important and is especially significant when it refers to idioms, which are demanding for non-native speakers from the aspect of decoding and even more so from the aspect of encoding. This is why labels should be included in a way that would enable a dictionary user to interpret them appropriately and consequently to use the lemma correctly. For that purpose, it would be advisable not to list variants whose restrictions and connotations differ from those of a lemma as variant forms under the lemma but rather to include them in a dictionary as independent lemmata with their specific labelling needs. This should, however, be examined more exhaustively by conducting a user survey to gain better insight into users’ comprehension and interpretation of labels. In conclusion, the inclusion of diasystematic information largely depends on the type of dictionary and especially on its intended users. Therefore, lexicographers’ decisions about whether to use a label and how to use it appropriately should be based on the user profile, a recommendation which is also proposed by Ptaszynski (2010: 437). This is especially true of dictionaries intended for non-native speakers of a language, where one of the main functions is to promote the active use of a foreign language, in which case every single piece of information included in the dictionary counts.
Bibliography Monographs and articles Atkins, B. T. Sue/Rundell, Michael (2008): The Oxford Guide to Practical Lexicography. Oxford: Oxford University Press. Bergenholtz, Henning/Tarp, Sven (1995): Manual of Specialised Lexicography. The Preparation of Specialised Dictionaries. Amsterdam: Benjamins. Hausmann, Franz Josef (1977): Einführung in die Benutzung der neufranzösischen Wörterbücher. Tübingen: Niemeyer. Hausmann, Franz Josef (1989): Die Markierung in einem allgemeinen einsprachigen Wörterbuch: Eine Übersicht. In: Franz Josef Hausmann et al. (eds.): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. Erster Teilband. Berlin/New York: De Gruyter, 649–657. Moon, Rosamund (1998): Fixed Expressions and Idioms in English: A Corpus-Based Approach. Oxford: Clarendon Press.
224
Marjeta Vrbinc
Ptaszynski, Marcin Overgaard (2010): Theoretical Considerations for the Improvement of Usage Labelling in Dictionaries: A Combined Formal-Functional Approach. In: International Journal of Lexicography 23 (4), 411–442. Svensén, Bo (2009): A Handbook of Lexicography: The Theory and Practice of Dictionary-Making. Cambridge: Cambridge University Press.
Dictionaries OIDLE2 = Oxford Idioms Dictionary for Learners of English. Eds. Parkinson, Dilys, Francis, Ben. Oxford: Oxford University Press, 2nd ed., 2006.
Teil III: Wörterbuchstrukturen in der einsprachigen Lexikographie der slowenischen Standardsprache
Marko Snoj
Etymologie und Wörterbücher 1 Einleitung Moderne Etymologie beschäftigt sich mit der Ergründung des Ursprungs und der primären Bedeutung von Einheiten des Benennungssystems bzw. Lexikons einzelner Sprachen; es interessieren der Ursprung und die primäre Bedeutung von Sachund Eigennamen, Morphemen, opaken Wortverbindungen und phraseologischen Einheiten. In erster Linie bedient sich die Etymologie der vergleichenden Methode; diese ermöglicht u. a. die Rekonstruktion sprachlicher Einheiten und sprachlicher Systeme der vorgeschichtlichen Zeit. Für die etymologische Behandlung des zeitlich jüngeren Wortguts genügen manchmal, jedoch nicht immer, die Erkenntnisse der historischen Sprachwissenschaft. Die Etymologie ist zudem eine Disziplin, die stark interdisziplinär ausgerichtet ist, denn neben Erkenntnissen der Sprachwissenschaft berücksichtigt sie das Wissen vieler anderer Disziplinen, vorrangig solcher, die sich mit der materiellen und immateriellen Kultur befassen, die sich mit der menschlichen Beschreibung und Deutung der Welt auseinandersetzen und von Botanik bis zur Psychologie reichen.
2 Etymologie im slawischen Raum Alle wissenschaftlichen Erkenntnisse, darunter auch etymologische, sind im menschlichen Denken begründet und alle lassen sich mithilfe einer entsprechenden Methode interpretieren. Die etymologischen Erkenntnisse werden im slawischen Raum, und auf diesen bezieht sich der vorliegende Beitrag, seit dem 18. Jh. auch in Wörterbüchern dokumentiert. Als erstes slawisches etymologisches Wörterbuch kann das slowenische Glossarium Slavicum von Mönchpriester Marko Pohlin aus dem Jahr 1792 genannt werden. Die wissenschaftliche Beschäftigung mit der Etymologie, basierend auf der vergleichenden Methode von Sir William Jones (1746–1794), erfolgte jedoch zunächst in engeren Fachkreisen und in eng spezialisierten wissenschaftlichen Artikeln bzw. vergleichenden Grammatiken. Die lexikographische Darstellung etymologischer Erkenntnisse wurde somit zeitlich um ein ganzes Jahrhundert verschoben.
Marko Snoj: Inštitut za slovenski jezik Frana Ramovša ZRC SAZU, Novi trg 2, 1000 Ljubljana, Slovenija, [email protected] https://doi.org/10.1515/9783110598650-014
228
Marko Snoj
Etymologische Interpretationen einzelner Lexeme findet man in Wörterbüchern in einer größeren Anzahl erst seit dem Ende des 19. Jh.
2.1 Etymologische Wörterbücher im slawischen Raum Das erste derartige slawische Wörterbuch ist vorjunggrammatisches Etymologisches Wörterbuch der slavischen Sprachen (1886), verfasst vom Slowenen Franz Miklošič (Miklosich), dem Begründer der wissenschaftlichen Slawistik und einem ihrer bedeutendsten Vertreter im 19. Jh. Es folgten zwei unvollendete Wörterbücher: Slavisches etymologisches Wörterbuch (A–mor), herausgegeben zwischen 1908 und 1913 von Erich Berneker und Vergleichendes Wörterbuch der slavischen Sprachen von der aus Ptuj stammenden Slowenin Linda Sadnik und dem österreichischen Slawisten Rudolf Aitzetmüller aus dem Jahre 1975. Das Letztere verzeichnet nur die Lemmata unter den Buchstaben A und B. In der neuesten Zeit sind zwei etymologische lexikographische Werke kollektiver Autorschaft zu nennen: das von Franciszek Sławski im Jahr 1974 begründete und in Krakau herausgegebene Wörterbuch mit dem Titel Słownik prasłowiański [Urslawisches Wörterbuch], bisher bis zum Buchstaben G veröffentlicht, und das Этимологический словарь славянских языков [Etymologisches Wörterbuch der slawischen Sprachen], das in Moskau seit demselben Jahr erscheint, zwischen 1974 und 2002 unter der Redaktion von Oleg N. Trubachyov, seit 2002 unter der Redaktion von Anatolij Žuravljov. Bisher sind 40 Lieferungen dieses Wörterbuchs erschienen, die den urslawischen Wortschatz bis zum Lemma *pakъla behandeln. Die Etymologie der slawischen Sprachen behandelt zudem das Etymological Dictionary of the Slavic Inherited Lexicon von Rick Derksen aus dem Jahre 1996. Für die einzelnen slawischen Sprachen (mit der Ausnahme des Mazedonischen) existiert mindestens ein etymologisches Wörterbuch.1 Max Vasmer erarbeitete das Russische etymologische Wörterbuch (1950–1958; die zweite, auf Russisch übersetzte Auflage erschien zwischen 1964 und 1973, nachgedruckt 1986). Von Václav Machek stammt das tschechische Etymologický slovník jazyka českého [Etymologisches Wörterbuch der Tschechischen Sprache] aus dem Jahr 1968 (die erste Ausgabe aus dem Jahr 1957 trägt den Titel Etymologický slovník jazyka českého a slovenského); Petar Skok ist der Autor des kroatisch/serbischen etymologischen Wörterbuchs Etimologijski rječnik hrvatskoga ili srpskoga jezika [Etymologisches Wörterbuch der kroatischen oder serbischen Sprache], herausgegeben zwischen 1971 und 1974; Heinz Schuster-Šewc beschäftigte sich mit der Etymologie des Sorbischen
1 In der folgenden Aufzählung bleiben nichtwissenschaftliche etymologische Nachschlagewerke unberücksichtigt, so z. B. das russische Wörterbuch von A. G. Preobraženskij (1959) oder das bulgarische Wörterbuch von S. Mladenov (1941).
Etymologie und Wörterbücher
229
(Etymologisches Wörterbuch der Ober- und Niedersorbischen Sprache, 1978); unvollendet blieb das polnische etymologische Wörterbuch von Franciszek Sławsky aus den Jahren 1952 bis 1982 namens Słownik etymologiczny języka polskiego [Etymologisches Wörterbuch der polnischen Sprache]; Wiesław Boryś und Hanna Popowska-Taborska gaben das Słownik etymologiczny kaszubszczyzny [Etymologisches Wörterbuch des Kaschubischen] heraus (1994–2010). Unter kollektiver Autorschaft entstanden: Български етимлоичен речник [Bulgarisches etymologisches Wörterbuch], erscheint seit 1971 in Redaktion von V. I. Georgiev, I. Duridanov und T. Todorov; Этымалагічны слоўнк беларускай мовы [Etymologisches Wörterbuch der weißrussischen Sprache] erscheint seit 1978 in Redaktion von V. U. Martinau und G. A Cyhun; Етимологічний словник укранскої мови [Etymologisches Wörterbuch der ukrainischen Sprache], publiziert zwischen 1982 und 2012 in Redaktion von O. S. Mel’ničuk. Seit 2007 erscheint in Moskau das Русский этимологический словарь [Russisches etymologisches Wörterbuch] von A. E. Anikin, bisher sind zehn Bände erschienen. Im Rahmen der Tschechischen Akademie der Wissenschaften in Brno und unter der Leitung von Ilona Jynyšková wird seit 1989 das etymologische Wörterbuch des Altkirschenslawischen mit dem Titel Etymologický slovník jazyka staroslověnského [Etymologisches Wörterbuch der altslavischen Sprache] herausgegeben; bisher sind 18 Bände erschienen, einzelne Wörter (bis zum letzten Wort zakonъ) sind nach dem Lateinalphabet geordnet.2 Zu dieser Reihe zählt auch das slowenische Etimološki slovar slovenskega jezika [Etymologisches Wörterbuch der slowenischen Sprache] von France Bezlaj aus den Jahren 1976 bis 2007. Die erwähnten etymologischen Wörterbücher sind in ihrer Grundbestimmung Produkte wissenschaftlicher Arbeit, d. h., darin sind die zur jeweiligen Entstehungszeit bekannten etymologischen Erkenntnisse detailliert angeführt, entsprechend interpretiert und argumentiert. Sie behandeln nicht nur die Lexik der Standard- oder Schriftsprachen, sondern ebenso lediglich historisch oder dialektal belegte Wörter. So kann man annehmen, dass etymologische Daten in Wörterbüchern dieses Typs hauptsächlich nur für Sprachwissenschaftler (möglicherweise sogar nur für Experten im Bereich vergleichender bzw. historischer Sprachwissenschaft und Dialektologie) verständlich sind. Sodann kam es zur Idee, neuartige und aktualisierte etymologische Wörterbücher slawischer Sprachen herauszugeben. Diese sollten neuere etymologische Erkenntnisse und ebenso neuartige lexikographische Lösungen einbeziehen, die in der zweiten Hälfte des 20. Jh. durch die reiche wissenschaftliche und lexikographische Produktion bekannt geworden sind. Es handelt sich um Überlegungen, wie man etymologische Wörterbücher bestmöglich erstellen kann, wie man ein Wort oder eine
2 Vor diesem Wörterbuch konnte man etymologische Informationen zum Altkirchenslawischen nur dem etymologischen Kommentar zum Handwörterbuch zu den altkirchenslavischen Texten von Linda Sadnik und Rudolf Aitzetmüller aus dem Jahr 1955 entnehmen.
230
Marko Snoj
feste phraseologische Wortverbindung möglichst ausführlich, detailliert und relevant lexikographisch erfassen kann. Beispielhaft für solche Bestrebungen ist das serbische etymologische Wörterbuch Etimološki rečnik srpskog jezika [Etymologisches Wörterbuch der serbischen Sprache], seit 80er Jahre des 20. Jh. und in der Redaktion von Pavle Ivić (Leitung bis seinem Tod 1999), Jasna Vlajić-Popović, Aleksandar Loma, Marta Bjeletić, Ana Tešić und Željko Stepanović in Erarbeitung. Nach 35 Jahren gelang das Wörterbuch lediglich bis zum Buchstaben B, genauer Bj, was zur Folge hatte, dass die Herausgeber sich entschieden haben, zunächst ein weniger umfangreiches etymologisches Wörterbuch für breitere Benutzerkreise herauszugeben. Mit der serbischen Erfahrung vergleichbar ist das neue slowenische etymologische Wörterbuch von Metka Furlan (Novi etimološki slovar slovenskega jezika, 2013), wozu bisher nur ein Probeheft erschienen ist. Beide lexikographische Vorhaben können wir als qualitätsvoll, jedoch leider auch als unrealistisch einschätzen. Um der Realität näher zu bleiben, hat Furlan Entscheidung getroffen, kleinere thematisch begrenzte etymologische Hefte zum Slowenischen linguistischen Atlas herauszugeben.
2.2 Konzeptionen populärwissenschaftlicher etymologischer Wörterbücher im slawischen Raum Aufgrund des Interesses an Erkenntnissen der etymologischen Disziplin bei sprachwissenschaftlichen Laien entstand das Bedürfnis nach Konzeption populärwissenschaftlicher etymologischer Wörterbücher. Solche Wörterbücher gab es bereits für die meisten Sprachen im westlichen Teil Europas, z. B. das Wörterbuch von Friedrich Kluge für das Deutsche, von Terry F. Hoad für das Englische, von Albert Dauzat für das Französische und von Joan Corominas für das Spanische. Vergleichbare Produkte gibt es auch für slawische Sprachen. Geordnet nach dem Erscheinungsjahr werden hier folgende erwähnt: das von A. Gluhak erstellte Hrvatski etimološki rječnik [Kroatisches etymologisches Wörterbuch] aus dem Jahr 1993, das im selben Jahr von P. J. Černych herausgegebene Историко-этимологический словарь современного русского языка [Historisch-etymologisches Wörterbuch der russischen Gegenwartssprache], das von mir erarbeitete Slovenski etimološki slovar [Slowenisches etymologisches Wörterbuch] in mehreren Auflagen (1997, 22003, 32015 /Online-Publikation/,3 3 2016 /gedruckte Publikation/), das Český etymologický slovník [Tschechisches etymologisches Wörterbuch] (2001, 22012) von J. Rejzek, das Słownik etymologiczny języka polskiego [Etymologisches Wörterbuch der polnischen Sprache] (2005) von Wiesław Boryś, das Stručný etymologický slovník slovenčiny [Kurzgefasstes etymologisches Wörterbuch des Slowakischen] (2015) von L. Králik; hierzu zählen
3 Auch frei zugänglich auf dem slowenischen Wörterbuchportal Fran (www.fran.si.).
Etymologie und Wörterbücher
231
ebenso serbische und kroatische etymologische Wörterbücher, die zurzeit erarbeitet werden. Der Torso ist bisher das von A. Beńkowski zusammengefasstes Etymologiczny słownik języka polskiego [Etymologisches Wörterbuch der polnischen Sprache] geblieben, das im Jahr 2000 bis zum Buchstaben P erschienen ist. Etymologische Wörterbücher des populärwissenschaftlichen Typs basieren auf grundlegenden wissenschaftlichen Arbeiten und erfüllen Bedürfnisse durchschnittlich gebildeter Benutzer. Diesen Eigenschaften gerecht wären noch der in November 2016 erschienene erste Band des kroatischen Etimološki rječnik hrvatskoga jezika A–Nj [Etymologisches Wörterbuch der kroatischen Sprache A–Nj] der Autoren R. Matasović, T. Pronk, D. Ivšić und D. Brozović Rončević, und ebenso das kurz vor der Herausgabe stehende serbische etymologische Wörterbuch des oben erwähnten Autorenkollektivs. Die beiden letzterwähnten Wörterbücher sind nach meiner Ansicht zwischen die wissenschaftlichen und populärwissenschaftlichen Werke einzuordnen.
2.3 Etymologie in allgemeinen Wörterbüchern Durch den schnellen Wandel der Zeit verändern sich allerdings auch die Erwartungen durchschnittlicher Wörterbuchbenutzer. Diese suchen in einem erläuternden Wörterbuch u. a. auch nach Informationen über den Ursprung und die ursprüngliche Bedeutung einzelner Wörter. Die konzise Präsentation etymologischer Daten, die man im Duden, Webster, Petit Robert und in anderen Wörterbüchern im westlichen Teil Europas seit mehreren Jahrzehnten beobachten kann, bieten nur wenige Wörterbücher slawischer Sprachen. Wenn man das Slovensko-nemški slovar [Slowenisch-Deutsches Wörterbuch] (1894–1895) von Maks Pleteršnik und das kroatische allgemeine Großwörterbuch Rječnik hrvatskoga ili srpskoga jezika [Wörterbuch der kroatischen oder serbischen Sprache] (1880–1976) wegen weniger systematischer Anordnung etymologischer Daten außer Betracht lässt, gilt als erstes slawisches allgemeines Wörterbuch mit systematischen und überprüften etymologischen Daten das Толковый словарь русского языка [Erklärendes Wörterbuch der russischen Sprache] von S. I. Ožegov und N. J. Švedova aus dem Jahre 2009; die etymologischen Angaben hat L. V. Kurkina beigetragen. Das zweite dazugehörige Wörterbuch ist meines Erachtens das slowenische Wörterbuch Slovar novejšega besedja slovenskega jezika [Wörterbuch der neueren Lexik der slowenischen Sprache] aus dem Jahre 2013, welches den neueren slowenischen Wortschatz (ab 1991) verzeichnet und semantisch erklärt. Das dritte hier zu nennende Wörterbuch ist die 3. Ausgabe des slowenischen Allgemeinwörterbuchs Slovar slovenskega knjižnega jezika [Wörterbuch der slowenischen Standardsprache], welches seit dem 19. Oktober 2016 auf dem Wörterbuchportal Fran (www.fran.si) als wachsendes Wörterbuch frei zugänglich ist.
232
Marko Snoj
2.4 Etymologie im neuen Wörterbuch der slowenischen Standardsprache (Slovar slovenskega knjižnega jezika, SSKJ) Etymologische Angaben und Kommentare in allgemeinen einsprachigen Wörterbüchern sind üblicherweise kondensiert, transparente Wortbildungsprodukte sind in der Regel mit dem Verweis auf das motivierende Wort versehen. In der 3. Aufl. des Slovar slovenskega knjižnega jezika wird z. B. beim Wort bučka ‚Zucchino‘, i. e. Diminutivform von buča ‚Kürbis‘ auf das motivierende Wort buča verwiesen: ↑buča.
Abb. 1: Wörterbuchartikel zum Lemma buča in der 3. Ausg. des SSKJ (Fran).
Abb. 2: Wörterbuchartikel zum Lemma buča im slowenischen etymologischen Wörterbuch von Snoj (Fran).
Etymologie und Wörterbücher
233
Der Wörterbuchartikel zum Lemma buča (vgl. Abb. 1) enthält kondensierte etymologische Angaben (am Ende des Artikels unter dem Titel Etimologija). Ein (kompetenter) Wörterbuchbenutzer kann daran nachvollziehen, dass das slowenische Wort buča ursprünglich und semantisch dem kroatischen Wort buća gleicht und dass beide einem (alten) romanischen Idiom (von der Adriaküste) entstammen; dieses idiomspezifische Wort entwickelte sich regulär aus dem vulgärlateinischen Ausdruck buttia und dieses wiederum aus dem klassischlateinischen Wort buttis mit der Bedeutung ‚Fass‘. Möchte der Wörterbuchbenutzer mehrere und ausführlichere Informationen zur Etymologie des Wortes buča erfahren, so kann er mit dem Klick auf Več… (Mehr…) zum populärwissenschaftlich konzipierten slowenischen etymologischen Wörterbuch von Snoj gelangen. Wie die Abb. 2 zeigt, findet man dort viel mehr illustratives Material zur etymologischen Erläuterung des slowenischen Wortes buča; zudem wird auf andere verwandte Wörter verwiesen, die Polysemie wird leicht angezweifelt (vielleicht handelt es sich um Homonymie) und schließlich wird durch anklickbare Angaben auf die weiterführende Literatur verwiesen.
3 Fazit Abschließend will ich hervorheben, dass alle Typen von etymologischen Angaben in allgemeinen und speziellen etymologischen Wörterbüchern notwendig und vom Nutzen sind. Im Detail, am ausführlichsten und argumentiert sind etymologische Erkenntnisse zu einzelnen Wörtern in wissenschaftlichen Publikationen verzeichnet, während die Aufgabe von wissenschaftlich konzipierten etymologischen Wörterbüchern darin besteht, solche Erkenntnisse zu sammeln, zusammenzufassen und kritisch zu erörtern. Dies ermöglicht eine Übersicht über die Kontinuität der wissenschaftlichen etymologischen Forschung. Die Erarbeitung eines solchen Wörterbuchs ist jedoch zeitaufwendig und erfordert beträchtliche finanzielle und menschliche Ressourcen. Populärwissenschaftlich konzipierte etymologische Wörterbücher, die in der Regel gegenwartssprachlichen Wortschatz behandeln, können mit weniger Aufwand erarbeitet werden; dazu kommt, dass sie schneller auf neue wissenschaftliche Erkenntnisse reagieren können. Aus meiner eigenen Erfahrung als Lexikograph kann ich sagen, dass für die Erarbeitung der ersten Auflage des Slowenischen etymologischen Wörterbuchs drei Jahre (und 15 Jahre Vorarbeiten) notwendig waren, während die zweite und dritte Auflage durch laufende Ergänzungen viel schneller entstanden sind. Schließlich sind etymologische Daten in allgemeinen synchronen Wörterbüchern für jene Benutzer geeignet, die sich für allgemeine etymologische Gegebenheiten interessieren, etwa ob ein Wort einheimisch oder übernommen ist, was sein Ursprung ist und was es primär bedeutete.
234
Marko Snoj
Literatur Anikin, Aleksandr E. (2007–): Русский этимологический словарь. (Russisches etymologisches Wörterbuch). Moskva: Rukopisnye pamjatniki Drevnej Rusi. Beńkowski, Andrzej (2000–2014): Etymologiczny słownik języka polskiego. Warszawa: Wydawnictwo naukowe PAN. Berneker, Erich (1908–1913): Slavisches etymologisches Wörterbuch. Heidelberg: C. Winter’s Universitätsbuchhandlung. Bezlaj, France (1976–2007): Etimološki slovar slovenskega jezika. Ljubljana: Mladinska knjiga; Ljubljana, Založba ZRC. Bjeletić, Marta et al. (2003–): Etimološki rečnik srpskog jezika. Beograd: Srpska akademija nauka i umetnosti. Boryś, Wiesław/Popowska-Taborska, Hanna (1994–2010): Słownik etymologiczny kaszubszczyzny. Warszawa: Polska Akademia Nauk. Boryś, Wiesław (2005): Słownik etymologiczny języka polskiego. Kraków: Wydawnictwo Literackie. Černych, Pavel J. (1993): Историко-этимологический словарь современного русского языка. (Historisch-etymologisches Wörterbuch der russischen Gegenwartssprache). Moskva: Russkij jazyk. Dauzat, Albert/Dubois, Jean/Mitterand, Henri (1971): Nouveau dictionnaire étymologique et historique. Paris: Larousse. Derksen, Rick (1996): Etymological Dictionary of the Slavic Inherited Lexicon. Leiden, Boston: Bril. Furlan, Metka (2013–): Novi etimološki slovar slovenskega jezika. Ljubljana: Založba ZRC. Georgiev, Vladimir I. et al. (1971-): Български етимлоичен речник. (Bulgarisches etymologisches Wörterbuch). Sofija: Izdatelstvo na B’lgarskata akademija na naukite. Gluhak, Alemko (1993): Hrvatski etimološki rječnik. Zagreb: August Cesarec. Hoad, Terry F. (1986): The Oxford Concise Dictionary of English Etymology. Oxford: Clarendon Press. Králik, L’ubor (2015): Stručný etymologický slovník slovenčiny. Bratislava: VEDA. Kupcová, Helena/Jynyšková, Ilona (1989–): Etymologický slovník jazyka staroslověnského. Praha: Akademie věd České republiky; Brno: Tribun. Machek, Václav (1957): Etymologický slovník jazyka českého a slovenského. Praha: Československá akademie věd. Machek, Václav (1968): Etymologický slovník jazyka českého. Praha: Academia. Martinau, Viktar U./Cyhun, Genadz A. (1978–): Этымалагічны слоўнк беларускай мовы. (Etymologisches Wörterbuch der weißrussischen Sprache). Minsk: Navuka i tèhnika. Matasović, Ranko et al. (2016–): Etimološki rječnik hrvatskoga jezika. Zagreb: Institut za hrvatski jezik i jezikoslovlje. Mel’ničuk, Oleksandr S. (1982–2012): Етимологічний словник укранскої мови. (Etymologisches Wörterbuch der ukrainischen Sprache). Kyïv: Naukova dumka. Miklosich, Franz (1886): Etymologisches Wörterbuch der slavischen Sprachen. Wien: W. Braumüller. Mladenov, Stefan (1941): Етимологически и правописен речник на българския книжовен език. Sofija: Knigoizdatelstvo Hristo G. Danov. Ožegov, Sergej I./Švedova, Natal’ja J. (2009): Толковый словарь русского языка. (Erklärendes Wörterbuch der russischen Sprache). Moskva: A TEMP. Pleteršnik, Maks (1894–1895): Slovensko-nemški slovar. Ljubljana: Knezoškofijstvo. Pohlin, Marko (1792): Glossarium Slavicum. Wien: literis Grosserianis. Preobraženskij, Aleksandr G. (1959): Этимологический словарь русского языка. (Etymologisches Wörterbuch der russischen Sprache). Moskva: Gossudarstvenoe izdatel’stvo inostrannyx in nacional’nyx slovarej. Rejzek, Jiří (2001, 22012): Český etymologický slovník. Voznice: Leda.
Etymologie und Wörterbücher
235
Rječnik hrvatskoga ili srpskoga jezika (1880–1976). Zagreb: Jugoslavenska akademija znanosti i umjetnosti. Sadnik, Linda/Aitzetmüller, Rudolf (1975): Vergleichendes Wörterbuch der slavischen Sprachen. Wiesbaden: O. Harrassowitz. Schuster-Šewc, Hinz (1978–1989): Etymologisches Wörterbuch der Ober- und Niedersorbischen Sprache. Bautzen: Domowina. Skok, Petar (1971–1974): Etimologijski rječnik hrvatskoga ili srpskoga jezika. Zagreb: Jugoslavenska akademija znanosti i umjetnosti. Sławsky, Franciszek (1952–): Słownik etymologiczny języka polskiego. Kraków: Towarzystwo miłośników języka polskiego. Sławski, Franciszek (1974–): Słownik prasłowiański. Wrocław etc.: Ossolineum. Slovar slovenskega knjižnega jezika (2016). 3. Auflage. [Unter: ; letzter Zugriff 1. 2. 2017]. Snoj, Marko (1997; 22003; 32015, 2016): Slovenski etimološki slovar. Ljubljana: Mladinska knjiga, Modrijan, bzw. Založba ZRC. [Unter: ; letzter Zugriff 1. 2. 2017]. Vasmer, Max (1964–1973): Этимологический словарь русского языка. (Etymologisches Wörterbuch der russischen Sprache). Moskva: Progress. Vasmer, Max (1950–1958): Russisches etymologisches Wörterbuch. Heidelberg: C. Winter.
Nataša Jakop
The role and position of phraseological units in the General monolingual dictionary of Slovene: Macro- and microstructural aspects 1 General monolingual dictionary of Slovene The paper discusses some problems, dilemmas and open questions about lexicographical treatment of phraseological units in a general monolingual dictionary of Slovene which arise from practical work-experiences at making the third edition of Dictionary of the Slovene Standard Language. Dictionary of the Slovene Standard Language (SSKJ) is classified as an academic synchronic general monolingual dictionary.1 It gives a description and prescription of the Slovene standard language, so it establishes the linguistic norm. The first edition of the dictionary was made between 1970 and 1991; the second edition was updated, supplemented and published in 2014. Both, the first and second edition were first published in printed form and later converted to a digital form available at Fran portal.2 The third edition of SSKJ is preparing by the group of younger lexicographers in Lexicological Section of the Institute with a modernized methodology and technology on the basis of a corpus analysis of contemporary Slovene. It is based on the renewed dictionary concept (Koncept 2015).3 It is important to stress that the third edition is planned to be published primarily in digital form as a regular publication appearing once per year at Fran Portal (a growing dictionary). In October 2016 some first dictionary-entries were published (eSSKJ 2016).
1 The editor of the dictionary is Fran Ramovš Institute of the Slovenian Language at the Research Centre of the Slovenian Academy of Sciences and Arts. The institute was established in 1945 for the purpose of compiling linguistic materials and making some basic Slovenian language resources (http://isjfr.zrc-sazu.si/en#v). 2 www.fran.si. 3 The concept was confirmed by the session of the Scientific Council of the Institute of the Slovenian Language SRC SASA, by the Scientific Council of the Research Centre SASA, by the Class for philological and literary sciences at SASA and by the Executive Committee of the Presidency of SASA.
Nataša Jakop: Inštitut za slovenski jezik Frana Ramovša, Znanstvenoraziskovalni center Slovenske akademije znanosti in umetnosti, Novi trg 4, 1000 Ljubljana, Slovenija, [email protected] https://doi.org/10.1515/9783110598650-015
238
Nataša Jakop
1.1 The Fran portal The Fran portal, Dictionaries of the Fran Ramovš Institute of the Slovenian Language SRC SASA (Fran) at the moment brings together 32 dictionaries of different types: –– seven general dictionaries: monolingual dictionaries (first, second and third edition of Dictionary of the Slovene Standard Language, Dictionary of New Slovenian Words), Slovene orthography (Slovenian Normative Guide), specialized growing dictionaries (Dictionary of Slovene Orthographical Difficulties, Dictionary of the Slovenian Language); –– phraseological dictionary (Dictionary of Slovenian Phrasemes); –– two etymological dictionaries (Slovenian Etymological Dictionary, New Etymological Dictionary of Slovenian Language); –– five historical dictionaries (Dictionary of Maks Pleteršnik, Dictionary of the Old Slovenian Literary Language of Prekmurje, Dictionary of Kastelec and Vorenc, Dictionary of the Slovenian Language in the Works of J. Svetokriški, Words of the 16th-Century Slovenian Literary Language); –– thirteen terminological dictionaries (Terminological Dictionary of Urban Planning, Dictionary of Percussion Terminology, Dictionary of Applied Art Terminology, Terminological Dictionary of Automatic Control, Systems and Robotics, Botanical Terminological Dictionary, Pharmaceutical Terminological Dictionary, Dictionary of Theatre Terminology, Dictionary of Beekeeping Terminology, Geological Terminological Dictionary, Gemmological Terminological Dictionary, Geographical Terminological Dictionary, Dictionary of Mountaineering Terminology, Slovenian Skiing Dictionary); –– four dialectal dictionaries (Dictionary of the Črnovrško Dialect, Dictionary of the Local Dialects of Zadrečka dolina, Dictionary of the Bovško Local Dialect, Dictionary of the Kostelsko Dialect) and Slovene Linguistic Atlas (first and second volume which contains the vocabulary from the fields of human body, diseases, family and farm). The portal also offers language and terminological counseling. At the moment, Fran has together more than half million dictionary-entries (593.707). It is user-friendly and supports simple and advanced search, so it is possible to search in all dictionaries at the same time or just in the selected dictionary or dictionaries. For example, if we search for the word mačka ‘cat’ Fran has 19 dictionary-entries mačka in 16 different dictionaries; the word mačka is also more than 530-times part of different structure elements within a dictionary-article, for example in definitions, examples, as syn-
The role and position of phraseological units
239
onyms, etc.4 If we search for example only in the Slovenian Etymological Dictionary there are three dictionary-entries with word mačka: mačka, morska mačka, zamorska mačka.5
2 Phraseological units in a general monolingual dictionary It seems that all human languages have phraseology because of the natural tendency for metaphorical expression (Makkai 1978). The phraseology is a remarkable language phenomenon both on a structural and semantic level because of their syntactic and semantic anomalous features (Čermák 1985). Phraseological units are multi-word expressions which are relatively fixed in form, but not always completely fixed (we talk about phraseological variants). Most of them have an idiomatic phraseological meaning, but the degree of their idiomaticity range from more or less transparent to completely opaque. Some of them also convey pragmatic meanings which are contextual and culturally-bounded, for example greetings, thanks, apologies, requests. However, phraseological units are a constituent part of a human vocabulary, a lexicon, they are reproducible and lexicalized. Therefore, phraseological units are a significant part of an explanatory type of dictionary where they should be appropriately treated and presented. What does it mean appropriately? It is very difficult to answer this question (Kržišnik 2009). But throughout the paper I would like to demonstrate the importance of the idea that the phraseology as a group of complex and varied types of lexical items need a well-defined theoretical and methodological framework for a consistent lexicographical work within a general monolingual dictionary which is, frankly speaking, primarily focused on non-phraseological lexical items.
2.1 Phraseographical questioning When we talk about phraseology in a general monolingual dictionary a lexicographer or better, a lexicographical team should deal with three interrelated macro- and micro-structural topics (Kržišnik/Jakop 2015). The first one is about the pre-selection and selection of phraseological material for inclusion into the dictionary. In Slovene as well as in other European languages exists
4 See , and click the blue and green circles in the segment Everything on Fran. 5 See .
240
Nataša Jakop
the whole range of different types of phraseological units, from minimal phraseological units (for example clitic word forms) and more or less lexicalized phraseological comparisons to paremiological units (for example proverbs) and phraseological dialogs (some types of pragmatic idioms). However, the crucial conceptual lexicographical decision is which types of phraseological units to include in a dictionary and which not (phraseology in broad or narrow sense), what kind of language resources do we have and need, what is the proportion between standard or nonstandard language, between written and spoken language etc. Several objective criteria are needed to ensure consistency in a lexicographical practice. The second question is about the placement of phraseological units within a dictionary. The tradition of many general monolingual dictionaries is that phraseology usually has a subordinate position in the structure of a dictionary, i. e. that phraseological units are not entry-words; regularly we find them at the end, at the bottom of dictionary-articles. So, the question here is how to provide a dictionary-structure with relatively self-sufficient phraseological subsystem integrated to dictionary’s entry-words, which phraseological components are connected to the main dictionary-entries. The third question is about the representation of phraseological units in a dictionary, i. e. the arrangement within the dictionary-entry, occurrence of phraseological variants and synonyms, description of phraseological units, illustration of their usage, etc. Slovene phraseographical practice on this field is not established yet and in this respect also the Dictionary of Slovenian Phrasemes (2011) was criticized (Konicka 2012, Jesenšek 2013). Therefore, this set of questions represents some serious challenges in making third edition of SSKJ.6
2.2 Phraseology in the third edition of SSKJ In the third edition of SSKJ we devote to phraseology a comprehensive lexicographical treatment within a specialized phraseological section named Phraseology. The section Phraseology brings phraseology in a broad sense, so the phraseological and paremiological units used in standard Slovene. The selection is established on several criteria and one of the main criteria is the minimal frequency rule, i. e. the phraseological unit must be in use in contemporary Slovene and its usage must be confirmed in text corpora. We mainly use data from the corpus Gigafida and corpus Kres which
6 First and second edition of SSKJ otherwise provide a special phraseological and terminological section, but the realization of phraseology in the dictionary was strongly criticized precisely because of low-level phraseographical principles that were applied by a dictionary concept and a lexicographical team.
The role and position of phraseological units
241
are our main language sources of written language material for the dictionary.7 So, phraseology in the dictionary is primarily corpus-based. Despite a multi-word structure of phraseological units it is frequently very difficult, complicated and time consuming to get phraseological lemma out of a corpus (with more or less automatized extraction). For example, in corpus Gigafida there are more than 35 000 and in corpus Kres more than 4 400 concordances of lemma mačka (cat). With the help of a corpora tool Sketch Engine, we can get many of possible candidates of Slovene phraseological components, i. e. words which are in a relatively fixed relation with a noun mačka and which may form a phraseological unit, for example a conjunction kot (as) for extraction of possible phraseological comparisons: biti kot mačka, hoditi kot mačka, vrteti se kot mačka, poigravati se kot mačka, igrati se kot mačka, presti kot mačka, videti kot mačka, pretegniti se kot mačka. The lexicographer concentrates also to noun and verb candidates, for example pes, miš, živeti, igrati, gledati etc. But there are too many and we quickly lose yourself in a mass of material. So, it is important to focus on a potential phraseological core (Gantar 2007: 37, 49–51) – that is the more or less fixed piece of structure in language which could be a fragment of phraseological unit. But, of course, the Sketch Engine not necessarily detects phraseological units, especially units up to sentence level, where we combine corpus methodology with target data from other resources and researches.8 The section Phraseology brings various types of phraseological units and their variants: from minimal phraseological units (lomiti ga ‘to do foolish things, to make mistakes’), all types of phraseological units which function in different part of speech (i. e. as a noun, verb, adjective, adverb, for example igra mačke z mišjo / igra mačke in miši ‘a showing, an expression of superiority over someone; cruel treatment to someone’)9 up to pragmatic idioms (Kaj pizdiš! / Kaj pizdiš? ‘it expresses an angry, annoyed response of a speaker to a resentment of somebody’) and paremiological units (Ko mačke ni doma, miši plešejo. / Kadar mačke ni doma, miši plešejo. / Če mačke ni doma,
7 Corpus Gigafida consists of more than one billion words and presents the collection of authentic Slovene written texts of various genres (newspapers, and magazines, literature, textbooks, web pages, transcriptions of parliamentary debates and similar (http://www.gigafida.net/Support/About). The Gigafida is the biggest Slovene corpus but is not balanced in language resources. On the other hand, the corpus Kres which was sampled from the Gigafida is smaller; it contains almost 100 million words but is balanced in its genre structure (http://www.korpus-kres.net/Support/About). 8 There are some interesting contemporary studies in the field of paremiology (Jesenšek/Babič 2014, Lipavic Oštir 2014, Fabčič/Bernjak 2014, Meterc 2017). 9 Preposition and conjunction phraseological units don’t have lexical or phraseological meaning because they express only syntactical relations between words and phrases and they also don’t have expressive functions which are characteristic for phraseology, therefore they need more grammatical than semantical description; in the third edition of SSKJ they are positioned and treated in the section Fixed multiword expressions which describes terminological and non-phraseological multiword expressions.
242
Nataša Jakop
miši plešejo. ‘it expresses that in the absence of authority things happen that would otherwise not be allowed’). The organisation of the section Phraseology is based on syntactic and alphabetical order in a combination. Syntactically speaking, there are two main groups of phraseological units: the first one is below sentence level and the second one is up to sentence level, which is formally reflected in the capitalization of phraseological units: units up to sentence level begins with a capital letter and end with a punctuation mark. Within these two groups phraseological units are sorted alphabetically on the first component of a phraseological lemma:10 Multiword expressions: divja mačka, morska mačka, norveška gozdna mačka, perzijska mačka, sabljastozoba mačka, siamska mačka, velika mačka, zamorska mačka, zelena zamorska mačka; Phraseology: biti kot pes in mačka, gledati se kot pes in mačka, hoditi kot mačka okrog vrele kaše, igra mačke z mišjo, igrati se mačke in miši, igrati se s kom kot mačka z mišjo, kot bi komu mačka snedla jezik, prenašati koga, kaj kot mačka mlade, presti kot mačka, Črne mačke prinašajo nesrečo., Ko mačke ni doma, miši plešejo., Ko mački stopiš na rep, zacvili., Mačka miško, miš pšeničko., Mačke imajo devet življenj., Ni pomembno, kakšne barve je mačka, pomembno je, da lovi miši.
Searching and finding of phraseological units in a dictionary could be sometimes quite challenging for a dictionary user. Therefore, phraseological units in the third edition of SSKJ are displayed in the section Phraseology in all dictionary-entries where an autosemantic word represents a phraseological component, for example the phraseological unit gledati se kot pes in mačka is displayed in the section Phraseology of dictionary-entries mačka, pes, and gledati. Maybe it sounds weird and looks redundant, but the digital medium enables that simple solution and we don’t need to economize the representation of phraseology just because of technical reasons. That doesn’t mean double work for lexicographers. The point is in a lexical database in the Ilex program which works in the background. The micro-structural elements of section Phraseology are structured on the same principles as main dictionary-entries with the aim to represent and semantically describe a current phraseological inventory of Slovene standard. The information is mostly the same type as it is used for other lexical items in the dictionary. A user will get the following language data about Slovene phraseological units: a phraseological or paremiological lemma, possible phraseological and paremiological variants, definition of phraseological and paremiological units (their phraseological meaning or meanings), information about their expressive or stylistic features (labels about their particular attitude or appropriateness in a particular situation, for example: if a phra-
10 See http://fran.si/iskanje?View=1&Query=ma%C4%8Dka&FilteredDictionaryIds=201.
The role and position of phraseological units
243
seological unit or its meaning is used ironically, vulgarly, etc.), significant restrictions in use and examples from corpora (see Fig. 1). Despite the variability of many phraseological units sometimes a lexicographer has difficulties in a determination of the phraseological lemma (the main variant used in the Slovene standard) and in a dividing between phraseological variants and synonyms. For example držati komu štango (approx. 298 concordances in Gigafida), držati komu vrečo (approx. 197 concordances in Gigafida), držati komu svečo (approx. 165 concordances in Gigafida), držati komu lestev (approx. 45 concordances in Gigafida), držati komu lojtro (approx. 5 concordances in Gigafida). In such cases it is crucial to check the lexicalization of phraseological units in dictionaries. According to the first and second edition of SSKJ and Dictionary of Slovenian Phrasemes these units have slightly different meanings, so for the further analysis we can presuppose they are not just simple phraseological variants. držati komu lestev ‘to help somebody to do something bad’ držati vrečo ‘to participate in theft, robbery’ držati komu štango ‘to protect somebody, to support somebody in his usual negative performance, handling’
But the final results can be made only on the basis of corpus analyses at the semantic level.
Frazeološka enota phraseological variants
phraseological hoditi kot mačka okrog vrele kaše lemma vrteti se kot mačka okoli vrele kaše hoditi kot mačka okoli vrele kaše vrteti se kot mačka okrog vrele kaše hoditi kot maček okrog vrele kaše vrteti se kot maček okrog vrele kaše hoditi kot maček okoli vrele kaše vrteti se okoli koga, česa kot mačka okoli vrele kaše STRNJENI PRIKAZ: hoditi/vrteti se (okoli/okrog koga, česa) kot mačka/maček okrog/okoli vrele kaše consise display of phraseological unit obotavljati se; izmikati se kočljivi, občutljivi temi, neprijetnostim; previdno, z obotavljanjem pristopati h komu definition
examples
Da ne bi hodili kot mačka okrog vrele kaše, pojdimo k bistvu. Če nekaj postane večna tema, okoli katere se vrtim kot mačka okrog vrele kaše, potem je nikoli ne bom načela. Naveličali se boste hoditi kot maček okoli vrele kaše in z vsemi argumenti stopili v napad. Nekdo se bo okoli vas vrtel kot mačka okoli vrele kaše. Mislim, da ni treba, da se okoli teh zadev vrtimo kot mačka okoli vrele kaše. Treba je zadevo jasno povedati.
Fig. 1: Micro-structural elements in the section Phraseology.
244
Nataša Jakop
3 Conclusion Brief answers to three phraseographical questions within the third edition of SSKJ could be summed up. The selection of phraseological material for the dictionary is corpus-based. The third edition of SSKJ brings all types of phraseological units used in standard Slovene and they are placed in two specialized sections: Phraseology (noun, verb, adverbial, adjective, interjection, particle phraseological units, paremiological units) and Fixed multiword expressions (proposition and conjunctional phraseological units). Phraseological units are alphabetically arranged within two main groups, phraseological variants are listed by frequency of usage data. All phraseological units in the general monolingual dictionary are equipped with a definition (phraseological meanings) and examples. Simple incorporation of phraseological units within dictionary-entries enables user friendly searching of Slovene phraseology.
Literature Monographs and articles Čermák, František (1985): Frazeologie a idiomatika. In: Filipec, Josef/Čermák, František: Česká lexikologie. Praga: Akademia, 166–236. Fabčič, Melanija/Bernjak, Elizabeta (2014): Frazemi in pregovori v stiku. Kulturološki in semantično-pragmatični vidiki. Maribor: Filozofska fakulteta, Oddelek za germanistiko. Gantar, Polona (2007): Stalne besedne zveze v slovenščini: korpusni pristop. Ljubljana: Založba ZRC, ZRC SAZU. Jesenšek, Vida (2013): O medjezikovnih frazeoloških razmerjih. In: Jakop, Nataša et al. (eds.): Frazeološka simfonija: sodobni pogledi na frazeologijo. Ljubljana: Založba ZRC, 209–222. Jesenšek, Vida/Babič, Saša (eds.) (2014): Več glav več ve. Frazeologija in paremiologija v slovarju in vsakdanji rabi = Zwei Köpfe wissen mehr als einer. Phraseologie und Parömiologie im Wörterbuch und Alltag = Two heads are better than one. Phraseology and paremiology in dictionaries and in everyday use. Maribor, Ljubljana: Oddelek za germanistiko, Filozofska fakulteta; Inštitut za slovensko narodopisje ZRC SAZU. Koncept novega slovarja slovenskega knjižnega jezika: elektronska knjiga (2015). Ljubljana: Inštitut za slovenski jezik Frana Ramovša ZRC SAZU. [; last access: 21 February 2017]. Konicka, Jelena (2012): Prvi slovenski frazeološki slovar. In: Jezikoslovni zapiski 18/2, 169–185. Kržišnik, Erika (2009): Kam in kako s frazeologijo v novem slovarju. In: Perdih, Andrej (ed.): Strokovni posvet o novem slovarju slovenskega jezika. Ljubljana: Založba ZRC, ZRC SAZU, 53–60. Kržišnik, Erika/Jakop, Nataša (2015): Konceptualna izhodišča za vključitev frazeologije v splošni enojezični slovar slovenskega jezika. In: Smolej, Mojca (ed.): Slovnica in slovar – aktualni jezikovni opis (1. del). Ljubljana: Univerza v Ljubljani, Filozofska fakulteta, 417–424. Lipavic Oštir, Alja (2014): Nemški in slovenski pregovori. Sociolingvistični vidiki. Maribor: Filozofska fakulteta, Oddelek za germanistiko.
The role and position of phraseological units
245
Makkai, Adam (1978): Idiomaticity as a Language Universal. In: Joseph H. Greenberg, Charles A. Ferguson, Edith A. Moravcsik (eds.): Universals of Language III. Stanford University Press, 401–448. Meterc, Matej (2017): Paremiološki optimum: najbolj poznani in pogosti pregovori ter sorodne paremije v slovenščini. Ljubljana: Založba ZRC, ZRC SAZU.
Dictionaries Fran = Fran portal, slovarji Inštituta za slovenski jezik Frana Ramovša ZRC SAZU. [; last access: 21 February 2017]. Gigafida = Korpus Gigafida. [; last access: 21 February 2017]. Kres = Korpus Kres. [; last access: 21 February 2017]. eSSKJ = Slovar slovenskega knjižnega jezika: elektronska objava tretje izdaje. Rastoči slovar. Ljubljana: Inštitut za slovenski jezik Frana Ramovša ZRC SAZU. 2016. [; last access: 21 February 2017].
Simona Štavbar
Wie lässt sich die lexikographische Terminologie darstellen? 1 Gründe für die lexikographische Beschreibung der lexikographischen Terminologie Es gibt mehrere Gründe, warum die lexikographische Beschreibung der lexikographischen Terminologie, etwa in Form eines elektronischen Wörterbuchs, in Slowenien benötigt wird. Im slowenischen Raum gibt es derzeit keine lexikographischen Produkte (Fachwörterbücher, Datenbanken, Glossare usw.), in denen die lexikographische Terminologie entsprechend gesammelt, beschrieben, kommentiert und einem Benutzer zugänglich wäre. Es gibt auch keine Lehrwerke für Studierende zum genannten Themenbereich. Dazu kommt, dass manche slowenischen Fachausdrücke im Bereich der lexikographischen Disziplin als hochgradig synonym eingestuft werden können1 und dass man relativ viele terminologische Lücken feststellen muss.2 Das heißt, dass die slowenische lexikographische Fachsprache (etwa im Vergleich zum Deutschen) weniger standardisiert und unvollständig ist. Um diese ungünstigen Defizite zu beheben, d. h. die Terminologie zu vereinheitlichen, die fehlenden Termini einzuführen und diese zu standardisieren, ist es zunächst notwendig, eine lexikographietheoretische Grundlage festzulegen. Es scheint angebracht, von der funktionstheoretischen Basis auszugehen, d. h. das lexikographische terminologische System von Herbert Ernst Wiegand als Ausgangspunkt zu nehmen und auf dieser Grundlage für die systematische Ausarbeitung und Standardisierung der slowenischen lexikographischen Terminologie zu sorgen.3
1 Mehr zur synonymen Verwendung der lexikographischen Termini im Slowenischen in Štavbar (2015: 753–754). In einigen Fällen lassen sich sogar mehrere synonyme Varianten eines lexikographischen Terminus verzeichnen. 2 Die fehlenden lexikographischen Termini im Slowenischen sind nicht nur auf die einzelnen Teilbereiche der lexikographischen Disziplin beschränkt, vgl. hierzu Štavbar (ebenda; 2016a: 243–245); als problematisch erweisen sich zudem Definitionen einzelner Ausdrücke, was anhand der bestehenden Wörterbücher leicht nachvollziehbar ist. 3 Ohne eine theoretische Grundlage ist keine systematische Terminologie möglich. Dies lässt sich am Wörterbuch zur Lexikographie und Wörterbuchforschung (2010) beobachten, wo die lexikographische
Simona Štavbar: Borštnikova 86, 2000 Maribor, Slovenija, [email protected] https://doi.org/10.1515/9783110598650-016
248
Simona Štavbar
Terminologische Festlegungen samt entsprechender lexikographischer Darstellung erscheinen notwendig und wichtig, da besonders bei den slowenischen Fachwörterbüchern eine fundierte theoretische Basis oft vermisst wird oder diese nicht gründlich durchdacht ist.4 Die Konzeption und Erarbeitung einer spezialisierten lexikographischen Ressource (Datenbank und datenbankbasiertes elektronisches Wörterbuch, basierend auf der deutschen Ausgangsterminologie mit slowenischen und englischen Äquivalenten) werden im Folgenden kurz behandelt.
2 Funktionstheorie als Basis für die Erarbeitung eines elektronischen Fachwörterbuchs Das Modell zu einem elektronischen Fachwörterbuch basiert auf der Funktionstheorie (Tarp 2008; 2009; 2010). Diese geht von spezifischen Benutzertypen und bestimmten Benutzersituationen aus. Zwei Funktionen stehen im Vordergrund: die kommunikative Funktion (Textbildung, Textüberprüfung und Übersetzung) und die kognitive Funktion (Erwerb der lexikographischen Terminologie und des spezifischen lexikographischen Wissens) (vgl. Tarp 2008: 84–86). Das Wörterbuch der lexikographischen Terminologie wird auf der Basis dieser Überlegungen ein Konsultations- und zugleich ein Lernwörterbuch. Es soll Folgendes unterstützen: –– das Verstehen einzelner (deutscher) lexikographischer Termini, terminologischer Wortverbindungen, Synonyme und Kollokationen in Fachtexten zur lexikographischen Theorie und Praxis, –– den Erwerb der lexikographischen Terminologie und folglich den Ausbau spezifischer lexikographischer Kompetenzen, –– die Produktion von lexikographischen und linguistischen Texten mit lexikographischer Terminologie und –– das Übersetzen von lexikographischen und linguistischen Texten ins Deutsche, Englische oder Slowenische. Nach Bergenholtz/Kaufmann (1997: 99–102) ist es wichtig, dass man zwischen unterschiedlichen Benutzern differenziert und somit zwischen Experten, Semi-Experten und Laien unterscheidet. Kompetenzniveaus dieser drei Gruppen verweisen auf die lexikographisch relevanten Benutzerbedürfnisse und bieten somit eine Basis für das Bestimmen der Funktionalität des geplanten Wörterbuchs. Wenn wir diese Einteilung auf Benutzergruppen auf diejenigen applizieren, die potenziell das Wörterbuch der
Terminologie im Deutschen den Ausgangspunkt für die Bildung der lexikographischen Terminologie in weiteren Sprachen darstellt. 4 Vgl. die Analyse von slowenischen Fachwörterbüchern in Štavbar (2016b).
Wie lässt sich die lexikographische Terminologie darstellen?
249
lexikographischen Terminologie konsultieren werden, dann kann man sie grob in folgende Gruppen aufteilen: –– Laien (z. B. Studierende), aber auch diejenigen, die als potenzielle Benutzer kein (Vor)wissen über die lexikographische Terminologie haben oder nur über Grundwissen verfügen und die lexikographische Terminologie während einer Ausbildung erst erlernen. Hier handelt es sich um eine Population, die die Kenntnis der lexikographischen Terminologie erst erwerben will; –– Semi-Experten (z. B. Übersetzer metalexikographischer Texte und Texte mit lexikographischer Terminologie, Sprachwissenschaftler oder Lehrende der betreffenden Studiengänge), die man von der vorigen Gruppe trennen soll, da ihr Fachwissen auf einem höheren Niveau angesiedelt ist. Hierzu zählt man vor allem Experten der benachbarten sprachwissenschaftlichen Fachgebiete und auch diejenigen, die mit der lexikographischen Terminologie und mit der Lexikographie im unmittelbaren Kontakt stehen (z. B. Informatiker und andere, die sich mit der Sprachtechnologie beschäftigen; –– Experten, die lexikographisch ausgebildet sind und die sich mit der lexikographischen Terminologie und mit der Lexikographie regelmäßig beschäftigen. Dazu gehören vor allem Lexikographen und Wörterbuchforscher. Angeführte Benutzergruppen verfügen über unterschiedliche fachliche und sprachliche Kompetenzen sowie über Kompetenzen, die für die Textproduktion und für das Übersetzen von lexikographischen Fachtexten (vgl. die oben angegebenen Funktionen) wichtig sind. Aus diesem Grund soll das Wörterbuch Daten enthalten, die den Benutzer immer dann unterstützen, wenn seine Kompetenzen nicht ausreichen.5
3 Die Datenbank für das Deutsche Die Datenbank unterscheidet sich vom Wörterbuch dadurch, dass sie nur als Speicherungssystem für spezifische Arten von Daten dient, z. B. für Übersetzungsäquivalente, Synonyme, Kollokationen usw., anhand derer ein Wörterbuch erarbeitet bzw. vorbereitet wird.6 In Bezug auf die genannten Benutzertypen (Experten, Semi-Experten, 5 Benutzerkompetenzen lassen sich erkennen, wenn man Profile von Benutzern ansetzt, was man auf unterschiedliche Art machen kann. Tarp (2010: 52) schlägt vor, dass einer der Wege, wie man die im Wörterbuch benötigten Daten bestimmen kann, der ist, dass man die Kompetenzen der Benutzerzielgruppe durch die Beantwortung von gezielten Fragen ermittelt. Die gewonnenen Antworten ermöglichen, dass man ins Wörterbuch der lexikographischen Terminologie nur die Daten integriert, die mit der mangelnden Kompetenz der Benutzer in Verbindung stehen. 6 Zudem ist die Datenbank Bestandteil der dreiteiligen Struktur eines elektronischen Wörterbuchs, das sich in der Regel aus der lexikographischen Datenbank, der Benutzeroberfläche und der Suchmaschine zusammensetzt.
250
Simona Štavbar
Laien) werden in der Phase der Vorbereitung des Wörterbuchs unterschiedliche Arten von Daten ausgewählt, die in die Datenbank integriert werden.7 Die Datenbank wird folgende Arten von Daten enthalten und ein Auszug aus dieser wird so präsentiert, dass auf die Benutzerbedürfnisse in spezifischen Benutzersituationen, die entweder kognitiv oder kommunikativ sind, eingegangen wird. Für das Deutsche wird Folgendes eingeschlossen: –– Lemmazeichengestaltangabe –– morphologisch-syntaktische Angabe –– orthographische Angabe –– Angabe über orthographische Varianten –– Angabe über morphologische Varianten –– Definitionsangabe –– Kollokationsangabe –– Beispielangabe (Belegbeispielangabe bzw. Kompetenzbeispielangabe) –– Synonymenangabe (adressiert an die Lemmazeichengestaltangabe) –– Übersetzungsäquivalentangabe (Englisch, Slowenisch) –– Wortbildungsangabe (adressiert an die entsprechende Lemmazeichengestaltangabe) –– Belegstellenangabe (zitierte Quellen und/oder Link auf die elektronische Quelle) –– pragmatische Angabe (adressiert an die Lemmazeichengestaltangabe) –– Verweisangabe/Link (zur Lemmazeichengestaltangabe, zu den entsprechenden Daten). Die angeführten Angabentypen sind Bestandteil des jeweiligen Wörterbuchartikels. Welche davon bei der Suche auf der Bildoberfläche angezeigt werden, hängt von der wählbaren Suchoption des Benutzers bzw. auch von der jeweiligen Funktion ab (kognitive bzw. kommunikative). Die Auswahl der Termini und entsprechender Daten beruht auf dem Prinzip der Relevanz. Das Kriterium der Relevanz verlangt das Ein-
7 Um das gewähren zu können, ist zuerst eine systematische Klassifikation des Fachgebiets bzw. des Gegenstands nötig – in diesem Fall der Lexikographie. Die hier eingesetzte Klassifikation beruht auf der von Svensén vorgeschlagenen Klassifikation (vgl. 2009) und wurde abgeändert für die Zwecke der Erarbeitung dieses Fachwörterbuchs der Lexikographie angewandt. Durch die Klassifikation kann sichergestellt werden, dass die Datenbank nur das metalexikographische Material und kein anderes Material enthält. Die angeführte Klassifikation ist eine Darstellung, wie man das Fachgebiet der Lexikographie für die Zwecke der Auswahl der Texte und der lexikographischen Terminologie (also für die terminologische Klassifikation) hierarchisch gliedert. Der Prozess der Einordnung gewährleistet, dass nur die relevanten metalexikographischen Daten ausgewählt werden und damit verbunden auch Texte, die die oben angeführten Funktionen des Wörterbuchs zur lexikographischen Terminologie unterstützen.
Wie lässt sich die lexikographische Terminologie darstellen?
251
schließen aller für ein Fachgebiet bedeutsamen Termini. In der Fachkommunikation sind nämlich die Fachtermini an sich von Bedeutung und nicht deren Frequenz.8 Die Datenbank besteht aus den Einträgen, wobei sich die einzelnen Einträge aus den angeführten Angaben zum jeweiligen Lemma zusammensetzen. Strukturverbindungen in Bezug auf das Deutsche hängen vom jeweiligen Terminus ab, morphologische Angabe(n) ist/sind höher angesiedelt als die Definition, dieser folgen andere Angaben und Verweise.9
4 Zur Struktur des mehrdimensionalen Modells des elektronischen Fachwörterbuchs für die lexikographische Beschreibung der lexikographischen Terminologie 4.1 Zur Mediostruktur Der Zugang zu den Daten im Fachwörterbuch der lexikographischen Terminologie ist mit den Benutzerbedürfnissen in unterschiedlichen Arten von Benutzersituationen verbunden. Deswegen sollen die abgerufenen Daten auf der Bildschirmoberfläche so vorgestellt werden, dass der Benutzer diese problemlos verstehen und anwenden kann. Um dieses Ziel zu erreichen, müssen dem Benutzer mehrere unterschiedliche inhaltsbezogene Suchoptionen angeboten werden, u. z. ausgehend von der jeweiligen Benutzersituation. Benutzer, die das Wörterbuch konsultieren, werden unterstützt: –– beim Verstehen von lexikographischen Termini (Funktion Unterstützung beim Verstehen), –– bei der Produktion und beim Übersetzen von Texten mit lexikographischer Terminologie, wobei die Termini den Benutzern gewöhnlich bereits bekannt sind (Funktion Unterstützung beim Schreiben/Übersetzen) und –– bei beiden angeführten Optionen, deswegen die Angabe aller Daten (Funktion Alle Daten). Das Wörterbuch wird auf diese Weise unterschiedliche Funktionen und verschiedene Suchoptionen ermöglichen, die jeder Funktion angepasst sind. Damit verbunden ist
8 Wenn man das Kriterium der Frequenz befolgt, führt das dazu, dass zwar die am häufigsten verwendeten Termini berücksichtigt werden, diese jedoch in unterschiedlichen Benutzersituationen irrelevant sind. 9 Mehr zur Struktur der Datenbank in Štavbar (2016b).
252
Simona Štavbar
auch der Anteil von Daten, die gemäß der Funktion angeführt werden (vgl. Štavbar 2016b: 227–232). Alle Lemmata und Verweislemmata werden über das Suchfenster abrufbar sein. Das lexikographische Wörterbuch wird somit eine einfache Zugriffsstruktur aufweisen. Die einfache Suche nach dem einzelnen Lemma ermöglicht eine schnelle Suche im Wörterbuch. Andere Suchoptionen werden innerhalb des Wörterbuchs angeboten und möglich. Eine dem Benutzer angepasste Suche wird den Benutzern mit unterschiedlichem Vorwissen einen schnellen Zugang zu den gesuchten Daten gewähren. Zugleich wird somit auf die Anforderungen der Funktionstheorie eingegangen, die sich auf unterschiedliche Benutzertypen richtet. Die Suchseite ist einfach und kann mit anderen klassischen Webbrowsern verglichen werden, u. z. mit einem Suchfenster und anderen zusätzlichen Suchoptionen, z. B. die Suche über Tabs zu den einzelnen Funktionen. Dazu wird möglich, auf die slowenischen und englischen Übersetzungsäquivalente über separate Wortlisten von der Benutzeroberfläche aus zuzugreifen. Auf die gleiche Weise wird auch der Zugang zu einigen ausgewählten Termini aus dem Bereich der Computerlexikographie und Informationstechnologie möglich, die in der Lexikographie verwendet werden. Über einen Hyperlink kann der Benutzer von der Benutzeroberfläche aus auch zu den Benutzungshinweisen gelangen, in welchen die Struktur des Wörterbuchs und dessen Organisation sowie die Suchmöglichkeiten beschrieben werden und zu den Eigenen Notizen, über die der Benutzer z. B. seine individuelle Suche speichern kann. Durch die Funktion Hilfe und Kontakt wird mittels eines Kontaktformulars die Möglichkeit der Kontaktfunktion verwirklicht. Über die Funktion Herunterladen kann der Benutzer seine persönliche Suche herunterladen. Die Verlinkung in den Wörterbuchartikeln selbst ist wörterbuchintern und -extern. Die interne Verlinkung erfolgt über Hyperlinks. Zudem werden auch Mouseover-Effekte eingesetzt. Die Verlinkung der Daten über Hyperlinks wird bei Synonymen und bei Wortbildungsprodukten immer dann angewandt, wenn diese auch als Lemmata belegt und in Wörterbuchartikeln behandelt werden. Mouseover-Effekte werden für die Zwecke des Kommentars und des Vorschlags verwendet, so bei grammatischen Besonderheiten bzw. Charakteristika (z. B. Pluralbildung: Lemmata und nicht Lemmas) und auch für die Zwecke des Vorschlags (pragmatische Angaben, wie Häufigkeitsangabe, Kommentare zum Gebrauch, z. B. bei Stichwort und Lemma – bei Stichwort: favorisiert in der praktischen elektronischen Lexikographie; bei Lemma: verwendet in Verbindung mit Printwörterbüchern usw.). Die wörterbuchexterne Verlinkung wird über die Quellen möglich, die im Internet zugänglich sind. Bei diesen handelt es sich um Fachtexte, in denen das gesuchte Lemma im kontextuellen Umfeld auftritt, was besonders in der kommunikativen Situation, also bei der Textproduktion und beim Übersetzen wichtig ist.
Wie lässt sich die lexikographische Terminologie darstellen?
253
4.2 Zur Mikrostruktur Die Ergebnisse des Suchvorgangs bzw. die gesuchten Daten werden im Wörterbuch gemäß dem Suchbegriff angezeigt, u. z. in Bezug auf die oben angeführten Funktionen. In der kommunikativen Benutzersituation benötigen Benutzer unterschiedliche Daten. In diesem Fall werden sie die Funktion Unterstützung beim Schreiben/Übersetzen auswählen, da sie den Terminus/Begriff bereits kennen. Als Ergebnis der Suche werden folgende Arten von Daten angezeigt: Lemmazeichengestaltangabe, Singularbildungsangabe, Pluralbildungsangabe und Flexionsangabe bei Substantiven, orthographische Angabe, Angabe über morphologische Varianten (fakultativ), Definition, Kollokationsangabe, Beispielangabe, Synonymenangabe und Übersetzungsäquivalentangabe (Englisch und Slowenisch). Die Definition ist wichtig bei der Bestimmung des relevanten Terminus und im Kontext eines Fachtextes, linguistische Daten, Kollokationsangaben und Beispielangaben sowie Synonymenangaben unterstützen die Textproduktion und das Übersetzen. In der kognitiven Situation benötigen Benutzer vor allem einzelne Daten, um Wissenslücken zu schließen oder allgemeine Daten, um mehr über ein bestimmtes lexikographisches Thema zu erfahren. Aus diesem Grund werden die Benutzer, die z. B. nach der Bedeutung eines Terminus suchen, diesen über die Option Unterstützung beim Verstehen oder über die Option Alle Daten finden. Im ersten Fall werden die Daten angezeigt, die den Benutzer beim Verstehen eines lexikographischen Terminus unterstützen. Die angebotene Definition des Terminus wird in Sätzen und gemäß den vorhandenen Definitionstypen angeboten. Im weiteren Fall, wenn der Benutzer allgemeine Daten benötigt, kann die Funktion Alle Daten ausgewählt werden, was bedeutet, dass alle Daten, die an ein Lemma adressiert sind, angezeigt werden. Der Browser wird die Suche nach den folgenden relevanten Arten von Daten durchführen: Lemmazeichengestaltangabe, Singularbildungsangabe, Pluralbildungsangabe und Flexionsangabe bei Substantiven, orthographische Angabe, Angabe über morphologische Varianten (fakultativ), Definition, Kollokationsangabe, Synonymenangabe, Wortbildungsangabe, Übersetzungsäquivalentangabe (Slowenisch und Englisch), Beispiel angabe und Quellen- bzw. Belegstellenangabe (Link auf die Seite mit der Angabe). Das Fachwörterbuch der lexikographischen Terminologie wird somit den Benutzer in der kognitiven Situation unterstützen, wenn dieser allgemeine oder spezifische Daten zu einem Terminus sucht. Die mikrostrukturelle Anordnung von Daten ist für ihre Anwendung von besonderer Bedeutung. Die geplante und oben besprochene Mikrostruktur wird in der Tabelle 1 dargestellt. In der linken Spalte sind die einzelnen Angabeklassen angeführt, die in der rechten Spalte genauer bestimmt sind. Tabelle 1 enthält die Angabeklassen, die im Fachwörterbuch der Lexikographie, d. h. auf der Ebene der konkreten Mikrostruktur, den Angaben entsprechen. Welche Angaben in einem Wörterbuchartikel vorkommen, hängt vom jeweiligen Lemma ab.
254
Simona Štavbar
In Tabelle 2 werden an einem Beispiel die Angabeklassen mit den Angaben zur Lemmazeichengestaltangabe Wörterbuchartikel präzisiert. Tabelle 1: Angabeklassen, die im Fachwörterbuch den einzelnen Angaben entsprechen.10 Grammatikangabe – morphologische Angabe
Genusangabe (bei Substantiven lässt sich diese anhand der Lemmazeichengestaltangabe erkennen bzw. anhand des Artikels) Deklinationsangabe bzw. Flexionsangabe Pluralbildungsangabe
Wortartangabe (bei Substantiven lässt sich diese anhand der – syntaktische Angabe Lemmazeichengestaltangabe erkennen bzw. anhand des Artikels) Kommentar zur grammatischen Angabe
zum Artikelgebrauch bei Substantiven andere Hinweise zu Normfragen Verwendungshinweis über die Häufigkeit der Verwendung im Sg./Pl.
Angabe über morphologische Varianten Orthographische Angaben
Schreibweise der Lemmazeichengestaltangabe Schreibvariante der Lemmazeichengestaltangabe
Übersetzungsäquivalentangabe
Slowenisch/Englisch
Definitionsangabe Hinweise und Kommentare verbunden mit der Definitionsangabe
bezüglich bestimmter Verwendung oder zusätzlicher Sachinformationen
Kollokationsangabe Beispielangabe Synonymenangabe Belegstellenangabe Wortbildungsangabe Pragmatische Angaben
Empfehlungsangabe zu der präferierten Form des Terminus Empfehlungsangabe bezogen auf einen spezifischen Terminus Empfehlungsangabe bezogen auf die exakte Verwendung des Terminus Empfehlungsangabe bezogen auf den Vorrang des spezifischen Terminus Empfehlungsangabe bezogen auf den etablierten Terminus bzw. auf die terminologische Verbindung
10 Die grauen Felder enthalten Angabeklassen, die weißen Felder (rechte Spalte) sind für die einzelnen dazugehörigen Angaben bestimmt (hängt vom jeweiligen Lemma ab).
Wie lässt sich die lexikographische Terminologie darstellen?
255
Tabelle 2: Angabeklassen mit den Angaben zur Lemmazeichengestaltangabe Wörterbuchartikel. Grammatikangabe – morphologische Angabe
Genusangabe (bei Substantiven lässt sich diese anhand der Lemmazeichengestaltangabe erkennen bzw. anhand des Artikels) der Wörterbuchartikel Deklinationsangabe bzw. Flexionsangabe des Wörterbuchartikels Pluralbildungsangabe die Wörterbuchartikel Wortartangabe (bei Substantiven lässt sich diese anhand der – syntaktische Angabe Lemmazeichengestaltangabe erkennen bzw. anhand des Artikels) der Wörterbuchartikel Kommentar zur grammatischen Angabe zum Artikelgebrauch bei Substantiven andere Hinweise zu Normfragen Verwendungshinweis über die Häufigkeit der Verwendung im Sg./Pl. Angabe über morphologische Varianten Orthographische Angaben
Übersetzungsäquivalentangabe
Definitionsangabe Hinweise und Kommentare verbunden mit der Definitionsangabe
Kollokationsangabe Beispielangabe Synonymenangabe
Belegstellenangabe Wortbildungsangabe Pragmatische Angaben
Schreibweise der Lemmazeichengestaltangabe Wörterbuchartikel Schreibvariante der Lemmazeichengestaltangabe Slowenisch/Englisch slovarski članek dictionary article Ein Wörterbuchartikel ist ein Teil des Wörterverzeichnisses eines Wörterbuches und besteht aus dem Lemma und dieser zugeordneten konkreten Mikrostruktur. bezüglich bestimmter Verwendung oder zusätzlicher Sachinformationen Ein Wörterbuchartikel besteht aus einem Lemma und mindestens zwei Angaben, wovon eine die Lemmazeichengestaltangabe ist. Wörterbuchartikel strukturieren; Wörterbuchartikel bearbeiten Die Verantwortung für die Inhalte eines Wörterbuchartikels verbleibt auch im computerunterstützenden lexikographischen Prozess vollständig beim Lexikographen. Wiegand, H. E. (1998). Wörterbuchforschung. Berlin/New York: De Gruyter. Engelberg, S./Lemnitzer, L. (2009). Lexikographie und Wörterbuch benutzung. Tübingen: Stauffenburg. [4. überarb. und erw. Auflage] Wörterbuchartikelstruktur Empfehlungsangabe zu der präferierten Form des Terminus Die Form Wörterbuchartikel wird der Kurzform Artikel vorgezogen. Empfehlungsangabe bezogen auf einen spezifischen Terminus Empfehlungsangabe bezogen auf die exakte Verwendung des Terminus Empfehlungsangabe bezogen auf den Vorrang des spezifischen Terminus Dictionary article wird dem Terminus dictionary entry vorgezogen. Empfehlungsangabe bezogen auf den etablierten Terminus bzw. auf die terminologische Verbindung
256
Simona Štavbar
5 Über integrierte lexikographische Daten und Suchoptionen im Modell des elektronischen Fachwörterbuchs Das Wörterbuch der lexikographischen Terminologie ist dem Angeführten nach ein synchrones Fachwörterbuch mit deutscher Ausgangsterminologie, das zudem Äquivalente auf Slowenisch und Englisch enthält und besonders die Laien und SemiExperten unterstützen soll. Aus der Benutzerperspektive funktioniert die Suche im Wörterbuch auf die folgende Weise. Befindet sich der Benutzer auf der wörterbucheigenen Internetseite, benutzt er den Browser, der die Datenbank nach entsprechenden Daten durchsucht und das Ergebnis der Suche liefert. Diese Daten werden dem Benutzer angezeigt, u. z. in der vorbestimmten Ordnung. Wie die Recherche in der Datenbank aussieht und wie die Daten angezeigt werden, hängt von der jeweiligen Benutzersituation ab. Eine allgemeine Suche kann man mit der Suchoption Suche starten oder durch die bereits vorgegebenen Funktionen. Einzelne Daten kann der Benutzer auch mithilfe von Links abrufen.
5.1 Fachwörterbuch zur lexikographischen Terminologie – Funktion Unterstützung beim Verstehen Benutzer, die z. B. nach der Bedeutung des lexikographischen Terminus Wörterbuchartikel suchen, den sie in einem lexikographischen Fachtext finden, wählen die angebotene Option Unterstützung beim Verstehen. Der Browser startet die Suche nach dem Terminus Wörterbuchartikel. Gesucht wird nach Daten, die mit dem Verstehen des gesuchten Terminus verbunden sind. Auf der Bildoberfläche anzeigt werden folgende Daten: Lemmazeichengestaltangabe, an das Lemma adressierte Grammatikangabe, orthographische Angabe, Definition, Äquivalentangabe (Slowenisch und Englisch), pragmatische Angaben und Quellenangabe. Dem Benutzer werden Daten angezeigt, die hilfreich beim Verstehen des lexikographischen Terminus im Deutschen sind, der aus einem lexikographischen Text stammt und nicht verstanden wird – hier des lexikographischen Terminus Wörterbuchartikel. Viele Wörterbuchbenutzer konsultieren ein bestimmtes Fachwörterbuch auch bei grammatischen Fragen. Dies gilt für Muttersprachler und noch mehr für Nichtmuttersprachler. Deshalb wird der lexikographische Terminus zunächst nach seiner Wortart bestimmt und mit Informationen zu seiner Grammatik versehen. Zum einen werden diese auch von Benutzern erwartet (vgl. Wiegand 1985). Da man innerhalb der lexikographischen Terminologie eine große Anzahl von Schreibvarianten beobachten kann, wird den Benutzern des lexikographischen Fachwörterbuchs eine normgerechte Schreibweise angeboten, und, wenn vorhanden, auch die dazugehörige(n) Schreibvariante(n), die in den Fachtexten belegt sind. Die angebotene Definition
Wie lässt sich die lexikographische Terminologie darstellen?
257
ermöglicht das Verstehen des Terminus im kontextuellen Umfeld; dazu dient auch die Quellenangabe, die eine ergänzende bzw. unterstützende Funktion zur Definition erfüllt. Die vorhandene Definition ist in vollständigen Sätzen verfasst. Seite auf: Deutsch
Benutzungshinweise
Suche
Wörterbuchartikel
Herunterladen
Hilfe und Kontakt
Unterstützung beim Verstehen, Deutsch
Suche: 1. Unterstützung beim Verstehen 2. Unterstützung beim Schreiben/Übersetzen 3. Alle Daten Wörterbuchartikel
Die Form Wörterbuchartikel wird der Kurzform Artikel vorgezogen
der Wörterbuchartikel des Wörterbuchartikels die Wörterbuchartikel Orthographie: Schreibweise: Wörterbuchartikel
Ein Wörterbuchartikel besteht aus einem Lemma und mindestens zwei Angaben, wovon eine die Lemmazeichengestaltangabe ist.
Eigene Notizen
Äquivalentliste Slowenisch Äquivalentliste Englisch
Bedeutung: Ein Wörterbuchartikel ist ein Teil des Wörterverzeichnisses eines Wörterbuches und besteht aus dem Lemma und dieser zugeordneten konkreten Mikrostruktur. Äquivalente: Slowenisch: slovarski članek Englisch: dictionary article
Dictionary article wird dem Terminus dictionary entry vorgezogen.
Quellen: Wiegand, H. E. (1998). Wörterbuchforschung. Berlin/New York: De Gruyter. Engelberg, S./Lemnitzer, L. (2009). Lexikographie und Wörterbuchbenutzung. Tübingen: Stauffenburg. [4. überarb. und erw. Auflage]
Termini aus dem Bereich der Computerlexikographie und IT-Termini
Grafische Darstellung
Abb. 1: Angezeigte Daten bei der ausgewählten Funktion Unterstützung beim Verstehen.
5.2 Fachwörterbuch zur lexikographischen Terminologie – Funktion Unterstützung beim Schreiben/Übersetzen In dieser Benutzersituation benötigen Benutzer Unterstützung beim Verfassen eines Textes oder sie benötigen Hilfe beim Übersetzen und wollen erfahren, wie sie den Terminus Wörterbuchartikel benutzen können. In diesem Fall wird die Funktion Unterstützung beim Schreiben/Übersetzen gewählt. Als Ergebnis der Suche werden folgende Arten von Daten angezeigt: Lemmazeichengestaltangabe, Grammatikangabe, orthographische Angabe (Schreibweise), Definition, Kollokationsangabe, Belegtext angabe, pragmatische Angaben und Äquivalentangabe (Slowenisch und Englisch). Auf dem Bildschirm werden folgende Daten angezeigt:
258
Simona Štavbar
Seite auf: Deutsch
Benutzungshinweise
Suche
Wörterbuchartikel
Herunterladen
Hilfe und Kontakt
Unterstützung beim Schreiben/Übersetzen, Deutsch
Suche: 1. Unterstützung beim Verstehen 2. Unterstützung beim Schreiben/Übersetzen 3. Alle Daten Wörterbuchartikel
Die Form Wörterbuchartikel wird der Kurzform Artikel vorgezogen der Wörterbuchartikel des Wörterbuchartikels die Wörterbuchartikel Ein Wörterbuchartikel
Orthographie: Schreibweise: Wörterbuchartikel
besteht aus einem Lemma und mindestens zwei Angaben, wovon eine die Lemmazeichengestaltangabe ist.
Eigene Notizen
Äquivalentliste Slowenisch Äquivalentliste Englisch
Bedeutung: Ein Wörterbuchartikel ist ein Teil des Wörterverzeichnisses eines Wörterbuches und besteht aus dem Lemma und dieser zugeordneten konkreten Mikrostruktur. Kollokationen: Wörterbuchartikel strukturieren Wörterbuchartikel bearbeiten Beispiel: Die Verantwortung für die Inhalte eines Wörterbuchartikels verbleibt auch im computerunterstützenden lexikographischen Prozess vollständig beim Lexikographen. Äquivalente: Slowenisch: slovarski članek Englisch: dictionary article
Dictionary article wird dem Terminus dictionary entry vorgezogen.
Termini aus dem Bereich der Computerlexikographie und IT-Termini
Grafische Darstellung
Abb. 2: Angezeigte Daten bei der ausgewählten Funktion Unterstützung beim Schreiben/Übersetzen.
Die angegebenen Daten in der Abb. 2 unterstützen den Benutzer beim Verfassen von linguistischen und besonders beim Verfassen von lexikographischen Texten auf Deutsch. Die angebotene Definition ist wichtig bei der Bestimmung des relevanten Terminus und im Kontext eines Fachtextes; grammatische Angabe, Kollokationsangabe und Belegtextangabe sowie Synonymenangabe unterstützen die Textproduktion und das Übersetzen ebenfalls. Die pragmatische Angabe hat die Funktion einer Empfehlung bezüglich der Präferenzen im Sprachgebrauch. Fuertes-Olivera/ Tarp bezeichnen dies als proscriptive notes (2014: 228–229). Diese unterstützen alle Benutzertypen, besonders in kommunikativen Benutzersituationen, jedoch auch in kognitiver Hinsicht.
Wie lässt sich die lexikographische Terminologie darstellen?
259
5.3 Wörterbuch zur lexikographischen Terminologie – Funktion Alle Daten Benutzer können die Funktion Alle Daten auswählen. Das heißt, dass sie sich für alle Daten interessieren, die an den gesuchten Terminus Wörterbuchartikel adressiert sind. Der Browser wird die Suche nach folgenden relevanten Arten von Daten durchführen: Lemmazeichengestaltangabe, Grammatikangabe, orthographische Angabe (Schreibweise), Definition, Kollokationsangabe, Belegtextangabe, Äquivalentangabe (Slowenisch und Englisch), Kompositumsangabe, Quellenangabe bzw. Literaturangabe und pragmatische Angaben. Die genannten Daten werden wie folgt angezeigt:
Seite auf: Deutsch
Benutzungshinweise
Suche
Herunterladen
Wörterbuchartikel
Hilfe und Kontakt
Alle Daten, Deutsch
Suche: 1. Unterstützung beim Verstehen 2. Unterstützung beim Schreiben/Übersetzen 3. Alle Daten Wörterbuchartikel
Die Form Wörterbuchartikel wird der Kurzform Artikel vorgezogen
der Wörterbuchartikel des Wörterbuchartikels die Wörterbuchartikel Orthographie: Schreibweise: Wörterbuchartikel
Ein Wörterbuchartikel besteht aus einem Lemma und mindestens zwei Angaben, wovon eine die Lemmazeichengestaltangabe ist.
Eigene Notizen
Äquivalentliste Slowenisch Äquivalentliste Englisch
Bedeutung: Ein Wörterbuchartikel ist ein Teil des Wörterverzeichnisses eines Wörterbuches und besteht aus dem Lemma und dieser zugeordneten konkreten Mikrostruktur. Kollokationen: Wörterbuchartikel strukturieren Wörterbuchartikel bearbeiten Beispiel: Die Verantwortung für die Inhalte eines Wörterbuchartikels verbleibt auch im computerunterstützenden lexikographischen Prozess vollständig beim Lexikographen. Äquivalente: Slowenisch: slovarski članek Englisch: dictionary article Siehe auch: Wörterbuchartikelstruktur
Termini aus dem Bereich der Computerlexikographie und IT-Termini
Dictionary article wird dem Terminus dictionary entry vorgezogen.
Quellen: Wiegand, H. E. (1998). Wörterbuchforschung. Berlin/New York: De Gruyter. Engelberg, S./Lemnitzer, L. (2009). Lexikographie und Wörterbuchbenutzung. Tübingen: Stauffenburg. [4. überarb. und erw. Auflage]
Abb. 3: Angezeigte Daten bei der ausgewählten Funktion Alle Daten.
Grafische Darstellung
260
Simona Štavbar
Das Wörterbuch der lexikographischen Terminologie wird bei der Wahl der Funktion Unterstützung beim Verstehen und Alle Daten die potenziellen Benutzer unterstützen, wenn sie allgemeine oder einzelne, spezifische Daten über ein terminologisches Konzept benötigen, also in der kognitiven Situation.
6 Zusammenfassung Ein ausgebautes lexikographisches terminologisches System ermöglicht dem Benutzer, sich über das Fachgebiet im Detail zu informieren, was sowohl aus fachspezifischer als auch aus kultureller Sicht wichtig ist. Das zugrundeliegende lexikographische terminologische System nach H. E. Wiegand ermöglicht, entsprechende lexikographische Termini auch in anderen Sprachen, hier im Slowenischen, systematisch einzuführen. Durch die Vereinheitlichung der bestehenden Terminologie und Einführung der benötigten, jedoch bisher fehlenden Fachausdrücke und zugleich durch ihre entsprechende lexikographische Bearbeitung und Präsentation wird ein regionales, sprachspezifisches Manko größtenteils behoben. Die Vereinheitlichung und das Einführen von fehlenden lexikographischen Termini führen zu einer weiteren Entwicklung der lexikographischen Theorie, zur Erhöhung der lexikographischen Kompetenz und folgerichtig zur Verbesserung der Qualität zukünftiger lexikographischer Produkte. Die theoretische Grundlage des Konzepts basiert auf den theoretischen und praktischen Erkenntnissen, die in der Welt bekannt sind und hierbei angewandt werden. Auch dadurch wird ein regionales Manko behoben, zumal die mangelhafte oder sogar fehlende Rezeption theoriegeleiteter lexikographischer Kenntnisse aus dem deutschsprachigen Gebiet gegenwärtig in Slowenien nicht zu übersehen ist.
Literatur Bergenholtz, Henning/Kaufmann, Uwe (1997): Terminography and Lexicography. A Critical Survey of Dictionaries from a Single Specialised Field. In: Hermes 18, 91–125. [Unter: ; letzter Zugriff: 16. 1. 2017]. Fuertes, Pedro A./Tarp, Sven (2014): Theory and Practice of Specialised Online Dictionaries. Berlin/ Boston: De Gruyter. Svensén, Bo (2009): Subject-field classification for metalexicography revisited. In: Nielsen, Sandro/ Tarp, Sven (Hrsg.): Lexicography in the 21st century: in honour of Henning Bergenholtz. Amsterdam/Philadelphia: John Benjamins, 147–159. Štavbar, Simona (2015): Problemi terminologije v leksikografski vedi na Slovenskem. Slovnica in slovar – aktualni jezikovni opis. In: Smolej, Mojca (Hrsg.): Obdobja 34. Simpozij. Ljubljana: Znanstvena založba Filozofske fakultete, 751–757.
Wie lässt sich die lexikographische Terminologie darstellen?
261
Štavbar, Simona (2016a): Probleme in Bezug auf die slowenische lexikographische Terminologie. In: Lexikos 26, 241–272. [Unter: ; letzter Zugriff: 13. 1. 2017]. Štavbar, Simona (2016b): Nemška leksikografska terminologija – Teoretični in praktični vidiki elektronskega terminološkega slovarja = Deutsche lexikographische Terminologie – Theoretische und praktische Aspekte des elektronischen Fachwörterbuchs. Dissertation. Maribor: Univerza v Mariboru, Filozofska fakulteta. Tarp, Sven (2008): Lexicography in the Borderland between Knowledge and Non-Knowledge: General Lexicographical Theory with Particular Focus on Learner’s Lexicography. Tübingen: Niemeyer. Tarp, Sven (2009): Beyond Lexicography: New Visions and Challenges in the Information Age. In: Bergenholtz, Henning/Nielsen, Sandro/Tarp, Sven (Hrsg.): Lexicography at a Crossroads: Dictionaries and Encyclopedias Today, Lexicographical Tools Tomorrow. Bern: Peter Lang, 17–32. Tarp, Sven (2010): Functions of Specialised Learners’ Dictionaries. In: Fuertes-Olivera, Pedro A. (Hrsg.): Specialised Dictionaries for Learners. Berlin/New York: De Gruyter, 39–53. Wiegand, Herbert Ernst (1985): Fragen zur Grammatik in Wörterbuchbenutzungsprotokollen. Ein Beitrag zur empirischen Erforschung der Benutzung einsprachiger Wörterbücher. In: Bergenholtz, Henning/Mugdan, Joachim (Hrsg.): Lexikografie und Grammatik, Akten des Essener Kolloquiums zur Grammatik im Wörterbuch, 28.–30. 6. 1984. Tübingen: Niemeyer, 20–98. WLWF = Wörterbuch zur Lexikographie und Wörterbuchforschung. Hrsg. v. Wiegand, Herbert Ernst/ Beißwenger, Michael/Gouws, Rufus H. et al. Berlin/New York: De Gruyter, 2010. [Bd. 1 A–C].