Wörterbuchforschung und Lexikographie 9783110474251, 9783110472196

This volume collects 17 essays by experts from 5 countries under the rubric "dictionary research and lexicography&q

233 46 7MB

German Pages 343 [344] Year 2016

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Vorwort
Inhalt
Lexikographische Ergebnisdarstellungen: Fragen der Präsentation und Kommentierung
E-KOLLEX. Überlegungen zu einem Online-Kollokationswörterbuch für DaF
Das „Wörterbuch zur Lexikographie und Wörterbuchforschung“/„Dictionary of Lexicography and Dictionary Research“ im RDF-Format. Ein Vorschlag zur Diskussion
Von Rutengängern und Lexikographen – offene und verdeckte Quellen für die Bedeutungsbeschreibung
Giuges, Nesiron und Zabulismes. Ein türkisch-spanisches Glossar von 1690
Lexikographie und Linguistik: wortartenbezogene Aspekte
Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie
Increasing the scope of the treatment of specialized language terms in general language dictionaries
„Auf, auf, mein Herz, mit Freuden nimm wahr, was heut geschicht“. Das „Evangelische Gesangbuch“ – auch eine „Pflegestätte“ deutscher Archaismen?
Zur lexikographischen Darstellung der zeitgenössischen Germanismen. Eine Problemskizze
Lexikographische Konzepte: übergreifende Fragestellungen – gestern und heute
Eine Korpusanalyse ist eine überflüssige Zeremonie
Wörterbuch war gestern. Programm für ein unifiziertes Konstruktikon!
Wörterbücher als Sehflächen
The amazing vitality of things that don’t exist
Lexikographie und Metalexikographie: Status quo und Perspektiven
Was haben Metalexikographie und Publishing Studies miteinander zu tun?. Das in beiden Fällen bestehende produktive, bidirektionale Verhältnis zu einer kulturellen Praxis als zentraler Befund
Über die gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie
Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre
Einige kurze Überlegungen zur Metalexikographie in der Lehre
Lexikographie und Wörterbuchforschung im Alltag
Recommend Papers

Wörterbuchforschung und Lexikographie
 9783110474251, 9783110472196

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Wörterbuchforschung und Lexikographie

LEXICOGRAPHICA Series Maior

Supplementary Volumes to the International Annual for Lexicography Suppléments à la Revue Internationale de Lexicographie Supplementbände zum Internationalen Jahrbuch für Lexikographie Edited by Rufus Hjalmar Gouws, Ulrich Heid, Thomas Herbst, Oskar Reichmann, Stefan J. Schierholz, Wolfgang Schweickard and Herbert Ernst Wiegand

Volume 151

Wörterbuchforschung und Lexikographie Herausgegeben von Stefan J. Schierholz Rufus Hjalmar Gouws Zita Hollós Werner Wolski

ISBN 978-3-11-047219-6 e-ISBN (PDF) 978-3-11-047425-1 e-ISBN (EPUB) 978-3-11-047228-8 ISSN 0175-9264 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2016 Walter de Gruyter GmbH, Berlin/Boston Satz: jürgen ullrich typosatz, Nördlingen Druck und Bindung: CPI books GmbH, Leck ♾ Gedruckt auf säurefreiem Papier Printed in Germany www.degruyter.com

Vorwort Dieser, Herbert Ernst Wiegand zum 80. Geburtstag gewidmete, Sammelband hat den Titel „Wörterbuchforschung und Lexikographie“ erhalten, um damit in den Beiträgen die Möglichkeit zu schaffen, sich zu verschiedenen Themenbereichen der Lexikographie und Wörterbuchforschung äußern zu können. Der Titel enthält die beiden Bereiche, die Herbert Ernst Wiegand nach dem Gesetz der wachsenden Glieder reiht und dann in dieser Weise wiederholt in seinen Publikationen nennt, in der umgekehrten Reihenfolge, um damit dem Prinzip „vom Allgemeinen zum Speziellen“ oder „vom Abstrakten zum Konkreten“ bzw. „von der Theorie zur Praxis“ zu folgen und sich somit von der usuellen Benennung abzusetzen und dennoch die Extension zu erhalten. Eine systematische Würdigung des Schaffens Herbert Ernst Wiegands muss hier ausbleiben. Denn selbst mit Blick ausschließlich auf die (meta-)lexikographischen Arbeiten ließen sich dazu nur in einem sehr langen Beitrag einigermaßen befriedigende Ausführungen leisten: Neben der Monographie mit dem Titel „Wörterbuchforschung“ (1162 Seiten) weisen auch viele seiner Aufsätze den Umfang einer Monographie auf. Schätzungsweise mehr als 20.000 Seiten umfassen Wiegands Artikel in verschiedenen internationalen Zeitschriften, Sammelbänden, Buchreihen und Handbüchern. Zahlreiche Artikel sind zusammen mit Kollegen und Kolleginnen verfasst worden, z.B. mit Henning Bergenholtz, Maria Teresa Fuentes Morán, Rufus H. Gouws, Franz Josef Hausmann, Helmut Henne, Vida Jesenšek, Matthias Kammerer, Alan Kirkness, Klaus-Peter Konerding, Antonín Kučera, Stefan J. Schierholz und Sven Tarp. Die mit 2699 Seiten in vier Bänden erschienene „Internationale Bibliographie zur germanistischen Lexikographie und Wörterbuchforschung“ ist zwischenzeitlich (im Rahmen einer Auftragsarbeit) von Werner Wolski um ein 660 Seiten umfassendes kommentiertes Sachregister ergänzt worden. Hinzu kommen Wiegands vielfältig Tätigkeiten im Rahmen der von ihm initiierten Publikationen: die „Handbücher zur Sprach- und Kommunikationswissenschaft“ (HSK), die „Wörterbücher zur Sprachund Kommunikationswissenschaft“ (WSK), das „Wörterbuch zur Lexikographie und Wörterbuchforschung“ (WLWF), das internationale Jahrbuch „Lexicographica“ und die angeschlossene Reihe „Lexicographica Series Maior“, die Zeitschrift und gleichnamige Buchreihe „Germanistische Linguistik“ sowie die „Zeitschrift für germanistische Linguistik“. Herbert Ernst Wiegand hat aber auch zahlreiche Kolloquien, Workshops, Konferenzen und Sektionen organisiert: Zu nennen sind vor allem das „Lexikographische Kolloquium“ in Heidelberg, die Gründung des „Internationalen Kopenhagener Kolloquiums“ sowie die Gründung des internationalen „Kolloquiums zur Lexikographie und Wörterbuchforschung“, das in Osteuropa seit dem Jahre 2000 im Zweijahresrhythmus organisiert wird. Hinzu kommen auch Sektionen bei der „Internationalen Vereinigung der Germanisten“. In Verbindung mit der „European Association for Lexcography“ (EURALEX) ist das internationale Jahrbuch „Lexicographica“ (erster

VI

Vorwort

Band: 1984) erschienen; und auch an der Gründung der EURALEX war Herbert Ernst Wiegand maßgeblich beteiligt. Des Weiteren hat Herbert Ernst Wiegand eine offizielle Beratertätigkeit bei über zwanzig Wörterbuchprojekten im In- und Ausland ausgeübt, war zwischen 1985 und 1990 Sprecher des Forschungsschwerpunkts Lexikographie an der Neuphilologischen Fakultät in Heidelberg, zwölf Jahre lang Mitglied des Kuratoriums des „Instituts für deutsche Sprache“ (IDS Mannheim), und unter anderem auch von 1995 bis 2003 im Kuratorium des „Österreichischen Instituts für Dialekt- und Namenlexika“. Details zu seinem Werdegang seit seiner Tätigkeit am „Forschungsinstitut für deutsche Sprache“ (Deutscher Sprachatlas in Marburg) und dortiger Promotion im Jahre 1968 sowie zu seinem weiteren Schaffen können beispielsweise der Festschrift zu seinem 65. Geburtstag („Sprache im Alltag“) und zahlreichen Internetseiten entnommen werden. An dieser Stelle sei lediglich erwähnt, dass Herbert Ernst Wiegand für seine Verdienste im Bereich der Wörterbuchforschung dreimal die Ehrendoktorwürde verliehen worden ist: im Jahre 1996 an der „Aarhus School of Business“ (Dänemark), im Jahre 2000 an der Universität Sofia (Bulgarien), und im Jahre 2006 an der Universität Stellenbosch (Südafrika). Der Erlanger Franz Josef Hausmann hat Herbert Ernst Wiegand einmal den „Karajan“ der Lexikographie genannt. Bei Studierenden, Sekretärinnen und Doktoranden war er jedoch gelegentlich gefürchtet; aber auch das Stuttgarter Wissenschaftsministerium hat gelegentlich seine Scharfzüngigkeit und Scharfsinnigkeit zu spüren bekommen. Gegen die Verwaltung hat er sich gewehrt, wenn überflüssige Vorschriften die Lehr- und Forschungstätigkeiten zu sehr eingeengt haben. Bei zuverlässigen, kompetenten, einsatzfreudigen und kritischen Kollegen jedoch war er immer hoch angesehen und beliebt: Wer ein kritisches Gespräch gesucht hat, wer auch mal provozieren mochte, der war bei Herbert Ernst Wiegand an der richtigen Adresse. Wer nur schnell zu irgendeinem Ziel wollte oder um den heißen Brei herumredete, nicht auf den Punkt kam, keine klar definierten Ziele hatte oder ohne Struktur eine Aufgabe lösen wollte, der hatte schnell Probleme mit Herbert Ernst Wiegand und sah sich unangenehmen Fragen ausgesetzt. Militärische Disziplin, höchste Effektivität, Arbeiten bis spät in die Nacht (manchmal bis zum nächsten Morgen), Großprojekte und Mammutaufgaben mit Risiken eingehen, aber auch scharfsinnig und glasklar kalkulieren sowie absolute Zuverlässigkeit in allen Angelegenheiten; das gehörte und gehört zu seinen hervorstechenden Eigenschaften. Dass dabei in seinem Leben dennoch das Private nicht zu kurz kam, ist erstaunlich und vor allem nur denjenigen bekannt, die ihn in Oberurff getroffen oder ihn jetzt in Homberg/Efze bei seiner zweiten Frau Cornelia PaulusWiegand besucht haben. Dazu zählen unter anderem: die Familienpflege, das Tennisspielen, als 70-jähriger mit den Enkeln Skifahren (Herbert Ernst Wiegand war auch Skilehrer), an der Algarve Urlaub machen (und dort mit Stefan Schierholz das letzte noch aktive Großprojekt skizzieren), in Stellenbosch Weinproben machen (wo er Fellow am „Stellenbosch Institute for Advanced Studies“ (STIAS) ist), auch anderen-

Vorwort

VII

orts regelmäßig Urlaub machen, Sonne tanken (Seine vor einigen Jahren verstorbene erste Frau Marianne sagte einmal: „Herbert achtet sehr drauf!“ – gemeint war der Teint.), Tanzen, Lieben, Loben, Vorankommen und dennoch täglich eine 24-stündige strukturierte Disziplin bewahren. Ein Kolloquium zu Ehren Herbert Ernst Wiegands hat in Erlangen stattgefunden, weil die FAU insbesondere seit der Emeritierung Herbert Ernst Wiegands mit diesem über Stefan J. Schierholz und über das Erlanger „Interdisziplinäre Zentrum für Lexikographie, Valenz und Kollokationsforschung“ sowie auch durch gemeinsame Herausgebertätigkeiten (mit Peter O. Müller in der „Germanistischen Linguistik“, mit Thomas Herbst und Stefan J. Schierholz in „Lexicographica Series Maior“ und „Lexicographica“) und mit Stefan J. Schierholz im Großprojekt „Wörterbücher zur Sprach- und Kommunikationswissenschaft“ enge und stetige Verbindungen aufgebaut hat. Die siebzehn Beiträge der Festschrift sind nach thematischen Gesichtspunkten auf vier Kapitel verteilt: Das erste Kapitel umfasst Beiträge, in denen lexikographische Projekte einschließlich ihrer Perspektiven vorgestellt werden: vier Projekte der Gegenwart, sowie ein Projekt aus der Vergangenheit. Zita Hollós stellt in ihrem Beitrag erste Überlegungen zu einem ein- oder zweisprachigen Online-Kollokationswörterbuch für DaF-Lerner an. Die Grundlage für das Wörterbuch bildet die webbasierte und dynamische Datenbank des deutsch-ungarischen syntagmatischen Printwörterbuchs TÁR// K OLLE X“ (2014) mit mehr als 60.000 deutschen Wortverbindungen, „SZÓ KAP TÁR dessen Konzeption übrigens auf die vom Jubilar betreute Dissertation der Autorin zurückgeht. Matthias Kammerer stellt in seinem Artikel Schritt für Schritt vor, wie die xml-Daten des von Herbert Ernst Wiegand initiierten WLWF („Wörterbuch zur Lexikographie und Wörterbuchforschung“ /„Dictionary of Lexicography and Dictionary Research“) mit Hilfe des Formats „Resource Description Frameworks“ (RDF) für weitere Anwendungen sinnvoll und eindeutig repräsentiert werden können. Der Beitrag kann „als eine informelle Einführung in RDF gelesen werden, der teilweise auch die prinzipiellen Probleme einer RDF-Modellierung thematisiert“. Lothar Lemnitzer geht von einer einstigen Prüfungsfrage aus, die ihm Herbert Ernst Wiegand gestellt hatte, nämlich „Können wir dem Computer beibringen, Bedeutungsbeschreibungen als Teil der lexikographischen Arbeit zu erstellen?“. Dazu gibt er in zeitlichem Abstand neue Antworten, indem er vor dem Hintergrund des Projekts „Digitales Wörterbuch der deutschen Sprache“ (DWDS) verschiedenen Details der computerunterstützten Ermittlung und Aufbereitung von Daten für die Bedeutungsbeschreibung lexikalischer Einheiten nachgeht. Der wörterbuchgeschichtliche Beitrag von Wolfgang Schweickard widmet sich einem türkisch-spanischen Glossar aus dem 17. Jahrhundert (unter dem Namen J. B. Lardito im Jahre 1670 erschienen), das in der einzigen spanischen Übersetzung von Sir Paul Rycaut’s Werk „Present State of the Ottoman Empire“ (1667) unter dem Titel „Historia del estado presente del Imperio Otomano“ zu finden ist. Er zeigt am Beispiel einer solchen Wortliste die vielfältigen, damit verbundenen überlieferungsgeschichtlichen Probleme auf.

VIII

Vorwort

Das zweite Kapitel enthält Beiträge, die sich mit der lexikographischen Kommentierung bestimmter Lexemtypen (Substantive, Fachwörter, Archaismen, Germanismen) beschäftigen: Milka Enčeva geht in ihrem Artikel zu substantivischen Komposita in ein- und zweisprachigen Lernerwörterbüchern mit Deutsch der Frage nach, wie nützlich die aufgelisteten Komposita in Rezeptions-, Produktions- und Lernsituationen sind und wie die Ergebnisse der Substantivvalenzforschung für die lexikographische Praxis umgesetzt werden könnten. Den Ausgangspunkt des Beitrags von Rufus H. Gouws bildet die Beobachtung, dass für die Kodifizierung von Termini in erster Linie Fachwörterbücher vorgesehen sind, obwohl sie oft genug auch in allgemeinen Wörterbüchern gesucht werden. Deshalb macht er Vorschläge für eine innovative und umfassendere Behandlung der Fachwörter (z.B. im Bereich Wirtschaft) im Rahmen von Bedeutungswörterbüchern, damit die zu erschließenden Informationen die Benutzerbedürfnisse besser befriedigen können. Klaus-Dieter Ludwig greift die Idee des Jubilars auf, zweisprachige Wörterbücher mit Deutsch als Ausgangssprache seien ein Fundort deutscher Archaismen und überprüft sogenannte „Altwörter“ im „Evangelischen Gesangbuch“ auf ihre diaphasische Markierung in Gegenwartswörterbüchern. Dabei gelangt er zu dem überraschenden Ergebnis, dass die nach dem Sprachgefühl des Autors veraltenden/veralteten Wörter lediglich mit dem diastratischen Markierungsprädikat „gehoben“ versehen sind. Giovanni Rovere liefert eine Problemskizze in Bezug auf die lexikographische Darstellung der Germanismen im Italienischen, wobei die Rolle der Sprachpolitik, die internationale Relevanz der Gebersprache und der „autarke“ Charakter der Nehmersprache hervorgehoben werden. Das dritte Kapitel umfasst Beiträge, die lexikographische Konzepte unter übergreifenden Fragestellungen thematisieren: Henning Bergenholtz geht unter dem provokativ formulierten Titel „Eine Korpusanalyse ist eine überflüssige Zeremonie“ auf verschiedene überzogene Forderungen zur Rolle von Korpusanalysen ein. Er argumentiert dahingehend, dass eine korpusgesteuerte Lexikographie durchaus nicht pauschal als unerlässlich betrachtet werden darf. Vielmehr sind Korpusanalysen nach ihrer Relevanz relativ zu Wörterbuchtypen sowie insbesondere auch relativ zu Angabetypen zu beurteilen: Für „einige“ Typen von Angaben bedarf es durchaus der Korpusanalyse, für andere aber nicht. Thomas Herbst schließt an das Konzept eines sog. „Konstruktikons“ an, das seit einigen Jahren aus der Perspektive der kognitiven Linguistik (Framesemantik, Prototypentheorie) diskutiert wird. Dazu entwirft er insbesondere für englische Lernerwörterbücher ein detailliertes Programm zur Optimierung der Angaben zu Mehrworteinheiten, Valenzstrukturen, Phrasenkonstruktionen Argumentstruktur-Konstruktionen u.a.m. Ulrich Schmitz vergleicht die Sehflächen in Print- und in Online-Wörterbüchern: Während erstere eine begrenzte Menge an Daten auf eine statische Weise und lediglich linear darstellen, ist für letztere kennzeichnend, dass schriftliche wie gleichermaßen nichtschriftliche Elemente – in Form dynamischer multimodaler Verknüpfungen – im Layout „gemeinsame Bedeutungseinheiten“ bilden. Dies beinhaltet die Überwindung semiotischer Beschränkungen der Textsorte Wörterbucheintrag, nämlich weg von der Alleinstellung der Schrift und

Vorwort

IX

hin zu Sehflächen (mit Eingabefeldern, Farbdesign, Diagrammen usw.). Sven Tarp preist in seinem leicht ironisierenden Beitrag Wörterbücher und lexikographische Theorien, die angeblich nicht existieren, dennoch vitaler denn je sind – trotz oder gerade wegen der Ignoranz bestimmter „Fachleute“, die dies nicht zur Kenntnis nehmen wollen. Bezug nehmend auf lexikographische Ergebnisdarstellungen unterschiedlichen Typs unterscheidet er unter anderem zwischen „dictionaries of words“ und „dictionaries of things“. Das vierte Kapitel gewährt Ein- und Ausblicke in die lexikographische Praxis und die Metalexikographie. Christoph Bläsi widmet sich in seinem Beitrag aus der Perspektive der Buchwissenschaft dem Verhältnis zwischen Lexikographie und Publishing Studies. Er geht der Frage nach, ob sie gleichermaßen als eigenständige Disziplinen betrachtet werden können. Darüber hinaus werden Gemeinsamkeiten und Unterschiede beider kultureller Praxen dargelegt, die durch die zunehmende Digitalisierung und digitale Transformationen vor neue Herausforderungen gestellt sind und deren Resultate auch für andere, noch im Entstehen befindliche, Disziplinen fruchtbar gemacht werden können. Vida Jesenšek behandelt in ihrem Beitrag die nichtwissenschaftliche Internetlexikographie und geht der Frage nach, inwiefern Produkte der nichtwissenschaftlichen (halb-)kollaborativen Internetlexikographie den fachlichen Anforderungen und den Qualitätsanforderungen der wissenschaftlichen Lexikographie entsprechen. Im Mittelpunkt ihres Interesses steht dabei die Rolle der lexikographischen Verantwortung (im Sinne von Herbert Ernst Wiegand), wozu sie auf die teilweise kollaborativ erarbeiteten allgemeinen zweisprachigen Pons-Internetwörterbücher Bezug nimmt. Ausgehend von Wiegands grundlegender Publikation „Wörterbuchforschung“ geht Carolin Müller-Spitzer auf Aufgabenbereiche und Fragen der Relevanz der Wörterbuchbenutzungsforschung ein. Angesichts der sich seit dem Erscheinen des Buches enorm veränderten Wörterbuchlandschaft plädiert sie für eine Fokuserweiterung: Ergebnisse der Wörterbuchbenutzungsforschung sollten nicht nur die Qualität der Wörterbücher verbessern, sondern methodologische Reflexionen zur Wichtigkeit der Nutzung statistischer Daten in Online-Wörterbüchern und zur Praxis kollaborativer Wörterbucharbeit liefern, um ihre Relevanz für die wissenschaftliche Lexikographie zu prüfen. Stefan J. Schierholz geht auf Fragen der metalexikographischen Theoriebildung im Sinne von Herbert Ernst Wiegand ein. Unter Berücksichtigung auch kritischer Stellungnahmen behandelt er zunächst terminologische Details des Verhältnisses von Lexikographie, Metalexikographie und Wörterbuchforschung. Im Hinblick auf Fragen der Vermittlung in der Lehre stellt er sodann verschiedene weiterführende Überlegungen an, die sich insbesondere an Studierende des „Europäischen Masters für Lexikographie“ (EMLex) in Erlangen richten, aber auch an solche, die den Studiengang künftig im Rahmen des „Erasmus Mundus Joint Master Degree“ studieren werden. Werner Wolski schließlich thematisiert „alltägliche“ Probleme der Lexikographie und Wörterbuchforschung. Sein satirischer Beitrag bietet Ausführungen zu problematischen Seiten heutiger lexikographischer Ergebnisdarstellungen und zu absonderlichen Einflussnahmen auf sprachliche

X

Vorwort

Äußerungsformen. Die Ausführungen münden in Probeartikeln eines als „Wörterbuchkarikatur“ zu bezeichnenden polemischen Konzepts mit dem Titel „Volkes Wort“, das vor dem Hintergrund der zuvor kritisch betrachteten gegenwärtigen Entwicklungen in der deutschen Wörterbuchlandschaft präsentiert wird. Was für die (Meta-)Lexikographie jetzt bleiben wird, ist ein in mancher Hinsicht noch unvollendetes (meta-)lexikographisches Leben. Aber für die Rolle Herbert Ernst Wiegands kann man durchaus eine Vollendung erkennen. Und es wird lange brauchen, bis wieder ein Forscher die Metalexikographie in der gleichen Qualität und in dem gleichen Umfang befruchten wird. Wir danken der Vinzl-Stiftung (Erlangen) und dem Erlanger „Interdisziplinären Zentrum für Lexikographie, Valenz und Kollokationsforschung“ für ihre finanzielle Unterstützung bei der Durchführung des Kolloquiums. Stefan J. Schierholz (Erlangen) Rufus H. Gouws (Stellenbosch) Zita Hollós (Budapest) Werner Wolski (Paderborn)

Inhalt Vorwort

V

Lexikographische Ergebnisdarstellungen: Fragen der Präsentation und Kommentierung Zita Hollós E-K OLLE X Überlegungen zu einem Online-Kollokationswörterbuch für DaF

3

Matthias Kammerer Das „Wörterbuch zur Lexikographie und Wörterbuchforschung“/ „Dictionary of Lexicography and Dictionary Research“ im RDF-Format Ein Vorschlag zur Diskussion 35 Lothar Lemnitzer Von Rutengängern und Lexikographen – offene und verdeckte Quellen für die Bedeutungsbeschreibung 57 Wolfgang Schweickard Giuges, Nesiron und Zabulismes Ein türkisch-spanisches Glossar von 1690

73

Lexikographie und Linguistik: wortartenbezogene Aspekte Milka Enčeva Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie 81 Rufus H. Gouws Increasing the scope of the treatment of specialized language terms in general language dictionaries 101 Klaus-Dieter Ludwig „Auf, auf, mein Herz, mit Freuden nimm wahr, was heut geschicht“ Das „Evangelische Gesangbuch“ – auch eine „Pflegestätte“ deutscher Archaismen? 119

XII

Inhalt

Giovanni Rovere Zur lexikographischen Darstellung der zeitgenössischen Germanismen Eine Problemskizze 131

Lexikographische Konzepte: übergreifende Fragestellungen – gestern und heute Henning Bergenholtz Eine Korpusanalyse ist eine überflüssige Zeremonie Thomas Herbst Wörterbuch war gestern Programm für ein unifiziertes Konstruktikon! Ulrich Schmitz Wörterbücher als Sehflächen

155

169

207

Sven Tarp The amazing vitality of things that don’t exist

227

Lexikographie und Metalexikographie: Status quo und Perspektiven Christoph Bläsi Was haben Metalexikographie und Publishing Studies miteinander zu tun? Das in beiden Fällen bestehende produktive, bidirektionale Verhältnis zu einer kulturellen Praxis als zentraler Befund 241 Vida Jesenšek Über die gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie 259 Carolin Müller-Spitzer Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre 275 Stefan J. Schierholz Einige kurze Überlegungen zur Metalexikographie in der Lehre Werner Wolski Lexikographie und Wörterbuchforschung im Alltag

309

295

Lexikographische Ergebnisdarstellungen: Fragen der Präsentation und Kommentierung

Zita Hollós

E-K OLLE X Überlegungen zu einem Online-Kollokationswörterbuch für DaF Abstract: The following article describes the relevance of an online mono- and bilingual collocations dictionary for German as a foreign language, based on the corpus- and databased bilingual syntagmatic dictionary SZÓ KAP TÁR /K OLLE X (2014) and presents first ideas for the realisation of E-K OLLE X . After a short introduction the second section shortly overviews the data on word combinations and collocations in online monolingual dictionaries for German (duden.de, elexico, DWDS) and in some automatically generated cooccurrence lists for the needs of language learners. Then the third section presents the concrete numbers of the K OLLE X -database with 2262 polysemous words and more than 61 000 word combinations and collocations. With the help of a webbased user interface and a dynamic data structure in the new data management system the K OLLE X can be extended easily. As a first result a bilingual learner’s dictionary for German collocations can be developed on the database of K OLLE X . As a first step, the data structure for verbal collocations with the structure A DV +V ERB and its extension with new datatypes is introduced. As a second step, the selection of different types of collocations in two or more collocator wordlists is shown, based on the German register of 10 313 cotextpartners. The solutions found for E-K OLLE X are presented by means of concrete examples, the so called collocator articles where the collocators are part of an intralingual collocation (cf. Hollós 2004, in print). This baseline study provides the first theoretical and practical steps towards new EK OLLE X -ressources.  

Keywords: collocations, corpuslinguistics, online dictionary, data bank, data bank management system Schlagwörter: Kollokationen, Korpuslinguistik, Onlinewörterbuch, Datenbank, Datenbankmanagementsystem

1 Einleitung Das Thema dieses Beitrags, erste Überlegungen zur Konzeption von „E-K OLLE X“ für Deutschlerner, ist sowohl in der Wörterbuchforschung als auch in der Lexikographie

Zita Hollós: Károli Gáspár Universität der Reformierten Kirche, Lehrstuhl für Deutsche Sprache und Literatur, Reviczky u. 4., 1088 Budapest, Ungarn, email: [email protected]

4

Zita Hollós

fest verankert:1 in der Wörterbuchforschung durch die Konzeption eines zweisprachigen syntagmatischen Lernerwörterbuchs (Hollós 2004) als Teil der Planungsphase des computergestützen lexikographischen Prozesses und in der Lexikographie durch TÁR// K OLLE X die Erstellung eines zweisprachigen Kollokationswörterbuchs, SZÓ KAP TÁR (2014), welche die anderen vier Phasen des computergestützten lexikographischen Prozesses (Phase der Datenbeschaffung, der Datenaufbereitung, der Datenauswertung und der Satz- und Druckvorbereitung) darstellen, denn: „Auch wenn die computergestützte Datenverwaltung eine größere Flexibilisierung bei der Abfolge der Arbeitsschritte ermöglicht und sich manche Teilhandlungen ganz oder teilweise automatisieren lassen, ist die in § 5–9 zugrunde gelegte Einteilung lexikographischer Prozesse in fünf Phasen weiterhin ein gutes Gerüst, um die wesentlichen Techniken der Computerunterstützung lexikographischer Prozesse, seien sie nun printlexikographisch oder medienneutral, zu skizzieren.“ (WLWF 2010: 17).

Den computergestützten lexikographischen Prozess sowie etliche theoretische Probleme bei der lexikographischen Darstellung der Kollokationen habe ich während der letzten zehn Jahre im Rahmen des KOLLE X- Projekts in verschiedenen Publikationen thematisiert.2 Das entstandene Printwörterbuch, SZÓ KAP TÁR TÁR// K OLLE X (2014) ist engstens mit der Korpuslinguistik und Informatik verbunden, da daran seit Anfang des Wörterbuchprojekts im Jahre 2005 mit eigens für dieses Kollokationswörterbuch extrahierten Korpusdaten aus dem Deutschen Wortschatz-Projekt (DW) und mit einem kontinuierlich weiterentwickelten Datenbanksystem als ein „Verbund einer Datenbank mit einem Datenbankmanagementsystem“ (WLWF 2. Bd.: 755) gearbeitet wurde. Da die Phasen der Datenbeschaffung, -aufbereitung und -auswertung größtenteils bereits 2009 abgeschlossen waren, ist bei der Planung von E-K OLLE X zuerst die Datenbank und das neue dynamische Datenbankmanagementsystem vorzustellen. Davor ist es unabdingbar, die Relevanz eines online, ein- bzw. zweisprachigen Kollokationswörterbuchs hinreichned zu begründen. Erst danach kann man über die Erweiterung des Datenangebotes und über die kontextadaptive Präsentation der Daten nachdenken. TÁR / K OLLE X (2014) in ein Online-KollokaBei der „Umwandlung“ von SZÓ KAP TÁR/ tionswörterbuch, E-K OLLE X , ist außerdem die bisherige lexikographische Praxis im Bereich der digitalen phraseologischen Spezialwörterbücher eingehend zu studieren, damit die neue Konzeption auf der Basis der „best practices“ in diesem phraseologischen Bereich entsteht.3 Auch dem Benutzerbezug und den Benutzungssituationen

1 Die Ausdrücke Wörterbuchforschung und Lexikographie benutze ich i.S.v. Wiegand (WLWF 2010: 4, 7). 2 Eine kurze Beschreibung des Projekts sowie die deutschsprachigen Publikationen dazu befinden sich auf der SZÓ KAP TÁR/K OL LE X- Homepage unter www.kollex.hu. 3 Zu den digitalen Wörterbüchern und neuen Entwicklungen sind unbedingt die drei Sammelbände von Granger/Paquot (2012), Gouws et al. (2013) und Mann (2014) zu nennen.

E-K OLLE X

5

muss Rechnung getragen werden, damit die Wörterbuchfunktionen, die auch im digitalen Bereich von größter Bedeutung sind, bestimmten, vordefinierten Datendistributionsstrukturen zugeordnet werden können.4 All das kann nicht in einem kurzen Beitrag geleistet werden, sondern muss Schritt für Schritt erarbeitet werden. Im Folgenden sollen Überlegungen zur Planung des maximalen Datenangebotes innerhalb der dynamischen Datenbank und in Ansätzen zur wörterbuchgegenstandsbedingten Verteilung der Daten, also über die Datendisributionsstruktur, abhängig von den wichtigsten Parametern des zu realisierenden E-K OLLE X angestellt werden: „Folglich sind Datenkomplexität und ein spezifisches Informationsangebot durchaus auch von linguistischer Seite erwünscht. Der wissenschaftlichen Lexikographie bleibt vor diesem Hintergrund deshalb vor allem der Auftrag, neue Arten der Datenmodellierung und des Informationsangebots auszuprobieren und auch neue, bisher unbekannte Arten des Zugriffs anzubieten. Eine Modellierung sollte möglichst ein Maximum des Darzustellenden vorsehen und anstreben.“ (Klosa/Müller-Spitzer 2011: 6).

Dies soll aber im Hinblick auf verschiedene Benutzerprofile (ein- oder zweisprachig) und Benutzungssituationen bzw. Wörterbuchfunktionen (Rezeptions-, Produktions-, Studier- und Translationsfunktion) geschehen und wird ausführlich in einem anderen Beitrag erarbeitet.

2 Zur Relevanz von E-K OLLE X Die Relevanz von E-K OLLE X lässt sich nicht nur dadurch erklären, dass m.W. kein solches Online-Spezialwörterbuch existiert, sondern auch dadurch, dass die einsprachigen, im Internet verfügbaren Wörterbücher (z.B. duden.de) oder Online-Informationssysteme wie DWDS (beta) oder elexiko (im OWID) für viele DaF-Lerner bestimmte spezifische Informationen über Wortverbindungen und Kollokationen trotz der enormen Entwicklung der letzten Jahre nicht enthalten oder ihnen zu kompliziert erscheinen.5 Ein weiteres Problem stellt die Einstellung des beispielhaften elexiko-Projektes am IDS Anfang 2015 dar, das noch am ehesten für Spachlerner attraktiv hätte werden

4 Zur Wörterbuchbenutzungsforschung für digitale Nachschlagewerke gibt es erfreulicherweise ein echtes Referenzwerk (Müller-Spitzer 2014), das viele empirische Studien u.a. über Benutzerbedürfnisse und Benutzungssituationen liefert. 5 Zur Zeit ist m.W. auch kein zweisprachiges Kollokationswörterbuch im Internet aufzufinden, abgesehen von den in der kollaborativen Lexikographie entstandenen, recht undurchschaubaren Listen von „äquivalenten“ Wortverbindungen, deren Qualität – trotz Beliebtheit bei vielen Fremdsprachlernern – sehr fragwürdig und daher keinesfalls Sprachlernern auf Grund- und Mittelstufe zu empfehlen ist.

6

Zita Hollós

können, weil es überschaubar, nicht zu kompliziert und didaktisch am besten aufbereitet war.

2.1 Kookkurenzen in deutschen Onlinewörterbüchern und -informationssystemen Im Folgenden möchte ich mit Hilfe von Screenshots zeigen, welche Daten und in welcher Präsentationsform in den oben genannten Nachschlagewerken (duden.de, DWDS (beta) und elexiko) den Benutzern, die nach typischen Wortverbindungen und Kollokationen suchen, zur Verfügung stehen. Das Lemma, das in den online einsprachigen, deutschen Nachschlagewerken nachgeschlagen wurde, ist das Verb ernähren. Substantive sind sowohl in Print- als auch in Onlinewörterbüchern auch wegen der Vielfalt der möglichen Kotextpartnerkategorien detaillierter und dadurch anschaulicher präsentiert. Die verbalen Kollokationen (mit dem Strukturtyp ADV +VERB) gehören zum stiefmütterlich behandelten Bereich der Kollokationsforschung und sind auch in der Wörterbuchforschung zu Kollokationswörterbüchern nicht hinreichend thematisiert.6 Aus Platzgründen beschränke ich mich auf die Behandlung des Verbs als Basis nach der didaktisch ausgerichteten Kollokationsauffassung i. S.v. Hausmann (1984). Es werden nur die typischen Adverbien, nicht jedoch die Substantive als mögliche Valenzrealisierungen unter die Lupe genommen, da dies zur Umkehrung der gerichteten Kollokationsrelation führt. Zu Produktionszwecken wurde seit jeher für die Kodierung der Kollokationen unter der Basis plädiert. Substantive als Kotextpartner und gleichzeitig als Valenzrealisierungen zu Verben aufzuführen, ist äußerst nützlich und – vor allem, um das Verb richtig verwendungsfähig zu machen – notwendig. Dieser Praxis folgen alle genannten Online-Nachschlagewerke TÁR// K OLLE X (2014), letzteres jedoch auf einer anderen theoretiund auch SZÓ KAP TÁR schen Grundlage (vgl. Hollós 2014b). Wenn wir jedoch am didaktisch orientierten Kollokationsbegriff festhalten wollen – vor allem wegen des Benutzerbezugs und der im Lernerwörterbuch SZÓ KAPTÁR// K OLLE X (2014) praktizierten Kollokationsdefinition –, müssen diese VerbindunTÁR gen vor allem unter dem jeweiligen Substantiv auffindbar sein. Dies zu prüfen, ist jedoch nicht mein Anliegen, und würde auch den Rahmen dieses Beitrags sprengen. In den nächsten Abschnitten folgt also die genaue Untersuchung der verbalen Kollokationen mit dem Stukturtyp ADV+VERB zu ernähren. Auf „duden.de“ findet man zu ernähren sogenannte „Typische Verbindungen“, die allerdings sememübergreifend, vermutlich automatisch und mit größter Wahrscheinlichkeit nach einem statistisch ermittelten Signifikanzmaß, gemäß der Darstellung durch unterschiedliche Buchstabengrößen, ermittelt wurden. Demnach sind die

6 Zu diesem Thema siehe Hollós (2014a).

E-K OLLE X

7

typischsten Adverbien (hier nach Stärke und dann alphabetisch sortiert): ausschließlich, fettarm, ungesund – künstlich – gesund, wie der ersten Abbildung zu entnehmen:7

Abb. 1: duden.de zu ernähren.

Im DWDS (beta) kann man eine erhebliche Verbesserung des Datenangebots und der Datenpräsentation beobachten. Im Vergleich zum früheren modularen Aufbau, wo die einzelnen Module wie Wörterbücher (z.B. DWDS-Wörterbuch oder Etymologisches Wörterbuch) und des Weiteren das OpenThesaurus, das DWDS-Wortprofil 3.0, die Korpusbelege aus verschiedenen Textarchiven etc. wie kleine Kästchen, als Bildschirm im Bildschirm, angeordnet waren (vgl. Abb. 2), geht die Beta-Version zu einer Untereinanderordnung der einzelnen Module über, d.h. sie lassen sich wie gewohnt von oben nach unten scrollen (vgl. Abb. 3). Durch kleine Schaltflächen im mittleren bzw. obersten linearen Bereich des Bildschirms ist auch ein schnelles, punktuelles Navigieren zwischen den Komponenten möglich. Auch das Umbenennen der einzelnen Elemente zeigt eine Änderung von der rein wissenschaftlichen digitalen Lexikographie hin zu einer benutzerfreundlichen Online-Lexikographie. Zum direkten Vergleich des Aufbaus des Bildschirms in beiden Versionen dienen die folgenden Abbildungen 2 und 3:

7 Das Adverb ausschließlich modifiziert nicht das Verb, sondern die Valenzrealisierungen, nach dem Muster jd/etw ernährt sich ausschließlichmit/von etw. Auf das andere Problem möchte ich an dieser Stelle nur hinweisen: Adverbien können sowohl vom Verb als auch vom ganzen Satz abhängen. Die Entscheidung, welcher Fall gerade bei den statistisch ermittelten Kookkurrenzen vorliegt, kann man nur durch Einsicht der KWICs treffen, die allerdings bei den Online-Nachschlagewerken nicht einsehbar sind.

8

Zita Hollós

Abb. 2: DWDS zu ernähren.

Abb. 3: DWDS (beta) zu ernähren.

Unter „Typische Verbindungen“ findet der Benutzer eine assoziogramm-ähnliche Darstellung der statistisch ermittelten, signifikanten Kookkurrenzen mit Signifikanzkennzeichnungen (Buchstabengröße), ähnlich wie auf duden.de, allerdings unsortiert

E-K OLLE X

9

(vgl. Abb. 4). Für detailliertere Informationen steht ein Link „DWDS-Wortprofil zu ernähren“ unter dem Bild zur Verfügung.8

Abb. 4: DWDS (beta) – Kookkurrenzen zu ernähren.

Im elexiko-Projekt, das ein Teil von OWID ist und Anfang 2015 wegen Ressourcenmangel am IDS eingestellt wurde, sind insgesamt 1868 Wortartikel vollständig, also redaktionell bearbeitet. Diese Lemmaliste kann man aus der Gesamtliste mit Hilfe der alphabetischen Lemmastrecken durch den Filter alle Artikel/redaktionell bearbeitete Artikel selber erstellen. Als Beispiel: Die B-Strecke umfasst 20176 Artikel, aber nur 161 redaktionell bearbeitete in 7 Teilstrecken. Fragwürdig bleibt die Auswahl der redaktionell bearbeiteten Artikel; z.B. ist Bauch nicht bearbeitet, aber Bauchmensch. Die genaue Verteilung auf die Lemmazeichentypen kann man nicht per Knopfdruck ermitteln, weil ein solcher Filter zur Wortart fehlt. Innerhalb der B-Lemmastrecke habe ich unter den 161 redaktionell bearbeiteten Artikeln 29 Verben gezählt. Das sind etwa 18%, was mehr oder weniger der Proportion der in einsprachigen deutschen Wörterbüchern bearbeiteten sprachlichen Einheiten nach Wortart entspricht. Die nächsten Bilder zeigen das Nachschlageergebnis von ernähren in zwei Abschnitten, da man zu den adverbialen Kotextpartnern, die auf die Frage „Wie?“ antworten, nur durch Scrollen kommt. Ähnlich wie im DWDS (beta) gibt es hier auch

8 Da es nicht auf den ersten Blick für den Benutzer einsehbar ist, werde ich dieses Tool unter 2.2. bei den automatisch generierten Wortlisten zu typischen Kookkurrenzen behandeln.

10

Zita Hollós

eine obere Navigationsleiste mit kleinen Schaltflächen – mit dem Unterschied, dass hier diese „Datenpäckchen“ modular aufbereitet wurden und durch einfaches Herunterscrollen nicht einsehbar sind:

Abb. 5: elexiko zu ernähren.

Abb. 6: elexiko – Adverbien zu ernähren.

E-K OLLE X

11

Bei beiden Online-Informationssystemen, DWDS und elexiko, kann man die Realisierung der von Storrer bereits 2001 aufgestellten sieben Thesen zur Nutzung des Hypertext-Konzeptes in der Lexikographie (vgl. Storrer 2001: 61–67) beobachten. Eine kleine Gegenüberstellung der Daten in Bezug auf Adverbien in den drei Online-Nachschlagewerken zeigt ein sehr unausgewogenes Bild. Als Vergleichsgrundlage dienen die Daten im elexiko, da sie am unfangreichsten und alphabetisch sortiert sind: Tabelle 1: Adverbien zu ernähren im elexiko, DWDS und duden.de. elexiko

DWDS ohne Wortprofil

ausgewogen

+

duden.de

ausreichend ballaststoffreich biologisch einseitig eiweißreich falsch fettarm

+

fettreich fleischlos gentechnikfrei gesund

+

+

intravenös kalorienbewusst künstlich

+

makrobiotisch mangelhaft pflanzlich richtig salzarm ungesund

+

unzureichend vegan

+

vegetarisch

+

vernünftig vielseitig

+

12

Zita Hollós

elexiko

DWDS ohne Wortprofil

duden.de

ausschließlich

+

vitaminreich vollwertig

hauptsächlich vorwiegend Σ: 28

Σ: 5

Σ: 4

Nicht zuletzt wird die Relevanz eines deutschen Online-Kollokationswörterbuchs (E-KOLLE X) mit folgenden Zitat von Storrer (2001), dessen Aussage in der Speziallexikographie für lexikalische Snytagmatik immer noch gültig ist, begründet: „Dass es sich bislang nur um Protoypen [kontextadaptiver Wörterbücher wie Petelenz (2001) – ergänzt von Z.H.] handelt, liegt weniger daran, dass nicht bekannt wäre, für welche usuellen Benutzungssitutionen typischerweise welche Klassen von Angaben relevant werden. Die Ursache liegt vielmehr darin, dass eine kontextadaptive Präsentation lexikalischer Information eine lingustisch motivierte und feinkörnige Modellierung der lexikographischen Daten voraussetzt (vgl. These 1).9 Eine derartige Modellierung erfordert, wenn sie auf der Grundlage eines gedruckten Wörterbuches erfolgt, einen relativ hohen Auf- und Nachbereitungsaufwand […] und lässt sich deshalb am schnellsten realisieren, wenn ein digitales Wörterbuch unabhängig von einer vorhandenen Printvorlage neu konzipiert werden kann.“ (Storrer 2001: 65).

Da KOLLE X für die adäquate Darstellung der Kollokationen neu konzipiert wurde (vgl. Hollós 2004) und von Anfang an mithilfe einer Datenbasis medienneutral, dennoch im Hinblick auf eine Printversion erarbeitet wurde, ist eine „lingustisch motivierte und feinkörnige Modellierung der lexikographischen Daten“ (ebd.) gewährleistet. Die Anpassung an mehrere Benutzer- und Benutzungsschnittstellen kann anhand des jetzigen Datenangebotes erfolgen; die ersten Pläne dazu werden im Kapitel 4 dargestellt werden.

2.2 Automatisch generierte Kookkurenzlisten Findigen und experimentierfreudigen Sprachlernern auf hohem Niveau stehen auch automatisch generierte deutsche Wortlisten als Extraktionen spezieller Sprach- und Analysewerkzeuge im DW (beta), in der CCDB oder im DWDS-Wortprofil zur Ver-

9 These 1 lautet: „Die konzeptuelle Datenmodellierung für digitale Wörterbücher sollte sich vorwiegend an linguistischen Entitäten und Strukturen ausrichten und nicht an den Strukturen eines Printwörterbuchs.“ (Storrer 2001: 61) [Fußnote ergänzt von Z.H.].

E-K OLLE X

13

fügung. Die folgenden Abbildungen zeigen das Ergebnis des Nachschlagens beim Wort ernähren im DW, in der CCDB und im DWDS-Wortprofil:

Abb. 7: Kookkurenzen zu ernähren im DW (beta) (siehe näher: unten Signifikante linke Nachbarn).

Abb. 8: Kookkurenzen zu ernähren in der CCDB (siehe näher: links, nach Wortart sortiert).

14

Zita Hollós

Abb. 9: Kookkurenzen zu ernähren im DWDS-Wortprofil (siehe näher: in der Mitte als Adverbialbestimmung).

Da diese Listen erstens nicht sememspezifisch sind, zweitens den Zugriff auf die Kotexte, also auf KWICs, nicht ermöglichen, und drittens nur im Falle der CCDB im rechten Analysefenster (vgl. Abb. 8), nicht aber bei DW (vgl. Abb. 7) oder DWDSWortprofil (vgl. Abb. 9) nach Wortarten zu sortieren sind, führen sie bei den meisten Benutzern ohne muttersprachliche Kompetenz kaum zu einer erfolgreichen Konsultationshandlung zu typischen Verwendungskontexten eines Wortes in einer bestimmten Bedeutung. DWDS-Wortprofil hat jedoch den großen Vorteil gegenüber dem DW und der CCDB, dass die Kookkurrenzen als Ergebnis eines Taggings nach der Funktion im Satz angeordnet sind. Auf der Projektseite von DWDS ist folgendes zu diesem Wortprofil-Modul zu lesen: „Das DWDS-Wortprofil ist das Ergebnis einer automatischen syntaktischen und statistischen Analyse sehr großer Korpora. Es liefert einen kompakten Überblick über die statistisch signifikanten syntagmatischen Beziehungen eines Wortes. Beispiele dieser sogenannten syntaktischen Relationen sind Attribut-Nomen Verbindungen wie schöne Bescherung oder Verb-Objekt Beziehungen wie Flasche entkorken. Die Darstellung der Relationen erfolgt in Form einer Schlagwortwolke oder in Tabellenform. Die Berechnung des DWDS-Wortprofils erfolgt in drei Etappen: Festlegung der zu extrahierenden syntaktischen Relationstypen, Extraktion der Relationen mittels einer automatischen syntaktischen Analyse und Bewertung der statistischen Signifikanz der extrahierten Relationen.“

E-K OLLE X

15

Die folgende Abbildung zeigt das Wortprofil zu ernähren im DWDS:

Abb. 10: DWDS (beta) – Wortprofil zu ernähren.

Eine nächste Gegenüberstellung der Daten in Bezug auf adverbiale Kookkurrenzen durch die drei Analysewerkzeuge im DW, in der CCDB und im DWDS-Wortprofil zeigt ebenfalls ein recht unausgewogenes Bild – hier aber vor allem, was die Qualität betrifft. Dies hängt selbstverständlich in erster Linie mit den den Analysen zugrunde gelegten Korpora und mit den Signifikanzmaßen zusammen. Nur bei der CCDB ist die Umsortierung auf höchster Ebene nach Signifikanz oder Alphabet möglich; und nur das DWDS-Wortprofil erlaubt die Modifizierung der Anzahl der ermittelten Kookkurrenzen. Als Ausgangspunkt dienen hier die Daten aus der CCDB, da sie am unfangreichsten sind. Natürlich ist diese Liste, wie alle anderen ermittelten, nach absteigender Signifikanzstärke sortiert:10

10 Es bestehen kleine Unterschiede hinsichtlich der Signifikanz, und dadurch in der Reihenfolge.

16

Zita Hollós

Tabelle 2: Statistisch signifikanteste adverbiale Kookkurrenzen zu ernähren in der CCDB, im DW und DWDS-Wortprofil; kursiv: alte Schreibweise, grau: flektierte Form. CCDB

DW

DWDS

gesund

+

+

ausschließlich vegetarisch

+ +

hauptsächlich ausreichend

+ +

+

vorwiegend

+ +

ungesund

+

+

pflanzlich

+

+

räuberisch bewusst

+

bewußt vernünftig

+

fettarm

+

+

vitaminreich

+

vollwertig

+

+

vegan

+

+

fleischlos

+

+

organisch sechsköpfig

karg ballaststoffreich

+

kargen nachtaktiv gentechnikfrei gesundheitsbewusst

+

gesundheitsbewußt abgestorben dreiköpfig artgerecht anständig fettreich kalorienbewußt wirbellos

+

+

E-K OLLE X

CCDB

DW

DWDS

ausgewogen

+

zwangsweise siebenköpfig zehnköpfig vielköpfig eiweißreich makrobiotisch kinderreich ausgewachsen stärkehaltig redlich autark trügerisch leidlich intravenös unverdaulich koscher schulpflichtig kümmerlich unausgewogen

gesünder selbst bewusster normal

+

falsch

+

richtig preisgünstig einseitig besser selber allein gut kalorienarm ausgewogener künstlich

17

18

Zita Hollós

CCDB

DW

DWDS abwechslungsreich überwiegend

Σ: 50

Σ: 25

11

Σ: irrelevant13

12

Auffällig ist hierbei die relativ niedrige Übereinstimmung der Kookkurrenzen (fett markiert), nämlich nur bei zehn Partnern. Ebenso auffällig ist die relativ hohe Anzahl solcher Kookkurrenzen, die aller Wahrscheinlichkeit nach nicht das Verb, sondern eine Valenzrealisierung (ausschließlich) oder die ganze Prädikation (selbst) modifizieren. Der Algorithmus von DW scheint dabei im Hinblick auf den ersteren Problemfall besser geeignet zu sein, während prädikationsbedingte Adverbien eher mit einsortiert wurden (siehe die zusätzlichen Partner am Ende der Tabelle). Die Zahl der Übereinstimmungen bei zwei Listen, ohne die obigen Fälle miteingerechnet zu haben, beträgt sieben. Tabelle 3 zeigt diejenigen Partner, die in allen Listen oder in zwei Listen vorkommen, und vergleicht das Ergebnis mit den Daten im KOLLE X: Tabelle 3: Kookkurrenzen zu ernähren, die in allen (in der CCDB, im DW und DWDS-Wortprofil) oder in zwei von den drei vorkommen, und ihr Verhältnis zu den Daten im K OLLE X . gemeinsame Kookkurrenzen in mind. zwei Listen

DW

DWDS

KOLLE X

gesund

+

+

+

vegetarisch

+

+

+

ausreichend

+

+

pflanzlich

+

+

bewusst

+

vernünftig

+ +

+

fettarm

+

+

vitaminreich

+

vollwertig

+

+

vegan

+

+

+

11 Wegen der alten Schreibweise tauchen manche Partner (z.B. bewusst – bewußt) zweimal auf; sie werden aber nur einmal gezählt. 12 Flektierte Wortformen als Kookkurrenzen sind zwar ganz besonders für Deutschlerner nützliche Daten, aber wegen der Vergleichbarkeit wurden sie bei der Zählung nicht berücksichtigt. 13 Da die ermittelte Anzahl der Partner beliebig ausgewählt werden kann, spielt sie keine Rolle. Ich habe nur die ersten 30 wegen der ermittelten Zahl der Kookkurrenzen im DW (25) ausgewertet.

E-K OLLE X

gemeinsame Kookkurrenzen in mind. zwei Listen

DW

DWDS

fleischlos

+

+

ballaststoffreich

+

gesundheitsbewusst

+

fettreich

+

+

ausgewogen

+

normal

+

falsch

+

19

KOLLE X

+

+ künstlich zwangsweise einseitig hochwertig kalorienbewusst

Σ: 15

15/14 Σ: 17

15/11 Σ: 14

15/7 Σ: 12

Die letzte Zeile, wo das Verhältnis ablesbar ist, zeigt, dass DW, der auch die Primärquelle für KOLLE X darstellt, das beste Selektionsergebnis erbracht hat. Das Ergebnis der Datenselektion von KOLLE X ist auf den ersten Blick vielleicht nicht so überzeugend, da es „nur“ sieben der fünfzehn in der Ergebnisliste enthält. Unter den in allen Listen vorhanden Partnern (fett markiert) ist dieses Verhältnis besser, nämlich fünf zu neun (grau hinterlegt). Wenn man diese fett hervorgehobenen Partner in Bezug auf KOLLE X näher betrachtet, bessert sich das Verhältnis, da es sich bei den nicht vorhandenen vier Partnern zweimal um Quasisynonyme handelt (vegan, fleischlos zu vegetarisch). Vollwertig ist stark schriftsprachlich, fast schon fachsprachlich, und ungesund lässt sich problemlos aus gesund bilden.14 Allerdings kommen drei von den fünf zusätzlichen Adverbien am Ende der Tabelle in einer der vorherigen Listen vor. Die anderen zwei Partner stammen aus Wörterbüchern, die zur Wörterbuchbasis von KOLLE X gehören.15 Einer der Gründe für die niedrige Zahl der Kotextpartner im KOLLE X zu ernähren ist die starke Datenselektion, die größtenteils zwischen 2005 und 2009 erfolgt ist. Damals war die Erstellung eines gedruckten, zweisprachigen Kollokationswörterbuchs für Lerner das wichtigste Anliegen. Zu der Zeit gab es keine Möglichkeit, die 14 Solche negierten Partner wurden bei der Selektion meistens, wenn sie nicht die signifikanteren waren, automatisch weggelassen. 15 Die Daten werden im Kapitel 4 wieder aufgegriffen; dabei wird ersichtlich, dass die Datenselektion, gemessen an der für K OLLE X praktizierten Kollokationspraxis, als sehr gut zu bewerten ist.

20

Zita Hollós

einsortierten Daten, die für die Printversion als zu viel erschienen, als Reserve zu markieren und für spätere Anwendungen nutzbar zu machen. Die Selektion war letztendlich – wie bereits in früheren Publikationen betont – sowohl korpusbasiert als auch wörterbuchbasiert. Einer der größten Vorteile von KOLLE X in diesem syntaktischen Bereich sind jedoch: die sememspezifische Datendistribution und die zusätzlichen morphosyntaktischen Angaben zu den typischen Verbindungen und Kollokationen.

3 Datenbanksystem 3.1 Datenbank von SZÓ KAP TÁR TÁR// K OLLE X als Basis von E-K OLLE X

16

K OLLE X und die dazugehörige webbasierte Datenbasis enthält 61 617 Wortverbindungen, Kollokationen und Kombinationen, vornehmlich aus Korpora, aber auch aus Wörterbüchern ermittelt. Darunter sind: – 48 757 Wortverbindungen/Kollokationen (primär aus dem Korpus gewonnene sememspezifische Kollokationen und freie Wortverbindungen, angeordnet nach der Signifikanz des gemeinsamen Vorkommens im Korpus, Valenzangaben inklusive): in den SUBS -, A DJ - und V ERB - Zonen der Substantivartikel sowie in der A DV - Zone der Verb- und Adjektiv-/Adverbartikel; – 2661 (mehrgliedrige) Kombinationen in den K OMB - Zonen aller Wörterbuchartikel; – 8590 (ein- oder mehrgliedrige) Wortverbindungen/Kollokationen mit Partnern als Valenzrealisierungen, die hinter den grau hinterlegten Valenzangaben wie Akk aufgelistet sind; – 1609 (ein- oder mehrgliedrige) Wortverbindungen/Kollokationen mit (Basis)-Partnern in den Subzonen +SUBS, +VERB und/oder +ADJ, aber ausschließlich bei Adjektivartikeln.  



Es enthält weiterhin 10 313 deutsche Partner/Kollokatoren im Nachspann, im „Register der deutschen Partner“, mit Angaben des sememspezifischen Vorkommens. Das Wörterbuch hat insgesamt 2262 Wörterbuchartikel: – 1274 Substantivartikel – 579 Verbartikel – 362 Adjektivartikel – 47 Adverbartikel  

16 Den Text über die konkreten Zahlen übernehme ich leicht verändert aus SZÓ KAP TÁR/K OLLE X (2014: 956).

E-K OLLE X

21

Um auch dem kontrastiven Aspekt Rechnung zu tragen, gibt es im K OLLE X 8378 interlinguale Kollokationen, die mit Warnsymbol „[G]“ markiert sind, also solche interferenzverdächtige Wortverbindungen, die bei der Sprachproduktion mit großer Wahrscheinlichkeit fehlerhaft produziert werden.

3.2 Vom statischen zum dynamischen Datenbankmanagementsystem Ähnlich wie bei Bergenholz/Bergenholz (2013) aus einer Datenbasis vier monofunktionale Wörterbücher konzipiert wurden, sollen auch aus der Datenbank von SZÓ KAP TÁR TÁR// K OLLE X mehrere ein- und zweisprachige Print- und Onlinewörterbücher für Kollokationen für verschienene Lernerniveaus entstehen. Die vorliegende Datenbank ist, was das Datenangebot betrifft, wesentlich umfangreicher, als das in Bergenholz/Bergenholz (2013) vorgestellte, aber dennoch nicht ausreichend für mehrere E-K OLLE X- Ressourcen.17 Die folgende Abbildung zeigt die jetzige Datenstruktur mit dem vollständigen Datenangebot, das zum obigen Zweck adaptiert und umgewandelt werden muss:

Abb. 11: Abstrakte, hierarchische Datenstruktur von E-KOLLE X.

17 Darauf komme ich im Kapitel 4 zurück.

22

Zita Hollós

Im Frühling 2015 wurde die Datenbasis auf ein webbasiertes User-Interface umgestellt. Die bisherige Desktop-Applikation wurde so ersetzt und ist nun passwortgeschützt unter www.kollex.hu/editor erreichbar. Die neuentwickelte, dynamische Datenstruktur des webbasierten Datenmanagementsystems ermöglicht die Tilgung und Hinzufügung neuer Datentypen ohne rückwirkenden Charakter (vgl. Abb. 12), d. h. die bereits in der Datenbasis enthaltenen Daten bleiben erhalten, währenddessen die neue, modifizierte Datenstruktur für die Generierung, Verwaltung und weitere Entwicklung unabhängiger ein- und zweisprachiger (Teil-)Wörterbücher, gedruckt oder online, gilt. So entstehen miteinander vernetzbare Wörterbuchressourcen. Die folgenden zwei Abbildungen zeigen Ausschnitte aus diesem webbasierten Tool im Web. Die erste Abbildung gibt einen Teil der Lemmaliste wieder, die zweite zeigt die Redaktionsschnittstelle des webbasierten Managementsystems:  

Abb. 12: Anfang der Lemmastrecke E im E-KOLLE X .

E-K OLLE X

23

Abb. 13: Anfang der Datenstruktur von ernähren im E-KOLLE X .

4 Datenangebot und dessen konzeptuelle Erweiterung für E-K OLLE X Die Vorstellung des Datenangebots im alten Datenbankmanagementsystem wurde bereits für Substantivlemmata und ansatzweise für Verblemmata in Hollós (2014b) geleistet. Auf solche selbstverständlichen Änderungen im Formkommentar, die die Aussprachedaten auch mit Audiodateien ergänzen oder die ungarischen Äquivalente in der einsprachigen Version durch (dem Lernerniveau angepasste) Bedeutungsparaphrasen ersetzen, sowie in den anderen zweisprachigen Versionen durch anderssprachige Äquivalente, die womöglich durch Bilddateien oder Videosequenzen ergänzt werden sollten, möchte ich nicht näher eingehen. Bei der vollständigen Planung des Datenangebots müssen selbstverständlich all diese Punkte angesprochen und detailliert geplant werden. Häufig fehlt es nicht an guten Vorsätzen, aber deren Umsetzung stößt nicht selten auf ressourcenbedingte Grenzen. Ich beschränke mich deshalb im Folgenden auf denjenigen Teil des Datenangebotes, der den Gegenstand von E-K OLLE X darstellt, nämlich auf die Kotextpartnerangaben, insbesondere auf den Kollokationstyp ADV+VERB, damit das bereits am Anfang untersuchte Wort ernähren und die dazugehörigen Daten weiterhin als Beispiel für das Datenangebot und dessen Erweiterung dienen können. Unter die Lupe genommen wird die Kotextpartnermodellierung in der Datenbasis von E-K OLLE X. Sie wird bei dem zweiten Semem von ernähren ‛eine Handlung, bei der Menschen oder

24

Zita Hollós

Tiere sich mit Essen versorgen‘18 vorgestellt, damit das Datendistributionsprogramm als „geordnete Menge von Instruktionen, wie die erhobenen lexikographischen Daten auf die integrierten Bauteile eines geplanten Wörterbuchs zu verteilen sind“ (WLWF 2. Bd.: 755), Schritt für Schritt vorgestellt werden kann.19 Die nächste Abbildung vermittelt einen ersten Eindruck von der jetzigen Datenkomplexität zu den Verblemmata:

Abb. 14: Datenstruktur der Verben im E-KOLLE X .

An der zweiten Abbildung, die mehr in die Datenstruktur der Verblemmata einzoomt, kann man bereits erkennen, dass jeder Datentyp eine namentliche und eine numerische ID (Identifikation) hat, und dass dieser gelöscht (Del), aber auch nochmal dazugegeben (Add) werden kann.

18 Die Bedeutungsparaphrase wurde leicht modifiziert aus dem Wörterbuchartikel zum Lemma ernähren im elexiko übernommen. OLL E X (2014 , 157) stellen einen Sonder19 Die MOD-Realisierungen zu ernähren 2 im SZÓ KAP TÁR/K OLLE fall dar, weil sie obligatorische Mitspieler des Verbs sind.

E-K OLLE X

25

Abb. 15: Datenstruktur der Kotextparter im E-KOLLE X .

Die Abkürzungen HU, EN, FR bedeuten, dass der Datentyp in allen drei geplanten zweisprachigen Teilwörterbüchern – im deutsch-ungarischen, deutsch-englischen und deutsch-französischen Kollokationswörterbuch – vorhanden ist; d.h.: Bei neuen Datentypen kann man das jeweilige Teilwörterbuch auswählen. Die darunter auffindbare Bezeichnung gibt die Spezifizierung des Datentyps an: ob das Datum frei einzugeben (vachar), aus einer Liste auszuwählen (select) ist, oder ganz rechts eine Bilddatei (picture) darstellt, die gerade neu der Datenstruktur zugefügt wurde.20 Für die Kotextpartner waren in der Datenstruktur von Anfang an Beispielangaben mit Quellenangaben (Typ „Példa 328“ und „Forrás 330“) vorgesehen. Aus Mangel an Ressourcen wurden sie nicht realisiert. Hierzu und später zu den intralingualen Kollokationen im Kollokator-Wörterverzeichnis bietet sich nicht nur die neue Suche nach Belegen an, sondern vor allem die Verlinkung der Kollokationen mit Korpusbelegen, wie im DWDS-Projekt (vgl. Geyken 2011). Am einfachsten ist dies – nach Einwilligung der Projektleitung von DWDS – durch externe Links auf die jeweilige Kollokation samt Belegen im DWDS zu realisieren. Mit Hilfe der dynamischen Datenstruktur ist die Modifizierung und Anpassung des Datenangebotes an die geplanten ein- und zweisprachigen E-K OLLE X- Ressourcen realisierbar.21

20 Zur Einsetzbarkeit der Bilder bei zweisprachigen Wörterbüchern siehe Petelenz (2001: 220–222), der die Überlegungen von Hupka aufgreift und ergänzt. 21 Hierzu ist unbedingt der Beitrag von Klosa/Müller-Spitzer (2011) über die Datenmodellierung für Internetwörterbücher zu erwähnen.

26

Zita Hollós

Im Folgenden werde ich mich auf das zweisprachige, deutsch-ungarische E-K OLLE X für Deutschlerner beschränken und diesbezüglich einige Vorschläge zur Erweiterung des Datenangebotes machen, ohne die Benutzungssituationen für die Sortierung der Daten und für ihren Zugriff miteinzubeziehen. Dies wird Thema eines anderen Beitrages. E-K OLLE X wurde – wie bereits in der Wörterbuchkonzeption (Hollós 2004) ansatzweise vorgestellt – von Anfang an mit mindestens zwei Wörterverzeichnissen, mit einem zu den Basen und einem zu den ausgewählten Kollokatoren, geplant sowie mit TÁR// K OLLE X (2014) als Printwörterbuch hat einem zusätzlichen Register. SZÓ KAP TÁR „nur“ das erste Wörterverzeichnis der Basen und das Register der 10 313 Kollokatoren, mit sememspezifischem Vorkommen unter ihrer jeweiligen Basis. E-K OLLE X wird mindestens zwei Wörterverzeichnisse, also eine bi- oder polyalphabetische, komplementär-repetitive, artikelheterogene Datendistribution haben. Geplant sind ein Wörterverzeichnis der Kollokatoren als Teil einer intralingualen Kollokation, und eines der Kollokatoren als Teil einer interlingualen Kollokation. Von besonderem Interesse für Deutschlerner sind sowohl die intra- als auch die interlingualen Kollokationen. Deshalb mussten parallel zur technischen Weiterentwicklung auch die theoretischen Probleme der Kollokationen weiterverfolgt werden. Die gesammelten, potenziellen adverbialen Kollokatoren – als Teil einer intralingualen Kollokation – wurden aus den Registerstrecken G und H überprüft, und nur die i.S. der Definition für intralinguale Kollokationen beschränkt kombinierbaren als Lemmakandidaten beibehalten.22 Als Ergebnis der Selektion und deren Kontrolle sind von den 595 adverbialen Kollokatoren mit G zuerst 79, dann 60 geblieben (die bei der Kontrolle gestrichenen erscheinen in der nachfolgenden Tabelle in grauer Schrift); gleichzeitig ist die Zahl der intralingualen Kollokationen von 139 auf 96 gesunken. Zu diesen Kollokatoren wurden gleichzeitig ihre aus der Kookkurrenzdatenbank (CCDB) gewonnenen, weiteren signifikanten Basis-Partner tabellarisch gesammelt und einige mit einer grauen Hinterlegung markiert, die auch in der KOLLE X-Datenbasis vorhanden waren (vgl. Tabelle 4). Nicht nur die Basis, sondern auch das zugehörige Semem wurde dabei angegeben (z.B. gastfreundlich – aufnehmen 2). Wenn die Basis als Lemma vorhanden war, aber der Kollokator (also die Kollokation selber) unter diesem Lemma nicht, wurde dies ebenfalls in einer separaten Spalte „L“ mit „x“ vermerkt. Auf diese Art und Weise kann man auch evtl. Selektionsfehler nachbearbeiten, die durch die riesigen zu bewältigenden Datenmengen leicht entstehen können. Wie man der Tabelle 4 entnehmen kann, war dies bei dieser Strecke nur einmal der Fall (galant – küssen). Die anderen Basen sind also (noch) keine Lemmata des Basisverzeichnisses, aber als Teil einer intralingualen Kollokation müssten sie im dazugehörigen Kollokator-Artikel aufgenommen werden.

22 Zur Definition der zwei Kollokationstypen verweise ich auf Hollós (2004) und Hollós (im Druck).

E-K OLLE X

27

Damit erklärt sich die zunächst bialphabetische, komplementär-repetitive Datendistribution. Wenn der Kollokator im KOLLE X verzeichnet, aber in der CCDB nicht vorhanden war, wurde dies mit dem Symbol „ø“ ebenfalls vermerkt. Dieser Aspekt ist deshalb bemerkenswert, weil die im KOLLE X kodifizierten Kollokationen zwar größtenteils korpusbasiert, nämlich dem Korpus des Projekts „Deutscher Wortschatz“ entnommen sind, aber auch aus Wörterbüchern stammen können. Das Korpus für die Gewinnung der intralingualen Kollokationen können jedoch nur die IDS-Korpora sein, weil auf deren Grundlage das Analysetool CCDB entwickelt wurde. Dieses Tool ermöglicht objektive Aussagen über die begrenzte Kombinierbarkeit der Kollokatoren. Mit dessen Hilfe ist es möglich, dies mit Daten zu belegen und zu dokumentieren. Nach all diesen Selektions- und Bearbeitungsvorgängen entstand eine komplexe Tabelle der Kollokatoren. Der folgende Ausschnitt zeigt das Ergebnis der Analyse für die Kollokatoren von galant bis gebührenfrei: Tabelle 4: Ausschnitt aus der Analysetabelle für die Kollokatoren von gähnend bis gebührenfrei. Kollokatoren

CCDB – Verb

L

galant

küssen

x

CCDB – Adj

L

Anmerkungen

verbeugen hinwegsehen verschweigen ø auffordern 3 ganzjährig

öffnen 3

geschont

sehr viele Partner

bewohnen

geschützt

vor allem als Partizip

bewirtschaften

gesichert

bespielen

nutzbar

beheizen

bewohnbar

vor allem als Partizip

befahrbar zugänglich eisfrei jagdbar schiffbar ø gültig 1 ganztägig

betreuen

geöffnet

verkehren

geschlossen

streiken 1

berufstätig

beaufsichtigen ø führen 5

16 Partner – zu viel, vor allem als Partizip

28

Zita Hollós

Kollokatoren

CCDB – Verb

L

CCDB – Adj

L

Anmerkungen

ø lernen 3 ganztags

gastfreundlich

gebannt

betreuen

geöffnet

verharren

berufstätig 1

ø arbeiten 1

bewölkt

ø unterrichten 1,2

ø beschäftigt 1

vor allem als Partizip

keine KWICs

aufnehmen 2

auch als Partizip

bewirten

vor allem als Partizip

schauen 3

sehr viele Partner

zuschauen 1 ø folgen 1 „zuhören“ gibt es

ø hören 2 ø stehen 1 7,2 gebetsmühlenhaft

wiederholen 1

beschworen-

repetieren gebieterisch

aufdrängen ø verlangen 4,3,1

gebietsweise

regnen 1 schneien 1

gebührenfrei

parken 2

erreichbar

umtauschen 2,1

benutzbar

ø einzahlen 1 abstellen

vor allem als Partizip

ergattern stornierern umbuchen anwählen

Der folgende vereinfachte Ausschnitt aus der Tabelle zur intralingualen Kollokationen mit ihren jeweiligen ungarischen Übersetzungen zeigt bei weitem nicht die ganze Komplexität der gesammelten Daten und Kollokationsanalysen, gibt aber einen guten Überblick über deren Endergebnis für die Kollokatoren als Teil einer intralingualen Kollokationen von geruhsam bis gewerblich:23

23 Die Tabelle übernehme ich aus Hollós (im Druck).

E-K OLLE X

29

Tabelle 5: Auszug aus der Tabelle der intralingualen verbalen Kollokationen anhand der Registerstrecke G, inter = interlinguale Kollokation. Deutsche intralinguale Kollokation (Kollokator Basis) GE RUHS AM GERUHSAM

inter

spazieren

GE SCHÄ FTSMÄSSIG GESCHÄFTSMÄSSIG

Ungarische Übersetzung der intralingualen Kollokation békésen sétál(gat)

kühl

hivatalosan hűvös, kimért kissé elutasító

GE SCHLIFFEN GESCHLIFFEN

reden

formailag tökéletesen kifinomultan / csiszolt stílusban beszél

GE SCHR AUBT GESCHRAUBT

reden

erőltetetten / modorosan beszél

GE SCHWOLLEN GESCHWOLLEN

reden

fontoskodvan beszél

GE SPENS TIS CH GESPENSTISCH

leer

félelmetesen kísértetiesen kihalt, néptelen

gespenstisch leise

kísértetiesen halk alig hallhat

gespenstisch still

kísértetiesen csendes zajtalan

gespenstisch still

kísértetiesen csendes békés

GE STELZT GESTELZT

reden

mesterkélten / természetellenesen beszél

scharf

x

minden részletében éles teljesen kivehető kontúrokkal

GESUNDHEIT SBEWUS ST sichAkk GESUNDHEITSBEWUSST ernähren

x

egészségére figyelve egészségesen / egészségtudatosan táplálkozik

GESTOC GE STOC HEN

gesundheitsbewusst leben

egészségtudatosan él

GE WAL TFREI EI erziehen jn GEWALTFR

erőszakmentesen / erőszak nélkül (fel)nevel vkit

Akk

sich

GEWANDT

bewegen

ügyesen mozog

in etwAkk/auf etwAkk gewandt steigen GEWERBLIC H (jm/an etwAkk) etwAkk GEWERBLICH vermieten

ügyesen / fürgén beszáll vmibe, felszáll vmire x

(kis)üzemi / (kis)ipari célokra kiad, bérbe ad, kölcsönöz (vkinek) vmit

Zusammenfassend lassen sich aufgrund der intra- und interlingualen Kollokationen zur Registerstrecke G aus KOLLE X folgende Analyseergebnisse formulieren: 1. Von den potenziellen adverbialen Kollokatoren (595) ist nur etwa ein Zehntel ein echter Kollokator, also ein Kollokator mit beschränktem Kollokationspotenzial und damit ein Bestandteil einer intralingualen Kollokation im Sinne von Hollós (2004) und Hollós (im Druck). 2. Unter den intralingualen Kollokationen (96) ist nur etwa ein Viertel (25) auch interlingual markiert, gehört also zu den intra- und interlingualen Kollokationen. 3. Bei den untersuchten Kollokatoren als Teil einer intralingualen Kollokation gibt es nur ganz wenige, durch deren Übersetzung ins Ungarische auch eine intralinguale Kollokation im Ungarischen entsteht; und wenn ja, bildet er mit anderen Verben eine ungarische intralinguale Kollokation. Deshalb scheinen in zwei

30

Zita Hollós

Sprachen äquivalente intralinguale Kollokationspaare sehr selten zu sein, was – in aller Deutlichkeit – für ihre gesonderte Kodifizierung in lexikographischen Nachschlagewerken spricht.24 Wirft man den Blick erneut auf die Kookkurrenzen zu ernähren und überprüft die Partner auf ihre begrenzte Kombinierbarkeit in der CCDB, bekommt man ein äußerst interessantes Ergebnis, das eindeutig für die Datenselektion im KOLLE X spricht. Wie oben aus der Tabelle 5 durch graue Hinterlegung ersichtlich, handelt es sich bei sich gesundheitsbewusst ernähren um eine intralinguale Kollokation. Von den neuen Kookkurrenzen in der Tabelle 6 sind alle – mit zwei Ausnahmen (gesund und ausreichend) – Teil einer intralingualen Kollokation mit der Basis ernähren. Sie kommen mindestens mit einem Verb – dies ist dann selbstverständlich ernähren –, aber mit nicht mehr als vier Verben vor. Die im KOLLE X nicht verzeichneten intralingualen Kollokationen sind synoymisch zu vegetarisch (fleischlos) oder zu speziell (vollwertig) oder beides (vegan). Tabelle 6: Kookkurrenzen zu ernähren, die in allen drei Listen (in der CCDB, im DW und DWDS-Wortprofil) vorkommen, und ihr Verhältnis zu K OLLE X. gemeinsame Kookkurrenzen DW in allen drei Listen

DWDS

K OLLE X

CCDB -V ER BEN

gesund

+

+

+

sehr viele Partner, ernähren an 1. Stelle

vegetarisch

+

+

+

ernähren, essen, kochen, füttern

ausreichend

+

+

pflanzlich

+

+

+

ernähren, gerben, färben

fettarm

+

+

+

ernähren, zubereiten

vollwertig

+

+

ersetzen, ernähren

vegan

+

+

ernähren

fleischlos

+

+

ernähren, essen

gesundheitsbewusst

+

+

sehr viele Partner, ernähren an 25. Stelle

+

ernähren

Da sich die auf das Web umgestellte Datenbank mit dynamischer Datenstruktur in der Testphase befindet, konnten damit noch keine Kollokator-Wörterbuchartikel generiert werden. Nur das alte Datenbankmanagementsystem ermöglicht also z.Z. die automatische Generierung von Kollokator-Artikeln.

24 Die gesonderte Markierung und Verzeichnung interlingualer Kollokationen sollte bei einem zweisprachigen Online-Kollokationswörterbuch eine Selbstverständlichkeit sein. Diese interlingualen Kollokationen als mögliche Interferenzfehler bei der Produktion deutscher Kollokationen sind von Sprache zu Sprache unterschiedlich und können typisiert werden (vgl. Hollós 2013).

E-K OLLE X

31

Die folgenden Testartikel wurden aus der Datenbasis anhand der Basis-Artikel generiert und stellen die Rohversion für die weitere redaktionelle Bearbeitung der Kollokator-Artikel von galant bis gebührenfrei dar: galant ADV + Verb kissé régi, galant auffordern↑ - - - gálánsan felkér  



ganztags ADV + Verb ganztags unterrichten↑ - - - egész nap tanít oktat ganztags unterrichten↑ - - - egész nap tanít ganztags arbeiten↑ - - - teljes munkaidőben/nyolc órában dolgozik ADV + Adj ganztags berufstätig↑ - - - teljes munkaidőben/nyolc órában dolgozó/hivatását gyakorló/ munkaviszonyban álló ganztags beschäftigt↑ - - - teljes munkaidőben/nyolc órában foglalkoztatott/alkalmazott  



















gastfreundlich ADJ + Subs csak jel, gastfreundlich Haus↑ - - - vendégszerető család/ház gastfreundlich Ort↑ - - - vendégszerető város/falu (lakossága) ADV + Verb gastfreundlich aufnehmen↑ - - - (nagy) vendégszeretettel/vendégszeretőn befogad/felvesz  











gebetsmühlenhaft ADV + Verb gebetsmühlenhaft wiederholen↑ - - - robot módjára (meg)ismétel  



gebietsweise ADV + Verb gebietsweise regnen↑ - - - egyes helyeken/elszórtan esik (az eső) gebietsweise schneien↑ - - - helyenként esik a hó/havazik  







gebührenfrei ADJ + Subs gebührenfrei Anruf↑ - - - díjmentes (telefon)hívás gebührenfrei Nummer↑ - - - díjmentesen hívható (telefon)szám gebührenfrei Leistung↑ - - - díjmentes/ingyenes juttatás(ok)/szolgáltatás(ok) gebührenfrei Studium↑ - - - díjmentes/államilag finanszírozott tanulmányok/képzés ADV + Verb gebührenfrei umtauschen↑ - - - díjmentesen (át)vált gebührenfrei umtauschen↑ - - - díjmentesen/illetékmentesen kicserél/becserél gebührenfrei einzahlen↑ - - - díjmentesen/illetékmentesen befizet gebührenfrei parken↑ - - - díjmentesen parkol  































Die obigen Wörterbuchartikel müssen dementsprechend für das zweite KollokatorWörterverzeichnis der intralingualen Kollokationen noch manuell ergänzt, verfeinert

32

Zita Hollós

und für die Benutzergruppe der fortgeschrittenen Lerner mit den Verben aus der CCDB ergänzt werden. Die Verweise werden in beiden Anwendungen immer automatisch generiert. Dadurch werden die Kollokationen des Basis- und Kollokatorverzeichnisses miteinander verknüpft und stehen somit für E-K OLLE X als Hyperlinks zur Verfügung. Die Layout-Formate als „Node Type“ können in der webbasierten Anwendung beliebig gewählt werden; sie werden automatisch für den Druck oder für die Onlinepublikation für alle Daten gleichen Typs übernommen.

5 Ausblick Anliegen dieses Beitrages war, die Relevanz von E-K OLLE X anhand von vorhandenen Onlinewörterbüchern und Analysetools aufzuzeigen, sein neues Datenbankmanagementsystem samt der Datenbank, dem webbasierten User-Interface und der Datenstruktur vorzustellen, sowie erste Überlegungen zur Erweiterung des Datenangebots im Hinblick auf den zentralen Wörterbuchgegenstand, den der Kollokationen, zu präsentieren. Dank der dynamischen Datenstruktur kann E-K OLLE X im Hinblick auf weitere einund zweisprachige (Teil-)Wörterbücher durch neue Angaben- bzw. Datentypen erweitert werden. E-K OLLE X wird die lexikographischen Potenziale von Onlinewörterbüchern gemäß der realen Möglichkeiten umsetzen; vgl. dazu Lemberg (2001: 73): – Aufhebung des begrenzten Druckumfangs – Hypertextualisierung – multimediale Aufbereitung lexikographischer Daten – mehrfache äußere Zugriffsstrukturen und vielfältige Suchmöglichkeiten – Interaktivität – Aufhebung eines statischen zugunsten eines dynamischen Wörterbuchs – Kooperation und Interaktion zwischen Lexikograph und Benutzer Des Weiteren sollten die wichtigsten Qualitätskriterien für digitale Wörterbücher, die sieben Thesen von Storrer (2001: 61–67), umgesetzt werden. Für eine adäquate Benutzeroberfläche sind die Ergebnisse der ersten breitangelegten Benutzungsforschung für Onlinewörterbücher (vgl. Müller-Spitzer/Koplenig/Töpel 2012) genau zu studieren. Auch die Anforderungen für Onlinewörterbücher, wie sie in der Wörterbuchkritik von Onlineressourcen bei Kemmer (2010) zu finden sind, müssen mitbedacht werden. Dann bleibt nur zu hoffen, dass E-K OLLE X nicht lediglich die Zahl der „Prototypen […] kontextadaptiver Wörterbücher“ (Storrer 2001: 65) bereichert, sondern zu einem didaktisch motivierten, benutzerfreundlichen digitalen Nachschlagewerk für deutsche Kollokationen entwickelt wird.

E-K OLLE X

33

6 Literatur 6.1 Monographien und Aufsätze Bergenholz, Inger/Bergenholz, Henning (2013): One Database, Four Monofunctional Dictionaries. In: Hermes. Journal of Language and Communication in Business 50, 119–125. Geyken, Alexander (2011): Die dynamische Verknüpfung von Kollokationen mit Korpusbelegen und deren Repräsentation im DWDS-Wörterbuch. In: Klosa, Annette/Müller-Spitzer, Carolin (Hrsg. 2011), 9–20. Gouws, Rufus H. et al. (2013) (eds.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/Boston: de Gruyter. Granger, Sylviane/Paquot, Magali (2012) (Hrsg.): Electronic Lexicography. Oxford: Oxford University Press. Hausmann, Franz Josef ( 1984): Wortschatzlernen ist Kollokationslernen. Zum Lehren und Lernen französischer Wortverbindungen. In: Praxis des neusprachlichen Unterrichts 31, 395–406. Hollós, Zita ( 2004): Lernerlexikographie: syntagmatisch. Konzeption für ein deutsch-ungarisches Lernerwörterbuch. Tübingen: Niemeyer. Hollós, Zita (2013): Interferenzkandidaten in zweisprachigen Lernerwörterbüchern, insbesondere im deutsch-ungarischen Kollokationslexikon KolleX. In: Lexicographica 29. Tübingen: Walter de Gruyter, 92–116. Hollós, Zita (2014a): Syntagmatik im KolleX: Die lexikographische Darstellung grammatischer Syntagmatik in einem zweisprachigen Kollokationslexikon für Deutschlerner. In: Domínguez Vázquez, María José/Mollica, Fabio/Nied Curcio, Martina (Hrsg.): Zweisprachige Lexikographie zwischen Translation und Didaktik. Berlin/Boston: Walter de Gruyter, 113–129. Hollós, Zita (2014b): Ein Stiefkind der Kollokationsforschung. Kollokationen mit Adverbien. In: Das Wort – ein weites Feld. Festschrift für Regina Hessky. Hrsg. v. Dringó-Horváth, Ida et al. Budapest: L’Harmattan Kiadó, 25–39. Hollós, Zita (im Druck): Korpusbasierte intra- und interlinguale Kollokationen. In: EUROPHRAS 2015. Computerised and Corpus-based Approaches to Phraseology: Monolingual and Multilingual Perspectives. [erscheint]. Kemmer, Katharina (2010): Onlinewörterbücher in der Wörterbuchkritik. Ein Evaluationsraster mit 39 Beurteilungskriterien. Mannheim: Institut für Deutsche Sprache. [Unter: http://pub.ids-mannheim.de/laufend/opal/pdf/opal2010-2.pdf ; letzter Zugriff: 06.08.2015]. Klosa, Annette/Müller-Spitzer, Carolin (2011) (Hrsg.): Datenmodellierung für Internetwörterbücher. 1. Arbeitsbericht des wissenschaftlichen Netzwerks „Internetlexikografie“. Mannheim: Institut für Deutsche Sprache. [Unter: http://pub.ids-mannheim.de/laufend/opal/pdf/opal2011-2.pdf ; letzter Zugriff: 06.08.2015]. Lemberg, Ingrid (2001): Aspekte der Online-Lexikographie für wissenschaftliche Wörterbücher. In: Lemberg, Ingrid/Schröder, Bernhard/Storrer, Angelika (Hrsg.): Chancen und Perspektiven computergestützter Lexikographie. Tübingen: Niemeyer, 71–91. Mann, Michael (2014) (Hrsg.): Digitale Lexikographie. Ein- und mehrsprachige elektronische Wörterbücher mit Deutsch: aktuelle Eintwicklungen und Analysen. Hildesheim/Zürich/New York: Georg Olms Verlag. Müller-Spitzer, Carolin/Koplenig, Alexander/Töpel, Antje (2012): Online dictionary use: Key findings from an empirical research project. In: Granger, Sylviane/Paquot, Magali (Hrsg.): Electronic Lexicography. Oxford: Oxford University Press, 425–457. Müller-Spitzer, Carolin (2014) (Hrsg.): Using Online Dictionaries. Berlin/Boston: Walter de Gruyter.

34

Zita Hollós

Petelenz, Krzysztof (2001): Das Informationsdesign auf der Speicherungsebene eines zweisprachigen Online-Wörterbuchs Polnisch-Deutsch. In: Lemberg, Ingrid/Schröder, Bernhard/Storrer, Angelika (Hrsg.): Chancen und Perspektiven computergestützter Lexikographie. Tübingen: Niemeyer, 199–228. Storrer, Angelika (2001): Digitale Wörterbücher als Hypertexte: Zur Nutzung des Hypertextkonzepts in der Lexikographie. In: Lemberg, Ingrid/Schröder, Bernhard/Storrer, Angelika (Hrsg.): Chancen und Perspektiven computergestützter Lexikographie. Tübingen: Niemeyer, 53–69. Wiegand, Herbert Ernst: Datenbanksystem. In: WLWF, Bd. 2. [in Vorbereitung]. Wiegand, Herbert Ernst: Datendistributionsprogramm. In: WLWF, Bd. 2. [in Vorbereitung].

6.2 Wörterbücher SZÓ KA P TÁR TÁR// K OLLE X = SZÓ KA P TÁR . Német–magyar SZÓkapcsolatTÁR. Korpuszalapú kollokációs tanulószótár. K OLLE X : deutsch-ungarisches KOLLokationsLEXikon. Korpusbasiertes Wörterbuch der Kollokationen. Deutsch als Fremdsprache. Szeged: Grimm Kiadó, 2014. WLWF = Wörterbuch zur Lexikographie und Wörterbuchforschung. Dictionary of Lexicography and Dictionary Research. Hrsg. von Wiegand, Herbert Ernst et al. Bd. 1, A-C, Berlin. New York: Walter de Gruyter, 2010. [Bd. 2 in Vorbereitung].

6.3 Links CCDB = Belica, Cyril: Kookkurrenzdatenbank CCDB. Eine korpuslinguistische Denk- und Experimentierplattform für die Erforschung und theoretische Begründung von systemisch-strukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs. 2001 ff., Institut für Deutsche Sprache, Mannheim. [Unter: http://corpora.ids-mannheim.de/ ccdb; letzter Zugriff: 06.08.2015]. duden.de = Wörterbuch Duden online. Bibliographisches Institut, 2013. [Unter: http://www.duden. de/woerterbuch; letzter Zugriff: 06.08.2015]. DW (beta) = Deutscher Wortschatz. In: Leipzig Corpora Collection. Universität Leipzig, Institut für Informatik, Abteilung Sprachverarbeitung, 1998–2015. [Unter: http://corpora.informatik.unileipzig.de ; letzter Zugriff: 06.08.2015]. DWDS (beta) = Das Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart [BETAVERSION]. Berlin-Brandenburgische Akademie der Wissenschaften. [Unter: http://zwei. dwds.de/wb ; letzter Zugriff: 06.08.2015]. elexiko = Das Online-Wörterbuch zur deutschen Gegenwartssprache. In: OWID. Online Wortschatz Informationssystem Deutsch. Institut für Deutsche Sprache, 2009–2015. [Unter: http://www. owid.de/wb/elexiko/start.html ; letzter Zugriff: 06.08.2015]. SZÓ KA P TÁR TÁR// K OLLE X -Homepage. [Unter: www.kollex.hu; letzter Zugriff: 06.08.2015].  

Matthias Kammerer

Das „Wörterbuch zur Lexikographie und Wörterbuchforschung“/„Dictionary of Lexicography and Dictionary Research“ im RDF-Format Ein Vorschlag zur Diskussion1 Abstract: This contribution deals with the Wörterbuch zur Lexikographie und Wörterbuchforschung / Dictionary of Lexicography and Dictionary Research that was initiated by Herbert Ernst Wiegand and is created mostly by him. As all dictionary data is available in XML format the question is how this valuable data can be used further. For this the representation in the Resource Description Framework (RDF) is introduced and discussed to support a »semantic web«. Step by step a more and more sophisticated representation of some central data is developed and presented. Concomitantly it becomes obvious that it is important to select the right namespace vocabulary to get a meaningful and unambiguous formal representation. Keywords: Dictionary of Lexicography and Dictionary Research, Resource Description Framework, RDF, XML, DTD, semantic web, SKOS, FOAF, linked open data Schlagwörter: Wörterbuch zur Lexikographie und Wörterbuchforschung, Resource Description Framework, RDF, XML, DTD, Semantic Web, SKOS, FOAF, Linked Open Data Man kann sich nicht enthalten, in allem eine Bedeutung zu suchen. Schiller an Goethe in einem Brief vom 29. August 1795 über Goethes „Märchen“

1 Einführende Bemerkungen Das „Wörterbuch zur Lexikographie und Wörterbuchforschung“ (WLWF) wurde von Beginn an – mit einfachsten Mitteln – im XML-Format erstellt.2 Dieses Format erlaubt

1 Diesen Beitrag widme ich meiner lieben Frau Anna. 2 Siehe hierzu Kammerer (2001[2002]), Wiegand (2003) und insbes. Wiegand (2001).

Matthias Kammerer: Graf-Eberstein-Str. 81, 76199 Karlsruhe, email: [email protected]

36

Matthias Kammerer

es nicht nur, die Daten in HTML zu publizieren (mittels XSLT), sondern auch für den hochwertigen Druck aufzubereiten (mittels XSL-FO) und – wie es hier in diesem Artikel geschehen soll – sich weiterführenden Fragen zuzuwenden, wie z.B. einer Repräsentation der Daten im Format des Resource Description Frameworks (RDF).3 Das „Resource Description Framework (RDF) für XML Syntax“ (= RDF/XML) ist in der Version 1.1 seit dem 25. Februar 2014 eine W3C Recommendation und hat damit die höchsten Weihen des World Wide Web Consortiums (W3C) erhalten, die das W3C zu vergeben hat. Die Intention von RDF ist – unabhängig davon, wie es repräsentiert wird, sei es im XML-Format (RDF/XML), in Turtle oder in dem Turtle erweiternden Standard TRIG (in dem im Gegensatz zu Turtle mehr als nur ein Graph dargestellt werden kann), N-Triples oder den N-Triples ebenfalls erweiternden Standard N-Quads –, ein Format an die Hand zu geben, das es erlaubt, im großen Gebäude des semantischen Webs Aussagen formal darzustellen4 und diese mittels RDFS (Resource Description Framework Schema) mit einer „Semantik“ zu versehen, so dass am Ende Maschinen diese Daten – wie es gerne im semantischen Web-Diskurs heißt – „verstehen“ (obwohl, genau genommen, Maschinen diese Daten in keiner Weise verstehen oder verstehen können; sie können lediglich diese Daten mit ungeheurer Geschwindigkeit regelbasiert manipulieren und damit den Eindruck erwecken, als verstünden sie die Daten; der Knackpunkt sind am Ende die Regeln).5 Tim Berners-Lee unterscheidet in Bezug auf Open Linked Data fünf Stufen: [Berners-Lee (2009), Abschnitt: “Is your Linked Open Data 5 Star?”] «  Available on the web (whatever format) but with an open licence, to be Open Data ««  Available as machine-readable structured data (e.g.[,] excel [!] instead of image scan of a table)

3 Es ist hier nicht der Ort, in die verschiedenen Technologien des Semantic Webs einzuführen. Einen guten Überblick kann man sich z.B. in dem kostenlosen Online-Kurs „Semantic Web Technologies (2013)“ auf dem openHPI (https://open.hpi.de) verschaffen. Zur Einführung in RDF seien die beiden Primer RDF-Primer und RDF-Primer 1.1 empfohlen, für das durchaus interessante RDFa (RDF in Attributes) RDFa-Primer. Wie auch sonst üblich, findet man die wichtigsten Dokumente zu Web(Quasi-)Standards beim W3C, insbesondere RDF-Concepts und RDF-Concepts 1.1, RDF-MIME-Type, RDF-Syntax und RDF-MS, RDF-Semantics und RDF-Semantics 1.1, RDF-Tests sowie RDF-Vocabulary. Speziell für RDFa sei noch auf RDFa-Authors, RDFa-Handbook und RDFa-Syntax hingewiesen. 4 Im RDF-Primer, Abschnitt 2, heißt es: “RDF is intended to provide a simple way to make statements about Web resources, e.g., Web pages.” Da beliebige Dinge einfach über eine URI eingeführt werden können, ist die Einschränkung “Web resources” am Ende keine echte Einschränkung mehr. 5 Interessanterweise ist hier RDF-Primer bereits überaus klar und deutlich, wenn es in Abschnitt 2.2 heißt: “[…] RDF provides a way to make statements that applications can more easily process. An application cannot actually ‘understand’ such statements, as noted already, any more than a database system ‘understands’ terms like ‘employee’ or ‘salary’ in processing a query like SELECT NAME FROM EMPLOYEE WHERE SALARY > 35000. However, if an application is appropriately written, it can deal with RDF statements in a way that makes it seem like it does understand them, just as a database system and its applications can do useful work in processing employee and payroll information without understanding ‘employee’ and ‘payroll’.” [Kursivierung: M.K.]

„Das WLWF im RDF-Format“

37

«««  as (2) plus non-proprietary format (e.g.[,] CSV instead of excel [!]) ««««  All the above plus, Use [!] open standards from W3C (RDF and SPARQL) to identify things, so that people can point at your stuff «««««  All the above, plus: Link your data to other people’s data to provide context

Während der erste Punkt m.W. einer grundsätzlichen rechtlichen Klärung mit dem Verlag Walter de Gruyter bedarf, geht es in diesem Beitrag hauptsächlich um den vierten Punkt, die Repräsentation in dem W3C-Standard RDF. Dabei soll nicht darüber hinweggetäuscht werden, dass die Veröffentlichung der Daten unter einer Open Licence die Conditio sine qua non für Open Linked Data ist. Neben den lizenzrechtlichen Fragen sollte man, noch bevor man sich überhaupt RDF zuwendet, auch die folgenden grundsätzlichen Überlegungen anstellen: – Unter welcher URL (Uniform Resource Locator) sollten die RDF-Seiten erreichbar sein (s. dazu z.B. Cool URIs 2008)? – Wie erreicht man es, dass diese URLs einfach und stabil sind und außerdem leicht verwaltet werden können (siehe dazu Cool URIs 2008, Abschnitt 4.5)? – Wie gewährleistet man, dass die URLs auch in Zukunft persistieren? Sollten deshalb PURLs (Persistent Uniform Resource Locator) eingesetzt werden, die man z.B. bei purl.org registrieren kann, oder, als Alternative, DOIs (Digital Object Identifier), die gerne von Verlagen genutzt werden, um stabile IDs für insbesondere wissenschaftliche Publikationen zu erhalten? – Sollte es neben der RDF-Repräsentation auch eine von Menschen lesbare Repräsentation geben? Wie sind dann beide Repräsentationsformate miteinander zu korrelieren? Wenn es um die konkrete Publikation eines RDF-Vokabulars geht, drängen sich u.a. die folgenden technischen Fragen auf: – Wann sind Hash-Namespaces, wann sind Slash-Namespaces zu bevorzugen? – Wie kann ein RDF-Dokument mit einer von Menschen lesbaren HTML-Repräsentation verbunden werden (sowohl technisch als auch logisch)? – Genügt für die HTML-Repräsentation jeweils ein einzelnes Dokument oder benötigt man dafür mehrere HTML-Dokumente? – Und schließlich ganz basal: Wie sieht eine gute RDF-Repräsentation aus? Auf welche anderen Vokabularien kann und sollte man zurückgreifen? Welche RDFRepräsentation ist – bezogen auf die Intention – maximal expressiv und semantisch korrekt? Nicht alle Fragen können in diesem kurzen Beitrag diskutiert werden. Stattdessen konzentriere ich mich auf mir wesentlich erscheinende Aspekte und treffe en passant Entscheidungen, wie z.B. die, dass für das WLWF persistente URLs verwendet werden sollten, die man z.B. bei purl.org registrieren kann. Schließlich muss ich hier noch explizit darauf hinweisen, dass ich auf bestehende Initiativen, Wörterbuchdaten im RDF-Format oder in anderen semantischen Web-

38

Matthias Kammerer

Technologien zu erfassen, nicht eingehe, ebenso wenig wie auf bestehende Wörterbücher im RDF-Format (wie z.B. Lexvo.org [http://www.lexvo.org/], WordNet [http://wordnet-rdf.princeton.edu/] oder die Initiative LEXML [http://www.lexml.de]). Damit kann dieser Beitrag als eine informelle Einführung in RDF gelesen werden, der teilweise auch die prinzipiellen Probleme einer RDFModellierung thematisiert.

2 Vorschlag für die technische RDF-Architektur Unter der Annahme, dass das WLWF eine PURL erhält, die eine permanente Referenzierung gewährleistet, stellt sich die Frage, ob das RDF mit einem Slash- oder HashNamespace zu erstellen ist. Dazu bemerkt das RDF-BPR:Vocab 2008: [RDF-BPR:Vocab (2008, Appendix B)] For small vocabularies, it may be most convenient to serve the entire vocabulary in a single Web access. Such a vocabulary would typically use a hash namespace, and a Web access (i.e., an HTTP GET request) for any term in the vocabulary would return a single information resource describing all of the terms in the vocabulary. A vocabulary that is large, to which additions are anticipated frequently, or that defines more data than a typical user application will want to access at one time, should be arranged so that progressively greater detail about the terms in the vocabulary may be retrieved through multiple Web accesses.

Zählt man die Termini, zu denen im WLWF Fachwörterbuchartikel existieren, ergibt sich für die Lemmastrecken derzeit das folgende Bild: – – – – – – –

A-Strecke: B-Strecke: C-Strecke: D-Strecke: E-Strecke: F-Strecke: G-Strecke:

1012 Fachwörterbuchartikel 298 Fachwörterbuchartikel 22 Fachwörterbuchartikel 213 Fachwörterbuchartikel 422 Fachwörterbuchartikel 126 Fachwörterbuchartikel 274 Fachwörterbuchartikel

Dies ergibt allein für die Strecken A bis G insgesamt 2367 Fachwörterbuchartikel und damit Termini, die bereits beschrieben sind. Im Hinblick auf die in den Best Practices formulierten Empfehlungen ist für das WLWF damit ein Slash-Namespace zu bevorzugen. Eine Repräsentation der Fachwörterbuchartikel des WLWF in RDF ist – das sei in diesem Beitrag zuerst einmal unhinterfragt angenommen – prinzipiell sinnvoll. Dabei muss man sich aber darüber im Klaren sein, dass RDF nicht in erster Linie für den menschlichen Benutzer, sondern für die Maschine gemacht ist. Schnell kann RDF, insbesondere in der XML-Notation (= RDF/XML), für den Menschen schwer verständ-

„Das WLWF im RDF-Format“

39

lich werden. Da für die Fachwörterbuchartikel des WLWFs bereits eine für Menschen lesbare und gestaltete XHTML-basierte Repräsentation existiert (die sich in den meisten Aspekten an die Layoutvorgaben im gedruckten Wörterbuch orientiert; siehe unten Abb. 2), wäre es von Vorteil, dass auch diese XHTML-Repräsentation für menschliche Benutzer zur Verfügung gestellt wird. Mithin wären also die RDF/XMLals auch die XHTML-Repräsentation parallel anzubieten; der HTTP Client (z.B. der Browser) müsste dann lediglich entscheiden, welche von beiden Repräsentationsformen zu verwenden ist. Für das WLWF genügt es allerdings, für jede Vokabel (d.h.: deutsches Lemma) genau ein XHTML-Dokument anzubieten. Auch wenn die Fachwörterbuchartikel im WLWF teilweise über mehrere Druckspalten gehen, gibt es m.E. keine Notwendigkeit, diese Daten in mehrere Dateien aufzuteilen. Schließlich ist noch in Betracht zu ziehen, dass sich gerade in der Wissenschaft mit zunehmendem Erkenntnisgewinn Dinge auch ändern – genauer gesagt: Eine Aussage, die zu einem Zeitpunkt t1, bezogen auf eine Theorie T zum Zeitpunkt t1 (= Tt1), korrekt und vollständig ist, zu einem Zeitpunkt t2, der nach t1 liegt, bezogen auf dieselbe Theorie, aber eben zum Zeitpunkt t2 (= Tt2), nicht mehr korrekt und/oder nicht mehr vollständig ist. Auch dieser, der Wissenschaft geradezu konstitutiv-inhärenten Eigenschaft trägt RDF durch eine ziemlich triviale Praxis Rechnung, indem beispielsweise dem Dateinamen oder dem Pfad das Datum im DIN-5008-Format der Aussage beigegeben wird in der Form von Jahr, Monat, Tag (z.B. „2015-08-24“). Zusammengefasst bedeutet dies, dass die Architektur folgende Eigenschaften aufweisen sollte: – Als URLs sollen PURLs verwendet werden, um eine persistente Referenzierung zu gewährleisten. – Aufgrund des Vokabelumfangs sollte ein Slash-Namespace verwendet werden. – Um den menschlichen Benutzer nicht außen vor zu lassen, und da die Fachwörterbuchartikel ohnehin bereits in einem von Menschen lesbaren XHTML-Format vorliegen bzw. konvertiert werden können, sollten die Daten neben dem RDF/ XML-Format auch alternativ im XHTML-Format angeboten werden. – Die Genese des Vokabulars kann durch geeignete Benennungskonventionen (sei es im Dateinamen, sei es im Pfad), ggf. alternativ auch mit Hilfe des Dublin Core Namespaces, verdeutlicht werden. Eine solche Architektur ist letztlich relativ einfach möglich; man vgl. dazu Recipe 4a mit dem Titel: „Extended configuration for a PURL ‚slash namespace‘, single HTML document“ in RDF-BPR:Vocab 2008 sowie den Abschnitt 4.2 mit dem Titel “303 URIs forwarding to One Generic Document”6 in Cool URIs 2008; zur Verdeutlichung diene Abb. 1.

6 “As PURL servers use a 302 response code and there is currently no way to configure them to use 303 response codes, existing vocabularies with http://purl.org slash namespaces servers do not

40

Matthias Kammerer

Abb. 1: Vorschlag für eine technische RDF-Architektur für das WLWF (vgl. auch Cool URIs 2008, Abschnitt 4.2)

3 Vorschläge für die RDF-Repräsentation Auf die Wiedergabe der Mikrostrukturbilder zum WLWF wird hier verzichtet und stattdessen auf Wiegand (2001) verwiesen. Viel wichtiger ist in diesem Zusammenhang, wie die Document Type Definition (DTD) für das WLWF aussieht, und zwar bezogen auf Fachwörterbuchartikel. Diese wird im Folgenden informell wiedergegeben:7

strictly conform to the current TAG recommendations.” (RDF-BPR:Vocab 2008, Appendix A.). Dessen ungeachtet, wird der Vorschlag hier für eine 302-Antwort (“Moved Temporarily”) statt einer 303Antwort (“See Other”) ausgearbeitet. 7 Diese Darstellung beruht auf den Ausführungen in Kammerer (2001[2002]), wobei hier gleich zwei Fehler korrigiert werden: nichttypographische Strukturanzeiger werden nicht mehr explizit modelliert und auch sonstige nichtdeterministische Strukturen (wie z.B. A → B, B?, B?) werden vermieden. Kurz zur Notation: Das Komma („,“) konkateniert Sequenzen, der senkrechte Strich („|“) exklusive Alternativen; fakultative Einheiten werden durch ein Fragezeichen („?“) gekennzeichnet, der Asterisk („*“) markiert Einheiten, die beliebig oft wiederholt werden können, die aber auch ganz fehlen dürfen,

„Das WLWF im RDF-Format“

41

[Informelle Darstellung der DTD des WLWFs] 01 Fachwörterbuchartikel ( 02 Formkommentar ( 03

Lemmazeichengestaltangabe_zugleich_Rechtschreibangabe ,

04

Homonymieangabe ? ,

05

Morphologieangabe (

06

(verdichtete_Genusangabe ? ,

07 08 09 10

Angabe_zur_Pluralbildung )| Wortartangabe ) ?

11 ) , 12 vorderer_semantischer_Kommentar_zugleich_vorderer_Kommentar_zum_Fachgegenstand ( 13

deutsch/englischer_semantischer_Subkommentar (

14

deutsche_Definiensangabe ,

15

englische_Definitionsangabe (

16

englische_Äquivalentangabe ,

17

englische_Definiensangabe

18

)

19

) ,

20

Subkommentar_zum_Fachgegenstand (

21

Angabetext_zum_Fachgegenstand

22

),

23

Subkommentar_zum_alternativen_Fachgegenstand (

24

Angabetext_zum_alternativen_Fachgegenstand

25

) ? ,

26

Subkommentar_zu_einem_Ausschnitt_aus_dem_terminologischen_Netz (

27

Angabe_zur_Synonymie (

28

Synonymangabe +

29

) ? ,

30

Angabe_zur_Antonymie (

31 32

Antonymangabe + ) ?

33

) ? ,

34

Subkommentar_zur_Verweisung (

35

Angabe_die_aus_klassenverschiedenen_Verweisangaben_besteht (

36

Verweisadressenangabe_mit_der_eine_Umtextadresse_genannt_wird * ,

37

Verweisadressenangabe_mit_der_eine_↲ lemmatische_Verweisaußenadresse_genannt_wird *

38

)

39

) ?

40 ), 41 rechter_Zwischenkommentar_zur_Literatur , (

während das Pluszeichen („+“) besagt, dass die betreffende Einheit beliebig oft, aber mindestens einmal vorhanden sein muss. Das Zeichen „↲“ kennzeichnet eine umbrochene Zeile (so auch in den übrigen Coding-Strecken). Runde Klammern („(“ und „)“) gruppieren Einheiten.

42

Matthias Kammerer

42

Literaturangabe + ,

43

Angabe_der_Autorennamensigle

44 ) 45 hinterer_semantischer_Kommentar_zugleich_hinterer_Kommentar_zum_Fachgegenstand ( 46

Angabe_zur_Äquivalenz (

47

afrikaansche_Äquivalentangabe ,

48

bulgarische_Äquivalentangabe ,

49

spanische_Äquivalentangabe ,

50

französische_Äquivalentangabe ,

51

italienische_Äquivalentangabe ,

52

ungarische_Äquivalentangabe ,

53

portugiesische_Äquivalentangabe ,

54 55

russische_Äquivalentangabe )

56 ) 57 )

Wie man sieht, steht der zu beschreibende Terminus, der in der deutschen Lemmazeichengestaltangabe genannt wird, in zehn verschiedenen Sprachen zur Verfügung: auf Deutsch (s. Zeile 3), Englisch (s. Zeile 16) sowie auf Afrikaans, Bulgarisch, Spanisch, Französisch, Italienisch, Ungarisch, Portugiesisch und Russisch (s. Zeile 47–54). Damit gibt es per se zehn Kandidaten, die als Identifikatoren dienen können, wenn man in irgendeiner Weise „sprechende“ Identifikatoren verwenden möchte. (Natürlich könnte man auch völlig abstrakte Identifikatoren verwenden). Um Eindeutigkeit zu gewährleisten, müssen diese mit der Homonymieangabe (rechts) erweitert werden, da die Äquivalente in allen zehn Sprachen prinzipiell Homonyme aufweisen können. Da im WLWF aber ausschließlich die deutschen Lemmazeichen Homonymieangaben haben, können nur die deutschen Lemmazeichen (und nicht z.B. die englischen oder russischen Äquivalente) als eindeutige Identifikatoren (i.S.v. unique identifiers, UIDs) zusammen mit der Homonymieangabe dienen – zumindest, was die vorliegende Datenbasis betrifft.8 An dieser Stelle muss man entscheiden, wie man mit homonymen Lemmazeichen umgehen will. Eine Option ist, dass immer dann, wenn keine Homonymie vorliegt, eine „0“ notiert wird, oder man lässt die Homonymenangabe einfach völlig weg; in allen anderen Fällen wird grundsätzlich die Homonymieangabe (z.B. „1“ oder „2“) unmittelbar angeschlossen, um die Eindeutigkeit zu garantieren. – Im Folgenden wird die erste Option gewählt und für nicht-homonyme Lemmazeichen immer eine „0“ angefügt.

8 Es ist klar, dass deutschsprachige IDs in einem anglophon dominierten Diskurs wenig Chancen auf Akzeptanz haben. Insofern wäre es wünschenswert, englischsprachige IDs zu haben.

„Das WLWF im RDF-Format“

43

Da Identifikatoren i.S.v. IDs vom Typ NAME sind,9 können zwar Sonderzeichen, wie die deutschen Umlaute und das deutsche ß, verwendet werden (siehe dazu die Bereiche [#xC0–#xD6] und [#xD8–#xF6]), nicht jedoch das Leerzeichen (U+0020 SPACE) oder Interpunktionszeichen, wie z.B. das Komma (U+002C COMMA) oder das Semikolon (U+003B SEMICOLON) – der Bindestrich (U+002D HYPHEN-MINUS) ist hingegen erlaubt (siehe die explizite Nennung in der NameChar-Produktionsregel). Eine Lösung für dieses Problem wäre, die Leerzeichen vollständig zu entfernen (auf die Gefahr hin, dass dadurch die Eindeutigkeit verloren geht, wie z.B. die Konjunktion sowenig im Gegensatz zu allen übrigen Schreibungen gemäß der neuen deutschen Rechtschreibung: so wenig) oder das Leerzeichen durch ein anderes Zeichen zu ersetzen, wie z.B. durch den Unterstrich „_“, das Pluszeichen „+“, wie in Wikis üblich, oder den Mittelpunkt „·“ (U+00B7 MIDDLE DOT), wie dies im Folgenden der Fall sein wird. Für die übrigen Interpunktionszeichen, die bei Mehrworttermini auftreten können, wird hier der Einfachheit wegen entschieden, diese zu entfernen, sofern sie nicht erlaubt sind (in der Annahme, dass diese semantisch nicht signifikant sind). Da angenommen wird, dass kein lexikographischer oder metalexikographischer Terminus des Deutschen mit einer Zahl beginnt, braucht auf die Forderung, dass eine ID nicht mit einer Ziffer beginnen darf, keine Rücksicht genommen zu werden – ansonsten könnte man ein geeignetes Präfix wählen, z.B. den Unterstrich „_“ (U+005F LOW LINE) oder „wlwf:“. Auf diese Weise erhält man für die ersten fünf Fachwörterbuchartikel aus der AStrecke des WLWFs die folgenden Identifikatoren: – Abbildungsverweis0 – ABC-Buch0 – ABC-Glossar0 – Abfragesprache0 – abgegrenztes·verweisvermittelndes·Angabetextsegment0 Wie man insbesondere am letzten Beispiel sieht, ist der Identifikator keineswegs eine Rechtschreibangabe. Diese Art von Daten zusammen mit den Äquivalenten sind in der RDF/XML-Datei zu codieren und werden weiter unten diskutiert. 9 Die Produktionsregeln für IDs sind gemäß der XML-Spezifikation die folgenden (vgl. XML 1.0, Abschnitt 2.3): Name ::= NameStartChar (NameChar)* NameStartChar ::= : | [A-Z] | _ | [a-z] | [#xC0-#xD6] | [#xD8-#xF6] | [#xF8-#x2FF] | [#x370-#x37D] | [#x37F-#x1FFF] | [#x200C-#x200D] | [#x2070-#x218F] | [#x2C00#x2FEF] | [#x3001-#xD7FF] | [#xF900-#xFDCF] | [#xFDF0-#xFFFD] | [#x10000#xEFFFF] NameChar ::= NameStartChar | - | . | [0–9] | #xB7 | [#x0300-#x036F] | [#x203F#x2040] Wichtig ist hier lediglich, dass eine ID nicht mit einer Zahl beginnen und kein Leerzeichen enthalten darf.

44

Matthias Kammerer

Auf der Grundlage des bisher ausgeführten könnte das „generische Dokument“ wie folgt aussehen (hier in dem etwas komplizierter zu lesenden RDF/XML unter Verwendung einer Base-URI, siehe Zeile 3; siehe dazu die Spezifikation unter XML Base 2009): [RDF/XML-Vorschlag für das „generische Dokument“] 01 02



11

12

13 14



15

16

17 18



19

20

21 22



23

24

25

27

28

Diese Darstellung sei hier ganz kurz erläutert: Nach der obligatorischen XML-Deklaration in Zeile 1 (es handelt sich in dieser Notationsweise um ein XML-Dokument) folgt das Wurzelelement RDF in Großbuchstaben. Dieses Element gehört dem Namespace rdf an, der, durch einen Doppelpunkt abgetrennt, davor steht. Jedes RDF/ XML-Dokument besitzt dieses Element als Wurzelelement. In den Zeilen 4 bis 6 werden alle verwendeten Namespaces deklariert. Außerdem wird in Zeile 3 eine BaseURL eingeführt, um die Notation zu verkürzen (z.B. müsste man sonst in Zeile 8 „“ schreiben etc.). Daraufhin folgen die einzelnen RDF-Beschreibungen, die

„Das WLWF im RDF-Format“

45

in dem Element rdf:Description enthalten sind. Dazu wird mit dem Attribut rdf:ID der Identifikator genannt, zu dem dann zwei Aussagen gemacht werden: isDefinedBy im RDF-Schema-Namespace rdfs und page (gemeint ist die HTMLHomepage) im FOAF-Namespace foaf (üblicherweise wird der Friend-of-a-friendNamespace für solche Zwecke verwendet; vgl. FOAF (2014)). Eine solche Liste zu erstellen, ist mittels XSLT und der beim WLWF zur Verfügung stehenden Datenbasis sehr einfach möglich. Mit dieser Modellierung ist dem Grundkonzept von RDF Genüge getan: Jede RDFAussage ist prinzipiell dreiteilig und besteht aus einem so bezeichneten Subject (oder auch: Resource; quasi der Redegegenstand), einem Predicate (oder auch: Property; quasi ein zweistelliger Relationsterm) und einem Object (die zweite Stelle im Relationsterm). Während das Object sowohl eine Zeichenkette als auch eine URI sein kann, muss die Resource eine URI sein – mittels http://wlwf.org/id/Abbildungs verweis0 ist eine solche URI gegeben. Die XHTML-Version der einzelnen Fachwörterbuchartikel kann bereits mit XSLTMitteln erzeugt werden; derzeit sieht sie z.B. wie folgt aus (für das Lemmazeichen gebundenes Platzhaltersymbol):

Abb. 2: XHTML-Version des Fachwörterbuchartikels zu gebundenes Platzhaltersymbol.

Die zentrale Frage, die sich jetzt stellt, ist: Wie sollen die in XHTML repräsentierten und in XML vorliegenden Daten in RDF dargestellt werden? Auf diese Frage gibt es m.E. keine eindeutige und einfache Antwort. Eine wichtige Eigenschaft von RDF ist, dass dieses Repräsentationsformat hinsichtlich der Modellierung sehr frei ist – eine geeignete Repräsentation muss erarbeitet werden. Die Formalisierung muss lediglich

46

Matthias Kammerer

ein korrektes XML-Dokument sein, eine Validierung gegen eine DTD ist nicht möglich (RDF-Prüfungstools sind z.B.: http://www.w3.org/RDF/Validator/ vom W3C oder http://rdf-translator.appspot.com/ von RDF-Translator).10 Auf der Basis des oben wiedergegebenen Fachwörterbuchartikels zu gebundenes Platzhaltersymbol und der bereits dargestellten DTD soll nun exemplarisch eine solche RDFRepräsentation erstellt werden. Die XML-Version des Fachwörterbuchartikels zu gebundenes Platzhaltersymbol sieht wie folgt aus: [XML-getaggter Wörterbuchartikel zu gebundenes Platzhaltersymbol] 01 02 03 04 05

06

gebundenes Platzhaltersymbol

07

0

08

09

10

11

Platzhaltersymbol, das ein Segment einer vorher im Wörterbuchartikel ↲

12

genannten Wortform vertritt 13

bound place-keeping symbol

14

place-keeping symbol substituting a segment of a word form that ↲ has previously been mentioned in the dictionary article

15

16

17

18

19

Gebundene Platzhaltersymbole finden sich häufig bei den ↲ flexionsmorphologischen Angaben zu Substantiven, wie z.B. in

20

'Aus·lauf·mo·dell 〈n; ‑s, ‑e; .. 〉


21

(bw)

22 23

Die Bindestriche „‑“ in „‑s“ und „‑e“ sind gebundene Platzhaltersymbole.

24

25

26

27

Angabe mit Kohäsionsanweisung

28

Platzhaltersymbol

29 30



10 “An RDF/XML document is only required to be well-formed XML; it is not intended to be validated against an XML DTD (or an XML Schema), and RDF-SYNTAX does not specify a normative DTD that could be used for validating arbitrary RDF/XML […]” (RDF-Primer, Appendix B).

„Das WLWF im RDF-Format“

31

32

33

34

Wiegand

35

1989

36

c

37

430

38

39

40 41 42 43

2005 355

HEW

44

45

46

47

gebonde plekhousimbool

48

свързан позиционен символ

49

símbolo de espacio fijo

50

symbole remplaçant lié

51

kötött adathelyettesítő jel

52

simbolo segnaposto legato

53

símbolo de ocupação de espaço fixado

54

47

связанный позиционный символ

55

56

57

Für die formale Darstellung der Lemmazeichen in den verschiedenen Sprachen bietet sich das Element title im Namespace von Dublin Core an (alternativ hätte man auch rdfs:label verwenden können).11 Um die verschiedenen Sprachen auseinander halten zu können, kann das Attribut xml:lang verwendet werden. Gemäß RFC 5646 kann die Sprache noch mit dem Land und sogar mit einem Datum erweitert werden, ab dem z.B. eine neue Rechtschreibung gilt, so dass man für die im WLWF verwendete Sprache “de-DE-1996” erhält, da es sich bei den deutschen Lemmazeichen um deutsche Lemmazeichen in Deutschland in der (konservativ angewendeten) neuen deutschen Rechtschreibung von 1996 handelt. Da die Äquivalente paarweise prinzipiell gleichwertig sind und damit auch die deutsche Lemmazeichengestalt-

11 Hier zeigt sich wieder, wie – in gewisser Weise – beliebig eine Formalisierung ist. Dies wird noch dadurch erschwert, dass die natürlichsprachlichen (!) und keineswegs formalisierten englischen Definitionen dieser Properties in den einzelnen Publikationen durchaus vage sind. So heißt es beispielsweise bei Dublin Core zu http://purl.org/dc/terms/title: “A name given to the resource.” Zu rdfs:label heißt es: “A triple of the form: R rdfs:label L states that L is a human readable label for R.” (Kursivierung: M.K.) Wie man weiter unten sehen wird, ist wahrscheinlich skos:prefLabel am besten geeignet – vorerst soll aber mit title von Dublin Core gearbeitet werden.

48

Matthias Kammerer

angabe – obwohl sie der Ausgangspunkt für die ID ist – keinen Vorrang vor allen übrigen Äquivalenten hat, sollten die Äquivalente als eine Menge zusammengefasst werden, auf deren Elemente keine Präzedenzrelation definiert ist; das entsprechende RDF-Konstrukt heißt Bag.12 Auf diese Weise erhält man letztlich: [RDF/XML-Vorschlag für gebundenes Platzhaltersymbol, Version 1] 01 02

08 09 10

= "http://purl.org/dc/terms/" = "http://wlwf.org/id/"



11

gebundenes Platzhaltersymbol

12

bound place-keeping symbol

13

gebonde plekhousimbool

14

свързан позиционен символ

15

símbolo de espacio fijo

16

symbole remplaçant lié

17

kötött adathelyettesítő jel

18

simbolo segnaposto legato

19

símbolo de ocupação de espaço fixado

20 21 22 23

связанный позиционный символ



24

Weiter oben wurde darauf hingewiesen, dass die XHTML-Version des Fachwörterbuchartikels einen Link mit einer Referenz auf das RDF-Format enthält; entsprechend kann mit dc:hasFormat auch eine Referenz auf die XHTML-Version gesetzt werden (siehe unten Zeile 16). Die Dublin Core Initiative hat vielerlei Properties im terms-Namespace http:// purl.org/dc/terms/ definiert, die die Verwaltung von Dokumenten ermöglicht, wie z.B. contributor, created, creator, dateAccepted, dateCopyrighted, hasVersion, isReplacedBy, issues, isVersionOf, license, modified, provenance, publisher, replaces, rights und rightsHolder. Diese können ebenfalls verwendet werden, um das Dokument hinsichtlich seiner Entstehungs- und Verwaltungsdaten zu charakterisieren; für dieses Beispiel wird

12 “A Bag (a resource having type rdf:bag) represents a group of resources of literals […] where there is no significance in the order of the members.” (RDF-Primer, Abschnitt 4.1)

„Das WLWF im RDF-Format“

49

created, creator, hasVersion, rights und rightsHolder verwendet (s. Zeile 17–21). Dabei wird sowohl für creator als auch rightsHolder ein leerer Knoten (blank node) erstellt, der eine Beschreibung (rdf:Description) mit der angegebenen ID referenziert. Auf diese Weise können komplexe Beschreibungen ausgelagert und wiederverwendet werden. Ein Beispiel für die Wiederverwendung ist die modifizierte unsortierte Liste von Äquivalenten (s. Zeile 24–26). Für jedes Äquivalent kann man nicht nur das einzelsprachliche Formativ angeben, sondern auch, wer für dieses Äquivalent als Erzeuger bzw. Übersetzer verantwortlich ist.13 Auch hier ist es wieder notwendig, die entsprechenden Beschreibungen mittels einer ID zu referenzieren. Für die persönlichen Daten (in diesem Beispiel für Herbert Ernst Wiegand, Zeile 47–53, und Rufus Hjalmar Gouws, Zeile 55–62), wird wieder – wie auch sonst üblich – der foaf-Namespace verwendet; dabei werden die Properties title (der hier nicht den Titel eines Buches etc. meint, sondern den akademischen Titel einer Person),14 firstName, lastName, birthday, mbox und phone exemplarisch verwendet. Daraus ergibt sich nun das folgende RDF/XML: [RDF/XML-Vorschlag für gebundenes Platzhaltersymbol, Version 2] 01 02

05

06

07 ]> 08

doc/gebundenes·Platzhaltersymbol0.html

17

2012–02–06

18

19

12

13 Da teilweise die Übersetzer gewechselt haben und aufgrund des frühen Todes von Prof. Dr. Pavel Petkov, dem Äquivalentbeiträger für das Bulgarische, kann im Einzelfall nicht mehr für alle Äquivalente angegeben werden, wer diese wann erstellt hat. 14 Hier ist zu beachten: “This property [i.e., title] is a candidate for deprecation in favour of ‘honorificPrefix’ following Portable Contacts usage.” (FOAF 2014).

50

Matthias Kammerer

20

Copyright 2012. ↲

21

22

All rights reserved.15

23

24

25

26

27 28



29

30

31 32

33

34

gebundenes ↲ Platzhaltersymbol

35

36 37 38 39 40

bound place-keeping symbol

41 42 43 44 45

gebonde plekhousimbool

46 47

48

Prof. em. Dr. ↲

49

Herbert Ernst

50

Wiegand

Dr. h.c. mult.

51

01–08

52

mailto:herbert.ernst.wiegand@↲ gs.uni-heidelberg.de

53

54 55

56

Prof. Dr.

57

Rufus Hjalmar

58

Gouws

59

01–30

15 Unter Beachtung der ersten Anforderung für Open Data (s. Berners-Lee 2009) wäre das Copyright hinsichtlich einer Open Licence entsprechend anzupassen.

„Das WLWF im RDF-Format“

60 61 62

51

+27 21 8082164 mailto:[email protected]

63 64

Besonders hingewiesen sei an dieser Stelle auf die Entity-Deklarationen in den Zeilen 3–6; diese ermöglichen eine verkürzte Schreibweise für die Werte von z.B. rdf: datatype. Als nächstes soll die deutsche und die englische Definiensangabe modelliert werden. Hier bietet sich m.E. insbesondere der skos Namespace an (SKOS = Simple Knowledge Organization System).16 Wie eigentlich nicht anders zu erwarten, gibt es m.W. nirgends ein Modell, das derart genau zwischen Definiendum, Definitor und Definiens unterscheidet, wie dies eigentlich schon lange eingeführt und in den Aufsätzen von Herbert Ernst Wiegand strikt terminologisch und sachlich verfolgt wird. Bereits an diesem basalen Punkt geht die metalexikographische Theorie von Herbert Ernst Wiegand weit über die Praxis »semantischer« Web-Vokabularien hinaus. Die Definiensangaben können einfach der Beschreibung für die einzelnen Äquivalente mittels skos:definition beigegeben werden, so dass man erhält (zusätzlich muss natürlich der skos-Namespace deklariert werden): [RDF/XML-Fragmentvorschlag für die Definiensangabe von gebundenes Platzhaltersymbol] 01 02

03

gebundenes Platzhaltersymbol

04

Platzhaltersymbol, das ein Segment einer ↲ vorher im Wörterbuchartikel genannten Wortform vertritt

05 06 07

08

bound place-keeping symbol

09

place-keeping symbol substituting a ↲ segment of a word form that has previously been mentioned in the ↲ dictionary article

10

Der Angabetext zum Fachgegenstand (AText-FG) als auch der optionale Angabetext zum alternativen Fachgegenstand (AText-aFG) können ganz entsprechend modelliert werden. In diesem Fall wird die Property skos:note – aus Ermangelung einer besseren Alternative – verwendet (hier wäre dringend eine bessere Lösung zu finden). Wenn beide Angabetexte vorhanden sind, müssten beide in dem RDF-Container rdf:

16 vgl. hierzu: SKOS-HTML (2009), SKOS-Primer (2009) und SKOS-Ref (2009).

52

Matthias Kammerer

Alt modelliert werden, wobei offen ist, wie die präferierte Beschreibung zu kennzeichnen ist. Der Angabetext zum Fachgegenstand hat einen enzyklopädischen Charakter; vorläufig soll er hier einfach ohne weitere semantische Auszeichnungen im nativen XMLFormat (alternativ könnte man auch das erzeugte HTML-Format verwenden) übernommen werden. Um dies zu ermöglichen, wird das Attribut rdf:parseType mit dem Wert Literal notiert. Dabei muss zusätzlich, falls gewünscht, das xml:langAttribut in das Wurzelelement des XML-Fragments kopiert werden, da die Sprachund die Base-Eigenschaft nicht vererbt werden.17 Das entsprechende Fragment lautet dann für gebundenes Platzhaltersymbol: [RDF/XML-Fragmentvorschlag für den Angabetext zum Fachgegenstand von gebundenes Platzhaltersymbol] 01 02

03

gebundenes Platzhaltersymbol

04

Platzhaltersymbol, das ein Segment einer ↲

05

06

vorher im Wörterbuchartikel genannten Wortform vertritt

07

Gebundene Platzhaltersymbole finden sich häufig bei den ↲

08

'Aus·lauf·mo·dell 〈n; ‑s, ‑e; ..〉


09

(bw)

flexionsmorphologischen Angaben zu Substantiven, wie z.B. in

10

Die Bindestriche „‑“ in „‑s“ und „‑e“ sind gebundene Platzhaltersymbole.

11

12

13

Am Ende dieses Beitrags soll auch eine RDF-Repräsentation für Synonymangaben vorgeschlagen werden, obwohl diese nicht im Fachwörterbuchartikel zu gebundenes Platzhaltersymbol enthalten sind. Für die Synonymangaben bietet sich explizit SKOS an mit skos:prefLabel und skos:altLabel; für falsche Schreibungen ist skos:hiddenLabel vorgesehen. Mit diesem Vokabular wären dann die deutsche Lemmazeichengestaltangabe sowie die Äquivalente nicht mehr als dcterms:title zu modellieren, sondern im skos-Namespace mit skos:prefLabel. Die Synonyme, die im WLWF nur für das Deutsche angegeben werden, wären dann mittels skos: altLabel zu modellieren. Zusätzlich kann man mit skos:altLabel auch noch erlaubte alternative Schreibungen nennen (z.B. orthographische Varianten innerhalb der neuen deutschen Rechtschreibung oder der Rechtschreibung vor 1996 etc.), da

17 “Contextual attributes, such as xml:lang and xml:base are not inherited from the RDF/XML document, and, if required, must […] be explicitly specified in the XML fragment.” (RDF-Primer, Abschnitt 4.5.).

„Das WLWF im RDF-Format“

53

diese Property nicht auf lexikalische Synonymie eingeschränkt ist. Das entsprechende Fragment hat dann die folgende Struktur, wobei wegen fehlender Synonyme zwei Platzhalter zur Verdeutlichung verwendet werden: [RDF/XML-Fragmentvorschlag für Synonymangaben von gebundenes Platzhaltersymbol] 01 02

03



04



05

[Synonym 1]

gebundenes Platzhaltersymbol Platzhaltersymbol, gebundenes 06

[Synonym 2]

07



08

Platzhaltersymbol, das ein Segment einer ↲

09

10

gebundenes Platzhalter-Symbol vorher im Wörterbuchartikel genannten Wortform vertritt

11

Gebundene Platzhaltersymbole finden sich häufig bei den ↲ flexionsmorphologischen Angaben zu Substantiven, wie z.B. in

12

'Aus·lauf·mo·dell 〈n; ‑s, ‑e; ..〉


13

(bw)

14

Die Bindestriche „‑“ in „‑s“ und „‑e“ sind gebundene Platzhaltersymbole.

15

16

17

In dem Bewusstsein, dass hier noch viele Fragen offen sind (z.B. wie die Antonymangaben oder die Literaturangaben modelliert werden könnten), wird an dieser Stelle die Darstellung abgebrochen.

4 Wozu das alles? Im Titel dieses Beitrags heißt es: „Ein Vorschlag zur Diskussion“. Damit sollen explizit die folgenden Fragen zur Diskussion gestellt werden: 1. Macht es Sinn, die Wörterbuchdaten des WLWFs in einer formalen semantischen Beschreibung zur Verfügung zu stellen? 2. Und allgemeiner gefragt: Macht es überhaupt Sinn, Wörterbuchdaten (von Wörterbüchern beliebigen Typs) in einer semantischen Beschreibungssprache zu formalisieren? Mit anderen Worten: Was ist der Use Case für eine solche Formalisierung? 3. Ist der hier gewählte und vorgeschlagene Weg wünschenswert und gangbar? 4. Welche Alternativen gibt es? Was sind deren Vor- und Nachteile?

54

5.

6.

7.

Matthias Kammerer

In welchen größeren Zusammenhang muss eine solche Formalisierung gestellt werden? (Stichwörter hier: Abfragemöglichkeiten mit SPARQL, Erstellung einer Ontologie mit der Web Ontology Language OWL etc.?) Wie ist auf lange Sicht die technische Unterstützung? (Es gibt viele „offizielle“ Standards –: Sie werden aber erst dann zu einem „echten“ Standard, wenn dieser auch von der Industrie und den Tools angewendet wird, wie z.B. RDFa: Aus HTML-Seiten, die mit RDFa [oder auch mit Microformats oder mit HTML5-Microdata] angereichert sind, erzeugt Google in seinem Suchergebnis sog. Rich Snippets mit zusätzlichen Informationen). Wenn tatsächlich eine Formalisierung angestrebt werden sollte: Was sind die nächsten konkreten (!) Schritte? Und: In welchem Format?

Diese Fragen sind durchaus nicht rhetorisch gemeint; lässt sich die Sinnfrage bejahen, gibt es noch viel zu tun auf dem Wege zu einer „semantischen“ Repräsentation des WLWFs hin zu einem „semantischen“ Web.

5 Literatur Für alle nachfolgend genannten URLs gilt: letzter Zugriff: 2015-08-27. Berners-Lee 2009 = Tim Berners-Lee: Linked Data. 2006-07-27, last change: 2009/06/18 18:24:33. [http://www.w3.org/DesignIssues/LinkedData.html]. Cool URIs 2008 = Cool URIs for the Semantic Web. W3C Interest Group Note 03 December 2008. Editors: Leo Sauermann, Richard Cyganiak. Verwendete Version: [http://www.w3.org/TR/2008/ NOTE-cooluris-20081203/]. Neueste Version: [http://www.w3.org/TR/cooluris/]. FOAF 2014 = FOAF Vocabulary Specification 0.99. Namespace Document 14 January 2014 – Paddington Edition. Authors: Dan Brickley, Libby Miller. Verwendete Version: [http://xmlns.com/foaf/spec/ 20140114.html]. Neueste Version: [http://xmlns.com/foaf/spec/]. Kammerer 2001[2002] = Matthias Kammerer: XML getaggte Wörterbuchartikel. Ein Bericht aus der Praxis des Wörterbuchs zur Lexikographie und Wörterbuchforschung. In: Lexicographica 17. 2001 [erschienen: 2002], 249–301. RDF-BPR:Vocab 2008 = Best Practice Recipes for Publishing RDF Vocabularies. W3C Working Group Note 28 August 2008. Editors: Diego Berrueta, Jon Phipps. Verwendete Version: [http://www. w3.org/TR/2008/NOTE-swbp-vocab-pub-20080828/. Neueste Version: [http://www.w3.org/TR/ swbp-vocab-pub/]. RDF-Concepts 1.1 = RDF 1.1 Concepts and Abstract Syntax. W3C Recommendation 25 February 2014. Editors: Richard Cyganiak, David Wood, Markus Lanthaler. Verwendete Version: [http://www.w3. org/TR/2014/REC-rdf11-concepts-20140225/]. Neueste Version: [http://www.w3.org/TR/rdf11concepts/]. RDF-Concepts = Resource Description Framework (RDF): Concepts and Abstract: Syntax. W3C Recommendation 10 February 2004. Editors: Graham Klyne, Jeremy J. Carroll. Verwendete Version: [http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/]. Neueste Version: [http://www.w3. org/TR/rdf-concepts/]. RDF-MIME-Type = Media Types. (2015-08-21) [http://www.iana.org/assignments/media-types/]. RDF-MS = Resource Description Framework (RDF): Model and Syntax Specification. World Wide Web Consortium, 22 February 1999. Editors: Ora Lassila, Ralph R. Swick. Verwendete Version:

„Das WLWF im RDF-Format“

55

[http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/]. Neueste Version: [http://www.w3. org/TR/REC-rdf-syntax/]. RDF-Primer 1.1 = RDF 1.1 Primer. W3C Working Group Note 24 June 2014. Editors: Guus Schreiber, Yves Raimond. Verwendete Version: [http://www.w3.org/TR/2014/NOTE-rdf11-primer-20140624/]. Neueste Version: [http://www.w3.org/TR/rdf11-primer/]. RDF-Primer = RDF Primer, W3C Recommendation, 10 February 2004. Editors: Frank Manola, Eric Miller. Verwendete Version: [http://www.w3.org/TR/2004/REC-rdf-primer-20040210/]. Neueste Version: [http://www.w3.org/TR/rdf-primer/]. RDF-Schema 1.1 = RDF Schema 1.1. W3C Recommendation 25 February 2014. Editors: Dan Brickley, R.V. Guha. Verwendete Version: [http://www.w3.org/TR/2014/REC-rdf-schema-20140225/]. Neueste Version: [http://www.w3.org/TR/rdf-schema/]. RDF-Semantics 1.1 = RDF 1.1 Semantics. W3C Recommendation 25 February 2014. Editors: Patrick J. Hayes, Peter F. Patel-Schneide. Verwendete Version: [http://www.w3.org/TR/2014/REC-rdf11mt20140225/]. Neueste Version: [http://www.w3.org/TR/rdf11-mt/]. RDF-Semantics = RDF Semantics, W3C Recommendation 10 February 2004. Editor: Patrick Hayes. Verwendete Version: [http://www.w3.org/TR/2004/REC-rdf-schema-20040210/]. Neueste Version: [http://www.w3.org/TR/rdf-mt/]. RDF-Syntax 1.1 = RDF 1.1 XML Syntax. W3C Recommendation 25 February 2014. Editors: Fabien Gandon, Guus Schreiber. Verwendete Version: [http://www.w3.org/TR/2014/REC-rdf-syntax-grammar20140225/]. Neueste Version: [http://www.w3.org/TR/rdf-syntax-grammar/]. RDF-Syntax = RDF/XML Syntax Specification (Revised). W3C Recommendation, 10 February 2004. Editor: Dave Beckett. Verwendete Version: [http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/]. Neueste Version: [http://www.w3.org/TR/rdf-syntax-grammar/]. RDF-Tests = RDF Test Cases. W3C Recommendation 10 February 2004. Editors: Jan Gran, Dave Beckett. Verwendete Version: [http://www.w3.org/TR/2004/REC-rdf-testcases-20040210/]. Neueste Version: [http://www.w3.org/TR/rdf-testcases/]. RDF-Vocabulary = RDF Vocabulary Description Language 1.0: RDF Schema. W3C Recommendation 10 February 2004. Editors: Dan Brickley, R. V. Guha. Verwendete Version: [http://www.w3.org/ TR/2004/REC-rdf-schema-20040210/]. Neueste Version: [http://www.w3.org/TR/rdf-schema/]. RDFa-Authors = RDFa for HTML Authors. Editor: Steven Pemberton. Version date: 2009-05-14. Verwendete Version: [http://www.w3.org/MarkUp/2009/rdfa-for-html-authors]. RDFa-Handbook = The RDFa Handbook. By Mark Birbeck. Version: July 7, 2009–12:46pm. Verwendete Version: [http://webbackplane.com/rdfa-handbook/]. RDFa-Primer = RDFa Primer. Bridging the Human and Data Webs. W3C Working Group Note 14 October 2008. Editors: Ben Adida, Mark Birbeck. Verwendete Version: [http://www.w3.org/TR/2008/ NOTE-xhtml-rdfa-primer-20081014/]. Neueste Version: [http://www.w3.org/TR/xhtml-rdfa-primer/]. RDFa-Syntax = RDFa in XHTML: Syntax and Processing. A collection of attributes and processing rules for extending XHTML to support RDF. W3C Recommendation 14 October 2008. Editors: Ben Adida, Mark Birbeck, Shane McCarron, Steven Pemberton. Verwendete Version: [http://www.w3.org/ TR/2008/REC-rdfa-syntax-20081014/]. Neueste Version: [http://www.w3.org/TR/rdfa-syntax/]. RFC 5646 = Network Working Group: Request for Comments [RFC] 5646: Tags for Identifying Languages. BCP 47. September 2009. Editors: A. Phillips and M. Davis. Verwendete Version: [https:// tools.ietf.org/html/rfc5646]. SKOSCore = SKOS Core Vocabulary Specification. W3C Working Draft 10 May 2005. Editors: Alistair Miles, CCLRC; Dan Brickley, W3C. Verwendete Version: [http://www.w3.org/TR/2005/WD-swbpskos-core-spec-20050510]. Neueste Version: [http://www.w3.org/TR/swbp-skos-core-spec]. SKOS-HTML 2009 = SKOS Simple Knowledge Organization System Namespace Document – HTML Variant. 18 August 2009 Recommendation Edition. Authors: Alistair Miles, Sean Bechhofer. Ver-

56

Matthias Kammerer

wendete Version: [http://www.w3.org/TR/2009/REC-skos-reference-20090818/skos.html]. Neueste Version: [http://www.w3.org/TR/skos-reference/skos.html]. SKOS-Primer 2009 = SKOS Simple Knowledge Organization System Primer. W3C Working Group Note 18 August 2009. Editors: Antoine Isaac, Ed Summers. Verwendete Version: [http://www. w3.org/TR/2009/NOTE-skos-primer-20090818/]. Neueste Version: [http://www.w3.org/TR/ skos-primer]. SKOS-Ref 2009 = SKOS Simple Knowledge Organization System. Reference. W3C Recommendation 18 August 2009. Editors: Alistair Miles, Sean Bechhofer. Verwendete Version: [http://www.w3. org/TR/2009/REC-skos-reference-20090818/]. Neueste Version: [http://www.w3.org/TR/skosreference]. Wiegand 2001 = Herbert Ernst Wiegand: [Entwurf zu:] Kapitel „Wörterbuchartikel“ aus dem Instruktionsbuch des „Wörterbuchs zur Lexikographie und Wörterbuchforschung“ (WLWF). Typoskript. Heidelberg: 2001. Wiegand 2003 = Herbert Ernst Wiegand: Wörterbuch zur Lexikographie und Wörterbuchforschung (WLWF). Dictionary of Lexicography and Dictionary Research. In: Wissenschaftliche Lexikographie im deutschsprachigen Raum im Auftrag der Heidelberger Akademie der Wissenschaften. Hrsg. v. Thomas Städtler. Heidelberg: Universitätsverlag Winter 2003, 417–437. WLWF = Wörterbuch zur Lexikographie und Wörterbuchforschung / Dictionary of Lexicography and Dictionary Research. Mit englischen Übersetzungen der Umtexte und Definitionen sowie Äquivalenten in neun Sprachen/With English translations of the outer texts and definitions as well as equivalents in nine languages. Hrsg. u. bearb. v./Ed. and compiled by Herbert Ernst Wiegand, Michael Beißwenger, Rufus H. Gouws, Matthias Kammerer, Angelika Storrer, Werner Wolski, unter Mitarbeit von/with the collaboration of Ekaterina Butina-Koller (Russisch/Russian), Rute Costa (Portugiesisch/Portuguese), Mª Teresa Fuentes Morán (Spanisch/Spanish), Laura Giacomini (Italienisch/Italian), Rufus H. Gouws (Afrikaans; Englisch/English), Franz Josef Hausmann/ Maria Hegner (Französisch/French), Regina Hessky/Zita Hollós (Ungarisch/Hungarian), Pavel Petkov (Bulgarisch/Bulgarian), Giovanni Rovere (Italienisch/Italian), Stefan J. Schierholz (Portugiesisch/Portuguese), Maria Smit (Englisch/English). 1. Bd.: Systematische Einführung/Vol. I: Systematic Introduction. Mit 120 Grafiken von/with 120 Figures by Matthias Kammerer. A–C. Berlin. New York: Walter de Gruyter 2010. XHTML 2.0 = XHTML™ 2.0. W3C Working Draft 26 July 2006. Editors: Jonny Axelsson, Mark Birbeck, Micah Dubinko, Beth Epperson, Masayasu Ishikawa, Shane McCarron, Ann Navarro, Steven Pemberton. Verwendete Version: [http://www.w3.org/TR/2006/WD-xhtml2-20060726]. Neueste Version: [http://www.w3.org/TR/xhtml2]. XML 1.0 = Extensible Markup Language (XML) 1.0 (Fifth Edition). W3C Recommendation 26 November 2008. Editors: Tim Bray, Jean Paoli, C. M. Sperberg-McQueen, Eve Maler, François Yergeau. Verwendete Version: [http://www.w3.org/TR/2008/REC-xml-20081126]. Neueste Version: [http://www.w3.org/TR/xml]. XML Base 2009 = XML Base (Second Edition). W3C Recommendation 28 January 2009. Editors: Jonathan Marsh, Richard Tobin Verwendete Version: [http://www.w3.org/TR/2009/REC-xmlbase20090128/]. Neueste Version: [http://www.w3.org/TR/xmlbase/]. XSLT 1.0 = XSL Transformations (XSLT). Version 1.0. W3C Recommendation 16 November 1999. Editor: James Clark. Verwendete Version: [http://www.w3.org/TR/1999/REC-xslt-19991116]. Neueste Version: [http://www.w3.org/TR/xslt].

Lothar Lemnitzer

Von Rutengängern und Lexikographen – offene und verdeckte Quellen für die Bedeutungsbeschreibung Abstract: It’s been a quarter of a century that I had a conversation with Prof. Wiegand about the ability of natural language processing to contribute to a high-quality description of lexical meaning. With this article I would like to revise my then skeptical view (‘probably no’) with a somewhat more optimistic view (‘yes, but…’). As I want to show, this more optimistic view is substantiated by the much higher availability of large amounts of digitized textual data (corpora) as well as the existence of powerful mathematically models and algorithms for the detection of relevant patters and features in these data. Keywords: corpus linguistics, lexical semantics, distributional semantics Schlagwörter: Korpuslinguistik, lexikalische Semantik, distributionelle Semantik

1 Einleitung Es war ein für die Linguistik und Lexikographie nahezu bedeutungsloses, für mich aber prägendes Ereignis: Am 13. August 1988 saß ich Herbert Ernst Wiegand in seinem Büro gegenüber, um Fragen zur Lexikographie zu beantworten. Anlass war die mündliche Prüfung zum Magister Artium. Wie bei diesen Prüfungen üblich, ging es im Wesentlichen darum, herauszufinden, ob der Kandidat zur fehlerfreien Wiedergabe angelesenen Wissens in vollständigen Sätzen, auch in einer außerordentlich stressigen Situation, in der Lage ist. Da ich zu der Zeit Hilfskraft in einem Projekt mit dem zukunftsweisenden Titel „Computerlexikographie“ war – ein Projekt, dessen Idee u.a. vom Jubilar stammte und dessen Durchführung Andreas Blumenthal oblag –, meine ich mich erinnern zu können, dass im letzten etwas freieren Teil der Prüfung bei Herrn Wiegand ein wenig professionelles Interesse aufkam. Es ging um die Frage: „Können wir dem Computer beibringen, Bedeutungsbeschreibungen als Teil der lexikographischen Arbeit zu erstellen?“. Ich verneinte dies damals deutlich und glaube, dass der Prüfer diese Antwort erwartete oder diese ihn überzeugte. Zur Erinnerung: Es war dies die Zeit, in der das korpuslinguistische Pionierprojekt von

Lothar Lemnitzer: Berlin-Brandenburgische Akademie der Wissenschaften, Digitales Wörterbuch der deutschen Sprache, Jägerstr. 22/23, 10117 Berlin, email: [email protected]

58

Lothar Lemnitzer

John Sinclair mit dem Erscheinen der ersten Auflage des „Collins Cobuild Dictionary of English“ seinen sichtbaren Ausdruck fand (Motto: „helping learners with real English“), und „das Internet“ noch über Zugänge wie gopher und ftp zu erreichen war. Das Cobuild-Korpus, auf dem die Analysen und Beschreibungen des „Dictionary of English“ beruhen, umfasste damals etwa 20 Millionen laufende Wörter. Von einem weiteren Ereignis aus meiner Kindheit möchte ich noch berichten: Mein Großvater war ein Rutengänger. Er sei, so behauptete er, in der Lage, mit der Wünschelrute Wasseradern zu finden. So wurde Mitte der sechziger Jahre auf Empfehlung meines Großvaters in einer Kleingartenanlage ein Gemeinschaftsbrunnen gebohrt. Der Brunnen erfüllte seine Aufgabe, denn man fand an dieser Stelle tatsächlich ausreichend Wasser. Aber niemand weiß, ob man an einer anderen Stelle nicht auf mehr Wasser gestoßen wäre oder weniger tief hätte bohren müssen. Ich erwähne dies, weil ich glaube, dass sich der Lexikograph als Rutengänger in einer ähnlichen Situation befindet. Mit feinem Gespür und der richtigen Wünschelrute wird er sicher fündig. Aber oft weiß selbst er nicht, ob andere Stellen nicht ergiebiger gewesen wären; und er hat auch meistens nicht die Zeit, dies zu prüfen. Heute, gut 25 Jahre später, möchte ich mein damaliges klares „Nein“ zur Prüfungsfrage in ein „Ja, aber…“ umwandeln. Es ist naheliegend, dass seit 1988 sich die Datenbasis für ein Vorhaben, dessen Ziel die lexikographische Beschreibung eines nennenswert großen Ausschnitts der (deutschen) Gegenwartssprache ist, grundlegend verändert hat. Der Zettelkasten als Referenz für die lexikographische Bearbeitung des Wortschatzes hat an Bedeutung eingebüßt. Wenn überhaupt, dann spielt er in Vorhaben der diachronen Sprachbeschreibung noch eine Rolle. Abgelöst wurde diese geordnete Sammlung von Lesefrüchten aus sorgsam ausgewählten Texten von den Texten selber, die, spätestens seitdem auch die Druckvorstufe digitalisiert ist, in nahezu unbeschränktem Maß zugänglich geworden sind. Eine bedeutende Schranke für gegenwartssprachliche Texte, vor allem solcher höherer Qualität, liegt allerdings im Urheberrecht, das diese Texte, vor allem auf Betreiben der professionellen Textund Wissenshändler, auch vor ihrer wissenschaftlichen und dokumentarischen Nutzung schützt. Die Grundlage, aus der im Rahmen eines konkreten Wörterbuchprojektes die Wörterbuchbasis zusammengestellt wird, ist damit sehr groß. Gegenwartssprachliche Korpora, die mit Bedacht zusammengestellt und mit ausreichend Metadaten versehen sind, so dass sie für ein korpusbasiertes, beleglexikographisches Projekt verwendet werden können, umfassen für viele Sprachen heute mehrere Milliarden laufende Wörter. Dementsprechend groß ist die Zahl der Belege, die man für die zu beschreibenden lexikalischen Einheiten vorfindet. Nimmt man „das Web“ mit hinzu, was sich für bestimmte Formen der Recherche anbietet, dann vervielfacht sich die Größe der Textbasis noch einmal. In Folgenden möchte ich beschreiben, wie man unter Zuhilfenahme sprachtechnologischer Werkzeuge und sehr großer Datenmengen als Quelle nützliche Informationen zu den meisten Positionen /Angaben zur Bedeutung eines Stichworts erhalten kann. Als Blaupause lege ich das einsprachige, allgemeinsprachliche Gesamtwörter-

Von Rutengängern und Lexikographen

59

buch und seine wichtigsten Angabetypen im Bereich des semantischen Kommentars zugrunde (vgl. u.a. Wiegand 1989). Ich wende mich mit den folgenden Ausführungen an drei Zielgruppen: Zunächst sind hier die Lexikographen zu nennen. Ein grundlegendes Verständnis der Möglichkeiten eines sprachtechnologisch unterstützten Zugriffs auf die Texte der Wörterbuchbasis – jenseits der den meisten bekannten Konkordanzen – ist für die korpusbasierte (beleg-)lexikographische Arbeit von großem Nutzen. Zweitens wende ich mich an die Nutzer lexikographischer Ressourcen. Die neuen webbasierten Technologien versetzen die Nutzer in die Lage, selber in den Daten, vor allem natürlich im Web, zu recherchieren, um eine wortbezogene sprachliche Frage zu klären oder eine Wissenslücke zu schließen. Der Nutzer wird zum Rechercheur: Ob er bereits ein kundiger Rechercheur ist, das möchte ich bezweifeln. Nutzer sollten sich über die Grenzen der automatischen Analyse von Textdaten und den Unterschied von ungefilterten und unstrukturierten Daten und den in einem Wörterbuch angebotenen gefilterten und strukturierten Daten bewusst sein. Die dritte Zielgruppe sind diejenigen unter den Computerlinguisten und Korpuslinguisten, die ihre Arbeit der Unterstützung lexikographischer Vorhaben widmen. Diese werden sich gelegentlich wundern, dass ihnen vonseiten der Lexikographen statt tiefer Dankbarkeit oft Skepsis und Unverständnis entgegenschlägt. Auch in diesem potenziellen Konfliktfeld ist es wichtig, die Möglichkeiten und die Grenzen der eigenen Arbeit realistisch darzustellen. Bevor ich auf die Details der computerunterstützten Ermittlung und Aufbereitung von Daten für die Bedeutungsbeschreibung von lexikalischen Einheiten eingehe, möchte ich zur Motivation etwas zu dem Projekt schreiben, in dem ich zurzeit lexikographisch tätig bin.

2 Das „Digitale Wörterbuch der deutschen Sprache“ Ziel des am Zentrum Sprache der Berlin-Brandenburgischen Akademie der Wissenschaften (BBAW) durchgeführten Vorhabens „Digitales Wörterbuch der deutschen Sprache“ (DWDS) ist die Schaffung eines digitalen lexikalischen Systems – eines umfassenden, über das Internet zugänglichen Informationssystems, das Auskunft über den deutschen Wortschatz gibt. Das Projekt ist in drei Phasen von jeweils 6 Jahren untergliedert und wird im Jahr 2024 enden (vgl. Klein/ Geyken 2010). Die Hauptaufgabe der zweiten Phase dieses Vorhabens ist die Aktualisierung der gegenwartssprachlichen lexikalischen Substanz, die im Wesentlichen auf der retrodigialisierten Fassung des „Wörterbuchs der deutschen Gegenwartssprache“ (WDG) fußt (Klappenbach/Steinitz 1964–1977). Die Aktualisierung dieses Bestands umfasst im Kern die folgenden Arbeiten: a) Überarbeitung des Formteils der Artikel, insbesondere hinsichtlich der reformierten Rechtschreibung;

60

Lothar Lemnitzer

b) Aktualisierung des Stichwortbestandes angesichts der Tatsache, dass die Arbeiten am WDG Mitte der siebziger Jahre des letzten Jahrhunderts abgeschlossen wurden (vgl. Geyken/Lemnitzer 2012), und c) Überarbeitung der bestehenden Artikel unter inhaltlichen Aspekten, vor allem also Nachtrag neuer Bedeutungsvarianten und Anpassung der bedeutungsbeschreibenden Angaben an den gegenwärtigen Sprachgebrauch. Im Gegensatz zu der zettelkastenbasierten Arbeit bei der Erstellung des Originals kommen bei der Überarbeitung Textkorpora von großem Umfang als Wörterbuchbasis zum Zuge. Diese wurden mit computerlinguistischen Methoden und sprachtechnologischen Werkzeugen aufbereitet. Daten, die im Zuge der Bearbeitung der verschiedenen Artikelpositionen benötigt werden, können ebenfalls mit sprachtechnologischen Werkzeugen aus den Textkorpora extrahiert werden. Die Neuerstellung von Artikeln und die Überarbeitung von Bestandsartikeln sind parallel zu organisierende, ineinandergreifende Prozesse, die arbeitsteilig vom lexikographischen Team (zurzeit 6 Mitarbeiterinnen und Mitarbeiter) gelöst werden müssen. Bei der Erstellung neuer Artikel, die zumeist Substantivkomposita sind, werden häufig Lücken in den Artikeln zu den Wortbildungsbestandteilen entdeckt (zumeist fehlende Bedeutungsvarianten), die vordringlich gelöst werden müssen – schließlich soll das Verweisziel gegenüber dem neu erstellten Artikel nicht defizitär erscheinen; zu den lexikographischen Arbeitsprozessen in Vorhaben korpusbasierter Lexikographie unter den Bedingungen zeitnaher Publikation im Web vgl. Geyken (2014). Aus dieser doppelten Aufgabenstellung bzw. diesen zwei zu unterscheidenden lexikographischen Prozessen der Neubearbeitung und der Überarbeitung ergeben sich unterschiedliche Anforderungen an den Zugang zu den Daten der Wörterbuchbasis und den hierfür benötigten (sprachtechnologischen) Werkzeugen. Im nächsten Abschnitt möchte ich deshalb an Hand zweier Beispieleinträge zeigen, welche Möglichkeiten und auch Grenzen die automatischen Verfahren der Korpusanalyse nach dem heutigen Stand der Technik charakterisieren.

3 Die Daten Im Folgenden werde ich Rohdaten für die Bedeutungsbeschreibung zweier Stichwörter beschreiben: Das erste Stichwort – Flugtag – gehört zu der Menge der im WDG nicht gebuchten Stichwörter. Es muss deshalb ein komplett neuer Artikel erstellt werden. Das zweite Stichwort – Menü – ist zwar bereits im WDG vorhanden; es fehlt aber die informationstechnische Lesart, die die relativ neue Verwendung dieses Wortes zur Beschreibung eines typischen Elements der grafischen Oberfläche von Computern oder Smartphones beschreiben soll. Nur wenn diese Verwendungsweise angemessen beschrieben wird, ist dieses Wort geeignet für die Vernetzung mit Komposita wie Hauptmenü, Kontextmenü oder Menübefehl.

Von Rutengängern und Lexikographen

– – – – –

61

Die Beschreibung besteht aus folgenden Bestandteilen für jede Lesart: eine von mir selbst erstellte Bedeutungsparaphase, sofern nicht anders gekennzeichnet; Angabe einer semantischen Kategorie oder Fachgebietsmarkierung, die den Ansatz dieser Lesart rechtfertigt; Anteil der Belege, die dieser Lesart zugeordnet werden können (relativ zur Gesamtzahl der Belege bzw. zu einer Zufallsstrichprobe daraus); weitere für die Zuordnung der Lesart oder die Beschreibung der Bedeutung relevante Informationen, wie z.B. typische Kontextwörter; Angabe mindestens eines Beleges zur Illustration dieser spezifischen Verwendungsweise.

Alle Belege stammen aus den DWDS-Korpora und können auf der Webseite recherchiert werden.

3.1 Beispiel: Flugtag Typ: DWDS-Neueintrag, 702 Belege in den verwendeten Korpora. Lesart 1: ‚Veranstaltung, auf der Flieger mit ihren Flugzeugen Kunststücke vorführen und Flugzeuge besichtigt werden können‘ [Kategorie „Ereignis“] 446 Belege = 63,5 % aller Belege bedeutungsverwandt: Flugschau Beleg: Der Doppeldecker […] war bei dem vom Segelflugclub Lauf veranstalteten Flugtag eine der Hauptattraktionen. Zum Programm hatten auch Segelkunstflüge und Fallschirmformationssprünge gehört.

Lesart 2: ‚(Wochen-)Tag, an dem (regelmäßig) ein Flug oder mehrere Flüge stattfinden‘ [Kategorie „Zeitraum“] 77 Belege = 11 % typische Kontexte: Wochentage Beleg: Korean Air setzt ab dem 16. November auf der Strecke Frankfurt-Seoul an drei von sieben Flugtagen – sonntags, mittwochs und freitags – eine Boeing 747–400 mit neuer First, Business und Economy Class ein.

Lesart 3a: ‚einzelner Tag einer längeren Flugreise‘ [Kategorie „Zeitabschnitt“] 34 Belege = 4,8 % typische Kontexte: Ordinalzahlen Beleg: Die Weltraumfähren haben bei Flügen zur ISS jeden Tag ein etwa fünf- bis zehnminütiges Startfenster. Dann liegen die Flugbahnen der Station und des Shuttles so optimal, dass ein Andocken am dritten Flugtag möglich ist.

62

Lothar Lemnitzer

Lesart 3b: ‚einzelner Tag eines mehrtägigen sportlichen Wettkampfs im Skifliegen‘ [Kategorie „Zeitabschnitt“] 52 Belege = 7,4 % Beleg: Schmitt gewann seine erste WM-Medaille im Skifliegen und machte den ersten Doppelerfolg für eine Nation in der Geschichte der Skiflug-Weltmeisterschaften perfekt. Die Entscheidung bei der 17. Skiflug-WM auf dem Riesenbakken am Teufelsberg fiel – wie zwei Jahre zuvor im norwegischen Vikersund – nach nur einem Flugtag, weil Schneegestöber mit Windböen von bis zu 25 Metern pro Sekunde am Sonntag das Fliegen verhinderte.

Lesart 4: ‚Tag, den eine Person (Pilot, Passagier) in einem Flugzeug verbringt‘ [Kategorie „Zeitraum“] 50 Belege = 7,12 % typische Kontexte: Pilot Beleg: Zudem soll Airlines in Zukunft erlaubt werden, die Mindestruhezeit auf siebeneinhalb Stunden zu reduzieren : Käme der Pilot nach einem langen Flugtag auf Teneriffa um halb elf Uhr abends an, dürfte er schon um 6.30 Uhr wieder starten.

Lesart 5: ‚in mit einem Flugzeug benötigter Zeit gemessene Entfernung‘ [Kategorie „Strecke“ oder „Entfernung“] 10 Belege = 1,42 % typische Kontexte: Kardinalzahlen bedeutungsverwandt: Autostunde, Gehminute Beleg: Und Nasa-Forscher Everett Gibson möchte auf dem nur drei Flugtage entfernten Mond die Ausrüstung testen für eine ultimative sechsmonatige Reise zum Mars.

(Dazu 33 nicht zuordbare Belege)

3.2 Beispiel: Menü Typ: Überarbeitung eines im WDG existierenden Eintrags; 13500 Belege in den verwendeten Korpora; ausgewertet wurde eine Stichprobe von 500 Belegen. Lesart 1: ‚Mahlzeit mit mehreren Gängen, deren Folge festgelegt ist‘ (im WDG vorhanden, Bedeutungsparaphrase hieraus) 391 Belege = 78,2 % typische Kontexte: Restaurant, Koch, für/zu … Euro Beleg: Zu jeder Tageszeit wird das Menü serviert, für das die Sucrerie bekannt ist: knusprig gebratener Schweineschwarte („Christusohren“), Bohnen, Fleischpastete, Kichererbsen, ahornholzgeräucherter Speck, in Sirup-Lake gepökelter Schinken, hausgemachtes Brot und Zwiebelketchup.

Von Rutengängern und Lexikographen

63

Lesart 2: veraltet – ‚Speisekarte‘ (im WDG vorhanden; Bedeutungsparaphrase hieraus: hier nicht weiter berücksichtigt, da keine Belege zuordenbar) Lesart 3: ‚Auswahl von Optionen an der Benutzerschnittstelle einer Software‘ (zu ergänzende Lesart) 70 Belege = 14 % Beleg: Gelungen ist die übersichtliche Bedienoberfläche mit aufklappbaren Menüs.

Darüber hinaus gibt es 39 Belege, die hier nicht zugeordnet werden können. Meistens handelt sich um übertragenen Gebrauch. Übernommen werden die Aspekte des begrenzten Angebots und der Auswahl hieraus. Belege: Das automobile Menü ist reichhaltiger denn je zuvor, kaum eine Nische oder Lücke in irgendeinem Modellprogramm ist noch unbesetzt, jeder Hersteller schiebt mit großer Unverdrossenheit immer neue Motorvarianten und Ausstattungsversionen nach, kein Wunsch darf da mehr unerfüllt bleiben. Das TV-Popkorn Seifenoper paßt ideal in jenes von den Programmmachern aufgetischte Menü am Nachmittag und frühen Abend, zu Talk und Boulevard.

3.3 Analyse der Daten Es ist bezeichnend, dass das Wort Flugtag in keiner der für den heutigen Benutzer leicht erreichbaren lexikalischen Ressourcen – damit meine ich vor allem die Webseite des Duden, das Wiktionary und canoo.net, aber auch das DWDS – als Stichwort verzeichnet ist. Dabei erschließen sich die unterschiedlichen Bedeutungen dieses Wortes, wie ich sie oben verzeichnet habe, keinesfalls einfach aus den Bestandteilen des Wortes. Bei einigen Bedeutungen werden verschiedene Bedeutungsfacetten der Bestandteile Flug und Tag aktualisiert. Einige der Bedeutungen erschließen sich gar nicht aus den Bestandteilen. Dies gilt vor allem für die erste Lesart. Man ist also auf eine Analyse von „rohen“ textuellen Daten angewiesen, wenn man die unterschiedlichen Verwendungsweisen lexikographisch beschreiben (aus Sicht der Lexikographen) bzw. erschließen (aus Sicht der Rat suchenden Benutzer) möchte. Der Fall des Stichworts Menü ist etwas anders gelagert. Der Rat suchende Benutzer findet für beide Lesarten nützliche Informationen in den gebräuchlichen Nachschlagewerken. In einer weniger komfortablen Situation sind die Lexikographen, die die fehlende Bedeutung des Stichwortes nachtragen, die Verwendung durch Belege illustrieren und syntagmatische wie paradigmatische Bezüge zu anderen lexikalischen Einheiten herstellen wollen. Legt man die im DWDS momentan verwendeten Korpora zugrunde, so müsste der Lexikograph ca. 13 000 Belege sichten. Dabei sind vermutlich weniger die Belege für die neue Lesart das Problem – diese sind so ausreichend vorhanden, dass man daraus eine gute Auswahl treffen kann –, sondern

64

Lothar Lemnitzer

die Belege, die eine „nicht-eigentliche“, also bildliche oder übertragene Verwendung des Wortes beinhalten. Im Folgenden möchte ich darstellen, welche sprachtechnologischen Werkzeuge das Geschäft der Lexikographen bei der Beschreibung neuer Stichwörter oder bei der Ergänzung von Lesarten existierender Stichwörter leichter machen (und damit die Arbeit beschleunigen) können. In längerfristiger Perspektive könnten diese Werkzeuge auch dem Wörterbuchnutzer an die Hand gegeben werden, der im Falle von Wörterbuchlücken eigene Recherchen durchführen muss: Denn auch diesem (kundigen) Benutzer können geeignete Korpora und sprachtechnologische Werkzeuge das Leben einfacher machen. Ein Teil der folgenden Ausführungen baut auf den Darstellungen in Lemnitzer/Geyken (2016) auf.

4 Sprachtechnologische Werkzeuge und Verfahren für die Extraktion von Aspekten der lexikalischsemantischen Bedeutung 4.1 Definitionen/Bedeutungsparaphasen Im Zentrum der meisten allgemeinsprachlichen Gesamtwörterbüchern stehen die Bedeutungsparaphrasen, mit denen – je nach Sichtweise und Wortklasse des zu beschreibenden Wortes – die rekurrenten Verwendungsweisen eines Wortes oder das mit diesem Wort Bezeichnete beschrieben werden. Bedeutungsparaphrasen sind zugleich einer der am schwierigsten zu erstellenden Angabetypen im einsprachigen Wörterbuch. Der Text muss hinreichend informativ sein, sollte aber nicht zu lang werden und nicht in einem zu komplizierten Vokabular verfasst sein. Letzteres gilt insbesondere für Bedeutungsparaphrasen im Lernerwörterbuch. Aus diesem Grunde ist die Sprachtechnologie weit davon entfernt, Bedeutungsparaphrasen in ausreichender Qualität und in einer der Funktion des Wörterbuches angemessenen Weise zu erzeugen. Zumindest aber können Korpora zusammen mit Finde- und Analyseverfahren diesen Arbeitsprozess unterstützen. In vielen Texten, z.B. in Lehrbüchern und journalistischen Texten, werden Wörter häufig dann definiert, d.h. es wird ihre Bedeutung beschrieben, wenn der Autor davon ausgeht, dass ein Wort (in einer speziellen Bedeutung) den Lesern nicht geläufig oder für sie neu ist. Die Computerlinguistik beschäftigt sich seit einigen Jahren damit, Definitionen in Texten automatisch zu identifizieren. Als Beispiele seien hier die Dissertationen von Irene Cramer (2011) und von Stephan Walter (2011) genannt, die sich beide auf deutsche Texte beziehen. Die übliche Herangehensweise dabei ist, nach grammatischen und lexikalischen Mustern zu suchen, die typischerweise zum Definieren von Wortbedeutungen verwendet werden (Unter X versteht man, ein X ist NP, Sei X usw.). Man spricht dabei von „typischen

Von Rutengängern und Lexikographen

65

definitorischen Kontexten“. Auf diese Weise werden natürlich nicht alle Definitionen in Texten gefunden, und nicht alle extrahierten Textstellen sind wirklich Definitionen. Aber das Ergebnis solcher Verfahren kann sich sehen lassen. Zwei Beispiele aus den DWDS-Korpora sollen dies veranschaulichen (in Klammern wird neben der Belegquelle auch die Korpusabfrage angegeben, mit deren Hilfe der Beleg gefunden wurde): Denn unter Chimären versteht man heute eine im Schwein-Mensch-Experiment nicht vorgesehene Vermischung der Erbsubstanzen verschiedener Arten; etwa von Schaf und Ziege zur „Schiege“, oder natürlicherweise von Pferd und Esel zu einem Maultier (Süddeutsche Zeitung, 07.10.2000, Hervorhebung vom Autor, DWDS-Abfrage: „unter $p=NN versteht man“) Zur Erinnerung: Ein Menü ist eine Abfolge von Speisen, die sich voneinander unterscheiden (Die Zeit, 12.04.2007, Nr. 16, Hervorhebung vom Autor, DWDS-Abfrage: „Menü ist ein $p=NN“)

An diesen Beispielen wird deutlich, dass die gefundenen definitorischen Kontexte, selbst wenn es sich um Bedeutungsbeschreibungen i.e.S. handelt, von unterschiedlicher Qualität und damit Nützlichkeit für den Autor eines Wörterbuchartikels sind. Der erste Kontext enthält mit Vermischung von Erbsubstanzen verschiedener Arten eine gute Paraphrase, auch wenn unklar bleibt, ob mit Vermischung der Prozess oder das Ergebnis des Prozesses gemeint ist. Im zweiten Beispiel kann zu Recht gefragt werden, ob das „Sich-Unterscheiden“ der Speisen ein essentielles Merkmal eines Menüs ist. Mit dem gesamten Web als Korpus und damit als Teil der Wörterbuchbasis im Hintergrund wird der eine Teil der Übung, das Finden von potenziellen Definitionen, wesentlich schwieriger. Je größer die Datenmenge ist, desto größer auch die Gefahr, dass viele irrelevante Repräsentanten eines Verwendungsmusters gefunden werden und zunächst vom Lexikographen gesichtet werden müssen – eine zeitaufwendige und nicht immer erfolgreiche Aufgabe. Man geht deshalb heute dazu über, die musterbasierte Suche in den Texten mit einer musterbasierten Vorauswahl der Texte zu kombinieren, in denen überhaupt gesucht werden sollen (z.B. in Seiten, die sich als Lexika oder Glossare zu erkennen geben, oder die eine strukturell erkennbare Menge von Definiens/Definiendum-Abfolgen aufweisen); für weitere Details vgl. Barbaresi (2015). Ein automatisch extrahierter definitorischer Kontext kann also für den Lexikographen eine Hilfe sein: einerseits eine Verständnishilfe hinsichtlich des zu beschreibenden Wortes, andererseits als eine Formulierungshilfe für die zu verfassende Paraphrase. Die durch einen guten Lexikographen verfasste Bedeutungsparaphrasenangabe kann ein automatisch extrahierter definitorischer Kontext aber nicht ersetzen. Einer der wichtigsten Gründe hierfür ist es, dass eine Definition immer in einem größeren Kontext steht, eine Bedeutungsparaphrasenangabe jedoch für sich selber steht.

66

Lothar Lemnitzer

4.2 Kollokationen und andere Nachbarschaften Folgt man den linguistischen Argumenten im Umfeld des britischen Kontextualismus, dann machen die Wörter, die im textuellen Umfeld (Kontext) eines Textworts vorkommen, einen Teil der Bedeutung des lexikalischen Zeichens aus, das durch dieses Textwort repräsentiert wird. Aus diesem Grund und aus einer gewissen Arbitrarität der Kombination zweier Wörter, die diese Kombination zu einem entfernten Verwandten der Phraseme machen (vgl. Burger 2007, Mel’čuk 2007) ist die Kollokationsangabe eine häufige lexikographische Angabe, sowohl in allgemeinsprachlichen Gesamtwörterbüchern als auch in Spezialwörterbüchern und Lernerwörterbüchern. Das Auffinden von typischen Wortkombinationen wird seit geraumer Zeit durch korpuslinguistische Werkzeuge unterstützt. Als Pionierarbeit ist hier die von Adam Kilgarriff und Kollegen entwickelte „Sketch Engine“ zu erwähnen (vgl. Kilgarriff et al. 2004). Werkzeuge, die in der Folge entwickelt worden, wie das in unserem Vorhaben entwickelte „Wortprofil“, extrahieren nicht nur mit statistischen Maßen und Methoden typischerweise miteinander vorkommende Paare von Textwörtern (sog. „Kookkurrenzen“), sondern klassifizieren diese auch nach der syntaktischen Relation, in der die Textwörter stehen. Grundlage hierfür sind syntaktische analysierte und annotierte Korpora; zum Wortprofil vgl. Didakowski/Geyken (2013). Wie jedes andere statistische Werkzeug produzieren auch die „Sketch Engines“ ein statistisches Rauschen in Form von Wortpaaren, die ausreichend oft gemeinsam vorkommen, von einem geübten Lexikographen aber nicht als Kollokationen angesehen und damit für die Aufnahme in ein Wörterbuch als relevant eingestuft werden. Dies hängt sicher auch damit zusammen, dass das linguistisch-lexikographische Konzept der Kollokation nicht exakt in die statistische „Sprache“ der Korpusextraktoren übersetzt werden kann. Dass sich die Konzepte der Kookkurrenz und der Kollokation von einander unterscheiden, ist schon früh erkannt worden; vgl. z.B. Benson (1990). Dennoch ist die Bereitstellung von Kookkurrenzen für die zu bearbeitenden Stichwörter hilfreich: Denn die Kombination von großen Textkorpora und Extraktionswerkzeug fördert vieles zu Tage, was einem ausschließlich auf die eigene Kompetenz und andere Wörterbücher angewiesenen Lexikographen vermutlich entgangen wäre. Geyken (2011) zeigt dies anhand eines Vergleichs der Mengen von Kookkurrenzen, die das Wortprofil für einige ausgewählte Stichwörter findet, mit den Kollokationen im Wörterbuch der deutschen Gegenwartssprache, das den bestmöglichen Stand (neudeutsch „state of the art“) der lexikographischen Beschreibung in der Ära vor der Verfügbarkeit und Analysierbarkeit großer Textkorpora repräsentierte. Ähnlich argumentieren auch Kilgarriff/Kozem (2012). Die Auswahl, Gruppierung und angemessene Beschreibung der Kollokationen wird freilich bis auf Weiteres Lexikographen-Handwerk bleiben. Die in der Nachbarschaft eines zu beschreibenden Textwortes vorkommenden bedeutungstragenden Wörter können aber auch, wenn sie sich nicht als Bestandteile

Von Rutengängern und Lexikographen

67

von Kollokationen qualifizieren, für die Beschreibung der lexikalischen Bedeutung dieses Textwortes beitragen. Ein Forschungsprogramm, das sich den Ansatz des Kontextualismus zu eigen gemacht hat und in radikaler Weise umsetzt, nennt sich „distributionelle Semantik“. Eine frühe grundlegende Arbeit zu diesem Ansatz ist Widdows (2003). Baroni et al. (2012) geben einen Überblick über aktuelle Fragestellungen und Ansätze, die weit über das Feld der lexikalischen Semantik hinausgehen. Zusammengefasst modellieren diese Ansätze die Verwendung einer lexikalischen Einheit als die Menge der Kontexte, in denen diese lexikalische Einheit als Textwort in einem gegebenen, meist sehr großen Textkorpus vorkommt. Jeder Kontext wiederum wird als die (unstrukturierte) Menge von umgebenden Textwörtern modelliert. Jeder Kontext bildet einen Wortvektor. Phänomene wie die (lexikalisch-semantische) Ähnlichkeit von Wortbedeutungen können dadurch mit den Mitteln der Vektorrechnung erfasst werden. Schütze (1998) hat in diesem theoretischen Rahmen das Problem der Trennung verschiedener Lesarten als „Word Sense Discrimination“ modelliert (Schütze 1998). Im Zusammenhang unseres Vorhabens, dessen einer Gegenstand die Überarbeitung und Aktualisierung existierender Wörterbuchartikel ist, erscheint ein Ansatz, der eine z.T. sehr große Menge von Korpusbelegen als Vektoren modelliert und diese Vektoren als Cluster in einem Vektorraum anordnet, sehr hilfreich und vielversprechend. Wie an den beiden obigen Beispielen – Flugtag und Menü – gezeigt wurde, kann eine grobe Unterscheidung in eine Hauptlesart und einige weitere, weniger stark belegte Lesart (wie bei Flugtag) als analytisches Tool für die darauf folgende lexikographische Analyse hilfreich sein. Am Beispiel Menü kann man die Arbeitserleichterung ermessen, die sich daraus ergibt, wenn ca. 80 % der Belege, die sich eindeutig einer bereits erfassten Lesart zuordnen lassen, gar nicht mehr gesichtet werden müssen, und die lexikographische Arbeit sich auf die neuen, weniger stark belegten Lesarten und auf „ungewöhnliche“ Verwendungen konzentrieren kann. Bei den obigen Beispielen, denen allerdings eine komplett intellektuelle Analyse zugrunde liegt, habe ich angegeben, welche Kontextwörter ein starkes Indiz für eine bestimmte Lesart geben. Diese „Indikatoren“ im Kontext können als Ausgangspunkt für ein lernendes Verfahren wie das von Hinrich Schütze vorgeschlagene dienen. Meine Kollegen im DWDS-Vorhaben und in einem vom BMBF geförderten Projekt namens KobRA (s. http://www.kobra.tu-dortmund.de) arbeiten an der Implementierung solcher lernenden Verfahren, deren Ziel es ist, das Vorkommen eines Textwortes in einem Beleg einer bestimmten Lesart zuzuordnen (vgl. Geyken/Pölitz/Bartz 2015). Die Akkuratheit der Zuordnung von Belegen zu einer größeren Zahl von z.T. stark polysemen lexikalischen Einheiten, wie sie für diese Arbeit getestet wurde, liegt knapp über 50 %. Dieser Wert entspricht dem heutigen Stand der Technik. Eine automatische Zuordnung von Belegen zu Lesarten ist damit ausgeschlossen, weil zu fehlerbehaftet; aber es ergeben sich damit aus den Korpora hilfreiche Hinweise für den Ansatz von Lesarten und die Zuordnung von Belegen durch einen Lexikographen. Ob auch ein Wörterbuchbenutzer, der im Falle einer lexikographischen Lücke mit

68

Lothar Lemnitzer

solchen ungefilterten Ergebnissen konfrontiert würde, etwas mit diesen Ergebnissen anfangen kann, darf bezweifelt werden. Ob die automatische, explorative Analyse von Korpora für das Auffinden neuer Bedeutungen von Nutzen sein kann, wie dies bei Cook et al. (2014) zu Recht als wichtiges lexikographisches Desiderat dargestellt wird, das muss sich erst noch erweisen.

4.3 Lexikalisch-semantische Relationen In vielen allgemeinsprachlichen Gesamtwörterbüchern finden sich Angaben zu lexikalisch-semantischen Beziehungen, die das Stichwort mit anderen Wörtern verbindet, z.B. die Synonymenangabe oder Antonymenangabe. Besonders oft finden sich Angaben zu den paradigmatischen Beziehungen, die den Wortschatz vernetzen. Es gibt für viele Sprachen, auch für das Deutsche, spezielle lexikalische Ressourcen („Wortnetze“ genannt), die diese lexikalisch-semantischen Beziehungen als primäres Strukturierungsmerkmal haben; zu weiteren Details hierzu vgl. Lemnitzer/Kunze (2007: Kapitel 6). Es ist keine einfache Aufgabe, die Beziehungen zwischen lexikalischen Einheiten, die sprachsystematischen Charakter haben, in Texten zu „finden” und zu extrahieren. Auch in diesem Fall muss das Konzept einer lexikalisch-semantischen oder paradigmatischen Relation so operationalisiert werden, dass es sich in gezielte Suchen in großen Mengen sequentiellen Textes umsetzen lässt. Es gibt in der Computerlinguistik in den letzten zehn Jahren eine erfreulich hohe Anzahl von Versuchen, den Begriff der „semantischen Relation“ so weit zu operationalisieren, dass man Beispiele für Paare semantisch verbundener lexikalischer Einheiten aus Textkorpora extrahieren kann. Das Mittel der Wahl ist die Definition struktureller Muster, innerhalb derer typischerweise Paare von lexikalischen Einheiten auftreten, die in einer lexikalisch-semantischen Beziehung zueinander stehen. Diesen Ansatz wählt Jones für das Auffinden von Antonymenpaaren (Jones 2010). Der Autor arbeitet mit englischen Daten, und also auch mit englischen Extraktionsmustern (er nennt diese „Frames“). Einiges lässt sich auch auf das Deutsche übertragen. Wir wollen dies an einem einfachen Beispiel zeigen. Antonyme Adjektivpaare treten u.a. häufig in dem einen Kontrast signalisierenden Muster weder ADJ noch ADJ auf. Im Folgenden ein Beispiel aus dem DWDS-Korpus: In Wirklichkeit haben sich die italienischen Fabrikarbeiter weder als Individuen noch als Gewerkschaften, weder aktiv noch passiv den Erneuerungen in den Weg gestellt, die Kostensenkung, Rationalisierung der Arbeit, Einführung perfekterer technischer Organisationsformen im gesamten Betrieb anstrebten (Kurz, Robert, Schwarzbuch Kapitalismus, Frankfurt a.M.: Eichborn 1999, S. 411, Hervorhebungen vom Autor, DWDS-Abfrage: „weder $p=ADJD noch $p=ADJD“)

Natürlich erhält man neben echten Antonymenpaaren auch eine Vielzahl von okkasionellen Kontrastbildungen. Es ist also eine sorgfältige Auswahl und Prüfung der Daten notwendig.

Von Rutengängern und Lexikographen

69

Man kann die Suche natürlich auch gezielt auf ein bestimmtes lexikalisches Zeichen ausrichten. Die Suche zum Adjektiv groß (DWDS-Suche: „weder groß noch $p=ADJD“) ergibt viele Treffer mit weder groß noch klein und weder größer noch kleiner – neben einigen okkasionellen Bildungen. Textuelle Muster für Synonyme lexikalische Zeichen sind deutlich schwerer zu finden. Storjohann (2010) bringt einige Beispiele und belegt diese mit Daten aus dem von ihr verwendeten Korpus. Die „Muster“ sind aber entweder nicht als Korpusabfragen zu operationalisieren, oder sie sind zu ungenau, um Synonyme im engeren Sinn zu identifizieren. Einen generelleren Ansatz zur Ermittlung paradigmatischer Relationen verfolgen die Mitarbeiter im Leipziger „Wortschatz“-Projekt (vgl. Biemann et al. 2004). Auch sie beziehen sich auf die Kontexte der Vorkommen eines zu untersuchenden Stichworts, betrachten allerdings die überzufällig häufig mit dem Stichwort vorkommenden Wörter („Kookkurrenzen“) und in einem weiteren Schritt die Kookkurrenzen dieser ko-vorkommenden Wörter. Die Erwartung ist, dass diese Wörter mit dem ursprünglichen Stichwort in einer semantischen Beziehung stehen. Die Ergebnisse der automatischen Synonymenextraktion kann man auf der Webseite des Projekts begutachten (http://wortschatz.uni-leipzig.de/abfrage/). So werden zum Beispiel für das Stichwort fleißig 25 Synonyme angegeben. Synonymdaten dieser Qualität sind sicher als Ausgangsmaterial für die Erstellung einer entsprechenden Angabe im Wörterbuch hilfreich, bedürfen aber unbedingt einer Auswahl und Beurteilung durch die Lexikographen. Einen anderen vielversprechenden Ansatz verfolgen Sierra et al. (2008), die lexikalisch-semantische Relationen aus definitorischen Kontexten extrahieren. Ihre Untersuchungen basieren auf dem Spanischen; es ist deshalb nicht klar, ob der Ansatz auf das Deutsche übertragen werden kann. Zumindest könnte man versuchen, die sprachtechnologische Aufgabe der Identifikation und Abstraktion von Definitionen und die Aufgabe der Extraktion von lexikalisch-semantisch verbundenen lexikalischen Einheiten in diesen Texten zu kombinieren.

5 Zusammenfassung Die Existenz von unfassbar (im doppelten Wortsinn!) großen Textmengen in Web und die Weiterentwicklung von computerlinguistischen Verfahren und Werkzeugen auch auf Gebieten und für Fragestellungen, die von den eigentlichen Interessen der Lexikographie weiter entfernt sind, eröffnet für die lexikographische Beschreibung von Wortbedeutungen neue Horizonte. Die eingangs bzw. im Jahr 1988 noch eher skeptisch beantwortete Frage kann also aus heutiger Sicht deutlich optimistischer beantwortet werden als damals. In den letzten Abschnitten habe ich den „ja“-Teil der Antwort zu begründen versucht. Interessanterweise ging diese Entwicklung weniger – wie wir noch im Projekt „Colex“ erwarteten – von „intelligenten“ Verfahren und komplexen, regelbasierten Prozessen der Sprachverarbeitung aus, sondern von der

70

Lothar Lemnitzer

schieren Menge verfügbarer Daten in Kombination mit robusten statistischen Verfahren. Das „Wortprofil“ ist ein gutes Beispiel hierfür. Zum Schluss dieser Zusammenfassung möchte ich noch auf den „aber“-Teil eingehen. Zum einen ist die Textbasis kritisch zu betrachten. Jedes Korpus, egal welchen Umfangs, ist nur ein Ausschnitt aus der Gesamtheit der sprachlichen Wirklichkeit oder des Gegenstandes, das dieses Korpus repräsentieren soll, und damit auch des Gegenstandes eines Wörterbuchs, dem dieses Korpus als Basis dient. Das Verhältnis des Korpus als Ausschnitt zu seiner Grundgesamtheit ist komplex und muss bei allen Schlüssen, die vom Korpus auf die Grundgesamtheit gezogen werden, mit bedacht werden. Entschließt man sich dazu, „das Web“ oder einen mehr oder weniger wohldefinierten Ausschnitt daraus in die Wörterbuchbasis einzubeziehen, dann vervielfachen sich die Probleme. Oft ist nicht zu klären, von wem ein Text produziert wurde; dies erhöht die Gefahr, auf ein Beispiel nicht normgerechter Sprachverwendung zu stoßen. Bei der lexikographischen Beschreibung kommt es aber darauf an, nicht normgerechten, okkasionellen Sprachgebrauch von kreativen Verwendungen, die einen (lexikalischen) Sprachwandel begründen können, zu trennen; zur Problematik der Einschätzung von korpusbasierten Daten vgl. Lemnitzer/ Zinsmeister (2010: Kapitel 2 und 3). Eine weitere Quelle der Unsicherheit bringt die Verwendung der sprachtechnologischen Werkzeuge mit sich. Komplexe sprachtechnologische Verfahren bauen auf elementaren Verfahren der Segmentierung und Klassifizierung der Ausgangsdaten auf. Diese elementaren Verfahren, z.B. die Zerlegung eines Textes in Sätze und Wörter und die Klassifizierung der Wörter in Wortklassen, produzieren nach dem Stand der Technik nur relativ wenige Fehler, aber sie arbeiten eben nicht fehlerfrei. Eine gewisse Kenntnis typischer Fehler und der sich daraus ergebenden Konsequenzen für darauf aufbauende sprachtechnologische Verfahren ist für jeden, der die Ergebnisse dieser Verfahren nutzen möchte, hilfreich; vgl. ausführlicher hierzu Lemnitzer/Würzner (2015). Für die obigen Betrachtungen zur Exploration von Aspekten lexikalisch-semantischer Bedeutung ist aber eine andere Schwäche der entsprechenden Verfahren relevanter. Grundsätzlich haben alle sprachtechnologischen Verfahren, die das Ziel haben, Aspekte der lexikalisch-semantischen Bedeutung aufzudecken, Schwierigkeiten mit der quantitativen Verteilung von Verwendungsweisen oder -kontexten. Die oben angeführten Beispiele zeigen, was für viele Lexeme gilt: Einige der Bedeutungen oder Lesarten werden überdurchschnittlich oft in Texten realisiert, während andere mit einem verschwindend geringen Anteil vertreten sind. Fast alle Verfahren, die sich auf die Erkennung oder Unterscheidung von Lesarten beziehen, sind gegenüber seltenen Lesarten nicht „sensibel“ genug. Wenn man mit lexikographisch ungeübtem Blick an die Ergebnisdaten solcher Verfahren geht, dann ist die Gefahr groß, dass man die seltenen und vielleicht gerade deshalb interessanten Verwendungsweisen bzw. Lesarten übersieht. Dies spricht auch dagegen, diese Werkzeuge und deren Ergebnisse in ungefilterter Weise einer großen Zahl von Benutzern zur

Von Rutengängern und Lexikographen

71

Verfügung zu stellen. Positiv formuliert ist auch heute, wo Daten und Werkzeuge „nur einen Klick entfernt“ liegen, eine der Aufgaben der Lexikographie, die Rohdaten, die diese Werkzeuge liefern, in möglichst vollständigen und verständlichen Wörterbucheinträgen aufzubereiten. Dazu gehört das Aussortieren von Irrelevantem ebenso wie der Hinweis auf Relevantes, aber nicht sichtbar zu Machendes. Dieser Mehrwert von lexikalischen Ressourcen gegenüber automatisch extrahierten Angaben muss in der Didaktik der Wörterbücher und Wortschatzarbeit vermittelt werden, um das massenhafte Abwandern von Rat Suchenden zu Auskunftssystemen, die für diesen Zweck nicht gemacht sind, wie z.B. der Suchmaschen Google, zu verhindern. Um auf das oben eingeführte Bild vom Rutengänger noch einmal zurückzukommen: Es ist unter Umständen sogar dem Laien möglich, mit der Rute eine Wasserader zu entdecken. Daraus zu schließen, dass dies der ideale Ort für einen Brunnen ist, wäre allerdings voreilig und gewagt. Wissen darüber, wie und in welcher Höhe Wasseradern in einer bestimmten Art von Boden verlaufen, sollte bei der Entscheidung auf jeden Fall berücksichtigt werden.

6 Literatur Barbaresi, Adrien (2015): Ad hoc and general-purpose corpus construction from web sources. Diss. Univ. Lyon 2015. [Unter: https://hal.archives-ouvertes.fr/tel-01167309/document; letzter Zugriff: 30. Juli 2015]. Baroni, Marco/Bernardi, Raffaela/Zamparelli, Roberto (2014): Frege in Space. A program for Compositional Distributional Semantics. 2012. In: Linguistic Issues in Language Technology, Vol. 9, 5–110. Benson Morton (1990): Review article – Goran Kjellmer. A dictionary of English collocations. In: International Journal of Lexicography 3, Heft 4, 302–312. Burger, Harald (2007): Semantic aspects of phrasemes. In: Burger, Harald et al. (Hrsg.): Phraseologie. Ein internationales Handbuch der zeitgenössischen Forschung. 1. Halbband. Berlin [usw.]: Walter de Gruyter, 90–109. Cook, Paul et al. (2013): A lexicographic appraisal of an automatic approach for detecting new word senses. In: Proceedings of elex 2013, 17–19 October 2013, Tallinn, Estonia, 48–65. Cramer, Irene (2011): Definitionen in Wörterbuch und Text. Dissertation TU Dortmund. [Unter: http://hdl.handle.net/2003/27628; letzter Zugriff: 30. Juli 2015]. Didakowski, Jörg/Geyken, Alexander (2013): From DWDS corpora to a German Word Profile – methodological problems and solutions”. In: Network Strategies, Access Structures and Automatic Extraction of Lexicographical Information. 2nd Work Report of the Academic Network „Internet Lexicography“. Mannheim: Institut für Deutsche Sprache, 43–52. Geyken, Alexander (2014): Methoden bei der Wörterbuchplanung in Zeiten der Internetlexikographie. In: Heid, Ulrich et al. (Hrsg.). Lexicographica 30, 77–112. Geyken, Alexander/Lemnitzer, Lothar (2012): Using Google Books unigrams to improve the update of large monolingual reference dictionaries. In: Proceedings EURALEX 2012, Oslo, 362–366. Geyken, Alexander/Pölitz, Christian/Bartz, Thomas (2015): Using a Maximum Entropy Classifier to link “good” corpus examples to dictionary senses. In. Kosem, I./Jakubíček, M./Kallas J./Krek, S. (eds.): Electronic lexicography in the 21st century: linking lexical data in the digital age. Proc. of the elex 2015 conference, Herstmonceaux, UK, 11–13 August 2015. Ljubljana / Brighton.

72

Lothar Lemnitzer

Jones, Steven (2010): Using web data to explore lexico-semantic relations. In: Storjohann, Petra (Hg.): Lexical-Semantic Relations. Theoretical and practical perspectives. Amsterdam: Benjamins, 49–67. Kilgarriff, Adam et al. (2004): The sketch engine. In: Proceedings Euralex 2004, Lorient, France, July 2004, 105–116. Kilgarriff, Adam/Kosem, Iztok (2012): Corpus tools for lexicographers. In: Sylviane Granger/ Magali Paquot (eds.): Electronic Lexicography. Oxford: OUP, 31–55. Klappenbach, Ruth/Steinitz, Wolfgang (1964–1977) (Hrsg.): Wörterbuch der deutschen Gegenwartssprache (WDG). 6 Bände. Berlin: Akademie-Verlag. Klein, Wolfgang/Geyken, Alexander (2010): Das Digitale Wörterbuch der Deutschen Sprache (DWDS). In: Heid, Ulrich et al. (Hrsg.): Lexikographica 25, 79–93. Lemnitzer, Lothar/Geyken, Alexander (2016): Automatische Gewinnung lexikographischer Angaben. [Erscheint als Kapitel 5 des „Handbuchs Lexikographie“, herausgegeben von einem Autorenkollektiv unter Leitung von Annette Klosa. Mannheim: Institut für Deutsche Sprache]. Lemnitzer, Lothar/Zinsmeister, Heike (2010): Korpuslinguistik. Eine Einführung. Tübingen: GNV. Lemnitzer, Lothar/Würzner, Kay-Michael (2015): Das Wort in der Sprachtechnologie. In: Ulrike Haß und Petra Storjohann (Hrsg.): Handbuch Wort. [Erscheint im Herbst 2015 im Verlag Walter de Gruyter]. Mel’čuk, Igor (2007): Lexical Functions. In: H. Burger, Harald et al. (Hrsg.): Phraseologie. Ein internationales Handbuch der zeitgenössischen Forschung. 1. Halbband. Berlin [usw.]: Walter de Gruyter, 119–131. Schütze, Hinrich (1998): Automatic word sense discrimination. In: Computational Linguistics 24/1, 97–123. Storjohann, Petra (2010): Synonyms in corpus texts. Conceptualisation and construction. In: Storjohann, Petra (Hrsg.): Lexical-Semantic Relations. Theoretical and practical perspectives. Amsterdam: Benjamins, 69–94. Walter, Stephan (2011): Definitionsextraktion aus Urteilstexten. PhD Thesis, Universität des Saarlandes 2011[Unter: http://www.coli.uni-saarland.de/~stwa/publications/DissertationStephanWalter.pdf; letzter Zugriff: 30. Juli 2015]. Wiegand, Herbert Ernst (1989): Formen von Mikrostrukturen im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef et al. (Hrsg.): Wörterbücher. Dictionaries. Dictionnaires. Ein internationales Handbuch zur Lexikographie. An International Encyclopedia of Lexicography. Encyclopédie internationale de lexicographie. Erster Teilband. Berlin.New York: Walter de Gruyter, 462–501.

Wolfgang Schweickard

Giuges, Nesiron und Zabulismes Ein türkisch-spanisches Glossar von 1690 Abstract: The article explains the Turkish elements in the only known 17th century Turkish-Spanish glossary, which can be found in the Historia del estado presente del Imperio Otomano, which was published in 1670 under the name of Juan Bautista Lardito. In reality, the Historia is the first and only Spanish translation of Sir Paul Rycaut’s Present State of the Ottoman Empire (1667), which at that time was widespread throughout Europe. Keywords: Turkish-Spanish glossary, historical lexicography, turkisms, Rycaut, Lardito Schlagwörter: türkisch-spanisches Glossar, historische Lexikographie, Turzismen, Rycaut, Lardito

Der Doyen der germanistischen Lexikographie und Wörterbuchforschung hat immer auch über den Tellerrand seiner Disziplin hinausgeblickt. Ein besonders eindrucksvoller Beleg dafür ist seine großartige Bibliographie, die auch eine Fülle romanistischer Einträge enthält (Wiegand 2006–2014). Innerhalb der romanischen Sprachen sind ihm wiederum das Spanische und das Italienische, derer er sich auch als Publikationssprachen bedient, in besonderem Maße ans Herz gewachsen (Wiegand 2007; Wiegand/Fuentes Morán 2009). Es liegt daher nahe, dem Jubilar im Rahmen dieser Festschrift eine lexikographische Miszelle zum Spanischen zu widmen. Der Text, um den es im Folgenden gehen soll, findet sich in der Historia del estado presente del Imperio Otomano que, traducida, y añadida, ofrece a la luz publica, con un compendio de los progressos de la Liga Sagrada contra Turcos el P. M. Fr. Juan Bautista Lardito, Maestro General de la Religion de S. Benito, Cathedratico de Phisicos de la Universidad de Salamanca, y Regente de los estudios en su Colegio de S. Vicente (con las licencias necessarias, en Salamanca, por Lucas Perez, año de 1690). Es handelt sich um kleines türkisch-spanisches Glossar, das auf S. 138 der Historia steht, nur 36 Worteinträge umfasst und von völliger Unkenntnis des Türkischen seitens des Autors zeugt. Im Grunde wäre ein solches Elaborat nicht unbedingt einer vertiefenden Behandlung wert. Allerdings hat es mit dem Text seine besondere Be-

Wolfgang Schweickard: Universität des Saarlandes, FR 4.2 – Romanistik, PF 15 11 50, D-66041 Saarbrücken, email: [email protected]

74

Wolfgang Schweickard

wandtnis. Es handelt sich nämlich bei der Historia del estado presente del Imperio Otomano um die erste und einzige spanische Übersetzung des seinerzeit weit verbreiteten Werks The Present State of the Ottoman Empire von Sir Paul Rycaut, das zuerst 1667 in London erschienen war (zu Details der Werkgeschichte vgl. Schweickard (2016). Der Zusammenhang zwischen der Historia und Rycaut wurde bis dato (18.03.2015) nach Lage der Dinge noch von niemandem wahrgenommen. Das ist auch nicht verwunderlich, denn der Text war vor dem Eintritt in die Ära der Digitalisierung kaum bekannt und nur schwer zugänglich. Eine moderne Edition gibt es nicht. Zudem fehlt in Titelei und Vorwort jeglicher Hinweis auf die Autorschaft Rycauts. Als Herausgeber und Übersetzer des Werks wird auf dem Titelblatt der Benediktinerpater Juan Bautista Lardito genannt, über den ansonsten nichts bekannt ist. In einigen Exemplaren fehlt selbst der Hinweis auf Lardito: «Existen ejemplares de esta edición en cuya portada puede no constar el nombre del autor» (so die Information auf der Website der Universitätsbibliothek von Valladolid1). Ein solches völlig anonymes Exemplar liegt mir auch selbst in Reproduktion vor. Der vollständige Titel lautet in diesem Fall: Historia del estado presente del Imperio Otomano que, traducida, y añadida, ofrece a la luz publica, con un compendio de los progressos de la Liga Sagrada contra Turcos, Lucas Perez, Impressor de la Universidad de Salamanca (con las licencias necessarias, año de 1690). Der Name Rycaut findet in allen Ausgaben nur an einer einzigen versteckten Stelle im Text Erwähnung, aber auch dort ohne jeden Hinweis darauf, dass es sich um den eigentlichen Autor des Textes handelt: «Yo he visto (dize el Ricaut, Secretario Ingles) que en tiempo de epidemia extraordinaria no se fiaban mucho los Turcos de los preceptos de su Profeta […]» (42).

Weltweit sind heute nicht mehr als ein halbes Dutzend Exemplare des Drucks erhalten. Eines dieser Exemplare, das im Titel den Hinweis auf Lardito trägt, wurde in digitalisierter Form auf der Website der Bibliotecas de Castilla y León online zugänglich gemacht2. Dieser wissenschaftspolitisch kluge und dankenswerte Schritt wird die Rezeption des Werkes künftig entscheidend erleichtern. Die philologische Ausgangssituation wird noch dadurch kompliziert, dass der spanische Text nicht etwa auf der Grundlage des englischen Originals entstanden ist. Als Vorlage diente vielmehr die im Jahre 1672 erschienene italienische Übersetzung von Costantino Belli. Damit nicht genug. Auch die italienische Fassung basiert nicht auf dem Original, sondern wurde auf der Grundlage der ersten französischen Übersetzung von Pierre Briot aus dem Jahre 1670 erstellt. Bei der Übermittlung vom Englischen (1667) über das Französische (1670) und das Italienische (1672) bis hin

1 http://almena.uva.es/search~S1*spi/?searchtype=t&searcharg=Historia+del+estado+presente+& sort=D 2 http://bibliotecadigital.jcyl.es/i18n/consulta/registro.cmd?id=14315

Giuges, Nesiron und Zabulismes

75

zum Spanischen (1690) geht es dann zu wie bei der Stillen Post: Bereits die französische Fassung ist fehlerhaft, die italienische Version kann nur als desolat bezeichnet werden, und in der spanischen Fassung erscheinen die türkischen Belege vielfach derart verunstaltet, dass kaum noch zu erkennen ist, um was es eigentlich geht. Einige Beispiele: testà (21, 100), kiblab (24), kuflir aga (33), acanamassi (106), kindamassi (106), pachmalach (126), chashanà (178), humaugi basci (193), pizchames (201), pengihi (226, 237), mahapons (313), ostorahis (337), silhatares (355), mahames (402), etc.3.

In solchen Fällen kann der eigentliche Wortlaut oft nur durch Abgleich mit der Originalfassung rekonstruiert werden. Ein ähnlicher Befund ergibt sich bei der näheren Betrachtung des Glossars, das im Übrigen von Lardito selbst ergänzt wurde und sich in keiner der anderen Ausgaben und Übersetzungen findet. Die sonderbare Positionierung mitten im Text zwischen dem Libro primero und dem Libro segundo erklärt sich im Übrigen daraus, dass Lardito im Zuge der Drucklegung die einzelnen Kapitel gegenüber den Originalversionen neu angeordnet hat (vgl. Schweickard 2015, 91). Vermutlich hatte er das Glossar zunächst am Ende seiner Übersetzung platziert und erst später im Zuge der Umstellungen – möglicherweise unbeabsichtigt – innerhalb des Bandes verschoben. Vor diesem Hintergrund ist dann auch nachvollziehbar, dass viele der im Glossar genannten Belege erst in den darauf folgenden Abschnitten des laufenden Textes auftreten. Das Glossar wird mit den Worten eingeleitet: «Referirè (para mayor claridad de la historia) la interpretacion de alguno vocablos, y noticia de las monedas de que se haze mencio[n] en esta obra» (137). Der «mayor claridad» ist das Verzeichnis sicher nicht zuträglich. Im Folgenden wird der jeweilige Eintrag des Glossars mit Bedeutungsangabe in der Graphie des Originals gegeben (vereinheitlicht werden nur und ). Die Münzbezeichnungen, die außerhalb des eigentlichen Glossars stehen, bleiben hier unbeachtet. Das Lemma, das im Originaltext recte steht, wird hier der Übersichtlichkeit halber kursiv gesetzt. Nach dem Gedankenstrich folgt die wortgeschichtliche Einordnung. Agiam Oglanes. Ministros infimos de la Casa. – Tk. acemi oğlan / acami oğlan ʻAusbildungszögling der Janitscharenʼ < tk. acemi ‘ungeübt, unkundig’ (ar./pers. ‘aǧamī ‘fremdʼ, urspr. ʻpersischʼ) + oğlan ‘Junge’ (Redhouse 7, 897; Wehr 594; Steingass 837). Agà. Capitan. – Tk. ağa ʻHerr (würdige Anrede, Ehrentitel)ʼ (Redhouse 18).

3 Es handelt sich um tk. fetva ‘Rechtsgutachten’, kıble ‘Richtung nach Mekka (beim Gebet)’, kızlar ağa ‘Chef der schwarzen Eunuchen’, ahşam namazı ‘Abendgebet’, ikindi namazı ‘Nachmittagsgebet’, başmaklık das sogenannte ‘Pantoffelgeld’, hazine ‘Staatsschatz’, hamamcı başı ‘Oberbademeister’, bizeban ‘ein Stummer (Diener im Palast)’, pencik ‘Eigentumsurkunde (für Sklaven)’, mahpus ‘Geisel’, oturak ‘Janitscharen-Veteran’, silahtar ‘Angehöriger der Leibwache des Sultans’, mavna ‘Schleppkahn’.

76

Wolfgang Schweickard

Bostangies. Iardineros. – Tk. bostancı ʻGärtnerʼ, dann ʻAngehöriger der Leibwache des Sultansʼ < bostan ʻGartenʼ + Suffix der Nomina agentis -cı (Redhouse 191). Delios. Guardas del Visir. – Tk. deli (pl. deliler) ʻosmanische Reitertruppeʼ (Redhouse 280). Divan. Lugar del Consejo. – Tk. divan ʻStaatsratʼ < ar./pers. dīwān (Redhouse 304; Wehr 303; Steingass 555). Eserf. Originario de la estirpe de Mahoma. – Tk. eşref < ar. ašrāf, Plural zu šarīf ʻerlaucht, heiligʼ, ʻNachfahre Mohammedsʼ (Redhouse 351, 1058; Wehr 467). Eumaum. Cura, ò Parroco: el que llama à la Mezquita. – Tk. imam ‘Vorbeterʼ, ʻImamʼ < ar. imām (Redhouse 532; Wehr 26). Giuges. Enanos. – Tk. cüce ʻZwergʼ (Redhouse 233). Auch das englische Original hat bereits giuge (1667, 35). Im laufenden Text schreibt Lardito geuges: «Los Enanos que llaman Geuges, tienen tambien los quarteles en las dos Camaras de los Pages» (202). Goris. Infieles. – Tk. gavur ʻUngläubiger, Nicht-Muslim, Christʼ < ar./pers. kāfir (Redhouse 386; Wehr 833; Steingass 1006s.). Auch im laufenden Text steht goris: «los Goris, ò Infieles» (179). Das englische Original hat gaurs: «Gaurs or Infidels» (1667, 11). Auch Briot schreibt noch gaurs: «semblables aux Gaurs, c’est à dire, aux infideles» (1970, 71). Die italienische Fassung hat dann gori: «Gori, cioè infedeli (29). Hanifiz. Co[n]servador del Alcora[n]. – Tk. hanefi ʻVertreter der hanafitischen Rechtsschuleʼ < ar. ḥanafī (zum Namen Abū Ḥanīfa) (Redhouse 446; Wehr 210). Die Form Hanifiz beruht auf dem spanischen Plural. Hasahì Zufanà. Muger del Sulta[n]. – Tk. haseki sultan ʻFavoritin des Sultansʼ, oft auch nur haseki (Redhouse 456). Die Variante Hasahì Zufanà erscheint nur im Glossar. Im laufenden Text steht Hasai Sultana (206). Im Türkischen kommt das feminine Genus morphologisch nicht zum Ausdruck (sp. Sultana ist eine analoge Anpassung). Hosna Hodà. Camera del Tesorero. – Tk. hazine oda(sı) ʻSchatzkammerʼ < hazine ʻSchatzʼ + oda ʻZimmerʼ (im Türkischen üblicherweise mit dem Suffix -(s)ı der Genitivverbindungen) (Redhouse 470). Die Bedeutungsangabe bei Lardito müsste eigentlich ʻcamera del tesoroʼ lauten. Hozoda. Camara de 40. Pages. – Tk. has oda ʻLeibwache des Sultansʼ < has ʻbesonders, speziellʼ + oda ʻJanitscharenregiment (eigentlich: Zimmer, Kaserne)ʼ (Redhouse 455) Hogia. Dotor. – Tk. hoca ‘Lehrmeister, Gelehrter (auch respektvolle Anrede)ʼ < pers. ḫwāǧah (Redhouse 488; Steingass 479). Hodas. Salas. – Tk. oda ʻZimmerʼ (Redhouse 897). Hu. Que viva. – Tk. hu, Ausruf ʻhe, hedaʼ (Redhouse 491). Das trägt im Druck einen Halbbogen, der die Länge markiert. Icoglanes. Pages. – Tk. iç oğlanı ʻPage im Sultanspalastʼ (iç ʻinnenʼ + oğlan ʻJungeʼ + das Suffix der Genitivverbindungen ı (Redhouse 512). Kabin. Dote. – Tk. kabin / kebin ʻEhebestätigung durch den Richterʼ, ʻMitgiftʼ < pers. kābin (Redhouse 573, 628; Steingass 1000). Kalfas. Maestros, ò Prefectos. – Tk. kalfa ʻGeselle, Gehilfeʼ, ʻBauleiter, Geschäftsführerʼ, verkürzt aus kalifa < ar. ḥalīfa ʻVerweserʼ, ʻKalifʼ (Redhouse 587; Wehr 257). Kaduna. Matrona anciana. – Tk. kadın ‘Frau, Dame (auch respektvolle Anrede)ʼ (Redhouse 577). Kahijà. Teniente General. – Tk. kahya ʻHaushofmeister, Verwalter, Intendantʼ < pers. kad-ḫudā (kad ʻHausʼ + ḫudā ʻMeister, Besitzerʼ) (Redhouse 582; Steingass 448, 1018). Kalar. Botica. – Tk. kiler / kilar < gr.-biz. κελλάρι < gr. κελλάριον < lat. cellārium (Redhouse 664; Nişanyan 327: 15. Jh.). Die Verschreibung tritt nur im Glossar auf, im laufenden Text (193) steht kilar. Lalà. Governador, ò Protector. – Tk. lala ʻälterer Dienerʼ, ʻPrinzenerzieherʼ, auch respektvolle Anrede < pers. lālā (Redhouse 703; Steingass 1112).

Giuges, Nesiron und Zabulismes

77

Mussulman. Creyente, ò Fiel. – Tk. müslüman ʻmuslimisch; Muslimʼ < pers. muslimān (Redhouse 830; Steingass 1239). Nesiron. Edicto. – Tk. nefiri-am ʻMobilmachung aller Waffenfähigenʼ < ar. nafīr ʻāmm (Redhouse 875; Wehr 984). Das englische Original (1667, 12) und die französische Übersetzung (1670, 37) haben nesiraum, Belli schreibt in der italienische Fassung nesiron (1672, 16). Okas. Peso de dos libras. – Tk. okka ʻGewichtsmaßʼ < ar. ūqīya < gr. οὐγκία < lat. ūncia (Redhouse 898; Wehr 34; Passow 2/1,574; Georges 2,3296). Porta. Supremo Consejo. – Die ʻHohe Pforteʼ ist gebildet nach tk. Babıali < bab ʻTorʼ (ar. bāb) + ali ʻerhabenʼ (ar. ʻalī) (Redhouse 115; Wehr 639). Reis Efendi. Secretario de el Despacho Universal. – Tk. reis efendi ʻStaatsministerʼ (Redhouse 953). Seigte. Predicador del Gra[n] Señ[or]. – Tk. şeyh ʻOberhaupt eines geistlichen Ordensʼ (Redhouse 1059) < ar. šaiḫ (Wehr 496). Briot (1670, 39) hat das englische seigh der Ausgabe von 1668, 13 (die Erstausgabe 1667 hat seglo) als seigte gelesen; in die italienischen Version (1672,17) wird seigte unverändert übernommen. Safaus. Estrados, ò Camas. – Tk. sofa ʻSteinbankʼ, ʻSofaʼ < ar. ṣuffa(h) (Redhouse 1025; Wehr 516). Die gleiche Form findet sich im laufenden Text auf p. 203. Im englischen Original steht safawes (1667, 39). Tefterdar. Gran Tesorero. – Tk. defterdar ʻFinanzministerʼ < pers. daftardār (daftar ‘Register’ + das persische Suffix der Nomina agentis dār) (Redhouse 278; Steingass 529). Valeda. Reyna Madre. – Tk. valide (sultan) ʻSultansmutterʼ (Redhouse 1217). Wactisi. Legados, ò mandas. – Tk. vakıf ʻfromme Stiftung, Vermächtnisʼ < ar. waqf (Redhouse 1216; Wehr 1093). Auch im laufenden Text (203) schreibt Lardito wactisi (Graphie ). Im englischen Original (1667, 37) steht wakfi. Briot (1670, 68) schreibt wactifi, das so auch in die italienische Fassung (1671, 51) übernommen wird. Visir Azem. Primer Ministro. – Tk. veziri azam / vezir azam ʻGroßwesirʼ (Redhouse 1228). Zabulismes. Filosofos. – Tk. talebi ilm ʻIslamschülerʼ < ar. ṭālib al-ʻilm (Redhouse Wehr 564). Im laufenden Text steht Zalibulismos: «Otros, que son amantes de la Filosofia, y su lectura se llaman Zalibulismos, que es gente mas adelantada en la doctrina» (198). Das englische Original von 1667 wie auch die italienische Version von 1672 (44) haben talibulilmi.

Während es für das Sprachenpaar Italienisch-Türkisch eine reiche Glossartradition gibt, die bis ins 15. Jahrhundert zurückreicht, steht Larditos spanisch-türkische Wortliste allein auf weiter Flur. Dies liegt natürlich daran, dass die spanisch-türkischen Sprachkontakte insgesamt nur mäßig ausgeprägt waren. Zwar war auch das habsburgische Spanien in der Zeit der Türkenkriege an zahlreichen militärischen Auseinandersetzungen mit den Osmanen beteiligt (vor allem in den nordafrikanischen Gebieten, die seit dem 16. Jh. unter osmanischer Hoheit standen). Doch direkte Einblicke in die sprachliche Realität des Türkischen gewannen nur vergleichsweise wenige Personen. Dabei handelte es um einzelne Reisende, Söldner, Kriegsgefangene, Kaufleute und Pilger wie Tafur, Almosnino und Sapiencia in Konstantinopel und der Levante oder Cervantes und Haedo in Algier (vgl. Schweickard 2014). Aus dieser Sicht ist das hier besprochene Glossar durchaus ein Solitär, wenn auch nicht in jedem Sinne des Wortes.

78

Wolfgang Schweickard

Literatur Georges = Georges, Karl Ernst/Georges, Heinrich: Ausführliches Lateinisch-Deutsches Handwörterbuch. 2 Bände. Darmstadt: Wissenschaftliche Buchgesellschaft, 1976 (Nachdruck). Passow = Passow, Franz: Handwörterbuch der griechischen Sprache. Neu bearbeitet und zeitgemäß umgestaltet von Val. Chr. Fr. Rost und Friedrich Palm. Vol. 1/1: A–D (51841), vol. 1/2: E–K (51847), vol. 2/1: L–P (51852), vol. 2/2: R–W (51857). Darmstadt: Wissenschaftliche Buchgesellschaft, 2004 (Nachdruck). Redhouse = Redhouse yeni Türkç-Ingilizce sözlük/New Redhouse Turkish-English Dictionary. Istanbul: Redhouse Yayınevi, 2002. Rycaut, Paul (1667): The present state of the Ottoman Empire. London: printed for John Starkey and Henry Brome. Rycaut, Paul (1670): Histoire de l’etat present de l’Empire Ottoman, contenant les maximes politiques des Turcs, les principaux points de la religion Mahometane, les sectes, ses héresies, & ses diverses sortes de religieux […]. Traduite de l’anglais de monsieur Ricaut […] par Monsieur Briot. Paris: chez Sebastien Mabre-Cramoisy. Rycaut, Paul (1672): Historia dello stato presente dell’Imperio ottomano. Composta prima in lingua Inglese […], tradotta poscia in Francese dal Sig. Briot, e finalmente trasportata in Italiano da Costantin Belli. Venetia: presso Combi & La Noù. [Rycaut, Paul] (1690): Historia del estado presente del Imperio Otomano que, traducida, y añadida, ofrece a la luz publica, con un compendio de los progressos de la Liga Sagrada contra Turcos el P. M. Fr. Juan Bautista Lardito, Maestro General de la Religion de S. Benito, Cathedratico de Phisicos de la Universidad de Salamanca, y Regente de los estudios en su Colegio de S. Vicente. Con las licencias necessarias, en Salamanca: por Lucas Perez. Schweickard, Wolfgang (2014): “Espacos, Olofagos, y Caripicos”. Turzismen im frühneuzeitlichen Spanisch. In: Zeitschrift für romanische Philologie 130, 915–927. Schweickard, Wolfgang (2015): Paul Rycaut, “The Present State of the Ottoman Empire”. Textual tradition and lexical borrowings from Turkish. In: Studia Linguistica Universitatis Iagellonicae Cracoviensis 132, 187–196. Steingass = Steingass, Francis Joseph, A comprehensive Persian-English dictionary, including the Arabic words and phrases to be met with in Persian literature, being Johnson and Richardson’s Persian, Arabic & English dictionary, revised, enlarged and entirely reconstructed. New Delhi: Munshiram Manoharlal, 2000. Wehr = Wehr, Hans, A Dictionary of Modern Written Arabic. Edited by J. Milton Cowan. Ithaca (NY): Spoken Language Services, 31976. Wiegand, Herbert Ernst (2006–2014): Internationale Bibliographie zur germanistischen Lexikographie und Wörterbuchforschung. Mit Berücksichtigung anglistischer, nordistischer, romanistischer, slavistischer und weiterer metalexikographischer Forschungen. Band 1: A–H (2006), Band 2: I–R (2006), Band 3: S–Z (2007), Band 4: Nachträge (2014). Berlin. New York: de Gruyter. Wiegand, Herbert Ernst (2007): Il riferimento indirizzato nei dizionari bilingui a stampa. Studi italiani di linguistica teorica ed applicata 36, 7–87. Wiegand, Herbert Ernst/Fuentes Morán,Teresa (2009): Estructuras lexicográficas. Aspectos centrales de una teoría de la forma del diccionario. Granada: Tragacanto.

Lexikographie und Linguistik: wortartenbezogene Aspekte

Milka Enčeva

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie Abstract: The current research focuses on a lexicographical approach to compound nouns in monolingual and bilingual dictionaries with German as a foreign language. The 1st IC (immediate constituent) of a compound is regarded as the word internal argument realization of the 2nd IC being the valence noun. The valence nouns within the compound nouns prefer particular arguments as the valence nouns in nominal phrases and therefore can be taken into consideration when writing dictionary articles on nouns. The analyses focuses on dictionary articles in monolingual and bilingual (learner) dictionaries to determine whether the long lists with lexicographical unprocessed compound words at the end of the dictionary articles of both IC may be useful in situations of text reception, text production and foreign language learning. In addition to that proposals for the lexicographical practice will be made on how compound nouns can be incorporated into dictionary articles of both IC. Keywords: noun valence, compound nouns, argument realization, dictionaries, dictionary articles, lexicographical unprocessed compound words Schlagwörter: Substantivvalenz, Komposita/zusammengesetzte Substantive, Argumentrealisierung, Wörterbücher, Wörterbuchartikel, lexikographisch unbearbeitete Komposita

1 Einführung Anlass für die Verfassung dieses Beitrags ist die Auffassung, dass in einsprachigen und zweisprachigen Wörterbüchern mit Deutsch für Benutzer, deren Muttersprache nicht das Deutsche ist, die Angaben zur Bildung von Sätzen reichhaltiger, spezifischer und expliziter werden sollten (vgl. Bergenholtz 1984; Schierholz 1996; Wiegand 1996). Da die Struktur der deutschen Nominalphrase (NP) wegen ihres häufigeren Gebrauchs in Fachtexten in den Bereichen der Wissenschaft, Technik und Presse immer komplexer wird, wird hier davon ausgegangen, dass die Angaben zur Bildung von Nominalphrasen auch verbessert und erweitert werden könnten bzw. sollten.

Milka Enčeva: Universität Maribor/Slowenien, Koroska c. 160, Slo-2000 Maribor, email: [email protected]

82

Milka Enčeva

Der vorliegende Beitrag setzt sich das Ziel, auf die Ergebnisse einer empirischen Untersuchung1 aus lexikografischer Sicht einzugehen und deren Anwendung in der lexikografischen Praxis zur Diskussion zu stellen. „Eine möglichst explizite lexikografische Bearbeitung syntaktischer (und damit zusammenhängender semantischer) Eigenschaften“ muss sich aber auf eine „Grammatik(konzeption)“ beziehen – auf eine Wörterbuchgrammatik, die „kein Sammelsurium“ von Aussagen aus unterschiedlichen Grammatiken darstellt (vgl. Wiegand 1996: 114). Da sich durch das Konzept der Substantivvalenz die Struktur der Nominalphrase im Deutschen ohne theoretisch widersprüchliche Annahmen erklären lässt (vgl. Hölzner 2007: 3), wird es für eine linguistisch angemessene Beschreibung der grammatischen Phänomene im Beitrag herangezogen. Als besonders wichtig für die Beschreibung der Struktur der Nominalphrase erweist sich die Unterscheidung zwischen wortinternen, intraphrastischen und transphrastischen Argumentrealisierungen der Valenzkandidaten der Bezugssubstantive. Als wortinterne Argumentrealisierung wird die 1. UK eines Kompositums betrachtet, dessen 2. UK das Bezugssubstantiv ist (vgl. Lauterbach 1993, Hölzner 2007, Enčeva 2013). Bei der intraphrastischen Realisierung werden die Argumente des Bezugssubstantivs innerhalb der von ihm regierten NP, und bei der transphrastischen Realisierung außerhalb der von ihm regierten NP realisiert, d. h. als Partnerwort im Satz oder im Kontext als Kontextrealisierung (vgl. Sandberg 1979: 44–52, Hölzner 2007: 23). Bei der Zusammenfassung der Ergebnisse seiner empirischen Untersuchung hebt Hölzner hervor, dass es  

„[…] zum einen so gut wie keine semantische Rolle zu geben [scheint], für die vom System her keine Möglichkeit besteht, als Erstglied eines Kompositums realisiert zu werden. Zum anderen wird im realen Gebrauch von dieser multifunktionalen Einsetzbarkeit der Kompositumsvariante überraschend häufig Gebrauch gemacht“ (2007: 32).

Diese Erkenntnisse, die typologische Besonderheit der deutschen Sprache, in der die Komposition vom System her nahezu unbeschränkt ist, und die zur Tradition in der deutschsprachigen Lexikografie gewordenen langen Listen mit aufgezählten Komposita am Ende eines Wörterbuchartikels in ein- und zweisprachigen Wörterbüchern mit Deutsch haben dazu geführt, dass das Forschungsinteresse im Beitrag der wortinternen Valenzrealisierung der Substantive in Komposita gelten wird. Im Rahmen dieser Untersuchung wird überprüft, ob bei den Substantivkomposita auch eine bestimmte Argumentstelle präferiert wird, wie dies Hölzner für die intraphrastische Argumentrealisierung der valenten Substantive feststellt (Hölzner 2007: 314–319). 1 Es geht um die kontrastive Untersuchung „Formale und semantische Motivationsanalyse der unmittelbaren Konstituenten deutscher Substantivkomposita in Fachtexten der technischen Chemie und ihrer Entsprechungen im Bulgarischen“, die als Doktorarbeit an der Sofioter Universität vorgelegt wurde (vgl. Enčeva 2013).

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie

83

Die Verifizierung dieser Annahme wäre ein Anlass darüber nachzudenken, ob die Aufnahme der präferierten Argumentstellen der valenten Substantive in die Wörterbuchartikel zweckmäßig wäre. Außerdem wird der Frage nachgegangen, ob sich die Ergebnisse über die Argumentstruktur der als 2. UK von Komposita fungierenden valenten Substantive in diesem Beitrag von den Ergebnissen von Ehrich/Rapp (2000) unterscheiden. Veronika Ehrich und Irene Rapp leiten die Argumentstruktur von ung-Nominalisierungen aus ihrer lexikalisch-semantischen Struktur mithilfe eines semantikbasierten Linking-Ansatzes her und stellen fest, dass das Nominallinking dem Verballinking diametral entgegengesetzt sei (Ehrich/Rapp 2000: 299). Nach einer kurzen Beschreibung der Datenermittlung wird das Valenzkonzept dargestellt, worauf die empirische Untersuchung beruht. Danach wird auf jene Ergebnisse der Untersuchung eingegangen, die für die lexikografische Bearbeitung von lemmatisierten Substantiven von Bedeutung sind. Analysiert werden Wörterbuchartikel in ein- und zweisprachigen (Lerner-)Wörterbüchern. Auf der Grundlage der Erkenntnisse der erwähnten empirischen Untersuchung werden anschließend Vorschläge für die lexikografische Praxis gemacht.

2 Datenermittlung Da die Ergebnisse einer korpusbasierten Untersuchung dem tatsächlichen Stand der Sprache entsprechen, wurden die Daten aus Fachtexten exzerpiert. Sie beziehen sich auf den schriftlichen Sprachgebrauch auf der synchronen Ebene, wobei keine Repräsentativität des Korpus und der ermittelten Daten angestrebt wird. Schierholz (2001) und Hölzner (2007) legten den größten korpusbasierten Untersuchungen zur Valenz deutscher Substantive die Ausgaben der „taz“ bzw. des „Tagesspiegels“ als Korpora zugrunde. Damit nicht nur Substantive aus Zeitungsartikeln untersucht werden, wurden im Beitrag Texte aus dem Bereich der experimentellen Wissenschaften und Technik (genauer der technischen Chemie) ausgewählt. Die technische Chemie ist ein interdisziplinärer Bereich, der Naturwissenschaften (Chemie, Physik) und Ingenieurwissenschaften (Verfahrenstechnik) in sich vereint, und sich aus diesem Grund für eine linguistische Untersuchung als besonders geeignet erweist. Die Fachtexte sind für die Kommunikation unter Wissenschaftlern, zwischen Wissenschaftlern und Studierenden sowie zwischen Wissenschaftlern und wissenschaftlich-technischen Hilfskräften bestimmt und können einer hohen Abstraktionsstufe zugeordnet werden.

84

Milka Enčeva

3 Untersuchungsmethode Im Beitrag wird die Substantivvalenz als eigenständiger Bereich behandelt. Es wird davon ausgegangen, dass sowohl Nominalisierungen als auch originäre Substantive über Valenz verfügen können. Im Unterschied zur Verbvalenz kann ein und dasselbe Substantiv eine absolute und eine relative Verwendungsweise aufweisen (vgl. Hölzner 2007: 153), was in der Wiegandschen Ausdrucksweise2 (1996) heißen würde – der Sprecher ist sowohl „Herr“ (bei der absoluten Verwendungsweise) als auch „Sklave“ (bei der relativen Verwendungsweise) der Substantive.

3.1 Das multidimensionale Valenzkonzept Wie in Jacobs (1994, 2003) wird die Substantivvalenz als ein Oberbegriff („cover term“) für einzelne Valenzdimensionen verstanden, die unabhängig voneinander bestehen, wobei keine von ihnen in einem wechselseitigen Implikationsverhältnis stehen. Durch die Beschreibung anhand mehrerer autonomer Valenzdimensionen werden die Strukturebenen und die Beziehungen zwischen ihnen festgelegt und genau erfasst. Demzufolge kann die Substantivvalenz präziser beschrieben werden. Außerdem wird durch das mehrdimensionale Valenzkonzept das Problem der Abgrenzung von Ergänzungen und Angaben bzw. der Abgrenzung von obligatorischer und fakultativer Valenz vermieden. In der vorliegenden Arbeit werden die so bezeichneten Valenzdimensionen Argumenthaftigkeit (ARG – verbunden mit der Dimension der Partizipanz), Inhaltsspezifik (INSP), syntaktische Notwendigkeit (NOT) und Formspezifik (FOSP) angewendet und zu einer semantischen (ARG und INSP) und einer syntaktischen (NOT und FOSP) Gruppe zusammenfasst (vgl. Hölzner 2007: 113). Wie in den Untersuchungen von Ehrich/Rapp (2000), Reinhard (2001), Hölzner (2007) u. a. wird im Beitrag die Methode der lexikalischen Dekomposition eingesetzt, weil die Ansicht vertreten wird, dass die Argumente in der lexikalisch-semantischen Struktur (LSS) der Valenzträger enthalten sind. Dafür werden die Substantivbedeutungen in atomare Prädikate zerlegt. Da die lexikalische Dekomposition der Substantivbedeutungen nicht im Mittelpunkt dieser Untersuchung steht, wird bei der semantischen Repräsentation eines Substantivs die LSS nicht wie in Ehrich/Rapp (2000) dargestellt, sondern in Anlehnung an die Repräsentationen in Hölzner (2007). Die als Valenzträger vorkommenden Substantive werden nach der Art der ihnen zugrundeliegenden semantischen Prädikate in Gruppen klassifiziert. 2 Ich berufe mich auf den in der einschlägigen Forschungsliteratur sehr oft zitierten Artikel von Wiegand, der durch die Metapher „Der Sprecher ist ‚Sklave der Verben‘ und ‚Herr der Substantivgruppe‘[…]“ auf den Unterschied zwischen Verb- und Substantivvalenz aufmerksam macht (Wiegand 1996: 138).

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie

85

3.2 Die semantischen Rollen bzw. Makrorollen Die semantischen Beziehungen zwischen den Argumenten und dem Valenzträger werden durch semantische Rollen dargestellt. Die Schwierigkeiten ergeben sich daraus, dass die Zahl der semantischen Rollen von Untersuchung zu Untersuchung schwankt. Derzeit gibt es kein endgültiges Inventar an semantischen Rollen. Es bleibe immer umstritten, wie viele Rollen-Typen man ansetzen werde. Das sei von den Anwendungszwecken abhängig, so von Polenz (1988:169). Er stellt eine der umfangreichsten Listen mit 19 semantischen Rollen zusammen, fügt aber trotzdem hinzu, dass damit die Liste mit möglichen semantischen Rollen keineswegs erschöpft sei (von Polenz 1988: 170–172). Es gibt auch eine andere Herangehensweise an das Problem mit dem Inventar der semantischen Rollen. Dowty (1991) behandelt die semantischen Rollen nicht mehr als diskrete Einheiten, sondern zerlegt sie in elementare Basisrollen („entailments“) und setzt daraus zwei prototypische Makrorollen, Proto-Agens und Proto-Patiens, zusammen. Im Unterschied zu Dowty (1991) wendet Reinhard (2001) in Anlehnung an Primus (1999) noch eine Makrorolle namens Proto-Goal an. Unter Proto-Goal fasst Reinhard semantische Rollen wie „Goal“, „Experiencer“, „Rezipient“, „Adressat“ und „Benefaktiv“ zusammen, die bei Dowty nicht vorkommen, aber für die Beschreibung der Argumentstruktur dreistelliger Prädikate erforderlich sind (vgl. Reinhard 2001: 55). Bei der Erstellung der Liste wird im Beitrag im Sinne von Peter von Polenz (von Polenz 1988) von den Untersuchungszielen und den empirischen Daten ausgegangen. Berücksichtigt wird auch die Liste der semantischen Rollen bei Matthias Hölzner, mit der er die Valenz von Substantiven beschreibt (vgl. Hölzner 2007: 122). An dieser Stelle werden nur die in der vorliegenden Arbeit eingesetzten semantischen Rollen aufgezählt: Agens (Ag), Kausator (Kaus), Instrument (Instr), Prozessträger (PT), Zustandsträger (ZT), Effektiv (Eff), Objektiv (Obj), Finativ (Fin), Possessor (Pr), Possessum (Ps), Relator (Rl), Relatum (Rt) und Substanz (Sub). Bei der Analyse der ermittelten Daten hat sich erwiesen, dass es für die Zusammenfassung der Ergebnisse vorteilhafter ist, eine zweite Abstraktionsebene mit Makrorollen einzuführen. In Anlehnung an Reinhard (2001) wird von drei Makrorollen, Proto-Agens, Proto-Goal und Proto-Patiens, ausgegangen. Die Makrorollen werden als ein Kontinuum aufgefasst, sodass keine scharfen Grenzen zwischen ihnen gezogen werden und nicht versucht wird, die einzelnen semantischen Rollen einer streng abgegrenzten Makrorolle aufzuzwingen. Vielmehr werden die Argumente nach dem Prinzip einer Mehr-oder-weniger-Zugehörigkeit3 den Makrorollen zugeordnet.

3 An dieser Stelle sei auf die Untersuchung von Schierholz (2001) hingewiesen, in der die Zuordnung von präpositionalen Nominalphrasen entweder zu den Präpositionalattributskonstruktionen oder zu den Konstruktionen mit einer attributiven adverbialen Bestimmung nach dem Prinzip einer Mehr-oderweniger- Zugehörigkeit erfolgt.

86

Milka Enčeva

Grafik 1: Das Kontinuum der Makrorollen bzw. der einzelnen semantischen Rollen.

Auf dem linken Teil der Achse liegen diejenigen Argumente, deren Agenshaftigkeit abnimmt, je näher sie sich der Makrorolle Proto-Goal befinden und auf dem rechten Teil der Achse diejenigen, deren Patienshaftigkeit abnimmt, je näher sie auf der Achse der Makrorolle Proto-Goal sind. Auf dem rechten Teil der Achse liegt ganz rechts das Effektiv; es gilt als der prototypische Vertreter mit dem höchsten Grad an Patienshaftigkeit. Ihm folgt das Objektiv, weil es nicht so stark wie das Effektiv von der Handlung effiziert wird und demzufolge weniger patienshaftig ist. Die dritte Makrorolle Proto-Goal wird auf die Achse zwischen Proto-Agens und Proto-Patiens platziert. Der prototypische Vertreter des Proto-Goals ist das Argument Finitiv (Fin) im Sinne von Christina Gansel, nach der dieses Argument Ziel der Handlung ist und über das Merkmal [abstrakt] verfügt (Gansel 1992: 77). Links und rechts von ihm befinden sich weniger prototypische Vertreter der Makrorolle Proto-Goal. Je größer die Entfernung von Fin ist, über desto weniger Merkmale des Proto-Goals verfügt das Argument. Je nachdem, auf welcher Seite des Prototyps es steht, beginnt es Merkmale entweder des Proto-Agens oder des Proto-Patiens aufzuweisen. Auf der linken Seite von Finitiv stehen die Argumente Possessor und Relator, auf der rechten die Argumente Substanz, Possessiv und Relatum. In der Arbeit wird angenommen, dass die zwei Argumente auf der linken Seite über ähnliche Merkmale verfügen, so dass sie gleichermaßen mehr oder weniger prototypisch sind – bildhaft ausgedrückt: gleich weit vom Prototyp Finitiv entfernt sind. Die zwei Argumente können sowohl belebte als auch unbelebte Größen bezeichnen: dem Possessor wird ganz allgemein eine Haben-Relation, dem Relator eine einordnende Größe zugewiesen. Sie unterscheiden sich von den Vertretern des Proto-Agens dadurch, dass sie keine Handlung, keinen Vorgang oder Zustand mitkonstituieren (tragen), sondern ihnen eine Relation zugewiesen wird. Die mit Possessor und Relator innerhalb der jeweiligen Beziehung korrelierenden Glieder Possessiv und Relatum stehen rechts vom Prototyp Finitiv. Rechts steht auch das Argument Substanz, das die Beschaffenheit bzw. die Zusammensetzung oder die Herkunft einer Größe angibt.

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie

87

4 Argumentrealisierungen der Valenzkandidaten der Bezugssubstantive Seit Mitte der 90er Jahre wird darauf hingewiesen, dass die Valenzkandidaten der Bezugssubstantive bei deren Realisierung innerhalb der NP ein anderes Verhalten aufweisen als die Valenzkandidaten der Verben (Wiegand 1996: 138, Schierholz 2001: 279, Reinhard 2001: 38, Ehrich/Rapp 2000: 246, Hölzner 2007: 338). Im Unterschied zu den Verben steht bei den valenten Substantiven nicht die Frage im Vordergrund, wie viel Argumentstellen besetzt werden bzw. welche Ergänzungen obligatorisch und welche fakultativ sind, sondern welche Argumentstelle realisiert bzw. „fokussiert“ wird. So machen z. B. in der Untersuchung von Hölzner die Belege mit nur einer realisierten Argumentstelle mehr als 50 % aller Belege eines der untersuchten Substantive aus; und ihm fällt eine Präferenz für ein bestimmtes Argument bei der Realisierung einer Argumentstelle auf, die er als „fokussierte“ Argumentstelle bezeichnet (vgl. Hölzner 2007: 339). In Anlehnung an Ehrich/Rapp (2000) wird im Beitrag davon ausgegangen, dass die Argumentrealisierung lexikalisch-semantisch begründet ist. Sie stellen Argumentregeln auf, mit denen die Argumentstruktur der deverbalen Nominalisierungen aus ihrer LSS herzuleiten ist. Die von Hölzner (2007) analysierten empirischen Daten liefern Beispiele dafür, dass der reale Sprachgebrauch mit den Nominallinkingregeln im Sinne von Ehrich/Rapp (2000) nicht oder nicht immer darzustellen ist. Deshalb wird in diesem Beitrag bei der Analyse der Argumentstruktur der valenten Substantive auf Nominallinkingregeln wie in Ehrich/Rapp (2000) verzichtet; aber es wird überprüft, ob bestimmte Argumente bei der Besetzung einer Argumentstelle präferiert werden. Eine Klassifizierung entweder nach der Nominationsfunktion (Teubert 1979), oder nach der Zugehörigkeit zu einer Sachgruppe (Helbig 1992), oder zu einer Wortbildungskategorie (Eisenberg 1999) kann nicht allen Besonderheiten der Bezugssubstantive Rechnung tragen. Hölzner (2007: 125) klassifiziert die valenten Substantive nach der Art der ihnen zugrundeliegenden semantischen Prädikate und unterscheidet drei Klassen:  

Klassen valenter Substantive 1. Eventualitäten4 2. rollendenotierende Substantive 3. relationsdenotierende Substantive

Beispiele Herstellung, Besuch Lieferung, Teilnehmer Bruder, Tiefpunkt

4 Der Terminus Eventualitäten wird auch von Ehrich/Rapp (2000: 251) verwendet. Nur Eventualitäten haben eine Zeitstruktur mit Beginn, Verlauf und Abschluss.

88

Milka Enčeva

Diese Klassifizierung eignet sich sehr gut als Grundlage für eine Analyse der semantischen Beziehungen zwischen einem Substantiv als Valenzträger und seinen Argumenten, weil sie auf dessen semantischen Prädikaten beruht. Deswegen wird sie auch in dieser Arbeit eingesetzt.

4.1 Eventualitäten Wie in anderen Untersuchungen (Ehrich/Rapp 2000, Reinhard 2001) wird die in Vendler (1957) erstellte Klassifizierung der Verben nach ihrer Aktionsart übernommen. Aufgrund dessen werden die „Eventualitäten“ in drei Gruppen unterteilt – Prozess-Substantive, Zustands-Substantive und Ereignis-Substantive. Die einzelnen Gruppen weisen ihr eigenes referentielles Argument auf, das mit „r“, „s“ und „e“ in eckigen Klammern bezeichnet wird.

4.1.1 Prozess-Substantive Das Prozess-Substantiv Ablauf als Valenzträger verfügt über ein thematisches Argument (x) und über ein referentielles Argument [r]. Die Argumentstelle von (x) wird im Kompositum Reaktionsablauf durch die 1. UK Reaktion- besetzt. (1) Reaktionsablauf [r](x) – (x) = PT (Prozessträger) Bei den Prozess-Substantiven als 2. UK von Komposita wird eine Fokussierung im Sinne von Hölzner (2007) auf die Argumentstelle Prozessträger mit 79% aller Belege festgestellt. PT gehört zu der Makrorolle Proto-Agens, weist aber nicht die Merkmale der prototypischen semantischen Rolle Agens auf. Nach den Argumentregeln von Ehrich/Rapp (2000) hat bei den Prozess-Substantiven das Objektargument Vorrang, auch wenn das Subjektargument auftreten kann. In dieser Arbeit kommt es zum entgegengesetzten Ergebnis5.

4.1.2 Zustands-Substantive Bei den Zustands-Substantiven machen die Komposita mit der realisierten Argumentstelle Zustandsträger (ZT) 58% der Belege aus.

5 Es wird noch einmal darauf hingewiesen, dass Ehrich/Rapp nur ung-Nominalisierungen im Rahmen eines Linkingansatzes untersuchen. In diesem Beitrag wird von einem mehrdimensionalen Valenzmodell ausgegangen.

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie

89

(2) Wärmeverlust [s](x) – (x) = ZT Anhand der gewonnen Daten kann in dieser Arbeit angenommen werden, dass bei den Zustands-Substantiven als 2. UK der Komposita die Argumentstelle ZT präferiert wird. Der ZT gehört zu der Makrorolle Proto-Agens, weist aber wie PT nicht die Merkmale der prototypischen semantischen Rolle auf. Da es zu wenig Belege für Zustands-Substantive im Korpus gibt, sollte dieses Ergebnis an weiteren Komposita überprüft werden. Nach Ehrich/Rapp (2000) können bei Zustands-Substantiven sowohl Subjekt- als auch Objektargumente realisiert werden, wobei die Objekt-Argumente den Vorrang haben (Ehrich/Rapp 2000:276). Wie bei den Prozess-Substantiven kommt es in dieser Arbeit zum entgegengesetzten Ergebnis.

4.1.3 Ereignissubstantive Die meisten Komposita mit einem Ereignissubstantiv als 2. UK verfügen über eine Argumentstruktur [e](x)(y), deren thematische Argumente durch Agens (Ag) und Objektiv (Obj) bzw. Agens (Ag) und Effektiv (Eff) realisiert werden. Als 1. UK wird nur die Argumentstelle für das Obj bzw. Eff besetzt. (3) [e](x)(y) – (y) = Obj , {(x) = Ag}6 z. B. Abgasentstaubung, Oberflächentrocknung (4) [e](x)(y) – (y) = Eff , {(x) = Ag} z. B. Ammoniaksynthese, CaCN2-Produktion  



Darüber hinaus besteht auch eine kleine Gruppe Bezugssubstantive, die neben dem referentiellen Argument „e“ drei thematische Argumente aufweist. Den drei Argumentstellen werden die semantischen Rollen Ag, Obj und Instr (Instrument) zugewiesen. Wenn in den Komposita die Argumentstelle (1. UK) nicht durch Obj bzw. Eff besetzt wird, kommt die semantische Rolle Instr vor. (5) [e](x)(y)(z) – (z) = Instr, {(x) = Ag, (y) = Obj} z. B. Damрfsрaltung, Laugewäsche  

Da es bei Obj und Eff nur um einen graduellen Unterschied in der Affiziertheit geht und beide semantischen Rollen zu der Makrorolle Proto-Patiens gehören, können die Belege mit der realisierten Effektiv-Argumentstelle zu den Belegen mit dem realisierten Objektiv-Argument gerechnet werden. Folglich stellen die Belege mit Obj- und EffArgumenten 86% aller Belege dieser Gruppe und zugleich ihre präferierten Argumentstellen dar. Nach den Nominallinkingregeln von Ehrich/Rapp (2000) kann bei Ereig-

6 In geschweiften Klammern wird die nicht besetzte Argumentstelle des als 2. UK fungierenden Valenzträgers angegeben.

90

Milka Enčeva

nis-Substantiven nur das rangniedrigste Argument realisiert werden; das ist in diesem Fall das Effektiv, und eventuell das Objektiv. Die Realisierung des Arguments Instrument kann mit diesen Regeln nicht erklärt werden. Um Schlussfolgerungen zu ziehen, wären weitere empirische Untersuchungen nötig. Allgemein kann man für die gesamte Gruppe der Eventualitäten annehmen, dass Obj und Eff bzw. das Proto-Patiens mit zusammen 70% aller Belege die präferierten Argumentstellen sind. Diese Feststellung entspricht zum großen Teil den Nominallinkingregeln von Ehrich/Rapp (2000). Es gibt bei den Ereignis-Substantiven keine Belege für die Realisierung der prototypischen Argumentstelle Agens der Makrorolle Proto-Agens. Die realisierten Argumente der Prozess- und Zustands-Substantive PT und ZT befinden sich an der Peripherie der Makrorolle Proto-Agens. Als Argumente mit niedrigem Agenshaftigkeitsgrad sind sie auch ein indirekter Beweis für den Vorrang des Proto-Patiens. Interessant wäre zu überprüfen, ob sich bei der Erhebung weiterer Daten wieder Belege für die Realisierung der Argumentstelle Instrument finden werden, das nach Agens und Kausativ das dritte Argument auf der Hierarchieskala nach dem Grad der Agenshaftigkeit ist.

4.2 Rollendenotierende Substantive Bei dieser Substantivklasse kommt einer der wesentlichen Unterschiede zwischen der Verb- und Substantivvalenz zum Ausdruck.Verben haben immer ein Situationsargument (e, r, s) als referentielles Argument; bei den valenten Substantiven hingegen kann auch ein thematisches Argument als referentielles Argument auftreten. Folglich werden diese Substantive als rollendenotierende Substantive bezeichnet. Das Lexem Lieferant beispielsweise eröffnet eine Argumentstelle für den Gegenstand seiner Tätigkeit. In der semantischen Beziehung zu dieser Argumentstelle ist der Valenzträger Lieferant zugleich auch das Agens. Deshalb wird das Argument für das Agens als referentielles Argument angegeben. (5) Rohstofflieferant [x](y) – [x] = Ag, (y) = Obj (6) Reisekosten [y](x) – [y] = Eff, (x) = Kaus In (6) dagegen entstehen Kosten durch eine Reise; deshalb sind sie als Resultat einer Tätigkeit als Effektiv, und die Reise als Verursacher als Kausativ zu bestimmen –: x verursacht y. Folglich ist das thematische Argument y auch als referentielles Argument zu bezeichnen. Bei den rollendenotierenden Substantiven tritt als referentielles Argument in 98,5 % der Belege das thematische Argument Effektiv auf. Das am häufigsten realisierte thematische Argument ist Finitiv mit 75 % der Belege, gefolgt von Kausativ mit 14,3 %, und Agens mit 9,2 % der Belege. Es zeichnet sich eine deutliche Präferenz des

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie

91

Finitivs ab. Die geringe Anzahl der Belege der Ag-Argumentstelle könnte auf die Besonderheiten der Fachsprache (hier: technische Chemie) zurückgeführt werden, in der chemische Reaktionen, technologische Prozesse und Apparate im Vordergrund stehen.

4.3 Relationsdenotierende Substantive In vielen Arbeiten zur Substantivvalenz7 werden solche Substantive als „valent“ behandelt, die keine Nominalisierungen sind, aber in einer Relation zu anderen Personen, Objekten, Sachverhalten stehen. In der Terminologie des multidimensionalen Valenzkonzepts sind das Substantive, die in der Beziehung der Argumenthaftigkeit (ARG) zu einem anderen stehen. So erübrigt sich die Frage, nach welchen Kriterien sie von den avalenten Substantiven abgegrenzt werden. Im Beitrag werden die relationsdenotierenden Substantive nicht als eine einheitliche Gruppe behandelt. Nach der Art der semantischen Beziehung zwischen Valenzträger und Valenzkandidaten werden folgende Untergruppen differenziert: a) relationsdenotierende Substantive zum Ausdruck possessiver Beziehungen: Ofendecke, Reaktorwand, Bandabsetzer, Feldstärke, Stromdichte; b) relationsdenotierende Substantive zum Ausdruck der Einordnungsbeziehung: Mahlarbeit, Chlorierungsprozess; c) relationsdenotierende Substantive zum Ausdruck der Beziehung Substanz: Glaskolben, Brennersystem; d) relationsdenotierende Substantive zum Ausdruck der finalen Beziehung: Hochdrucknetz, Hochtemрeraturzone. Bei den relationsdenotierenden Substantiven werden als 1. UK in Komposita nur thematische Argumente realisiert, die der Makrorolle Proto-Goal angehören. Sie weisen weder Agenshaftigkeit noch Patienshaftigkeit auf, weil es um semantische Rollen geht, die sich an der Schnittstelle zwischen Proto-Agens und Proto-Patiens befinden. Sie verfügen weder über die Merkmale [intentional], [kausal] und [instrumental] noch über die Merkmale [effiziert] und [affiziert]. Der prototypische Vertreter des ProtoGoal, das Finitiv, verfügt über das Merkmal [Ziel]. Den größten Anteil an Belegen haben diejenigen semantischen Rollen, die in Paaren vorkommen und sich gegenseitig bedingen – Possessor und Possessiv sowie Relator und Relatum. Als präferierte Argumentstelle kann die Stelle für die possessive Beziehung betrachtet werden, weil sie bei 38% der relationsdenotierenden Substantive vorkommt. In der Grafik 2 wird die Verteilung der thematischen Argumente der drei Gruppen valenter Substantive dargestellt.

7 z. B. Teubert (1979), Helbig (1992), Agel (2000), Hölzner (2007) u. a.  

92

Milka Enčeva

Grafik 2: Realisierung8 der thematischen Argumente aller valenten Substantive.

Es fällt auf, dass die relationsdenotierenden Substantive zu hundert Prozent auf das Proto-Goal konzentriert und die Eventualitäten nur auf die Makrorollen Proto-Patiens und Proto-Agens verteilt sind, wobei die Fokussierung auf die patienshaften Argumente Objektiv und Effektiv deutlich ausgeprägt ist. Von den agenshaften Argumenten werden diejenigen, die an der Peripherie liegen, präferiert – PT, ZT und Instr, das zwischen den prototypischen agenshaften Argumenten und der Peripherie vorkommt. Eine Zwischenstellung nehmen die rollendenotierenden Substantive ein. Die Fokussierung der 2. UK der Komposita liegt in 98,7 % der Fälle auf dem Argument Eff. Bei der 1. UK liegt die Präferenz eindeutig auf dem Fin, das in 75 % aller rollendenotierenden Substantive vorkommt. Die Fokussierung auf das Proto-Goal haben die rollendenotierenden Substantive mit den relationsdenotierenden gemeinsam. Wie die Eventualitäten können auch sie Argumentstellen agenshafter Argumente besetzen. Sie bevorzugen die prototypischen Vertreter Ag und Kaus, während die Ereignissubstantive die Argumentstellen der Peripherieargumente PT und ZT besetzen. Insgesamt liegt die Fokussierung auf dem Proto-Goal mit 57,3 % aller Belege, gefolgt vom Proto-Patiens mit 29,2 %. Die Belege der agenshaften Argumente machen 13,5 % aus. An dieser Stelle wird an die Schlussfolgerung von Ehrich/Rapp (2000: 299–300) angeknüpft, dass das Nominallinking dem Verballinking, welches den activity-Teil einer lexikalisch-semantischen Struktur bevorzugt, diametral entgegengesetzt ist. Die Gruppe der in dieser Arbeit als Eventualitäten bezeichneten Substantive, zu der auch die ung-Nominalisierungen9 gehören, zeigen eine eindeutige Präferenz für das Proto-Patiens. Wenn alle analysierten Bezugssubstantive berücksichtigt werden, dann gilt für diese Arbeit, dass die Makrorolle Proto-Goal mit 57,3% am stärksten präferiert wird; nach ihr kommt das Proto-Patiens mit 29,2%.

8 Insgesamt ergeben die Prozentzahlen 112,8%, weil die thematischen Argumente Effektiv und Agens in Paaren mit einem anderen Argument auftreten und daraufhin doppelt gezählt werden. Sie machen zusammen 12,8% aller Belege aus. Bei ihrem Abzug von 112,8% kommt man auf 100%. 9 Die Untersuchung von Ehrich/Rapp (2000) behandelt die ung-Nominalisierungen.

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie

93

Durch weitere Untersuchungen sollte überprüft werden, ob diese Fokussierung der 2. UK der Komposita in Fachtexten der technischen Chemie auf das Proto-Goal auch für die Komposita in der Allgemeinsprache zutrifft. Erst dann könnte die Frage beantwortet werden, ob das Proto-Goal im Unterschied zu den Nominalphrasen die Domäne der Komposita ist.

5 Lexikografische Bearbeitung von Komposita In diesem Kapitel steht die lexikografische Bearbeitung von motivierten Komposita in Lernerwörterbüchern im Mittelpunkt des Interesses. Da es in erster Linie nicht um einen Vergleich der Darstellungen von Komposita in verschiedenen Wörterbüchern geht, sondern um die Möglichkeiten für deren benutzergerechte und benutzerfreundliche Präsentation in Wörterbüchern, werden Beispiele sowohl aus dem einsprachigen Print-Lernerwörterbücher „Pons Kompaktwörterbuch Deutsch als Fremdsprache“ (2012) als auch aus dem einsprachigen „Pons Online-Wörterbuch Deutsch als Fremdsprache“10, den zweisprachigen Online-Lernerwörterbüchern ELDIT11 und „Pons Online-Wörterbuch“12 angeführt. Außerdem wird auf Möglichkeiten eingegangen, in welchem Umfang und in welcher Form die in den vorangehenden Kapiteln vorgelegten Ergebnisse in Wörterbuchartikel von motivierten Komposita aufgenommen werden können.

5.1 Auflistung von lexikografisch unbearbeiteten Komposita In den einsprachigen deutschen (Lerner-)Wörterbüchern werden am Ende des Wörterbuchartikels eines lemmatisierten Substantivs „motivierte“ („durchsichtige“, „transparente“) Komposita aufgeführt, in denen es als 1. oder 2. UK vorkommt. Die Komposita sind lexikografisch nicht bearbeitet – ohne grammatische Angaben, ohne Bedeutungserklärung etc. Auf die „unmotivierten“ Komposita, die in die Makrostruktur des jeweiligen Wörterbuchs aufgenommen werden, wird nicht eingegangen. Im Beitrag werden die Auflistung „motivierter“ Substantivkomposita und die Gestaltung ihrer Wörterbuchartikel, falls sie lemmatisiert werden, kritisch aus der Sicht des Wörterbuchbenutzers bzw. des Lernerwörterbuch-Benutzers und aus der Sicht des Metalexikografen betrachtet.

10 Pons Online-Wörterbuch DaF [Unter: http://de.pons.com/%C3%BCbersetzung/deutsch-als-fremd sprache; letzter Zugriff: 4.7.2015] 11 ELDIT = Elektronisches Wörterbuch Deutsch-Italienisch. [Unter: http://eldit.eurac.edu/; letzter Zugriff: 4.7.2015] 12 Pons Online-Wörterbuch. [Unter: http://de.pons.com/; letzter Zugriff: 4.7.2015]

94

Milka Enčeva

Zuerst müssen die „motivierten“ und die „unmotivierten“ Komposita auseinandergehalten werden. Als Unterscheidungskriterium zwischen ihnen wird ihre Bedeutungsparaphrase herangezogen. Wenn beide UK eines Kompositums in der Bedeutungsparaphrase vorkommen, werden sie als „motiviert“ behandelt (vgl. van der Colff 1998: 202). U. E. gibt es keine scharfe Grenze zwischen den beiden Gruppen von Komposita; vielmehr handelt es sich um allmähliche Übergänge zwischen zwei Polen: zwischen den „motivierten“ und den „unmotivierten“ Komposita (vgl. Fleischer/Barz 1995:18). Theoretisch ist dieses Unterscheidungskriterium anfechtbar; im Beitrag wird es aber nur als eine praktische Lösung eingesetzt. Die Aufnahme von lexikografisch unbearbeiteten Komposita in die Wörterbuchartikel von lemmatisierten Substantiven wird als Dokumentation von Wortbildungsprodukten konzipiert, weil bei der Textproduktion besonders die Benutzer, deren Muttersprache nicht Deutsch ist, Wörter bilden, „[…] die vom System her möglich, aber unüblich sind. Für diesen Benutzer wäre es hilfreich, wenn er im Wörterbuch sehen kann, daß es das Wort ,gibt‘ “ (Bergenholtz 1989: 774). Im Deutschen ist bei der Erstellung von Wörterbüchern die Lemmaselektion problematisch, weil der Bildung von Komposita theoretisch keine Grenzen gesetzt sind. Dies ist in einem Lernerwörterbuch noch schwieriger, denn es muss dem fremdsprachigen Benutzer die nötigen Informationen bieten, um Problemlösungen bei der Textrezeption und -produktion und bei der sprachlichen Kompetenzerweiterung zu finden. Wird man aber durch die Aufnahme von lexikografisch unbearbeiteten Komposita am Ende von Wörterbuchartikeln den gerade erwähnten drei Funktionen von Lernerwörterbüchern gerecht? Die Auflistung von lexikografisch unbearbeiteten Komposita dient nicht der Textrezeption, weil es keine Bedeutungserklärungen gibt und die Fremdsprachler bei der Erschließung der Bedeutung von motivierten Komposita mehr Probleme haben als Muttersprachler. Benutzern, deren Muttersprache nicht Deutsch ist, mangelt es sowohl an sprachlichem als auch an außersprachlichem Wissen; und – um mit Adri van der Collf zu sprechen –: ihre „Durchsichtigkeitsschwelle“ muss tiefer angesetzt werden (Collf 1998: 200). Für die Textproduktion sind die aufgelisteten Komposita auch nicht geeignet, weil es keine Angaben im Bereich der Morphologie und der Syntax gibt. Die Bildung von Komposita in Analogie zu den bereits angeführten ist für fremdsprachliche Benutzer mit Schwierigkeiten verbunden, die nicht unterschätzt werden dürfen; sie kann nicht unbedingt als sprachliche Kompetenzerweiterung aufgefasst werden. Der Benutzer wird überschätzt, indem von ihm erwartet wird, anhand der aufgelisteten Komposita Schlussfolgerungen über morphologische und semantische Besonderheiten der UK und zwischen den UK ziehen zu können und sie bei der Bildung von neuen Komposita zu berücksichtigen. Da liegt die Vermutung nahe, dass die Auflistung von lexikografisch unbearbeiteten Komposita als Sublemmata in den Wörterbuchartikeln von lemmatisierten Substantiven aus kommerziellen Gründen gemacht werden könnte. Solche Komposita werden zu den Stichwörtern gezählt. Dadurch wird die Zahl der Stichwörter wesentlich erhöht; und bei Wortschatztests werden weniger Lemmalücken festgestellt. An 

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie

95

gestrebt wird ein möglichst großer Umfang des Lemmabestandes, weil dies als wichtiges Gütekriterium bei der Bewertung von Wörterbüchern bzw. von Lernerwörterbüchern angesehen wird (vgl. Wiegand 1983: 432). Im einsprachigen Print-Lernerwörterbuch „Pons Kompaktwörterbuch Deutsch als Fremdsprache“ (2012) werden am Ende der Wörterbuchartikel lemmatisierter Substantive nach einer Kompositionsidentifizierungsangabe lexikografisch unbearbeitete Komposita aufgelistet. In den „Hinweisen für den Benutzer“ wird erklärt, dass Komposita ohne eigene Definition beim Stichwort aufgeführt werden, weil es unmöglich ist, alle Komposita aufzunehmen und für sie eine Bedeutungserklärung anzubieten (vgl. Pons Kompaktwörterbuch Deutsch als Fremdsprache 2012: 11). Im einsprachigen „Pons Online-Wörterbuch Deutsch als Fremdsprache“ werden auch lexikografisch unbearbeitete Komposita als Sublemmata aufgelistet. Es wird nicht erklärt, nach welchem Kriterium bestimmte motivierte Komposita nur als Sublemmata ohne Angaben, aber andere motivierte Komposita mit demselben Kompositionsglied als Lemmata in der Makrostruktur zu finden sind.

Abb. 1: aus: „Pons Online-Wörterbuch Deutsch als Fremdsprache“13.

Im Wörterbucheintrag eines lemmatisierten Kompositums werden Angaben zum Genus, Numerus, zur Flexion, und eine Bedeutungsdefinition aufgeführt. Nach einer Kompositionsidentifizierungsangabe werden weitere lexikografisch unbearbeitete Komposita angegeben, die das lemmatisierte Kompositum als UK enthalten. Außerdem gibt es in jedem Wörterbuchartikel Angaben zu Links zu weiteren Informationen14. Daraus ist ersichtlich, dass jedes Lemma mit den repräsentativsten Online-

13 [Unter: http://de.pons.com/%C3%BCbersetzung/deutsch-als-fremdsprache/Schuh; letzter Zugriff: 20.7. 2015] 14 Lexika/Enzyklopädien – Wikipedia, Definitionen/Erklärungen – PONS Deutsch als Fremdsprache, Korpora/Belegsammlungen – Owid, Rechtschreibung – PONS Deutsche Rechtschreibung, Bildwörterbücher – Bildwörterbuch, Synonyme/Antonyme – Open Thesaurus, Redewendungen/Sprichwörter – Redensarten-Index, Phraseo, Wortschatz/Thesaurus – eyePlorer, DWDS, Berlin-Brandenburgische Akad. d. Wissenschaften, Deutscher Wortschatz (Uni Leipzig), Konjugation/Deklination – Cactus 2000, Canoo (ebda.).

96

Milka Enčeva

Wörterbüchern und Nachschlagewerken für die deutsche Sprache verlinkt ist. So kann auch ein nicht gut informierter Benutzer zu wichtigen Informationsquellen Zugang finden. Das Problem liegt darin, dass es bei Pons um ein Online-Lernerwörterbuch geht und die Benutzer nicht über die erforderlichen Sprachkenntnisse verfügen, um von den Daten Gebrauch zu machen. Im zweisprachigen Pons Online-Portal, das über Wörterbücher für 19 Sprachenpaare verfügt, werden keine Komposita als Sublemmata in den Wörterbuchartikeln aufgelistet: Vielmehr gibt es, wie in „PONS Deutsch als Fremdsprache“, eine Angabe, die zu den gleichen Links verweist. Anfänger ziehen beim Sprachenlernen zweisprachige Wörterbücher vor, sodass wieder – wie bei dem einsprachigen Wörterbuch – das Problem entsteht, dass die Informationsquellen wegen unzureichenden Sprachkenntnissen kaum zu verwenden sind. Im zweisprachigen Online-Wörterbuch ELDIT ist die ganze Mikrostruktur anders gestaltet als in allen PONS-Wörterbüchern, weshalb es hier kurz vorgestellt wird. Die Mikrostruktur ist modular aufgebaut, sodass bestimmte Angaben über ein eigenes Modul verfügen, das nur bei Bedarf abgerufen wird. Alle Angaben im Bereich Wortbildung werden in einem selbstständigen Modul präsentiert. Beim Lemma Schuh werden neben einem Derivat auch 22 Substantivkomposita15 aufgeführt. Sie werden nur mit der Genusangabe und dem entsprechenden Äquivalent im Italienischen versehen. Alle Komposita, die im Modul Wortbildung zu finden sind, werden über ein Fenster mit der anderen lemmatisierten UK verlinkt. Die Komposita erscheinen im Fenster mit den gleichen Angaben wie in den Modulen der beiden UK. Einige der Komposita treten auch in der Mikrostruktur mit einem eigenen Wörterbucheintrag auf, der auch über ein Fenster abrufbar ist. Im Wörterbucheintrag verfügen sie über alle Angaben wie die anderen Lemmata im Wörterbuch. Es gibt wie in „PONS Deutsch als Fremdsprache“ keine Erläuterung, in der bestimmt wird, welche Komposita lemmatisiert werden. Alle angeführten Beispiele zeigen, dass die Auflistung von Komposita eine gängige Praxis in der deutschsprachigen Lexikografie ist. Desto verwunderlicher ist es, dass keine Kriterien herausgearbeitet wurden, nach denen Komposita in die Makrostruktur aufgenommen werden können – oder anders ausgedrückt: welche Komposita nur am Ende von Wörterbuchartikeln der jeweiligen UK angegeben werden sollten. U. E. ist die modulare Gestaltung der Mikrostruktur in Online-Wörterbüchern besonders für die Auflistung von Komposita geeignet. Durch die Module werden die Wörterbucheinträge wesentlich entlastet, haben eine übersichtlichere Struktur, und ermöglichen gleichzeitig die Aufnahme weiterer wichtiger Informationen. So können im Modul „Wortbildung“ die Komposita aufgelistet werden, wobei die Angaben zur Pluralbildung und Flexion ergänzt werden sollten. Wenn es sich um ein zweisprachiges Wörterbuch handelt, übernimmt die Übersetzung in die Zielsprache die Funktion  

15 [Unter:http://eldit.eurac.edu/dicturl?from=Normal&todo=search&toCreate=simple&filename= Frames.html&lang=de&quSt=Schuh&woco=PHRASE&stemm=no&spell=no; letzter Zugriff: 20.7. 2015]

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie

97

der Bedeutungserklärung; wenn es um ein einsprachiges Wörterbuch geht, sollte eine Bedeutungserklärung hinzugefügt werden. Die Benutzer erhalten einen Überblick über mögliche Zusammensetzungen und die Wortbildungsproduktivität des lemmatisierten Substantivs. Da es um Online-Wörterbücher geht, braucht man keinen Platz zu sparen, und man kann viele Komposita auflisten. Weitere Informationen, die für den korrekten Gebrauch der Komposita wichtig sind, könnten in einem Fenster, das vom Modul abrufbar ist, aufgeführt werden. Welche und wie viele Komposita sollte man auflisten? Welche Angaben braucht man noch? Werden sie für alle Komposita aufgeführt? Dies sind Fragen, die sich aufdrängen, deren Behandlung aber den Rahmen dieses Beitrags sprengen würden. Im Folgenden wird nur noch ein Vorschlag gemacht, wie in einem Wörterbuchartikel Gebrauch von den Ergebnissen aus Kapitel 4 gemacht werden kann.

5.2 Angaben zur Valenz lemmatisierter Substantive Im 4. Kapitel wurden die Ergebnisse einer empirischen Untersuchung über die wortinterne Argumentrealisierung von valenten Substantiven präsentiert, denen zufolge bei der Substantivvalenz eine der Argumentstellen präferiert wird. Außerdem wurde gezeigt, dass sich die einzelnen Gruppen valenter Substantive auch auf bestimmte Argumente „fokussieren“. Bei der lexikografischen Bearbeitung von Komposita können diese Ergebnisse berücksichtigt werden. Es geht nicht darum, möglichst viele Komposita aufzuführen, sondern nur solche, die diese präferierte Argumentstellen veranschaulichen. Da die „Linguistisierung“ eines (Lerner-)Wörterbuchs vermieden werden muss, ist es nicht so einfach, nur mit passenden Beispielen und einer geeigneten Gruppierung der Komposita diese Präferenzen zu veranschaulichen. Eine mögliche Lösung wäre, Komposita zu einem lemmatisierten Substantiv nach den realisierten Argumentstellen in Gruppen einzuteilen und die Beziehung des Arguments zum Bezugssubstantiv durch eine kurze und einfache Paraphrase zu erklären – zum Lemma Schuh zum Beispiel: der Damenschuh, -e – ‘speziell für Damen bestimmte Schuhe’ ‘Etwas (Schuhe) ist für eine Gruppe von Personen bestimmt’ oder der Wanderschuh, -e – ‘Schuhe zum Wandern’: ‘Etwas (Schuhe) ist für die Ausführung einer Tätigkeit (Wandern) bestimmt’ u. v. a. m.  





Alle weiteren Komposita mit der gleichen semantischen Beziehung zwischen den UK – wie z. B. Herrenschuh, Kinderschuh, Bergschuh, Rollschuh, Sportschuh, Turnschuh – können in einem Fenster gezeigt werden, das mit dem Lemma Schuh bzw. Damenschuh verlinkt ist. Auf diese Weise wird das Modul „Wortbildung“ entlastet  

98

Milka Enčeva

und dient als Ausgangspunkt für die Auflistung der Komposita. In Anlehnung an van der Colff (1998) können die im Fenster aufgelisteten Komposita als „begrenzt lexikografisch bearbeitet“ betrachtet werden; denn es werden nicht – wie in einem Wörterbucheintrag für ein Lemma – alle Angaben gemacht, sondern es wird an einem Beispiel (wie Damenschuh) die Bedeutungserklärung veranschaulicht; im Fenster erscheinen die weiteren Komposita mit der Genus-, Plural- und Flexionsangabe. Wenn Schuh als 1. UK von Komposita aufgeführt wird, ist es nicht mehr das Bezugssubstantiv, sondern die Realisierung einer Argumentstelle. Es kommt aber reihenhaft in Komposita vor, die die gleiche semantische Beziehung zwischen den UK haben; und es ist sinnvoll auch sie aufzulisten. Bei Schuh als 1. UK gibt es zwei semantische Beziehungen, die präferiert werden. Relationsdenotierende Substantive weisen häufig eine finale oder possessive semantische Beziehung auf: Schuhbürste – ‘Bürste zum Reinigen der Schuhe’: ‘Etwas (Bürste) ist zu einer Handlung für etwas Anderes (Schuhe) bestimmt’ u. v. a. m. Im Fenster können Komposita wie Schuhcreme, Schuhgeschäft, Schuhputzmittel, Schuhschrank erscheinen.  





Die zweite semantische Beziehung kann sehr vereinfacht so erklärt werden: Schuhsohle – ‘die Sohle eines Schuhs’ bzw. ‘Das Ganze (Schuh) und ein Teil davon (Sohle)’ u. v. a. m. Weitere Komposita, die im Fenster aufgeführt werden können, sind z. B.: Schuhabsatz, Schuhband. Bevor die Gruppierung der Komposita vorgenommen wird, muss bestimmt werden, welche und wie viele Komposita ins Modul „Wortbildung“ einschließlich der Fenster aufgenommen werden. Im Modul werden Beispiele mit Bedeutungserklärungen für die einzelnen semantischen Beziehungen zwischen den UK präsentiert. Erst beim Öffnen der Fenster sieht man die aufgezählten Komposita mit den entsprechenden grammatischen Angaben. Auf diese Weise verliert der Benutzer den Überblick über das Modul „Wortbildung“ nicht. Wer bestimmte Komposita finden will, kann dann die Fenster öffnen und sich informieren.  







6 Fazit Bei der Untersuchung der wortinternen Argumentrealisierungen von Bezugssubstantiven wurde festgestellt, dass es bei den valenten Substantiven nicht um die Realisierung aller Argumentstellen geht, sondern darum, welche Argumentstelle präferiert wird. Es hat sich herausgestellt, dass die in drei Gruppen – nach der Art der ihnen zugrundeliegenden semantischen Prädikate eingeteilten valenten Substantive – ihre spezifischen Präferenzen haben. Für alle in dieser Arbeit untersuchten valenten Substantive im Bereich der technischen Chemie, die als 2. UK in Komposita vorkommen,

Über die Applikationsmöglichkeiten der Substantivvalenzforschung in der Lexikographie

99

gilt, dass die am stärksten präferierten Argumentstellen durch die semantischen Rollen, die zur Makrorolle Proto-Goal gehören, besetzt werden. Dieses Ergebnis sollte auch mit empirischen Daten aus der Allgemeinsprache und aus anderen Fachbereichen überprüft werden. Die Auseinandersetzung mit der gängigen Praxis, lange Listen mit lexikografisch unbearbeiteten Komposita in die Wörterbuchartikel ihrer lemmatisierten UK aufzunehmen, hat gezeigt, dass die Auflistungen weder in Situationen der Textrezeption noch der Textproduktion und der Kompetenzerweiterung von Nutzen sein können. Im Beitrag wird die Ansicht vertreten, dass eine modulare Gestaltung der Mikrostruktur sowohl in einsprachigen als auch in zweisprachigen Online-Lernerwörterbüchern viel zu einer angemesseneren lexikografischen Darstellung von Komposita in den Wörterbuchartikeln ihrer UK beitragen kann. In einem Modul für die Wortbildungsprodukte der lemmatisierten Substantive kann am Beispiel einzelner Komposita eine präferierte Argumentstelle mit einer einfachen und allgemein formulierten Paraphrase erklärt werden. Die Aufnahme deutscher Komposita in Wörterbücher und deren lexikografische Bearbeitung in den Wörterbucheinträgen sind zwar keine neuen, aber jedenfalls schwer zu bewältigende, Probleme, die eine Herausforderung für die Lexikografen bleiben.

7 Literatur 7.1 Wörterbücher ELDIT = Elektronisches Lernerwörterbuch Deutsch-Italienisch. [Unter: http://eldit.eurac.edu/; letzter Zugriff: 20.7.2015]. Pons Kompaktwörterbuch Deutsch als Fremdsprache = Wolski, Werner (2012): Pons Kompaktwörterbuch Deutsch als Fremdsprache. Stuttgart: Pons GmbH. Pons Online-Wörterbuch. [Unter: http://de.pons.com/; letzter Zugriff: 20.7.2015] Pons Online-Wörterbuch Deutsch als Fremdsprache. [Unter: http://de.pons.com/%C3%BCbersetzung/deutsch-als-fremdsprache; letzter Zugriff: 20.7.2015].

7.2 Monografien und Aufsätze Agel, Vilmos (2000): Valenztheorie. Tübingen: Narr. Bergenholtz, Henning (1984): Grammatik im Wörterbuch: Syntax. In: Wiegand, Herbert Ernst (Hrsg.): Studien zur neuhochdeutschen Lexikographie V. Hildesheim. New York: Olms, 1–46. Bergenholtz, Henning (1989): Probleme der Selektion im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz Josef et al. (Hrsg.): Wörterbücher, Dictionaries, Dictionnaires. Ein internationales Handbuch zur Lexikographie. 1. Teilband. Berlin. New York: de Gruyter, 772–779. Collf, Adri van der (1998): Die Komposita in Langenscheidts Großwörterbuch Deutsch als Fremdsprache. In: Wiegand, Herbert Ernst (Hrsg.): Perspektiven der pädagogischen Lexikographie des

100

Milka Enčeva

Deutschen. Untersuchungen anhand von "Langenscheidts Großwörterbuch Deutsch als Fremdsprache“ 193–207. Dowty, David (1991): Thematic Proto-Roles and Argument Selection. In: Language, 67, 3, 547–619. Ehrich, Veronika/Rapp, Irene (2000): Sortale Bedeutung und Argumentstruktur: ung- Nominalisierungen im Deutschen. In: Zeitschrift für Sprachwissenschaft 19, 2, 245–303. Eisenberg Peter (1999): Grundriss der deutschen Grammatik. Der Satz. Bd. 2. Stuttgart. Weimer: Metzler. Enčeva, Milka (2013): Formale und semantische Motivationsanalyse der unmittelbaren Konstituenten deutscher Substantivkomposita in Fachtexten der technischen Chemie und ihrer Entsprechungen im Bulgarischen. Dissertation. Sofia: Sofioter Universität. Fleischer, Wolfgang/Barz, Irmhild (1995): Wortbildung der deutschen Gegenwartssprache. Tübingen: Niemeyer. Gansel, Christina (1992): Semantik deutscher Verben aus kognitions-psychologischer Sicht. Frankfurt/Main [usw.]: Peter Lang. Helbig, Gerhard (1992): Probleme der Valenz- und Kasustheorie. Tübingen: Narr. Hölzner, Matthias (2007): Substantivvalenz. Korpusgestützte Untersuchungen zu Argumentrealisierungen deutscher Substantive. Tübingen: Niemeyer. Jacobs, Joachim (1994): Kontra Valenz. Trier: Wissenschaftlicher Verlag. Jacobs, Joachim (2003): Die Problematik der Valenzebenen. In: Agel, Vilmos et al. (Hrsg.): Dependenz und Valenz. Ein internationales Handbuch der zeitgenössischen Forschung. 1. Halbband. Berlin. New York: de Gruyter, 378–399. Lauterbach, Stefan (1993): Genitiv, Komposition und Präpositionalattribut: Zum System nominaler Relationen im Deutschen. München: Iudicium. von Polenz, Peter (1988): Deutsche Satzsemantik: Grundbegriffe des Zwischen-den-Zeilen-Lesens. 2. durchges. Auflage. Berlin. New York: Walter de Gruyter. Primus, Beatrice (1999): Cases and Thematic Roles – Ergative, Accusative and Active. Tübingen: Niemeyer. Reinhard, Sabine (2001): Deverbale Komposita an der Morphologie-Syntax-Semantik- Schnittstelle: Ein HPSG-Ansatz. Dissertation. Tübingen. [Unter: https://publikationen.unituebingen.de/xmlui/ handle/10900/46172; letzter Zugriff 1.6.2015] Sandberg, Bengt (1979): Zur Repräsentation, Besetzung und Funktion einiger zentraler Leerstellen bei Substantiven. Göteborg: Acta Universitatis. Schierholz, Stefan J. (1996): Grammatische Informationen zu Substantiven in einsprachigen deutschen Wörterbüchern. In: Wiegand, Herbert Ernst (Hrsg.): Wörterbücher in der Diskussion II. Tübingen: Niemeyer, 140–203. Schierholz, Stefan J. (2001): Präpositionalattribute. Tübingen: Niemeyer. Teubert, Wolfgang (1979): Substantivvalenz: Attributive Ergänzungen und Angaben. Düsseldorf: Pädagogischer Verlag Schwann. Vendler, Zeno (1957): Verbs and times. In: Philosophical Review 66, 2, 143–160. Wiegand, Herbert Ernst (1983): Was ist eigentlich ein Lemma? Ein Beitrag zur Theorie der lexikographischen Sprachbeschreibung. In: Wiegand, Herbert Ernst (Hrsg.): Studien zur neuhochdeutschen Lexikographie III. Hildesheim: Olms, 401–474. Wiegand, Herbert Ernst (1996): Über primäre, von Substantiven „regierten“ Präpositionen in Präpositionalattributkonstruktionen. In: Harras, Gisela/Bierwisch, Manfred (Hrsg.): Wenn die Semantik arbeitet: Hans Baumgärtner zum 65. Geburtstag. Tübingen: Niemeyer, 109–147.

Rufus H. Gouws

Increasing the scope of the treatment of specialized language terms in general language dictionaries Abstract: Although terms from specialized fields are primarily treated in specialized dictionaries general language dictionaries also include some terms from some fields. This paper looks at aspects of the treatment of terms in general language dictionaries. Negotiating the lexicographic needs of informed laypersons who typically consult general language dictionaries, suggestions are made for an innovative way to allow a more comprehensive treatment of a restricted number of specialized terms in general language dictionaries. Keywords: article structure, collective dictionary culture, comprehensive dictionary culture, comprehensive lexicographic theory, individual dictionary culture, informed layperson, language for general purposes, language for special purposes, specialised dictionaries Schlagwörter: Artikelstruktur, kollektive Wörterbuchkultur, umfassende Wörterbuchkultur, umfassende lexikographische Theorie, individuelle Wörterbuchkultur, informierter Laie, allgemeinsprachliche Lexikographie, Fachlexikographie, Fachwörterbücher

1 Introduction When looking at the broad field of lexicography different types of lexicographic reference works have been identified and described in detail. Wiegand (1988: 848) already presented a typology of reference works, classifying these works in terms of their genuine purpose as language dictionaries (Sprachwörterbucher), encyclopedic dictionaries (Sachwörterbücher) and comprehensive dictionaries (Allbücher). Within each one of these categories Wiegand (1988: 860) makes provision for specialized dictionaries that are directed at specific subject fields. He distinguishes between specialized language dictionaries, specialized encyclopedic dictionaries and specialized comprehensive dictionaries. Albeit that these different types of specialized dictionaries are the most typical venues for the accommodation of terms from different

Rufus H. Gouws: University of Stellenbosch, South Africa, email: [email protected]

102

Rufus H. Gouws

subject fields they are not the only ones displaying an inclusion and treatment of specialized terms from certain subject fields. Terms from a variety of subject fields are often also presented and treated in general language dictionaries. The metalexicographic discussion of the treatment of terms has rightfully focused on specialized dictionaries and not on general language dictionaries. The inclusion and treatment of specialized terms in general language dictionaries will be the focus of this paper. Before embarking on this topic it is important to comment on the status of lexicography as a practice-oriented scientific discipline and some aspects of its relation to linguistics, because this could have an influence on the subsequent discussions of the treatment of specialized terms.

2 Linguistics and lexicography and linguistics in lexicography Could and should the treatment of terms also be done in a general language dictionary – and if so, should the data presented in this treatment be similar to that found in the default articles of the specific dictionary? This question compels one to reassess the scope and assignment of general language dictionaries compared to that of specialized dictionaries – also with regard to the nature and extent of linguistic and non-linguistic data being conveyed in the treatment prevailing in a given dictionary. This does not only, yet again, raise the question regarding the role of linguistic data in dictionaries and therefore also the role of linguistics in lexicography but it also demands a clear understanding of the relation between linguistics and lexicography. Linguistics played an important role in the development of both practical and theoretical lexicography – a role which still has to be regarded as significant for present-day lexicography, especially with regard to general language dictionaries. Within the lexicographic practice dictionaries have been and still are typically regarded as sources for the retrieval of especially linguistic data. This demands a sound knowledge of linguistics when planning and compiling a general language dictionary. According to Gouws (2005) the emergence of theoretical lexicography occurred within a linguistic fold. The groundbreaking publication by Zgusta (1971) had its main focus on the linguistic contents of general language dictionaries. Subsequent research resulted in numerous publications dealing with various aspects of the linguistic data in dictionaries. Zgusta was keenly aware of the typological spectrum of dictionaries and the different approaches followed and different types of data presented in these different dictionaries. He also gave a detailed discussion of different typological classes and acknowledged the distinction between general language dictionaries and those compiled for the treatment of specialized terms. In the further development of theoretical lexicography new focal areas came to the fore, e.g. the shift in emphasis towards dictionary structures. In this regard the

Increasing the scope of the treatment of specialized language terms

103

German lexicographer Herbert Ernst Wiegand excelled as the most prolific researcher. His voluminous portfolio includes publications dealing with a wide range of dictionary structures that present the significance of dictionaries as containers of knowledge, cf. McArthur (1986). Seminal publications introducing his approach have been Wiegand (1988a; 1989a; 1989b; 1989c;1991; 1996; 1996a) and Hausmann and Wiegand (1989). His research in the field of dictionary structures continued and resulted in numerous further publications, e.g. his contributions in Gouws, et al. (2013). A further phase in the development of theoretical lexicography focused on dictionary functions with the Danish lexicographers Bergenholtz and Tarp leading this approach to lexicography, cf. Tarp (2000), Bergenholtz/Tarp (2002; 2003). The contribution of each one of the different phases still plays an equally important role in modern-day lexicography. The phases represent different focal points and the one phase does not eschew the continued importance and validity of the preceding phase. In this regard Rundell (2012: 85) according to my point of view interprets it wrongly when saying: “they [i.e. the followers of the Function Theory- RHG] trace the history of theoretical lexicography, and see its third (and by implication, culminating) stage as one guided by ‘Bergenholtz and Tarp’s functional approach, […].”

During the first of these phases lexicography could rightfully have been regarded as a subdiscipline of linguistics. It had its theoretical basis in linguistics and the majority of discussions focused on aspects of the linguistic data included in dictionary articles. The second and third phases still acknowledged the importance of items giving linguistic data but the scope of the theoretical discussions went beyond that focus. By introducing dictionary structures and the consequent packaging, presentation and linking of items giving the data it became evident that such an approach no longer qualifies lexicography as a subdiscipline of linguistics. This was strengthened by the focus on lexicographic functions and the central position of the user in a specific situation of usage, and it elevated lexicography to a discipline in its own right which no longer represents a subdiscipline of linguistics but rather a practice-oriented scientific discipline. Wiegand (2013: 20) rightly says: „Betrachtet man die Gesamtheit der lexikographischen Praxis in ihrer wissenschaftlichen Ausprägung, kann mit guten Gründen von einer praxisorientierten wissenschaftlichen Disziplin gesprochen werden.“

Albeit that some lexicographers today still see lexicography as a part of linguistics and eschew the reality of lexicography as a practice-oriented scientific discipline, many other lexicographers with different theoretical approaches do not regard lexicography as a subdiscipline of linguistics but rather as an independent discipline, although they also recognize that linguistics plays a significant role in some dictionary types, but this does not imply that the planning of these dictionaries is done in adherence to linguistic theory or that the lexicographic presentation in the dictionary should be dominated by

104

Rufus H. Gouws

linguistic data. Linguistic theory, linguistic knowledge and linguistic data make important contributions to lexicography, both on a theoretical and a practical level. This should always be acknowledged, but this contribution is not superior to the nonlinguistic component of the overall lexicographic process. Important is the fact that dictionaries are practical tools that should respond to the needs of their envisaged target users. If these needs are of a linguistic nature, as often is the case, there will be a stronger influence from linguistics, but the needs, even when consulting general language dictionaries, could be of a less or even non-linguistic nature. Then the dictionary typology should not be the only determining factor with regard to the inclusion of lemmata or the treatment allocated to them. The practice-oriented discipline demands a treatment that satisfies the needs of the intended target users.

3 Insufficient research in the field of specialized lexicography In lexicographic discussions, when justifying the claim regarding the status of lexicography as an independent discipline, reference is often made to specialized dictionaries. This is done to show that, contrary to general language dictionaries, some forms of lexicography prevail without the co-occurrence or dominance of linguistics. Factually such a statement might be correct but even in specialized language dictionaries the user can retrieve some linguistic information from the data on offer, e.g. the meaning of the term, grammatical information or etymology. Specialized dictionaries are used, or perhaps even misused, by some metalexicographers primarily to substantiate their claim for a minimal involvement of linguistics in lexicography. Besides using them for these claims they unfortunately devote too little research to specialized dictionaries as a fully-fledged broad typological category. In spite of frequent reference to specialized dictionaries they too seldom are the targets of lexicographic investigation and thorough research. For the majority of dictionary users general language dictionaries represent the default or even prototypical dictionary. Consequently and predictably this results in general language dictionaries being the primary target of metalexicographic research and discussions. Unfortunately it has also resulted in a lack of attention to specialized dictionaries – which might also be predictable if one takes into consideration that Kilgarriff (2012: 27) equates the comparison of general language dictionaries and specialized dictionaries to international airports and local airstrips. Insufficient research attention to specialized lexicography unfortunately impedes the development of a comprehensive lexicographic theory that includes a focus on both general language and specialized dictionaries. As a result the development of a theoretical base for specialized dictionaries is not as advanced as the development of a theoretical base for general language dictionaries.

Increasing the scope of the treatment of specialized language terms

105

In the field of metalexicographic research there fortunately are some noticeable exceptions where the emphasis is on specialized lexicography, e.g. Wiegand (1988; 2003; 2004; 2004a), Bergenholtz/Tarp/Wiegand (1999), Fuertes-Olivera (2010) and Jesenšek (2013). Specialized lexicography has also found a well-deserved albeit limited coverage in the comprehensive “An International Encyclopedia of Lexicography” (Gouws et al. 2013), e.g. Schierholz (2013). The insufficient research in the field of specialized lexicography was identified at an early stage of the development of general language lexicographic theory when Wiegand (1988:861) already mentioned that there are relatively few theoreticallyoriented investigations in the field of specialized lexicography. Unfortunately this situation has not changed a lot. Decades later Schierholz (2013: 432) still says with regard to specialized dictionaries of linguistics (but it also applies to other specialized dictionaries): “It is strange that dictionary research concerning lexicography for special purposes of linguistics is so scarcely represented.”

Wiegand (1988: 831–832) argues that most researchers fly over the jungle territory of specialized lexicography in a helicopter and only make some recordings from the air. A few have made an emergency landing because they have to study specialized dictionaries for some other reason, mostly lexicological provenance. Almost nobody has left the helicopter to embark on a lengthy expedition with the purpose of studying the jungle, and nobody has attempted to use a metalexicographic panga to cut through the woods to enable a theoretically motivated first or deeper insight into this unexplored territory. According to Bergenholtz/Tarp/Wiegand (1999: 1762) it has only been since the late eighties that specialized lexicography became a research field within the broader field of dictionary research that goes beyond mere problems of specific specialized dictionaries, venturing into metalexicographic research regarding the new domain of subject field lexicography and the formulation of lexicographic theory. The results of this research and the implementation in the lexicographic practice have not reached an optimal level. The interaction between general and specialized lexicography does not come to the fore in a strongly enough way. A natural feature of the work done in the field of specialized lexicography has been its restricted focus on specialized dictionaries – and not the occurrence and treatment of specialized terms in general language dictionaries. Wiegand (1988: 874) rightly says that specialized lexicography is that part of lexicography that is directed at the production of specialized dictionaries in order to enable the cultural practice of using specialized dictionaries. According to Wiegand (1988: 861) a specialized language dictionary is a specialized dictionary with the genuine purpose of giving a potential dictionary user the opportunity to retrieve lexicographic information regarding specialized language objects. However, attempts to retrieve lexicographic information

106

Rufus H. Gouws

regarding specialized language objects are not restricted to the consultation of specialized dictionaries. Dictionary users often resort to general language dictionaries for this type of assistance. In discussions regarding specialized lexicography little or no attention has been given to these lexicographic needs of dictionary users who consult general language dictionaries in an attempt to retrieve information regarding some terms from specialized fields.

4 The context of specialized dictionaries within a typological spectrum A discussion of any type of dictionary should be contextualized within the domain of the broader field of lexicography and the typological spectrum of dictionaries. Looking at specialized dictionaries Marzá (2009) comments as follows: “The specialized lexicographical approach involves dictionary-making from a natural communicative perspective; […] it adopts an active user-friendly and user-focused perspective in specialized dictionary-making; … it implies thinking about the ‘how’, ‘what for’, and ‘for whom’ we make specialized dictionaries.”

When planning, compiling and evaluating the lexicographic representation and treatment of specialized lexical items lexicographers should not only think about “how”, “what for”, and “for whom” they make specialized dictionaries but also “how”, “what for”, and “for whom” they present and treat terms from specialized fields, irrespective of whether they are included and treated in a specialized dictionary or any other type of dictionary. Specialized dictionaries accommodate items from specialized languages and lexicographers need to be able to give a clear indication of what qualifies as a specialized language. Marzá (2009: 21) quotes from an IULA document of the University of Pompeu Fabra and says: “[…] The discourse of physics, chemistry biology, geology […] would be more prototypical of ‘the specialized’ than those of banking, the stock exchange, trade or finance, and those of hairdressing […], sports […] would be even more peripheral.”

Marzá (2009: 36) maintains that this does not imply that a language such as that of chemistry or physics is more specialized than the language of cooking or games: “It is more accurate, however, to talk about tendencies and state that a chemistry text, because of its subject matter, is more likely to be specialized than one about cooking, but the topic is not an indispensable condition or a decisive one. […] any object from common reality can be dealt with as specialized knowledge if objectively and accurately dealt with.”

Increasing the scope of the treatment of specialized language terms

107

When talking about terms from any specialized field one has to realize that you are dealing with specialized knowledge and it should be dealt with objectively and accurately, no matter what dictionary is used as a venue to accommodate these terms. This is part of the “how” but one should also look at the “what for” and the “for whom” of the presentation and treatment of specialized terms. When looking at the lexicographic treatment of items from specialized fields lexicographers respond to the needs of users but also to the typical dictionary consultation endeavors of these users. This has implications for the venue and the nature and extent of the presentation and treatment of the specific items and emphasizes the relevance of the question whether specialized language should exclusively be treated in specialized dictionaries? The context of specialized dictionaries within the typological spectrum is determined by their genuine purpose, i.e. to accommodate and treat items from a given specialized field or specialized fields for different user groups with different needs and reference skills in different situations of use. This presupposes the need for different specialized dictionaries for any given field. However, the context of specialized dictionaries should also negotiate the broader context of the overall lexicographic venue of specialized terms that also allows the inclusion and treatment of these terms in some other dictionaries, i.e. general language dictionaries. It is a well attested fact that there is an intersection between language for general purposes (LGP) and languages for special purposes (LSP), cf. Bergenholtz/Tarp (1995). With regard to the lexicographic inclusion of special field terms there also is an intersection of the needs of users of general language dictionaries and users of specialized dictionaries, and thus also an intersection between general language dictionaries and specialized dictionaries. When discussing the lexicographic approach to specialized terms these different intersections need to be taken into account in order to determine the type of user bound to consult a specific dictionary and the expectations such a user has from that dictionary with regard to the inclusion and treatment of specialized terms, but it also has to take into account the needs and expectations of a user consulting a general language dictionary to retrieve information regarding specialized terms. A proper evaluation of the lexicographic approach to terms from specialized fields demands a clear indication of different users and their respective needs, the traditional distinction between different users of specialized dictionaries, i.e. experts, semi-experts and laypersons, still apply. However, lexicographers should determine whether this distinction is exhaustive enough.

5 Towards a comprehensive dictionary culture A general theory of lexicography that aims to cover the field in a comprehensive way should provide for a description of lexicographic activities in all types of dictionaries,

108

Rufus H. Gouws

including specialized dictionaries. The lexicographic practice needs to have a theoretical basis which implies that all dictionaries, including specialized dictionaries, should be seen as products resulting from a scientific process, albeit that they are used as practical instruments. Wiegand (1988; 1989) already indicated that lexicography is a scientific practice. Dictionaries need to be compiled according to a welldesigned model which reflects the underlying theoretical approach. This, yet again, also applies to specialized dictionaries. Although present-day metalexicographers recognize that the scope of dictionary research has to include specialized dictionaries this acknowledgement has not yet been sufficiently translated into a broader dictionary culture. The notion of a dictionary culture is still dominated by a strong LGP-bias. Discussions regarding the existence or non-existence of a dictionary culture in a given speech community typically refer to a culture regarding general language dictionaries. Reference to specialized dictionaries is very seldom introduced into such a discussion. The notion of a dictionary culture came to the fore in Hausmann (1989) when distinguishing between user-friendliness in lexicography and a dictionary culture. According to Hausmann (1989: 13) user-friendliness implies that lexicography should adapt to society by making dictionaries available that respond to the needs and reference skills of a clearly identified target user group. A dictionary culture results when a specific society adapts to lexicography by acquiring dictionary using skills and becoming familiar with e.g. dictionary typology, the contents and functions of different dictionaries, etc. Where a dictionary culture prevails users are familiar with dictionaries as practical tools. They do not only know how to use the tools but also when to use a specific tool. A dictionary culture constitutes an ongoing process with a variety of phases. The prevailing dictionary culture of the envisaged target users should necessarily have an influence on the functions, contents, structures and presentation of any new dictionary. When discussing a dictionary culture, cf. Gouws (2012; 2013), one has to distinguish between the dictionary culture of a given speech community or society (a societal or collective dictionary culture) and that of a given individual (an individual or idiolectal dictionary culture). Within an environment with a prevailing societal dictionary culture an individual dictionary culture can more easily be acquired compared to the situation within a society without a societal dictionary culture. An important aspect of the early phases of a dictionary culture is to make users aware of the fact that dictionaries should not be seen as isolated tools, but that they are part of a bigger family of reference tools. Learning how to use a dictionary should go hand in hand with learning how to use other reference tools – from telephone directories to advanced academic text books. A dictionary culture should not be restricted to general language lexicography. From the early phases of an emerging dictionary culture, users need to be made aware of the fact that there are different types of dictionaries with different functions which yield different types of assistance and with a contents and data distribution from

Increasing the scope of the treatment of specialized language terms

109

which different types of information can be retrieved. Of paramount importance in the development of a dictionary culture is the realization that the selection of data for a given dictionary should be determined by the relevant lexicographic criteria. A more refined dictionary culture that includes a focus on specialized lexicography compels metalexicographers to make provision in their research for a thorough lexicographic approach to the planning of specialized dictionaries. Practical lexicographers compiling specialized dictionaries need to execute the identification of the function(s) of the dictionary and the implications and application of the function(s) for the contents and structure of the envisaged dictionary within the framework of a theoretical approach that follows from the realization of a comprehensive dictionary culture. Such a refined dictionary culture should also make compilers of general language dictionaries aware of the needs of their intended target users to find a limited selection of terms from specialized fields in a general language dictionary.

6 Dictionary users Bergenholtz and Tarp (1995) refer to a continuum of users of specialized dictionaries and distinguish between experts, semi-experts and laypersons. This distinction is made with reference to the knowledge potential dictionary users have of the field treated in a specific specialized dictionary. These categories of users will also be found in an environment where a societal dictionary culture prevails. However, the existence of an established dictionary culture typically expands the lexicographic interests of the members of such a society. People become more interested in dictionaries of all types as sources of reference and become more interested in using the dictionaries at their disposal to retrieve information regarding a wide range of topics and subjects. Having access to reports in the media in which specialized terms are used, laypersons become interested in these fields and some of them are actually elevated on the user continuum to become informed laypersons. These informed laypersons rely on dictionaries for expert guidance regarding terms from certain specialized fields. Experts and semi-experts are people working in or are closely related to a given subject field. Laypersons might be experts in other fields but are not involved in the field for which they qualify as laypersons. Experts and semi-experts would typically have access to reference sources, including dictionaries, which have their specialized field as subject matter. Contrary to this, laypersons typically do not have regular or easy access to specialized dictionaries. General dictionaries function as their primary lexicographic sources – even when they need guidance regarding terms from certain specialized fields. This also applies to informed laypersons who often still rather consult general language dictionaries to find solutions to their restricted specialized field needs. For lexicographers this implies the need for innovative thinking regarding venues for the presentation and treatment of items from specialized fields. When looking at

110

Rufus H. Gouws

their lexicographic treatment and the relevant types of dictionaries all specialized fields should not be evaluated and treated in the same way. As indicated above Marzá (2009: 21 says: “[…] The discourse of physics, chemistry biology, geology […] would be more prototypical of ‘the specialized’ than those of banking, the stock exchange, trade or finance, and those of hairdressing […], sports […] would be even more peripheral.”

This idea could be rephrased by saying that the discourse in some fields will be restricted to people representing the experts and semi-experts whereas other fields that have an own specialized terminology will also be part of discourse that has informed laypersons as participants. These informed laypersons typically consult general language dictionaries even when in need of information from a specialized field.

7 The lexicographic venue of items from specialized fields Items from the LGP are lexicographically accommodated in general language dictionaries whereas items from the LSP’s are typically accommodated in special field language dictionaries. However, the section of the lexicon in which a given lexical item occurs, i.e. the general lexicon or the lexicon of a specialized field, should not be the only criterion to determine its lexicographic venue. The overlap between the LGP and LSP and the use of specialized terms in different communication situations, involving also laypersons, should also be considered when decisions are taken, because numerous terms from a variety of specialized fields are also used in a more general discourse that involves laypeople and not only subject field experts and semiexperts. These fields are usually those where communication situations exist between experts and semi-experts on the one hand and laypersons on the other hand. A typical example of such a communication situation comes from the field of medicine where a medical doctor (= expert) is in conversation with a patient (= layperson). The expert will use terms from the specialized field but the average patient will not have access to specialized medical dictionaries and would rather consult a general language dictionary, being the dictionary for the average member of a speech community. Consequently general dictionaries do include a limited selection of terms from a limited selection of specialized fields. The treatment of these terms, however, follows the same pattern as devised for the lemmata from the general language which constitutes the main subject matter of the dictionary. The inclusion of these terms is important and for their selection and appropriate treatment cooperation between the subject field expert and the lexicographer is desperately needed. In a general monolingual dictionary it remains a challenge to supply the layperson with a good but also scientifically valid paraphrase of meaning of terms from specialized fields. This

Increasing the scope of the treatment of specialized language terms

111

applies to some terms from those specialized fields that are integrated into the everyday life of a society, e.g. economics, computer science, medicine, law and digital technology. In the remainder of this paper the focus will primarily be on economics as an example of a field from which some terms also need to be included and treated in general language dictionaries. The suggestions made are also applicable to the treatment of terms from other fields that find their way into general language dictionaries. Economics can be regarded as one of the fields that attract the interest not only of experts and semi-experts but also of informed laypersons. This is acknowledged even in dictionaries dealing exclusively with items from the field of economics, e.g. in the preface of “The Penguin Dictionary of Economics” (Bannock et al. 1978) where it is stated that this dictionary: “[…] is intended to be of use to the general reader who wants to follow economic discussion in the press or elsewhere and to the increasing number of people who need knowledge of economic terms and concepts in their daily work – town planners, trade unionists, civil servants, teachers, journalists, politicians and businessmen amongst them.”

A question that arises is whether a specialized dictionary of economics is the best source of information for these general readers? This is one of the fields where a comprehensive dictionary culture could make provision for separate LSP dictionaries but also for an integration of specialized terms into general dictionaries. Within a community characterized by a societal dictionary culture lexicographers of general dictionaries need to pay more attention to an improved treatment of the limited selection of special field terms included in a general dictionary. This also applies to the inclusion and treatment of items from the field of economics.

8 Towards a new model 8.1 Back matter texts In both theoretical and practical lexicography attention should be given to the need of users to have rapid access to data and the need for a one stop reference work. When it comes to those specialized fields that are also partially represented in general language dictionaries lexicographers should make provision for the needs of laypersons as well as informed laypersons. Practical lexicographers are confronted by a challenge to compile a dictionary that responds to the changing needs of a new generation of dictionary users and therefore new models should be developed within the field of theoretical lexicography for these changing needs. Trying to satisfy these new needs has implications for different aspects of a general language dictionary, e.g. for the data distribution structure, outer texts as well as the article structure.

112

Rufus H. Gouws

According to Rundell (2012: 62) the information users need in a specialist dictionary is partly scientific (so subject-specialists should be involved), but also partly linguistic. Gouws (2011) has already indicated that lexicography is a team effort and not a lone ranger endeavor. In the planning and compilation of any dictionary there should be different role players. Specialized dictionaries cannot be compiled without a major input from experts in the specific field. In the planning and compilation of general language dictionaries that include a number of items from one or more specialized fields cooperation between lexicographer and subject field expert is also needed. The importance of this cooperation is not negotiable when making provision for the needs of informed laypersons. The first aim of lexicographers of general language dictionaries with regard to their inclusion and treatment of specialized terms could still be to assist the ordinary layperson. This approach could represent the default way of dealing with items from specialized fields. An innovative way of improving the assistance for informed laypersons could be to expand the treatment by means of data that complement the default data presentation. All specialized fields that are represented in the dictionary do not necessarily have to be treated in a similar way. In the planning of the dictionary the lexicographers can decide on the specialized fields to be represented. Where say less than ten terms from a given field qualify as lemma candidates they can only be included in the central list but where more terms from a given field are lemma candidates there could be additional efforts to enhance their presentation and treatment. These fields that qualify for a more comprehensive treatment could be those with which a majority of laypersons, the envisaged target users of the general language dictionary, regularly come into contact. In a printed dictionary terms from all the fields that qualify as lemma candidates could receive a brief explanation of meaning in the relevant article stretch of the central list. In addition a list of those fields selected for a more comprehensive treatment could be given in a front matter text and the data distribution structure could ensure a venue for the treatment of these terms in a series of thematically ordered back matter texts. The articles in the central word list could contain a very brief treatment and a cross-reference entry that guides the user to the relevant back matter text. The inclusion of such special field back matter texts will give lexicographers the opportunity to reflect on a much larger section of the lexicon with which their users are confronted on a daily basis, without altering the default treatment in the central list of the dictionary. The use of back matter texts will increase the complexity of a dictionary consultation process because the typical user will often have to negotiate a dual access process – first consulting the item in the central list and then being directed to the relevant back matter text. A better option could perhaps be to allow a more comprehensive treatment within the central list.

Increasing the scope of the treatment of specialized language terms

113

8.2 An additional text block Traditionally general dictionaries aim their treatment of specialized terms at laypersons. This presentation is appropriate for that specific target user but does not necessarily suffice the needs and expertise of the informed layperson. Working with a dictionary not only as a practical instrument but also as an economic instrument that has to provide specific users with specific assistance compels lexicographers to be innovative and to devise models that can successfully respond to the needs and reference skills of informed laypersons. Integrating a treatment of terms from different specialized fields as back matter texts into a general language dictionary can already be seen as an improvement. The notion of integration can also be taken a step further by allowing an increased number of special field terms as lemmata and a more expanded article structure in the central list with an extended treatment to complement the existing treatment directed only at the layperson. An improved article structure needs to be developed in order to ensure a better way of treating specialized terms for the benefit of informed laypersons. In the development of new models it is often necessary to be completely innovative but it often suffices to utilize some existing knowledge and structures. In his discussion of dictionary structures Wiegand has made numerous suggestions, all of which have not yet been put to practice frequently enough. One such a lesser implemented suggestion has been that of the semi-integrated microstructure, cf. Wiegand (1996). In some recent publications, cf. Gouws (2014; 2015), suggestions have been made for an increased use of adapted versions of this structure. Wiegand (1996) introduced the notion of a semi-integrated microstructure in order to provide a more diverse presentation of items giving example sentences and to assist users with both text reception and text production needs in an optimal way. The article structure is expanded by the use of such a microstructure. The different polysemous senses of the word are treated in a traditional sequence of subcomments on semantics within an integrated microstructure that allows a single example sentence included for each paraphrase of meaning or translation equivalent. This limited presentation of example sentences can assist users with a text reception need to have a better understanding of the paraphrase of meaning or translation equivalent and it can give limited assistance to users with a text production need. Following the default article structure with its integrated microstructure an additional, non-integrated, text block is added in which an ordered list of further items giving examples is presented. This is done for the benefit of those users in need of text production assistance. In a bifunctional dictionary the user only interested in text reception guidance does not have to consult this additional text block. Wiegand (1996:36) gives the following presentation of the use of a semi-integrated microstructure in the article of the lemma sign Kranz:

114

Rufus H. Gouws

Figure 1: Wiegand (1996: 36).

The approach illustrated in such an article that displays a semi-integrated microstructure, i.e. the use of a text block attached to the default article structure to include additional data, could also be used for a better presentation of items conveying other data types than example sentences. The additional data given in the treatment of a term from a specialized field to assist the informed layperson could find a venue in such a text block that could be attached to an article with a default article structure. This would lead to an article structure in which a simple paraphrase of meaning for the layperson is included in the first section of the article and a more comprehensive paraphrase of meaning as well as any other applicable data for the informed layperson or even the semi-expert are included in the additional text block. The lemmata

Increasing the scope of the treatment of specialized language terms

115

could be labelled as representing terms that belong to the relevant subject field and a further non-typographical structural indicator could be used to identify the lemma as guiding element of an article that includes a non-integrated text block. The primary function of the attached text block would be to increase the cognitive function of the dictionary. Such an innovative use of the approach suggested for articles with a semiintegrated microstructure can help to ensure the high quality lexicographic treatment of specialized terms in a high quality general language dictionary.

9 Terms from the field of economics The specialized field of economics could be a leading candidate for such a dictionary. Discussions and reports in the media during the recent financial crisis yet again illustrated the deep influence of economics on the daily life of people who are laypersons in this field and the need for guidance regarding many terms used in the public media. A model that makes provision for the needs of the informed layperson increases the scope of general language lexicography and results in a new form of typological hybridization – an integration of special field data into a general language dictionary. In an online dictionary the presentation and treatment can be expanded further and provision could be made for different access routes. Users can be given the opportunity to devise their own profile in order to retrieve the specific information they need. In a printed dictionary a structure resembling a semiintegrated microstructure with a text block that contains data directed at the needs of the informed layperson will go a long way to enhance the functionality of the specific dictionary. In the selection and treatment of terms lexicographers need to keep the specific user in mind. The general dictionary still differs from a specialized dictionary because it is not aimed at expert users but at laypersons and informed laypersons. Terms used in the conversation between experts, e.g. a term from the field of economics like homoscedasticity, will not qualify as lemma candidate. For experts the treatment of a term like expenditure function will include certain mathematical formulae whereas these formulae will not be included in the treatment allocated to this term in the additional text block of a general language dictionary. Terms often encountered in the public media, e.g. money laundering, inflation, hedge fund and deemed cost will be included as lemmata in the general language dictionary. They will be clearly labelled as belonging to the field of economics, receive a treatment directed at the needs of the layperson in the default section of the article and, for the sake of the informed layperson, an expanded treatment in the non-integrated text block. The cooperation between lexicographer and subject field expert needs to be much closer than in prevailing general language dictionaries. In the current “Oxford Online” the article of the lemma sign equilibrium contains a treatment of different polysemous senses of the word, including its use in the field of economics. For this sense the

116

Rufus H. Gouws

following paraphrase of meaning is given: “a situation in which supply and demand is matched and prices stable.” For a layperson such a paraphrase of meaning may suffice but not for the informed layperson. Such a user needs additional guidance, e.g. emphasizing that in a situation of equilibrium “no agent has an incentive to change strategy”. In the field of economics this is a significant aspect that should not be neglected, even in a general language dictionary.

10 In conclusion The field of economics receives wide-ranging interest from a broad spectrum of informed laypeople. Lexicographers of general language dictionaries need to negotiate the needs of these users in their dictionaries. The default way of looking only at the needs of laypersons should be complemented by a treatment directed at the informed layperson. The approach suggested in this paper needs to be worked out in detail by a team consisting of lexicographers and subject field experts. Because of its exposure to people outside the circles of subject field experts economics can lead the way in this new lexicographic approach to special field terms in general language dictionaries. The same principle could be applied to terms from other subject fields. This approach can also be seen as a more economical way of lexicographically presenting and treating terms from specialized fields. It can enhance the economy of dictionaries by making specialized terms more readily accessible to a wide range of potential target users. This will lead to positive lexicographic inflation. According to Adam Smith, the father of modern Economy: “It is not from the benevolence of the butcher, the brewer, or the baker, that we can expect our dinner, but from their regard to their own interest.” (Smith 1776). However, from the benevolence of lexicographers, economists and other subject field experts, not from their regard to their own interest, a wide range of dictionary users can find answers to their subject field specific questions in their general language dictionaries.

11 Bibliography 11.1 Dictionaries Bannock, Graham et al. (1978) (eds.): The Penguin Dictionary of Economics. Harmondsworth: Penguin. Oxford Online [http://www.oxforddictionaries.com].

Increasing the scope of the treatment of specialized language terms

117

11.2 Other literature Bergenholtz, Henning/Tarp, S ven (1995) (eds.): Manual of Specialised Lexicography. Amsterdam: John Benjamins. Bergenholtz, Henning/Tarp, S ven ( 2002): Die moderne lexikographische Funktionslehre. Diskussionsbeitrag zu neuen und alten Paradigmen, die Wörterbücher als Gebrauchsgegenstände verstehen. In: Lexicographica 18, 253–263. Bergenholtz, Henning/Tarp, S ven ( 2003): Two opposing theories: On H.E. Wiegand’s recent discovery of lexicographic functions. In: Hermes. Journal of Linguistics 31, 171–196. Bergenholtz, Henning/Tarp, S ven /Wiegand, Herbert Ernst (1999): Datendistributionsstrukturen. Makro- und Mikrostrukturen in neueren Fachwörterbüchern. In: Hoffmann, Lothar et al. (Hrsg.): Fachsprachen. Ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft. Berlin. New York: de Gruyter, 1762–1832. Fuertes-Olivera, Pedro A. (2010) (ed.): Specialised dictionaries for learners. Berlin. New York: de Gruyter. Gouws, Rufus H. (2005): Meilensteine auf dem historischen Weg der Metalexikographie. In: Lexicographica 21, 158–178. Gouws, Rufus H. (2011): Learning, unlearning and innovation in the planning of electronic dictionaries. In: Fuertes-Oliviera, Pedro A./Bergenholtz, Henning (eds.) e-lexicography. London: Continuum, 17–29. Gouws, Rufus H. (2012): Towards a system of integrated dictionary use. In: Karpova, Olga/ Kartashkova, Faina (2012) (eds.): Multi-disciplinary Lexicography: Traditions and Challenges of the XXI-st century. Cambridge: Cambridge Scholars Publishing, 134–144, Gouws, Rufus H. (2013): Establishing and developing a dictionary culture for specialized lexicography. In: Jesenšek, Vida (2013) (ed.) Specialised Lexicography. Berlin. New York: de Gruyter, 51–62. Gouws, Rufus H. (2014): Towards bilingual dictionaries with Afrikaans and German as language pair. In: Domínguez Vázquez, María José/Mollica, Fabio/Nied Curcio, Martina (2014) (eds.): Zweisprachige Lexikographie zwischen Translation und Didaktik. Berlin. New York: de Gruyter, 249–262. Gouws, Rufus H. (2015): The presentation and treatment of collocations as secondary guiding elements in dictionaries. In: Lexikos 25: 170–190. Gouws, Rufus H. et al. (2013) (eds.): An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin. New York: de Gruyter. Hausmann, Franz J. (1989): Die gesellschaftlichen Aufgaben der Lexikographie in Geschichte und Gegenwart. In: Hausmann, Franz J. et al. (1989) (eds.), 1–19. Hausmann, Franz J./Wiegand, Herbert Ernst (1989): Component Parts and Structures of General Monolingual Dictionaries: A Survey. In: Hausmann, Franz J. et al. (1989–1991) (eds.), 328–360. Hausmann, Franz J. et al. (1989–1991) (eds.): Wörterbücher. Dictionaries. Dictionnaires. An International Encyclopedia of Lexicography. Berlin [usw.]: de Gruyter. Jesenšek, Vida. (ed.) (2013) (ed.): Specialised Lexicography. Berlin. New York: de Gruyter. Kilgarriff, Adam (2012): Review of Fuertes-Olivera and Bergenholtz, e- Lexicography: The Internet, Digital Initiatives and Lexicography. In: Kernerman Dictionary News 20, 26‒29. Marzá, N.E. (2009.): The Specialised Lexicographical Approach: A Step Further in Dictionary-Making. Bern: Peter Lang. McArthur, Tom (1986): Worlds of reference. Cambridge: Cambridge University Press. Rundell, Michael (2012): It works in practice but will it work in theory? The uneasy relationship between lexicography and matters theoretical. In: Vatvedt Fjeld, Ruth/Matilde Torjusen, Julie (eds.): Proceedings of the 15th EURALEX International Congress. 7–11. 08.2012. Oslo: Department of Linguistics and Scandinavian Studies, University of Oslo, 47–92.

118

Rufus H. Gouws

Schierholz, Stefan J. (2013): New developments in lexicography for special purposes I: An overview of linguistic dictionaries. In: Gouws, Rufus H. et al. (eds.), 431–442. Smith, Adam (1981) [1776]: An Inquiry into the Nature and Causes of the Wealth of Nations. Volume I. Indianapolis: Liberty Fund. Tarp, Sven (2000): Theoretical challenges to LSP lexicography. In: Lexikos 10, 189–208. Wiegand, Herbert Ernst (1988): Was eigentlich ist Fachlexikographie? Mit Hinweisen zum Verhältnis von sprachlichem und enzyklopädischem Wissen. In: Munske, Horst H. et al. (Hrsg.): Deutscher Wortschatz. Lexikologische Studien. Berlin. New York: de Gruyter, 729–790. Wiegand, Herbert Ernst (1988a): Wörterbuchartikel als Text. In: Harras, Gisela (Hrsg.): Das Wörterbuch. Artikel und Verweisstrukturen. Düsseldorf: Jahrbuch 1987 des Instituts für deutsche Sprache, 30–120. Wiegand, Herbert Ernst (1989): Der gegenwärtige Status der Lexikographie und ihr Verhältnis zu anderen Disziplinen. In: Hausmann, Franz J. et al. (1989–1991) (eds.), 246–280. Wiegand, Herbert Ernst (1989a): Der Begriff der Mikrostruktur: Geschichte, Probleme, Perspektiven. In: Hausmann, Franz J. et al. (1989–1991) (eds.), 409–462. Wiegand, Herbert Ernst (1989b): Arten von Mikrostrukturen im allgemeinen einsprachigen Wörterbuch. In: Hausmann, Franz J. et al. (eds.), 462–501. Wiegand, Herbert Ernst (1989c): Aspekte der Makrostruktur im allgemeinen einsprachigen Wörterbuch: alphabetische Anordnungsformen und ihre Probleme. In: Hausmann, Franz J. et al. (1989– 1991) (eds.), 371–409. Wiegand, Herbert Ernst (1991): Printed Dictionaries and Their Parts as Texts. An Overview of More Recent Research as an Introduction. In: Lexicographica 6, 1–126. Wiegand, Herbert Ernst (1996): Das Konzept der semiintegrierten Mikrostrukturen. Ein Beitrag zur Theorie zweisprachiger Printwörterbücher. In: Wiegand, Herbert Ernst (Hrsg.): Wörterbücher in der Diskussion II. Tübingen: Max Niemeyer, 1–82. Wiegand, Herbert Ernst (1996 a): Über die Mediostrukturen bei gedrückten Wörterbüchern. In: Zettersten, Arne/Pedersen, Vigo (eds.): Symposium on Lexicography VII. Tübingen: Max Niemeyer, 11–43. Wiegand, Herbert Ernst (2003): Wörterbuch zur Lexikographie und Wörterbuchforschung / Dictionary of Lexicography and Dictionary Research. In: Städler, Thomas. (Hrsg.): Wissenschaftliche Lexikographie im deutschsprachigen Raum. Im Auftrag der Heidelberg Akademie der Wissenschaften. Heidelberg: Winter, 417–437. Wiegand, Herbert Ernst (2004): Über die Unterschiede von Fachlexikographie und Terminographie. Am Beispiel des Wörterbuchs zur Lexikographie und Wörterbuchforschung. In: Wiegand, H.E. (Hrsg.): Studien zur zweisprachigen Lexikographie mit Deutsch IX (= Germanistische Linguistik 178), 135–152. Wiegand, Herbert Ernst (2004a): Reflection on the mediostructure in special-field dictionaries. In: Lexikos 14, 195–221. Wiegand, Herbert Ernst (2013): Lexikographie und Angewandte Linguistik. In: Zeitschrift für angewandte Linguistik 58 (1), 13–39. Zgusta, Ladislav (1971): Manual of Lexicography. The Hague: Mouton.

Klaus-Dieter Ludwig

„Auf, auf, mein Herz, mit Freuden nimm wahr, was heut geschicht“ Das „Evangelische Gesangbuch“ – auch eine „Pflegestätte“ deutscher Archaismen? Abstract: Departing from H.E. Wiegand’s (2002) surprising experience with his own mother tongue in discovering that bilingual dictionaries with German as source language are a source of German archaisms, the author of this contribution embarks on a search of archaisms in another text type. The expected outcome of finding numerous archaisms in the evangelic hymnar was an erroneous belief. Most lexemes regarded as old words have been labelled in present-day dictionaries as “elevated” and only a few as “dated” and “obsolete”. According to the innate sense of language of the author they should, as seen from current language usage, have been labelled as “becoming obsolete” or “obsolete”. Keywords: old words, archaism Schlagwörter: Altwörter, Archaismus

1 Ein anderes „Erlebnis“ mit der Muttersprache In einem Beitrag hat Herbert Ernst Wiegand (2002: 137–155) für das Auffinden von Archaismen zweisprachige Wörterbücher empfohlen und anhand zahlreicher Beispiele gezeigt, dass diese Wörterbücher als „Pflegestätten deutscher Archaismen“ angesehen werden können. Bei der Durchsicht von „zehn zweisprachigen Wörterbüchern mit Deutsch als lexikographischer Ausgangssprache“, in denen alle „deutschen Ausdrücke […] primär gebucht (i.S.v. als Lemma angesetzt)“ sind, hatte der Wörterbuchforscher ein überraschendes „Erlebnis“ mit der eigenen Muttersprache. Denn es waren viele Lexeme dabei, die dem Metalexikographen „en passant aufgefallen sind“ und für ihn „fremd waren“ (Wiegand 2002: 137f.). Anhand einiger verschiedenartiger Beispiele veranschaulicht Herbert Ernst Wiegand sein „Fremdheitserlebnis“ (ebd.: 138) und zeigt, dass es sich hierbei um sogenannte Archaismen1 handelt – ein Termi-

1 Zum Phänomen Archaismus z.B. Cherubim (1988, 2012), Ludwig (2004, 2015), Wiegand (2002) und den von Kramer (2002) herausgegebenen Sammelband.

Klaus-Dieter Ludwig: Hielscherstr. 39, 13158 Berlin, email: [email protected]

120

Klaus-Dieter Ludwig

nus, der nach wie vor in der linguistischen Literatur nicht eindeutig definiert ist, und der im Allgemeinen (darüber herrscht weitgehend Konsens) als Oberbegriff für veraltendes und veraltetes Wortgut gilt. Es sind Altwörter2. Auf der Suche nach einer weiteren „Pflegestätte“ deutscher Archaismen hatte ich die Idee, dass hierfür eventuell ein derzeitiges deutsches Kirchengesangbuch in Frage käme. Und so begab ich mich im „Evangelischen Gesangbuch. Ausgabe für die Evangelische Landeskirche Anhalts, die Evangelische Kirche Berlin-Brandenburgschlesische Oberlausitz, die evangelische Kirche der Kirchenprovinz Sachsen“ auf die Suche nach Archaismen. Die kursorische Durchsicht des Gesangbuches brachte eine Anzahl von Lexemen zu Tage, bei denen sich zwar kein Erlebnis der Fremdheit einstellte, aber ein Erlebnis der „Auffälligkeit“3. Es betrifft Wörter, die nach meinem Sprachempfinden im heutigen alltäglichen Sprachgebrauch selten sind oder gar nicht mehr vorkommen, und wohl von vielen nicht verstanden werden. Die Generationsfrage spielt eine entscheidende Rolle, in diesem besonderen Falle wohl auch die Textsorte kirchliches Gesangbuch und nicht zuletzt die religiöse bzw. theologische Bildung. Den Enkeln und Urenkeln werden mehrere der in den Versen des Gesangbuchs vorkommenden Wörter kaum noch oder gar nicht mehr verständlich sein. Ob diese Wörter nach meinem Sprachgefühl heute als „alt“ empfunden und – wie in Gegenwartswörterbüchern üblich – als „veraltend“ oder „veraltet“4 markiert sind, habe ich anhand zweier Wörterbücher der Gegenwartssprache geprüft. Zur Kontrolle wurde das 1961–1977 erschienene „Wörterbuch der deutschen Gegenwartsprache“ (im Folgenden: WDG) und das 2014 publizierte Wörterbuch „DUDEN. Die deutsche Sprache. Wörterbuch in drei Bänden“ (DUWB) herangezogen. Zwischen dem Erscheinen beider Wörterbücher liegen rund 50 Jahre. Zum Vergleich ist auch die zehnte Auflage von Hermann Pauls „Deutschem Wörterbuch“ (2002) befragt worden.

2 In Analogie zu Neuwort findet sich Altwort in der „Vorrede“ zum „Volksthümlichen Wörterbuch der Deutschen Sprache“ von Theodor Heinsius (1818: XI): „Warum soll das Wort G e p ä c k e s nicht seyn, da es doch auch zuerst im siebenjährigen Kriege von den Zeitungsschreibern für B a g a g e gebraucht wurde? Warum nicht auch H e e r s c h a r und S t e r n w a r t e , die nicht älter sind? Man sieht an diesen Beispielen, was man solchen Bezeichnungen, womit Campe seine Neu- und Altwörter etc. ausstattet, zu halten hat“. 3 Dabei ist das Kriterium der „Auffälligkeit“ auf die „spontanen und intuitiven Reaktionen des Durchschnittssprechers“ zu beziehen, es ist also „eine unmittelbare Auffälligkeit gemeint, nicht eine, die erst nach linguistischer Analyse zutage tritt“ (Hausmann 1989: 649). 4 Die Kennzeichnung v e r a l t e n d soll angeben, „daß das Wort heute nur noch wenig gebraucht wird und vornehmlich dem Wortschatz der älteren Generation angehört“; v e r a l t e t werden Wörter genannt, „die heute nicht mehr gebraucht werden, in der heute noch gelesenen Literatur aber vorkommen und weithin noch verstanden werden“ (WDG Vorwort: 014). Ähnliche Erläuterungen finden sich im DUWB.

„Auf, auf, mein Herz, mit Freuden nimm wahr, was heut geschicht“

121

2 „Altwörter“ im „Evangelischen Gesangbuch“ Im Folgenden werden einige Lexem angeführt, die mir insofern „auffällig“ erschienen, als ich meinte, es seien „Altwörter“, und von denen ich annahm, dass deren Bedeutungen heute nicht (mehr) allgemein bekannt sind. Die Bedeutungserläuterungen zu den verzeichneten Ausdrücken sind den genannten Gegenwartswörterbüchern entnommen. Die ermittelten Lexeme werden den Wortarten Substantiv, Verben, Adjektiv und Adverb zugeordnet. In den Liedtexten vorkommende Formvarianten, die einer sprachgeschichtlichen Epoche angehören5, und Formvarianten, die dem Versmaß geschuldet sind, bleiben unberücksichtigt, ebenso etymologische Angaben.

2.1 Substantive Cherubim „… Gleicher Macht und gleicher Ehren / sitzt er unter lichten Chören / über allen Cherubim; / in der Welt und Himmel Enden …“ (123, 4; 1755)6

In beiden herangezogenen Wörterbüchern erscheint das Wort mit unterschiedlichen Kennzeichnungen und Bedeutungserläuterungen: im WDG Cherub, der; -s, Cherubim/ Cherubinen (biblisch) ‚Engel, der das Paradies bewacht‘; DUWB Cherub … (ökumenisch:) Kerub, der; -s, -im … u. -innen ‚[biblischer] Engel [mit Flügeln u. Tierfüßen]; himmlischer Wächter (z.B. des Paradieses)‘. Friedefürst „…und zeig dich jedem Völkerstamme / als Heiland, Friedefürst und Held.“ (255, 8; 1812)

Beide Wörterbücher verzeichnen Friedensfürst mit ähnlicher Bedeutung, aber unterschiedlichen Markierungen. Das WDG führt als erste Bedeutung ‚Jesus als Bringer des Friedens‘ an und markiert das Wort mit „Religion gehoben“7. Als zweite Bedeutung führt es an: ‚Fürst, der den Frieden schützt‘, die der zeitlichen Markierung „historisch“ zugeordnet wird. Das DUWB verfährt umgekehrt und erklärt das Wort zuerst mit ‚friedlich gesinnter, den Frieden liebender Fürst‘ und bewertet es in dieser Bedeutung als

5 Zu der im Titel vorkommenden Form geschicht vgl. GRIMM, Bd. 5, unter Stichwort Geschehen I.2a). 6 Der jeweiligen Textstelle mit dem infrage kommenden Lexem, das von mir kursiv gesetzt ist, folgen in Klammern Liednummer, Vers und Jahreszahl des entstandenen Textes. 7 „Wörter, wie sie bei feierlichen Anlässen und gelegentlich in der Literatur verwendet werden“, sind als „gehoben“ markiert. „Diese gehobene (>>geh.dichter.>früher>landsch.< < (= landschaftlich) verwendet …“ (DUWB: 18).

124

Klaus-Dieter Ludwig

Das WDG verzeichnet zu lobsingen das Beispiel „Gott lobsingen“ (‚durch Gesang ehren‘), das dem Fachgebiet „Religion“ zugewiesen wird. DUWB versieht das Verb mit der stilistischen Angabe „dichterisch“ und der Bedeutungserläuterung ‚Gott durch Lobgesang preisen‘. prangen „Dieser Tag ist nun vergangen / und die trübe Nacht bricht an; / es ist hin der Sonne Prangen, / so uns all erfreuen kann.“ (475, 3; 1642)

Das Verb in der Bedeutung ‚in voller Schönheit, in vollem Schmuck glänzen, leuchten‘ wird sowohl im WDG als auch im DUWB mit „gehoben“ markiert. preisen „Was er verspricht, / das bricht er nicht; / er bleibet meine Zuversicht, / ich will ihn ewig preisen.“ (374, 5; 1833) „Preist den Tag und die Nacht! / Preist die Nacht und den Tag! / Preist die Sonne, preiset die Erde, / preist den Herrn aller Welten.“ (489, 1; 1957)

Wer verwendet heutzutage noch das Wort preisen für ‚jemanden, etwas rühmen, loben‘? DUWB ordnet es der stilistischen Angabe „gehoben“ zu. Im WDG ist lediglich das Beispiel „ist das deine so sehr gepriesene Gastfreundschaft?“ als „spöttisch“ charakterisiert. In diesem Zusammenhang sei erwähnt, dass preisen ursprünglich ein schwaches Verb war (s. PAUL), wie es z.B. im folgenden Gesangbuchvers belegt ist: „Gott Vater in dem höchsten Thron / und Jesus Christ, sein ein’ger Sohn, / samt Gott, dem werten Heilgen Geist, / sei nun und immerdar gepreist.“ (288, 7; 1646). säumen „Nun jauchzt dem Herren, alle Welt! Kommt her, zu seinem Dienst euch stellt, kommt mit Frohlocken, säumet nicht …“. (288, 1; 1646).

Das Verb mit der Bedeutung ‚aus Nachlässigkeit oder Trägheit mit der Ausführung von etwas warten, zögern‘ erhält im WDG die stilistische Angabe „gehoben“, im DUWB die Markierungen „gehoben veraltend“. züchtigen „Nicht sterben werd ich, sondern leben; / gezüchtigt wurde ich vom Herrn, / dem Tode aber nicht gegeben …“ (294, 2; 1565).

Das Verb züchtigten ‚durch Schlagen hart bestrafen‘ kennzeichnet das WDG mit „gehoben veraltend“, DUWB mit „gehoben“.

„Auf, auf, mein Herz, mit Freuden nimm wahr, was heut geschicht“

125

2.3 Adjektive und Adverbien eitel „Sie lehren eitel falsche List, / was eigen Witz erfindet; / ihr Herz nicht eines Sinnes ist …“ (273, 2; 1524)

Die indeklinable Form des Adjektivs erscheint in beiden Wörterbüchern unter dem Bedeutungspunkt ‚rein‘, im WDG mit dem Hinweis „oft spöttisch“ („eitel Gold, Glück“) und der Präzisierung ‚nichts als‘ („in dem Hause herrschte eitel Sonnenschein“). DUWB kennzeichnet diese Verwendung als „veraltend, noch scherzhaft“. hold „… die Gnad tut er nicht sparen, / den Schwachen ist er hold; / sein Güt ist hoch erhaben …“ (289, 2; 1530)

In der Bedeutung ‚geneigt, wohlgesonnen, zugetan‘ bleibt das Adjektiv im WDG ohne Markierung, im DUWB ist es als „gehoben“ gekennzeichnet. lauter „Das Silber, durchs Feu’r siebenmal / bewährt, wird lauter funden; / von Gottes Wort man erwarten soll / desgleichen alle Stunden.“ (273, 5; 1524)

Das Adjektiv lauter, hier in der in der Bedeutung ‚rein, ungetrübt‘, erhält in beiden Wörterbüchern die stilistische Angabe „gehoben“. ledig „Wenn der Herr einst die Gefangnen ihrer Bande ledig macht, o dann schwinden die vergangnen Leiden wie ein Traum der Nacht …“ (298, 1; 1787)

Ledig, in der Bedeutung ‚frei von etwas‘, wird sowohl im WDG als auch im DUWB als „gehoben“ gekennzeichnet. allenthalben „Du b’reitest vor mir einen Tisch / vor mein‘ Feind‘ allenthalben, / machst mein Herz unverzaget frisch …“ (274, 4; 1531)

Das Adverb allenthalben (‚überall‘) erscheint im WDG mit der zeitlichen Zuordnung „veraltend“, im DUWB ohne zeitliche Kennzeichnung. allhier „Lass doch dein Licht / auslöschen nicht / bei uns allhier auf Erden.“ (473, 4; 1598)

126

Klaus-Dieter Ludwig

Das WDG, das allhier mit ‚hier, am gleichen Ort‘ erklärt, markiert das Adverb als „veraltend“, DUWB mit der Bedeutungserklärung ‚eben hier‘ kennzeichnet das Wort mit „Amtssprache veraltet“. hernieder „Christ fuhr gen11 Himmel. Was sandt er uns hernieder? Den Tröster, den Heiligen Geist, zu Trost der ganzen Christenheit.“ (120, 1480)

Das Adverb mit der Bedeutung ‚von dort oben nach unten, herunter‘ wird in beiden Wörterbüchern mit „gehoben“ markiert. PAUL kennzeichnet das Lexem als „veraltend“. immerdar „Gott Vater in dem höchsten Thron / und Jesus Christ, sein ein’ger Sohn … sei nun und immerdar gepreist.“ (288, 7; 1646)

Das Adverb immerdar (‚immer, jederzeit, künftig‘) erhält im WDG die stilistische und zeitliche Markierung „gehoben veraltend“, im DUWB die stilistische Zuordnung „gehoben“. PAUL notiert „jetzt veraltet“. vormals „Herr, der du vormals hast dein Land mit Gnaden angeblicket …“ (283, 1; 1653)

Das Adverb mit der Bedeutung ‚früher, einst’ erscheint im WDG mit der zeitlichen Angabe „veraltend“, im DUWB ohne Markierung.

3 Schlussbemerkungen Das angenommen oder erhoffte Ergebnis, im durchgesehenen Gesangbuch eine größere Anzahl „Altwörter“ zu finden, ist negativ. Nur wenige Lexeme sind in den Zettelkasten gelangt, die in den Gegenwartswörterbüchern mit dem zeitlichen Markierungsprädikaten „veraltend“ oder „veraltet“ versehen sind. Die meisten mir „auffälligen“ Wörter, von denen ich vermutete, sie seien im Wörterbuch als „Altwörter“ gekennzeichnet, haben im Wörterbuch den stilistischen Marker „gehoben“, in einigen Fällen „dichterisch“, und nur selten einen Hinweis auf Veraltung, obwohl sie nach meinem Sprachgefühl einen Hinweis auf „Veraltet-Werden“ oder „Veraltet-Sein“ verdient hätten. Die unterschiedlichen und zum Teil erheblich voneinander abweichenden

11 Die im Text vorkommende Präposition gen (’in Richtung, nach, gegen‘) erscheint im WDG mit der stilistischen Angabe „dichterisch“, im DUWB mit der zeitlichen Zuordnung „veraltend“.

„Auf, auf, mein Herz, mit Freuden nimm wahr, was heut geschicht“

127

Markierungen in den beiden Wörterbüchern zeigen erneut die subjektiven Einschätzungen. Klein (2013: 20) hat darauf hingewiesen, dass es weitaus „schwieriger ist […] klare Beispiele für Verluste“ von Wörtern anzugeben, als eine Reihe neuer Wörter zu nennen: „Zwar muten uns viele Wörter – Droschke, Leibstuhl, füglich, behufs, weiland, abzwecken – ungebräuchlich an. Aber man versteht sie immer noch, und ob sie tatsächlich nicht mehr aktiv verwendet werden, ist schwer zu entscheiden“. (Ebd.).

Das trifft auch auf Wörter aus dem Gesangbuch zu, wie Cherubim, benedeien, frohlocken, preisen, allhier oder immerdar: „Der Einzelne versteht immer nur einen kleinen Teil des gesamten Wortschatzes, wobei dieses Verstehen nicht nur unterschiedlich weit, sondern auch unterschiedlich tief geht“. (Ebd.: Anm.).

Nach Wiegands Typologie lexikalischer Archaismen (Wiegand 2002: 140f.) könnten die nach meiner individuellen Einschätzung angenommenen „Altwörter“ dem Typ „passiver lebender lexikalischer Archaismus“ zugeordnet werden: „Ein passiv lebender lexikalischer Archaismus einer bestimmte Varietät ist eine lexikalisierte Einheit, die in der Regel […] nicht mehr usuell verwendet wird, jedoch […] noch verstanden und als ‚veraltet‘ eingeschätzt wird, wenn sie diesen in älteren Texten in usueller Verwendung begegnen.“ (Wiegand 2002: 141).

Der negative Befund, im untersuchten Text nur einer geringen Anzahl vermuteter Archaismen begegnet zu sein, ist auch ein Ergebnis. Das „Evangelische Gesangbuch“ ist wohl keine „Pflegestätte“ oder ein „Quell“ von Archaismen, jedenfalls in Bezug auf Wörter. Der Jubilar hatte offenbar mehr Glück mit dem Auffinden von Archaismen, die ihm bei der Durchsicht zweisprachiger Wörterbücher „en passant aufgefallen“ sind. Möge er weitere überraschende Erlebnisse mit der Muttersprache haben. Gewünscht seien ihm dazu auch inskünftig stabiles Gesundsein, Wohlsein, frohe Erlebnisse im Alltäglichen, weniger Rastlosigkeit und weiterhin auch Freude am (meta-)lexikographischen Schaffen: „es ist ihm gestattet mit stiller wehmuth hinter sich zu blicken und nach dem schwülen tag in abendlicher, labender kühle gleichsam auf der bank vor seiner hausthür sitzend sein verbrachtes leben zu überschlagen“, wie es weiland Jacob Grimm in seiner „Rede über das Alter“ so treffend zum Ausdruck gebracht hat.

128

Klaus-Dieter Ludwig

4 Literatur 4.1 Monographien, Sammelbände und Beiträge in Sammelbänden oder Zeitschriften Cherubim, Dieter (1988): Sprach-Fossilien. Beobachtungen zum Gebrauch, zur Beschreibung und zur Bewertung der sogenannten Archaismen. In: Munske, Horst Haider/von Polenz, Peter/Reichmann, Oskar/Hildebrandt, Rainer (Hrsg.): Deutscher Wortschatz. Lexikologische Studien. Ludwig Erich Schmidt zum 80. Geburtstag von seinen Marburger Schülern. Berlin/New York: Walter de Gruyter, 525–552. Cherubim, Dieter (2012): Die Gleichzeitigkeit des Ungleichzeitigen in der deutschen Sprache. In: Neuland, Eva (Hrsg.): Sprache der Generationen. Mannheim/Zürich: Bibliographisches Institut, 207–231. Grimm, Jacob (1984): Rede über das Alter. In: Neumann, Werner/Schmidt, Hartmut (Hrsg.): Reden in der Akademie. Berlin: Akademie-Verlag, 304–323. Hausmann, Franz Josef (1989): Die Markierung im allgemeinen einsprachigen Wörterbuch: eine Übersicht. In: Hausmann, Franz Josef/Reichmann, Oskar/Wiegand Herbert Ernst/Zgusta, Ladislav (Hrsg.): Wörterbücher. Ein internationales Handbuch zur Lexikographie. Erster Teilband. Berlin/ New York: Walter de Gruyter, 649–647. Klein, Wolfgang (2013): Von Reichtum und Armut des deutschen Wortschatzes. In: Deutsche Akademie für Sprache und Dichtung/Union der deutschen Akademien der Wissenschaften (Hrsg.): Reichtum und Armut der deutschen Sprache. Erster Bericht zur Lage der deutschen Sprache. Berlin/Boston: Walter de Gruyter, 15–55. Kramer, Undine (2002) (Hrsg.): Archaismen – Archaisierungsprozesse – Sprachdynamik. Klaus-Dieter Ludwig zum 65. Geburtstag. Frankfurt a.M.: Peter Lang. Ludwig, Klaus-Dieter (2004): Hoch auf dem gelben Wagen sitz ich beim Schwager vorn … Zum Plan eines deutschen Archaismenwörterbuchs. In: Scharnhorst, Jürgen (Hrsg.): Sprachkultur und Lexikographie. Von der Forschung zur Nutzung von Wörterbüchern. Frankfurt a.M.: Peter Lang, 173–188. Ludwig, Klaus-Dieter (2015): Vetter, Muhme, Kebsweib. Randbemerkungen zu „bedrohten“, „gefährdeten“ und „untergegangenen“ Wörtern. In: Der Deutschunterricht 3/15, 14–23. Wiegand, Herbert, Ernst (202): „mit dem Teufel auf dem Höllenmarkt marschieren.“ Zweisprachige Wörterbücher mit Deutsch als Pflegestätte deutscher Archaismen? In: Kramer, Undine (2002), 137–155.

4.2 Wörterbücher DUDEN = DUDEN. Die deutsche Sprache. Wörterbuch in drei Bänden. Hrsg. von der Dudenredaktion. Berlin/Mannheim/Zürich: Bibliographisches Institut, 2014. GRIMM = Jacob und Wilhelm Grimm (1897): Deutsches Wörterbuch. Bd. 5. Leipzig: S. Hirzel. HEINSIUS = Heinsius, Theodor: Volksthümliches Wörterbuch der Deutschen Sprache mit Bezeichnung der Aussprache und Betonung für die Geschäfts- und Lesewelt. Bd. 1. Hannover, 1818. PAUL = Hermann Paul, Deutsches Wörterbuch. Bedeutungsgeschichte und Aufbau unseres Wortschatzes. 10., überarb. und erw. Aufl. von Henne, Helmut/Kämper, Heidrun/Objartel, Tübingen: Niemeyer, 2002.

„Auf, auf, mein Herz, mit Freuden nimm wahr, was heut geschicht“

129

WDG = Wörterbuch der deutschen Gegenwartssprache. Hrsg. von Klappenbach, Ruth/Steinitz, Wolfgang. Berlin: Akademie-Verlag, 1961–1977.

4.3 Quelle Evangelisches Gesangbuch. Ausgabe für die Evangelische Landeskirche Anhalts, die Evangelische Kirche Berlin-Brandenburg-schlesische Oberlausitz, die Evangelische Kirche der Kirchenprovinz Sachsen. Leipzig: Evangelische Verlagsanstalt, 2011.

Giovanni Rovere

Zur lexikographischen Darstellung der zeitgenössischen Germanismen Eine Problemskizze Abstract: The basic assumption which will be here discussed is that lexicographic representation of foreign words used by members of a specific language community in contemporary text production is a task which, due to methodological reasons, generally leads to uncertain results. This allows considerable leeway for intervention on the level of language policy whenever the international relevance of the donor language or the “autarchic” character of the recipient language needs to be highlighted. The topic of this thesis will be illustrated on the basis of available contemporary germanisms in Italian. Keywords: language contact lexicography, lexical borrowing, foreign word, cultural borrowing, germanism Schlagwörter: Kontaktlexikographie, lexikalische Entlehnung, Fremdwort, kulturelle Entlehnung, Germanismus

1 Grundthese Die hier zur Diskussion gestellte Grundthese lautet: Die lexikographische Darstellung der Fremdwörter, die in zeitgenössischen Textproduktionen von Sprechern einer gegebenen Sprachgemeinschaft verwendet werden, ist ein Unterfangen, das aus methodischen Gründen prinzipiell zu unsicheren Ergebnissen führt. Der sich aus diesem Sachverhalt ergebende Spielraum wird dann ideologisch oder sprachpolitisch genutzt, wenn die internationale Geltung der Gebersprache oder der sozusagen „autarke“ Charakter der Nehmersprache hervorgehoben werden soll. Die Grundthese wird anhand der zeitgenössischen Germanismen im Italienischen illustriert.

Giovanni Rovere: Universität Heidelberg, Institut für Übersetzen und Dolmetschen, Plöck 57a, 69115 Heidelberg, email: [email protected]

132

Giovanni Rovere

2 Begriffsbestimmungen Als zeitgenössische Fremdwörter gelten im Folgenden die lexikalischen Einheiten, die, durch Sprachkontakte übernommen, in einem gegenwärtigen nehmersprachlichen Wortschatz lexikalisiert sind und von den Sprechern der Nehmersprache als Fremdwort identifiziert werden, da sie mindestens eine als fremdsprachlich identifizierbare Komponente enthalten. Oder allgemeiner, mit den Worten Eisenbergs formuliert: „Von einem Fremdwort sprechen wir, wenn ein Wort fremde Eigenschaften hat, die der Normalsprecher einer fremden Sprache zuschreibt.“ (Eisenberg 2011: 29).1

Von der Betrachtung ausgeschlossen bleiben demnach die semantischen Entlehnungen und die Zitatwörter: erstere, weil ihre Zeichenform nichts Fremdsprachliches aufweist, und letztere, weil sie in der Nehmersprache nicht lexikalisiert sind. Bei der Analyse potentieller Germanismen ist zwar von unterschiedlichen Graden der Integration auszugehen, von unterschiedlichen Wortprofilen also, die den jeweiligen Integrationsgrad, von nicht- bis vollständig integriert, auf den verschiedenen Sprachebenen abbilden. Als entscheidend wird jedoch der Umstand betrachtet, dass die entlehnte lexikalische Einheit „gewohnheitsmäßig […] auch von nicht zweisprachigen Sprechern“ (von Polenz 2000: 42) verwendet wird. Unter dieser Bedingung ergibt sich zwingend, dass die lexikalisierte Entlehnung Veränderungen im semantischen Netz des zielsprachlichen Wortschatzes bewirkt, erkennbar an den semantischpragmatischen Differenzierungen innerhalb des jeweiligen Netzsegments, insbesondere im Verhältnis zu den nativen lexikalischen Einheiten. Sie gilt somit als semantisch-pragmatisch integriert, unabhängig vom Profil ihrer formalen Integration. Infolgedessen wird dem semantischen Kriterium nicht nur „Gewicht gegeben“ (von Polenz 2000: 43), sondern im Widerspruch zur Bevorzugung der ausdrucksseitigen Integrationsebenen Vorrang eingeräumt. Setzt man bei der Erfassung und Beschreibung des fremdsprachlichen Wortschatzes hingegen die formalen Eigenschaften des Kernwortschatzes als Vergleichskonstante, ergeben sich wesentliche Vorteile hinsichtlich der Kohärenz einer systematischen Darstellung - allerdings zum Preis, dass beispielsweise Köfte zu den nativen Wörtern gerechnet werden muss (so in Eisenberg 2011: 92), was gerade für den oben zitierten Normalsprecher eher kontraintuitiv sein dürfte. Es gilt in diesem Zusammenhang überdies zu berücksichtigen, dass es aufgrund der in modernen Gesellschaften typischen Intensivierung der Sprachkontakte und der allgemeinen Zunahme fremdsprachlicher Kenntnisse bei Nehmersprachen zu einer Erweiterung des lautlichen und grammatikalischen Inventars kommen kann (vgl. z.B. Lindström/Eklund 2009: 1039),

1 Eine ausführlichere Definition findet sich in Wiegand (Fremdwort, in Vorbereitung für das WLWF)

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

133

und somit die Bestimmung des Grads der formalen Integration erschwert wird. Es ist darüber hinaus anzunehmen, dass lexikalische Einheiten, die ausdrucksseitig als Fremdwörter einzuordnen sind, von sehr vielen Sprechern nicht mehr als fremdsprachlich empfunden werden, wenn – bedingt durch die alltägliche Vertrautheit der Sprecher mit dem Referenzobjekt und der damit verbundenen hohen Gebrauchsfrequenz des Fremdworts – dieses zum Grundwortschatz gehört. Die Erstellung der Integrationsprofile ist andererseits im Hinblick auf eine lexikographische Bearbeitung von Fremdwörtern insofern notwendig, als der jeweilige Wörterbuchartikel – in Abhängigkeit von den Zielen des Wörterbuchs – auch Angaben zum ausdrucksseitigen Integrationsgrad enthalten sollte.

3 Die Erfassung der zeitgenössischen Germanismen Neben den allgemeinen, übereinzelsprachlichen Aspekten der zu erörternden Thematik ergeben sich zweifellos jeweils auch spezifische, möglicherweise ausschließlich an die jeweilige Nehmersprache gebundene. Gemäß der oben formulierten Grundthese käme letzteren jedoch eine nachrangige Bedeutung zu, so dass es in unserer Perspektive als folgerichtig betrachtet wird, sich – nicht zuletzt auch aus Kompetenzgründen – auf eine einzige Nehmersprache zu konzentrieren. Die Feststellung Wiegands (2001b: 123), es sei „charakteristisch und aussagekräftig für bestimmte Aspekte der deutschen Sprach- und Kulturgeschichte sowie ihre lexikographische Aufarbeitung, dass aktive Sprachkontaktwörterbücher des Deutschen relativ rar sind“, hat ihre spiegelbildliche Entsprechung im Umstand, dass es keine passiven Kontaktwörterbücher des Italienischen gibt, in denen das Deutsche die alleinige Gebersprache darstellt. Allerdings existiert auch keine lexikologische Monographie zu den Germanismen im Italienischen. Aus diesem Grund konzentrieren wir uns einerseits auf zwei neuere polylaterale, passive Sprachkontaktwörterbücher des Italienischen, Lucarini/Scrofani (1999) und De Mauro/Mancini (2003), sowie andererseits auf das mehrbändige lexikographische Referenzwerk der italienischen Sprache, dem GDU.2 Alle drei haben als Wörterbuchgegenstandsbereich das zeitgenössische Italienisch. Der Typologie Wiegands (2001b) folgend, sind die beiden Kontaktwörterbücher als einsprachig einzustufen, da das Italienische sowohl die lemmaliefernde als auch die zur lexikographischen Beschreibung verwendete Sprache darstellt.3 Den Wörterbuchgegenstand von Lucarini/Scrofani (1999) bilden laut Verfasser fremdsprachliche Wörter und Wendungen, die im heute geschriebenen und gesprochenen Italienischen geläufig sind (Vorspann, S. VII). Das kleinformatige Lexikon, das 313 Seiten umfasst, soll den potentiellen Benutzern das Konsultieren

2 zum GDU vgl. Rovere (2003), Marello (2004). 3 vgl. hierzu auch Mayer/Rovere (2013).

134

Giovanni Rovere

umfangreicher allgemeiner Wörterbücher des Italienischen ersparen (ebd.). Weder zum verwendeten Ausdruck Fremdwort, noch zum Vorgehen bei der Erstellung der Wörterbuchbasis und der Lemmaliste werden Aussagen gemacht. Es wird lediglich darauf hingewiesen, dass fremdsprachliche Wörter und Wendungen aus dem juristischen und dem kirchlich-liturgischen Sprachbereich nicht aufgenommen wurden, da sie im allgemeinen Sprachgebrauch äußerst selten seien. Nach unserer Zählung findet sich bei 151 von ungefähr 6000 Lemmazeichen eine Germanismusidentifizierungsangabe, was einem Anteil der Germanismen am Gesamtlemmabestand von circa 2,5% entspräche. Die Verfasser des zweiten Kontaktwörterbuchs, De Mauro/Mancini (2003), gehen von der Voraussetzung aus, dass Fremdwörter in erhöhtem Maße einerseits Textverstehensprobleme, andererseits Schwierigkeiten bei ihrer Verwendung vor allem hinsichtlich Aussprache, Rechtschreibung und Pluralbildung verursachen. Das Wörterbuch gehört damit von seiner Funktion her zu den Wörterbüchern schwerer Wörter, die bei Rezeptions- oder Produktionsstörungen konsultiert werden. Laut Vorspann (S. III) gelten als Fremdwörter die lexikalischen Einheiten, in denen die italienischsprachigen Sprecher, relativ zum gegenwärtigen Sprachstadium, Bestandteile einer vom Italienischen verschiedenen Sprache erkennen. Nicht hinzugezählt werden demgemäß vollständig integrierte Lehnwörter, wohl aber Pseudoentlehnungen. Die Hauptquelle des Kontaktwörterbuchs ist das GDU in seiner Ausgabe von 1999. Hinzu kommen, laut Vorspann (S. IV), zahlreiche Neologismen, die größtenteils aus Tagesund Wochenzeitungen exzerpiert wurden und vor allem zu den Bereichen Informatik, Wirtschaft, Gastronomie gehören. Das Wörterbuch enthält 11.104 Lemmazeichen (ebd.), von denen 341 als aus dem Deutschen stammend ausgewiesen sind (S. VII). Dies entspricht einem Anteil von rund 3 %. Was den Grad an lexikographischer Abdeckung hinsichtlich zeitgenössischer Germanismen betrifft, müsste dieser in De Mauro/Mancini (2003) am höchsten sein. Betrachtet man die Germanismen, die in Lucarini/Scrofani (1999), aber nicht in De Mauro/Mancini (2003) enthalten sind, erscheint die Sachlage weniger klar. 18 von ihnen sind im GDU gebucht, was dafür spräche, dass – analog zur Beobachtung Wiegands (2001a: 77) zum GWDS – nicht ein Kontaktwörterbuch, sondern ein allgemeines Wörterbuch der Nehmersprache die höchste lexikographische Abdeckung aufweist. Gehen wir zunächst auf die Germanismen in Lucarini/Scrofani (1999) ein, die selbst im GDU in der Ausgabe von 1999 nicht (oder nicht als solche)4 erfasst sind: anstalt in der Bedeutung ‘privatrechtliche Unternehmensform in Liechtensteinʼ, asylanten, bundesbank, hausmusik, hütte, jäger, nicht rauchen, reisebilder, SA, skipass, über alles.5

4 Skipass wird in De Mauro/Mancini (2003) und im GDU irrtümlich als Anglizismus dargestellt. Das Wort ist auch im Englischen ein Germanismus. 5 Die Kleinschreibung der Substantive ist grundsätzlich ein Kriterium für die graphische Integration deutscher Fremdwörter. Der Verzicht auf Belegbeispiele in den Kontaktwörterbüchern und im GDU

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

135

Hausmusik und reisebilder gehören zum bildungssprachlichen Wortschatz, SA zu den historischen Germanismen, asylanten und bundesbank zu den zeitgenössischen Bezeichnungsexotismen. Von dieser Zuordnung abgesehen, löst die Liste wohl eine gewisse Verwunderung aus: Anstalt in der vorliegenden speziellen Bedeutung wird den allermeisten Deutschsprachigen unbekannt sein, so dass man – zumindest aus deren Sicht – kaum annehmen würde, es als ein im Italienischen gebräuchliches Fremdwort verzeichnet zu sehen. Anstelle von nicht rauchen wäre eher, lässt man die geringe Wahrscheinlichkeit des usuellen Gebrauchs solcher Wendungen in der italienischsprachigen Kommunikation einmal außer Acht, rauchen verboten oder aber bitte nicht rauchen zu erwarten. Ähnliches gilt für SA, das man intuitiv kaum als zum gegenwartsbezogenen italienischen Wortschatz gehörend einschätzen dürfte. Dies alles führt zur Vermutung, dass zum einen die Lemmaauswahl durch Willkürlichkeit geprägt oder mitbestimmt ist, und zum andern zwischen Fremdwort und jeweils mittels Bedeutungsparaphrasen erklärtem Zitatwort nicht oder nicht durchgehend unterschieden wird. Beide Annahmen lassen sich nicht direkt überprüfen, wiederum aufgrund fehlender Informationen im Vorspann und aufgrund des Verzichts auf Belegbeispiele im Wörterbuchteil. Eine flüchtige Suche in italienischen Korpora bestätigt immerhin die Plausibilität unserer Vermutungen.6 Jäger und hütte sind in den allermeisten Belegen Zitatwörter, deren kontextuelle Paraphrasen Aufschluss über die jeweilige Bedeutung geben: Bei jäger sind in der Regel die Kampftruppen im Ersten und Zweiten Weltkrieg gemeint, bei hütte die Berghütte. Im Fall von reisebilder ist festzustellen, dass das Wort in italienischen Korpora äußerst selten und meist im Zusammenhang mit dem Werk Heines belegt erscheint.7 Hausmusik ist in zeitgenössischen italienischen Texten sehr selten und wird meist als im Kotext erklärtes Zitatwort verwendet. Anstalt fehlt in seiner fachsprachlichen Bedeutung auch im GWDS. In wirtschafts- und rechtssprachlichen Texten des Italienischen findet sich der Ausdruck als Fremdwort, in nichtfachsprachlichen Zeitungsartikeln erscheint er sehr selten, und dann in der Regel als Zitatwort. Im Zusatzband des GDU von 2007, der Neologismen gewidmet ist und laut Vorspann (S. X) 38 Germanismen enthält, wird SA als „historisch“ markiert aufgenommen, mit „1987“ als Erstbelegdatierungsangabe. Die späte lexikographische Berücksichtigung dürfte damit zusammenhängen, dass traditionsgemäß literarische Werke als Primärquellen bevorzugt werden und Ausdrücke aus der nationalsozialistischen Zeit vermehrt in den entsprechenden Texten der Nachkriegszeit verwendet

lässt allerdings keine eindeutigen Schlüsse zur Aussagekraft der Unterscheidung zwischen Klein- und Großschreibung im Rahmen der Lemmazeichengestaltangabe zu. Im Folgenden wird die im GDU jeweils gewählte Schreibform übernommen. 6 Hier und im Folgenden werden die in den Datenbanken der Universitätsbibliothek Heidelberg enthaltenen Korpora verwendet, vgl. http://www.ub.uni-heidelberg.de/helios/. 7 Im GWDS ist es im Übrigen auch nicht verzeichnet, obwohl es in deutschen Korpora durchaus auch ohne explizite literarische Bezüge verwendet wird.

136

Giovanni Rovere

werden oder zumindest dort belegt erscheinen. Das GDU erfasst das in den italienischen Zeitungskorpora produktive und als bekannt vorausgesetzte Schema „X über alles“ nicht, obwohl es aufgrund seiner affektiven Konnotation gut belegt ist und auch in positiv bewerteten Zusammenhängen eingesetzt wird; vgl. „Inclusione über alles“ (Internazionale, 24.6.2014), in einem Bericht über Erfolge im deutschen Schulsystem bei den Bemühungen um Inklusion.8 Betrachten wir nun die 12 Germanismen, die in Lucarini/Scrofani (1999) und im GDU, nicht aber in De Mauro/Mancini (2003) aufgeführt sind: chellerina, doppler, gauss, gestalt, gotha, hertz, mauser, ohm, siemens, walchiria, wassermann, zeppelin.

Ein bislang unerwähnter Verwendungsbereich tritt in Erscheinung: die fachsprachlichen Germanismen. Das Argument in Lucarini/Scrofani (1999: Vorspann, S. VII), fremdsprachliche Wörter aus dem juristischen und dem kirchlich-liturgischen Sprachbereich seien aus der Lemmakandidatenliste ausgeschlossen worden, da sie im allgemeinen Sprachgebrauch äußerst seltenen vorkommen, würde den Umkehrschluss nahelegen, dass die Termini der Psychologie (gestalt), der Medizin (wassermann, kurz für Wassermann-Test) und der Physik (doppler, gauss, hertz, ohm, siemens) deswegen gebucht sind, weil sie in gemeinsprachlichen Texten als gebräuchlich eingestuft wurden. Die inkonsequente Anwendung des Ausschlusskriteriums, das nicht auf empirisch ermittelte Frequenzwerte beruht, ist offenkundig. Von Interesse sind auch die Germanismen, die in De Mauro/Mancini (2003), aber nicht im GDU erfasst sind, da sie unter Umständen einen indirekten Hinweis zur Selektionspraxis liefern, zumal alle im ersten, den Neologismen gewidmeten Zusatzband des GDU von 2003 aufgenommen sind. Es handelt sich um folgende 13 Lemmazeichen: achtung, berufsverbot, frau, herr, ja, kasko, kasseler, messerschmitt, müller thurgau, rösti, schnörchel [sic], spätzle, TÜV.

Es fällt wiederum schwer, Hypothesen zu den Kriterien der Datenbeschaffung und der Lemmaauswahl aufzustellen. Ein erster Grund dafür sind einmal mehr die nur vagen Angaben im Vorspann des Wörterbuchs, in dem allgemein von Zeitungen und Zeitschriften als Primärquellen die Rede ist (S. IV), ohne Nennung der Namen und

8 Bemerkenswert in diesem Zusammenhang ist, dass stalag, welches in allen drei italienischen Wörterbüchern gebucht ist (ebenso in allgemeinen Wörterbüchern anderer europäischer Sprachen; vgl. auch Schmidt-Radefeldt/Schurig (1997), mit einer lexikographischen Erstbelegangabe und 1994 als Erstdatierungsangabe, im GWDS fehlt. Dort fehlt ebenso das in den deutschen Korpora häufiger belegte Stammwort, welches in italienischen Korpora jedoch – bezeichnenderweise – seltener verwendet wird als das Kurzwort.

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

137

ohne Hinweise auf eine etwaige systematische Sichtung, die zumindest in Bezug zum verwendeten Korpus auch quantitative Feststellungen zuließe. Ein zweiter Grund ist das Fehlen von Belegbeispielen, ein dritter liegt in der sehr heterogenen Zusammensetzung des Lemmabestands. Als Neologismen können zunächst diejenigen Fremdwörter eingestuft werden, deren Referenzobjekt neu ist: Kasko ist als Versicherungstyp und als Bezeichnung seit den Achtzigerjahren in Italien verbreitet, für die Rebsorte Müller-Thurgau und deren Bezeichnung gilt Ähnliches. Als Bezeichnungsexotismus ist berufsverbot im Zusammenhang mit dem Radikalenerlass in Deutschland häufiger, heute jedoch nur noch sehr selten belegt. Keine genaue Erstbelegdatierungsangabe findet sich zu messerschmitt, die historische Bezeichnung für von der Messerschmitt AG hergestellte Jagdflugzeuge. Zu schnörchel ‚ein- und ausfahrbares Rohr zum Ansaugen von Luft für die Maschinen bei Unterwasserfahrt in geringer Tiefe‘ (GWDS, s.v. Schnorchel) ist zunächst am Rande anzumerken, dass der Umlaut wohl irrtümlich gesetzt ist. Zwar existiert diese Variante im Deutschen, nicht aber in den deutschen (und italienischen) Belegen, in denen das Wort die hier zitierte technische Bedeutung hat. Der Terminus findet sich sehr selten als fachliches Zitatwort in Berichten über den Zweiten Weltkrieg.9 Görlach (1999: 374) zählt Schnorchel zur „kleinen Zahl von Alltagswörtern deutscher Herkunft“, die international verbreitet sind. Offenkundig berücksichtigt er die Buchung des Fachworts in den Wörterbüchern verschiedener Sprachen, nicht aber die jeweiligen semantischen Kommentare. Das Kurzwort TÜV ist mit Bezug auf den deutschen TÜV als Bezeichnungsexotismus belegt; mit Bezug auf den in Italien tätigen TÜV Italia hat es den Status eines reinen Markenzeichens. Kasseler, rösti und spätzle sind sehr selten belegte Zitatwörter.10 Herr und Frau, beide meist großgeschrieben, werden typischerweise in Verbindung mit deutschen Eigennamen verwendet, häufig zur Betonung der Authentizität einer im Kotext wiedergegebenen oder zusammengefassten Aussage, gelegentlich zur vagen Anspielung auf nationale Klischees. Deutlich seltener belegt ist ja, das mit pragmatischer, meist scherzhafter Funktion verwendet wird. Nicht gebucht, obwohl wesentlich häufiger belegt, ist nein, das als ausdrucksbetonte Bekräftigung einer Ablehnung (in der Regel aus deutschsprachigem Munde) eingesetzt wird, vergleichbar mit der früher verbreiteten entsprechenden Verwendung von njet. Ähnliches gilt

9 Das GDU enthält in der Ausgabe von 1999 einen identischen Artikel zum Lemmazeichen Schnorchel. Identisch ist auch die Ausspracheangabe, zutreffend aber nur für das betreffende Lemmazeichen, was die Deutung einer irrtümlichen Setzung des Umlauts bei der Lemmazeichengestaltangabe zu „SCHNÖRCHEL“ im De Mauro/Mancini (2003) und im Zusatzband des GDU von 2003 stützt. 10 In der Südschweiz sind rösti und spätzli hingegen allgemein verbreitete Fremdwörter, die nicht erklärt zu werden brauchen. Die Verwendungsbedingungen von Germanismen in italienischsprachigen Regionen, die an deutschsprachige angrenzen, sind in den besprochenen Wörterbüchern nicht erfasst.

138

Giovanni Rovere

für verboten, das allerdings seltener ist. Achtung findet sich meist lediglich als expressiver Bestandteil von Namen und Titeln.11 Das Fehlen von Belegbeispielen verhindert, dass bei der letzten Gruppe von Germanismen deren pragmatische Funktionen erkannt werden. Es entsteht der Eindruck, dass in den Kontaktwörterbüchern zwar, gesamthaft betrachtet, die typischen Verwendungsbereiche der Germanismen erfasst sind,12 im Einzelnen aber auch viel Fragwürdiges und manche Widersprüchlichkeiten festzustellen sind. Weswegen in De Mauro/Mancini (2003) z.B. bundesrat und bundestag aufgeführt sind, die in italienischen Zeitungstexten häufig belegte und in der Regel als bekannt vorausgesetzte bundesbank aber nicht, erschließt sich jedenfalls nicht ohne weiteres.13 Wenn FDP als Lemma angesetzt ist, warum nicht CDU? Wenn die Maßeinheit weber angeführt wird, warum nicht fahrenheit?14 Die Stichhaltigkeit des allgemeinen Eindrucks, die Lemmaauswahl enthalte auch viel Fragwürdiges, soll an einer größeren Menge von Germanismen überprüft werden. Im Nachspann zu De Mauro/Mancini (2003) findet sich eine nach Sprachen geordnete Lemmaliste (S. 893–939) mit den 341 als Germanismen eingestuften und im Wörterbuchteil dargestellten Fremdwörtern. Deutschsprachigen Lesern wird die Aufzählung insofern etwas eigenwillig anmuten, als ihnen eine größere Zahl davon kaum bekannt sein dürfte. Hier ein Auszug: bühl, catadin, daun, DNS, dusack, eloxal, engler, fahlerz, gewere, günz, haff, halberkopf, heckelphon, hornstein, king, knig [sic], litz, maar, mindel, mispickel, mölltal, nem, pommer, rauchwake, saale, scheiner, schappe, seidel, springtanz, tammar, tesching, tschinke, tunker, weistum, wildflysch, zechstein.

Die Aufzählung mag auch deswegen befremden, weil sie – aus dem Blickwinkel der heute sozial relevanten Fachsprachen betrachtet – durch die Aufnahme von peripheren Fachausdrücken geprägt ist. Besonders exotisch wirkt die Buchung von king, das auf die italienische Übersetzung der deutschen Übersetzung von „I king“, dem ältesten Text der klassischen chinesischen Philosophie, zurückgeführt wird. Ein Vergleich zwischen der im Nachspann aufgeführten Lemmaliste und den entsprechenden Einträgen im Wörterbuchteil lässt kleinere Diskrepanzen erkennen: Alpenhorn ist als Variante von alphorn zu betrachten (im Wörterbuchteil als Verweislemma gesetzt), DNS stammt aus dem Englischen (im Wörterbuchteil korrekt dargestellt). Andererseits fehlen in der Liste Ausdrücke, die im Wörterbuchteil lem-

11 vgl. „Achtung, Banditi!“, Titel eines italienischen Kriegsfilms aus dem Jahr 1951, Achtung Babies, Name einer italienischen Rockband. 12 Wohl nicht nur im Italienischen, wie ein Abgleich mit anderen Sprachkontaktwörterbüchern wie Schmidt-Radefeldt/Schurig (1997) nahelegt. 13 Im Zusatzband von 2007 des GDU wird bundesliga aufgenommen, bundesbank fehlt jedoch weiterhin. 14 Fahrenheit ist im GDU dargestellt.

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

139

matisiert sind, wie z.B. diesel, VW und weber.15 Mit anderen Worten: Die Zählung von 341 Germanismen, wie sie von den Lexikographen selbst anhand der Lemmaliste vorgenommen wird, erweist sich als problematisch. Hinsichtlich der Frage, warum Germanismen, die im GDU (1999) als Lemmazeichen angesetzt sind, im Kontaktwörterbuch nicht bearbeitet werden, obwohl dieses auf jenem aufbaut, findet sich ein möglicher Anhaltspunkt im Nachspann von De Mauro/Mancini (2013). Dieses enthält eine zweite, wesentlich längere Wortliste (S. 989–1062), in der, wiederum nach Herkunftssprachen aufgeteilt, die Wörter der italienischen Sprache aufgeführt sind, die – in neuerer Zeit aus anderen Sprachen übernommen – in Aussprache, Schreibung und Morphologie als vollständig integrierte Lehnwörter betrachtet werden. Alle diese Ausdrücke sind (wie bereits erwähnt) im Wörterbuchteil nicht bearbeitet. Dazu gehören, dem Deutschen als Herkunftssprache zugeordnet: almen, blas, feldspato, johannite, kleksografia, landfogto, nix, perovskite, ph, sammetblenda, spring-granata.

Es dürfte m.E. kaum Zweifel daran bestehen, dass Italienischsprachige in diesen Wörtern Komponenten einer fremden Sprache erkennen und sie somit, entsprechend der im Vorspann angeführten Definition (s.o.), als Fremdwörter identifizieren. Weshalb pechblenda (dt. Pechblende) im Wörterbuch als Lemma angesetzt ist, während sammetblenda (dt. Sammetblende) als vollständig integriert gilt, ist nicht auf Anhieb nachvollziehbar. Dank dieses selektiven Vorgehens präsentiert sich das Wörterbuch, trotz der knapp mehr als tausend Seiten Umfang, als einbändiges, kleinformatiges und somit handliches Nachschlagewerk. Für das oben erwähnte Paradox seiner geringeren lexikographischen Abdeckung im Vergleich zum allgemeinen Wörterbuch wäre dies eine erste, einfache Erklärung.

4 Fachsprachliche Germanismen Dass der oben wiedergegebene Auszug aus der Lemmaliste des De Mauro/Mancini (2003) auf den deutschsprachigen Leser befremdlich wirkt, lässt sich auch aufgrund der Tatsache annehmen, dass die meisten angeführten Fachausdrücke in deutschen Wörterbüchern zum zeitgenössischen Wortschatz nicht verzeichnet sind. Dazu gehören auch: blaue erde, glimmlicht, inselberg, gegenschein, kunstwollen, magenstrasse, maitrank, mastzelle, mattmalerei, plansichter, quersprung, reststrahlen, rotpunkt, schalstein, stuppfett, westwerk.

15 Bei der Wiedergabe von Wörtern mit Umlauten sind technische Fehler zu verzeichnen (knig beispielsweise ist in König zu korrigieren).

140

Giovanni Rovere

Dies wiederum führt zur Hypothese, die anhand entsprechender Korpora zu verifizieren wäre, die angeführten Germanismen könnten mehrheitlich in gegenwärtigen deutschen Fachtexten nicht mehr belegt sein. Das Ergebnis einer solchen Untersuchung stellt offenkundig kein Kriterium im Hinblick auf die Lemmaselektion dar, nährt jedoch, wenn die Hypothese zutrifft, den Verdacht, es handle sich um Archaismen. Entscheidend ist, ebenso offenkundig, ob der jeweilige Fachausdruck in zeitgenössischen Texten der Nehmersprache so oft belegt ist, dass von der Zielsetzung des Wörterbuchs her die Lemmatisierung angezeigt ist. Entsprechende systematische Recherchen in italienischsprachigen Korpora wären auch im Hinblick auf die kulturgeschichtlich interessante Thematik der Verteilung der fachsprachlichen Germanismen nach Fachgebieten angezeigt. Lässt sich beispielsweise die hohe Zahl der im Kontaktwörterbuch dargestellten fachsprachlichen Germanismen in naturwissenschaftlichen Disziplinen, wie der Geologie und insbesondere der Petrographie (flysch, gneiss, grauwacke, greisen, hornfels, kieselgur, rauchwake, rauhkalk, schalstein), durch entsprechende Belege in zeitgenössischen italienischen Fachtexten bestätigen? Welchen Produktivitätsgrad weisen fachsprachliche Germanismen auf? Des Weiteren wäre zu untersuchen, welche fachsprachlichen Germanismen auch in nichtfachsprachlichen Texten ohne Begriffserklärung belegt sind. Eine flüchtige Überprüfung der Verwendungsweisen der im Wörterbuch dem philosophischen Wortschatz zugerechneten Germanismen (blas, einfühlung, erlebnis, übermensch, weltanschauung, zeitgeist) ergibt folgendes Bild: Weltanschauung ist gut belegt und meist nicht erklärt; zeitgeist ist gut belegt, ungefähr gleich häufig erklärt wie als bekannt vorausgesetzt; erlebnis, übermensch und einfühlung sind eher selten und meist erklärt; zu blas findet sich kein Beleg. Letzteres Ergebnis ist nicht weiter überraschend, da der Terminus, vom Flamen Jan Baptista van Helmont (1580–1644) neu gebildet,16 heute ungebräuchlich ist. Auffällig ist die häufige Buchung der Namen deutscher Hunderassen: boxer, dachshund, dobermann, kurzhaar, landseer, leonberger, mops, pinscher, riesenschnauzer, rottweiler, schnauzer, zwergschnauzer. Hierbei erhebt sich allerdings die Frage, in welchen Texten und Kotexten die Rassennamen verwendet werden, da neben den deutschen auch manchmal äquivalente italienische Bezeichnungen existieren. Insbesondere dann, wenn letztere in gemeinsprachlichen Texten deutlich häufiger belegt sind, wäre zu vermuten, dass die deutschen Bezeichnungen eher in Fachtexten zu finden sind. So ließe sich vielleicht erklären, weshalb im Wörterbuch dachshund und nicht dackel gebucht ist. Nur auf den ersten Blick überraschend ist die Feststellung, dass in der Lemmaliste deutsche Fremdwörter stehen, die in ihrer ursprünglichen Bedeutung im Deutschen auch oder in erster Linie als gemeinsprach-

16 vgl.: „Stellae […]. Quorum opus habent duplice motu. […]. Utrum autem novo nomine Blas significo“ (Jan Baptista van Helmont, Ortus Medicinae. Amsterdam: Elzevier, 1652, S. 65). Die Zuordnung von blas zu den Germanismen erscheint also aus mehreren Gründen fragwürdig.

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

141

lich eingestuft werden, aber als Germanismen in den italienischen Wörterbüchern in ihrer fachsprachlichen Bedeutung und nur in dieser dargestellt sind. Dies gilt z.B. für: becher (Chemie), faden (Metrologie), graben (Geologie), haken (Geografie), kraft (Papierindustrie), noch (Finanzwesen), stau (Meteorologie), stecher (Waffentechnik), trommel (Mineralogie), ungerade (Physik).

Allgemein bilden fachsprachliche Ausdrücke die Mehrzahl der gebuchten Germanismen. Es bestätigt sich also, was Schmidt-Radefeldt/Schurig (1997: 7) im Vorspann ihres Wörterbuchs schreiben: Ein Fremdwörterbuch ist zu großen Teilen auch ein Fachsprachenwörterbuch.

5 „im Stiffelius auf den Drachenballon steigen“ Die Überschrift dieses Paragraphen spielt auf den Titel des Aufsatzes von Wiegand (2002) an „mit dem Teufel auf dem Höllenmarkt marschieren“. Zwar handelt es sich im vorliegenden Fall nicht um einen Phraseologismus, sondern um eine mehr oder minder kreativ gebildete Wortfolge, doch scheint bei der Durchsicht der oben erwähnten Lemmaliste einiges darauf hinzudeuten, dass auch Kontaktwörterbücher in besonderem Ausmaße Archaismen enthalten, die nicht als solche erkannt und entsprechend gekennzeichnet sind. Zu stiffelius, in De Mauro/Mancini (2003) als Bezeichnung für eine festliche Herrenbekleidung vergangener Tage gebucht, gibt das Wörterbuch als mögliche Etymologie ein gleichlautendes deutsches Wort an, das auf ital. Stiffelio zurückgehen soll, nach dem Titel einer Oper von Verdi. Dieser Deutung entsprechend ist im GDU stiffelius als Verweislemma zu stiffelio gesetzt. Allerdings beruht das Libretto auf der italienischen Übersetzung eines französischen Dramas,17 in der die Hauptfigur, ein fiktiver deutscher Pastor, den Namen Stiffelius trägt, so dass Stiffelio vom deutschen Namen abgeleitet scheint, und nicht umgekehrt. Ungeklärt bleibt, so oder so, die Entwicklung zum Eponym. In unserem Zusammenhang wichtiger ist jedoch die Feststellung, dass es sich um ein Kleidungsstück des 19. Jh. handelt (vgl. GDLI), und die Bezeichnung in zeitgenössischen Texten nur noch als sehr seltenes Zitatwort belegt ist. Der Drachenballon seinerseits, ein Fesselballon, wurde gegen Ende des 19. Jh. in Deutschland entwickelt und zu meteorologischen, im Ersten Weltkrieg zu militärischen Zwecken verwendet. „Durch den Einsatz von deutschen Drachenballonen an der Alpenfront verbreitete sich der Name in Italien. […] Mit der Zeit entstand das Bedürfnis, das deutsche Wort mit der harten

17 « Le Pasteur, ou L’Évangile et le foyer » von Émile Souvestre und Eugène Bourgeois, Paris: Dondey-Dupré, 1849, wurde ins Italienische übersetzt unter dem Titel „Stiffelius“.

142

Giovanni Rovere

Aussprache und mit der unsicheren Schreibung durch ein italienisches zu ersetzen.“ (Heinimann 1946: 38).18

Erwähnt sei in diesem Zusammenhang auch der Terminus engler, in De Mauro/ Mancini (2003) als Maßeinheit für die Messung der Viskosität von Mineralölen gebucht, der heute – einzelsprachenunabhängig – nicht mehr verwendet wird. Die angeführten Beispiele verdeutlichen die Notwendigkeit, in der zeitlichen Markierungsdimension die lexikalischen Einheiten und die entsprechenden Referenzobjekte getrennt zu betrachten; vgl. hierzu den Aufsatz Ludwig (2005). Der Drachenballon und das Kleidungsstück sind als historisch anzuzeigen, ihre Benennungen als veraltet, da sie im gegenwärtigen Sprachstadium nicht mehr verwendet werden. Die kinematische Viskosität als physikalische Größe existiert trivialerweise weiterhin; engler ist hingegen als Maßeinheit veraltet. Zur Zeitmarkierung wird im De Mauro/Mancini (2003) das Prädikat „historisch“ gesetzt, und/oder es werden im semantischen Kommentar explizite Angaben zum Zeitbezug gemacht. Unter den Germanismen, in deren Artikeln mindestens eine der beiden Angaben steht, finden sich manche, die man aus deutscher Sicht intuitiv hinsichtlich ihrer Frequenz im gegenwärtigen Sprachgebrauch wohl als (sehr) selten einschätzen würde. biedermeier, fastnachtsspiel, fraktur, hallenkirche, hansa, hofkammer, hofmeister, hofrat, jugendstil, kommandantur, könig, kronprinz, K.K., k.u.k., kulturkampf, landfriede, landrecht, lebensraum, minnesänger, morgengabe, morgenstern in der Bedeutung ‘Schlagwaffeʼ, reichsrat, reichstag, reichswehr, rentenmark, sachsenspiegel, singspiel, streitaxtkulturen, Sturm und Drang, ur, wehrbund, wehrmacht, weistum, westwerk, vopo, zollverein.

Entscheidend für eine Lemmatisierung von Bezeichnungen historischer Referenzobjekte ist selbstredend wiederum allein ihre Beleglage in zeitgenössischen Texten der Nehmersprache, und zwar unter dem Blickwinkel der Häufigkeit, mit der die Fremdwörter als dem Leser bekannt vorausgesetzt sind. Bezeichnungen, die unter dieser Bedingung regulär verwendet werden, sind als Ausdruck der internationalen Bedeutung des Deutschen als Kultur- und Wissenschaftssprache zu deuten. Finden sich hingegen keine derartigen Belege mehr, besteht der Verdacht, dass der Germanismus als toter lexikalischer Archaismus (sensu Wiegand 2002) zu gelten hat.19

18 Varianten sind (u.a.): dracken(-ballon), draken(-ballon); vgl. Heinimann (1946: 39). Die Lehnübersetzung pallone drago, auch verkürzt zu drago, setzte sich gegenüber pallone (a) cervo volante durch; vgl. Heinimann (1946: 38). 19 Ob er trotzdem als Lemmazeichen zu bearbeiten ist, hängt von den Zielsetzungen des Wörterbuchs ab; vgl. die positiven Gründe in Schmidt-Radefeldt/Schurig (1997: Vorspann S. 9).

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

143

6 Neologismen Wie bereits in 3. erwähnt, enthält der Zusatzband des GDU von 2007, gemäß Vorspann (S. X), 38 neue deutsche Fremdwörter. Ein Abgleich mit der CD-ROM des ersten Zusatzbandes von 2003 ergibt folgende Lemmaliste: ablaut, angst, appenzeller, asylant (mit asilante als Verweislemma), aufklärung, Bauhaus, bildung, bretzel (mit brezel und prezel als Verweislemmata), bundesliga, dasein (mit da-sein als Verweislemma), doppelgänger (mit doppelganger als Verweislemma), ersatz, gestalttherapie, hanse (als Verweislemma zu hansa), heimat, jäger, johannisberg, kulturkritik, liptauer, mischling, MSR, ossi, ostalgie (mit ostalgia als Verweislemma), raus, SA, schadenfreude, schmarren, schnitzel (Verweislemma zu wiener schnitzel), schützen, slivoviza (Verweislemma zu slivoviz), stube, torball, verboten, völkisch, wessie, wiener schnitzel, witz, wunderkammer.20

Aus der hier einzig relevanten Perspektive der Nehmersprache besteht evidenterweise – wie ebenfalls (unter 3.) schon erwähnt – kein grundsätzlicher Widerspruch zwischen der Einstufung des Fremdworts als Neologismus und einer etwaigen Zeitmarkierung seines Bezugsobjekts, sofern die Beleglage einen relevanten Abstand zwischen der historischen Zeitspanne, in der ein gegebenes Referenzobjekt existiert, und der Verbreitung des entsprechenden Fremdworts in zeitgenössischen zielsprachlichen Texten erkennen lässt. Allerdings ist der Hinweis im Vorspann (S. IX) zu bedenken, dass auch Fremdwörter aufgenommen wurden, die in der Ausgabe von 1999 und im Zusatzband von 2003 fehlen, obwohl sie vor 1999 in der Nehmersprache belegt erscheinen. Nimmt man für die Bestimmung einer lexikalischen Einheit als Neologismus ein Vierteljahrhundert als Maximalwert für den Zeitabstand zwischen Erstbelegdatierungsangabe und dem Erscheinungsjahr des Wörterbuchs, hier der ersten Ausgabe des GDU (1999), stellen etwa ein Drittel der aufgeführten Lemmazeichen keine Neologismen dar. Es sind dies: angst, aufklärung, bauhaus, doppelgänger, ersatz, johannisberg, liptauer, raus, schadenfreude, verboten, witz, wunderkammer. Dadurch erhebt sich jedoch abermals die Frage nach den Bedingungen der Datenbeschaffung, ohne dass sich auf der Grundlage der angeführten Lemmaliste neue Erkenntnisse aufdrängten.21 Bereits weiter oben vorgetragene Beobachtungen werden hingegen bestätigt. Dies gilt in erster Linie für die hohe Zahl an fachsprachlichen Germanismen und die Bedeutung des Deutschen als Kultursprache, vgl. Bauhaus, bildung, kulturkritik, wunderkammer. Zu den philosophischen Germanismen gehört auch angst, dem das Wörterbuch die Bedeutung von ‚Existenzangst‘ zuweist. Doppelgänger und witz sind fachsprachlich markiert und der Psychologie zugeordnet. Wohl

20 Als formal integrierte Lehnwörter deutscher Herkunft gelten offenbar crenno (Verweislemma zu cren), liederismo, und urningo. 21 Eine Namensliste der zitierten Quellen findet sich im Vor- oder Nachspann aller Ausgaben des GDU. Die Erstbelegdatierungsangaben enthalten jedoch kein Quellenexzerpt, sondern höchstens eine allgemeine Quellenangabe, wie z.B. den Namen eines Autors oder einer Zeitschrift.

144

Giovanni Rovere

infolge der Globalisierung und des internationalen Tourismus nimmt die Zahl der gebuchten deutschsprachigen Bezeichnungen für Speisen und Getränke zu: appenzeller, brezel, johannisberg, liptauer, wiener schnitzel. Sie ergänzen die bereits früher im GDU lemmatisierten blauburgunder, frankfurter, kasseler, kipfel, kirsch, knödel, kugelhupf, kümmel (‚Brandwein mit Kümmel‘), pumpernickel, quark, sacher, silvaner u. ä. Hierzu gehören auch cren, slivoviz und gulasch, da in diesen Fällen das Deutsche die Vermittlersprache darstellt. Ein Hinweis auf die zunehmende Bedeutung des Deutschen in der Entwicklung fachsprachlicher Termini der modernen Automobiltechnik könnte die Buchung von MSR (Abkürzung für Motor Schleppmoment Regelung) darstellen, das nun zu ABS und zu DIN, belegt in Verbindungen mit Maßeinheiten wie z.B. CV-DIN, hinzutritt.

7 Problemfelder Die Feststellung, wie schwierig es sei, „Fremdwort“ zufriedenstellend zu definieren, gehört zu den Eröffnungstopoi der einschlägigen lexikologischen und lexikographischen Arbeiten. Die Schwierigkeiten bleiben auch dann bestehen, wenn man Fremdwörter als ein Ergebnis von Sprachkontakten auffasst und folgerichtig die Akteure des Sprachkontakts in den Vordergrund rückt. Zwar beinhaltet die Einführung der Instanz des Sprechers, in expliziter Form in Eisenberg (2011) und De Mauro/Mancini (2003), einen Perspektivenwechsel, der – wie schon bei von Polenz (s.o.) – den Sprachgebrauch als die für die Erfassung und Bearbeitung von Fremdwörtern relevante Ebene ansetzt. Während traditionellerweise der Vergleich zwischen der Bedeutung des gebersprachlichen Ausgangsworts und der Bedeutung, die es in der Nehmersprache annimmt, vorwiegend im Mittelpunkt steht, richtet sich nun der Blick in verstärktem Maße auf die Entwicklungen in der Nehmersprache. Dies erweist sich bei jenen lexikalischen Einheiten von besonderem Interesse, bei denen die Sprecher der Nehmersprache, von Heterostereotypen geleitet, Fremdwörter mit affektiver Konnotation verwenden und Vorstellungen, die sie von den Sprechern der Gebersprache und ihrer Kultur haben, auf die Fremdwörter projizieren. Der Perspektivenwechsel hat auch zur Folge, dass der Stellenwert, der in Einführungen zu Kontaktwörterbüchern den sogenannten „falschen Freunden“ eingeräumt wird, neu beurteilt wird. Da für die Verwendung eines Fremdworts dessen gegenwärtiges semantisches Verhältnis zu den anderen lexikalischen Einheiten des gleichen Wortfelds in der Nehmersprache entscheidend ist, erweist sich die Bezeichnung „Falsche Freunde“ im vorliegenden Zusammenhang einzig im Hinblick auf die spezifische Situation der Übersetzung eines Textes aus einer Kontaktsprache in die andere zutreffend für Ausdrücke, die in der Ausgangs- und Zielsprache gleich oder ähnlich lauten. Ähnliches gilt für das Phänomen der Pseudoentlehnung, das in erster Linie für den Sprachwissenschaftler relevant ist, in deutlich geringerem Maße oder gar nicht für die Sprecher. Des Weiteren erscheint die Vagheit der gängigen Definitionen von Bezeichnungsexotismus, wie z.B.

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

145

im Vorspann zum DFWB „fremde Wörter für fremde Sachen, Begriffe u. ä.“ (S. 24), aufgrund des Perspektivenwechsels in einem neuen Licht. Zum einen existieren Exotismen, mittels derer Entitäten bezeichnet werden, die allein in der Kultur der Gebersprache vorkommen, zum anderen fremdsprachliche Ausdrücke, die sowohl Bezeichnungsexotismen darstellen als auch in der Nehmersprache einen Bedeutungswandel infolge der Veränderungen des Referenzobjekts durchlaufen, wie dies typischerweise bei Speisen festzustellen ist; vgl. z.B. Pizza im Deutschen oder im Amerikanischen. Letztere sind oft durch Globalisierungstendenzen und gegenläufige, die Integration fördernde Lokalisierungen geprägt, wodurch die entsprechenden Gegenstände oder Sachverhalte, aber auch deren Bezeichnungen schließlich zur unmittelbaren Erfahrungswelt des Sprechers gehören. Indessen ist die Kategorie des Sprechers ihrerseits im Hinblick auf die Definition des Fremdworts nicht so unproblematisch wie die Benennungen „Durchschnittssprecher“ oder „Normalsprecher“ bei Eisenberg (2011: 15, 29), welche die soziologischen Unterschiede innerhalb einer Sprachgemeinschaft neutralisieren, zu suggerieren scheinen. Keinesfalls kann die Kategorie als Konstante bei der Erfassung und der Bearbeitung von Fremdwörtern angesetzt werden, da insbesondere Bildungsgrad der Sprecher sowie Häufigkeit und Intensität ihrer Sprachkontakte einen weiten Variationsspielraum bei Identifizierung, Verwendung und Verstehen von Fremdwörtern bedingen. So sehr die Bedeutung laienlinguistischer Kompetenzen nicht unterschätzt werden darf, sind Idealisierungen, wie sie in den folgenden Beispielen zu vermuten sind, kritisch zu sehen: „Jeder Sprecher […] weiß auch, wie schwierig es ist, sie [scil. die Klassifikation der Wortarten] zu begründen.“ (Eisenberg 2011: 17). Im GDU seinerseits wird in der Ausgabe von 1999 z.B. kitsch noch als Fremdwort identifiziert, in der CD-ROM von 2007 jedoch nicht mehr, da nun zusätzlich zwei Ableitungen (kitschizzante und kitscheria) gebucht werden, und somit der Germanismus als produktiv gilt. Die beiden Ableitungen sind allerdings im Sprachgebrauch kaum belegt, im Wörterbuch selbst als selten markiert, so dass es unwahrscheinlich ist, dass die Sprecher das seinerseits relativ seltene kitsch nun aus dem Wissen über die neuen Wortbildungen heraus nicht mehr als fremdsprachlich empfinden.22 Die implizite Identifizierung des „Normalsprechers“ mit dem linguistisch gebildeten Sprecher steht in diametralem Gegensatz zum Begriff der sprachsoziologischen Integration bei von Polenz (2009: 155): „‚Fremdwort‘ ist in der Sprachwissenschaft nur dann brauchbar, wenn jeweils die Frage beantwortet wird: Wem ist das Wort ‚fremd‘? Hier sind nur sprachsoziologische Antworten zulässig“.

22 Lied hingegen gilt in der Ausgabe von 2007 weiterhin als deutsches Fremdwort, obwohl mehrere Ableitungen gebucht werden; vgl. z.B. Anm. 20.

146

Giovanni Rovere

Aus dieser Fragestellung erwächst ein neues Forschungsfeld mit dem Ziel, die Ausprägung der Abhängigkeit im Gebrauch und Verstehen der Fremdwörter von gruppenspezifischen Merkmalen zu erfassen.23 Entsprechende Ergebnisse würden es der Sprachkontaktlexikographie ermöglichen, den Grad an soziolinguistischer Integration von Fremdwörtern darzustellen – ein Informationsangebot, das hinsichtlich der Verwendung von Fremdwörtern in mündlicher und schriftlicher Kommunikation eigentlich zentral ist, wie Aussprachevarianten mit unterschiedlichen soziolinguistischen Implikationen zeigen. Es ist aber evident, dass die empirische Erforschung dieser Dimension methodisch so aufwendig ist, dass eine systematische Erfassung der Daten, die für eine aussagekräftige lexikographische Darstellung notwendig sind, nicht ohne weiteres zu bewerkstelligen sein dürfte. Ein zweites Problemfeld ergibt sich aus der bereits erwähnten Praxis (siehe Anm. 21) in De Mauro/Mancini (2003) und im GDU, die Erstbelegdatierungsangabe im besten Fall mit einer Belegtextangabe zu ergänzen, aber nicht mit dem entsprechenden Textausschnitt. Auf dieser Grundlage ist offenkundig keine Aussage möglich, ob damit auch tatsächlich das erste Belegdatum für das betreffende Fremdwort angezeigt ist. Diese Feststellung ist keine Anspielung auf die beliebte Jagd nach einer früheren Datierung auf der Grundlage von nicht zur Wörterbuchbasis gehörenden Quellen. Es geht vielmehr um die Frage nach dem Verbreitungsgrad der lexikalischen Einheit zum Zeitpunkt der Erstdatierung – vornehmlich nach ihrem Status im Textausschnitt, zu dem das Wörterbuch die Datierung angibt.24 Denn es ist davon auszugehen, dass eine anderssprachige lexikalische Einheit, die neu in der (schriftlichen) Kommunikation verwendet wird, üblicherweise zunächst als Zitatwort im Text eingesetzt wird. Zitatwörter weisen im Sprachgebrauch in der Regel folgende Merkmale auf: Sie behalten ihre originalsprachliche Bedeutung, im Allgemeinen auch die Form; ihr Verständnis ist im Kotext sichergestellt, vorwiegend durch eine semantische Paraphrase; sie sind meistens metalinguistisch hervorgehoben. Unter diesen Bedingungen liegt kein Entlehnungsprozess vor. Kontaktwörterbücher sollten, ihrem Wörterbuchgegenstand entsprechend, Textausschnitte mit Belegtextangaben zum erstmaligen Gebrauch von Wörtern der Ursprungssprache angeben, wenn sie als zum Wortschatz der Nehmersprache gehörend verwendet werden, also lexikalisiert sind. Solche Belege sind hauptsächlich daran zu erkennen, dass eine wie auch immer geartete Bedeutungserklärung nicht mehr als grundsätzlich notwendig betrachtet wird. Damit ist ein drittes Problemfeld angesprochen, und zwar das der Wörterbuchbasis, die für die Erstellung eines Sprachkontaktwörterbuchs notwendig ist, um empirisch gesicherte Angaben zum Sprachgebrauch der lemmatisierten Fremdwörter anzubieten. Die Kernfrage lautet: Wie ist der gewohnheitsmäßige Gebrauch (vgl. von

23 Dies gilt nicht nur, aber in besonderem Maße für Kontaktwörterbücher, die als Wörterbücher schwerer Wörter konzipiert sind. 24 Hierbei ist zu bedenken, dass die primären Quellen in der Regel aus schriftlichen Texten bestehen.

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

147

Polenz, s.o.) eines Fremdworts, das nicht zum Grundwortschatz der Nehmersprache gehört, zu ermitteln? Die entscheidenden Aussagen hierzu lassen sich in zwei einfachen Sätzen zusammenfassen: Erforderlich sind umfangreiche elektronische Korpora, insbesondere fachsprachliche. Solche Textsammlungen stehen zurzeit nicht in dem Maße zur Verfügung, dass durchgehend belegbare Ergebnisse angestrebt werden können. Diese sind jedoch nötig, um die Vermutung zu erhärten, viele der in den zitierten Kontaktwörterbüchern als Germanismen gebuchten lexikalischen Einheiten seien in Wirklichkeit keine Fremd-, sondern Zitatwörter. Werden aber Zitatwörter von Fremdwörtern nicht unterschieden, lässt sich jede Okkurrenz eines deutschen Wortes in einem anderssprachigen Text als Germanismus deuten. Auch deswegen gilt, dass quantitative Angaben zu Fremdwörtern (wie z.B. bei Braun 1997), die sich auf Buchungen in Kontaktwörterbüchern und allgemeinen Wörterbüchern der Nehmersprache stützen, eine Genauigkeit vortäuschen, die nicht haltbar ist. Die fehlende Unterscheidung zwischen Zitat- und Fremdwort erlaubt andererseits, Thesen zu vertreten, die, zumindest unterschwellig, die Ebene des nationalen Selbstwertgefühls ansprechen. Dieser Aspekt sei an einem Fallbeispiel kurz beleuchtet. Ausgangspunkt sind folgende Feststellungen, die den zeitlichen Rahmen eines Entlehnungsprozesses abzustecken scheinen: „In diesen Tagen hält das deutsche Wort Energiewende Einzug in die englische Sprache, wie vor langer Zeit angst und sauerkraut.“ (Die Zeit, 15.11.2012); „Nach blitzkrieg und angst fand so auch die energiewende Einzug in den englischen Sprachraum.“ (Die Zeit, 18.12.2014).

Die Sichtung einer Auswahl von rund hundert Belegstellen aus englischsprachigen Pressetexten der letzten vier Jahre vermittelt ein anderes Bild. 1. 2.

3.

4.

5. 6.

“Like the UAE, Germany has embarked on an energy transition called Energiewende” in the German language.” (The National (Abu Dhabi), 11.6.2015); “The centerpiece of the German ‘Energiewende’, or energy transformation, was an extremely generous ‘feed-in tariff’ that made it a no-brainer for Germans to install solar power (or wind) at home and receive a predictable high price for the energy generated off their own rooftops.” (The New York Times, 6.5.2015); “[…] Germany’s ‘Energiewende’ is a well-documented case in point. Electricity prices there are the highest in Europe because of the move to renewables.” (Cape Times/South Africa, 16.4.2015); “Germany, under what has become known as ‘Energiewende’, or energy rewind, has undertaken Europe’s most aggressive – and, some say, risky – program to reduce fossil fuel use.” (The Age/Melbourne, 21.11.2014); “Ms. Merkel barely touched on Europe and made no mention of the biggest policy initiative of her second term – the Energiewende, or energy shift.” (The New York Times, 20.8.2014); “Germany’s so called ‘Energiewende’ aims to raise the share of electricity from renewables to 50pc by 2030 and 80pc by the midcentury.” (The Daily Telegraph, 25.5.2014);

148

Giovanni Rovere

7.

8.

“Germany is undertaking the Energiewende, or a transition to sustainable energy – a remarkable effort to meet the country’s entire energy demand with renewable energy, especially solar and wind power.” (The Daily Star/Lebanon, 9.4.2014); “Angela Merkel’s most ambitious domestic project: Germany’s energiewende, or energy revolution, under which the country is shutting down its nuclear power reactors, discouraging coal-fired plants and encouraging a near-complete shift to renewable energy sources.” (The International Herald Tribune, 19.9.2013).

Energiewende ist offenbar in englischsprachigen Pressetexten ein weltweit als Bezeichnungsexotismus verwendetes Zitatwort.25 Es ist graphisch meist nicht-integriert, wird häufig metalinguistisch hervorgehoben, und ist immer im Kotext erklärt – in erster Linie mittels Bedeutungsparaphrasen (so unterschiedlich diese auch sein mögen).26 Nun wäre allerdings denkbar, dass Energiewende in Fachtexten als Fremdwort verwendet wird, gegebenenfalls auch ohne Bezug zur deutschen Energiepolitik. Die Ergebnisse einer stichprobenartigen Überprüfung in fach- und populärwissenschaftlichen Zeitschriften scheinen diese Hypothese jedoch nicht zu unterstützen. Das Wort wird (zumindest in den gesammelten Belegen) nicht als bekannt vorausgesetzt; es behält den Status eines Bezeichnungsexotismus, und die Bedeutungsparaphrasen unterscheiden sich kaum von den oben zitierten: 1. 2. 3. 4. 5.

„the shift from coal and nuclear to renewables“ (Modern Power System, 1.5.2015); „the transition to a green economy“ (Business Monitor International, Energy & Utilities Infrastructure, 1.4.2015); „energy turnaround“ (Electricity Journal, Jan./Feb. 2015); „the strategy designed to transform Germany’s energy sector by phasing out nuclear power by 2022 and promoting renewables“ (World Gas Intelligence, 10.12.2014); „energy turning point“ (The Christian Science Monitor, 26.4.2014).

Des Weiteren sind elektronische Textkorpora unverzichtbar, wenn das Ziel darin besteht, bei den ausreichend belegten gemeinsprachlichen Germanismen Angaben zu Frequenzklasse und zu textsortentypischer Verwendung zu entwickeln. Das Gleiche gilt, wenn es darum geht, Germanismen zu erfassen, die bislang lexikographisch nicht bearbeitet worden sind. Auch zu diesem vierten Problemfeld lassen sich einfache Aussagen formulieren: Derartige Untersuchungen sind durchzuführen, da Grund zur Annahme besteht, dass vor allem fachsprachliche Germanismen lexikographisch noch nicht erfasst worden sind; sie gestalten sich jedoch als äußerst aufwendig, da z.B. aus Textkorpora gewonnene finalalphabetische Wortlisten nur bedingt ein gezieltes Suchen gestatten.

25 Zitatwörter haben mit den Xenismen, wie sie von Jung (1999: 55f.) definiert werden, gemeinsam, dass der „Verweischarakter auf eine andere Kultur kommunikativ bedeutsam ist“. 26 Bei Überschriften ist zu bedenken, dass aufgrund ihrer pragmatischen Zwecke Zitatwörter in der Regel ohne im unmittelbaren Kotext der Überschrift angeführte Erklärungen verwendet werden. Aus diesem Grund sind Überschriften aus der Belegtextsammlung ausgeschlossen worden.

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

149

8 Sprachpolitische Aspekte Aktive Sprachkontaktwörterbücher, die darum bemüht sind, die internationale Bedeutung der Gebersprache zu unterstreichen, streben eine Maximierung der Lemmakandidatenliste an. Dieses Bestreben wird durch definitorische Unbestimmtheiten der Grundbegriffe und methodische Entscheidungen bei der Datenerhebung erleichtert. Werner Wolski (Wolski: Artikel Germanismus; erscheint im 2. Bd. des WLWF) erinnert beispielsweise an die Aufrufe verschiedener Organisationen, in allen Ländern deutsche Lehnwörter zu sammeln. Auf diese Weise lassen sich leicht über 6000 Germanismen zusammentragen; vgl. auch Limbach (2007: 7). Die Dimension des damit verbundenen Selbstwertgefühls wird direkt angesprochen: „Wir können ruhig auch ein wenig stolz darauf sein, dass andere Sprachen unsere Wörter übernehmen“ (ebd.). Gleiches gilt für die traditionellen völkerpsychologischen Vorstellungen, wonach „wir mit unserer deutschen Sprache wahre Meister der Innerlichkeit sind: Wörter wie Heimat, Geborgenheit, Gemütlichkeit oder Sehnsucht finden sich in vielen anderen Sprachen wieder und eröffnen den Sprechern dieser Sprachen die Möglichkeit, ihre Gefühle zu benennen“ (ebd.). Dass nun Fingerspitzengefühl wegen seiner „vorzüglichen Aussagekraft von vielen Sprachen entliehen worden“ sei (ebd.), erscheint eher zweifelhaft. Schon der banale Umstand, dass die Aussprache und die Länge des Wortes den meisten Nichtdeutschsprachigen Schwierigkeiten bereiten dürften, spricht dagegen. Allerdings wird auch in passiven Sprachkontaktwörterbüchern eine Maximierung der Lemmakandidatenliste angestrebt, wenn puristische Ziele verfolgt werden und deswegen die Gebersprache als Bedrohung für die Nehmersprache dargestellt werden soll. Die hier besprochenen Wörterbücher zeigen nun, dass die Anwendung von sehr weitreichenden Lemmatisierungskriterien, die beispielsweise die Aufnahme von Eponymen, Markennamen und Abkürzungen beinhalten, einen dritten, bei lexikographischen Arbeiten häufig anzutreffenden Grund haben kann: das Anliegen nämlich, die Wahl des Wörterbuchgegenstandsbereichs als ertragreich zu rechtfertigen. Der gesellschaftlich und medial verbreitete puristische Diskurs kann auch zur Folge haben, dass in den Umtexten nichtpuristischer Kontaktwörterbücher die geringe statistische Relevanz der Fremdwörter im Verhältnis zum Gesamtwortschatz betont wird; vgl. De Mauro/Mancini (2003: Vorspann S. IV). Dem Argument, die Ausstrahlungskraft der Gebersprache gefährde gar das Überleben der Nehmersprache, wird also mit dem Hinweis auf den Status des Lemmabestands als relativer Größe entgegengetreten. Diese letztlich defensive Position steht unverkennbar im Gegensatz zur Auffassung von der Entlehnung als einem zentralen Mittel der Bereicherung der entlehnenden Sprache (vgl. Wolski in dem Artikel Entlehnung; erscheint im 2. Band des WLWF).

150

Giovanni Rovere

9 Literatur Ich bedanke mich bei Maurice Mayer für seine wertvollen Anregungen und die kritische Lektüre.

9.1 Monographien und Aufsätze Braun, Peter (1997): Germanismen im heutigen Italienisch. In: Muttersprache 107, 1–10. Eisenberg, Peter (2011): Das Fremdwort im Deutschen. Berlin. New York: de Gruyter. Görlach, Manfred (1999): Überlegungen zu einem internationalen Wörterbuch der Germanismen. In: Beiträge zur Geschichte der deutschen Sprache und Literatur 121/3, 359–378. Heinimann, Siegfried (1946): Wort- und Bedeutungsentlehnung durch die italienische Tagespresse im Ersten Weltkrieg (1914–1919). Genève. Erlenbach-Zürich: Librairie E. Droz/Eugen Rentsch. Jung, Matthias (1999): Sprache als Gegenstand kultureller Entlehnung: Germanismen im modernen französischen Sprachgebrauch. In: Kulturelle und sprachliche Entlehnung: Die Assimilierung des Fremden. Hrsg. v. Bierbach, Mechtild/Gemmingen, Barbara von. Bonn: Romanistischer Verlag, 39–59. Limbach, Jutta (2007) (Hrsg.): Ausgewanderte Wörter. Ismaning: Hueber. Lindström, Anders/Eklund, Robert (2009): Cross-lingual influence: The integration of foreign items. In: Corpus Linguistics. An International Handbook. Vol. 2. Ed. by Lüdeling, Anke/Kytö, Merja. Berlin. New York: de Gruyter, 1024–1043. Ludwig, Klaus-Dieter (2005): Archaismen im GWDS. In: Untersuchungen zur kommerziellen Lexikographie der deutschen Gegenwartssprache II. Duden. Das große Wörterbuch der deutschen Sprache in zehn Bänden. Print- und CD-ROM-Version. Hrsg. von Herbert Ernst Wiegand. Tübingen: Niemeyer, 261–275. Marello, Carla (2004): Lexicography in Italy: specific themes and trends. In: International Journal of Lexicography 17/4, 349–356. Mayer, Maurice/Rovere, Giovanni (2013): Dictionary of language contact. In: Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Special Focus on Computational Lexicography. Ed. by Rufus Gouws et al. Berlin. New York: de Gruyter, 393–400. Polenz, Peter von (2000): Deutsche Sprachgeschichte vom Spätmittelalter bis zur Gegenwart. Bd. 1. Einführung Grundbegriffe 14. bis 16. Jahrhundert. 2. überarb. u. erg. Aufl. Berlin. New York: de Gruyter. Polenz, Peter von (2009): Geschichte der deutschen Sprache. 10. Aufl. Berlin. New York: de Gruyter. Rovere, Giovanni (2003): Das GWDS und der Grande Dizionario Italiano dell’ Uso (GDU). In: Untersuchungen zur kommerziellen Lexikographie der deutschen Gegenwartssprache I. Duden. Das große Wörterbuch der deutschen Sprache in zehn Bänden. Print- und CD-ROM- Version. Hrsg. von Herbert Ernst Wiegand. Tübingen: Niemeyer, 61–80. Wiegand, Herbert Ernst (2001a): Fremdwörterbücher und Sprachwirklichkeit. In: Neues und Fremdes im deutschen Wortschatz. Aktueller lexikalischer Wandel. Hrsg. von Gerhard Stickel. Berlin. New York: de Gruyter, 59–88. Wiegand, Herbert Ernst (2001b): Sprachkontaktwörterbücher. Typen, Funktionen, Strukturen. In: Theoretische und praktische Probleme der Lexikographie. Hrsg. von Birgit Igla, Pavel Petkov, und Herbert Ernst Wiegand. Hildesheim. New York: Olms, 115–224. Wiegand, Herbert Ernst (2002): „mit dem Teufel auf dem Höllenmarkt marschieren“. Zweisprachige Wörterbücher mit Deutsch als Pflegestätten deutscher Archaismen? In: Archaismen, Archaisie-

Zur lexikographischen Darstellung der zeitgenössischen Germanismen

151

rungsprozesse, Sprachdynamik. Klaus-Dieter Ludwig zum 65. Geburtstag. Hrsg. von Undine Kramer. Frankfurt a.M. [etc.]: Peter Lang, 137–155. Wiegand, Herbert Ernst: Fremdwort. Erscheint in WLWF, Bd. 2 [in Vorbereitung]. Wolski, Werner: Entlehnung. Erscheint in WLWF, Bd. 2 [in Vorbereitung]. Wolski, Werner: Germanismus. Erscheint in WLWF, Bd. 2 [in Vorbereitung].

9.2 Wörterbücher De Mauro/Mancini (2003) = Parole straniere nella lingua italiana. A cura di De Mauro, Tullio /Mancini, Marco. Ediz. aggiornata. Milano: Garzanti. DFWB = Deutsches Fremdwörterbuch. Hrsg. v. Schulz, Hans/Basler, Otto/Strauß, Gerhard. 2. Aufl., völlig neu erarbeitet im Institut für Deutsche Sprache. Berlin/New York: de Gruyter. GDLI = Grande Dizionario della Lingua Italiana. A cura di Salvatore Battaglia, Torino: Utet, 21 voll., 1961–2002. GDU = Grande dizionario italiano dell’uso. A cura di De Mauro, Tullio. Torino: Utet, 8 voll., 1999–2007, con CD-ROM. GWDS = Duden. Das große Wörterbuch der deutschen Sprache. 4. Aufl. Mannheim: Duden-Verlag, CD-ROM, 2012. Lucarini/Scrofani (1999) = Dizionario delle parole straniere in uso nella lingua italiana. A cura di Lucarini, Achille / Scrofani, Francesca. Roma: Editori riuniti. Schmidt-Radefeldt/Schurig (1997) = Schmidt-Radefeldt, Jürgen / Schurig, Dorothea, Dicionário dos Anglicismos e Germanismos na Língua Portuguesa. Frankfurt am Main: TFM. WLWF = Wörterbuch zur Lexikographie und Wörterbuchforschung. Dictionary of Lexicography and Dictionary Research. Hrsg. v. Wiegand, Herbert Ernst et al. Berlin/New York: de Gruyter, Bd. 1, A-C, 2010. [Bd. 2 in Vorbereitung].

Lexikographische Konzepte: übergreifende Fragestellungen – gestern und heute

Henning Bergenholtz

Eine Korpusanalyse ist eine überflüssige Zeremonie Abstract: The title of this paper does not reflect my own opinion. The title is from a paper by Isa Itkonen. The fight between the position expressed by these quotations and corpus makers was a main topic in the second part of the 1970s. The first book or one of the first books on the construction and analysis of text corpora edited by Henning Bergenholtz and Burkhard Schaeder published in Europe is from 1979, unfortunately with a German title, but with many contributions in English, e.g. by Nelson W. Francis, Stig Johansson, Randolph Quirk and Jan Svartvik. Today, you do not have to fight for making and using corpora. On the contrary, there is a need for discussing the limitations of the use of corpora. As a lexicographer, I will discuss this problem based on cases such as grammar and collocation items where we definitely cannot get trustful and helpful dictionary articles. But we do not need corpus analysis for all kinds of lexicographic work, e.g. not for the construction of meaning items for some kinds of specialized dictionaries. And we do not need a corpus for the lemma selection in other kinds of specialized dictionaries. But also for general language dictionaries, especially learner’s dictionaries, the need for explicit frequency items is doubtful if the dictionaries are made as tools designed to help the case of text reception or text production. Keywords: theoretical lexicography, practical lexicography, corpus, empirical basis Schlagwörter: theoretische Lexikographie, praktische Lexikographie, Korpus, empirische Basis

1 So etwas wie eine theoretische Lexikographie gibt es nicht, und wird es nie geben Man mag gegen die folgende Gegenüberstellung einwenden, dass man einen wesentlichen Beitrag zur theoretischen Lexikographie nicht mit einem Beitrag zur praktischen Lexikographie, der kaum das Niveau einer Vorlesung für Erstsemestler erreicht, vergleichen sollte. Der Einwand ist korrekt. Der Vergleich wird dennoch gemacht, da es sich um eine prinzipielle Problemstellung handelt, wo das Niedrigniveau-Argu-

Henning Bergenholtz: Centre for Lexicography, School of Business and Social Sciences, Aarhus University, Jens Chr. Skous Vej 4, 8000 Århus V (Denmark), email: [email protected]

156

Henning Bergenholtz

ment von international anerkannten Lexikographen vorgenommen wird. In großen Teilen der englischsprachigen Lexikographie lehnt man die Annahme ab, dass Lexikographie eine theoretische Disziplin ist. Es sei, so Atkins/Rundell (2008: 4), eine praktische Disziplin, in der man bestimmten Methoden folgen sollte, aber eine Theorie der Lexikographie gebe es nicht. Noch weiter geht Bejoint (2010: 381), der nicht nur die heutige Existenz von lexikographischen Theorien verneint; es wird sie nie geben, meint er: ”I simply do not believe that there exists a theory of lexicography, and I very much doubt that there can be one.“ Unserer Jubilar, Herbert Ernst Wiegand, soll somit ein Werk über etwas nicht Existierendes in seinem Werk mit dem Untertitel „zur Theorie … der Lexikographie“ geschrieben haben. Wiegand (1998) kann somit nicht mal als Science Fiction gelten, wenn es nach diesen Lexikographen gehen soll. Lexikographen beschreiben Sprache, und sollen Sprache beschreiben. Darüber hinaus sollen sie Anleitungen geben zum Verfassen von Wörterbüchern – so die britische Schule, wie sie z.B. von Atkins/ Rundell (2008) repräsentiert wird. Ich halte dagegen: Es gibt nichts, was mehr praktisch wäre als eine gute Theorie. Ob nun Wiegand (1998) eine sehr gute oder „nur“ eine gute Theorie sein kann, steht auf einem anderen Blatt; vgl. dazu Bergenholtz/Tarp (2003). Dennoch stellt das Werk eine Theorie dar, die Lexikographen nicht nur kennen, sondern auch ernst nehmen sollten – ob kritisch oder zustimmend. Die empirische Basis kann für die heutige Lexikographie – aus der Sicht von Atkins/Rundell (2008) – nur in der Analyse eines computerlesbaren Korpus bestehen. Ohne ein solches Korpus soll kein einziger Arbeitsschritt bei der Selektion und der Beschreibung sprachlicher Elemente unternommen werden. Das gilt ohne Ausnahme: Lemmaselektion, Bedeutungsbeschreibung, Kollokationsselektion, grammatische Beschreibung usw. usw. Sie zeichnen dafür folgendes Diagramm (Atkins/Rundell 2008: 46):

Eine Korpusanalyse ist eine überflüssige Zeremonie

157

In der Praxis ist das Korpus der Ausgangspunkt der gesamten lexikographischen Arbeit. Introspektion sei zwar auch „a form of evidence“. Aber Introspektion könne nicht als empirische Basis dienen: “Even if we assume that we have full access to the contens of our mental lexicon, one individual’s store of linguistic knowledge is inevitably incomplete and idiosyncratic” (Atkins/Rundell 2008: 47).

Dies gelte auch für Informantenbefragungen. Sie hätten eine nur “limited value for mainstream lexicography”. Nur die Beobachtung von wirklicher Sprache, und das ist die Korpusanalyse, könne das gewährleisten, was die heutige Lexikographie nach Meinung von Atkins/Rundell (2008:45) leisten muss: “generalizations about word behaviour approximate closely to the ways in which people normally use and understand langugage when engaging in real communicative acts.” Die Unzulänglichkeit dieser Argumentation will ich hier nicht nachweisen, sondern nur auf einige Punkte hinweisen: Introspektion ist differenzierter zu sehen, insbesondere wenn ein Wort oder ein mehrwortiger Ausdruck auch oder nur in einer Fachsprache vorkommt. Informantenbefragungen geben manchmal Ergebnisse, die sich von Korpusanalysen unterscheiden; aber meist stimmen die Ergebnisse aus beiden Formen der empirischen Analyse miteinander überein (vgl. Bergenholtz/Jensen 2002). Darüber hinaus gibt es mindestens ein umfangreiches und bekanntes Wörterbuch, das einen großen Qualitätsgewinn, d.h. Informationswertsteigerung durch die Wiedergabe von Befragungen von 100 bekannten Persönlichkeiten, erhalten hat (AHD 1976). Besonders auffallend ist es, dass Atkins/Rundell (2008) zwar Belegsammlungen für die Wörterbucharbeit vor 1980 erwähnen, aber keine anderen Arten der empirischen Basis. Im Vergleich dazu bietet der theoretische lexikographische Beitrag von Wiegand (1998) ein weit differenzierteres Bild, das nicht nur theoretisch haltbarer ist, sondern auch eher die wirkliche und zugleich eine optimalere lexikographische Praxis wiederspiegelt: Wiegand (1998:140) sieht die empirische Basis als Prozess in der lexikographischen Arbeit und nennt diesen „eine Wörterbuchbasis erstellen“. Er trennt zwischen primären, sekundären und tertiären Quellen für diese Basis. Die primäre Quelle ist das „lexikographische Korpus“, das immer ein Korpus von wirklichen Texten darstellt. Diese Quelle ist nach Wiegand ein obligatorischer Bestandteil der Wörterbucharbeit. Die sekundären und tertiären Quellen sind je nach Wörterbuchprojekt obligatorisch oder fakultativ zu verwenden. Die sekundären Quellen bestehen aus all den Wörterbüchern, die der Lexikograph konsultiert. Zu den tertiären Quellen gehören all die sonstigen „Sprachmaterialien”, wie z.B. linguistische Monographien und Grammatiken. Aus dem Diagramm Seite 183 sieht man, dass auch „Fragebogendateien“ zu den Primärdaten gehören. Es sind neu erfasste Daten – anders als die Übernahmen von bereits erfassten Daten in den sekundären und tertiären Quellen:

158

Henning Bergenholtz

Eine solche Darstellung kommt dem näher, was Lexikographen wirklich tun und auch tun sollten. Mit einer solchen Darstellung wird auch die Aufteilung in korpusbasierte contra korpusgesteuerte Lexikographie („corpus-based“ contra „corpusdriven“) unbrauchbar. Weder ist ein Korpus die ausschließliche empirische Basis lexikographischer Arbeit, noch ist die Unterteilung in deduktive bzw. induktive Arbeitsweise realistisch; vgl. dazu die Definitionen von Ulrich Heid (Vortrag in Valladolid 6.3.2015): corpus-based: Start from theoretical assumptions and verify these on corpus data corpus-driven: Start from (statistical) account of data and draw conclusions: hypothesis building by use of aggregation, generalization, etc. Eine deduktive Vorgehensweise bei der Selektion von Kollokations-, Beispiel- oder Wortbildungsangaben gibt keinen Sinn – wenn, dann für die Erstellung von Bedeutungsangaben. Aber auch hier ist die übliche Vorgehensweise ein Hin und Her zwischen vorläufigen Annahmen, Analyse von Kollokationen und Beispielen, neuen Annahmen, neuen Analysen usw.; vgl. dazu die theoretischen Überlegungen von van de Velde (1979) und die Beschreibung von konkreten Arbeitsschritten bei der Ausformung von Bedeutungsangaben in Bergenholtz/Agerbo (2014). Das Korpus ist kein obligatorischer Bestandteil der empirischen Basis jedweder lexikographischer Arbeit – weder für alle Wörterbuchtypen, noch für alle lexikographischen Arbeitsschritte. Hinzu kommt, dass es unterschiedliche Auffassungen darüber gibt, was unter Korpus zu verstehen ist, und wann eine Korpusanalyse erforderlich ist.

2 Korpusdiskussionen Für Atkins/Rundell (2008) ist ein Korpus eine große Sammlung von computerlesbaren Texten. Wiegand hingegen (Wiegand 1998) muss auch andere Formen von Korpora

Eine Korpusanalyse ist eine überflüssige Zeremonie

159

gemeint haben, da er auf Bergenholtz/Mugdan (1989) verweist. Man kann insgesamt zwischen folgenden Arten von Korpora unterscheiden: – Zufallskorpus, wenn der Lexikograph mehr oder weniger zufällig Belege in verschiedenen Texten findet und für die Belegsammlung aufschreibt oder kopiert; – Lesekorpus, so z.B. Bungarten (1979) oder Ulvestad/Bergenholtz (1983), wo der Lexikograph oder Linguist eine große Menge von Texten genau durchliest und analysiert; – computerlesbares Korpus. Belege aus zufällig oder nicht voll systematisch durchgelesenen Texten waren bis etwa 1980 die am häufigsten benutzten Methode, empirisches Material zu sammeln. Diese Methode wird auch heute gebraucht und ist insbesondere für die Vervollständigung oder die Revision eines Wörterbuches wichtig. Aber durch die Verwendung von computerlesbaren Korpora findet der Lexikograph in der Tat in vielen Fällen die wesentlichsten Daten für die lexikographische Arbeit. Ob Zufallskorpus, Lesekorpus oder computerlesbares Korpus –: Es war in der Lexikographie die letzten 150 Jahre nur selten unumstritten, dass Textbelege und Korpora wichtig sind für viele, aber nicht alle lexikographische Vorhaben. Eine totale Ablehnung jedweden Gebrauchs von Korpora ist ein geläufiger Einwand gegen die ersten Korpora, nämlich seit dem Brown-Corpus von 1960, oder dem ersten deutschen Korpus, dem Limas-Korpus von 1975. Es sei eine Geld- und Zeitverschwendung, sie zu erstellen und sie anzuwenden: “That is a complete waste of your time and the government’s money. You are a native speaker of English; in ten minutes you can produce more illustrations of any point in English grammar than you will find in many millions of words of random text.” (Robert Lees 1962, mündliche Diskussion, zitiert in Francis 1979:110).

Francis kann in seiner Reaktion richtig gesehen haben, dass Chomsky weder damals noch später eine haltbare Definition von „competence“ oder „performance“ geliefert hat. Und richtig ist es auch, was Francis (1979) weiter schreibt, nämlich dass er nicht verstehen könne, wie man „competence“ ohne Rücksicht auf die wirkliche „performance“, d.h. Textanalysen, untersuchen kann. Aber Francis’ Freude über die angeblich Niederlage war 1979 mehr ein Vorgreifen der späteren Entwicklung als eine Beschreibung der schon 1979 abgeschlossenen Auseinandersetzung, da die Diskussion um den Wert von Korpusanalysen noch sehr gefühlsbeladen geführt wurde, wo z. B. ein finnischer Linguist „die Heranziehung eines Korpus von tatsächlichen Äußerungen als eine überflüssige Zeremonie“ einstuft (Itkonen 1976: 65). Weniger pauschal, aber dennoch skeptisch bleiben viele Linguisten und Lexikographen bis in die 90er Jahre, auch in Deutschland z.B. Zöfgen (1986) und Pasch (1992: 284). Anstelle von Zufallsbelegen oder Beispielen aus computerlesbaren Korpora könne man genauso gut selber Beispiele erfinden: „Linguists use an existing corpus or a corpus created

160

Henning Bergenholtz

from introspection to discover criteria for categorization or the formulation of rules“ (Greenbaum 1984:194). Ich habe damals solche selbstgebildeten Kollokationen und Satzbeispiele als linguistische Poesie gekennzeichnet – eine Poesie, die wenig mit der Sprachwirklichkeit zu tun hat und oft eine sehr persönliche Weltauffassung wiederspiegelt. So waren alle Satzbeispiele in KVL (1978), einem deutschen Valenzwörterbuch, von den beteiligten Lexikographen selbst gebildet. Man sieht hier bei etwa 30% aller Beispiele im Wörterbuch eine Rollenverteilung zwischen Männern und Frauen, die jede Feministin und auch viele Nicht-Feministen auf die Barrikaden hätte bringen müssen: beginnen […] Die Hausfrau beginnt damit, das Geschirr abzutrocknen. begegnen […] Wir begegnen dem Vater mit Achtung. bekommen […] Hans bekommt Arbeit. […] Die Mutter bekommt das Geschirr sauber. beobachten […] Das Kind beobachtet es genau, wie sein Vater das Auto repariert. besorgen […] Die Hausfrau hat Milch besorgt.

Teilweise als Reaktion auf die damaligen empiriefeindlichen theoretischen Vorschläge und auch auf die konkreten lexikographischen Vorhaben mit ausschließlich selbstgebildeten Kollokationen und Beispielen haben viele andere Lexikographen angesichts solcher theoretischen Ansichten und solcher lexikographischen Ergebnisse damals den Wert von Korpusanalysen stark hervorgehoben, z.B. Bergenholtz/Schaeder (1977) oder Bergenholtz/Mugdan (1986). Diese Hervorhebung der Korpusanalyse und ihr Wert für die Lexikographie haben sich jedoch im Laufe der Zeit verselbständigt, so dass man heute von Korpuslexikographie spricht. Mit dieser Terminologie hebt man das Korpus als alleinige empirische Basis in irreführender Weise hervor. Wenn man dem terminologischen Gebrauch voll folgen sollte, müsste man auch von „Intuitionslexikographie“, „Surveylexikographie“ oder „Datenübernahmelexikographie“ (wenn Daten aus vorliegenden Wörterbüchern und Handbüchern übernommen wird) sprechen, was aber niemand tut. Der Wert der Korpusanalyse wird dann um noch eine Stufe gesteigert, wenn ein vorliegendes Wörterbuch oder ein metalexikographischer Beitrag ohne Korpusanalyse auskommt und deswegen als qualitätslos eingestuft wird: “The Aarhus School doubts the relevance of corpora for lexicography (explicitly, in the concluding chapter, p 309). But you need corpora to get the facts right.” (Kilgariff 2012: 29).

Kilgariff kritisiert hier den Beitrag von Bergenholtz/Bergenholtz (2011) und auch das dort vorgestellte dänische Wörterbuch der klassischen Musik insbesondere dahingehend, dass für die Lemmaselektion keine Korpusanalyse verwendet wurde. Die Lemmaselektion für dieses Wörterbuch bestand in erster Linie in Absprache mit dem Verlag in der Wiederverwendung des Lemmastocks aus einem früheren Musikwörterbuch vom selben Verlag. Hinzu kamen weitere Termini aus Indizes verschiedener Musikhandbücher sowie das Hinzufügen fachsystematisch fehlender Lemmata. Kilga-

Eine Korpusanalyse ist eine überflüssige Zeremonie

161

riff setzte seine Kritik in einer Diskussion an der Asialex-Konferenz in Bali 2013 fort, indem er darauf verwies, dass ein ihm befreundeter Terminologe bestätigt habe, dass man auch für Fachwörterbücher eine gute Lemmaselektion nur durch Korpusanalysen erhalten kann. Ich bezweifle nicht, dass dies jemand gesagt hat. Der Punkt ist, dass das Argument nicht zutrifft; vgl. dazu ebenso auch Fuertes-Olivera (2014: 58). Zu kritisieren ist die Ablehnung lexikographischer Theorien und vorliegender Wörterbücher, nämlich dass sie unter allen Umständen angeblich nichts taugen sollen, wenn sie nicht in der Art einer korpusgesteuerten Lexikographie vorgehen, die ohne Einschränkung für jedes Wörterbuch und jede Angabe in jedem Wörterbuch eine vorausgehende Korpusanalyse verlange.

3 Ein Wörterbuch ist ein Informationswerkzeug ”Was ist eines wörterbuchs zweck?” fragt Jacob Grimm in seinem berühmten Vorwort zum „Deutschen Wörterbuch“. Für Grimm – wie für Wiegand (1998: 52) – ist ein Wörterbuch ein Gebrauchsgegenstand. Jacob Grimm gibt auch Beispiele für Wörterbuchbenutzungssituationen, wie z.B. „wie heizt doch das wort, dessen ich mich nicht mehr recht erinnern kann?“ oder „der mann führt ein seltsames wort im munde, was mag es eigentlich sagen wollen? … lasz uns nachschlagen.“ (Grimm 1854, XII). Für Atkins/Rundell (2008: 45) dagegen ist ein Wörterbuch ein linguistisches Werk, in dem man die Beschreibung einer oder mehrerer Sprachen wiedergibt: “For any given word, a good dictionary tells its readers the ways in which that word typically contributes to the meaning of an utterance, the ways in which it combines with other words, the types of text that it tends to occur in.”

Ein Wörterbuch soll somit ein Werk sein, in dem der Lexikograph, in Wirklichkeit der Linguist, möglichst viele Daten über die jeweiligen Wörter den Benutzern darbietet. Ich sehe das anders, Wiegand (1998) auch. Ein Wörterbuch ist ein Informationswerkzeug, in dem der potentielle Benutzer relevante Daten finden kann, aus denen er vorgesehene Informationsbedürfnisse erfüllen soll. Als Werkzeug soll es so eingerichtet sein, dass es diese Bedürfnisse möglichst schnell erfüllt. Wiegand (1998: 938ff.) beschreibt eine mögliche Wörterbuchkonsultation, bei der sein imaginärer Wörterbuchbenutzer mit dem Namen „John“ nicht weiß, ob er bestimmte Substantive im Plural verwenden sollte, oder nicht. John findet z.B. folgende Flexionsangabe in einem der Wörterbücher, die er konsultiert: Machenschaft, die; –, -en (meist Pl.)

Das betreffende Wörterbuch beschreibt somit – wie es Atkins/Rundell (2008) von einem Wörterbuch verlangt – den Gebrauch der Sprache. Die Angabe „meist“ ist jedoch ungenau; es handelt sich um einen undefinierten Pseudoterminus: Soll mit

162

Henning Bergenholtz

„meist“ 60% oder 99% aller Belege gemeint sein? Dies kann man schon definieren, z.B. wie in Bergenholtz/Mugdan (1984, 62): fast immer meist oft auch manchmal selten

für 90% der Belege und mehr für 70% bis unter 90% der Belege für 50% bis unter 70% der Belege für 30% bis unter 50% der Belege für 10% bis unter 30% der Belege für unter 10% der Belege

Wenn eine solche Vorgehensweise befolgt wird, und man ein großes Textkorpus für solche Häufigkeitsangaben auswertet, hätte man die Genauigkeit, die Wiegand (1998: 940) fordert. Diese Methodik wird in vielen englischen monolingualen Wörterbüchern verwendet, oft mit Farben für die verschiedenen Häufigkeitsklassen. Aber anders, als ich in Bergenholtz/Mugdan (1984) meinte, führen solche Genauigkeiten einer Korpusanalyse im besten Falle zu einer relevanten Information, wenn ein potentieller Wörterbuchbenutzer kein konkretes Problem mit einem Text hat, wie John in Wiegands Beispielen, sondern allgemein sein Wissen über die deutsche Sprache erweitern möchte (in meiner Terminologie „eine Angabe in einem kognitiven Wörterbuch sucht“). Wenn aber der potentielle Benutzer ein kommunikatives Problem hat, ist ihm damit wenig geholfen. Zwei Beispiele aus dem Dänischen können dazu dienen, die Problematik zu erkennen: Das Verb vejlede (Deutsch beraten) hat im Präteritum zwei Varianten: vejledede und vejledte. Auch gibt es zwei orthographische Varianten im Dänischen für das deutsche Wort Linie: linje und linie, wobei vejledede und linie die weniger häufigen Varianten sind. Nehmen wir nun an, dass ein potentieller Benutzer eines dänischen monolingualen Wörterbuches in einem Text das Wort vejledede oder das Wort linie liest, und es nicht versteht. Ihm würde die jeweilige Angabe zu beiden Varianten keine relevante Information bieten. Bei einem Rezeptionsproblem kann die Häufigkeit bzw. – wie hier – die geringere Häufigkeit im Vergleich mit der anderen Variante zwar dazu führen, dass ein Rezeptionsproblem entsteht; aber Angaben wie „selten“ oder „manchmal“ oder eine Farbe für dieselbe Information, sind irrelevant. Nur eine gute Bedeutungsangabe hilft. Das gilt auch für linie, das zwar verwendet, aber seit 2001 von der dänischen offiziellen Sprachkommission verboten ist und daher nicht mehr in dem offiziellen Rechtschreibewörterbuch und in einigen anderen Wörterbüchern zu finden ist. Ob verboten, selten oder häufig – : Bei einem Rezeptionsproblem benötigt man keine Häufigkeitsangaben und somit keine Angaben aus einer Korpusanalyse. Anders ist es, wenn der potentielle Benutzer das Wörterbuch benutzen will und sich nicht sicher ist, ob er die eine oder die andere Variante in einem ins Dänische übersetzten Text oder in einem neu zu schreibenden Text verwenden soll. „Anders“ heißt jedoch nicht, dass hier genaue Häufigkeitsangaben eindeutig hilfreich sind.

Eine Korpusanalyse ist eine überflüssige Zeremonie

163

Wenn vejledede oder linie selten oder nur manchmal gebraucht werden –: Soll er es dann nicht und nie gebrauchen? Oder nur manchmal? Und wie soll er „auch“ verstehen, wenn eine Variante in 30% bis 50% aller Belege verwendet wird? Hier hilft ein rein deskriptiver Wörterbuchartikel nicht eindeutig, so auch nicht die folgenden Angaben, die Bergenholtz (2003: 72) entnommen sind: Präteritum of vejlede (engl. instruct) (1) vejlede verb 〈…, vejledte (710 attestations, 373 informants) or vejledede (73 attestations and 41 informants), …〉 (2) vejlede verb 〈…, vejledte (89%) or vejledede (11%); similarly the informants (90% and 10% respectively), …〉 (3) vejlede verb 〈…, vejledte (frequent) or vejledede (rare); most informants chose vejledte, … 〉

Als Hilfe bei einem Textproduktionsproblem kann weit eher ein proskriptiver Wörterbuchartikel infrage kommen, d.h. einer, der eine bestimmte Variante empfiehlt: (4) vejlede auch, aber nicht empfohlen (5) linie Diese Schreibweise ist von der dänischen Sprachkommission nicht erlaubt. Verwende statt dessen → linje.

Für ein kognitives Wörterbuch, d.h. ein Wörterbuch, das möglichst viel Wissen über Sprache bieten will, wäre insbesondere die obige Variante (1) hilfreich. Allerdings wäre dann ein weit größeres Korpus erforderlich gewesen. Es ist auch fraglich, ob 414 befragte Informanten eine ausreichend große Zahl darstellen, und ob die Auswahl repräsentativ für alle Dänen mit Dänisch als Muttersprache war. Für ein kognitives Wörterbuch gilt Kilgariffs Grundtheorie – zumindest für die eine Hälfte der Daten: „But you need corpora to get the facts right“. Wir sehen jedoch, dass es auch andere Arten der Datenerhebung – wie Surveys – gibt, wenn Fakten über den Sprachgebrauch und die Beurteilung von Sprachgebrauch gefunden werden sollen. Für jeden Angabetyp in jedem Wörterbuch sind manchmal die gleichen, aber meist unterschiedliche Kombinationen von empirischen Methoden erforderlich. An dieser Stelle soll – neben dem soeben diskutierten Angabetyp zu grammatischen und orthographischen Varianten – nur ein Typ kurz angesprochen werden: die Bedeutungsangabe. Hier gilt für viele Fachwörterbücher, dass Korpusanalysen keine Rolle spielen und spielen können, so für das erwähnte dänische Musikwörterbuch, für die Wörterbücher zur Rechenschaftslegung, z.B. „Diccionario Español de Contabilidad: Recepción“ (2013), oder die molekularbiologischen Wörterbücher, z.B. „Gentenologisk Ordbog“ (1991). Bei all diesen Fachwörterbüchen wurde für die Erstellung von Bedeutungsangaben ausschließlich auf das Fachwissen der Lexikographen sowie die gelegentliche Konsultation von Handbüchern bei und Fachzeitschriften zurückgegriffen. Für allgemeinsprachliche Wörterbücher ist es – teilweise – anders. In vielen Fällen ist die Korpusanalyse die sichere und wichtigste Methode, siehe Bergenholtz/

164

Henning Bergenholtz

Agerbo (2014). Aber immer dann, wenn es sich um Wörter und Mehrwortausdrücke handelt, deren allgemeinsprachlicher Gebrauch sich direkt auf dem fachsprachlichen basiert, wird keine Korpusanalyse für die Erarbeitung der Bedeutungsangabe durchgeführt. Wir reden somit nicht von DNA in der Bedeutung ‚gute oder schlechte Angewohnheit’, sondern von dem Gebrauch des Ausdruck in der Molekularbiologie. Gleiches gilt z.B. auch für chemische Ausdrücke, die in vielen allgemeinsprachlichen Wörterbüchern falsche oder lückenhafte Bedeutungsangaben erhalten haben; vgl. dazu Bergenholtz (2013) mit dem Beispiel calcium. Hier wie bei Wirtschaftstermini oder linguistischen Termini (z.B. Adjektiv) wird keine Korpusanalyse durchgeführt, sondern die Bedeutungsangabe von einem Fachmann verfasst, der evtl. relevante Handbücher konsultiert.

4 Eine Korpusanalyse ist manchmal eine notwendige, manchmal eine überflüssige Zeremonie Ein Wörterbuch ist – wie oben gesagt – ein Informationswerkzeug. Diese Voraussetzung steuert die Wahl der Angabetypen in dem jeweiligen Wörterbuch und auch die Wahl der empirischen Basis für jeden Angabetyp. Dies soll in einer neuen Abbildung dargestellt werden. Diese Abbildung unterscheidet sich völlig von der in Atkins/Rundell (2008) vorgestellten. Sie unterscheidet sich auch von der in Wiegand (1998). Denn es ist vorgesehen, dass der Lexikograph unterschiedliche Teile der empirischen Basis für die Lemmaselektion und für die Selektion und Beschreibung heranziehen sollte – und nur im Extremfall alle:

Eine Korpusanalyse ist eine überflüssige Zeremonie

165

Für ein Textproduktionswörterbuch wie „Diccionario de Español para la creación“ (2016) gilt, dass die Lexikographen Kollokationen (und auch Beispiele) nur einem elektronischen Korpus entnehmen sollen:

Anders ist es für die Bedeutungsangaben in dem bereits erwähnten Musikwörterbuch „Viden om Musikudtryk“ (2011). Es ist für musikinteressierte Laien geschrieben, die ausführliche Erklärungen von Termini aus der klassischen Musik finden möchten. Als empirische Basis wird insbesondere das Fachwissen des Lexikographen (die Expertin in klassischer Musiktheorie ist) herangezogen. Wenn ihr vorhandenes Wissen nicht ausreicht oder sie in Zweifel gerät, werden Musikhandbücher herangezogen:

Wir sehen somit, dass der Titel des Beitrags für die Wahl der empirischen Basis für einige Datentypen in einigen Wörterbüchern, aber auch nur einige zutrifft. Daher ist auch die Beschreibung der empirischen Basis, wie sie Atkins/Rundell (2008) vornehmen, prinzipiell falsch. Ihr Ansatz ist jedoch korrekt für einige Angabetypen. Und auch der Titel vorliegenden Beitrags ist ein Zitat, der als Verallgemeinerung für alle

166

Henning Bergenholtz

lexikographischen Schritte falsch ist: Für einige Angabetypen kann man ohne Korpusanalysen keine relevanten Angaben erhalten.

5 Literatur AHD = The American Heritage Dictionary. 2. ed. (rev. ed. of The American Heritage Dictionary of the English Language). Boston: Houghton Mifflin Company 1976. Atkins, B.T. Sue/Rundell, Michael (2008): The Oxford Guide to Practica Lexicography. Oxford: Oxford University Press. Bejoint, Henri (2010): The lexicography of English. Oxford: Oxford University Press. Bergenholtz, Henning (2003): User-oriented Understanding of Descriptive, Proscriptive and Prescriptive Lexicography. In: Lexikos 13, 65–80. Bergenholtz, Henning (2013): The role of linguists in planning and making dictionaries in modern information society; in: Lexicography and Dictionaries in the Information Age. Selected papers from the 8th ASIALEX Conference. Ed. by Deny Kwary, Nur Wulan, Lilla Musyahda. Surabaya: Airlangga University Press, 1–10. Bergenholtz, Henning/Agerbo, Heidi (2014): Extraction, selection and distribution of meaning elements for monolingual information tools. In: Lexicographica 30, 488–510. Bergenholtz, Henning/Bergenholtz, Inger (2011): A dictionary is a tool, a good dictionary is a monofunctional tool. In: Fuertes-Olivera Pedro A./Bergenholtz, Henning (eds.): e-Lexicography: The Internet, Digital Initiatives and Lexicography. London & New York: Continuum 2011, 187–207. Bergenholtz, Henning / Jensen, Sanne (2000): Inddragelse af informanter ved ordbogsarbejde. In: LexicoNordica 7, 149–166. Bergenholtz, Henning/Mugdan, Joachim (1984): Grammatik im Wörterbuch: von ja bis Jux. In: Studien zur neuhochdeutschen Lexikographie V. Hrsg. von Wiegand, Herbert Ernst. Hildesheim/Zürich/ New York: Olms, 47–102. Bergenholtz, Henning/Mugdan, Joachim (1986): Der neue „Super-Duden“ – die authentische Darstellung der deutschen Gegenwartssprache? In: Studien zur neuhochdeutschen Lexikographie VI.1. Hrsg. von Wiegand, Herbert Ernst. Hildesheim/Zürich/New York: Olms, 1–149. Bergenholtz, Henning/Mugdan, Joachim (1989): Korpusproblematik in der Computerlinguistik: Konstruktionsprinzipien und Repräsentativität. In: Computional Linguistics. Computerlinguistik. An International Handbook on Computer Oriented Language Research and Applications. Ein internationales Handbuch zur computer unterstützten Sprachforschung und ihrer Anwendungen. Hrsg. von Bàtori, Istvàn S./ Lenders, Winfried/Putschke, Wolfgang. Berlin/New York: Walter de Gruyter, 141–149. Bergenholtz, Henning / Schaeder, Burkhard (1977): Deskriptive Lexikographie. In: zeitschrift für germanistische linguistik 5.1, 2–33. Bergenholtz, Henning/Tarp, Sven (2003): Two opposing theories: On H.E. Wiegand’s recent discovery of lexicographic functions. In: Hermes, Journal of Linguistics 31, 171– 196. Bungarten, Theo (1979): Das Korpus als empirische Grundlage in der Linguistik und Literaturwissenschaft. In: Bergenholtz, Henning/Schaeder, Burkhard (Hrsg.): Empirische Textwissenschaft. Aufbau und Auswertung von Text-Corpora. Königstein/Ts.: Scriptor, 28–51. Diccionario de Español para la creación (2016) = Fuertes-Olivera Pedro A. y Henning Bergenholtz, en colaboración con Ángeles Sastre Ruano, Eva Álvarez Ramos, María Fonseca Hernández, Mª José López Carrero, Álvaro Prieto López y Olga Saldaña: Diccionario de español para la creación. Base de datos y diseño: Jesper Skovgård Nielsen y Martin Carlsen. Hamburg, Lemma.com. Diccionario Español de Contabilidad: Recepción (2013) = Fuertes-Olivera, Pedro A., Henning Bergenholtz, Sandro Nielsen, Pablo Gordo Gómez, Marta Niño Amo, Ángel de los Ríos Rodicio, Ángeles

Eine Korpusanalyse ist eine überflüssige Zeremonie

167

Sastre Ruano, Sven Tarp, Marisol Velasco Sacristán: Diccionario Español de Contabilidad: Recepción. Base de Datos y Diseño: Richard Almind y Jesper Skovgård Nielsen. Hamburg: Lemma.com 2013. Francis, W. Nelson (1979): Problems of Assembling and Computerizing Large Corpora. In: Bergenholtz, Henning/Schaeder, Burkhard (Hrsg.): Empirische Textwissenschaft. Aufbau und Auswertung von Text-Corpora. Königstein/Ts.: Scriptor, 110–123. Fuertes-Olivera, Pedro (2012): Lexicography and the Internet as a (Re-) sourche. In: Lexicographica 28, 49–70. Gentenologisk Ordbog (1992) = Kaufmann, Uwe/Bergenholtz, Henning: Genteknologisk ordbog. Dansk-engelsk/engelsk-dansk molekylærbiologi og DNA- teknologi. København: Gad. Greenbaum, Sidney (1984): Corpus Analysis and Elicitation Tests. In: Corpus Linguistics. Recent Developments in the Use of Computer Corpora in English Language Research. Ed. by Aarts, Jan/ Meijs, Willem. Amsterdam: Rodopi, 193–201. Grimm, Jacob (1854): Vorrede. In: Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm. Leipzig: Hirzel. I-LXVII. Itkonen, Iso (1976): Was für eine Wissenschaft ist die Linguistik eigentlich? In: Wunderlich, Dieter (Hrsg.): Wissenschaftstheorie der Linguistik. Kronberg: Athenäum, 56–76. Johansson, Stig (1979): The Use of a Corpus in Register Analysis: The Case of Learned and Scientific English. In: Bergenholtz, Henning/Schaeder, Burkhard (Hrsg.): Empirische Textwissenschaft. Aufbau und Auswertung von Text-Corpora. Königstein/Ts.: Scriptor, 281–293. Kilgariff, Adam (2012): Review of Pedro A. Fuertes-Olivera and Henning Bergenholtz (eds.): e-Lexicogaphy. The Internet, Digital Initiatives and Lexicography. In: Kernerman Dictionary News, 26–29. KVL (1978) = Engel, Ulrich/Schumacher, Helmut unter Mitarbeit von Ballweg, Joachim u.a.: Kleines Valenzlexikon deutscher Verben. Tübingen: Gunter Narr Verlag. Pasch, Renate (1992): Es lebe das lexikographische Beispiel! (Probleme der lexikographischen Beschreibung wahrheitsfunktionaler Satzverknüpfer mit Kontextbeschränkungen. In: Lexikontheorie und Wörterbuch. Wege der Verbindung von lexikologischer Forschung und lexikographischer Praxis. Hrsg. von Brauße, Ursula/Viehweger, Dieter. Tübingen: Niemeyer, 245–293. Quirk, Randolph/Svartvik, Jan (1979): A Corpus of Modern English. In: Bergenholtz, Henning/Schaeder, Burkhard (Hrsg.): Empirische Textwissenschaft. Aufbau und Auswertung von Text-Corpora. Königstein/Ts.: Scriptor, 204–218. Ulvestad, Bjarne / Bergenholtz, Henning (1983): Es als „Vorgreifer“ eines Objektsatzes. In: Deutsche Sprache 1/83, 1–26. Velde, Roger G. van de (1979): Probleme der linguistischen Theorienbildung einer empirischen Textwissenschaft. In: Bergenholtz, Henning/Schaeder, Burkhard (Hrsg.): Empirische Textwissenschaft. Aufbau und Auswertung von Text-Corpora. Königstein/Ts.: Scriptor, 10–27. Viden om Musikudtryk (2011) = Inger Bergenholtz i samarbejde med Henning Bergenholtz. Database: Richard Almind og Martin Gyde Poulsen: Viden om musikudtryk. Odense: Ordbogen.com 2011. [www.ordbogen.com]. Wiegand, Herbert Ernst (1998): Wörterbuchforschung. Untersuchungen zur Wörterbuchbenutzung, zur Theorie, Geschichte, Kritik und Automatisierung der Lexikographie. Berlin: Walter de Gruyter. Zöfgen, Ekkehard (1986): Kollokation – Kontextualisierung – (Beleg-)Satz. Anmerkungen zu Theorie und Praxis des lexikographischen Beispiels. In: Barrera– Vidal, Albert/Kleineidam, Hartmut/ Raupach, Manfred (Hrsg.): Französische Sprachlehre und bon usage. Festschrift für Hans-Wilhelm Klein zum 75. Geburtstag. München: Hueber, 219–238.

Thomas Herbst

Wörterbuch war gestern Programm für ein unifiziertes Konstruktikon! Abstract: In this contribution a programme for a unified constructicon is developed. On the basis of considerations from construction grammar it is shown how information types traditionally found in dictionaries and those traditionally found in grammars can be presented in one reference constructicon within the frame of the same linguistic-theoretical basis, and how such a reference constructicon can in particular illustrate the transition area between lexicon and grammar. Keywords: collocation, collostruction, constructicon, construction grammar, grammar, learners’ lexicography, lexicon Schlagwörter: Grammatik, Lexik, Konstruktionsgrammatik, Kollokation, collostruction, Konstruktikon, Kollostruktikon, Lernerlexikografie

1 Konstruktikon1 1.1 Lexikografie und Linguistik Die Typologie der Nachschlagewerke ist in den letzten Jahren um ein Konzept bereichert worden – nämlich das des Konstruktions. Der Begriff constructicon wird bereits 1991 von Jurafsky2 verwendet; im Sinne eines mentalen Modells sprachlicher Einheiten ist er heute relativ weit verbreitet (Bybee 2010, Goldberg 2006), wobei er in einer konkret-deskriptiven Richtung am deutlichsten im Umfeld von FrameNet (Fillmore/Lee-Goldman/Rhomieux 2012, Fillmore 2014, Boas 2014) in Hinblick auf das

1 Ich danke Stefan Evert, Susen Faulhaber, Michael Klotz, Thomas Proisl und Peter Uhrig für die hilfreichen Kommentierungen und Diskussionen. 2 siehe Bücker (2012: 77); vgl. Jurafsky (1991: 8): „Lexical entries, idioms, and syntactic structures are all represented uniformly as grammatical constructions. Thus the ‘constructicon’ subsumes the lexicon, the syntactic rule base, and the idiom dictionary assumed by other theories. Using a single representation for linguistic knowledge allows a very general mechanism for language understanding – lexical access, idiom processing, syntactic parsing, and semantic interpretation are all done by the same mechanism using the same knowledge base.“

Thomas Herbst: Friedrich-Alexander-Universität Erlangen-Nürnberg, Lehrstuhl für Anglistik, insbesondere Linguistik, Department für Anglistik, Amerikanistik und Romanistik & Interdisziplinäres Zentrum für Lexikografie, Valenz- und Kollokationsforschung, Bismarckstraße 1, 91054 Erlangen

170

Thomas Herbst

FrameNet-Constructicon und verwandte Projekte, wie etwa das SweCon (Sköldberg et al. 2013), auftritt. Da die Idee eines Konstruktikons eng an ein bestimmtes, kognitiv orientiertes Modell von Sprache gebunden ist, kann die Entwicklung von Konstruktika durchaus in einer Reihe mit anderen Versuchen, bestimmte linguistische Theorien in Wörterbüchern quasi in die Praxis umzusetzen, gesehen werden. Dass es solche Versuche immer wieder gegeben hat, ist auch naheliegend, nachdem die Linguistik als die Wissenschaft, die Theorien von Sprache entwickelt, und die Lexikografie, die die Deskription von Sprachen bzw. eines Teilbereichs von Sprachen zum Gegenstand hat, in einer engen Wechselbeziehung stehen und stehen müssen. Ein Beispiel ist etwa die Valenztheorie, die mit der Veröffentlichung des „Wörterbuchs zur Valenz und Distribution deutscher Verben“ von Helbig/Schenkel (1969) einen neuen Wörterbuchtyp begründete. Ebenso ist die Entstehung von Kollokationswörterbüchern ein Ergebnis der linguistischen Kollokationsforschung (z.B. Hausmann 1984, 1985). Bezüge zwischen linguistischer Theoriebildung und Lexikografie finden sich aber auch im Bereich der semantischen Prototypentheorie (Geeraerts 1990, 2007); und die zunehmende Popularität der kognitiven Linguistik führte fast unweigerlich zur Forderung nach einer kognitiven Lexikografie (Ostermann 2015). Allerdings ist es dabei nicht notwendigerweise so, dass es sich um eine reine Anwendung theoretisch-linguistischer Erkenntnisse auf die Konzeption von Wörterbüchern handelt. So ist im Falle der Prototypentheorie der Erkenntnisgewinn nicht etwa darin zu sehen, dass die Theorie dazu geführt hätte, dass Lexikografen Bedeutungserklärungen nun plötzlich in der Form prototypischer Angaben gefertigt hätten – vielmehr war dies schon lange vor der Entwicklung der Prototypentheorie gängige lexikografische Praxis, wie auch Geeraerts (1990: 210, 2013: 495) betont. Im Folgenden soll der Versuch unternommen werden, die Grundgedanken der Ansätze, die unter Bezeichnungen wie Konstruktionsgrammatik und gebrauchsorientiert firmieren, in Hinblick auf ihre Anwendbarkeit auf die Gestaltung von Wörterbüchern, insbesondere von englischen Lernerwörterbüchern, zu prüfen. Dies erscheint aus einer Reihe von Gründen ein lohnendes Unterfangen, von denen hier nur einige genannt seien: 1. Konstruktionsgrammatische Ansätze etablieren sich zunehmend als Gegenentwurf zu sprachwissenschaftlicher Forschung Chomskyscher Prägung. 2. Nachdem sich für das Erlernen von Fremdsprachen zentrale Phänomene wie Valenz und Kollokation sehr gut in der Form von Konstruktionen darstellen lassen, liegt es ausgesprochen nahe, dass sich konstruktionistische Ansätze auch gewinnbringend für die Lernerlexikografie erweisen werden. 3. Erkenntnisse der modernen Korpuslinguistik sind für wesentliche Bereiche der Lexikografie als auch der konstruktionistischen Theoriebildung essentiell und kompatibel. 4. Durch die einschneidenden Veränderungen im Mediensektor in den letzten Jahrzehnten ergeben sich aufgrund neuer Mediennutzungsgewohnheiten sowie durch

Wörterbuch war gestern

171

Weiterentwicklung der Technik neue Möglichkeiten lexikographischer Darstellung, die eine konstruktionistisch geprägte Vermittlung von Informationen über eine Sprache begünstigen könnten.

1.2 Konstruktionen Die Attraktivität konstruktivistischer Ansätze ergibt sich aus dem dem Konstruktionsbegriff zugrunde liegendem Verständnis von Sprache. Sprachliches Wissen besteht demnach – je nach Ausprägung der Theorie – mehr oder weniger ausschließlich aus Konstruktionen, die netzwerkartig miteinander verbunden sind. Konstruktionen – und man muss die Wahl des Terminus nicht unbedingt glücklich finden – sind dabei Form-Bedeutungspaare. Während der Konstruktionsbegriff ursprünglich auf semantisch nicht-transparente Einheiten beschränkt war (etwa bei Goldberg 1995), wird er in letzter Zeit auch auf hochfrequente Verbindungen ausgeweitet, wie auch aus Goldbergs (2006: 5) Konstruktionsdefinition ersichtlich ist:3 “Any linguistic pattern is recognized as a construction as long as some aspect of its form or function is not strictly predictable from its component parts or from other constructions recognized to exist. In addition, patterns are stored as constructions even if they are fully predictable as long as they occur with sufficient frequency.”4

Mit der Fokussierung auf die Kriterien der Nicht-Transparenz und der Frequenz ergibt sich übrigens eine sehr interessante Parallele zur Diskussion um den Kollokationsbegriff, was darauf hindeutet, dass diese Kriterien, die auch nicht immer eindeutig voneinander zu trennen sind, beide für die Bestimmung gespeicherter sprachlicher Einheiten relevant sind.5

1.3 Lexikon und Grammatik Ein wesentliches Charakteristikum gebrauchsorienterter konstruktivistischer Ansätze besteht in der Ablehnung einer scharfen Trennlinie zwischen Lexikon und Grammatik und der Annahme eines lexikogrammatischen Kontinuums (Langacker 1990: 219 und

3 siehe auch Bybee (2013: 51): „[…] constructions can be viewed as processing units or chunks– sequences of words (or morphemes) that have been used often enough to be accessed together.“ 4 Eine denkbare Übersetzung könnte folgendermaßen lauten: „Jedes sprachliche Muster wird als Konstruktion betrachtet, solange sich ein Aspekt seiner Form oder Funktion nicht eindeutig aus seinen Bestandteilen oder aus anderen als existierend erkannten Konstruktionen ergibt. Außerdem werden Muster selbst dann als Konstruktionen gespeichert, wenn sie völlig transparent erscheinen, aber mit ausreichender Frequenz vorkommen.“ 5 bzw. von Einheiten, von denen man annehmen kann, dass sie gespeichert sind.

172

Thomas Herbst

2009: 1) – ein Standpunkt, der in mehr oder weniger stark ausgeprägter Form auch von anderen Theorien artikuliert wurde (Quirk 1968: 72, Halliday 1994: 15, Sinclair 2004: 164–165).6 Wenn man aber davon ausgeht, dass das gesamte sprachliche Wissen eines Sprechers aus der Speicherung von Einheiten essentiell gleichen Charakters besteht und wir uns deshalb Sprache nicht in der Form der Interaktion einer Grammatik und eines mentalen Lexikon vorstellen, dann ergeben sich auch für die Lexikographie völlig neue Perspektiven, weil in einer konsequenten Umsetzung dieses Gedankens auch die traditionelle Aufteilung von Wörterbuch und Grammatik hinfällig wird. Ziel einer konstruktivistischen Lexikografie muss also die Schaffung eines Konstruktikons sein, das analog zum mentalen Konstruktikon Konstruktionen einer Sprache verzeichnet und für Benutzerinnen und Benutzer zugänglich macht. Zur Abgrenzung von der Vorstellung eines mentalen Konstruktikons soll in Bezug auf entsprechende Nachschlagewerke von Referenzkonstruktika die Rede sein (nachdem ein Terminus wie Konstruktionenbuch recht altertümlich wirken und zudem der wahrscheinlichsten, nämlich der elektronischen Realisierungsform kaum gerecht werden würde). Dass Umfang und Beschreibungstiefe eines solchen Referenzkonstruktikons, wie bei traditionellen Wörterbüchern auch, von den Zielsetzungen bezüglich der Funktionen, die ein solches Konstruktikon erfüllen soll, und den intendierten Benutzergruppen abhängt, versteht sich von selbst.7

1.4 Referenzkonstruktikon und mentales Konstruktikon Natürlich kann ein Referenzkonstruktikon keine 1:1-Abbildung eines mentalen Konstruktikons sein – schon deshalb nicht, weil man im Augenblick von empirisch fundierten Erkenntnissen über die Form eines solchen Konstruktikons im menschlichen Gehirn noch sehr weit entfernt ist und auch kein umfassenden Modell existiert, das allgemein akzeptiert wäre. Eine gewisse Parallele ergibt sich allerdings dadurch, dass das Referenzkonstruktikon idealerweise bottom up durch die Analyse von Korpusdaten und entsprechende Abstraktionsprozesse durch die Lexikogrammatiker entsteht, wenn man einen korpusgetriebenen Ansatz im Sinne Sinclairs (2004) verfolgt, was mit der Grundüberzeugung konstruktionistischer gebrauchsorientierter Theorien in Einklang steht, dass sprachliche Strukturen emergent sind (Bybee/Hopper 2001). Ein wesentlicher Unterschied besteht naturgemäß darin, dass Referenzkonstruktika langue-orientiert sein müssen und von daher die Unterschiedlichkeit der mentalen Konstruktika einzelner Sprecherinnen und Sprecher nicht abbilden können.

6 siehe auch Bybee (2007: 287–290). Zu einer gegensätzlichen Position vgl. aber Pulvermüller/Cappelle/Shtyrov (2013: 414). 7 siehe dazu u.a. Hausmann (1977: 144–156) oder Tarp (2008).

Wörterbuch war gestern

173

2 Informationstypen in Wörterbuch und Konstruktikon So wie ein Wörterbuch Informationen zu den formalen und semantisch-pragmatischen Aspekten von Wörtern gibt, die für eine bestimmte Benutzergruppe und für bestimmte Nachschlagezwecke relevant sind, muss ein Referenzkonstruktikon Informationen zu den formalen und semantisch-pragmatischen Aspekten von Konstruktionen enthalten, die für eine bestimmte Benutzergruppe und für bestimmte Nachschlagezwecke relevant sind. Das bedeutet, dass ein Referenzkonstruktikon prinzipiell – im Einzelfall natürlich abhängig von Benutzergruppe und Zweck – alle Typen sprachlicher Einheiten umfassen kann oder muss, denen in der konstruktionsgrammatischen Forschung Konstruktionsstatus zugewiesen wird. Das ist, wie Behrens (2009: 429) es beschreibt, „das Spektrum von formal vollständig kompositionellen und semantisch transparenten Strukturen bis hin zu vollständig lexikalisierten und formal fixierten Idiomen“. Im Einzelnen zählen dazu beispielsweise:8 (i) Morpheme

S , pre-, un-

(ii) einfache Wörter

boat, buoy

(iii) komplexe Wörter

lighthouse, lighthouse keeper

(iv) Kollokationen

dark night, lay the table

(v) Idiome

no smoke without fire; coal to Newcastle

(vi) the Xer the Yer

the sooner the better

(vi) Grammatische Konstruktionen

Passivkonstruktion(en)

(vii) Texte

football chants

Es ist offensichtlich, dass viel davon bereits in traditionellen Wörterbüchern enthalten ist: 1. Gebundene Morpheme sind nicht in allen Wörterbüchern verzeichnet, finden sich aber durchaus in englischen Lernerwörterbüchern sowie dem „Oxford English Dictionary“ oder Spezialwörterbüchern wie Steins „Dictionary of English Affixes“ (2007). 2. Kategorien (ii) und (iii) sind die zentralen Beschreibungsgegenstände der allermeisten Wörterbuchtypen; (iv) und (v) sind in Lerner- und Spezialwörterbüchern erfasst.

8 vgl. dazu Goldberg (2006: 5), zu (iii) und (iv) siehe Bybee (2010: 28), zu (vi) Fillmore/Kay/O’Connor (1988), zu (vii) Hoffmann (2015).

174

Thomas Herbst

Das Verhältnis von Wörterbuch und Referenzkonstruktikon lässt sich zunächst einmal so beschreiben, dass letzteres im Prinzip alle Informationen enthält, die auch in einem einsprachigen Lernerwörterbuch zu finden sind, und zwar sowohl die Formals auch die Bedeutungsseite betreffend. Eine gebrauchsorientierte konstruktionistische Sicht erfordert hier keine grundlegenden Veränderungen gegenüber der jetzigen lexikografischen Praxis der Online-Versionen von englischen Lernerwörterbüchern wie dem „Oxford Advanced Learner’s Dictionary“, dem „Longman Dictionary of Contemporary English“ oder dem „Macmillan Dictionary“.9 Eine konstruktionistische Perspektive ist vor allem in dreierlei Hinsicht von Interesse, nämlich (i) Mehrworteinheiten, (ii) Argumentstrukturkonstruktionen und (iii) „grammatische“ Informationen, die in traditionellen Wörterbüchern nicht zu finden sind.

3 Mehrworteinheiten I 3.1 Zugriffsmöglichkeiten Dass wir davon ausgehen können, dass sprachliches Wissen bis zu einem erheblichen Grad auch gespeicherte Mehrworteinheiten umfasst, wird heute wohl kaum noch jemand bezweifeln. Die Ergebnisse (oft mit lexikografischen Anwendungszwecken konzipierter) korpuslinguistischer Forschungen liefern hierfür ebenso Evidenz wie psycholinguistische Experimente (Sinclair 2004, Altenberg 1998; Greenbaum 1988, Underwood Schmitt/Galpin 2004; Ellis/Frey/Jalkanen 2009; Dąbrowska 2014).10 Dabei handelt es sich keineswegs nur um klassische Idiome und Kollokationen, sondern um eine Reihe mehr oder minder fester Wortverbindungen, die sich einer eindeutigen Klassifikation weitgehend entziehen. Konstruktionstische und kognitive Ansätze eignen sich unter anderem deshalb als theoretische Grundlage für lexikografische Deskription besonders gut, weil sie diese Widersprüchlichkeit zwischen Fixiertheit und Variation relativ gut beschreiben können. Langacker (2008: 20) spricht in diesem Zusammenhang von „partially schematic unit expressions“ (‚auf partiell schematischen Einheiten beruhenden Ausdrücken‘); Bybee (2013: 61) verdeutlicht die zu beobachtende Variation innerhalb der Resultativkonstruktion mit dem Verb drive folgendermaßen:11

9 Das schließt punktuelle Verbesserungen natürlich nicht aus: Ostermann (2015) argumentiert zum Beispiel für die Einbeziehung von Elementen der kognitiven Metaphernforschung bei der Abfassung von Bedeutungsangaben in einsprachigen Wörterbüchern. 10 siehe aber auch Gläser (1990: 15). 11 vgl. Bybee (2010: 27). Zu einer Diskussion dieser Darstellung siehe Herbst (2015).

Wörterbuch war gestern

175

Abb. 1: Resultativkonstruktion mit drive (Bybee 2013: 61).

Es wäre nun verfehlt zu behaupten, diese Tiefe an Information wäre in einem Printwörterbuch nicht möglich – so bieten etwa die beiden Bände des „Oxford Dictionary of Current Idiomatic English“ von Cowie/Mackin/McCaig (1975 und 1983) eine bemerkenswerte Breite an Variationsmöglichkeiten der erfassten Mehrworteinheiten. Wo liegt also der entscheidende Mehrwert in einem Referenzkonstruktikon? Zum einen bietet ein Konstruktikon eine im Vergleich zu den in den jetzigen elektronischen Wörterbüchern, die sich zugegebenermaßen in diesem Punkt erheblich unterscheiden, verbesserte Zugriffsstruktur. Wo liegt der Vorteil des elektronischen Mediums, wenn eine Suche nach of course zu keinem sinnvollen Ergebnis führt – wie in „OALD9-online“? Was nützt die Einsicht, dass Idiome oft nicht in ihrer vollständigen Form verwendet werden, wenn eine Eingabe wie catches the worm in elektronischen Wörterbüchern nicht mit early bird in Verbindung gebracht wird – wie in „LDOCE5-online“? Hier besteht noch erheblicher Spielraum für Verbesserungen, deren Umsetzung zwar nicht an die Idee eines Referenzkonstruktikons gebunden ist, deren Notwendigkeit aber durch die konstruktionistische Sprachauffassung noch unterstrichen wird.12 Zudem führt dieser Ansatz auch zur Identifizierung mancher Konstruktionen, die durch die strikte Trennung von Syntax und Lexik bisher nicht im Fokus der Deskription standen. Wo wäre etwa folgende im Englischen sehr geläufige Konstruktion zu verorten (Herbst 2016)? [502]

the NUM of PRON

12 zu einem Plädoyer, Mehrwortausdrücke als Lemmata zu behandeln, vgl. Gouws (2010: 61), zu Fragen der Zugriffsstruktur und Zugriffspfaden siehe Wiegand (2008). Im elektronischen Konstruktikon stellt sich daher auch das Problem nicht, dass eine Klassifikation einer gesuchten Einheit als Idiom vom Benutzer erwartet werden würde; vgl. für Printwörterbücher Wiegand (2010: 167).

176

Thomas Herbst

Für traditionelle Wörterbücher ist eine systematische Erfassung dieser Konstruktion kaum möglich, weil sie angesichts von Formen wie the two of us, the three of them etc. lemmamäßig kaum lokalisiert werden kann. Wenig überraschend bleiben entsprechende Suchanfragen in den einsprachigen englischen Lernerwörterbüchern erfolglos.13 In Grammatiken wie der „Comprehensive Grammar of the English Language“ oder der „Cambridge Grammar of the English Language“ ist die Konstruktion zwar erfasst, aber schwer auffindbar.14 Auch zweisprachige Wörterbücher – wie „PONS online“ – führen zu keinem wirklich befriedigendem Ergebnis15 – wohl aber „dict.cc“. Aus einer kontrastiven Perspektive mit dem Deutschen ist diese Konstruktion deshalb so interessant, weil sie die weitaus etabliertere Form des Referierens auf eine kleine Zahl von Personen darstellt: L1-Sprecher des Englischen werden wohl mit hoher Wahrscheinlichkeit the two etc. of us etc. verwenden, wo deutsche Muttersprachler wir zwei etc. sagen würden (Herbst 2016). Insofern hat diese Konstruktion ihren Platz in einem Konstruktikon. Gegenüber einer Grammatik und einem Wörterbuch ergibt sich in zweierlei Hinsicht ein Mehrwert eines e-Konstruktikons: gegenüber dem Wörterbuch, weil es eine generalisiertere Version der Konstruktion wie [502] bieten kann; gegenüber der Grammatik, wenn das Konstruktikon so gestaltet ist, dass es eine lexikalisch basierte Suchanfrage erlaubt, die Benutzer also von the two of us oder the three of them zur allgemeinen Beschreibung der Konstruktion führt, ohne dass terminologische Kenntnisse erforderlich sind.

4 Darstellung von Valenz in einem Konstruktikon 4.1 Valenz- und Argumentstrukturkonstruktionen In ähnlicher Weise kann ein Konstruktikon auch die Informationen zur Valenz um eine wichtige Dimension erweitern, und zwar in Richtung der mit der vor allem von Adele Goldberg entwickelten Theorie der Argumentstrukturkonstruktionen verbundenen Erkenntnisse. Goldbergs Modell und valenztheoretische Ansätze sind kompatibel und komplementär, weil letztere wichtige Generalisierungen in Bezug auf die Bedeutung von Patterns nicht vornehmen, Goldbergs Modell hingegen nicht gut erklären kann, warum manche Verben in bestimmten Argumentstrukturkonstruktio-

13 Eine Suche nach the two of us lieferte in den Online-Versionen des OALD9, LDOCE5 und MEDAL (September 2011) keine Ergebnisse. 14 In der „Cambridge Grammar of the English Language“ (2002: 539) ist diese Konstruktion als „partitive construction“ unter der Überschrift „Criteria for determinatives“ zu finden, wobei hier auch all, both, certain etc. zusammen mit Kardinalzahlen aufgeführt sind. 15 Das „PONS Online-Wörterbuch“ [accessed November 2015] liefert bei einer Suche Englisch → Deutsch für the two of us bzw. them immerhin wir beide/die beiden; in der umgekehrten Richtung für ihr zwei etc. aber nur you two/three/four.

Wörterbuch war gestern

177

nen nicht vorkommen (Herbst 2011a).16 Aus diesem Grund ist es notwendig, dass alle (bzw. alle in Bezug auf den Zweck des Konstruktikons relevanten) Valenzkonstruktionen im Eintrag des jeweiligen Valenzträgers (also der entsprechenden lexical unit eines Verbs, Substantivs, Adjektivs etc.) aufgeführt werden. Dies kann – je nach intendierter Benutzergruppe – in der Form von (1) Patternillustrationen wie etwa im OALD917 oder in der Form von (2) abstrakten Patternangaben (Klotz/Herbst 2016) erfolgen:18 (1) (2)

sb/sth earns sth, sth earns sb sth, sb earns sth from sth a [SCU: NP|V-ing-CL|that_CL|NP_V-ing_CL]_earnact2_[PCU: NP] b [SCU: NP|V-ing-CL|that_CL|NP_V-ing_CL]_earnact3_[PCU1: NP]_[PCU2: NP] c [SCU: NP|V-ing-CL|that_CL|NP_V-ing_CL]_earnact3_[PCU1: NP]_[PCU2: for_NP] d [SCU: NP|V-ing-CL|that_CL|NP_V-ing_CL]_earnact3_[PCU1: NP]_[PCU2: from_NP]

Was die lexikografischen Darstellungsformen, die hier nicht im Vordergrund der Betrachtung stehen sollen, betrifft, ist an benutzerangepasste und mehrschichtige Strukturen zu denken, so dass Benutzer wählen können, ob sie zunächst eine „einfache“ Darstellung, wie in (1), oder die komplexere in (2) erhalten, wobei es natürlich möglich sein muss, im Bedarfsfall schnell von (1) zur präziseren Darstellung zu wechseln. Ebenso könnte man daran denken, die hellgrau markierten Informationen nur über eine mouse-over-Funktion oder Mausklick sichtbar zu machen.19 Wenn der Verbeintrag zu earn neben der Bedeutungsparaphrase auch noch eine semantische Beschreibung der Patterns wie die folgende aus dem „Valency Dictionary of English“ erhält, wird damit eine vollständige Beschreibung der verbspezifischen Valenzkonstruktionen gegeben, wobei der Terminus Valenzkonstruktion im Sinne der Konstruktionsgrammatik als Form-Bedeutungspaar zu verstehen ist (Herbst 2014a, 2014b):

16 Zum Verhältnis von Valenzansätzen und Argumentstrukturkonstruktionen siehe u.a. auch Jacobs (2009), Engelberg (2010), Engelberg et al. (2011), Stefanowitsch (2011), Herbst (2011a, 2014a) und Welke (2011). 17 Zu Patternsystemen in englischen Lernerwörterbüchern siehe u.a. Dziemianko (2012) oder Herbst (2009b). Für eine stärker semantisch ausgerichtete Beschreibung von Patterns s. Hanks (2013) und das „Pattern Dictionary of English Verbs“. Zur Valenzbeschreibung des Deutschen siehe „VALBU“ (2004). 18 Diese Notation orientiert sich an den in Herbst/Schüller (2008) dargelegten Kategorien; vgl. Herbst (2014a): SCU steht für subject complement unit (‚Valenzergänzung des Verbs in der Funktion des Subjekts‘), PCU für predicate complement unit (‚Valenzergänzung des Verbs im Prädikat‘). 19 Dasselbe gilt natürlich für Abkürzungen wie SCU oder NP, die durch mouse-over-Funktionen unmittelbar erklärt werden könnten.

178

Thomas Herbst

Der Mehrwert eines Konstruktikons besteht darin, dass es neben den einzelverbspezifischen Valenzkonstruktionen auch abstrahierte Argumentstrukturkonstruktionen zu erfassen vermag, wobei Beschreibungen ähnlich den von Goldberg (1995, 2006) vorgeschlagenen gegeben werden könnten: so würde man von Pattern (2b) von earn zu einer allgemeinen Beschreibung der ditransitive construction gelangen:20

Abb. 2: Die ditransitive construction in Anlehnung an Goldberg (1995: 142) mit valenztheoretischer Erweiterung.

Fürderhin wäre durchaus in Erwägung zu ziehen, in einem Konstruktionseintrag das gesamte Spektrum der für eine Konstruktion festzustellenden Bedeutungen mit Angaben zu den entsprechenden Verben bzw. Verbgruppen zu liefern, wie es Goldberg (1995: 38) für die ditransitive Konstruktion ausführt:

20 Die Bedeutungsparaphrase der Konstruktion entspricht Goldbergs (1995: 38) Beschreibung des „central sense“ der Konstruktion. Diese Darstellung basiert auf Goldberg (1995: 142), wobei „SUBJ“, „OBJ“ und OBJ2 durch SCU und PCU ersetzt wurden; die formalen Realisierungen sollten hier noch spezifiziert werden.

Wörterbuch war gestern

179

Abb. 3: Bedeutungsspektrum der ditransitive construction (Goldberg 1995: 38).

Es muss wohl nicht eigens betont werden, dass die Realisierung dieser hier skizzierten Verbindung von Valenzwörterbuch und Argumentstrukturkonstruktikon erheblichen Deskriptionsaufwand mit sich bringen, sondern auch eine Lösung einiger nicht unwesentlicher Fragen beinhalten würde: Das betrifft insbesondere die Frage formaler Variation – repräsentieren etwa She wants an ice-cream und She wants to have an ice-

180

Thomas Herbst

cream Allostruktionen einer Konstruktion oder zwei verschiedene Konstruktionen? Außerdem wäre es in diesem Zusammenhang aber außerordentlich interessant zu sehen, inwieweit sich überhaupt alle Valenzkonstruktionen von Verben ohne Weiteres unter sehr generelle Argumentstrukturkonstruktionen subsumieren lassen.21 Die hierfür erforderliche empirische Deskription verspricht wesentliche Rückwirkungen auf die linguistische Theoriebildung.

4.2 Das Kollostruktikon im Konstruktikon Eine zweite denkbare Erweiterung der in bisherigen Valenz- und Lernerwörterbüchern gegebenen Information zur Valenz betrifft die lexikalische Füllung der Leerstellen der Valenzkonstruktion. Hier bietet sich eine lexikografische Umsetzung der von Stefanowitsch/Gries (2003) entwickelten Methode der collostructional analysis an, mit der sozusagen die „Anziehungskraft“ einer Konstruktion auf bestimmte Wörter ermittelt werden kann.22 Mit diesem oder ähnlichen Verfahren lassen sich durchaus interessante – und lexikografisch bzw. kollostruktografisch relevante – Einsichten erzielen. So zeigt eine (auf der Basis einer treebank.info-Analyse des BNC erfolgte) Analyse des Verbs earn, dass die zweivalente Valenzkonstruktion bevorzugt andere Nomina im SCU-slot anzieht als die dreivalente: (3)

a b

Yes, I don’t earn much money, but I’m happy in my job. And in any case his degree was good enough to earn him, as Robyn’s did for her, a Major State Studentship to do postgraduate research.

Tabelle 1: Subjekte des Verbs earn (alle morphologischen Formen; BNC, treebank-info-Analyse). Häufigste 20 Substantivformen in Subjektsfunktion mit earn in zweivalenter Verwendung (mit direktem Objekt) nsubj noun earn ∀ dobj iobj ccomp xcomp23

Häufigste 20 Substantivformen in Subjektsfunktion mit earn in dreivalenter Verwendung (mit zwei Objekten) nsubj noun earn ∀ dobj iobj ccomp xcomp

people

35

110,3781 goal

11

129,9004

women

22

108,6215 victory

6

61,4627

21 Ein weiteres Problem betrifft die Frage, ob man – wie Goldberg – die in einer Konstruktion vorkommenden Verben in semantische Gruppen zusammenfassen soll oder nicht. Auch das wirft erhebliche theoretische Probleme auf; vgl. Faulhaber (2011). 22 vgl. Gries und Stefanowitsch (2004a, 2004b), Stefanowitsch (2013, 2014); zu einer Kritik dieses Verfahrens siehe Bybee (2010: 97–101). 23 Um nur Verwendungen mit dem direkten Objekt zu erfassen, wurden die Kategorien „iobj“, „ccomp“ und „xcomp“ für die linken Spalten der Tabellen 1, 2 und 3 ausgeschlossen; für die rechten Spalten nur die beiden letzten Kategorien. In Tabelle 1 wurde „nsubj“ als „noun“ spezifiziert, in Tabellen 2 und 3 „dobj“.

181

Wörterbuch war gestern

Häufigste 20 Substantivformen in Subjektsfunktion mit earn in zweivalenter Verwendung (mit direktem Objekt) nsubj noun earn ∀ dobj iobj ccomp xcomp23

Häufigste 20 Substantivformen in Subjektsfunktion mit earn in dreivalenter Verwendung (mit zwei Objekten) nsubj noun earn ∀ dobj iobj ccomp xcomp

men

20

95,299 skills

5

41,5928

man

17

53,4902 success

4

26,4909

workers

15

97,7477 monopolist

3

58,86

players

9

60,4342 dancing

3

31,8385

banks

7

45,0749 achievement

3

29,7939

husband

7

36,8473 career

3

22,0959

father

7

23,0711 act

3

11,7258

money

7

15,1265 form

3

9,9766

well

7

0,2777 deeds

2

26,9646

husbands

6

2

21,4216

worker

6

47,1412 performances

2

21,2084

person

6

16,3924 courage

2

19,9229

girl

5

17,8396 habit

2

19,4517

members

5

9,462 jump

2

18,8185

company

5

6,353 penalty

2

18,3941

children

5

2

18,0176

hunt

4

30,5377 goals

2

15,1167

clubs

4

26,4051 goal

11

129,9004

69,4876 wins

5,0537 contributions

Es zeigt sich, dass sich für zweivalente Verwendung von earn bevorzugt Subjekte mit dem Merkmal ‚belebt‘ bzw. ‚human‘ finden, was bei der dreivalenten Verwendung nicht der Fall ist. Während die Erklärung hierfür naheliegt, ist die Tatsache, dass sich die lexikalischen Präferenzen für die direkten Objekte ebenfalls deutlich unterscheiden, nicht ganz so offensichtlich: Tabelle 2: Direkte Objekte des Verbs earn (alle morphologischen Formen; BNC, treebank-infoAnalyse). häufigste 20 Substantivformen in der Funktion eines direkten Objekts in Sätzen ohne indirektes Objekt [nsubj earn verb ∀ dobj noun iobj]

häufigste 20 Substantivformen in der Funktion eines direkten Objekts in Sätzen mit indirektem Objekt [nsubj earn verb ∀ dobj noun iobj]

money

160

1566,455 place

23

176,2361

living

106

1166,272 nickname

13

262,6088

46

584,7626 reputation

13

173,3237

reputation

182

Thomas Herbst

häufigste 20 Substantivformen in der Funktion eines direkten Objekts in Sätzen ohne indirektes Objekt [nsubj earn verb ∀ dobj noun iobj] interest

41

place

36

income

27

wage

26

respect

häufigste 20 Substantivformen in der Funktion eines direkten Objekts in Sätzen mit indirektem Objekt [nsubj earn verb ∀ dobj noun iobj]

273,4209 respect

12

122,9343

171,5474 title

11

110,5382

210,2803 award

11

96,6513

297,3197 money

10

60,4539

26

213,5364 name

8

51,3548

return

20

118,4535 points

7

53,4911

wages

19

192,899 draw

5

43,1617

right

19

31,0861 hour

5

37,3196

profits

18

156,0108 right

5

9,7527

points

17

101,6822 win

4

27,7958

nickname

14

225,5375 fine

4

25,4982

rate

14

65,7767 living

4

23,3959

lot

14

51,5414 man

4

9,6798

praise

13

148,8109 sobriquet

3

69,1572

salary

13

140,7638 mbe

3

56,749

pounds

12

65,9817 admiration

3

39,0785

bonus

11

124,9018 promotion

3

28,2551

Hier ergeben sich 9 Übereinstimmungen unter den zwanzig häufigsten Substantiven. Auffälliger sind diesbezügliche Unterschiede beim Verb show, wo sich unter den 30 häufigsten Substantiven, die als direktes Objekt in Patterns ohne und mit direktem Objekt in einer treebank-info-Analyse des BNC ausgewiesen werden, nur vier Übereinstimmungen finden.24

24 Im Gegensatz zu den Tabellen 1 und 2 wurden in dieser Analyse auch clausal subjects zugelassen und Passivsätze ausgeschlossen.

183

Wörterbuch war gestern

Tabelle 3: Direkte Objekte des Verbs show (alle morphologischen Formen; BNC, treebank-infoAnalyse). häufigste 30 Substantive in der Funktion eines direkten Objekts in Sätzen ohne indirektes Objekt [show verb ∀ dobj noun iobj nicht-lemmatisiert]

häufigste 30 Substantive in der Funktion eines direkten Objekts in Sätzen mit indirektem Objekt25 [show verb ∀ dobj noun iobj nicht-lemmatisiert]

signs

636

7782,27 way

33

113,4226

interest

457

2839,285 room

19

97,2476

sign

236

1831,737 door

15

76,03

increase

214

1162,11 house

13

35,9446

1032,8 respect

improvement

130

11

71,9728

evidence

128

443,4149 place

11

26,7425

results

126

535,7516 video

10

74,2376

number

116

152,7937 book

10

38,6196

pattern

115

627,8294 world

9

14,2089

concern

109

537,4269 pictures

8

58,8196

effect

109

309,765 picture

8

43,7481

differences

108

613,0476 piece

7

38,8686

difference

101

454,9051 list

7

32,7603

7

2,7517

6

51,8366

way

93

7,11 work

decline

92

growth

87

326,713 card

6

38,5081

609,9113 photograph

changes

87

240,2458 pair

6

37,6411

teeth

82

525,6816 letter

6

24,686

support

82

127,7385 series

6

23,5657

work

81

3,1921 path

5

28,7759

change

80

116,0137 animal

5

27,3329

correlation

77

740,3132 range

5

12,9478

degree

75

304,1153 love

5

11,8486

relationship

75

255,0623 kind

5

11,2046

commitment

73

399,9053 car

5

9,8005

distribution

73

378,5463 photos

4

43,1442

promise

72

469,3416 teeth

4

23,6624

range

72

156,2202 direction

4

16,8398

25 Die folgenden Elemente wurden manuell aus der rechten Liste entfernt: (something 48–296,5318, everything 7–26,2952, er 4–0,6857, one 6 – -6,9341.

184

Thomas Herbst

häufigste 30 Substantive in der Funktion eines direkten Objekts in Sätzen ohne indirektes Objekt [show verb ∀ dobj noun iobj nicht-lemmatisiert]

häufigste 30 Substantive in der Funktion eines direkten Objekts in Sätzen mit indirektem Objekt25 [show verb ∀ dobj noun iobj nicht-lemmatisiert]

face

71

81,0201 variety

4

16,641

people

71

-8,2398 mark

4

13,2193

Es muss betont werden, dass es sich hierbei um Präferenzanalysen und nicht um Akzeptabilitätsurteile handelt: Alle Substantive, die in Tabelle 3 rechts aufgeführt sind, kommen auch in Sätzen ohne indirektes Objekt vor; im BNC sind jedoch 13 der häufigsten Substantivformen aus der zweivalenten Verwendung nicht im dreivalenten Pattern belegt (was durch die Kursivsetzung in Tabelle 3 zum Ausdruck gebracht wird).26 Für die Zwecke eines Referenzkonstruktikons wäre es durchaus vorstellbar, die Angaben zur Valenz von Verben und anderen Valenzträgern durch die Möglichkeit zu ergänzen, Listen von Wörtern angezeigt zu bekommen, die in bestimmten Slots einer Konstruktion besonders häufig vorkommen, also ein Kollostruktikon im Konstruktikon zu schaffen. Selbstverständlich betrifft dies in erster Linie ein Konstruktikon mit wissenschaftlicher Zielsetzung; ein solches Tool könnte aber durchaus auch gewinnbringend im aktiven Sprachunterricht eingesetzt werden.

5 Mehrworteinheiten II 5.1 Frequenz Wenn man Sprache als Netzwerk von Konstruktionen sieht, besteht kein fundamentaler Unterschied zwischen Valenzkonstruktionen und zum Beispiel Kollokationen.27 Auch wenn sich Valenz- und Kollokationsforschung im traditionellen Sinn als relativ selbständige Gegenstandsbereiche gesehen haben mögen, beleuchten sie doch nahe beieinander liegende Bereiche des lexikogrammatischen Kontinuums, wobei es durchaus einen Überlappungsbereich zwischen diesen Schlaglichtern gibt. Insofern scheint es angebracht, die Möglichkeiten, die die moderne Korpuslinguistik in Hinblick auf die Berechnung von Wortassoziationen bietet, nicht nur als Basis für lexikografische Arbeit zu nutzen, sondern die Ergebnisse dieser Analysen explizit in ein Konstruktikon aufzunehmen. Das „Oxford Collocations Dictionary for students of 26 Prinzipiell stellt sich bei einem geringen Übereinstimmungsgrad natürlich die Frage, ob ein Valenzträger als polysem zu beschreiben wäre. 27 vgl. in diesem Zusammenhang auch die Argumentation von Heid (2005: 102–110) zu Kollokationen im Kontext, sowie zu Mehrwortvalenzträgern (Heid 2006).

Wörterbuch war gestern

185

English“ gibt z.B. Kollokatoren, die von der Bedeutung her sehr ähnlich sind, in alphabetischer Reihenfolge: repercussion noun ► ADJ. considerable, important, major, serious, significant | wide/widespread | international | economic, political, social …

Über Frequenz wird hier keinerlei Aussage getroffen. Eine Suche im „British National Corpus“ ergibt aber deutliche Frequenzunterschiede: Tabelle 4: Adjektivkollokatoren von repercussion ∀ (BNC, span: ‒3 ‒1). Vorkommen considerable important

mutual information

T-score

6

41.024

6.3518

2.4195

10

50.8082

5.0564

3.0672

3

11.1501

4.0333

1.6263

25

230.2627

8.059

4.9813

4

22.2903

5.4255

1.9535

major serious

log-likelihood

significant

In verschiedenen Methoden der Berechnung der Assoziation zwischen den beiden Wörtern erreicht jeweils serious repercussion(s) den höchsten Wert.28 Auch wenn solche Daten nicht überbewertet werden dürfen angesichts einer Reihe von Faktoren, die vor allem die Repräsentativität und Größe der Korpora betreffen – die natürlich bei der Untersuchung von Kollokationsphänomenen wesentlich kritischer sind als etwa bei einer Analyse des Gebrauchs des present perfect –, wäre anzustreben, dass ein Konstruktikon (was im Übrigen auch für herkömmliche Kollokationswörterbücher gilt) Frequenzunterschiede zwischen verschiedenen Kollokatoren verdeutlicht. Eine noch feinkörnigere Darstellung müsste im Sinne einer gebrauchsorientierten Sprachauffassung außerdem deutlich machen, dass die Pluralform serious repercussions signifikant häufiger ist als der Gebrauch im Singular – was übrigens für das Substantiv repercussion generell gilt: Tabelle 5: Singular und Plural von serious repercussion ∀ (BNC; span: ‒3 ‒1).

BNC COCA

serious repercussion

serious repercussions

repercussion

repercussions

0

0.22 ipm

0.12 ipm

3.07 ipm

0.002 ipm

0.108 ipm

0.14 ipm

3.14 ipm

28 Zu den unterschiedlichen Assoziationsmaßen siehe u.a. Hoffmann et al. (2008: 150–158).

186

Thomas Herbst

5.2 Kollokationen und Konstruktionen? Aus einer kognitiven Perspektive erscheint unter Umständen auch die Frage nach dem Phänomen der Kollokation in einem etwas anderen Licht als etwa in der weitgehend auf Fremdsprachenlerner und Fremdsprachenlexikografie orientierten Kollokationstheorie Hausmanns (1984, 1985).29 Wenn man (wie Bybee 2010: 28) Kollokationen als Konstruktionen betrachtet und Konstruktionen (wie Goldberg 2006: 5) durch Nicht-Kompositionalität oder/und Frequenz bestimmt sieht, so wird auch die Polarität zwischen einem signifikanz- und einem frequenzorientierten Kollokationsbegriff hinfällig: In der kognitiven Linguistik geht man davon aus, dass Mehrworteinheiten gespeichert werden, weil sie kognitiv salient sind oder aufgrund hoher Frequenz entrenchment stattfindet – wobei allerdings alles andere als klar ist, warum eine Verbindung zwischen zwei Wörtern als salient empfunden wird oder woraus sich die „sufficient frequency“ aus Goldbergs eingangs zitierter Konstruktionsdefinition ergibt.30 Unter Umständen ist die Schwelle für eine Speicherung sprachlicher Einheiten sehr niedrig anzusetzen.31 Legt man Hausmanns (2007: 218) Beschreibung des Kollokators als ein Wort, „das beim Formulieren in Abhängigkeit von der Basis gewählt wird und das folglich nicht ohne die Basis definiert, gelernt und übersetzt werden kann“ zugrunde, so stellt sich sehr die Frage, ob es sich bei serious repercussions um eine Kollokation im Hausmannschen, auf Unvorhersagbarkeit der Kombination abzielenden Sinn handelt: Man kann sich durchaus vorstellen, dass eine Person das Wort serious artikuliert (bzw. gewählt) hat, bevor sie sich für repercussions oder consequences etc. entscheidet. Das Wort serious tritt in Kombination mit zahlreichen anderen Substantiven (fraud, problem(s), threat, damage etc.) auf, und zwar mit einer Bedeutung, die mit der in serious repercussions vergleichbar ist und die zum Beispiel im Macmillan Dictionary-online als „bad or dangerous enough to make you worried“ an erster Stelle angegeben ist.

29 vgl. in diesem Zusammenhang auch Hausmann (2007), Herbst (1996 und 2011b), Siepmann (2005) und Schmid (2014). 30 Dąbrowska (2014) legt für den von ihr zum Zwecke der Bestimmung der Kompetenz von Sprechern entwickelten Words-that-go-together-Test folgende Werte zugrunde: t-score ≥ 2, MI score ≥ 3, 5 or 10 ipm; für Distraktoren einen MI < 2. Zu den mathematischen Grundlagen dieser Werte siehe Evert (2005, 2008: 1224–1228, 1242–1245); siehe auch Stubbs (1995/2007). 31 Bybee (1995: 428) argumentiert, dass unregelmäßige Verben in Sprachen immer zu den hochfrequenten Verben zählen. Die Tatsache, dass das Englische aber über eine Reihe von Pluralformen (radii 0.49 ipm im BNC; anaphora 0.51 ipm, narcissi 0.4 ipm, croci 0.02 ipm, desiderata 0.18 ipm) von Substantiven verfügt, die nicht mit hoher Frequenz auftreten, könnte ein Gegenargument darstellen. Allerdings sind auch die Singularformen dieser Wörter nicht in jedem Fall wesentlich häufiger (anapher 0.6 ipm, radius 6.55 ipm, narcissus 0.59 ipm, crocus 0.56 und desideratum 0.09) und in manchen Fällen finden sich auch regelmäßige Pluralformen (anaphers 0.44 ipm, crocuses 0.51), was durchaus in Einklang mit Bybees Theorie steht.

Wörterbuch war gestern

187

Tabelle 6: heavy, serious und severe als Kollokatoren von Substantiven ∀ (BNC; span ‒1‒1).

Der absoluten Frequenz kommt in exemplar models eine wichtige Rolle zu: “[…] because exemplars are strenghtened as each new token of use is mapped onto them, highfrequency exemplars will be stronger than low-frequency ones, and high-frequency clusters – words, phrases, constructions ‒ will be stronger than low-frequency ones.” (Bybee 2010: 24)

Dabei stellt sich allerdings die Frage, welche Rolle die Faktoren spielen, die in die Berechnung von Assoziationsmaßen wie dem log-likelihood-Wert oder dem mutual information score zugrundeliegen, die in Bezug auf die Salienz einer Kollokation durchaus wichtig sein könnten:

188

Thomas Herbst

Tabelle 7: heavy, serious und severe als Kollokatoren von Substantiven ∀ (BNC; span ‒1‒1): loglikelihood.

Tabelle 8: heavy, serious und severe als Kollokatoren von Substantiven ∀ (BNC; span ‒1‒1): mutual information.

Es ist offensichtlich, dass sich bei den unterschiedlichen Assoziationsmaßen Unterschiede in Bezug auf die relative Assoziationsstärke zwischen den Kollokationspartnern ergeben, die sich z.B. auch auf die Reihenfolge der „Anziehungskraft“, die zum Beispiel heavy und serious auf bestimmte Substantive ausüben, auswirkt:

Wörterbuch war gestern

189

Tabelle 9: Assoziationsstärke bestimmter Substantive ∀ zu heavy und serious (BNC; span ‒1‒1). heavy

serious

absolute Frequenz

log-likelihood

mutual information

absolute Frequenz

log-likelihood

mutual information

fine

fine

fine

consequence

consequence

repercussion

penalty

penalty

penalty

effect

repercussion

effect

sentence

punishment

punishment

repercussion

effect

consequence

punishment

sentence

sentence

penalty

penalty

penalty

sanction

sanction

sanction

punishment

punishment

punishment

effect

effect

effect

Im Augenblick sind wir wohl von der Beantwortung der Frage, ob die Speicherung von Mehrworteinheiten im menschlichen Gehirn eher auf der Basis von Tabelle 6, 7 oder 8 erfolgt, noch ein ganz schönes Stück entfernt, auch wenn manche Evidenz in Richtung einer dominanten Rolle der absoluten Frequenz zu deuten scheint.32 Für lexikografische bzw. konstruktikografische Zwecke sind diese Unterschiede wohl vernachlässigbar. In Hinblick auf die Semantik (und damit auch auf Hausmanns Kriterium der Übersetzungsschwierigkeit)33 zeigen diese Analysen jedoch auch, dass heavy eher als intensifier für eine von Menschen verhängte oder beeinflusste Konsequenz (einer Tat oder eines Handelns) verwendet wird, während serious eine stärker von außen bestimmte Schwere signalisiert. Insofern weisen die hier betrachteten Kollokationen durchaus eine semantische Motiviertheit auf, wobei eine mangelnde Vorhersehbarkeit wohl vor allem in Bezug auf die niedrigen Werte für severe fine(s) zu konstatieren ist.34 Bis zu einem gewissen Grad ist das jedoch irrelevant, jedenfalls dann, wenn man

32 Zu diesbezüglichen neurolinguistischen Untersuchungen siehe Alexandrov et al. (2011). 33 Was Schwierigkeiten bei der Übersetzung oder der fremdsprachlichen Produktion angeht, so bestehen diese bestenfalls darin, dass bei repercussions, jedenfalls wenn man die absoluten Zahlen aus dem BNC oder aus COCA zugrundelegt, alternative Ausdrucksweisen, die bei consequences (serious) oder effect (serious und heavy) belegt sind, nicht etabliert erscheinen: Dabei ist allerdings zu berücksichtigen, dass ein einziges Vorkommen einer Verbindung in einem Korpus bereits zu einem unter Umständen als signifikant einzustufendem log-likelihood-Wert führen kann. Die in Tabellen 7 und 8 angegebenen Werte beziehen sich auf das BNC; in COCA, das mit 450 Millionen Wörtern deutlich größer ist als das BNC, finden sich entsprechend auch einige der im BNC nicht belegten Kombinationen, z.B. heavy consequences (3; 0,06 ipm), serious verdict (1), heavy fee (2) und heavy fees (1). 34 Letztlich ist man dann wieder bei der Zirkularität angelangt, dass, wenn das Kollokationsverhalten eines Kollokators als Teil seiner Bedeutung gesehen wird, es keine semantisch signifikanten Kollokationen geben kann; wenn nicht, dann schon: Wenn das Denotat (im Sinne eines potentiellen Referenzbereichs) von Wörtern wie flock und herd als Teil der Wortbedeutung analysiert wird, ist flock of sheep

190

Thomas Herbst

die Bedeutung lexikalischer Einheiten als aus dem Gebrauch emergierend betrachtet (weil sich dann die Bedeutung aus der Kollokation und nicht die Kollokation aus der Bedeutung ergibt). Für die Konzeption eines Referenzkonstruktikons bedeutet dies, dass – ganz im Hausmannschen Sinne – unter der Basis (also etwa repercussion oder besser noch repercussions)35 die wichtigsten Kollokatoren angegeben werden sollten, allerdings mit einer Darstellung der Frequenz einer Verbindung:36

Dass bei diesem Vorgehen Kollokatoren unter der Basis gelistet werden, die nach Hausmanns Verständnis keine sind, ist bei einem Referenzkonstruktikon, das im Gegensatz zu den Printwörterbüchern, auf die sich Hausmanns Theorie primär bezieht, nicht unbedingt ein Nachteil; denn immerhin illustrieren sie ebenfalls wichtige Verwendungen der Basis. Aus demselben Grund können solche Listen auch für Adjektive in Bezug auf die Nomina, mit denen sie häufig vorkommen, in einem Konstruktikon enthalten sein:37 natürlich keine Kollokation im Hausmannschen Sinne; wenn flock und herd die Bedeutung ‚Gruppe von Tieren‘ zugewiesen wird, dann ist das Wissen darum, dass es herd of cows und nicht flock of cows heißt, Kollokationswissen. Letztlich ist das eine Frage der Analyse und keine Frage, die im Gegenstand selbst angelegt ist (siehe Herbst 1996). 35 Die Singularform repercussion findet sich im BNC nur 12 mal (0.12 ipm); vgl. auch Verlinde, Binon und Selva (2006) und Binon/Verlinde (2013) zur Darstellung von Kollokationsinformation im elektronischen Medium. 36 Das bedeutet nicht automatisch, dass andere Assoziationsmaße bei der Auswahl der anzugebenden Kollokatoren nicht einbezogen werden sollten – zumindest in der Weise, dass einigermaßen sichergestellt ist, dass Kollokationen im eigentlichen Hausmannschen Sinne auf jeden Fall in der angegebenen Kollokatorenliste enthalten sind. 37 Es kann an dieser Stelle nur um eine exemplarische Darstellung gehen. Es ist offensichtlich, dass hier wie in jedem Wörterbuch Probleme dahingehend ergeben, wie viele Bedeutungsparaphrasen man ansetzt und welche Kollokatoren man welchen Bedeutungsparaphrasen zuordnet. So wären consideration (1.15 ipm), business (1.14 ipm), matter (0.98 ipm) und attempt (0.97 ipm), die eine Kollokationsanalyse des BNC von serious aufführt, premodifier-head constructions mit serious in anderen Bedeutungen zuzuordnen.

Wörterbuch war gestern

191

6 Wortklassenangaben und Phrasenkonstruktionen 6.1 Wortklassenangaben Da es sich bei einem Referenzkonstruktikon um ein völlig neuartiges Nachschlagewerk handelt, bietet sich ‒ je nach Zielpublikum und Zweck ‒ auch die Chance, terminologischen Ballast über Bord zu werfen und die im Konstruktikon gegebenen Beschreibungen in einer der jeweiligen Sprache angemessenen Terminologie vorzunehmen. Das bedeutet einerseits, dass Valenzbeschreibungen in einer einfachen formalen Terminologie erfolgen können, ohne dass für das Englische problematische (weil in unterschiedlichen Ansätzen verschieden definierte und oft nur prototypisch zu definierende) Termini wie Objekt oder unterdifferenzierende Termini wie transitiv oder intransitiv zum Einsatz kommen müssten. Dies gilt insbesondere auch für Wortklassenangaben. Zwar wird auch eine radikale Hinterfragung der traditionellen Wortklasseneinteilung nicht dazu führen, Wortklassenangaben wie Substantiv, Verb oder Adjektiv aufzugeben. Wohl aber lässt sich fragen, ob solche Angaben immer sinnvoll sind. Und man muss an die Frage der Wortklassenangaben nicht einmal sehr radikal herangehen, um die Angemessenheit von Angaben wie Konjunktion oder Präposition oder Determiner und Pronomen für das Englische in Frage zu stellen. Für Wortklassenangaben in einem Referenzkonstruktikon sollten folgende Prinzipien gelten: 1. Wortklassenangaben werden nur gemacht, wenn sie generalisierend verschiedene Eigenschaften von Wörtern erfassen und all diese Eigenschaften vom entsprechenden Lemma erfüllt werden.

192

2.

3.

Thomas Herbst

Die mit einer Wortklassenangabe verbundenen Eigenschaften sind im Konstruktikon (im Sinne der Wörterbuchgrammatik von Wiegand 1985: 96) beschrieben und im elektronischen Medium bei jedem Eintrag abrufbar. Angaben zur syntaktischen Verwendung von Wörtern, die durch eine Wortklassenangabe nicht hinreichend präzise gegeben werden können, werden in der Form von Patterns dargestellt.

Das englische Wort open kann hier zur Verdeutlichung herangezogen werden. Es ist sicherlich sinnvoll, im Englischen ein Adjektiv open zu identifizieren, weil die gängigen Definitionskriterien darauf zutreffen:38 (3)

a b c d

Here and there the open doors of furnaces glowed a dangerous red … ‘The pubs were open, were they, Mr Stratton?’ asked Lewis. In very open country, the judgement of heights, even down below 200 or 300 feet, is surprisingly difficult. The country is more open here, with fewer trees and flatter ground.

Ebenso erfüllt open die Kriterien der Wortklasse Verb: (4) Robyn opens a drawer in her desk …

Insofern ist gegen eine Klassifikation von open als Adjektiv und als Verb in einem Wörterbuch wie dem OALD 9-online nichts einzuwenden; OALD 9 macht aber überdies die Angabe noun: Dafür werden die folgenden Beispiele gegeben: (5)

a b c

Children need to play out in the open. Government officials do not want these comments in the open. They intend to bring out their complaints out into the open.

Abgesehen von the bloody open – und anders gelagerten Fällen vom Typ the British and European Opens, die aber im OALD 9 in einem anderen Eintrag behandelt werden – kommt das sogenannte noun open nicht im Plural vor (was das OALD 9 anmerkt), nicht mit einem 's-Genitiv, nicht mit prämodifizierendem Adjektiv und nicht mit einer Postmodifikation, etwa einem Relativsatz. Zwar markiert das OALD9online in der Tat die phraseologischen Einheiten the open bzw. in the open/into the open, die Klassifikation als Substantiv erscheint aber zweifelhaft.

38 In Bezug auf Steigerbarkeit und Modifizierbarkeit können bei einigen Bedeutungen von open Einschränkungen angebracht sein.

Wörterbuch war gestern

193

6.2 Funktionswortklassen Funktionswörter wie since, before, after oder this, some und all sind gute Beispiele für Wörter, bei denen eine Angabe im Rahmen traditioneller Wortklassen wenig ergiebig ist. Was Fremdsprachenlerner als potentielle Benutzer angeht, so lässt sich mit Sicherheit sagen, dass diese neuen Klassifikationsversuchen zwar zum Teil recht skeptisch gegenüberstehen, und dass diese Skepsis zumindest nicht in einem auch nur approximativem Verständnis von Wortklassenbezeichnungen wie Präposition oder Konjunktion begründet wäre (Faulhaber/Herbst/Uhrig 2013). Traditionelle Beschreibungen des Englischen tendieren dazu, Wörter wie before gleich drei Wortklassen zuzuschreiben ‒ Präposition, Konjunktion und Adverb. Dies ist insofern unglücklich, als damit die tatsächlichen Verwendungsmöglichkeiten solcher Wörter nicht hinreichend beschrieben sind, weil die Item-Spezifik weiter geht als es diese Wortklassenbezeichnungen verdeutlichen (Herbst/Schüller 2008, Pullum 2009, Herbst 2009a). Ähnliches gilt für Wörter wie all, die als Determiners, Pronomen und ebenfalls als Adverben klassifiziert werden, ohne dass die Verwendungen von all und von before als Adverb sich durch bestechende Gemeinsamkeiten auszeichneten: (6) a b

What would they all think if they could see her now? ‘Ever been inside a factory before?’

Aus diesem Grund haben wir vorgeschlagen, für solche Wörter Patternangaben ähnlich denen der Valenzangaben von Verben zu machen (Faulhaber/Herbst/Uhrig 2013: 103–105), was in einem Referenzkonstruktikon natürlich absolut naheliegt, weil die entsprechenden phrasalen Konstruktionen durch Mausklick erreichbar sein müssen. Der Eintrag für before könnte also u.a. die folgenden Informationen enthalten: (7)

before + finite clause + NP + V-ing_CL ————— premodifiers: just, long, never, ever, X days/ weeks/ etc.

What would you say to another little drink before you go? Wycliffe drove back and arrived at his hotel just before midnight.

For five years she had worked at the Ashmolean before moving across the street to The Randolph … ‘Do you know, I’ve never met anyone before who’s quoted that thing correctly.’ It was just before mid-day when Lewis braked sedately outside the Downes’s residence …

But now, ten minutes before takeoff, Stratton felt most curiously relaxed …

194

Thomas Herbst

Eine stärker konstruktionistisch orientierte Darstellung könnte folgendermaßen aussehen:39

6.3 Phrasen Ähnlich wie in einem Konstruktikon Links von den Valenzkonstruktionen zu den abstrakteren Argumentstrukturkonstruktionen (und zurück) eingerichtet werden müssen, muss es auch möglich sein, von der [Premodifier-head construction mit serious als head] zu einer allgemeinen Noun Phrase construction oder von der beforeconstruction zu einer Prepositional Phrase construction zu gelangen.40

39 Aspekte der Darstellungsform und der Benutzerfreundlichkeit eines Referenzkonstruktikons sind stark von Zwecken und Zielgruppen bestimmt und daher nicht Gegenstand der vorliegenden Betrachtungen. Das betrifft natürlich auch Fragen der Terminologie und auch der gebotenen Informationen; die Frequenzunterschiede zwischen X years before und X minutes before etc. dürften beispielsweise für die meisten Benutzungszwecke negligabel sein; vgl. in diesem Zusammenhang die Darstellung von Kollokationen im BLF. 40 Vgl. Herbst/Schüller (2008: 89–92). Diese Darstellung orientiert sich am Konzept der Präposition, wie er in der Cambridge Grammar of the English Language (Huddleston & Pullum 2002), von (Herbst/ Schüller 2008) unter der Bezeichnung particle und von Aarts (2011) verwendet wird.

Wörterbuch war gestern

195

Kognitiv trägt die Aufnahme solcher Konstruktionen in ein Referenzkonstruktikon der Tatsache Rechnung, dass auch Sprecher einer Sprache, wenn auch in unterschiedlichem Ausmaß, Generalisierungen vornehmen (Goldberg 2006, Dąbrowska/ Lieven 2005, Dąbrowska 2014, Lieven 2014, MacWhinney 2014). Deskriptiv hat diese Art der Vernetzung den Vorteil, dass das Konstruktikon eine umfassende Beschreibung einer Sprache liefert, die in sich – auch in terminologischer Hinsicht – konsistent ist.

7 Allgemeine „grammatische“ Konstruktionen In Bezug auf die bisher dargestellten abstrakteren Konstruktionen bietet ein Konstruktikon gegenüber einer traditionellen Grammatik für die Benutzer dahingehend einen enormen Vorteil, dass keinerlei Terminologie oder „bewusstes Wissen über Sprache“ vorausgesetzt wird. Der Konsultationsprozess kann bottom up erfolgen, d.h. von item-spezifischen Konstruktionen gelangt man zur abstrakteren Konstruktionen, d.h. etwa vom Eintrag von some zum Eintrag Nominalphrase. Terminologie bzw. der

196

Thomas Herbst

dem Konstruktikon zugrundeliegende terminologische Apparat wird also nicht vorausgesetzt, sondern während der Benutzung erworben. Das Prinzip, den Zugriff auf Einträge für abstrakte grammatische Konstruktionen – unter anderem auch! – von Einträgen für bestimmte lexikalische Einheiten zu ermöglichen, lässt sich für eine große Anzahl von Konstruktionen durchführen, zum Beispiel für: – die present perfect- und past perfect-Konstruktionen (von have aus), – die past tense-Konstruktion (von den morphologischen Angaben zu Verben aus), – die progressive Konstruktion (von be aus), – die Passivkonstruktion (von allen Verben aus, die im Passiv vorkommen). Allerdings lassen sich nicht alle Konstruktionen einer Sprache in dieser Weise sinnvoll an lexikalische Einheiten binden. Aus diesem Grund muss das Konstruktikon natürlich auch über eine andere Zugriffsmöglichkeit auf allgemeine Informationen in der Form einer Liste von Themen oder Termini verfügen, die ebenfalls zu den Einträgen für diese abstrakteren Konstruktionen führen. Ebenso offensichtlich ist, dass man von will oder going to zu einer Übersicht über alle Konstruktionen kommen muss, mit denen im Englischen auf Zukünftiges referiert werden kann.41

8 Weitere Features eines Referenzkonstruktikons 8.1 Die onomasiologische Komponente Diese generelle Konzeption der Zugriffsstruktur eines Referenzkonstruktikons ist kompatibel mit der Idee einer onomasiologischen Nutzungsfunktion, die den systematischen Ausbau der in vielen englischen eLernerwörterbüchern der heutigen Generation bereits recht weit entwickelten thesaurus-ähnlichen Zugriffsstrukturen bzw. die die Übernahme von Gruppierungen aus Thesauri wie dem „Oxford Learner’s Thesaurus“ bedeutet. Es ist offensichtlich, dass – jedenfalls im Fremdsprachenkontext – ein Grundproblem von Thesauri wegfällt, nämlich dass sie Spezialwörterbücher sind, also ein zweites Nachschlagewerk darstellen. Eine entsprechende semantische Verlinkung einzelner lexikalischer Einträge in diese Richtung könnte eine neue Dimension hinsichtlich eines tools für die Sprachproduktion eröffnen.42

41 vgl. in diesem Zusammenhang auch die Konzeption einer Wörterbuchgrammatik von Bergenholtz (1985: 249). 42 vgl. z.B. die Ausführungen von Heid/Gouws (2006) zu erinnern und in Erinnerung rufen, sowie das Konzept der Probabeme (Herbst 2011b, Klotz/Herbst 2016).

Wörterbuch war gestern

197

8.2 Lernerwörterbuch plus Es wäre verfehlt, die Entwicklung eines Referenzkonstruktikons auf der Basis der hier geschilderten Prinzipien als einen Bruch – oder gar eine Revolution – in der Geschichte der Lexikografie zu sehen. Vielmehr wäre sie die konsequente Weiterentwicklung von sprachlichen Nachschlagewerken im Lichte der neuen Darstellungsmöglichkeiten im elektronischen Medium. Das bedeutet natürlich auch, dass bei der Entwicklung eines Referenzkonstruktikons die Standards einzuhalten sind, die in der professionellen Lexikografie zu Beginn des 21. Jahrhunderts als etabliert gelten können. So darf zum Beispiel ein Referenzkonstruktikon für Lerner des Englischen in verschiedenster Hinsicht nicht hinter den hohen Standard der etablierten englischen Lernerwörterbücher zurückfallen. Es muss deshalb zum Beispiel – die Aussprache von Wörtern und Phrasen nicht nur durch IPA-Symbole, sondern auch akustisch präsentieren, und zwar in den für die jeweilige Zielgruppe relevanten Varietäten (also in der Regel in britischem und amerikanischem Englisch), – Bedeutungsparaphrasen in ganzen Sätzen (wie durch die Cobuild-Wörterbücher eingeführt) oder/und auf der Basis eines flexibel angewandten begrenzten Definitionswortschatzes abfassen, oder – Beispiele auf Korpusbasis entwickeln. Gleichzeitig bringt ein Referenzkonstruktikon aber durchaus eine erhebliche Ausweitung des Beschreibungsgegenstands mit sich.

9 Ein Netzwerk von Konstruktionen und mehr Konstitutives Merkmal eines Referenzkonstruktikons ist, wie die Beispiele Argumentstruktur und Kollokation deutlich gemacht haben, die starke Vernetzung lexikalischer Informationen mit Informationen, die traditionell in Grammatiken zu finden ist. Ich stelle mir ein solches unifiziertes Konstruktikon – oder genauer: solche auf Zielgruppen abgestimmte Konstruktika – als das reference tool für die entsprechende Sprache vor. Zugegeben, die Unterscheidung zwischen Grammatik und Wörterbuch ist uns quasi schon in die Wiege unseres Sprachverständnisses gelegt: Sprachlehrbücher im Latein-, Englisch- oder Französischunterricht haben zu den einzelnen Lektionen einen Grammatik- und einen Wortschatzteil – in ersterem steht „die Grammatik“, in letzterem „die Wörter“. Grammatiken enthalten das Allgemeine, Generalisierbare und betrachten eine Sprache sozusagen phänomenologisch; Wörterbücher das Spezifische, Wörter. Aber diese Trennung hat auch etwas Artifizielles: Da, wo Grammatiken Klassen identifizieren, geben sie Beispiele für Wörter, die diesen Klassen angehören – von Klassen wie Substantiv, uncount noun bis hin zu "nouns from Latin ending in – a /ə/ … with ae-plural“ (CGEL 5.95). Morphologische Besonderheiten wie die, dass die

198

Thomas Herbst

etablierten Pluralformen von alga und curriculum algae und curricula lauten, sind aber auch in jedem Wörterbuch aufgeführt. Und da, wo Wörterbücher Angaben zur syntaktischen Verwendung von Wörtern machen, beziehen sie sich auf Klassen – Klassen wie Substantiv, uncount noun, transitives Verb etc. Grammatik und Wörterbuch unterscheiden sich also primär in der Perspektive, aus der der Beschreibungsgegenstand betrachtet und beschrieben wird, und nicht so sehr im Beschreibungsgegenstand selbst.43 Ein unifiziertes Konstruktikon kann dem Ineinandergreifen von grammatischer und lexikalischer Information, wie oben bereits angedeutet, in wesentlich besserer Weise gerecht werden als das bei den herkömmlichen Nachschlagewerken der Fall ist: 1. Es schafft die Möglichkeit, bei einem Nachschlagevorgang von einzelnen Wörtern per Mausklick zu anderen Wörtern mit ähnlichen semantischen, morphologischen oder syntaktischen Eigenschaften zu gelangen, aber eben auch zu generellen Informationen. 2. Dadurch dass nicht nur Mehrwortverbindungen wie Kollokationen, sondern auch Kollostruktionen erfasst werden, wird die künstliche Trennung von lexikalischen und syntaktischen Erscheinungen an einer weiteren wichtigen Schnittstelle aufgehoben. Dadurch kann ein Referenzkonstruktikon für fremdsprachige Benutzer den produktionsorientierten Zweck wesentlich besser erfüllen als ein Wörterbuch. 3. Der Konzeption eines unifizierten Konstruktikons ist inhärent, dass die lexikalische Komponente vieler „grammatischer“ Konstruktionen (etwa bei will oder going to im Englischen) für die Benutzer transparenter und bewusster wird. 4. Ebenso ist im Wesen eines Konstruktikons angelegt, dass das Beschreibungsmodell und damit auch die Terminologie, mit der sprachliche Erscheinungen auf verschiedenen Abstraktionsstufen und aus verschiedenen Perspektiven beschrieben werden, in sich konsistent ist.44 5. Aus der Benutzerperspektive hat ein unifiziertes Konstruktikon den unschätzbaren Vorteil, dass ein integriertes Nachschlagewerk für alle eine Sprache betreffenden Fragen vorliegt. 6. Ein integriertes Referenzkonstruktikon beruht auf einer theoretisch-linguistischen Grundlage, die für die Zwecke der Deskription und einer lernergerechten

43 zu Ausnahmen siehe Abschnitt 7. 44 Das kann bei traditionellen Grammatiken und Wörterbüchern natürlich auch der Fall sein, insbesondere dann, wenn eine Grammatik und ein Wörterbuch vom selben Verlag herausgegeben werden, wie das bei der „Grammar of Contemporary English“ (1972) und dem „Dictionary of Contemporary English“ (1974) oder bei der „Cobuild“-Serie der Fall war, was aber noch nicht unbedingt bedeutet, dass die Benutzer des Wörterbuchs auch mit der entsprechenden Grammatik und ihrer Terminologie vertraut sind. Zu Problemen in Zusammenhang von Grammatikschreibung und Lexikografie siehe auch Pullum (2009).

Wörterbuch war gestern

199

Darstellung von Sprachen dem Modell, das die theoretische Diskussion der zweiten Hälfte des 20. Jahrhunderts dominierte, weit überlegen ist.45

10 Literatur Aarts, Bas (2011): Oxford Modern English Grammar. Oxford: Oxford University Press. Alexandrov, Alexander A. et al. (2011): Strength of Word-Specific Neural Memory Traces Assessed Electrophysiologically. In: PLoS ONE 6(8), e22999. doi:10.1371/journal.pone. 0022999 Altenberg, Bengt (1998): On the Phraseology of Spoken English: The Evidence of Recurrent WordCombinations. In Cowie, Anthony P. (Hrsg.): Phraseology. Theory, Analysis, and Applications. Oxford: Clarendon Press, 101–122. Behrens, Heike (2009): Konstruktionen im Spracherwerb. In: Zeitschrift für Germanistische Linguistik 37, 427–444. Bergenholtz, Henning (1985): Vom wissenschaftlichen Wörterbuch zum Lernerwörterbuch. In: Bergenholtz, Henning /Mugdan, Joachim (Hrsg.): Lexikographie und Grammatik. Akten des Essener Kolloquiums zur Grammatik im Wörterbuch (28.–30.6.1984). Tübingen: Niemeyer, 225–256. Binon, Jean / Verlinde, Serge (2013): Electronic Pedagogical Dictionaries. In: Gouws, Rufus H. et al. (Hrsg.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume. Recent Developments with Focus on Electronic and Computational Lexicography. Berlin. Boston: Walter de Gruyte, 1035–1046. Boas, Hans C. (2014): Zur Architektur einer konstruktionsbasierten Grammatik des Deutschen. In: Lasch, Alexander / Ziem, Alexander (Hrsg.): Grammatik als Netzwerk von Konstruktionen. Sprachwissen im Fokus der Konstruktionsgrammatik (= Sprache und Wissen 15). Berlin: de Gruyter, 37– 63 Bücker, Jörg (2012): Sprachhandeln und Sprachwissen. Grammatische Konstruktionen im Spannungsfeld von Interaktion und Kognition. Berlin / Boston: de Gruyter. Bybee, Joan (1995): Regular Morphology and the Lexicon. Language and Cognitive Processes 10(5), 425–455. Bybee, Joan (2007): The Emergent Lexicon. In: Bybee, Joan (Hrsg.): Frequency of Use and the Organization of Language. Oxford: Oxford University Press. [first published: 1998. CLS 34: The panels. Chicago: Chicago Linguistic Society, 421–435.] Bybee, Joan (2010): Language, Usage and Cognition. Cambridge: Cambridge University Press.

45 Es sei noch darauf hingewiesen, dass es mir in diesem Artikel vorrangig um die Darstellung der Konzeption eines unifizierten Konstruktikons aus der Perspektive der kognitiven Linguistik ging. Dabei blieben zwei wichtige Fragenkomplexe weitgehend ausgeklammert: Zum einen wird die Realisierung eines solchen Konstruktikons entscheidend davon abhängen, inwieweit es möglich sein wird, Teile der aufzunehmenden Informationen – insbesondere im Bereich der kollokationellen und kollostruktionellen Angaben – automatisiert oder teilautomatisiert zu gewinnen; vgl. Kilgarriff (2013), Spoor (2012). Zum zweiten wird das Design eines Referenzkonstruktikons selbstverständlich von den Erkenntnissen der lexikografischen Benutzungsforschung bestimmt sein, worauf hier ebenfalls nur am Rande eingegangen wurde; vgl. Wiegand (1987). Für eine Übersicht siehe Töpel (2014); siehe z.B. auch Pastor/ Alcina (2013) und Müller-Spitzer (2014); zur Frage der Innovation siehe besonders Müller-Spitzer/ Koplenig (2014); vgl. insbesondere auch Verlinde/Leroyer/Binon (2009).

200

Thomas Herbst

Bybee, Joan (2013): Usage-Based Theory and Exemplar Representation of Constructions. In: Hoffmann, Thomas / Trousdale, Graeme (Hrsg.): The Oxford Handbook of Construction Grammar. Oxford: Oxford University Press, 49–69. Bybee, Joan / Hopper, Paul (2001): Introduction to Frequency and the Emergence of Linguistic Structure. In: Bybee, Joan / Hopper, Paul (Hrsg.): Frequency and the Emergence of Linguistic Structure. Amsterdam / Philadelphia: Benjamins, 1–24. Dąbrowska, Ewa (2014): Recycling Utterances. A Speaker’s Guide to Sentence Processing. Cognitive Linguistics 25(4), 617–653. Dąbrowska, Ewa / Lieven, Elena (2005): Towards a Lexically Specific Grammar of Children’s Question Constructions. Cognitive Linguistics 16(3), 437–474. Dziemianko, Anna (2012): Noun and Verb Codes in English Monolingual Dictionaries for Foreign Learners. A Study of Usefulness in the Polish Context. Poznań: Wydawnictwo Naukowe UAM. Engelberg, Stefan (2010): Die lexikographische Behandlung von Argumentstrukturvarianten in Valenzund Lernerwörterbüchern. In: Fischer, Klaus / Fobbe, Eilika / Schierholz, Stefan J. (Hrsg.): Valenz und Deutsch als Fremdsprache. Frankfurt: Lang, 113–141. Engelberg, Stefan et al. (2011): Argumentstrukturmuster als Konstruktionen? Identität – Verwandtschaft – Idiosynkrasien. In: Engelberg, Stefan / Holler, Anke / Proost, Kristel (Hrsg.): Sprachliches Wissen zwischen Lexikon und Grammatik. Berlin and Boston: de Gruyter, 71–112. Ellis, Nick C. / Frey, Eric / Jalkanen, Isaac (2009): The Psycholinguistic Reality of Collocation and Semantic Prosody (1). In: Römer, Ute / Schulze, Rainer (Hrsg.): Exploring the Lexis-Grammar Interface. Amsterdam & Philadelphia: Benjamins, 89–114. Evert, Stefan (2005): The Statistics of Word Cooccurrences. Word Pairs and Collocations. Dissertation, Institut für maschinelle Sprachverarbeitung, University of Stuttgart, URN urn:nbn:de:bsz:93opus-23714. Evert, Stefan (2008): Corpora and Collocations. In: Lüdeling, Anke / Kytö, Merja (Hrsg.): Corpus Linguistics. An International Handbook. Berlin: Mouton de Gruyter, Berlin, 1212–1248. Faulhaber, Susen (2011): Verb Valency Patterns. A Challenge for Semantics-Based Accounts. Berlin / New York: de Gruyter Mouton. Faulhaber, Susen / Herbst, Thomas / Uhrig, Peter (2013): Funktionswortklassen im Englischen: Linguistische und lexikografische Perspektiven. In: Breindl, Eva / Klosa, Annette (Hrsg.): Funktionswörter|buch|forschung. Zur lexikographischen Darstellung von Partikeln, Konnektoren, Präpositionen und anderen Funktionswörtern, Germanistische Linguistik 221–222. Hildesheim / Zürich / New York: Georg Olms Verlag, 59–110. Fillmore, Charles (2014): Frames, Constructions and FrameNet. In: Herbst. Thomas / Schmid, HansJörg / Faulhaber, Susen (Hrsg.): Constructions – Collocations – Patterns. Berlin / Boston: de Gruyter Mouton, 113–157. Fillmore, Charles / Kay, Paul / O’Connor, Catherine M. (1988): Regularity and Idiomaticity in Grammatical Constructions. The Case of let alone. Language 64(3): 501–538. Fillmore, Charles J. / Lee-Goldman, Russell R. / Rhomieux, Russell (2012): The FrameNet-Constructicon. In: Boas Hans C. / Sag, Ivan A. (Hrsg.): Sign-Based Construction Grammar. Stanford: CSLI Publications, 309–372. Geeraerts, Dirk (1990): The Lexicographical Treatment of Protoypical Polysemy. In: Tsohatzidis, Savas L. (Hrsg.): Meanings and Prototypes. Studies in Linguistic Categorization. London: Routledge, 195–210. Geeraerts, Dirk (2007): Lexicography. In: Geeraerts, Dirk / Cuyckens, Hubert (Hrsg.): The Oxford Handbook of Cognitive Linguistics. Oxford: Oxford University Press, 1160–1174. Gläser, Rosemarie (21990): Phraseologie der englischen Sprache. Leipzig: Enzyklopädie. Goldberg, Adele E. (1995): Constructions. A Construction Grammar Approach to Argument Structure. Chicago: Chicago University Press.

Wörterbuch war gestern

201

Goldberg, Adele E. (2006): Constructions at Work. Oxford / New York: Oxford University Press. Gouws, Rufus (2010): Fixed Word Combinations as Second Level Treatment Units in Dictionaries. In Ďurčo, Peter (Hrsg.): Feste Wortverbindungen und Lexikographie. Berlin / New York: de Gruyter, 51–63. Granger, Sylviane / Paquot, Magali (2008): Disentangling the Phraseological Web. In: Granger, Sylviane / Meunier, Fanny (Hrsg.): Phraseology. An Interdisciplinary Perspective. Amsterdam/ Philadelphia: Benjamins, 37–49. Greenbaum, Sidney (1988): Some Verb-Intensifer Collocations in American and British English. In: Greenbaum, Sidney (Hrsg.): Good English & the Grammarian. London / New York: 113–124. [1974. American Speech 49, 79–89.] Gries, Stefan Th. / Stefanowitsch, Anatol (2004a): Extending Collostructional Analysis. A CorpusBased Perspective on ‘Alternations’. International Journal of Corpus Linguistics 9(1), 97–129. Gries, Stefan Th. / Stefanowitsch, Anatol (2004b): Co-Varying Collexemes in the Into-caustative. In: Archard, Michel / Kemmer, Suzanne (Hrsg.): Language, Culture, and Mind. Stanford: CSLI, 225–236. Halliday, Michael A. K. (21994): An Introduction to Functional Grammar. London / Melbourne / Auckland: Arnold. Hanks, Patrick (2013): English and American II. In: Gouws, Rufus H. et al. (Hrsg.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin / Boston: de Gruyter, 720–731. Hausmann, Franz-Josef (1977): Einführung in die Benutzung der neufranzösischen Wörterbücher. Tübingen: Niemeyer. Hausmann, Franz-Josef (1984): Wortschatzlernen ist Kollokationslernen. Praxis des neusprachlichen Unterrichts 31, 395–406. Hausmann, Franz-Josef (1985): Kollokationen im deutschen Wörterbuch. Ein Beitrag zur Theorie des lexikographischen Beispiels. In: Bergenholtz, Henning / Mugdan, Joachim (Hrsg.): Lexikographie und Grammatik. Tübingen: Niemeyer, 118–129. Hausmann, Franz Josef (2007): Die Kollokationen im Rahmen der Phraseologie. Systematische und historische Darstellung. Zeitschrift für Anglistik und Amerikanistik 55(3), 217–234. Heid, Ulrich (2005): Corpusbasierte Gewinnung von Daten zur Interaktion von Lexik und Grammatik. Kollokation – Distribution – Valenz. In: Lenz, Friedrich / Schierholz, Stefan J. (Hrsg.): Korpuslinguistik in Lexik und Grammatik. Tübingen: Stauffenburg, 97–122. Heid, Ulrich (2006): Valenzwörterbücher im Netz. In: Steiner, Petra C. / Boas, Hans C. / Schierholz, Stefan J. (Hrsg.): Contrastive Studies and Valency. Kontrastive Studien und Valenz. Frankfurt: Lang, 69–89. Heid, Ulrich / Gouws, Rufus (2006): A Model for a Multifunctional Dictionary of Collocations. Euralex 2006 Proceedings. http://www.euralex.org /proceedings-toc/euralex_2006/ Herbst, Thomas (1996): What are Collocations: Sandy Beaches or False Teeth? English Studies 77(4), 379–393. Herbst, Thomas (2009a): Item-Specific Syntagmatic Relations in Dictionaries. In: Nielsen, Sandro / Tarp, Sven (Hrsg.): Lexicography in the 21st Century, Amsterdam / Philadelphia: 281–308. Herbst, Thomas (2009b): Patterns in Syntax, Lexicography and Corpus Linguistics. In: Eckstein, Lars / Reinfandt, Christoph (Hrsg.): Anglistentag 2008 Proceedings. Trier: WVT, 379–389. Herbst, Thomas (2011a): The Status of Generalizations: Valency and Argument Structure Constructions. Zeitschrift für Anglistik und Amerikanistik 59(4), 347–367. Herbst, Thomas (2011b): Choosing Sandy Beaches. Collocations, Probabemes and the Idiom Principle. In: Herbst, Thomas / Faulhaber, Susen / Uhrig, Peter (Hrsg.): The Phraseological View of Language. A Tribute to John Sinclair. Berlin / Boston: de Gruyter Mouton, 27–57.

202

Thomas Herbst

Herbst, Thomas (2014a): The Valency Approach to Argument Structure Constructions. In: Herbst, Thomas / Schmid, Hans-Jörg / Faulhaber, Susen (Hrsg.): Constructions – Collocations – Patterns. Berlin / Boston: de Gruyter Mouton, 167–216. Herbst, Thomas (2014b): Idiosyncrasies and Generalizations: Argument Structure, Semantic Roles and the Valency Realization Principle. In: Hilpert, Martin / Flach, Susanne (Hrsg.): Yearbook of the German Cognitive Linguistics Association. Jahrbuch der Deutschen Gesellschaft für Kognitive Linguistik, Vol. II. Berlin / München / Boston: de Gruyter Mouton, 253–289. Herbst, Thomas (2015): Why Construction Grammar Catches the Worm and Corpus Data Can Drive you Crazy. Accounting for Idiomatic and Non-Idiomatic Idiomaticity. Journal of Social Sciences. http://thescipub.com/journals/jss/psi Herbst, Thomas (erscheint 2016): Foreign Language Learning is Construction Learning. Principles of Pedagogic Construction Grammar. In: Gilquin, Gaëtanelle / De Knop, Sabine (Hrsg.): Applies Construction Grammar. Berlin / Boston: de Gruyter Mouton. Herbst, Thomas / Schüller, Susen (2008): Introduction to Syntactic Analysis. A Valency Approach. Tübingen: Narr. Hoffmann, Sebastian et al. (2008): Corpus Linguistics with BNCweb. A Practical Guide. Frankfurt/ Main: Lang. Hoffmann, Thomas (2015): Cognitive Sociolinguistic Aspects of Football Chants. The Role of Social and Physical Context in Usage-based Construction Grammar. Zeitschrift für Anglistik und Amerikanistik 63(3), 273–294. Huddleston, Rodney / Pullum, Geoffrey K. (Hrsg.) (2002): The Cambridge Grammar of the English Language. Cambridge: Cambridge University Press. Jacobs, Joachim (2009): Valenzbindung oder Konstruktionsbindung? Eine Grundfrage der Grammatiktheorie. ZGL, 490–513. Jurafsky, Daniel (1991): An On-line Computational Model of Human Sentence Interpretation: A Theory of the Representation and Use of Linguistic Knowledge. Diss., University of California: Berkeley. http://www.eecs.berkeley.edu/Pubs/TechRpts/1992/CSD-92-676.pdf Kilgarriff, Adam (2013): Using Corpora as Data Sources for Dictionaries. In: Jackson, Howard (Hrsg.): The Bloomsbury Companion to Lexicography. London: Bloomsbury, 77–96. Klotz, Michael / Herbst, Thomas (erscheint 2016): English Lexicography. Berlin: Schmidt. Langacker, Ronald W. (1990): In Tsohatzidis, S. L. (Hrsg.): Meanings and Prototypes. Studies in linguistic categorization. London / New York: Routledge, 213–238. Langacker, Ronald W. (2008): Cognitive Grammar. A Basic Introduction. Oxford: Oxford University Press. Langacker, Ronald W. (2009): Constructions in Cognitive Grammar. In: Langacker, Ronald W.: Investigations in Cognitive Grammar. Berlin / New York, Mouton de Gruyter, 1–39 [originally published in English Linguistics 20. 2003: 41–83]. Lieven, Elena (2014): First-Language Learning from a Usage-Based Approach. In: Herbst, Thomas / Schmid, Hans-Jörg / Faulhaber, Susen (Hrsg.): Constructions – Collocations – Patterns. Berlin / Boston: de Gruyter Mouton, 9–32. MacWhinney, Brian (2014): Item-Based Patterns in Early Syntactic Development. In: Herbst, Thomas / Schmid, Hans-Jörg / Faulhaber, Susen (Hrsg.): Constructions – Collocations – Patterns. Berlin / Boston: de Gruyter Mouton, 33–69. Müller-Spitzer, Carolin (2014): Empirical Data on Contexts of Dictionary Use. In: Müller-Spitzer, Carolin (Hrsg.): Using Online Dictionaries. Berlin / Boston: de Gruyter, 85–126. Müller-Spitzer, Carolin / Koplenig, Alexander (2014): Online Dictionaries. Expectations and Demands. In: Müller-Spitzer, Carolin (Hrsg.): Using Online Dictionaries. Berlin / Boston: de Gruyter, 143–188.

Wörterbuch war gestern

203

Ostermann, Carolin (2015): Cognitive Lexicography. A New Approach to Lexicography Making Use of Cognitive Semantics. Berlin / Boston: de Gruyter. Pastor, Verónica / Amparo, Alcina (2013): Researching the Use of Electronic Dictionaries. In: Jackson, Howard (Hrsg.): The Bloomsbury Companion to Lexicography. London: Bloomsbury, 97–133. Pullum, Geoffrey K. (2009): Lexical Categorization in English Dictionaries and Traditional Grammars. Zeitschrift für Anglistik und Amerikanistik 57(3). 255–273. Pulvermüller, Friedemann / Cappelle, Bert / Shtyrov, Yury (2013): Brain Basis of Meaning, Words, Constructions and Grammar. In: Hoffmann, Thomas / Trousdale, Graeme (Hrsg.): The Oxford Handbook of Construction Grammar. Oxford: Oxford University Press, 397–416. Quirk, Randolph (1968): The Survey of English Usage. In: Quirk, Randolph (Hrsg.): Essays on the English Language Medieval and Modern. London: Longman, 70–87. Quirk, Randolph et al. (1985): A Comprehensive Grammar of the English Language. London / New York: Longman. Schmid, Hans-Jörg (2014): Lexico-Grammatical Patterns, Pragmatic Associations and Discourse Frequency. In: Herbst, Thomas / Schmid, Hans-Jörg / Faulhaber, Susen (Hrsg.): Constructions – Collocations – Patterns. Berlin / Boston: de Gruyter Mouton, 231–285. Siepmann, Dirk (2005): Collocation, Colligation and Encoding Dictionaries. Part I: Lexicological Aspects. International Journal of Lexicography 18, 409–433. Sinclair, John (Hrsg.) (1990): Collins Cobuild English Grammar. London / Glasgow: Collins. Sinclair, John McH. (2004): Trust the Text. London / New York: Routledge. Sköldberg, Emma, Linnéa Bäckström, Lars Borin, Markus Forsberg, Benjamin Lyngfelt, Leif-Jöran Olsson, Julia Prentice, Rudolf Rydstedt, Sofia Tingsell, Jonatan Uppström (2013): Between Grammars and Dictionaries. A Swedish Constructicon. Proceedings of eLex 2013. Spoor, Dennis (2012): Towards a Multifunctional Lexical Resource. Design and Implementations of a Graph-Based Lexicon Model. Berlin / Boston: de Gruyter. Stefanowitsch, Anatol (2011): Argument Structure. Item-based or Distributed? Argument Structure – Valency and/or Constructions? Zeitschrift für Anglistik und Amerikanistik 59(4), 369–386. Stefanowitsch, Anatol (2013): Collostructional Analysis. In: Hoffmann, Thomas / Trousdale, Graeme (Hrsg.): The Oxford Handbook of Construction Grammar. Oxford: Oxford University Press, 290–306. Stefanowitsch, Anatol (2014): Collostructional Analysis. A Case Study of the English into-Causative. In: Herbst, Thomas / Schmid, Hans-Jörg / Faulhaber, Susen (Hrsg.): Constructions – Collocations – Patterns. Berlin / Boston: de Gruyter Mouton, 217–238. Stefanowitsch, Anatol / Gries, Stefan Th. (2003): Collostructions. Investigating the Interaction of Words and Constructions. International Journal of Corpus Linguistics 8(2), 209–243. Stubbs, Michael (2007): Collocations and Semantic Profiles. On the Cause of the Trouble with Quantitative Studies. In: Teubert, Wolfgang / Krishnamurthy, Ramesh (Hrsg.): Corpus Linguistics. Critical Concepts in Linguistics. London / New York: Routledge, 166–193. [first published: 1995. Functions of Language 2(1), 23–55.] Tarp, Sven (2008): Lexicography in the Borderland between Knowledge and Non-Knowledge. Tübingen: Niemeyer. Töpel, Antje (2014): Review of Research into the Use of Electronic Dictionaries. In: Müller-Spitzer, Carolin (Hrsg.): Using Online Dictionaries. Berlin / Boston: de Gruyter, 13–54. Underwood, Geoffrey / Schmitt, Norbert / Galpin, Adam (2004): The Eyes Have It. An Eye-Movement Study into the Processing of Formulaic Sequences. In: Schmitt, Norbert (Hrsg.): Formulaic Sequences. Amsterdam / Philadelphia: Benjamins, 153–168. Verlinde, Serge / Binon, Jean / Selva, Thierry (2006): Corpus, collocations et dictionnaires d’apprentissage. Langue française 150(2), 84–98.

204

Thomas Herbst

Verlinde, Serge / Leroyer, Patrick / Binon, Jean (2009): Search and You Will Find. From Stand-Alone Lexicographic Tools to User Driven Task and Problem-Oriented Multifunctional Leximats, International Journal of Lexicography 23(1), 1–17. Welke, Klaus (2011): Valenzgrammatik des Deutschen. Eine Einführung. Berlin / New York: de Gruyter. Wiegand, Herbert Ernst (1985): Fragen zur Grammatik in Wörterbuchbenutzungsprotokollen. Ein Beitrag zur empirischen Erforschung der Benutzung einsprachiger Wörterbücher. In: Bergenholtz, Henning / Mugdan, Joachim (Hrsg.): Lexikographie und Grammatik. Akten des Essener Kolloquiums zur Grammatik im Wörterbuch 28.–30.6.1984. Tübingen: Niemeyer, 20–98. Wiegand, Herbert Ernst (1987): Zur handlungstheoretischen Grundlegung der Wörterbuchbenutzungsforschung. Lexicographica 3, 178–227. Wiegand, Herbert Ernst (2008): Zugriffsstrukturen in Printwörterbüchern. Ein zusammenfassender Beitrag zu einem zentralen Ausschnitt einer Theorie der Wörterbuchform. Lexicographica 24, 209–315. Wiegand, Herbert Ernst (2010): Makro- und mikrostrukturelle Präsentationsprobleme bei Phrasemen in allgemeinen einsprachigen Wörterbüchern. Vorschläge für ihre Lösung. In: Ďurčo, Peter (Hrsg.): Feste Wortverbindungen und Lexikographie. In Kolloquium zur Lexikographie und Wörterbuchforschung, 161–180. Berlin / New York: de Gruyter, 161–180.

Wörterbücher BLF = Base lexicale du français [accessed November 2015]. Cowie 1975 = Oxford Dictionary of Current Idiomatic English. Volume 1: Verbs with Prepositions & Particles. Hrsg. v. Cowie, A. P. / Mackin, R. London: Oxford University Press, 1975. Cowie 1983 = Oxford Dictionary of Current Idiomatic English. Volume 2: Phrase, Clause & Sentence Idioms. Hrsg. v. Cowie, A. P. / Mackin, R. / McCaig, I. R. Oxford: Oxford University Press, 1983. Crowther 2002 = Oxford Collocations Dictionary for Students of English. Hrsg. v. Crowther, Jonathan / Dignen, Sheila / Lea, Diana. Oxford: Oxford University Press, 2002. dict.cc = Deutsch-Englisch Wörterbuch . Hanks 2015 = Pattern Dictionary of English Verbs. 2000–2014. Hrsg. v. Hanks, Patrick. [accessed November 2015]. Helbig 1973 = Wörterbuch zur Valenz und Distribution deutscher Verben. Hrsg. v. Helbig, Gerhard / Schenkel, Wolfgang. Leipzig: Verlag Enzyklopädie, 2nd edition 1973 [1st edition 1969]. Herbst 2004 = A Valency Dictionary of English. Hrsg. v. Herbst, Thomas et al. Berlin / New York: Mouton de Gruyter, 2004. Hornby 2015 = Oxford Advanced Learner’s Dictionary. Hrsg. v. Hornby, A. S. et al. Oxford: Oxford University Press, 2015. LDOCE5-online = Longman English Dictionary online. [accessed April 2015]. LDOCE6 = Longman Dictionary of Contemporary English. Harlow: Pearson, 6th edition, 2014. LDOCE5 = Longman Dictionary of Contemporary English. Hrsg. v. Mayor, M. Harlow: Pearson Longman, 5th edition, 2009. Macmillan Dictionary. [accessed April 2015]. OALD-online = Oxford Learner’s Dictionaries [accessed January 2015]. OED = The Oxford English Dictionary (32000-). Hrsg. v. John A. Simpson / and Michael Proffitt. www. oed.com. Oxford: Oxford University Press. PONS Online-Wörterbuch [accessed October 2015].

Wörterbuch war gestern

205

Stein 2007 = A Dictionary of English Affixes. Their Function and Meaning. Hrsg. v., Gabriele. München: LINCOM, 2007. VALBU = Valenzwörterbuch deutscher Verben. Hrsg. v. Schumacher, Helmut et al. Tübingen: Narr, 2004.

Korpora BNC = The British National Corpus. Distributed by Oxford University Computing Services on behalf of the BNC Consortium . COCA = The Corpus of Contemporary American English: 450 million words, 1990-present. Hrsg. v. Davies, Mark. 2008. Available online at .

Ulrich Schmitz

Wörterbücher als Sehflächen Abstract: In this article, the nature and role of visual presentation of lexical knowledge will be discussed. Static viewing surfaces in printed dictionaries are compared with dynamic viewing surfaces in electronic dictionaries. Viewing surfaces are areas on which written and non-written visual elements are combined to units of meaning in a planned layout. Printed dictionaries present limited amounts of information in a static way, largely following the monomodal lines of writing. Online dictionaries, in contrast, make available infinite masses of information on dynamic viewing surfaces. It is their visual design which regulates access and assigns the requested data. This is why layout, topography, typography, multimodality, ergonomics and dynamics in online dictionaries are considerably more complex and powerful. The traditional model of rigid lists and clear lines is being replaced by a new model of structured surface with hyper-dynamic filling. Even more than in printed dictionaries, it is not so much grammar (as in linear texts), but the visual design which gives structure and relevant meaning to the information presented. The more the topographical arrangement of the characters contributes to meaning, the more noticeable the viewing surface will be a diagram. Keywords: diagram, electronic dictionary, viewing surface, visual design, visual presentation Schlagwörter: Diagramm, elektronisches Wörterbuch, Sehfläche, visuelles Design, visuelle Präsentation

1 Schriftbilder in Wörterbüchern 1.1 Schrift: Leistung durch Verzicht Wörterbücher sind schriftgebundene Bildungsmittel. Sie helfen, Bildung zu erwerben, auszubauen und einzusetzen. Deshalb sollten Wörterbücher möglichst zuverlässig, zweckmäßig und leicht zugänglich sein. Bildung heißt die Fähigkeit, souverän mit Sprachen, Wissen und Weltbildern umzugehen, ihre Herkunft, Eigenarten und Funktionen zu verstehen, ihre Potentiale

Ulrich Schmitz: Germanistik/Linguistik, Universität Duisburg-Essen, 45117 Essen, email: [email protected], www.linse.uni-due.de

208

Ulrich Schmitz

kritisch zu beurteilen sowie konstruktiv an ihrer Nutzung und Weiterentwicklung mitzuarbeiten. So verstanden gehört Bildung (neben Arbeit, Empathie, institutionellen und natürlichen Ressourcen) zu den elementaren Lebenselixieren jeder menschlichen Gesellschaft. Mit deren historischer Entwicklung und wachsender Komplexität gewinnt Bildung immer mehr an Bedeutung für das Wohlergehen sowohl der Individuen als auch einzelner Gesellschaften und der gesamten Menschheit. Deshalb ist Bildung ein immer wertvolleres Gut geworden. In nicht-egalitären (also allen) Gesellschaften kämpfen gewichtige Interessen um deren Verteilung. Bildung dient dann nicht nur dem Gemeinwohl, sondern auch der sozialen Diskriminierung, also der ungleichen Verteilung des Zugangs zu Gütern, Einfluss und Ansehen. Damit erhält Bildung einen Nimbus. Wer über Bildung zu verfügen glaubt, schafft sich eine (möglichst unauffällige und folglich wirksame) Ideologie zur Rechtfertigung. Oberflächlich heißt es: Wer fleißig lernt (und vielleicht noch besonders begabt ist), soll auch belohnt werden – erbrachte Leistung rechtfertigt Privilegien. Im subtilen Kern des allgemeinen Diskurses über Bildung steckt aber der unbefragte Glaube an die heilbringende Kraft von Schrift. So hängt die diskursive Figur des Bildungsbürgers an dessen Gewalt über Schrift. Wer (gut, viel, kreativ) lesen und schreiben kann, gilt mehr als andere. Der zentrale Mythos zur Errichtung einer Kaste von Akademikern ist bis heute die fraglose Unterstellung, Schrift gewähre einen besseren, sozusagen erlesenen, Zugang zur Welt. „Sola scriptura“, Luthers Kampfansage an die elitären Hüter mündlicher Überlieferung, wandelte sich in den folgenden Jahrhunderten zum stillschweigenden Schibboleth einer allmählich und bis heute quantitativ wachsenden, zunächst bürgerlichen, dann immer mehr kleinbürgerlichen Bildungselite. Dabei wird Schrift weniger als ein Werkzeug (neben anderen) zur Erkenntnis und Konstruktion von Wirklichkeit sowie zur Kommunikation darüber aufgefasst, sondern vielmehr als fertige Gestalt abgeschlossenen Wissens und Denkens, als Textkonserve: Ein Autor (oder mehrere) verfasst ein Werk (Roman, opus magnum, Fachbuch, Zeitungsartikel, Patentschrift, Beipackzettel, Schulaufsatz etc.), Leser nehmen es zur Kenntnis. Hauptsächlich auf derartigen Schriftstücken ruht die kulturelle Entwicklung der letzten Jahrhunderte. Ihr unschlagbarer Vorteil ergibt sich aus ihrer Abstraktion (und dementsprechend formalen Korrektheit): Kommunikation verläuft unabhängig von den Bedingungen einer einzelnen Situation. Damit geht allerdings auch ein leicht vergessenes Handicap einher. Abstraktion verlangt Reduktion, Verzicht aufs Konkrete, Einzelne, unmittelbar Gelebte. Gedruckte Wörterbücher gehen noch einen Schritt weiter. Als Buchhaltung für Wörter verzichten sie gänzlich auf aktuelle Bedeutung. Meist werden sie ja dazu benutzt, um den Zugang zu schweren Stellen in Texten zu ermöglichen. Kotext wird allenfalls zitiert, nämlich in für exemplarisch gehaltenen Belegstellen.

Wörterbücher als Sehflächen

209

1.2 Schrift in digitalen Medien Grundsätzlich gilt all das auch für Online-Wörterbücher, jedoch mit einigen erheblichen Neuerungen. Man muss nicht mehr auf alles verzichten. Erstens können sie unendlich umfangreich sein und permanent ergänzt und korrigiert werden. Zweitens können sie mit zahllosen Belegen aus umfangreichen Korpora arbeiten. Auf diese Weise vermögen Wörterbücher Wittgensteins Diktum besser nachzukommen, die Bedeutung eines Wortes sei sein Gebrauch in der Sprache.1 Drittens erlaubt die computergebundene Hypertechnik völlig neue Verweissysteme sowohl innerhalb eines Wörterbuches als auch nach außerhalb. Und viertens können semiotische Modi jenseits von Schrift eingebunden werden, z.B. Bilder, Video- und Audiodateien. Was bedeutet das für die Schriftlichkeit elektronischer Wörterbücher? Digitale Medien erweitern die Potentiale schriftlicher Kommunikation, prototypisch etwa auf Webseiten, in Mails, Chats und Blogs. Schriftliche Dialoge, auch kurz getaktet, werden möglich. Nähesprachliche Schriftlichkeit – früher kaum vorstellbar – wird ausgebaut. Und intensiver als früher gibt Schrift ihre traditionell monomodale Autonomie auf und wandert als ein Element von mehreren in multimodale Botschaften ein. Viele dieser Möglichkeiten werden in Online-Wörterbüchern selten oder kaum ausgenutzt. Teils liegt das an hergebrachten Gewohnheiten im Umgang mit Wörterbüchern, teils an den Kosten, und teils am Bemühen um Solidität. Dennoch unterscheiden sich die meisten Online-Wörterbücher radikal von gedruckten – nicht nur was Nutzung und Leistungsumfang, sondern auch was die Präsentationsformen betrifft. Nur um Letztere geht es im Folgenden: Wie sehen die „Seiten“ in Wörterbüchern aus? Layout und Design in Online-Wörterbüchern folgen anderen Regeln als in Print-Wörterbüchern. Meist sind sie erheblich anspruchsvoller. Nutzerinnen und Nutzern eröffnen sie dabei ganz neue Möglichkeiten, mit ihnen zu arbeiten. Möglich wird das durch dynamische Sehflächen.

1.3 Sehflächen Sehflächen sind Flächen, auf denen schriftliche und nichtschriftliche visuelle Elemente (z.B. Bilder) in geplantem Layout gemeinsame Bedeutungseinheiten bilden (Schmitz 2011 und 2015). In der Regel denkt man dabei an Bildschirme, Plakate, Warenverpackungen, Zeitungs- und Zeitschriftenseiten. Doch es gibt vielerlei andere einschlägige Kommunikationsformen und Textsorten (z.B. Landkarten, Geldscheine,

1 Wittgenstein (1960: 311 = § 43); dazu Wiegand (1999).

210

Ulrich Schmitz

T-Shirts, Schalttafeln, und zumindest im Ansatz eben auch Wörterbücher). Sehflächen sind heute die vorherrschende Form öffentlicher Kommunikation. Sie integrieren Bild und Text zu bedeutungstragenden Einheiten. Dabei müssen die bildlichen Bestandteile nicht unbedingt Abbildungen sein. Es kann sich auch um Piktogramme, Diagramme oder andere visuell-gestalterische Zeichen handeln. Weil Wörterbücher Teile von Sprachen dokumentieren, dominieren hier zumeist schriftliche Elemente. Dennoch werden sowohl deren Auffindung als auch deren Relevanz und inhaltliche Bedeutung mehr oder weniger stark von visuellen Darstellungsmitteln beeinflusst. Während nämlich in kontinuierlichen Ganztexten (wie diesem Aufsatz) grammatische Mittel dafür sorgen, dass aus linear aneinandergereihten Zeichen fortlaufender Sinn entsteht, dienen Struktur und Ordnung in Wörterbüchern vorwiegend der ergonomischen Präsentation einzelner Informationen oder Cluster von Informationen. Deshalb ist weniger Grammatik als vielmehr Design das Mittel der Wahl zur Ordnung der Auskünfte. So können Flächengestaltung (Layout), Platzierung (Topografie) und Schriftgestaltung (Typografie), zusammen mit weiteren visuellen Informationsträgern (Farbdesign, Piktogramme, Diagramme, Abbildungen) die Bedeutung von Textelementen stark beeinflussen. Selbst in gestalterisch kargen Wörterbüchern kann ein und dasselbe Wort an verschiedenen Stellen platziert Unterschiedliches bedeuten. Dieser Effekt wird bei Online-Wörterbüchern vielfach potenziert, wie wir in Abschnitt 4 sehen werden.

2 Wörterbücher: Textsorte und Medium Als Junge nahm ich mir vor, sämtliche zwölf Bände des Konversationslexikons im Bücherschrank meiner Eltern der Reihe nach durchzulesen. Wenn ich am Ende angelangt wäre, so dachte ich, hätte ich das gesamte Wissen der Menschheit in meinem Kopf. (Leichtfertige Illusion des angehenden kleinen Bildungsbürgers: Das kann dir keiner mehr nehmen!). Die ersten 14 oder 15 Seiten des ersten Bandes habe ich immerhin geschafft. Dabei war das voluminöse Werk doch schon gar nicht auf eine systematische und vollständige Darstellung angelegt. Wie alle Lexika enthielt es alphabetisch sortierte Einzelartikel; und später erschienen Ergänzungsbände. Dennoch gaben sie sich den Anschein unverrückbarer Abgeschlossenheit. So auch, mit speziellerem Zweck, die klassischen Wörterbücher. Hier war ich nicht auf die Idee gekommen, ein Wörterbuch von A bis Z zu studieren, etwa um eine fremde Sprache zu erlernen. Zwar ist das Pauken langer, kontextloser Vokabellisten bis heute gängiger Usus. Doch niemand liest Wörterbücher ganz; selbst einzelne Einträge werden selten komplett rezipiert. Enzyklopädien und noch stärker Wörterbücher sind auf punktuellen Ad-hoc-Gebrauch hin angelegt. Wörterbücher beanspruchen zwar allgemeine Geltung; typischerweise werden sie aber pragmatisch genutzt, nämlich in bestimmten Situationen zur Lösung eines speziellen sprachlichen Problems (z.B. bei einer Übersetzung).

Wörterbücher als Sehflächen

211

Schon deshalb unterscheidet sich die Textsorte Wörterbucheintrag drastisch von prototypischen Ganztexten, die linear von Anfang bis Ende gelesen werden wollen (etwa Briefe, Romane, Lehrbücher). Allein medientechnische Bedingungen sorgen dafür, dass Wörterbücher wie Bücher aussehen und auch so heißen. Der Textsorte hätten (teurere, vielleicht auch weniger handliche) Karteikarten, Mindmaps oder Formen mündlicher Auskunft besser entsprochen. Dennoch passen gedruckte Wörterbücher zum bildungsbürgerlichen Schriftlichkeitskonzept: Es gilt das geschriebene Wort, und lange gedruckte Texte genießen höchste Autorität. Erst neue technische Möglichkeiten in digitalen Medien erlauben es, die semiotischen Reduktionen zu überwinden, welche sowohl Herstellung als auch Struktur und Gebrauch gedruckter Wörterbücher so schwerfällig machen. Deshalb liegt die „Zukunft für Wörterbücher“ (Klosa 2014) hauptsächlich in Internet-Anwendungen sowie in Smartphone-Apps. Vor allem die hypermediale Verfassung des World Wide Web lässt, jedenfalls technisch, unendlich umfangreiche, komplexe, multimodale, vielfach vernetzte, flexible, interaktive, kollaborative, personalisierbare und permanent änderbare lexikalische Informationssysteme zu, auch im Verbund mit Korpusdaten sowie enzyklopädischem Wissen jeglicher Art – und natürlich mit allen Risiken und Nebenwirkungen jeglicher Komplexität. Einen Überblick über den Stand elektronischer Wörterbuchkunst geben Gouws et al. (eds. 2013), Haß/Schmitz (Hg. 2010) und Tarp (2012); zur lexikografischen Praxis siehe Geyken (2014) und Kosem et al. (eds. 2013). Im Folgenden geht es allein um die visuelle Präsentation lexikalischen Wissens auf Flächen: im kurzen Abschnitt 3 auf Papier und im längeren Abschnitt 4 auf Bildschirmen.

3 Gedruckte Wörterbücher In den vergangenen Jahrhunderten hat sich das äußere Erscheinungsbild gedruckter Wörterbücher kaum geändert, wenn man von typografischen Feinheiten und – selten – gelegentlichem Einsatz von Farbe und manchmal Abbildungen in jüngerer Zeit einmal absieht. Stets werden die einzelnen, leicht ausgerückten und fett gesetzten Lemmata auf rechteckigen Textflächen erläutert, die spaltenweise von oben nach unten hintereinandergereiht werden. Exemplarisch vergleiche man „Adelung 1786“ mit dem „Duden Universalwörterbuch“ von 2001 (Abb. 1 und 2).

212

Ulrich Schmitz

Abb. 1: Adelung (1786: Sp. 293 f.).  

Wörterbücher als Sehflächen

213

Abb. 2: Duden „Deutsches Universalwörterbuch“ (Duden 2001: 1829) im Ausschnitt.

Aus zwei sind drei Spalten geworden, aus Blocksatz wird Flattersatz, und die Buchstaben sind kleiner, so dass mehr Text auf eine Seite passt. Nur auf der Titelseite erlaubte man sich früher mehr Schmuck; man betrachte Abb. 3 und Abb. 4.

214

Ulrich Schmitz

Abb. 3: Adelung (1786: Titelseite).

Abb. 4: Duden „Deutsches Universalwörterbuch“ (2001: Titelseite).

Wörterbücher als Sehflächen

215

Ähnliche Beobachtungen gelten bis heute für die allermeisten gedruckten Wörterbücher, und selbst für so kreativ neuartige Wörterbuchtypen wie Wiegand (2008). Es sind monomodale, statische, rein schriftliche Listen gleichartiger Worterklärungen (ggf. mit Belegtexten) in einfachem und innerhalb eines Werkes stets gleich bleibendem Standardlayout.

4 Online-Wörterbücher 4.1 Am Beispiel DWDS 4.1.1 Eine Momentaufnahme Seit Ende der 1990er Jahre hat sich diese gewohnte und bewährte Situation schlagartig geändert, und zwar in dem Maße, wie die hypermedialen Möglichkeiten digitaler Techniken genutzt wurden und werden.

Abb. 5: Auskunft zum Stichwort Wörterbuch im DWDS2.

2 [www.dwds.de/?qu=Wörterbuch; letzter Zugriff 15.7.2015].

216

Ulrich Schmitz

Abb. 5 zeigt das Ergebnis einer Computer-Anfrage zum Eintrag Wörterbuch an Das Digitale Wörterbuch der deutschen Sprache (www.dwds.de). Es könnte jederzeit durch einfache Mausklicks vielfältig verändert werden. In der Momentaufnahme von Abb. 5 ähnelt nur die obere Hälfte des ersten Fensters oben links der herkömmlichen Textsorte Wörterbucheintrag in Print-Wörterbüchern. Ansonsten werden allerlei lexikografische Informationen unterschiedlichster Art in verschiedenen Fenstern (Panels) dargeboten. Darin kommen die Textsorten Diagramm, Wortwolke, korpusbasierte KWIC-Liste, Häufigkeitsliste und Inhaltsverzeichnis vor, aber auch zusätzliche Piktogramme, Linkbeschriftungen, Eingabefelder, virtuelle Schieberegler u.a.m.3 Schon auf diesem einem Screenshot (von zahllosen möglichen zum Stichwort Wörterbuch) stehen viel mehr Informationen und auch Informationsarten zur Verfügung, als in gedruckten Büchern präsentiert werden könnten. Außerdem finden wir an die zwei Dutzend sensitive Mouse-over-Flächen sowie weit über hundert Hyperlinks zu jeweils vertiefenden, benachbarten oder weiterführenden Informationen unterschiedlicher Art, die ihrerseits mit weiteren vernetzt sind. Außerdem können Fenster geschlossen und/oder weitere Fenster mit anderen Informationen hinzugefügt werden. So ist dieser Informations-Bildschirm zugleich eine Schalttafel zur rezeptiven Bedienung umfangreicher Datenbanken und Programme. Da übliche Bildschirme nur über eine Fläche von etwa ein bis zwei DIN-A-4-Seiten (bei Smartphones nur von etwa zwei Streichholzschachteln) verfügen, kann jeweils nur ein winziger Ausschnitt aus dem potentiell unendlichen virtuellen Informationsraum gezeigt werden. Dafür kann die Nutzerin oder der Nutzer diesen Ausschnitt (je nach vorheriger Programmierung des Anbieters) auf vielfältigste Weise selbst zusammenstellen und jederzeit nach Bedarf umkonfigurieren. „Auf der Webseite werden die verschiedenen Quellen jeweils als Panel dargestellt, die nach dem Lego-Prinzip zu sogenannten Sichten zusammengesetzt werden können. Darüber hinaus können Panels frei ab- oder hinzugewählt werden, so dass sich der Benutzer individuell parametrisierbare Sichten des lexikalischen Informationssystems zusammenstellen kann. Es gibt aber auch voreingestellte Sichten, wie beispielsweise die Standardansicht, die Statistiksicht oder die Referenzkorpussicht […]. Die Vorteile dieses aus vielfältigen Quellen bestehenden Sichtenkonzepts bestehen in der Reichhaltigkeit der präsentierten Informationen. Die Vielfältigkeit hat aber auch zwei gravierende Nachteile. Insbesondere können die Quellen redundante Informationen enthalten und damit für die Präsentation unübersichtlich werden und zweitens können die heterogenen Informationen zu Inkonsistenzen führen.“ (Geyken 2014: 95).

Derartige Komplexität lässt sich nicht linear darstellen – nicht einmal als einfach (z.B. alphabetisch) geordnete Liste von (fragmentarischen) Texten wie in herkömmlichen Wörterbüchern. Das alte Modell starrer Liste und klarer Linie wird ersetzt durch ein neues Modell strukturierter Fläche mit dynamischer Füllung. In semioti-

3 In einer neuen Fassung ( seit Juni 2015 im Beta-Betrieb) wird die PanelDarstellung weitgehend aufgegeben.

Wörterbücher als Sehflächen

217

scher Hinsicht kommen dabei hauptsächlich schriftsprachliche Zeichen (Wörter, Abkürzungen, Zahlen, meist elliptische Textstücke) vor und nur wenig bildähnliche Zeichen (Piktogramme, farbiges Balkendiagramm). Linear gelesen, sofern das überhaupt möglich ist, ergeben sie aber keinen vernünftigen Sinn – und schon gar nicht den gemeinten. Vielmehr gewinnen die einzelnen Zeichen ihre hier gemeinte Bedeutung erst durch ihre visuelle Gestaltung und ihre Position auf der Fläche. Nicht Grammatik (wie bei linearen Texten), sondern Typografie und Layout, also das visuelle Erscheinungsbild, verleihen der Zeichenfülle auf dieser Webseite Struktur und relevante Bedeutung. Also blicken wir auf eine schriftdominierte, variable Sehfläche. Vom Hersteller vorgegeben (und jederzeit änderbar) sind die zugrundeliegenden Daten, Algorithmen und die lexikografischen Design-Muster (templates). Angeregt durch die angebotenen Möglichkeiten erbasteln sich Nutzerinnen und Nutzer daraus selektiv und ad hoc das, was sie jeweils zu brauchen glauben. Angesichts der Fülle des Materials und der attraktiven und beweglichen Seitengestaltung lassen sie sich dabei wahrscheinlich zu weit mehr Vernetzungs-Ideen verführen, als ihnen das bei herkömmlichen Wörterbüchern auch schon geschehen wäre. Die Sehfläche in Abb. 5 wurde vom Nutzer bereits nach seinen Wünschen konfiguriert; zum Eintrag Wörterbuch kann man sich auch andere Resultate anzeigen lassen. Die sechs Felder enthalten unterschiedliche Informationen. Der Inhalt des ersten Feldes oben links könnte in ähnlicher Weise auch in gedruckten Wörterbüchern stehen, nur eben als unveränderlicher Teil einer ebenfalls unveränderlichen (z. B. alphabetisch geordneten) Liste. Hier können verschiedene Elemente angeklickt werden, so dass sich zusätzliche oder andere Fenster öffnen: Surfen im Netz statt Suchen in der Linie. Außerdem ist dieses Feld nur eines von mehreren, deren Informationen in der Rezeption wechselseitig aufeinander bezogen werden können. Das zweite Feld zeigt in einem Diagramm, wie oft das erfragte Stichwort im zugrunde liegenden Korpus vorkommt, verteilt nach vier Textsortengruppen und im historischen Verlauf des 20. Jahrhunderts. Sprachlicher Text spielt hier nur als Legende zur Erklärung der Grafik eine Rolle; die aktuelle Bedeutung der Wörter hängt nicht von ihrer grammatischen Einbettung, sondern von ihrer jeweiligen Platzierung auf der Fläche ab. Gilt üblicherweise mit Wittgenstein (1960: 311 = § 43): „Die Bedeutung eines Wortes ist sein Gebrauch in der Sprache.“, so hier: Die Bedeutung der Zeichen ergibt sich aus ihrer topografischen Verteilung auf der Fläche. Diagramme (wie im zweiten Feld) repräsentieren Relationen oder Proportionen der Teile ihres Objekts (vgl. Peirce 1983: 64; ausführlich Bauer/Ernst 2010). Deshalb machen diagrammatische Strukturen, wie sich hier zeigt, grammatische Strukturen entbehrlich. Auch das dritte Feld oben rechts weist diagrammatische Züge auf, wenngleich weniger stark. Die (alphabetisch geordnete, aber nicht alphabetisch zu lesende) Wortwolke in seinem größten Teil zeigt an, mit welchen anderen Wörtern das erfragte Stichwort Wörterbuch häufig gemeinsam auftritt; die Schriftgröße deutet die Stärke

218

Ulrich Schmitz

der statistischen Assoziation an (laut Beschreibung, die über das Fragezeichensymbol oben rechts erreicht werden kann). Alle kleineren Felder in diesem dritten Feld erlauben dynamische Anfragen verschiedener Art. Stärker noch als in den anderen fünf hier gezeigten Feldern haben wir es mit virtuellen Schalttafeln zu tun, analog etwa zu Bedienungsfeldern an mechanischen Maschinen oder Armaturenbrettern in Fahr- und Flugzeugen. Auch hier bezieht das jeweilige Wort seine spezielle Bedeutung nicht aus dem sprachlichen Kotext, sondern aus seiner Position auf der Fläche. Beispielsweise bezeichnet „Substantiv“ in der dritten Textzeile dieses Fensters, dass Wörterbuch als Substantiv betrachtet wird (assertiver Sprechakt). Gibt man das gleiche Wort dagegen in das freie Eingabefeld oben rechts ein, fasst das Programm es als Befehl auf, statistische Verbindungen beider Wörter zu errechnen (direktiver Sprechakt, durch Return-Taste dann deklarativ). Und erschiene das Wort in der Wortwolke, so hieße das (assertiv), dass Wörterbuch im Korpus häufig gemeinsam mit ihm vorkäme. Auch die Felder in der unteren Hälfte sind nicht auf lineare Textlektüre hin angelegt, sondern auf visuellen Zugriff, obgleich sie fast nur schriftliche Elemente enthalten. Das vierte Feld unten links zeigt Korpusauszüge mit dem Suchwort samt unmittelbar umgebendem Text. Das fünfte listet Korpusfrequenzen auf. Das sechste bietet ein anklickbares Verzeichnis weiterer Suchmöglichkeiten an, hier nämlich Analysen für syntaktische Relationen. Also selbst dort, wo es wenig Bilder gibt, ordnen Sehflächen (hier Online-Wörterbücher) ihre Informationen in erster Linie nach topografischen Gesichtspunkten an: Es kommt darauf an, was an welcher Stelle auf der Fläche steht. Je stärker die topografische Anordnung der Zeichen deren Bedeutung mit trägt, desto eindeutiger ist die Sehfläche ein Diagramm.

4.1.2 Hyperdynamik Wir gehen hier nicht auf sämtliche Einzelheiten ein; jeder mag die hier vorgetragene Perspektive durch eigene Nutzung des DWDS vertiefen. Ein wesentliches Merkmal, das die meisten elektronischen von allen gedruckten Wörterbüchern unterscheidet und das in der statischen Abb. 5 nicht gezeigt werden kann, ist ihre hypertextuelle und oft auch hypermediale Verfassung. Die Bildschirmseite ist nicht statisch, sondern kann mithilfe der meist sehr zahlreich angebotenen Links jederzeit ad libitum verändert werden. Jede Bildschirmseite, so auch die hier abgebildete, liefert (von unendlich vielen) nur einen tomografischen Schnitt durch die virtuell vieldimensionalen Informationsmengen eines Wörterbuches oder einer vernetzten Menge von Wörterbüchern und ggf. Enzyklopädien sowie anderen Informationsquellen. Während die Nutzerin im gedruckten Wörterbuch eine bestimmte Information durch einfaches Blättern auffindet und dann vorwiegend linear rezipiert, stellt sie im Online-Wörterbuch diverse Informationspäckchen durch Nutzung der Hyperflächen zusammen,

Wörterbücher als Sehflächen

219

erblickt und variiert sie ad libitum im Rahmen der vom Programm eröffneten Möglichkeiten. So gilt für jedes Online-Wörterbuch (bei neu erstellten immer, bei retrodigitalisierten zumindest aus Nutzersicht), was Storrer (2002: 231–235) für Hypertexte zusammenfasst: Sowohl als Ganzes als auch in seinen Teilen ist es „Mehr-als-Text“ (Textelemente sind ja nur ein Teil des Angebots), „Noch-nicht-Text“ (die gewünschte Auskunft wird durch Klicks erst zusammengestellt), „Text-in-Bewegung“ (der Nutzer wird stets weiterklicken), „Interaktiver Text“ (der Nutzer bedient ein Programm) und nichtlinear (die jeweils sichtbare Fläche wird selektiv und punktuell wahrgenommen). Storrer (2008) nennt die folgenden sechs Merkmale von Hypertext: „Computerverwaltung“ (Hypertechnik ist auf Computer angewiesen), „Nicht-Linearität“ (s.o.), „multimodale Kodiertheit“ (so gut wie alle Hypertexte enthalten auch nicht-schriftliche Elemente, z.B. Piktogramme, Bilder, Töne), „Dynamik“ (s.o. „Text-in-Bewegung“), „Interaktivität“ (s.o.) und „computervermittelte Kommunikation“ (ergibt sich aus Computerverwaltung und Interaktion). Jedenfalls sind Hypertexte und eben auch Online-Wörterbücher, meist in Verbindung mit nichtschriftlichen Informationen (grafischen Elementen, Bildern, gesprochener Sprache etc.), so gebaut, dass Nutzerinnen und Nutzer sich durch immer weitere Mausklicks aktiv durch nach innen bewegliche und nach außen mehr oder weniger offene Zeichenkomplexe hangeln, also durch semiotische Landschaften reisen. Die Informationen können gar nicht linear von vorn nach hinten erschlossen werden, was bei gedruckten Wörterbüchern zwar unnütz, aber doch möglich wäre. Vielmehr sollen und müssen die Auskünfte aus den bestehenden Daten punktuell ad hoc erzeugt werden. Genau dafür eignen sich dynamische Sehflächen. Üblicherweise werden gedruckte Wörterbücher ebenfalls punktuell und ad hoc rezipiert. Gewöhnlich liest man dort nur einen bestimmten Artikel oder Teile davon; und gutes Layout unterstützt selektive Lektüre. Die Hypertechnik jedoch eröffnet schier grenzenlose Möglichkeiten der Informationspräsentation. Dafür reichen linear dargebotene Texte noch weniger aus als für gedruckte Lexika. Zwar wurden auch in gedruckten Wörterbüchern schon immer einfache Möglichkeiten genutzt, die Seitenfläche nutzungspraktisch zu gestalten (z.B. durch Fettdruck, Ein- und Ausrückungen, Spalten, leere Flächen; s. o. Abb. 1 und 2). Doch unterhalb der generellen (z.B. alphabetischen) Listenform ist die waagerechte Linie das zentrale Mittel zur Ordnung der Präsentation. Anders ist es bei Online-Wörterbüchern: Wohl bleibt die gewohnte eindimensionale Lese-Linie teilweise erhalten. Aber sie wird in (reale) Fläche und (virtuellen) Raum integriert. Anders als bei herkömmlichen Wörterbüchern zeigt beispielsweise Abb. 5 nicht eine durchgehende rechtwinklige Fläche, sondern deren sechs (von mehr möglichen), die alle recht verschieden gestaltet und gefüllt sind. Innerhalb der meisten dominiert visuell durchaus die lineare Anordnung. Doch fortschreitend lineare Lektüre wird nur im ersten Feld oben links zumindest tendenziell erwartet. Meistens wäre sie gar nicht sinnvoll (z.B. im dritten Feld oben rechts), oder ohne Ver-

220

Ulrich Schmitz

änderung der gezeigten Inhalte nicht einmal möglich (z.B. im vierten Feld unten links). Kurzum: Die sechs Teilflächen in Abb. 5 zeigen jeweils einen kleinen tomografischen Schnitt durch Teile eines sehr großen virtuellen Informationsraumes. Linie (Textzeilen), Fläche (Sehflächen), Raum (kognitive Metapher für vieldimensionale multimodale Datenbanken): Print-Wörterbücher präsentieren ihre Informationen zeilenweise und nutzen dabei einfache Gestaltungselemente für Flächen. OnlineWörterbücher demgegenüber nutzen die Vorteile multimodaler Sehflächen mehr oder weniger intensiv aus und schöpfen dabei aus virtuellen Räumen. Folgerichtig zielte der nächste technische Schritt auf die Konstruktion realer (begehbarer) hypermedialer Informationsräume. Mit den derzeit vorstellbaren technischen Möglichkeiten wäre das für Wörterbücher allerdings wenig praktikabel. Was deren Präsentationsweisen angeht, dürfen wir von Online-Wörterbüchern vorerst nicht mehr und nicht weniger erwarten, als dass sie die typografischen, topografischen, multimodalen und hypertechnischen Gestaltungsmöglichkeiten einerseits inhaltlich immer komplexer, andererseits ergonomisch immer nutzerfreundlicher ausreizen. Das DWDS bemüht sich um Balance auf einem mittleren Weg: Sehr große Datenmengen, reichhaltige Informationen, zahlreiche Hyperlinks, wenig Multimodalität.

4.2 Andere Beispiele Die zahllosen elektronischen Wörterbücher im Internet bewegen sich in einem sehr breiten Spektrum zwischen (selten) barocker Pracht und (häufig) protestantischer Askese.4 Vor allem die seriöseren und werbefreien Angebote nutzen multimodale Möglichkeiten nur sparsam aus. Technisch umfassend mögliche Komplexität wird meist vermieden, und zwar sowohl wegen der Kosten als auch um der Nutzerfreundlichkeit willen. Doch selbst wenn sie vorwiegend monomodal schriftlich gehalten sind wie gedruckte Wörterbücher, führt die Hypertechnik weg von der Linie hin zur Darbietung kleinteiliger Informationspäckchen auf virtuell verschachtelten Flächen. Abb. 6 zeigt einen Ausschnitt zum Stichwort Wortschatz in elexiko innerhalb OWID, dem Portal für korpusbasierte Lexikografie des Instituts für Deutsche Sprache. Die Fläche ist klar und einfach gestaltet. Wie in fast allen Online-Wörterbüchern ist jeder Teilfläche per interner Konvention eine bestimmte Funktion zugewiesen, die

4 Siehe zum Beispiel die gut 300 dokumentierten Online-Wörterbücher in der kommentierten Datenbank LinseLinks sowie die gut 350 einschlägigen Links in (15.7.2015). Die zehn international orientierten Beiträge in Haß/Schmitz (Hrsg. 2010: 143–203) stellen die wichtigsten Online-Wörterbücher ausführlich vor. Überblick für den germanistischen Bereich bei Gantert (2010: 239–257), älter und knapper Beißwenger 2003.

Wörterbücher als Sehflächen

221

Abb. 6: Stichwort Wortschatz in elexiko5.

über Hyperlinks auf Wunsch auch weitergeführt werden kann. In der linken Spalte sehen wir hier einen scrollbaren Auszug aus der alphabetischen Liste sämtlicher Stichwörter in elexiko, in der rechten Spalte (fett hervorgehoben) die Position der Seite innerhalb des gesamten OWID-Projekts. Obwohl, wenn man von Farben absieht, ausschließlich monomodal, nämlich textbasiert, ist auch die mittige Hauptfläche in mehrere Felder mit Unterfeldern eingeteilt, um punktuellen Zugriff zu unterstützen. Waren gedruckte Wörterbücher vorwiegend auf gezieltes Nachschlagen angelegt, so dieses auf anregende Recherche. Wer konzentriert lesen will, braucht lineare Texte; prototypisch sind Romane. Wer weiß, was er sucht, schlägt in listenförmigen Auskunftssystemen nach; so arbeiten herkömmliche Wörterbücher. Wer breiter recherchieren möchte, dem helfen dynamische Informationspäckchen auf Flächen; dementsprechend sind die meisten Online-Wörterbücher gestaltet.

5 (Ausschnitt, 15.7.2015).

222

Ulrich Schmitz

Abb. 7: Stichwort Wörterbuch in LEO (RussischDeutsch)6.

Selbst wenn E-Wörterbücher in erster Linie zum Nachschlagen gedacht sind, nutzen sie die flächige statt linearer Präsentation und bieten weitere Flächen mit nicht erfragten Auskünften an – in Abb. 7 unter anderem über den „i“-Link zum Beispiel zu Aussprache, Flexionstabelle, Definition und ähnlichen Einträgen. Pixel-Bildschirme und Hypertechnik laden zu Informationsüberfluss ein. Sparsames Layout lenkt konzentrierte Nachschlager auch nicht ab und macht weitergehende Recherche dennoch möglich. In der Regel bieten auch retrodigitalisierte Fassungen gedruckter Wörterbücher allerlei zusätzliche Funktionen an, die durch Computer erst möglich werden. So ist beispielsweise das an der Universität Trier angesiedelte „Wörterbuchnetz“7 als virtu-

6 (Ausschnitt, 15.7.2015). 7 (eingesehen am 15.7.2015).

Wörterbücher als Sehflächen

223

elle Landschaft unzähliger vielfach untereinander verlinkter Sehflächen gestaltet: Statt in einer umfangreichen Papier-Bibliothek bewegt sich die Nutzerin/der Nutzer an einem einzigen Bildschirm durch gewaltige Datenmengen. Dort suchte man eher etwas Bestimmtes, hier findet man eher Ungeahntes. All das erfordert neuartige Planung von Ergonomie und Design auf Anbieterseite, erzeugt neues Such(t)verhalten auf Nutzerseite, und macht insgesamt – auch in Schulen – eine neuartige Bildung für den Umgang mit Wörterbüchern notwendig. Wenn Wörterbücher auch mit Illustrationen aufwarten, nähert sich ihr Erscheinungsbild herkömmlichen (prototypischen) Sehflächen an, wie man sie etwa von Plakaten, Presseprodukten und Warenverpackungen gewohnt ist. Auf den ersten Blick stehen hier Text und abbildendes (ikonisches) Bild in enger Beziehung zueinander. Am Beispiel von Unternehmenskommunikation im Internet hat Wetzchewald (2012) sämtliche theoretisch denkbaren und empirisch vorkommenden Beziehungen und Junktoren zwischen Text und Bild erkundet. In Wörterbüchern kommen davon nur wenige vor: erstens, weil Bilder hier fast ausschließlich der Illustration dienen (etwas sprachlich Beschriebenes wird visuell vorgezeigt); und zweitens, weil folglich nur ein sehr kleines Spektrum von Bildtypen verwendet wird (z.B. einfache Fotografien prototypischer Gegenstände ohne Umgebung). Kemmer (2014: 400–431) hat Illustrationen in Onlinewörterbüchern aufs Gründlichste untersucht und ihre Ergebnisse in neunzehn detaillierten Thesen zusammengefasst. Sie alle dienen der ergonomischen Beurteilung und Verbesserung lexikalischer Sehflächen. Kemmers Blickbewegungsstudie (Kemmer 2014: 347–379) zeigt auch, in welcher Weise Nutzerinnen und Nutzer einzelne Artikel in illustrierten Online-Wörterbüchern eben nicht linear lesen, sondern flächig erkunden – ganz ähnlich, wie man das von anderen Sehflächen zum Beispiel in der Presse kennt (z.B. Bucher/Schumacher Hrsg. 2012).

5 Rück- und Ausblick Klassische Schriftlichkeit arbeitet monomodal (sola scriptura) und linear (von Anfang bis Ende). Im Laufe medientechnischer Entwicklungen wurden die damit verbundenen Reduktionen, abhängig vom kommunikativen Zweck, immer weiter zurückgenommen. Heute erlauben digitale Medien samt Hypertechnik dynamische multimodale Verknüpfungen fast beliebiger Art innerhalb gigantischer Datenmengen.8 Dabei gibt Schrift ihre gewohnte Alleinstellung auf und wandert in Sehflächen (und Hörräume) ein. So werden semiotisch erheblich komplexere technisierte Kommunikationsweisen möglich, gern auch zu selektiver Nutzung für kurzfristigen Bedarf.

8 All das akribisch bis ins Kleinste zu untersuchen könnte eine Herausforderung für Nanolinguisten sein: .

224

Ulrich Schmitz

Diese allgemeine Tendenz geht an Wörterbüchern nicht vorbei. Wörterbücher zeichneten sich schon immer durch begrenzte Linearität innerhalb kleiner Module (Einträge), interne Querverweise sowie selektive Ad-hoc-Nutzung aus. Zur vollen Blüte gelangen diese Eigenschaften jedoch erst digital und vor allem online. Gedruckte Wörterbücher präsentieren begrenzte Informationsmengen weitgehend monomodal, folgen der Schrift-Linie, sind schwerfällig im Gebrauch und werden nur in langfristigen Etappen aktualisiert. Online-Wörterbücher lassen diese Grenzen hinter sich. Eigentlich sind es nicht Bücher, sondern vernetzte Datenbanken mit allerlei Rechen- und Darstellungsfunktionen. Theoretisch können sie unbegrenzt viele Informationen aufnehmen und zur Verfügung stellen. Dafür eignet sich die Linie monomodaler Schrift nicht. Vielmehr werden die gewünschten Auskünfte auf dynamischen Sehflächen zur Verfügung gestellt. Deren visuelles Design regelt den Zugang und ordnet die erfragten Daten. Für die Handhabung derartiger Sehflächen genügt klassische Schriftbildung nicht. Die Arbeit mit Online-Wörterbüchern liefert reicheren Ertrag, stellt aber andere Anforderungen an Nutzer. Sie müssen sich in einem Übermaß an Informationen zurechtfinden, das weder Anfang noch Ende hat. Sie können nicht in einer Liste suchen und dann linear lesen. Vielmehr müssen sie aktiv mit dynamischen Schriftbildern auf Sehflächen umgehen können. Das setzt Erfahrung und Urteilskraft voraus; beides kann man lernen. Der Erfolg hängt wesentlich von der Leistung des lexikografischen Anbieters ab. Wenn die Fläche sinnvoll, praktikabel und möglichst selbst erklärend gestaltet ist und bedient werden kann, können sowohl Experten als auch Laien damit wahrscheinlich effizienter arbeiten als mit Print-Wörterbüchern. So könnte es sein, dass elektronische Lexikografie den Umgang mit Wörterbüchern im 21. Jahrhundert demokratisiert – in ähnlicher Weise wie die gedruckte Tagespresse im 19. Jahrhundert zur „Demokratisierung der Schriftsprache“ beitrug (Eggers 1977: 128f.). Das setzt allerdings zweierlei voraus: Erstens braucht es weitere Experimente mit intelligentem Sehflächen-Design für Wörterbücher, denn die inhaltlichen, technischen und designerischen Möglichkeiten wurden bei weitem noch nicht ausgereizt. Und zweitens sind einschlägige Nutzerstudien nötig, die bisher fehlen. Die Möglichkeiten sind da. Es kommt drauf an, was wir draus machen.

6 Literatur Adelung, Johann Christoph (1786): Versuch eines vollständigen grammatisch-kritischen Wörterbuches der hochdeutschen Mundart, mit beständiger Vergleichung der übrigen Mundarten, besonders aber der Oberdeutschen. Fünften und letzten Theils Erste Hälfte, von W – Z. Leipzig: Breitkopf. Bauer, Matthias/Ernst, Christoph (2010): Diagrammatik. Einführung in ein kultur- und medienwissenschaftliches Forschungsfeld. Bielefeld: transcript. Beißwenger, Michael (2003): Wörterbücher im Internet. In: Zeitschrift für Germanistische Linguistik 31/2, 317–319.

Wörterbücher als Sehflächen

225

Bucher, Hans-Jürgen/Schumacher, Peter (Hrsg. 2012): Interaktionale Rezeptionsforschung. Theorie und Methode der Blickaufzeichnung in der Medienforschung. Wiesbaden: Springer VS. Duden (2001) = Deutsches Universalwörterbuch. 4. Aufl. Mannheim u.a.: Dudenverlag. Eggers, Hans (1977): Deutsche Sprachgeschichte IV. Das Neuhochdeutsche. Reinbek: Rowohlt. Gantert, Klaus (2010): Elektronische Informationsressourcen für Germanisten. Berlin. New York: de Gruyter Saur. Geyken, Alexander (2014): Methoden bei der Wörterbuchplanung in Zeiten der Internetlexikographie. In: Lexicographica 30. Berlin. New York: de Gruyter, 77–111. Gouws, Rufus Hjalmar/Heid, Ulrich/Schweickard, Wolfgang/Wiegand, Herbert Ernst (eds. 2013): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin. New York: de Gruyter (HSK 5.4). Haß, Ulrike/Schmitz, Ulrich (Hrsg. 2010): Lexikographie im Internet. Thematischer Teil in: Lexicographica 26. Berlin. New York: de Gruyter, 1–203. Kemmer, Katharina (2014): Illustrationen im Onlinewörterbuch. Text-Bild-Relationen im Wörterbuch und ihre empirische Untersuchung. Mannheim: Institut für Deutsche Sprache (= amades Bd. 47). Klosa, Annette (2014): Gibt es eine Zukunft für Wörterbücher? In: Sprachreport 30/4, 28–37. Kosem, Iztok/Kallas, Jelena/Gantar, Polona/Krek, Simon/Langemets, Margit/Tuulik, Maria (eds. 2013): Electronic lexicography in the 21st century: thinking outside the paper. Proceedings of the eLex 2013 conference, 17–19 October 2013, Tallinn, Estonia. Ljubljana/Tallinn: Trojina, Institute for Applied Slovene Studies/Eesti Keele Instituut. [Unter: http://eki.ee/elex2013/confproceedings; letzter Zugriff: 15.7.2015)]. Peirce, Charles S. (1983): Phänomen und Logik der Zeichen Frankfurt/M.: Suhrkamp. [amerik. Ms. 1903]. Frankfurt/M.: Suhrkamp. Schmitz, Ulrich (2011): Sehflächenforschung. Eine Einführung. In: Diekmannshenke, Hajo/ Klemm, Michael/ Stöckl, Hartmut (Hrsg.): Bildlinguistik. Theorien – Methoden – Fallbeispiele. Berlin: Erich Schmidt, 23–42. Schmitz, Ulrich (2015): Das Wort in der Sehfläche. In: Haß, Ulrike/Storjohann, Petra (Hrsg.): Handbuch Wort und Wortschatz. Berlin: de Gruyter, 102–128. Storrer, Angelika (2000): Was ist „hyper“ am Hypertext? In: Kallmeyer, Werner (Hrsg.): Sprache und neue Medien. Berlin. New York: de Gruyter, 222–249 (Jahrbuch 1999 des Instituts für deutsche Sprache). Storrer, Angelika (2008): Hypertextlinguistik. In: Janich, Nina (Hrsg.): Textlinguistik. 15 Einführungen. Tübingen: Narr, 211–227. Tarp, Sven (2012): Online dictionaries: today and tomorrow. In: Lexicographica 28. Berlin. New York: de Gruyter, 253–267. Wetzchewald, Marcus (2012): Junktoren zwischen Text und Bild – dargestellt anhand der Unternehmenskommunikation im Internet. Duisburg: Universitätsverlag Rhein-Ruhr. Wiegand, Herbert Ernst (1999): Mit Wittgenstein über die Wortbedeutung nachdenken. Gebrauch? Regel des Gebrauchs? Ein Etwas im Kopf. In: Wiegand, Herbert Ernst (Hrsg.): Sprache und Sprachen in den Wissenschaften. Geschichte und Gegenwart. Festschrift für den Verlag Walter de Gruyter & Co. anläßlich einer 250jährigen Verlagstradition. Berlin. New York, 404–461. Wiegand, Herbert Ernst (2008): Festschrift. Ein Wörterbuchartikel. In: Cölfen, Hermann/ Voßkamp, Patrick (Hrsg.): K(l)eine Festschrift. Ulrich Schmitz zum 60. Geburtstag. Duisburg: Universitätsverlag Rhein-Ruhr, 55–60. Wittgenstein, Ludwig (1960): Philosophische Untersuchungen [1953]. In: Wittgenstein, Ludwig. Schriften 1. Frankfurt/M.: Suhrkamp, 279–544.

Sven Tarp

The amazing vitality of things that don’t exist Abstract: This contribution moves in the grey zone between lexicographical reality and fiction. It starts three hundred years ago and presents some dictionaries that do not exist. It then follows the historical development and shows how these dictionaries recently have got company by lexicographical theories that flourish although they do not exist either. It argues that this mess has been created and has survived until our days because some lexicographers follow their personal preferences instead of being faithful to their empirical basis. The contribution sends an optimistic message praising the vitality of the non-existing dictionaries and theories. Keywords: dictionary of things, dictionary of words, dictionary of facts, lexicographical theory, lexicographical evidence Schlagwörter: Wörterbuch der Dinge/Sachen, Wörterbuch der Wörter, Wörterbuch der Fakten, lexikographische Theorie, lexikographische Evidenz

“The United States will come to talk to us when they have a black President and the world has a Latin American Pope” (Fidel Castro 1973)

1 Things that don’t exist The European middle age was crowded by many strange creatures. Elves, spirits, goblins, demons, gnomes, dwarfs and ogres were just some of them. These magic creatures were of very different kinds and varied from region to region, from country to country. Some lived in houses and other in the deep forests, some inhabited isolated rocks and other hided in caves. Some were good, friendly and helpful, other were bad and troublesome and a permanent nuisance to the superstitious people. The magic creatures seem to have had their own life. They were subjected to the Darwinian law of “the survival of the fittest” and many adapted to the changing milieu. But in this particular case the milieu was not Mother Nature but human imagination. With the passing of time, some of these creatures changed completely and even adopted the opposite characteristics. The elves were originally annoying

Sven Tarp: Centre for Lexicography, School of Business and Social Sciences, Aarhus University, Jens Chr. Skous Vej 4, 8000 Århus V (Denmark), Phone: +45 8716 4851, email: [email protected]

228

Sven Tarp

and troublesome creatures living in peoples’ houses, but today they have developed into nice and friendly fellows who mostly appear at Christmas time and in commercial advertisements. The pixies have their origin in the high moorland areas around Devon and Cornwall where they entertained people with their dances, but in the 20th century they moved into technology and became a constant nuisance to aircraft engineers, among others. According to an old Danish saying, “every parish has its own trolls”. I will not claim to have visited all parishes in Denmark but I surely have been in most of them. To my big disappointment, I have never personally had the privilege of meeting any of these mythical creatures but I have talked to quite a number of people convinced of their existence and even claiming to have seen them. Today well-informed and learned people will know that all these creatures are just the product of the human brain and its creative imagination. They came into being in order to scare, to cheat, to give comfort or just to explain the otherwise unexplainable, each of them with a specific purpose. It is a well-known phenomenon that people frequently go from one extreme to another. Today some “learned” people have not only turned their back on the mystic creatures born in a darker period of human intellectuality. In a perhaps well-intentioned but excessive and ill-fated effort not to repeat past mistakes, these people have gone to the opposite extreme and now claim that various things existing in the real world do not exist as were they just elves, trolls, goblins, demons, etc. Now the reader will probably ask what all this has to do with a festschrift for Professor Herbert Ernst Wiegand. Unfortunately, it has quite a lot to do with this. The phenomenon described has also been haunting lexicography, at least for the past 260 years.

2 Things that do exist When the printing technology finally arrived in Europe, hundreds of years after it was invented in China, it quickly made its way into lexicography. Although maintaining the paper book as the medium of communication, the passing from handwritten to printed dictionaries had huge and disruptive consequences for lexicography, only comparable to the recent introduction of the computer and information technologies and the current transition to the digital media. It did not only lead to radical changes in the article format and the inclusion of new data categories, as explained in great details by Hanks (2010). The fact that the printing technology allowed the rapid publication of a large number of dictionaries, also meant that dictionaries reached users from new social strata with other types of lexicographical need related to the general development of society. Especially in the period of European history known as the Enlightenment Era, this gave rise to lexicographical experimentation and the birth of a completely new

The amazing vitality of things that don’t exist

229

generation of dictionaries with new purposes and contents. Many philosophers, scientists and learned people now regarded dictionaries as “the best means to disseminate sciences” and “speed up their progress” (Ganilh 1826: xxvii). Dictionaries were no longer just “inventories of words”, as claimed by Trench (1858) and still maintained by some modern lexicographers. John Harris (1704), the author of the “Universal English Dictionary of Arts and Sciences”, also titled “Lexicon Technicum”, perhaps wanted to highlight this new aspect of lexicography when he wrote in the Preface that his dictionary did not only contain “bare Words” but also “Things”. In fact, those who consulted this dictionary would not only find “an Explication of the Technical Words, or the Terms of Art made use of in all the Liberal Sciences… but also those Arts themselves”. Almost identical words were used by Ephraïm Cambers (1728) to describe his “Universal Dictionary of Arts and Sciences” (also titled “Cyclopædia”) which was intended “as a Course of Ancient and Modern Learning”. According to the subtitle, it contained both “definitions of the terms, and accounts of the things signify’d thereby, in the several arts, both Liberal and Mechanical, and the Several Sciences, Human and Divine…” Other authors used other words to express similar ideas. Postlethwayt (1749:2) wrote that knowledge of foreign and domestic trade was scattered “in an infinity of volumes”, but that it would be “reduced to the form of a Dictionary, for alphabetical reference” in his planned “Universal Dictionary of Trade and Commerce”. In 1766, a “Society of Gentlemen” used almost the same words to explain the idea behind their “General Dictionary of Husbandry” which aimed at introducing the most advanced knowledge and modern techniques in British husbandry “in all its branches”. This dictionary was also titled “The Complete Farmer” and contained “the valuable Precepts, Observations, Discoveries, and Improvements” scattered in publications by a big group of experts from various countries. The 18th century was filled with similar dictionaries, many of them characterized by lexicographical innovation. At the end of the century (1784), a dictionary directly titled “Arte e Diccionario do Commercio e Economía Portugueza” (”Art and Dictionary of Commerce and Portuguese Economy”) appeared in Portugal. The work begins with a 25-pages systematic introduction to the subject field, whereas the remaining part constitutes an example of a dictionary of things and facts. In this dictionary, the lemmata do not provide access to either definitions, as they are traditionally understood in lexicography, or any sort of linguistic data, but to very specific data concerning trade, commerce, and economy, occasionally accompanied by the author’s personal comments: All these and many similar dictionaries DID EXIST. Based on this undeniable factual evidence, the French illuminist Jean le Rond d’Alembert (1754) therefore distinguished between three categories of dictionary, namely “dictionaries of words, dictionaries of facts, and dictionaries of things”. This he did in an article specifically dedicated to the topic in the famous “Encyclopédie” (also titled “Dictionnaire raisonné des sciences, des arts et des metiers”). Being a great scientist and philosopher,

230

Sven Tarp

Example 1: Articles from the “Arte e Diccionario do Commercio e Economía Portugueza”.

d’Alembert took into account the lexicographical practice of his epoch, as well as the ideas expressed by contemporary authors of specialized dictionaries. Jean le Rond d’Alembert did not close his eyes to reality. It is interesting to establish an analogy to our time. For the past half century the usefulness of corpora has been discussed among linguists and lexicographers. When the first corpora were introduced, some scholars like Lees (1962: 110) regarded them as a waste of time with the argument that “a native speaker of English in ten minutes (…) can produce more illustrations of any point in English grammar than you will find in many millions of words of random text.” Today, this kind of introspective argumentation has been put to shame by practice. Only a few modern lexicographers deny the relevance of corpora to their work, although there may be different opinions as to what extent they can be useful. With this in mind, it is surprising to see that some of these lexicographers do not demand the same degree of scientific rigor in terms of empirical basis when it comes to defining the very term dictionary. It all seems to start with Samuel Johnson.

3 I don’t like it: Ergo it doesn’t exist Samuel Johnson was a great pioneer of English lexicography and his merits as such cannot be neglected. No doubt about that. But he was not the only lexicographer of his epoch. Neither was he the most advanced and innovative if lexicographers from other European countries like France, Italy and Germany are also considered. However, due to the rise of the British and later the North American empire, English became an international lingua franca. This fact undoubtedly gave more international projection than deserved to some of Samuel Johnson’s ideas. One of these is how the term dictionary should be understood and defined.

The amazing vitality of things that don’t exist

231

In 1755 Samuel Johnson published his world-famous “Dictionary of the English Language”. The year is important. It was only one year after the appearance of d’Alembert’s article on dictionaries in the French Encyclopédie. And it was the very same year that Malachy Postlethwayt published the last installment of the first edition of his “Universal Dictionary of Trade and Commerce”, probably the most advanced specialized dictionary project to see the light in Britain in the 18th century, cf. Tarp/ Bothma (2013). The “Dictionary of the English Language” is a typical “dictionary of words” according to d’Alembert’s classification. Here, Johnson defines a dictionary as a “book containing the words of any language in alphabetical order, with explanations of their meaning; a lexicon; a vocabulary; a word-book”. Hence, a dictionary is only about words. The “things”, i.e. the content of arts, sciences and crafts – as well as the “facts” – emphasized by some of Johnson’s contemporaries, completely disappear in his definition. This cannot but surprise. Johnson knew very well of the existence of “dictionaries of things” as can be seen in the Preface which he dedicated to the second edition of Richard Rolt’s “New Dictionary of Trade and Commerce” (1761). This text was written although he did not know either the author or the dictionary: ”Sir, (said he) I never saw the man, and never read the book. The booksellers wanted a Preface to a Dictionary of Trade and Commerce. I knew very well what such a Dictionary should be, and I wrote a Preface accordingly.” (quoted from Boswell 1791: 359)

The “Cambridge International Dictionary of English” defines the word arrogant as being “unpleasantly proud and behaving as if you are more important than, or know more than, other people”. Similar definitions can be found in other dictionaries; all of them describing very well the attitude expressed by Johnson in the above quotation. Let us now see what a man with this attitude wrote in a preface to a dictionary which he never read: “It has lately been the practice of the learned to range knowledge by the alphabet, and publish dictionaries of every kind of literature. This practice has, perhaps, been carried too far by the force of fashion. Sciences, in themselves systematical and coherent, are not very properly broken into such fortuitous distributions. A dictionary of arithmetic or geometry can serve only to confound; but commerce, considered in its whole extent, seems to refuse any other method of arrangement, as it comprises innumerable particulars unconnected with each other, among which there is no reason why any should be first or last, better than is furnished by the letters that compose their names.” (Johnson 1761).

Here it is, black on white. Samuel Johnson was aware of the existence of certain “dictionaries of things” but considered them to be “carried too far”. This opinion is perfectly legitimate and may be the reason why he defined the term dictionary as exclusively being a “word-book” in his “Dictionary of the English Language”. How-

232

Sven Tarp

ever, disapproval of specific types of dictionary can never justify that such dictionaries are treated as were they magic creatures from the middle ages. Samuel Johnson did not like “dictionaries of things”. He closed his eyes to reality – and ergo they did not exist!

4 To be or not to be Johnson’s lexicographical hocus-pocus was the starting point for a harmful schism that has haunted lexicography ever since. On the one hand, “dictionaries of “things” have been published in an increasing number and variety. On the other hand, dictionaries are still regarded as “inventories of words” by many lexicographers, even in the 21st century. This fact is astonishing. In 1826 José Canga Argüelles, a former Spanish minister of public finance, published a dictionary which he himself described as a “small library of public finance”. The purpose was to train senior civil servants in the department of public finance. In 1844 Johnson and Emerson published a dictionary of rural affairs dedicated to the “book-farmer”. This dictionary aimed at educating farmers in order to raise productivity in American agriculture. This lexicographical tradition has continued up to our time. Thousands of dictionaries have been produced in this spirit. In recent years, the Oxford University Press has published a long series of specialized dictionaries aimed at assisting students in learning disciplines like archeology, nursing, economics, physics, philosophy and biology, just to mention a few of them. Many other publishing houses from many countries and language areas have done the same. According to Hoare (2009: 47) “scientific, technical, and other specialized dictionaries greatly outnumber all other kinds” in the present-day library. Of these works, many are “dictionaries of things”, i.e. specialized dictionaries designed to transmit knowledge about a specific subject, discipline or branch of science. When defining a dictionary in his “Diccionario de lexicografía práctica”, Martínez de Sousa (1995: 144) rightly observes that “many sciences and techniques that could be expounded in the form of a treatise or a study are reduced to the form of a dictionary, a formula which is generally well received by the users”. The idea is identical to the one expressed by Postlethwayt 246 years earlier. It shows that some modern lexicographers accept the existence of “dictionaries of things”, even when they call them other names. Others, however, still follow in Samuel Johnson’s footsteps and seem comfortable turning a blind eye to reality. Recently, a peer reviewer from ”International Journal of Lexicography” even claimed that dictionary of things is not a known lexicographical term and asked the authors to correct this “mistake”.

The amazing vitality of things that don’t exist

233

Today, many general dictionaries treat the lemma dictionary as a polyseme. The online ”Macmillan English Dictionary” defines one of the senses as “a book, website or other resource which deals with a particular subject, providing the words, phrases, and terms used in that field, with information about their meaning and use”. This is a very precise definition of one type of specialized dictionary – but it completely excludes another type, namely the “dictionary of things”. The proof is 312 years old. Harris (1704) distinguished between 1) words or terms, 2) explications of these words or terms, and 3) the arts or things themselves. The definition from ”Macmillan English Dictionary” includes points 1 and 2, but not point 3. “Dictionaries of things” are still orphan.

5 The apple of discord Why is all this so important? First of all because it has led lexicography – or part of it – into a blind alley. Many authors of “dictionaries of things” have nowhere to go when they need discussing the lexicographical challenges posed to their dictionaries. These authors are, as a rule, experts within their fields, frequently even vanguard researchers. The only advice they get from established lexicography is to desist from dictionary making because they don’t know “how lexicons operate (…) how to represent meaning” (Frawley 1988: 196), and how to follow “the lexicographical format (…) properly” (Riggs 1989: 90). Such advices cannot be taken serious. Unfortunately, the two lexicographers mentioned here are no exception to the rule. They themselves are the victims of a schism dating back to Samuel Johnson’s ”Dictionary of the English Language”. The overcoming of this ruinous problem is crucial to lexicography. If it continues, lexicography will experience difficulties in resolving all its tasks in the digital era, among them a new and much broader understanding of what is a dictionary. However, the real importance of this discussion lies elsewhere. The existence of “dictionaries of things” shows better than anything else that lexicography is not a linguistic discipline. Linguistic knowledge may be necessary for the compilation of “dictionaries of words”. For the compilation of “dictionaries of things” it is irrelevant. Here knowledge about “things” is relevant. “Dictionaries of words”, “dictionaries of things” and “dictionaries of facts” are very different types of works that require very different types of knowledge to be compiled. The fact that all of them can be classified as dictionaries indicates that they have something in common in spite of their big variety. These uniting elements cannot be linguistics or any of the thousands of other types of specific subject-field knowledge needed in accordance with the purpose of each individual dictionary, i.e. needed in some dictionaries but not in all of them. Hence, if an abstraction is made from all these types of specialized knowledge used in one or another dictionary, what remains is nothing but pure, non-conta-

234

Sven Tarp

minated lexicography. Such an approach reveals lexicography as a discipline in its own right. It paves the way for an independent study of the discipline. And even worse: it lays the foundations for the building of a theory – or theories – of lexicography. This is the real apple of discord.

6 Snakes in Ireland In recent years, a number of lexicographers belonging to the Anglo-Saxon tradition have lined up and rejected the existence of a theory of lexicography. Atkins/Rundell (2008: 4) “do not believe that such a thing exists”. Bogaards (2010: 316) shares this opinion although he does not deny that a theory may exist. He simply rejects the existing ones because they lack “empirically verifiable or falsifiable hypotheses”. By using this argument, he seems to stick to the Popperian tradition without understanding its distinction between scientific theories and other theories where only the former require falsification, cf. Popper (1963: 38). In a certain sense, Bejoint (2010) sums up the arguments provided against a theory of lexicography: “I simply do not believe that there exists a theory of lexicography, and I very much doubt that there can be one. Those who have proposed a general theory have not been found convincing by the community, and for good reasons. A theory is a system of ideas put forward to explain phenomena that are not otherwise explainable. A science has a theory, a craft does not. All natural phenomena need a theory, but how can there be a theory of the production of artefacts? There are theories of language, there may be theories of lexicology, but there is no theory of lexicography.” (Bejoint 2010: 381).

This line of reasoning has been dismissed point by point by Fuertes-Olivera/Tarp (2014). The practical compilation of dictionaries can, of course, be defined as a craft but this does not exclude that it is subjected to observation, empirical studies and theoretical generalizations. Nothing prevents lexicographers from 1) observing and studying this craft in all its dimensions, 2) isolating relevant phenomena with certain properties, 3) establishing the relations existing between them, 4) making statements about these phenomena and relations, and 5) systematizing these statements. This is all that is required to formulate a coherent theory of lexicography as it has been done by various scholars, among them Herbert Ernst Wiegand. But arguments seem to be without effect in this surrealist circus: Somebody has “proposed” a general theory of lexicography. Bejoint doesn’t like it – and ergo it doesn’t exist. End of story! In an attempt to be funny, the French scholar compares a theory of lexicography with the famous Irish snakes who, according to the legend, were exterminated by St. Patrick. No problem here. There may not be a theory in Bejoint’s intellectual universe,

The amazing vitality of things that don’t exist

235

but it certainly exists in the real world, even in Ireland. St. Patrick is not known to be a killer of theories.

7 They will come to talk to us During the past four decades, Herbert Ernst Wiegand has created a monumental work of lexicographical theory, mainly concerning printed dictionaries. Lexicographers may agree or disagree with this gigantic work – or part of it. They may find it relevant or irrelevant for their own lexicographical endeavour. They may even like or dislike it. All this is acceptable in the framework of a healthy academic discussion. But ignoring this work, or even worse, claiming that it doesn’t exist, is an expression of intellectual poverty only surpassed by that of the audience to which Galileo addressed the famous words “Eppur si muove”. “Dictionaries of things” don’t exist! A theory of lexicography doesn’t exist! Herbert Ernst Wiegand’s theoretical work doesn’t exist! But although they don’t exist, all of them show amazing vitality! The online “Macmillan English Dictionary” defines the word blind as, among other things, “unable to realize or admit the truth about something”. The reader, however, looks in vain for the expression nobody is as blind as the one who doesn’t want to see. Those who cannot see will come to talk to us when lexicographical glasses are eventually invented. In the present digital era this day may come sooner than later. Until then the show will go on.

8 Bibliography 8.1 Dictionaries A New Dictionary of Trade and Commerce = Rolt, Richard: A New Dictionary of Trade and Commerce. Second Edition. London: Printed for G. Keith, S. Crowder, and H. Woodgate and S. Brooks, 1761. American farmer’s encyclopedia and dictionary of rural affairs = Johnson, Cuthbert W./Emerson, Governeur G.: The American farmer’s encyclopedia and dictionary of rural affairs. Third Edition. Philadelphia: Carey and Hart, 1744. Arte, e Diccionario do Commercio, e Economía Portugueza = Jesus Maria, B. de: Arte, e Diccionario do Commercio, e Economía Portugueza, para que todos negoceem, e governem os seus bens por calculo, e não por conjectura; ou para que todos lucrem mais com menos risco. Lissabon: Na Offic. do Domingos Gonsalves, 1784. Cambridge International Dictionary of English = Procter, Paul (ed.): Cambridge International Dictionary of English. Cambridge: Cambridge University Press, 1996.

236

Sven Tarp

Cyclopædia = Cambers, Ephraïm: Cyclopædia; or, an Universal dictionary of arts and sciences. London: James and John Knapton, 1728. Diccionario de lexicografía práctica = Martínez de Sousa, José: Diccionario de lexicografía práctica. Barcelona: Biblograf, 1995. Dictionary of the English Language = Johnson, Samuel: Dictionary of the English Language. London: J. & P. Knapton, 1755. Encyclopédie = Diderot, Denis/D’Alembert, Jean le Rond (eds.): Encyclopédie, ou Dictionnaire raisonné des sciences, des arts et des metiers. Tome 1–35. Paris: Briasson, 1751–1780. Lexicon Technicum = Harris, John: Lexicon Technicum: or, an Universal English Dictionary of Arts and Sciences: Explaining Not Only the Terms of Art, but the Arts Themselves. London: D. Brown, J. Walthoe, J. Knapton, B. and S. Tooke, D. Midwinter, B. Cowse, T. Ward, E. Symon, E. Valentine, and J. Clark, 1704. MacMillan English Dictionary = Rundell, Michael (ed.): MacMillan English Dictionary. London: MacMillan, 2015. [www.macmillandictionary.com]. The Complete Farmer = A Society of Gentlemen: The Complete Farmer: or, a General Dictionary of Husbandry. London: The Authors, 1766. Universal Dictionary of Trade and Commerce = Postlethwayt, Malachy: The Universal Dictionary of Trade and Commerce. London: John and Paul Knapton, 1751–1755.

8.2 Other literature Atkins, B.T. Sue/Rundell, Michael (2008): The Oxford Guide to Practical Lexicography. Oxford: Oxford University Press. Bejoint, Henri (2010): The lexicography of English. Oxford: Oxford University Press. Bogaards, Paul (2010): Lexicography: science without theory? In: De Schryver, Gilles-Maurice (ed.): A Way with Words: Recent Advances in Lexical Theory and Analysis. A Festschrift for Patrick Hanks. Kampala: Menha Publishers, 313–322. Boswell, James (1791): The life of Samuel Johnson. London: Printed by Henry Baldwin for Charles Dilly, in the Poultry. D’Alembert, Jean le Rond (1754): Dictionnaire. In: Diderot, Denis/D’Alembert, Jean le Rond (eds.): Encyclopédie, ou Dictionnaire raisonné des sciences, des arts et des metiers. Tome IV. Paris: Briasson, 958–969. Francis, W. Nelson (1979): Problems of Assembling and Computerizing Large Corpora. In: Bergenholtz, Henning/Schaeder, Burkhard (eds.): Empirische Textwissenschaft. Aufbau und Auswertung von Text-Corpora. Königstein/Ts.: Scriptor, 110–123. Frawley, William (1988): New forms of specialized dictionaries. International Journal of Lexicography 1:3, 189–213. Fuertes-Olivera, Pedro A./Tarp, Sven (2014): Theory and practice of specialised online dictionaries: Lexicography versus terminography. Berlin/Boston: de Gruyter, 2014. Ganilh, Charles (1826): Préface. Dictionnaire analytique d’économie politique. Paris/Brussels: Ladvocat. Hanks, Patrick (2010): Lexicography, Printing Technology, and the Spread of Renaissance Culture. In: Dykstra, Anne/Schoonheim, Tanneke (eds.): Proceedings of the XIV Euralex International Congress. Leeuwarden: Fryske Akademy, 988–1016. Hoare, Michael R. (2009): Scientific and technical dictionaries. In: Cowie, Anthony P. (ed.): The Oxford History of English Lexicography. Volume II: Specialized Dictionaries. Oxford: Oxford University Press, 47–93.

The amazing vitality of things that don’t exist

237

Johnson, Samuel (1761): Preface. In: Rolt, Richard: A New Dictionary of Trade and Commerce. Second Edition. London: Printed for G. Keith, S. Crowder, and H. Woodgate and S. Brooks. Lees, Robert (1962): Oral contribution, quoted by Francis (1979: 100). Popper, Karl Raimund (1963): Conjectures and Refutations. London: Routledge & Kegan Paul. Postlethwayt, Malachy (1749): A dissertation on the Plan, Use, and Importance, of the Universal Dictionary of Trade and Commerce. London: John and Paul Knapton. Riggs, Fred W. (1989): Terminology and lexicography: Their complementarity. International Journal of Lexicography 2:2, 89–110. Tarp, Sven / Bothma, Theo J. D. (2013): An Alternative Approach to Enlightenment Age Lexicography: The Universal Dictionary of Trade and Commerce. Lexicographica 29, 222–284.

Lexikographie und Metalexikographie: Status quo und Perspektiven

Christoph Bläsi

Was haben Metalexikographie und Publishing Studies miteinander zu tun? Das in beiden Fällen bestehende produktive, bidirektionale Verhältnis zu einer kulturellen Praxis als zentraler Befund Abstract: In Germany, metalexicography and book / publishing studies have developed from german studies, in the case of metalexikography german studies mediated from an earlier strand in French philology. This paper contrasts the two areas of research. The aspects covered are 1) the considerations in both areas, if it is or can be seen as a (scholarly) discipline, 2) the discussions about theories and methods as well as 3) the connections of both areas to a respective practice. It turns out that specific, bidirectionally productive connections with cultural practices are the salient point of congruence between the two research areas; in the case of publishing studies the reference practice is given in the form of the publishing industry, in the case of metalexicography in the form of practical lexicography. The fact that the subject field intersection between the two areas has traditionally been nonempty as well as the effects and challenges of the ongoing digital transitions in the media systems on both of them make common research efforts between metalexicography and publishing studies look like a worthwhile and promising project. Keywords: Book Studies/Publishing Studies, Metalexicography, German Studies, Theories, Methods, Cultural Practice, (Scholarly) Discipline Schlagwörter: Buchwissenschaft, Metalexikographie, Germanistik, Theorien, Methoden, kulturelle Praxis, Disziplin

1 Hinführung in vier Schlaglichtern Schlaglicht 1: Eine Person soll in einem Verlag den Publikationsprozess für ein Wörterbuch managen und dabei auch die Wörterbuchredakteure anleiten. Gibt es Ausbildungsgänge bzw. Studiengänge, die auf eine solche Tätigkeit vorbereiten? Die gibt es: Insbesonde-

Christoph Bläsi: Institut für Buchwissenschaft, Johannes Gutenberg-Universität Mainz, Philosophicum, Jakob-Welder-Weg 18, 55128 Mainz, email: [email protected]

242

Christoph Bläsi

re wären das ein Studium der Buchwissenschaft mit einem Schwerpunkt auf dem zeitgenössischen Buchmediensystem (international typischerweise „Publishing Studies“ genannt) oder der Germanistischen Linguistik mit einem Schwerpunkt auf Metalexikographie.

Schlaglicht 2: Buchwissenschaftlerinnen und Buchwissenschaftler müssen sich nicht nur damit abfinden, dass die Gegenstände ihrer Beschäftigung seit einigen Jahrzehnten zunehmend unanschaulicher werden (CD-ROMs, E-Book-Dateien, …), sondern auch damit, dass sie perspektivisch sogar zu verschwinden drohen: Was hat das Workflow-Management-Produkt eines Fachverlages mit Verlegen zu tun? Der Gegenstandsbereich der Buchwissenschaft muss deswegen – parallel zu einer vertretbaren Wahrnehmung, dass eben nicht nur E-Books, sondern auch buchinhaltsbasierte Softwarelösungen zur Buchwelt gehören – abstrakter gefasst werden. In der Metalexikographie ist der wohl auch dort anstehende Abstraktionsprozess offenbar (noch) nicht expliziert und überschreitet insbesondere nicht die Grenze, bis zu der man wenigstens noch intuitiv von „Content“ sprechen kann – die Gegenstände haben z.B. mit Tripeln mit lexikographischer Information in der Linked Open Data-Cloud für die Verwendung durch Softwareagenten und sprachtechnologische Anwendungen aber ebenfalls sehr an Anschaulichkeit verloren. Ein Beispielphänomen, das beide Forschungsbereiche entsprechend herausfordert, sind Spellchecker (Rechtschreibprüfprogramme); eine Aufnahme in den Gegenstandsbereich der Metalexikographie bietet sich an, und auch zur Buchwelt und damit zum Gegenstandsbereich der Buchwissenschaft gehören sie, insofern z.B. die zur Vermarktung verwendete Marke (z.B. „Duden“) sowie die eingegangene redaktionelle Kompetenz aus der Buchwelt kommen.

Schlaglicht 3: Wörterbücher (und Enzyklopädien) sind nicht selten zu Monographien und Aufsätzen alternative oder diese ergänzende Ergebnisformen (geistes)wissenschaftlichen Arbeitens. Überlegungen zur Zukunft geisteswissenschaftlicher Erkenntnisprozesse und – als ein wichtiger Unterpunkt – des geisteswissenschaftlichen Publizierens, nicht zuletzt auch im Zusammenhang mit der Entwicklung der Digital Humanities, betreffen beide, Nachschlagewerke und Monographien: das eine traditionell mehr im Fokus der Metalexikographie, das andere in dem der Publishing Studies.

Was haben Metalexikographie und Publishing Studies miteinander zu tun?

243

Schlaglicht 4: Es gibt universitäre Studiengänge der Buchwissenschaft; diese gelten allerdings akademisch überwiegend durch ihre buchhistorischen Bestandteile als legitimiert. Studiengänge ohne explizit historische Anteile gibt es an deutschen Universitäten nicht, wohl aber – typischerweise unter dem Namen „Publishing Studies“ – in anderen Ländern (sowie, unter anderen Namen, z.B. auch an deutschen Fachhochschulen). Im Hinblick auf diese Publishing Studies gibt es eine Diskussion darüber, ob die entsprechenden Forschungs- und Lehrinstitutionen mit vollem Recht als zu einer Disziplin gehörig angesehen werden können bzw. was zu tun sei, dass man das mit Recht sagen kann. Andererseits gibt es in Deutschland zwar nur einen (internationalen) Studiengang der (Meta-)Lexikographie (European Master in Lexicography1 an der Universität Erlangen-Nürnberg); vielfach ist Metalexikographie aber ein Vertiefungsbereich anderer, typischerweise germanistischer Studiengänge. Es gibt auch dort eine Diskussion darüber, ob die Metalexikographie nun eine (wissenschaftliche) Disziplin sei.

2 Publishing Studies und Metalexikographie Was die Geschichte der beiden Forschungsbereiche angeht, gibt es deutliche Parallelen, und zwar in Gestalt ihrer, etwas verkürzt ausgedrückt, gemeinsamen Abkunft aus der Germanistik; diese Aussage gilt natürlich einerseits nur für die deutschsprachige Metalexikographie, und andererseits nur für die deutsche Buchwissenschaft – und nur als etabliertes Fach als Ganzes, das traditionellerweise Buchgeschichte und die Beschäftigung mit dem zeitgenössischen Buchmediensystem integriert2. Wie sich zeigen wird, führt darüber hinaus insbesondere der für Geisteswissenschaften (in Deutschland) ungewöhnlich direkte Bezug zu einem beruflichen Handlungsfeld bzw. einer kulturellen Praxis als wichtiger Teil des jeweiligen Selbstverständnisses dazu, dass die Gemeinsamkeiten von Publishing Studies und Metalexikographie möglicherweise größere Beachtung verdienen. Ungeachtet der diesen Beitrag motivierenden und leitenden Gemeinsamkeiten gibt es aber natürlich auch wesentliche Unterschiede zwischen den beiden Forschungsbereichen. Zunächst einmal liegen umfangreiche Teile der Gegenstandsbereiche systematisch jeweils außerhalb derer des anderen: So beschäftigen sich die Publishing Studies auch mit Aspekten von Non-Fiction-Büchern im Allgemeinen, also

1 So lautet der Name des Studienganges, den man systematisch vielleicht eher als „[…] Master in Metalexicography“ oder „[…] Master in Lexicographic Studies“ erwartet hätte. 2 Ich nenne diesen zweiten, an deutschen Universitäten unselbständigen Bestandteil in diesem Beitrag genauso „Publishing Studies“ wie die selbständigen Lehr- und Forschungseinheiten im Ausland.

244

Christoph Bläsi

nicht nur von solchen, die meist stark komprimierte lexikographische Texte enthalten – und natürlich auch mit belletristischen Büchern sowie Büchern weiterer Genres. Typischerweise sind für die Publishing Studies dabei Aspekte von Materialität und Medialität im Fokus. Vor allem, was den Bereich der Belletristik angeht, gibt es ganz offensichtlich keinerlei Überschneidung mit dem Gegenstandsbereich der Metalexikographie. Auf der anderen Seite beschäftigt sich die Metalexikographie – das gilt in erster Linie für die Wörterbuchforschung, weniger für die Forschung zu sachlexikographischen Werken wie Enzyklopädien – systematisch auch mit Fragen des propositionalen Inhalts dieser Bücher, nämlich im Hinblick auf die linguistischen Eigenschaften ihrer Gegenstände, der Wörter, bzw. deren Erfassung und Darstellung. Das hinwiederum liegt klar außerhalb des Gegenstandsbereiches der Publishing Studies. Darüber hinaus kann man wahrscheinlich sagen, dass spezifische textuelle Strukturen in den Publishing Studies zwar vereinzelt und dann eher weniger explizit zum Thema werden, diese aber für die Metalexikographie, vor allem die Metalexikographie deutscher Prägung, eine große Rolle spielen. Dass beide Forschungsbereiche sich, wie gesagt, aus der Germanistik heraus entwickelt haben und in Deutschland überwiegend nach wie vor eine große institutionelle Nähe zu dieser haben, kann darüber hinaus den Sachverhalt verschleiern, dass sie sich im methodischen Kern doch wesentlich unterscheiden: Das KernMethodenset der Metalexikographie kann dem linguistisch-strukturalistischen Paradigma zugeordnet werden3, während die im Einzelfall im Interesse erweiterter Forschungsinteressen glücklicherweise überwundene, prinzipiell aber immer noch im Selbstverständnis verankerte Methodik der Publishing Studies4 quasi-normativ die Hermeneutik ist5, gewissermaßen als Teil ihres Buchwissenschafts-Erbes aus der Literaturwissenschaft.

3 Eine solche Aussage ist z.B. auf der Basis der von Wiegand (vgl. Wiegand 1998: 100) beispielhaft gelisteten Methoden möglich; sie gilt nämlich für die dort genannte Methode zum Vergleich von Wörterbuchauflagen, für die Analysemethode der funktional-positionalen Segmentation und für die Methode der „Funktionsfestlegung […] mittels einer Funktionenmatrix“. In einem Fall, dem der Datenerhebungsmethode mittels Wörterbuchbenutzungsprotokollen, handelt es sich dagegen um eine Methode, die sich an solchen der empirischen Sozialforschung orientiert; vgl. (Wiegand 1998: 974– 1010) und (Ripfel/Wiegand 1988). 4 Für die Buchgeschichte gilt das natürlich sowieso; dort ist die Sachdienlichkeit der Hermeneutik allerdings unbestritten. 5 Die Frage nach dem Disziplin-Sein der Publishing Studies (s.u.) ist zu einem guten Teil auch aus der Spannung motiviert zwischen traditionell zur Verfügung stehender Methodik auf der einen, und aktuellen Forschungsproblemen, für die relevante Erkenntnisgewinne mittels der Hermeneutik nicht gewonnen werden können, auf der anderen Seite.

Was haben Metalexikographie und Publishing Studies miteinander zu tun?

245

3 Kann man aus den Diskussionen um das „Disziplin-Sein“ in beiden Forschungsbereichen sachdienliche Erkenntnisse gewinnen? Interessanterweise gibt es in beiden Forschungsbereichen Überlegungen dazu, ob sie nun (wissenschaftliche) Disziplinen seien. Man kann also die Frage stellen, inwieweit diese Tatsache, v.a. aber die bei den entsprechenden Überlegungen in Anschlag gebrachten Kriterien und Argumente – auch „über Kreuz“ – dazu fruchtbar gemacht werden können, die jeweiligen Identitäten noch deutlicher zu konturieren, gegeneinander zu stellen und ggf. Gemeinsamkeiten oder Unterschiede zu entdecken.

3.1 Herbert Ernst Wiegand zur Frage, ob die Metalexikographie eine Disziplin ist „Um den historisch-systematischen Ort der Wörterbuchforschung noch genauer als bisher zu bestimmen, soll daher nun untersucht werden, ob und gegebenenfalls in welchem Sinne die Wörterbuchforschung eine wissenschaftliche Disziplin ist“ (Wiegand 1998: 89, Heraushebung im Original). In Verfolgung dieses Ziels erarbeitet Wiegand – u.a. mit Bezug auf Posner – Kriterien, die ein Feld von Studien6 (als Tätigkeiten mit dem Ziel, Wissen zu erlangen) erfüllen muss, damit man es als eine „wissenschaftliche Disziplin“ bezeichnen kann (vgl. Wiegand 1998: 90–97). Es geht dabei um Wissen zu einem Ausschnitt der Realität bzw. einem Gegenstandsbereich im Hinblick auf bestimmte Eigenschaften und unter bestimmten Perspektiven. Für eine wissenschaftliche Disziplin setzt Wiegand zunächst einige Grundkriterien an, nämlich a) einen festgelegten Gegenstandsbereich, b) eine spezifische Menge von Perspektiven, c) spezifische Methoden, d) ein spezifisches Wissenskorpus, und e) spezifische Darstellungsmittel. Zur allfälligen Abgrenzung von benachbarten Disziplinen wird von ihm zusätzlich gefordert, dass mindestens in einer der von a) bis e) genannten Kriteriendimensionen ein so genannter „Integrationskern“ für die Disziplin gesehen werden kann, indem entweder der Gegenstandsbereich homogen ist, oder eine durchgehend einheitliche Perspektive vorherrscht, oder man von einer zentralen Methode, einem zentralen Wissenskorpus oder aber dominanten Darstellungsmitteln sprechen kann. Aspekte des, so könnte man sagen, in einem engeren Sinne Wissenschaftlichen kommen schließlich durch die weiterhin geforderten Kriterien hinein, dass „der Gegenstandsbereich in seiner Gesamtheit erforscht wird, die Perspektiven […] wertneutral sind, die Methoden

6 Auf die Herleitung dieser vorgängigen Begriffsfassungen verzichte ich hier; sie finden sich bei Wiegand (1998: 90–95).

246

Christoph Bläsi

wiederholt anwendbar sind, das Wissenskorpus […] wenigstens eine konsistente Theorie enthält und die Darstellungsmittel intersubjektiv und damit prinzipiell auch interfachlich verstehbar sind“ (vgl. Wiegand 1998: 90–97). Für die Metalexikographie auf dem Stand Mitte der 1990er-Jahre sieht Wiegand (vgl. ebd.: 97–103) die Kriterien a) – e) als erfüllt an, wobei er für die Perspektiven, die Methoden, das Wissenskorpus und die Darstellungsmittel jeweils Beispiele als Belege anführt. In Bezug auf das Wissenskorpus sieht er das Kriterium dabei als erfüllt an, „[o]bwohl das metalexikographische Wissen bis jetzt nicht anhand einer oder mehrerer Theorien einheitlich organisiert ist […]“ (ebd.: 100). Auch – das mit Bezug auf die zusätzlichen Kriterien zur Abgrenzung – sei der Gegenstandsbereich insofern homogen, als zu ihm durchgehend Handlungen gehörten, und zwar Handlungen der Wörterbuchbenutzung, solche der Wörterbucherstellung und solche der Kommunikation über Wörterbücher. Die restlichen vier Bedingungen zur Abgrenzung seien nicht erfüllt. Und die Bedingungen an die Wissenschaftlichkeit erfülle die Metalexikographie deswegen nicht, weil der Gegenstand (noch) nicht in seiner Gesamtheit erforscht werde und das Wissenskorpus nicht wenigstens eine konsistente Theorie enthalte. Wiegand kommt damit – auf dem Stand der Mitte der 1990er-Jahre (eine aktuelle Überprüfung steht mir als Außenstehendem nicht zu) – zu dem Schluss, dass „[d]ie Wörterbuchforschung […] keine wissenschaftliche Disziplin und damit – anders gesagt – keine selbständige Einzelwissenschaft“ (ebd.: 102) sei. Auch wenn die Lexikographie in vielen Ländern, so in Deutschland, eine akademische Existenz vorweisen könne (in Form von Kommunikationsmitteln, Organisationen, Tagungen, Lehrveranstaltungen), kommt Wiegand darüber hinaus zu dem Ergebnis, dass die Metalexikographie in Deutschland Mitte der 1990er-Jahre keine akademische (als zu einer höheren Lehranstalt gehörige) Disziplin7 sei und z.B. über keinen anerkannten akademischen Abschluss verfüge. Letzteres hat sich seither in Form des oben erwähnten Erlanger Studienganges allerdings geändert8. Über die breit diskutierten Erwartungen an die Effekte einer akademischen Disziplin Metalexikographie auf die Professionalität und auch die Beschäftigungssituation von Lexikographen besteht nach Wiegand keine völlige Einigkeit, auch wenn die Erwartung positiver Effekte überwiegt (vgl. ebd.: 130–132).

7 Wiegand ist dabei der Meinung, dass akademische Disziplinen, „wie sie in Institutionen wie Universitäten faktisch in Erscheinung treten“ (Wiegand 1998: 90), „historische Kompromissgebilde“ (ebd.) seien „aus Anforderungen aus beruflichen Disziplinen, Disziplinen und wissenschaftlichen Disziplinen im wissenschaftstheoretischen Sinne“ (ebd.: 97). 8 Wiegand vermutet – das auch im Vorgriff auf die Überlegungen zum Verhältnis zur Praxis bzw. zu einer kulturellen Praxis –, dass in den über verschiedenste Disziplinen verteilten Lehrveranstaltungen zur Metalexikographie zu wenig und nicht projektgebunden, wie er es vorziehen würde, die Lexikographie als eigenständige wissenschaftliche Praxis gelehrt wird. Das müsse integriert erfolgen, auf dass tatsächlich „das Erarbeiten von Wörterbüchern gelehrt wird und Prüfungsgegenstand ist“ (ebd.: 129).

Was haben Metalexikographie und Publishing Studies miteinander zu tun?

247

3.2 Christoph Bläsi zur Frage, ob die Publishing Studies eine Disziplin sind Meine an anderer Stelle näher ausgeführten Überlegungen (vgl. Bläsi 2015a und 2015b) zu den Publishing Studies dienen nicht explizit dazu, die Auswirkungen einer breiteren Verankerung im Lehrangebot von Universitäten auf die Professionalität des Referenz-Feldes bzw. der Branche, das Standing der Absolventen, etc. zu diskutieren, wie Wiegand das über die Diskussion in der Metalexikographie-Community berichtet (s.o.); solche Fragen werden von mir zumindest im Moment aus Sicht der Publishing Studies als nicht virulent wahrgenommen. Dagegen ist für mich die Bestimmung des systematischen Ortes der Publishing Studies eine wesentliche Motivation gewesen; ich habe diese Frage dabei im Hinblick auf die Einordnung in das typische Fachbereichs- oder Fakultäts-Aufbauschema einer Universität und die produktive Beziehung zu anderen Disziplin konkretisiert. Es gibt immer wieder kritische Äußerungen gegenüber den Publishing Studies, wegen deren angeblich nicht hinreichend akademischem Ansatz und zu stark berufsbildenden Ausbildungsanteilen (was eine Anerkennung zumindest als an Universitäten vertretene Disziplin schwierig machen würde). Ich wollte das zum Anlass nehmen, im gegebenen Zusammenhang zu fragen, wie solche kritischen Anfragen zu bewerten sind und ggf. zur zielgerichteten Modifikation der Lehrangebote herangezogen werden könnten. Die erwähnte Kritik kommt dabei meist von Vertretern der Buchgeschichte, deren Ausprägung im deutschsprachigen Raum dazu neigt, die Publishing Studies gewissermaßen als Anhängsel der Buchgeschichte zu sehen9. Vor allem wenn man – in einer etwas modifizierten Fassung des Gegenstandsbereiches, der z.B. neben dem Verlagswesen explizit auch den verbreitenden Buchhandel in den Fokus nimmt – die zeitgenössische Buchkommunikation und die zeitgenössische Buchwirtschaft als Hauptgegenstandsbereiche der Publishing Studies sieht und digitalen Buchformen wie E-Books Buchstatus zugesteht (was in der Community ohnehin unbestritten ist), dann fällt überdies auf, dass nicht wenige relevante Arbeiten zur Kommunikation mit digitalen Büchern im weitesten Sinne in anderen Disziplinen als den Publishing Studies entstehen, nämlich z.B. in den Kommunikationswissenschaften, in der Wirtschaftsinformatik oder in der Informationswissenschaft. Meist erfolgt das mit Methoden, wie sie den Publishing Studies bzw. der sich immer noch weit überwiegend als geisteswissenschaftlicher Forschungsbereich verstehenden Buchwissenschaft zumindest traditionell, und das heißt eben auch aufgrund der wissenschaftlichen Ausbildung und Sozialisation der meisten dort tätigen

9 Zu dieser Einschätzung gehört es, das als ein Gebiet zu sehen, in dem man im Wesentlichen mit den Herangehensweisen (Hermeneutik, s.o.) und Erkenntnissen der Buchgeschichte – ergänzt um ausgewählte Schlaglichter aus der Praxis der Buchbranche – die Anstellungsaussichten der Absolventinnen und Absolventen in der modernen Buchwelt erhöhen kann, und zwar typischerweise ohne substantielle Ergänzung des methodisch-theoretischen Instrumentariums.

248

Christoph Bläsi

Wissenschaftlerinnen und Wissenschaftler, nicht zur Verfügung stehen. Ein in den Publishing Studies breit einflussreiches Beispiele für solche Arbeiten aus anderen Disziplinen ist die von Janello (2010) zur Wirtschaftsinformatik; die von König (2009) aus der Wirtschaftswissenschaft oder Murray (2011) aus der Literaturwissenschaft haben dort ebenfalls großes Potential. Die Tatsache, dass den Publishing Studies so ein Stück weit die wissenschaftliche „Lufthoheit“ über ihren Gegenstandsbereich verloren zu gehen droht, war für mich eine weitere Motivation, über die Frage des Disziplin-Seins nachzudenken; nicht zuletzt steht hier – in Wiegands Worten – das Kriterium der Erforschung des Gegenstandsbereiches „als Ganzes“ in Frage. Mit dem Wissenschaftstheoretiker Balzer (2009) beziehe ich mich für meine Überlegungen (vgl. Bläsi 2015a) zwar auch auf allgemeine Kriterien zur Klassifizierung von Disziplinen; und ich spanne damit den Raum auf für weiter gehende Erwägungen zu Theorien und Methoden der Publishing Studies, die z.T. unten Eingang finden. Im Wesentlichen ziehe ich in dem von mir vorgestellten (vgl. Bläsi 2015a) und noch nicht abgeschlossenen Projekt aber aus Experteninterviews gewonnene Einschätzungen von einschlägigen Forscherinnen und Forschern heran, um die Frage zu beantworten, ob Publishing Studies eine Disziplin sind. Diese Forschungsarbeit habe ich zunächst für und in Großbritannien durchgeführt, weil sich dort – mit einer z.T. jahrzehntelangen Geschichte – eine wesentlich größere Zahl und Vielfalt an Forschungs- und Lehrinstitutionen mit dem zeitgenössischen Publizieren beschäftigt und auch international bedeutende Fachvertreter von dort kommen. Die noch nicht als Ganzes veröffentlichen Ergebnisse der Arbeit deuten klar auf den Befund hin, dass die Publishing Studies (noch) nicht als Disziplin (hier synonym mit der „wissenschaftlichen Disziplin“ Wiegands) gesehen werden. Als Grund dafür wird genannt, dass sie keine spezifische Menge an (eigenen) Methoden haben, sondern diese – oft orientiert an den wissenschaftlichen Biographien der ja meist nicht selbst dort schon ausgebildeten und sozialisierten Wissenschaftlerinnen und Wissenschaftler – typischerweise von anderen Disziplinen übernommen werden. Das wurde von den Befragten mit der Nennung relevanter Nachbardisziplinen und von in Forschung und Lehre in den Publishing Studies an zentraler Stelle herangezogenen Theoretikern aus anderen Disziplinen belegt, z.B. mit Porter aus der Wirtschaftswissenschaft, McLuhan aus der Medienwissenschaft, Genette aus der Literaturwissenschaft, Thompson aus der Soziologie, Darnton aus der Geschichtswissenschaft, etc. Außerdem sei, so die Befragten, die kritische Masse derer, die sich grundsätzlicherer Fragen des Publizierens annehmen, einfach (noch) zu klein. Ungeachtet dieses Befunds hätten die Publishing Studies natürlich bereits jetzt viele Eigenschaften einer Disziplin: Es gebe einen hinreichend abgegrenzten Gegenstandsbereich, eine beachtliche Menge an Erkenntnissen – und natürlich Konferenzen, Publikationen, etc. Von einigen Gesprächspartnern wurde auch darauf hingewiesen, dass diese spezifische Position des „Noch-Nicht-Ganz-Disziplin“-Seins auch ihre Vorteile habe, und zwar im Hinblick auf die Offenheit bzw. die Freiheit von potentiell auch einengenden Bezugsrahmen. Aufschlussreich waren auch die Antworten auf die

Was haben Metalexikographie und Publishing Studies miteinander zu tun?

249

Frage nach der Bedeutung des im engeren Sinne „Wissenschaftlichen“ – neben dem Berufsvorbereitenden bzw. Praktischen, das in den Publishing Studies-Studiengängen meist ja tatsächlich eine große Rolle spielt. Dazu wurde von den Befragten u.a. geäußert, dass es im Publikationswesen Fragestellungen gebe, die aus der Innen-, also der berufspraktischen Perspektive typischerweise einfach nicht angegangen würden; zu diesen gehörten Fragen der gesellschaftlichen Bedeutung von Büchern bzw. deren Relevanz für die Bildung, Genderfragen oder auch das Problem der Hegemonie angelsächsischer Unternehmen in der globalen Buchwelt. Angesichts der Bedeutung der sich besonders im Bereich der Medien schnell weiter entwickelnden digitalen Technik sei es auch wichtig, Prinzipien herauszuarbeiten, die es bei aller Offenheit auch für grundlegendere Revisionen erlauben, neuen technischen Lösungen einfacher einen Platz im Dienste des „Eigentlichen“ des Publizierens zuzuweisen. Die von mir gewählte Herangehensweise zur Klärung der Frage mittels Interviews mit Fachvertretern (in Großbritannien), die man als eine qualitativ-sozialwissenschaftliche kategorisieren kann, wird zusammen fassend also tendenziell das Ergebnis erbringen, dass die Publishing Studies deswegen (noch) keine Disziplin sind, weil es ihnen an spezifischen, eigenen Methoden (und Theorien) fehlt und die Menge der akademisch am Thema Arbeitenden zu klein ist. Interessanterweise können die meisten Gelehrten dieser Situation in ihrer Offenheit aber durchaus etwas abgewinnen – man freut sich über den „broad church“-Ansatz bzw. „the right of the greenfields“ (Bläsi 2015a: 152). Auch kann etwas abseits der Frage nach dem Disziplinstatus schon an dieser Stelle gesagt werden (mehr dazu unten mit Maxwell 2014), dass unter den Fachvertretern die Meinung vorherrscht, dass der spezifisch starke Praxisbezug der Publishing Studies auch akademisch relevante Auswirkungen hat – und Potential für eine attraktive Alleinstellung. Ich hatte oben erwähnt, dass man die für den Status als (wissenschaftliche) Disziplin in Anschlag gebrachten Kriterien auch gewissermaßen „über Kreuz“ anwenden könne. Wenn man in diesem Sinne zur Klärung, ob die Publishing Studies eine Disziplin sind, also statt meiner qualitativ-sozialwissenschaftlichen Methode die Kriterien von Wiegand (s.o. bzw. vgl. Wiegand 1998: 90–97), die dieser auf die Metalexikographie angewandt hatte, heranzieht, kommt man allerdings zu keinem anderen Ergebnis: Die Publishing Studies sind (noch) keine (wissenschaftliche) Disziplin. Die Gründe dafür sind bei dieser Herangehensweise, dass man zwar von einem festgelegten Gegenstandsbereich, einer spezifischen Menge von Perspektiven, und auch einem spezifischen Wissenskorpus sprechen kann, nicht aber davon, dass es spezifische Methoden und spezifische Darstellungsmittel gäbe; außerdem bietet sich keine der drei zutreffenden Eigenschaften als Integrationskern der Publishing Studies an. Auch was die Anforderungen an die Wissenschaftlichkeit angeht, liegt Zurückhaltung nahe: Der Gegenstandsbereich wird zwar grundsätzlich in seiner Gesamtheit erforscht; vor allem was die geforderte Wertneutralität der Perspektiven betrifft, gibt es aber zumindest für Deutschland Probleme durch die relativ große und ansonsten meist auch sachdienliche Nähe zu der, was die Lobbyarbeit angeht, sehr stark auf-

250

Christoph Bläsi

gestellten Buchbranche (vgl. z.B. die Diskussionen um die Buchpreisbindung oder um die Verschärfung urheberrechtlicher Regelungen); auf dieses Problem weist sehr grundsätzlich auch Saxer (2010)10 hin. Durch die (hinreichend) sorgfältige Übernahme von Theorien und Methoden aus anderen Disziplinen kann in Summe dagegen im Allgemeinen als sichergestellt gelten, dass die verwendeten Methoden wiederholt anwendbar sind. Auch enthält das Wissenskorpus wenigstens eine konsistente Theorie – es reicht hier, eine zu nennen, z.B. die von Bhaskar (2013), siehe unten – und sind die Darstellungsmittel intersubjektiv und damit prinzipiell auch interfachlich verstehbar (gerade weil sie unspezifisch sind, siehe oben).

4 Das Verhältnis zu einer kulturellen Praxis und die Überlegungen zu einer theoretischen Fundierung in Metalexikographie und Publishing Studies Es ist zwar auffällig, dass sowohl in den Publishing Studies als auch in der Metalexikographie die Frage eine Rolle spielt, ob es sich nun um (wissenschaftliche) Disziplinen handele. Aufgrund der unterschiedlichen Ausgangslagen und der deswegen auch unterschiedlichen Frage-Motivationen (s.o.) sind alleine aus diesen Diskussionen und auch nicht aus dem identischen Ergebnis in beiden Fällen, dass es sich nämlich (noch) nicht um Disziplinen handelt, aber noch keine hinreichend überzeugenden argumentativen Bausteine für die Feststellung eines besonderen Verhältnisses zwischen Publishing Studies und Metalexikographie zu generieren. Die Erkenntnis, dass es Forschungsbereichs-spezifische Methoden gleichermaßen nicht gibt, ist interessant und plausibel; für eine dezidierte Aussage spezifische Gemeinsamkeiten betreffend aber scheint sie nicht hinreichend. Man könnte in einem nächsten Schritt nun fragen, ob die ebenfalls in beiden Bereichen angestellten grundsätzlichen Überlegungen zu ihrem in der Geisteswissenschaftslandschaft ungewöhnlichen Charakter, was ihr Verhältnis zur Praxis bzw. zu einer kulturellen Praxis betrifft, produktive Analogien zeigen. Ähnliches könnte man von den jeweiligen Diskussionen um die Bedeutung und den Status von Theorien erwarten.

10 „Buchwissenschaft, die praktizistisch auch die Berufsideologie von Buchproduzenten und -vermittlern wiss. bestätigt, ist indes selbst Ideologie und missachtet das elementare wissenschaftliche Qualitätserfordernis der Unparteilichkeit.“ (Saxer 2010: 68).

Was haben Metalexikographie und Publishing Studies miteinander zu tun?

251

4.1 Das Verhältnis zu einer kulturellen Praxis Sowohl in Verlagen im Allgemeinen als auch an Nachschlagewerkprojekten im Speziellen arbeiten nicht nur Absolventinnen und Absolventen von Publishing Studies und Metalexikographie, sondern – neben nicht wenigen mit ganz anderen Ausbildungen – vielfach auch Germanisten: im Verlagswesen wohl eher Literaturwissenschaftler, in Lexikonprojekten wohl eher Sprachwissenschaftler. Ungeachtet dessen arbeiten viele Metalexikographie- und Buchwissenschafts-Absolventinnen und -Absolventen natürlich in ganz anderen beruflichen Tätigkeitsbereichen. Trotz dieses Befunds aus dem Recruiting-Bereich – und ich werde das gleich belegen – ist die Beziehung der Metalexikographie zur praktischen Lexikographie und die der Publishing Studies zur Verlagswelt gleichermaßen konstitutiv anders als, zum Beispiel, die der Germanistik zur schulischen Lehrpraxis. Wiegand kategorisiert die Sprachlexikographie zentral als Praxis (Wiegand 1998: 15–33), nachdem er andere Hypothesen (z.B. die, Sprachlexikographie sei angewandte Linguistik oder Lexikologie) widerlegen und diese Kategorisierungen damit ausschließen konnte. Diese Praxis sei gegeben nicht nur durch abgeschlossene lexikographische Prozesse, sondern auch durch noch laufende (vgl. ebd.: 34–37), und habe nicht wenige Eigenschaften mit anderen Herstellungsprozessen gemein (vgl. ebd.: 38). Ungeachtet der Tatsache, dass die wissenschaftliche Sprachlexikographie natürlich auch eine wissenschaftliche Praxis sei, sei die Sprachlexikographie, also auch die nicht-wissenschaftliche, in jedem Fall eine kulturelle Praxis – und zwar die kulturelle Praxis, „die darauf ausgerichtet ist, dass nichtwissenschaftliche Wörterbücher als Gebrauchsgegenstände entstehen […]“ (ebd.: 39). Bemerkenswert ist nach Wiegand nun das Verhältnis dieser kulturellen Praxis zur Wissenschaft bzw. zu dem Forschungsbereich, der zu dieser Praxis gehört: Er hält „[e]ine Charakterisierung wie ‘Sprachlexikographie ist angewandte Wissenschaft’ […] deswegen für äußerst missverständlich, weil sie den Begründungszusammenhang von Sprachlexikographie und Wissenschaft einseitig von der Wissenschaft her beurteilt […]“. Insbesondere die Metalexikographie sei „auf die […] tradierten Wissensbestände, die dort entwickelten Fertigkeiten und Fähigkeiten, die nicht ihre eigene Anwendung sind, angewiesen“ (ebd.: 41). Ungeachtet dessen – aber weit weniger spezifisch – gilt natürlich auch die umgekehrte Richtung; das nimmt einen von Wiegand in der Vorbetrachtung geäußerten „vorgängigen Standpunkt“ auf, nämlich den, dass „eine möglichst weitgehende theoretische und methodologische Durchleuchtung einer althergebrachten […], pragmatisch eingespielten Praxis zu einem vertieften Verständnis dieser Praxis, zu einem höheren Grad ihrer Beherrschung und damit in manchen Bereichen auch zu ihrer Erneuerung führen kann“ (ebd.: 3). Diese Überlegungen Wiegands zur Metalexikographie lassen sich gut in Beziehung bringen mit denen des Publishing Studies-Gelehrten John Maxwell (2013), der vor allem die digitalen Transformationen, die sowohl die Metalexikographie als auch die Publishing Studies über ihre Gegenstandsbereiche stark betreffen, zu einem zen-

252

Christoph Bläsi

tralen Anlass seiner Ausführungen nimmt. Maxwell sagt, dass die mit der Digitalisierung einher gehenden Disruptionen „Mumm, Resilienz und ein hohes Maß an Toleranz gegenüber Ambiguitäten“ (Maxwell 2013) erfordern – und das sei genau das, was „Communities of practice“ auszeichne. Darüber hinaus sei Verlegen nicht zuletzt ein „Handwerk“ (craft); daher sei es wichtig, „to research and develop, because the discourse of publishing is embodied in its artefacts and products as much as in what people are saying. It is discourse + practice.“ (ebd.). Ganz in Linie mit Wiegands vorsichtigen Gedanken, die wissenschaftliche Beschäftigung mit der Praxis (in dessen Fall der der Lexikographie) könne zu deren Erneuerung beitragen, aber noch entschiedener, weist Maxwell angesichts der erwähnten disruptiven Entwicklungen im Verlagswesen und mit Bezug auf die mit Wissenschaft konstitutiv verbundenen institutionellen Gegebenheiten von Studiengängen darauf hin, dass ein „university program […] can afford to do experimental work and exploratory R&D without worrying about sacrificing next season’s list, or the next isuue, or the quarterly bottom line. We can afford to play with techniques and tools and methods of doing things.“ (ebd.). Eine solche Sichtweise – und hier kann man natürlich auch an die Metalexikographie angesichts einer zunehmend digitalisierten Lexikographie denken – erlaube es nicht zuletzt auch, verbreitete Darstellungen des Verlagswesens (bzw. dann auch der Lexikographie) „as beleaguered sector with diminishing prospects“ (ebd.) zu hinterfragen. Ich habe die vorläufigen Ergebnisse der Auswertung meiner Interviews in Großbritannien folgendermaßen mit Maxwells Position zusammengebracht: „[I]t can be said that there are strong indications that the doing, the participation in a cultural practice are a constitutive as well as distinctive element of Publishing Studies.“ (Bläsi 2015a: 155). Was ich an der zitierten Stelle nicht ausgeführt hatte, ist die Tatsache, dass es auch andere Forschungsbereiche geben könnte bzw. gibt, auf die Vergleichbares zutrifft – für die Metalexikographie konnte das im Vorigen mit Wiegand dargelegt werden. Was man mit einem Blick auf die nicht-leere Schnittmenge zwischen dem Gegenstandsbereich der Metalexikographie und dem Gegenstandsbereich der Publishing Studies, die z.B. materielle und mediale Aspekte des Buch-Genres Nachschlagewerke enthält, schon hätte schließen können, zeigen die Diskurse in den beiden Forschungsbereichen in größerer Allgemeinheit und explizit: dass sie beide ein spezifisches, konstitutives Verhältnis zur kulturellen Praxis haben bzw. für sich reklamieren. Ein Unterschied, was die Rolle der Praxis in entsprechenden Studiengängen im Detail angeht, kann allerdings angeführt werden: Während Wiegand in seinen Überlegungen zur Gestaltung eines Studienganges im Falle einer (mittlerweile eingetretenen) Etablierung als offizielle akademische Disziplin darauf hinweist, „dass ein geregeltes Studium in dieser Disziplin […] zu einem selbständigen Teilabschluss führen kann, den man nicht erhalten sollte, ohne mindestens ein sechsmonatiges lexikographisches Praktikum nachweisen zu können“ (Wiegand 1998: 132), und Atkins sogar mindestens ein Jahr Praktikum fordere (vgl. ebd.), ist es eine relativ weit verbreitete Ansicht in der universitären deutschen Buchwissenschaft, solche Anteile als Beitrag

Was haben Metalexikographie und Publishing Studies miteinander zu tun?

253

zur Profilschärfung gegenüber den Fachhochschulen, die den Publishing Studies ähnliche Studiengänge anbieten und relativ lange Praxisphasen haben, lieber klein zu halten, auch was den modernen Teil betrifft – leider ohne weitere inhaltliche Auseinandersetzung mit deren möglicherweise konstitutiven Bedeutung sowie entsprechenden Ausgestaltbarkeit.

4.2 Die Überlegungen zu einer theoretischen Fundierung Kommen wir auf die Frage nach einer Theorie bzw. Theorien (und damit zusammenhängend: Methoden) zurück, letztlich also der nach der theoretischen Fundierung eines Forschungsbereiches; diese war schon in den Überlegungen dazu, ob Metalexikographie und Publishing Studies Disziplinen sind, angesprochen. Die Frage nach einer Theorie bzw. Theorien ist die nach Aussagen eines speziellen Typs über den Gegenstandsbereich des jeweiligen Forschungsbereiches. Dieser Gegenstandsbereich kann für den Fall der Publishing Studies zunächst als Prozess des Verlegens, dann aber auch als die Ergebnisse dieses Prozesses (also Bücher, in erster Linie unter medialen und materialen Aspekten) sowie andere konstitutive Prozesse um diese Ergebnisse (z.B. die des Vertriebs oder auch der Rezeption von Büchern) beschrieben werden. Im Falle der Metalexikographie ist der Gegenstandsbereich mit Wiegand die Lexikographie als Praxis (in Prozessen und deren Ergebnissen; ebd.: 34–37) und die Wörterbuchbenutzung (cf. Wiegand 1998: 76–87). Es geht also um Aussagen über Bücher, über das Verlegen, etc. im Falle der Publishing Studies bzw. über Nachschlagewerke, die Prozesse zu deren Erstellung, etc. im Falle der Metalexikographie. Die Anforderungen, die man an solche Aussagen stellt, so dass man sie als Theorien bezeichnen kann, sind allerdings selbst Gegenstand von Diskursen. So zeigt sich, dass es – was den Stand der Theorieentwicklung angeht – auch in den beiden Forschungsbereichen unterschiedliche Erwartungen zu geben scheint. Zur Herausarbeitung einer der dabei wichtigen Dimensionen der Unterscheidung kann ein Zitat des Metalexikographen Piotrowski dienen, der seinerseits auf das Wörterbuch von Collins zurückgreift: „It follows then that there are two distinct senses of the word theory: 1. ‘a study of principles and methods (of art or science)’; 2. ‘a cohesive set of hypotheses’.“ (Piotrowski 2013: 306). Während in der Metalexikographie nun eher die Erwartung vorzuherrschen scheint, dass es eine oder möglicherweise mehrere umfassende „Top-Level“-Theorien (die, möglicherweise mit untergeordneten Teiltheorien, Prinzipien und Methoden spezifizieren) im ersten Sinne nach Piotrowski gibt (und die von Wiegand als ein gewissermaßen „heißer Kandidat“ einer solchen Theorie explizit erwähnt wird; vgl. ebd.: 318), ist die Erwartung in den Publishing Studies eher die, dass es – für einzelne Ausschnitte des Gegenstandsbereiches – verschiedene Theorien, ggf. auch verschiedener Urheber und verschiedener grundsätzlicher Herangehensweisen, gibt, dann eher im zweiten Sinne nach Piotrowski, also als Menge von aus Daten belegten Hypothesen (siehe dazu auch unten). Das schließt nicht aus, dass

254

Christoph Bläsi

eine Theorie auch einmal übergeordnete Konzepte abdecken kann, wie das aktuell Michael Bhaskar (2013) mit seinem Entwurf einer Theorie des Publizierens11 (!) tut, auf den ich unten noch einmal eingehen werde. Vor allem, wenn man den programmatischen Aufsatz von Tadeusz Piotrowski zur Theoriefrage der Metalexikographie heranzieht, lassen sich noch einige weitere Unterschiede in den jeweiligen Theorieauffassungen diagnostizieren. Der 1. Sinn von Theorie nach Piotrowski hat – jedenfalls in seiner eigenen Auslegung – eine offene Flanke zu einem wenig produktiven naiven Verständnis von Theorie; das zeigt sich beim Blick auf den nach Piotrowskis Meinung vergleichbaren Bereich der Übersetzung, wo Übersetzer (nach Pym) bei ihrer Arbeit „are theorizing all the time“ (Piotrowski 2013: 305) und seiner Aussage, Ähnliches würde auch für Lexikographen gelten. Selbst wenn man sich im Detail auf den von Piotrowski herausgearbeiteten 2. Sinn bezieht, kann ich mich, der in seinen vorbereitenden Ausführungen zur Diskussion des Selbstverständnisses der Publishing Studies den Theoriebegriff des Wissenschaftstheoretikers Balzer (2009) heranzieht, über Piotrowskis offensichtlichen Verzicht auf den Anspruch an Theorien, 1. zu erklären (cf. Piotrowski 2013: 311) und 2. eine gewisse prognostische Kraft zu haben (vgl. ebd.: 317), nur wundern; Ähnliches gilt für die Position, auch Präskriptives als Theorie „durchgehen“ zu lassen (vgl. ebd.: 311) sowie für eine die Diskussion über Theorien abschließende Aussage Piotrowskis: „So what the validity of a lexicographic theory depend on? As usual in the humanities, it depends on the authority of the theoretician.“ (ebd.: 317). Schließlich beschreibt die Aussage, die „[v]alidity of theoretical models is primarily based on their efficiency in the past, therefore they cannot be used in times when the cultural and technological environment rapidly changes“ (ebd.: 318) eine Situation, in der es zwar in der Tat passieren kann, dass durch Transformationen im Gegenstandsbereich eine Theorie durch eine neue ersetzt oder auch durch Theorien höherer Ordnung, die den Wandel zwischen Gegebenheiten als solchen in den Fokus nehmen, ergänzt werden muss – die Auffassung jedoch, nach der es in einer solchen Situation letztlich zu einem Ende des Theoretisieren kommt, erscheint mir doch irritierend defensiv und unambitioniert. Mit Balzer (vgl. Balzer 2009: passim) ist für mich eine Theorie eine Aussage oder eine Menge von Aussagen auf Strukturen innerhalb des fokussierten Weltausschnittes, die systematisch auf Daten über diese Strukturen beruhen. Mit der für wissenschaftliches Arbeiten unvermeidlichen Basiertheit auf Daten (welcher Art auch immer) ist auch ein überaus offensichtliches Kriterium für eine Theorie ihre Falsifizierbarkeit; dieser für die Entwicklung in der Wissenschaft so zentrale Sachverhalt wird bei Piotrowski nicht einmal erwähnt …

11 Bhaskars Theorie könnte die erste mit einem umfassenderen Anspruch vorgebrachte sein, die aus den Publishing Studies selbst kommt und nicht, wie bisher üblich, aus anderen Disziplinen stammt, wie z.B. die von Bourdieu aus der Soziologie.

Was haben Metalexikographie und Publishing Studies miteinander zu tun?

255

Trotz dieser Vorbehalte scheint die Dauer der bisherigen Diskussion, die Explizitheit des ausgedrückten Desiderats sowie der Umfang eines wesentlichen kohärenten Theoriebeitrags (dem von Wiegand) der Metalexikographie hier aber einen gewissen Vorsprung vor den Publishing Studies zu verschaffen. Anregend, bedenkenswert und überaus anschlussfähig an entsprechende Auffassungen v.a. in der britischen Publishing Studies-Szene, für deren Studiengänge die Anwendung und Entwicklung des „critical thinking“ ein häufig explizit erwähntes Ziel ist, ist auch Piotrowskis Aussage, teilweise mit Culler, dass „[d]ictionaries are cultural products, and ‘theory is a critique of common sense, of concepts taken as natural’, it is ‘the demonstration that what has been thought or declared natural is in fact a historical, cultural product’.“ (ebd.: 308). In den Publishing Studies herrscht wie bereits ausgeführt im Moment eine Situation vor, in der Wissenschaftlerinnen und Wissenschaftler, die sich weit überwiegend selbst nicht in Publishing Studies qualifiziert haben, mit Theorien und Methoden12 arbeiten, die sie typischerweise aus den Disziplinen nehmen, in denen sie wissenschaftlich ausgebildet und sozialisiert sind. Darüber hinaus wird wie gesagt in Nachbardisziplinen – mit deren Theorien und Methoden – über den Gegenstandsbereich der Publishing Studies ertragreich geforscht. Eine besonders wohlwollende Aufnahme hat deshalb in den Publishing Studies in jüngster Zeit der schon oben erwähnte Ansatz von Michael Bhaskar (2013) gefunden, der eine Theorie des Verlegens vorgelegt hat. Er versucht das historisch und auch sektoral (vgl. z.B. das Verlegen von Musiknoten oder von Computerspielen) extrem schillernde Konzept auf der Basis im Wesentlichen hermeneutischer Betrachtungen abstrakt – und falsifizierbar13! – zu fassen.

12 Mit Methoden gestaltet man im Umfeld von Theorien Übergänge, z.B. bei der Entwicklung einer Theorie. Diese können u.a. in Hermeneutik, naturwissenschaftliche Methoden, Methoden der empirischen Sozialwissenschaft (vgl. u.a. Balzer 2009) sowie – über Balzer hinaus gehend – in ein Vorgehen nach dem konstruktionswissenschaftlichen Paradigma kategorisiert werden; letzteres spielt z.B. in der Wirtschaftsinformatik und der Informationswissenschaft eine Rolle. 13 Ich habe selbst – auf der Tagung „By the Book 2“ vom 18. bis zum 19. Juni 2015 in Florenz – die Position vertreten, dass Bhaskars Theorie durch neuere Entwicklungen im Verlagswesen (die hier die Daten darstellen, die in der Theorie abgebildet sein müssen) angepasst werden muss; das ist nicht als Falsifikation der Theorie als Ganzes zu verstehen, verdeutlicht aber den grundsätzlichen Mechanismus. Vorausgesetzt, dass man mit solch einer Theorie Aktivitäten von Verlagshäusern mit dem Konzept des Verlegens in Zusammenhang bringen können sollte, deckt der stark Content-basierte Ansatz von Bhaskar zunehmend wichtiger werdende Verlagsprodukte wie v.a. Software (Rechtschreibprüfprogramme, content-basierte Workflow-Management-Programme für Unternehmen, etc.) nicht hinreichend prägnant ab. Lösungsvorschläge zur Integration solcher in der Verlagswelt oft unter der Überschrift „Kontext statt Content“ subsumierten Phänomene habe ich in meinem bis jetzt unveröffentlichten Beitrag in Florenz gemacht.

256

Christoph Bläsi

4.3 Einige Bemerkungen zum Umgang mit den digitalen Transformationen Die Auswirkungen der Digitalisierung auf die Gegenstandsbereiche von Metalexikographie und Publishing Studies werden in beiden Forschungsbereichen in ihrer Vielgestaltigkeit gesehen und untersucht. Für den Fall der Metalexikographie werden die Phänomene aufgrund der eingesetzten digitalen Werkzeuge auf oberster Ebene zum einen in der digitalen Korpusarbeit (vgl. z.B. Kilgarriff /Kosem 2012) – hierzu gibt es kein direktes Äquivalent im Gegenstandsbereich der Publishing Studies –, und zum anderen in der Arbeit mit Nachschlagewerk-Redaktionssystemen (vgl. z.B. Abel 2012) gesehen; des Weiteren natürlich, ganz offensichtlich, in der Tatsache, dass die Nachschlagewerke selbst oft in digitaler Form bereitgestellt werden. Letzteres kann für die Konsultation durch Menschen oder als Wissensbasis für sprachverarbeitende Systeme erfolgen. Was die beiden letzten Punkte, Redaktionssysteme und digitale Produkte, angeht, sind die Analogien zum Verlagswesen im Allgemeinen offensichtlich. Der mediale Übergang der Ergebnisse von sowohl Verlags- als auch lexikographischen Prozessen von gedruckten Ausprägungen zu auf Computer lesbaren Dateien seit dem Ende des letzten Jahrhunderts war Anlass für einen ersten, so könnte man es nennen, „Abstraktionsschritt“. Bei diesem Schritt wurden systematisch auch Erscheinungsformen der Ergebnisse des Verlegens und der (v.a. praktischen) Lexikographie jenseits einer ganz bestimmten, wie sich jetzt erweist historisch kontingenten, medialen Erscheinungsformen, nämlich der gedruckten, berücksichtigt. Dass es über diesen ersten „Abstraktionsschritt“ hinaus einen zweiten geben muss, nach dem auch Content (Inhalt[e]) als zutreffende Beschreibung des Wesentlichen nicht mehr stimmt, scheint in der Metalexikographie (vgl. z.B. Tarp 2012) noch nicht vollständig analytisch durchdrungen (zum Verlagswesen vgl. Fußnote 13). Immerhin erwähnt Piotrowski beiläufig, dass “[i]t is highly likely that the dictionary of the future will not be perceived as an object at all, it will work like a background process. We already know this sort of dictionary, it is for example the spelling checker working with a word editor.” (Piotrowski 2012: 317).

5 Fazit Zwischen der Metalexikographie und der Buchwissenschaft bzw. dann v.a. den Publishing Studies, die im deutschen Sprachraum allerdings nur einen Teil der Buchwissenschaft darstellen, gibt es offensichtliche Parallelen, was die Geschichte dieser Forschungsbereiche in Deutschland angeht. Die interessante Tatsache, dass es in beiden explizite, publizierte und aneinander anschlussfähige Überlegungen dazu gibt, ob sie als (wissenschaftliche) Disziplinen angesehen werden können, habe ich zum Anlass genommen, die beiden Forschungsbereiche auch unter weiteren Aspekten parallel zu betrachten. Ungeachtet der Tatsache, dass Metalexiko-

Was haben Metalexikographie und Publishing Studies miteinander zu tun?

257

graphie und Publishing Studies auf aktuellem Stand nicht als Disziplinen gesehen werden, gibt es in beiden Bereichen ein explizites, aus einem wahrgenommenen Mangel heraus entstandenes Nachdenken über Theorien und Methoden. Das ist für das Selbstverständnis schon eines Forschungsbereiches, sicher dann aber einer Disziplin, grundsätzlich unabdingbar; in den untersuchten Fällen ist es aber besonders wichtig. Das kann man sagen, weil die nach meiner Auffassung zentrale Gemeinsamkeit zwischen Metalexikographie und Buchwissenschaft/Publishing Studies, das ganz spezifische, explizierte und produktive Verhältnis zu jeweils einer kulturellen Praxis, die Gefahr in sich birgt, bei der Ausbildung von Nachwuchskräften und einer eher positivistischen Beschreibung der Zustände und Entwicklungen in den Referenz-Feldern, Verlagswesen bzw. praktische Lexikographie, stehen zu bleiben. Mit einer so weit möglich und nötig Forschungsbereichsspezifischen, den Gegenstandsbereichen angemessenen theoretisch und methodisch fundierten Herangehensweise bietet sich aber sowohl für die Metalexikographie als auch für die Publishing Studies die Chance, das Verhältnis zu einer kulturellen Praxis nicht nur (v.a. angesichts der digitalen Transformationen) für die zielführende Erneuerung dieser kulturellen Praxis selbst produktiv zu machen, sondern mit Hilfe der hochentwickelten Fertigkeiten und Fähigkeiten dieser Praxen auch für die Anregung und Erneuerung der doch mit einiger Wahrscheinlichkeit entstehenden Disziplinen. Mit der Propositionalisierung des Wissens in Tripeln in der Linked Open Data Cloud, dem verbreiteten Übergang von Inhaltsprodukten zu inhaltsbasierten Dienstleistungen in den Referenz-Feldern sowie mit den Publikationserfordernissen der Digital Humanities sind überdies beispielhaft Phänomene genannt, denen sich Metalexikographie und Buchwissenschaft/Publishing Studies in diesem Sinne ertragreich gemeinsam widmen können.

6 Literatur Abel, Andrea (2012): Dictionary writing systems and beyond. In: Granger, Sylvane/Paquot, Magali (Hrsg.): Electronic Lexicography. Oxford: Oxford University Press, 83–106. Balzer, Wolfgang (2009): Die Wissenschaft und ihre Methoden. Grundsätze der Wissenschaftstheorie. Ein Lehrbuch. 2. Aufl. Freiburg/München: Alber. Bhaskar, Michael (2013): The content machine. Towards a theory of publishing from the printing press to the digital network. London: Anthem. Bläsi, Christoph (2015a): Publishing studies: being part of a cultural practice plus x? In: Libellarium 8, 147–156. [Unter: DOI: http://dx.doi.org/10.15291/libellarium.v8i1.223; letzter Zugriff: 16.09.2015]. Bläsi, Christoph (2015b): Literary Studies, Business Studies – and Information Science? Yes, it’s a Key Discipline for the Empowerment of Publishing Studies for the Digital Age. In What Way Information Science can Inform Publishing Studies in the Face of the Ongoing Digital Transitions. In: Pehar, Franjo/Schlögl, Christian/Wolff, Christian (Hrsg.): Re:inventing Information Science in the Networked Society. Proceedings of the 14th International Symposium of Information Science (ISI 2015). Glückstadt: Verlag Werner Hülsbusch, 81–92.

258

Christoph Bläsi

Janello, Christoph (2010): Wertschöpfung im digitalisierten Buchmarkt. Wiesbaden: Gabler. (Gabler Research: Markt- und Unternehmensentwicklung). Kilgarriff, Adam/Kosem, Iztok (2012): Corpus tools for lexicography. In: Granger, Sylvane/Paquot, Magali (Hrsg.): Electronic Lexicography. Oxford: Oxford University Press, 31–56. König, Andreas (2009): Cognitive Framing and Incumbent Inertia in Response to Technological Discontinuities. A Replication and Extension of the Gilbert Study in the German Book Retailing Industry. Berlin: Pro Business. Maxwell, John (2014): Publishing Education in the 21st Century and the Role of the University. In: The Journal of Electronic Publishing 17(2). [Unter: DOI: http://dx.doi.org/10.3998/3336451.0017.205; letzter Zugriff: 16.09.2015]. Murray, Simone (2011): The Adaptation Industry: The Cultural Economy of Contemporary Literary Adaptation. London: Routledge. Piotrowski, Tadeusz (2013): A Theory of Lexicography – Is There One? In: Jackson, Howard (Hrsg.): The Bloomsbury Companion to Lexicography. London etc.: Bloomsbury, 303–320. Ripfel, Martha/Wiegand, Herbert Ernst (1988): Wörterbuchbenutzungsforschung. Ein kritischer Bericht. In: Wiegand, Herbert Ernst (Hrsg.): Studien zur neuhochdeutschen Lexikographie VI. 2. Teilband. Hildesheim [u.a.]: Olms, 492–520. Saxer, Ulrich (2010): Buchwissenschaft als Medienwissenschaft. In: Rautenberg, Ursula (Hrsg.): Buchwissenschaft in Deutschland. München: de Gruyter Saur, 65–104. Tarp, Sven (2012): Theoretical challenges in the transition from lexicographical p-works to e-tools. In: Granger, Sylvane / Paquot, Magali (Hrsg.): Electronic Lexicography. Oxford: Oxford University Press, 107–118. Wiegand, Herbert Ernst (1998): Wörterbuchforschung. Untersuchungen zur Wörterbuchnutzung, zur Theorie, Geschichte, Kritik und Automatisierung der Lexikographie. 1. Teilband. Berlin [usw]: Walter de Gruyter.

Vida Jesenšek

Über die gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie Abstract: The article focuses on the question to what extent products of non-scientific (semi) collaborative Internet lexicography follow the professional and the quality requirements of scientific lexicography and on the role the concept of lexicographical responsibility. The research is based on fundamental thoughts of Wiegand (1997) on the subject and on the forms of responsibility in lexicographical processes as well as on implementation, results and impact of activities of lexicographers who bear undeniable social responsibility. The research outlines that lexicographers are responsible for the quality of lexicographical products in the half-collaborative nonscientific Internet lexicography. This is based on selected examples from the (semi) collaborative practice in the compilation of on-line general bilingual dictionaries of the PONS publishing house. The research emphasizes the need for more contemporary dictionary didactics which future competent and responsible collaboratively users need. Keywords: Internet lexicography, collaborative lexicography, social responsibility, quality assurance Schlagwörter: Internetlexikographie, kollaborative Lexikographie, gesellschaftliche Verantwortung, Qualitätssicherung

1 Vorbemerkung In diesem Beitrag geht es um die Frage, inwiefern Produkte der nichtwissenschaftlichen (halb)kollaborativen Internetlexikographie den fachlichen und Qualitätsanforderungen der wissenschaftlichen Lexikographie obliegen, und welche Rolle dabei der Begriff der „lexikographischen Verantwortung“ einnimmt. Die Themenwahl sowie der Beitragstitel gehen auf den Aufsatz des Jubilars Herbert Ernst Wiegand von 1997 zurück, in dem die Begrifflichkeit der gesellschaftlichen Verantwortung der wissenschaftlichen Lexikographie ausführlich erläutert wird

Vida Jesenšek: Philosophische Fakultät, Universität Maribor, Koroška 160, 2000 Maribor, email: [email protected]

260

Vida Jesenšek

(Wiegand 1997).1 Diskutiert werden verschiedene Aspekte und Bezugsrelationen der Verantwortlichkeit im lexikographischen Prozess: die generelle Verantwortung der Lexikographen für die Qualität ihrer lexikographischen Produkte, die Verantwortung im fachlichen (lexikographischen) Verantwortungsbereich und im gesellschaftlichen Verantwortungsraum sowie Formen der Verantwortlichkeit gegenüber verschiedenen Verantwortungsinstanzen, z. B. die Verantwortung gegenüber den Wörterbuchverlagen und Verfassern verwendeter Quellen bzw. die Verantwortung in Bezug auf die Wörterbuchbenutzer. Unter der Voraussetzung, dass handelnden Lexikographen Handlungsfreiheit gewährt wird und dass in ihrem Verantwortungsraum sozial geltende Normen existieren, sind sie zur Verantwortung für die Durchführung, Ergebnisse und Folgen ihrer lexikographischen Aktivitäten verpflichtet. Wie man leicht sehen kann, hat sich bei der gegenwärtigen Herstellung von Wörterbüchern einiges verändert. Neue technologische Möglichkeiten und entsprechende Methoden der Sprachdatenermittlung aus umfangreichen elektronischen Textkorpora, neuartige Perspektiven für die digitale Präsentation lexikographischer Produkte, veränderte Formen des Nachschlageverhaltens sowie grundlegende Änderungen im Verlagswesen sind Faktoren, die zum bedeutenden Wandel in der Durchführung der lexikographischen Prozesse geführt haben. Die neuen Sachverhalte gelten verstärkt für die Internetlexikographie, wobei die massive Einbeziehung der Wörterbuchbenutzer besonders augenfällig ist. Eine Praxis, die man unter den Namen „kollaborative“ bzw. „Bottom-up-Lexikographie“ kennt (Fuertes-Olivera 2009), hat sich zwischendurch auch bei einigen renommierten Wörterbuchverlagen eingebürgert. Das Potential und die Beschränkungen von kollaborativen Arbeitsprinzipien in der Erstellung von Wörterbüchern wurden bisher relativ selten thematisiert (vgl. Abschnitt 3). Der Begriff der „gesellschaftlichen Verantwortung der Lexikographie“ im Sinne Wiegands wurde in diesen Zusammenhängen nach meiner Kenntnis explizit nur in Jesenšek (2014) angesprochen. Im Hinblick auf den momentanen Qualitätsstand der vielfältigen lexikographischen Produkte im Internet wäre es allerdings an der Zeit, sich damit intensiver auseinanderzusetzen. Es handelt sich nicht nur um neue Möglichkeiten der pragmatisch-funktionalen und methodischen Anreicherung der lexikographischen Praxis; es geht gleichermaßen auch um grundlegende Herausforderungen für die künftige Entwicklung der Lexikographie als kulturelle Praxis und wissenschaftliche Disziplin. Man steht vor dem Dilemma der technologisch-ökonomisch begründbaren Flexibilität in Prozessen der Wörterbuchherstellung einerseits und der Standardisierung und Qualitätssicherung im Fachbereich Lexikographie andererseits. Man steht eigentlich vor der Frage, wer sich in der Zukunft zum Lexikographen halten wird.

1 Eine leicht adaptierte Version dieses Aufsatzes erschien 2006 auch in slowenischer Übersetzung (Wiegand/Jesenšek 2006).

Gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie

261

Der vorliegende Beitrag ist somit als Fortsetzung der Diskussion zur lexikographischen Verantwortung in Wiegand (1997), Wiegand/Jesenšek (2006) und Jesenšek (2014) zu verstehen. Um in das Thema einzusteigen, wird vorerst die Begrifflichkeit der „gesellschaftlichen Verantwortung“ in der (wissenschaftlichen) Lexikographie nach Wiegand (1997) skizziert (Abschnitt 2). Im darauffolgenden Abschnitt 3 wird auf grundlegende Prinzipien der (halb)kollaborativen Lexikographie eingegangen. Sodann werden anhand der Beispiele aus den teilweise kollaborativ erarbeiteten allgemeinen zweisprachigen Internetwörterbüchern des Sprachenverlags PONS einige Problemstellen aus der Perspektive der lexikographischen Verantwortung erörtert (Abschnitt 4). Der Beitrag schließt mit einem Ausblick auf zukünftige Entwicklungen und weiteren Forschungsbedarf ab (Abschnitt 5).

2 Zum Begriff der „gesellschaftlichen Verantwortung“ der (wissenschaftlichen) Lexikographie nach Wiegand (1997) Ausgangspunkt der Überlegungen zur lexikographischen Verantwortung und zu den Formen der Verantwortlichkeit in lexikographischen Prozessen ist die inzwischen auch von der sprachkognitiven und sprachdidaktischen Forschung anerkannte Relevanz der Sprache (Wörter) für den Wissenserwerb und die menschliche Wahrnehmung der Welt; vgl.: „Sind Ausschnitte einer Welt von der Sprachgemeinschaft einmal in einer je bestimmten Weise sprachlich benannt und damit mehr oder weniger verbindlich eingeordnet, weil sie einmal so und nicht anders begriffen wurden, dann werden sie von denen, die in diese Sprachgemeinschaft hineinwachsen, eben vor allem so gesehen, wie sie in der Sprache heißen.“ (Wiegand 1997: 177–178).

Bezug nehmend auf die Zusammenhänge des sprachlich determinierten Wissenserwerbs bzw. der Weltwahrnehmung und der Sprachlexikographie, die man als gesellschaftlich-kulturelle Praxis versteht, liegt es nahe, dass Lexikographen für die Durchführung, Ergebnisse und Folgen ihrer Tätigkeit unbestreitbar gesellschaftliche Verantwortung tragen.

2.1 Handlungstheoretischer und gesellschaftlicher Rahmen der lexikographischen Verantwortung Angesichts der unterschiedlichen (philosophischen, moralischen, politischen, juristischen, religiösen, wissenschafts- und medienbezogenen) Auffassungen und Interpretationen des Verantwortungsbegriffes skizziert Wiegand den Begriff der „lexikogra-

262

Vida Jesenšek

phischen Verantwortung“ auf der Basis der sprachüblichen Verwendung der Ausdrücke verantwortlich bzw. Verantwortung. Aus dem Sprachgebrauch ergibt sich, für welche Sachverhalte einzelne Personen, Personengruppen oder Institutionen verantwortlich oder nicht verantwortlich sein können. Zu den verantwortungsträchtigen Sachverhalten zählen vor allem Ergebnisse und Folgen menschlicher Handlungen, darunter solche sprachkommunikativen Typs und Unterlassungshandlungen (einschließlich ihrer Bedingungen). Darunter fallen des Weiteren auch alle Handlungen, die bei der Erarbeitung eines Wörterbuchs, also in einem gesellschaftlich-kulturell geprägten lexikographischen Gesamtprozess, ausgeführt werden. Lexikographische Handlungen obliegen dem Begriff der „Verantwortlichkeit“ allerdings nur unter der Voraussetzung, dass handelnde Lexikographen sich „im Zustand der Willensfreiheit und damit der Zurechnungsfähigkeit“ befinden (Wiegand 1997: 181). Sie müssen die Möglichkeit haben, sich hinsichtlich der Arten und Formen ihrer Handlungen, für die sie Verantwortung tragen, frei entscheiden zu können. Dieser Freiheit sind jedoch Grenzen gesetzt. Einerseits sind es Grenzen des Sachbereichs, die sich am vorgängigen fachspezifischen (linguistischen, lexikographischen) Wissen ablesen lassen; andererseits sind es Grenzen der gesellschaftlichkulturell bedingten Sittlichkeit. Denn es geht stets auch um die Verantwortung gegenüber anderen Menschen, also gegenüber jener Kulturgemeinschaft, in der Lexikographen leben und handeln. Der handlungstheoretisch und soziologisch begründete Wiegandsche Begriff der „lexikographischen Verantwortung“ ist somit doppelter Natur: Der handelnde Lexikograph trägt Verantwortung im Rahmen seines sachlichen Zuständigkeitsbereiches (der sachliche, i.e. der lexikographische Verantwortungsbereich und er ist Träger einer gesellschaftlich-sittlichen Verantwortung (der gesellschaftliche Verantwortungsraum). Darüber hinaus sind Verantwortungsbereiche durch verschiedene hierarchische Verantwortungsinstanzen gekennzeichnet (Personen, Personengruppen, Institutionen), die sich zueinander in (möglicherweise auch rechtlich geregelten) wechselseitigen Verpflichtungsverhältnissen befinden. So beschaffen sind üblicherweise Verantwortungsstrukturen in einem lexikographischen Team in der kommerziellen Lexikographie, wo es in der Regel einen leitenden Lexikographen gibt. Der leitende Lexikograph trägt gegenüber dem Verlag bestimmte Formen der Verantwortung, etwa die „Verantwortung für die Wörterbuchkonzeption“ und die „Verantwortung für die Planung und Kontrolle der lexikographischen Teilprozesse“. Gleichzeitig stellt er die verpflichtende Verantwortungsinstanz für die Lexikographen im Team dar, zumal diese ihm für die Ergebnisse der ihnen zugewiesenen lexikographischen Teilhandlungen verantwortlich sind (ebd.: 186−187). Aus einzelnen lexikographischen Teilhandlungen bei der Erarbeitung der Wörterbuchartikel ergeben sich etwa folgende Formen der lexikographischen Teilverantwortlichkeit: die „lexikographische Verantwortlichkeit für die formale Sprachrichtigkeit“ (bezogen auf alle Arten der Wörterbuchangaben zur Sprachform), die „lexikographische Verantwortlichkeit für die Gültigkeit des Sprachwissens“ (bezogen

Gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie

263

auf die angemessene Anwendung des bestehenden linguistischen Fachwissens, etwa bei der Formulierung von grammatischen oder etymologischen Angaben), die „lexikographische Verantwortlichkeit für die Angemessenheit der semantisch-pragmatischen Interpretation“ (bezogen auf die Formulierung von semantischen und pragmatischen Angaben), die „lexikographische Verantwortlichkeit für die Sprachüblichkeit der Beispiele“ (bezogen auf die Selektion und Auswertung der Textausschnitte in Belegfunktion, anhand deren sprachüblicher Gebrauch der Lemmazeichen nachvollziehbar sein sollte). Die Anzahl der lexikographischen Teilverantwortlichkeiten ist variabel und von der jeweiligen Konzeption des zu erstellenden Wörterbuchs abhängig. Aus der Gesamtheit der Teilverantwortlichkeiten im jeweiligen Prozess der Wörterbucherarbeitung ergibt sich die „lexikographische Verantwortlichkeit für die Qualität der lexikographischen Texte“, die der jeweilige leitende Lexikograph trägt – dies sowohl im sachlichen Verantwortungsbereich als auch im gesellschaftlichen Verantwortungsraum. In Bezug auf verschiedene Aspekte der lexikographischen Handlungen im (kommerziellen) lexikographischen Gesamtprozess sind laut Wiegand (ebd.: 192) drei Verantwortungsinstanzen zu nennen, gegenüber denen der leitende Lexikograph Verantwortung trägt: der Verlag (Geldgeber), die Verfasser verwendeter Quellen, und die potentiellen Wörterbuchbenutzer.

2.2 Eigenschaften lexikographischer Tätigkeiten als Wörterbuchherstellungshandlungen In Zusammenhang mit dem hier behandelten Thema ist explizit auf die Wichtigkeit der lexikographischen Sachkenntnisse hinzuweisen. Auf dem vorgängigen Sachwissen über die Wörterbücher und ihre Herstellung basieren nämlich jene Eigenschaften der (wissenschaftlichen) lexikographischen Praxis, die eine fachgerechte und erfolgreiche Ausführung des lexikographischen Gesamtprozesses sichern. Diese Eigenschaften sind: die „Kalkulierbarkeit“ (Einschätzbarkeit der notwendigen Kenntnisse und Fertigkeiten in Bezug auf das herzustellende Wörterbuch), die „Zerlegbarkeit“ und die „Kontrollierbarkeit“ (Zerlegung des lexikographischen Herstellungsprozesses in einzelne Teilprozesse, die somit systematisch und gezielt kontrolliert werden können), die „Reglementierbarkeit“ (sich ergebend aus dem fachlichen Herstellungswissen und dem Bewusstsein über die Verpflichtungs- bzw. Verantwortungsverhältnisse, in denen gearbeitet wird), die „Lehrbarkeit“ (der gesamte lexikographische Herstellungsprozess und seine Teilprozesse sind lehrbar), und die „Prüfbarkeit“ (aufgrund von Sachkenntnissen über die Eigenschaften des herzustellenden Produktes kann seine Qualität geprüft werden); vgl. Wiegand (1997: 185). Nachfolgend wird vor allem der Frage nachgegangen, ob und inwieweit sich die hier skizierten und von Wiegand am Beispiel der wissenschaftlichen Lexikographie explizierten Eigenschaften der lexikographischen Prozesse und Formen der Verant-

264

Vida Jesenšek

wortlichkeit an der gegenwärtig geradezu blühenden nichtwissenschaftlichen Internetlexikographie ablesen lassen, deren bedeutendes Merkmal (halb)kollaborative Arbeitsprinzipien sind. Als empirische Quelle werden dafür allgemeine zweisprachige Internetwörterbücher des PONS-Verlags herangezogen. Vorab sind jedoch kurze Bemerkungen zu wesentlichen Handlungsprinzipien der kollaborativen Lexikographie zu machen.

3 Zu Handlungsprinzipien der kollaborativen Lexikographie Die Anfänge der kollaborativen lexikographischen Praxis findet man in den 90-er Jahren des 20. Jhs.: über die „kollaborative Erstellung“ (von Wörterbüchern) lesen wir bei Storrer/Friese (1996), über die „bottom-up lexicography“ bei Carr (1997). Detaillierter befasst man sich mit der Erscheinung im Rahmen der (kritischen) Erforschung der Internetlexikographie, vgl. die Besprechung der „collaborative lexicography“ und des „nutzergenerierten“ bzw. „kollaborativen Wörterbuchs“ bei Meyer/Gurevych (2012, 2014), der „Kollaborativität“ bzw. „Halbkollaborativität“ bei Melchior (2012, 2014), der lexikographischen Behandlung von Sprichwörtern in kollaborativ erstellten Wörterbüchern bei Jesenšek (2014). Man unterscheidet zwischen offen-kollaborativen (Wiktionary), kollaborativ-institutionellen (Macmillan Open Dictionary) und semikollaborativen Wörterbüchern (LEO, Open Thesaurus), wie in Abel/Meyer (2013), bzw. zwischen vollständig kollaborativen und halbkollaborativen Ansätzen; vgl. Melchior (2012, 2014). Es handelt sich um die Modelle der Interaktivität in der Internet-Umgebung (Web 2.0). Das grundlegende Prinzip ist, dass eine offene und mehr oder weniger anonyme Personengruppe ein gemeinsames Ziel befolgt – in unserem Fall die Erarbeitung eines Wörterbuchs –, wobei die Mitwirkung an verschiedene lexikographische Aktivitäten gebunden sein kann: Man liefert neue Sprachdaten, man redigiert bestehende Sprachdaten, man unterbreitet Vorschläge zu mikrostrukturellen Änderungen, man beurteilt die Auffindbarkeit von Sprachdaten, u.a.m. Die Intensität der Mitwirkung ist unterschiedlich: Sie reicht von der Bereitstellung der Sprachdaten, die in darauffolgenden Arbeitsschritten von Lexikographen aus- und verwertet werden, bis hin zu einer vollständig autonomen Erarbeitung von Wörterbüchern ohne die Mitwirkung der Lexikographen. Eine angemessene Differenzierung der Internetwörterbücher hinsichtlich der kollaborativen Beteiligung von Wörterbuchbenutzern in lexikographischen Prozessen macht Storrer (2010), indem sie zwischen den Internetwörterbüchern mit Nutzerpartizipation und nutzergenerierten Internetwörterbüchern unterscheidet. Während die ersteren redaktionell betreut werden und mitwirkende Wörterbuchbenutzer inhaltlich beteiligt sind, indem sie bestehende Wörterbuchartikel ergänzen und/oder korrigieren, Diskussionsbeiträge in wörterbucheigenen Foren/Blogs publi-

Gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie

265

zieren u.a.m. (gilt etwa für LEO und PONS), werden die letzteren im Wesentlichen von den Wörterbuchbenutzern selbst erstellt (gilt etwa für Wiktionary). Technische Gegebenheiten der interaktiven Internet-Umgebung ermöglichen dazu verschiedene Formen der wechselseitigen Interaktion, darunter die Interaktion unter den mitwirkenden Benutzern selbst, die Interaktion unter den Benutzern und der jeweiligen Wörterbuchredaktion (falls diese existiert) sowie schließlich auch die Interaktion unter den Benutzern und Internetbetreibern. Es soll allerdings betont werden, dass die moderne Kollaborativität in der lexikographischen Praxis nicht völlig gleichzusetzen ist mit der historisch tradierten Zusammenarbeit der Lexikographen mit den Wörterbuchbenutzern. Ein Beispiel für das Letztere wäre das Konzept der sog. „Leseprogramme“ bei der Erarbeitung des englischen Oxford-Wörterbuchs im 19. Jh. (Oxford English Dictionary), welches jedoch keine unmittelbare externe Mitwirkung am lexikographischen Prozess ermöglichte. Prinzipien der internetbasierten Kollaborativität haben sich bisher besonders stark im Bereich des (Sprach-)Wissensmanagements durchgesetzt. Offensichtlich ist auch, dass sie im Moment eine starke gesellschaftliche und bildungspolitische Unterstützung genießen. Das Phänomen wird als erwünschte kreative Interaktion interpretiert und als Beitrag zur Zugänglichkeit und Offenheit des Wissens verstanden („wisdom of crowds“, „crowdsourcing“); vgl. Zimmer (2007). Zugleich sieht man darin einen bedeutenden Beitrag zur gesellschaftlichen Demokratisierung, was darauf zu führen ist, dass breite Massen in einen Tätigkeitsbereich mit eng professionellen Anschauungen, Interessen und Bestrebungen integriert werden (Jesenšek 2014). Wir beobachten also neuartige technologisch fortschrittliche Prozesse und gesellschaftlich erwünschte Verhaltensänderungen im lexikographischen Fachbereich, die auch den renommierten Wörterbuchverlagen wie Collins, Macmillin, PONS u.a. nicht mehr fremd sind.

4 Fallbeispiel PONS Die empirische Basis für die nachfolgenden Überlegungen zu Verantwortlichkeitskonstellationen in der kollaborativen Internetlexikographie stellen allgemeine zweisprachige Internetwörterbücher dar, die auf dem Wörterbuchportal des Sprachenverlags PONS frei zugänglich sind.2 Es geht um ein ambitioniertes Wörterbuchprojekt mit hohen Qualitätsansprüchen, wie aus der verlagseigenen Werbung hervorgeht: „Alle unsere PONS Sprachenprodukte erfüllen höchste Standards, was Qualität und Pädagogik angeht“; „das Onlinewörterbuch nimmt eine Spitzenposition im Bereich Webbzw. Portaltechnologie und Reichweitenvermarktung von hochkarätigen Verlags-

2 PONS Online-Wörterbuch. [Unter: http://de.pons.com/; letzter Zugriff: 23. 7. 2015]. Das Portal beinhaltet u.A. allgemeine zweisprachige Wörterbücher mit Deutsch und 18 weiteren Sprachen.

266

Vida Jesenšek

inhalten ein […]“. Zu potentiellen Benutzern zählt der Verlag alle, „die Fremdsprachen lernen und anwenden: in Schule, Beruf, auf Reisen oder einfach nur als Hobby“.3 Es handelt sich demnach um ein Wörterbuch für lern- und/oder übersetzerische Benutzungszwecke bei fremdsprachlichen Sprechern der behandelten Sprachen. Das Kollaborativitätsprinzip wird dadurch wahrgenommen, dass interessierte Benutzer einfach „am Wörterbuch mitschreiben“; vgl. „[…] Am Online-Wörterbuch kann jeder mitschreiben: Im Open Dictionary kann man für einen Teil der Sprachen zusätzliche, bisher fehlende Begriffe eingeben“; man kann Kontakt mit der Redaktion herstellen, um Fragen, Anmerkungen, Kommentare, Verbesserungsvorschläge oder Kritik auszudrücken. Auf der Seite „hilfe_open_dict“4 finden sich Hinweise für registrierte Benutzer, anhand deren sich diese über das Vorgehen informieren können. Allerdings muss man feststellen, dass die Hinweise sehr knapp sowie dazu in einem umgangssprachlichen Stil mit völlig unklarer Terminologie verfasst sind, folglich keinesfalls als eine Art lexikographisches Instruktionsbuch für mitwirkende „Lexikographen“ verstanden werden können. Benutzergenerierte und mithilfe einer Eingabemaske gelieferte Beiträge zum Inhalt des Wörterbuches sollten in der Regel von der PONS-Wörterbuchredaktion überprüft und ggf. redigiert werden. Genauere redaktionelle Aussagen über Kriterien, Maßstäbe und Standards, die von der Redaktion dabei gefolgt werden, fehlen jedoch fast völlig. Man erfährt nur, dass die Redaktion um die (sprachliche?) Korrektheit und „einheitliche Darstellung der Einträge“ bemüht ist, vgl.: „Unsere Redaktion prüft alle OpenDict-Einträge. Dabei stellen wir sicher, dass die Angaben korrekt sind und die Einträge einheitlich dargestellt werden“; vgl. auch den Hinweis darauf, dass die Benutzerbeiträge ggf. „ergänzt, umstrukturiert oder anderweitig optimiert“ werden. Allgemeine zweisprachige PONS-Wörterbücher sind somit dem Typ der halbkollaborativen Wörterbücher zuzuordnen (vgl. Abschnitt 3). Anhand der deklarierten redaktionellen Überprüfung der benutzergenerierten „Einträge“ könnte man annehmen, dass die in Abschnitt 2 dargelegten Verantwortlichkeiten sichergestellt werden. Der Verlag vertritt hierbei jedoch ein andersartiges Verantwortungsverständnis, wenn wir im Impressum des PONS-Portals folgendes lesen: „Für die Richtigkeit von Angaben, Daten, Behauptungen etc. in den Beiträgen kann der Herausgeber bzw. die Redaktion keine Verantwortung übernehmen.“5 Wie der gesamte lexikographische Prozess bei PONS im Detail organisiert ist, lässt sich anhand der online zugänglichen Daten nur schwer nachvollziehen. In Zusammenhang mit Verantwortungs- und Verpflichtungsverhältnissen, die uns in diesem Beitrag interessieren, gehen wir jedoch davon aus, dass es ein (hierarchisch organisiertes, professionelles?) Redaktionsteam mit einem leitenden Lexikographen gibt, 3 PONS Online-Wörterbuch. [Unter: http://de.pons.com/shop/unternehmen/;letzter Zugriff: 23. 7. 2015]. 4 PONS Online-Wörterbuch. [Unter: http://de.pons.com/specials/cms/hilfe;letzter Zugriff: 23. 7. 2015]. 5 PONS Online-Wörterbuch. [Unter: http://de.pons.com/shop/impressum/; letzter Zugriff: 23. 7. 2015].

Gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie

267

dessen Mitglieder einzelne lexikographische Teilhandlungen unter kollaborativer Mitwirkung der interessierten Benutzer ausführen und dessen Zuständigkeiten und Verantwortlichkeiten − trotz der oben erwähnten Verweigerung der Verantwortung für die Inhalte des Portals − folgende Verantwortungsinstanzen betreffen: den Verlag, die Verfasser verwendeter Quellen, und die potentiellen Wörterbuchbenutzer.

4.1 Verantwortung gegenüber dem Verlag In Abschnitt 2.2 wurden Eigenschaften des lexikographischen Gesamtprozesses und einzelner lexikographischer Teilprozesse skizziert. Sie gründen auf lexikographischen Sachkenntnissen. Wird der lexikographische Gesamtprozess so organisiert, dass sie zum Tragen kommen, so kann eine fachgerechte Ausführung einzelner lexikographischer Handlungen und in der Folge die Qualität des lexikographischen Produktes als gesichert gelten. Alle genannten Eigenschaften lassen sich unmittelbar auf die Verantwortung des leitenden Lexikographen gegenüber dem Verlag beziehen: Er trägt die Verantwortung für die Einschätzung der notwendigen Kenntnisse und Fertigkeiten in Bezug auf das herzustellende Wörterbuch (Kalkulierbarkeit). Er ist dafür verantwortlich, dass sich der lexikographische Herstellungsprozesses in Bezug auf das herzustellende Wörterbuch in entsprechende einzelne Teilprozesse zerlegen und somit gezielter kontrollieren lässt (Zerlegbarkeit, Kontrollierbarkeit). Aufgrund seiner fachlichen (lexikographischen) Kompetenz verantwortet er das gesamte Wörterbuchkonzept und die Ausarbeitung sowie Einhaltung des Instruktionsbuches (Reglementierbarkeit). Er trägt Verantwortung dafür, dass den Mitwirkenden entsprechende/ notwendige Kenntnisse und Fertigkeiten vermittelt werden, damit sie imstande sind, die einzelnen Teilhandlungen korrekt auszuführen (Lehrbarkeit). Und schließlich muss er aufgrund seiner (lexikographischen, linguistischen) Fachkenntnisse Qualitätsmaßstäbe für die Beurteilung der Qualität der lexikographischen (Teil-)Ergebnisse setzen können, damit die Überprüfung der Qualität gewährleistet ist (Prüfbarkeit). Bei der Herstellung der erwähnten Wörterbücher nehmen einen bedeutenden Teil des gesamten Herstellungsprozesses lexikographische Teilhandlungen ein, die kollaborativ durch die Mitwirkung von Wörterbuchbenutzern realisiert werden. Diese muss man in der Terminologie Wiegands als „nichtprofessionelle“ und „nichtwissenschaftliche lexikographische Herstellungshandlungen“ verstehen. Anhand der zugänglichen Informationen zum Herstellungsprozess der PONS-Wörterbücher ist nicht genau ersichtlich, ob die Einschätzung der notwendigen Kenntnisse und Fertigkeiten der mitwirkenden Benutzer überhaupt eine Rolle spielt. Anhand der oben zitierten Motivations- und Werbungsaussagen („jeder kann mitschreiben“) muss man eher davon ausgehen, dass der Aspekt der Kalkulierbarkeit unreflektiert bleibt. Die Annahme bestätigt auch das Stellenangebot für das (nicht vergütete) Praktikum vom Mai 2015: Unter „Anforderungen“ werden keine speziellen Kenntnisse zur Lexikographie oder Linguistik genannt. Denn was man von einem mitwirkenden Praktikanten in

268

Vida Jesenšek

Bezug auf die lexikographische Fachkompetenz erwartet, ist lediglich „Spaß an der zweisprachigen Wörterbucharbeit“.6 Wie wir oben gesehen haben, stehen den mitwirkenden Benutzern auch keine genaueren Hinweise zur Verfassung ihrer Beiträge zur Verfügung, sodass auch der Aspekt der Lehrbarkeit weitgehend unberücksichtigt bleibt. Angesichts solcher Beobachtungen muss man feststellen, dass der leitende Lexikograph gegenüber dem Verlag auch Verantwortlichkeit trägt für die auf kollaborativ mitwirkende Benutzer bezogenen Unterlassungshandlungen.

4.2 Verantwortung gegenüber den Verfassern verwendeter Quellen Es ist traditionell üblich, dass bei der Ermittlung und Aufbereitung der lexikographisch relevanten Sprachdaten verschiedenartige Quellen benutzt werden. Die Befolgung von Quellennachweisprinzipien bzw. Belegprinzipien gilt als Qualitätszeichen der (wissenschaftlichen) lexikographischen Produkte: Das übernommene Sprachmaterial soll zitiert werden; den Benutzern soll offengelegt werden, welche Quellen bei der jeweiligen Wörterbuchherstellung verwendet und wie sie ausgewertet worden sind. Die Anforderung obliegt sowohl der sachlichen Verantwortlichkeit für die Qualität des lexikographischen Produktes, als auch der sittlichen Verantwortlichkeit im gesellschaftlichen Verantwortungsraum (vgl. 2.1): Es geht um eine moralisch-ethische Dimension der lexikographischen Tätigkeit; vgl.: „[…] es schadet der Lexikographie insgesamt, wenn einige Wörterbücher den Geruch des geistigen Diebstahls mit sich führen“ (Wiegand 1997: 192f.). Was diese Verantwortlichkeitsaspekte im zweisprachigen PONS angeht, so stellt man fest, dass den kollaborativ mitwirkenden Benutzern von Seiten der Redaktion überhaupt nicht geraten wird, welche Quellen bei der Herausarbeitung einzelner Angaben zu berücksichtigen und nach welchen Prinzipien und Kriterien sie auszuwerten sind, um lexikographisch relevante Sprachdaten sicherzustellen. Dies gilt sowohl in makrostruktureller Hinsicht (Auswahlkriterien der Wörter, die als Lemma anzusetzen sind), als auch in Bezug auf die Herausarbeitung einzelnen Angaben, etwa Kollokations-, Phraseologie-, und Beispielangaben. Die PONS-Wörterbücher vertreten hierbei eine Position, die man als fachlich unprofessionell ansehen muss. In den Hinweisen für die mitwirkenden Benutzer liest man: „Wir heißen es daher immer sehr willkommen, wenn Sie in den Feldern zu Kontextinformationen Angaben darüber machen, wo Sie auf das Stichwort bzw. die Wendung gestoßen sind. […]. Da bei uns echte gelebte Sprache an erster Stelle steht, möchten wir Sie aber bitten, nicht einfach nur

6 Klett-Gruppe. [Unter: http://www.klett-gruppe.de/karriere/stellenangebote/praktikant|in+.2784. htm; letzter Zugriff 7. 5. 2015].

Gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie

269

andere Wörterbücher zu kopieren. Dies können wir schon aus urheberrechtlichen Gründen nicht akzeptieren. Umso mehr freuen wir uns auf Ihre eigenen sprachlichen Erfahrungen.“

Diese Aussage ist kontrovers, zumal einerseits Angaben zu Sprachdatenquellen gefordert werden („wo Sie auf das Stichwort bzw. die Wendung gestoßen sind“), andererseits jedoch die benutzereigene Sprachkompetenz hervorgehoben wird („ihre eigenen sprachlichen Erfahrungen“). Ferner ist nicht klar, was man mit „echte gelebte Sprache“ meint: Spricht man etwa als Muttersprachler einer Sprache anders als in entsprechenden textuellen Sprachkorpora belegt ist, die als Quellen gelten können? Ist hierbei nur der gesprochene Sprachgebrauch gemeint? Ist damit etwa nur Frequenz und somit Aktualität im gegenwärtigen Sprachgebrauch gemeint? Diese und weitere Fragen zur obigen Redaktionsaussage lassen sich ohne eine nähere Kenntnis der redaktionsinternen Arbeitsorganisation und Instruktionen zur redaktionellen Überprüfung benutzergenerierter Daten leider nicht beantworten. Es ist lediglich festzuhalten, dass in Folge einer derartig unprofessionellen Position der Redaktion die Makro- und Mikrostrukturen von zweisprachigen PONS-Wörterbüchern äußerst unausgewogen und in nicht wenigen Fällen auch von schlechter Qualität sind.

4.3 Verantwortung gegenüber den Wörterbuchbenutzern Lexikographietheoretisch gesprochen, ist der potentielle Wörterbuchbenutzer „eine Person, welche die Voraussetzungen dafür hat, um den Erwartungen entsprechen zu können, welche die Benutzerrolle ausmachen, die vom Wörterbuchtyp festgelegt ist“ (Wiegand 1997: 194). Inwiefern der Wörterbuchbenutzer seine Wörterbuchbenutzerrolle effizient wahrnehmen kann, ist zwar nicht nur vom jeweiligen lexikographischen Produkt als Resultat des lexikographischen Gesamtprozesses abhängig; seine jeweilige Qualität kann dazu aber entscheidend beitragen. Der Lexikograph kann daher für die Resultate einzelner Benutzungshandlungen nicht unmittelbar verantwortlich sein: Er ist aber schlechthin für die Qualität des Wörterbuchs verantwortlich, die erfolgreiche Benutzungshandlungen überhaupt ermöglicht und zum Nutzen des Wörterbuchs beiträgt. Daher ist die Verantwortlichkeit gegenüber den Wörterbuchbenutzern vorrangig auf die lexikographische Verantwortlichkeit für die Qualität der lexikographischen Texte zurückzuführen (vgl. Abschnitt 2.1.). Zu den zwei wichtigsten Qualitätskriterien von Wörterbüchern zählt Wiegand die „Zuverlässigkeit“ und die „Auffindbarkeit“ der lexikographischen Daten (Wiegand 1997: 195). Der Aspekt der Auffindbarkeit von lexikographischen Daten in den zweisprachigen PONS-Wörterbüchern wurde am Beispiel der polylexikalen Einheiten (Phraseme und Sprichwörter) in Jesenšek (2014) dargelegt. Die Beobachtungen laufen darauf hinaus, dass nicht in befriedigender Weise verfahren wird: Die lexikographische Behandlung von polylexikalen Einheiten ist inkonsequent und von der Redak-

270

Vida Jesenšek

tion offensichtlich weniger reflektiert, was primär auf die Nichtberücksichtigung fachlicher (linguistischer, phraseologischer) und lexikographischer Kenntnisse zurückzuführen ist, und somit folglich auf die mangelnde Verantwortung für das Wörterbuchkonzept und Wörterbuchqualität. Die Zuverlässigkeit der lexikographischen Daten ist jeweils von ihrem Typ abhängig. So sind Daten zur Form zuverlässig, wenn sie richtig sind („Verantwortung für die Sprachrichtigkeit“). Daten zum Fachwissen sind dann zuverlässig, wenn sie gültig sind („Verantwortung für das Fachwissen“). Daten zur Semantik und Pragmatik sind zuverlässig, wenn sie angemessen sind („Verantwortung für die Interpretation“). Verwendungsbeispiele sind zuverlässig, wenn sie üblich sind („Verantwortung für die Sprachüblichkeit“); vgl. ebd. Welche Beobachtungen lassen sich in diesen Zusammenhängen an die zweisprachigen PONS-Wörterbüchern anschließen? – Unter vielen angemessenen semantischen Interpretationen (im zweisprachigen Wörterbuch übernehmen diese Rolle in der Regel Äquivalentangaben) findet man auch solche, die man wohl für nicht zuverlässig halten muss. Auch an den Daten zum Fachwissen kann man stellenweise zweifeln. Und Verwendungsbeispiele sind manchmal recht unüblich. Ein kleiner Ausschnitt aus dem deutsch-slowenischen PONS-Wörterbuch soll hierbei zur Illustration verschiedener Problemstellen dienen: Am Ende des Wörterbuchartikels zum Lemma Katze findet sich ein Block mit sog. „Beispielsätzen“, die in der Form einer zweisprachigen Liste von Angaben verschiedenster Art präsentiert werden:7 Beispielsätze für Katze: die Katze macht „miau“ fam eine Katze ertränken die Katze belauert den Vogel die Katze im Sack kaufen unsere Katze ist heute sehr anlehnungsbedürftig

mačka dela „mijav“ utopiti mačko mačka preži na ptiča kupiti mačka v žaklju naša mačka potrebuje danes veliko pozornosti die Katze aus dem Sack lassen fam izdati skrivnost die Katze lässt das Mausen nicht Spr volk dlako menja, a narave nikoli sie sind wie Hund und Katze fam fig sta kot pes in mačka wie die Katze um den heißen Brei schleichen fam fig plaziti se kot mačka okoli vrele kaše du darfst bei der Katze mal ei ei machen lahko pobožaš mačko

7 PONS Online-Wörterbuch. [Unter: http://de.pons.com/%C3%BCbersetzung?q=Katze&l=desl&in= &lf=de; letzter Zugriff: 23. 7. 2015].

Gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie

271

Manches ist hier sowohl aus linguistischer als auch aus lexikographischer Perspektive korrekturbedürftig: Nur bei fünf Angaben geht es um die Beispielsätze, also Sätze im Sinne der deutschen Syntax; sonst sind es (ggf. auch unkorrekte) Phrasemangaben (die Katze im Sack kaufen, die Katze aus dem Sack lassen, wie die Katze um den heißen Brei (?) schleichen), Sprichwortangaben (die Katze lässt das Mausen nicht), Kollokationsangaben (?) (eine Katze ertränken). Die slowenischen Äquivalentangaben sind ggf. unüblich (mačka dela „mijav“; üblicher und somit besser: mačka mijavka). Für die Beispielangabe unsere Katze ist heute sehr anlehnungsbedürftig lässt sich mühelos die (unzitierte) Quelle finden, nämlich das Portal „Academic“ („Academic dictionaries and encyclopedias“);8 die Markierungen fam (‚umgangssprachlich‘) und fig (‚figurativ, übertragen, bildlich‘) werden eher beliebig und inkonsequent verwendet (vgl. Jesenšek 2014), usw. Von einer Zuverlässigkeit der lexikographischen Daten im Sinne der oben skizierten Verantwortlichkeiten kann leider nicht die Rede sein.

5 Fazit und Ausblick In Bezug auf die anfangs gestellte Frage, inwiefern Produkte der nichtwissenschaftlichen (halb)kollaborativen Internetlexikographie den fachlichen und Qualitätsanforderungen der wissenschaftlichen Lexikographie obliegen und welche Rolle dabei der Begriff der „lexikographischen Verantwortung“ einnimmt, muss man anhand der Praxis der zweisprachigen halb-kollaborativen PONS-Wörterbücher feststellen, dass die Begrifflichkeit der lexikographischen Verantwortung, wie diese in Wiegand (1997) festgelegt wurde, nicht bzw. äußerst wenig reflektiert wird. Dies zeigt sich u. A. an minimalen fachlichen (linguistischen, lexikographischen) Anforderungen gegenüber den kollaborativ mitwirkenden Benutzern, an nicht nachvollziehbarer redaktioneller Überprüfung benutzergenerierter Daten, und somit folglich an mangelnder Qualität des Wörterbuches in vielerlei Hinsicht. Wer ist letztendlich für die Qualität der PONS-Internetwörterbücher verantwortlich? Ist es der Verlag? Ist es der leitende Lexikograph (wenn es einen überhaupt gibt)? Ist es das gesamte (unbekannte) lexikographische Team? Sind es mitwirkende Benutzer? – Diese Fragen können vorläufig ohne eine nähere Kenntnis der verlagsinternen Verpflichtungs- und Verantwortlichkeitskonstellationen nicht beantwortet werden. Man muss aber feststellen, dass ein derartig mangelhaftes lexikographisches Produkt nicht schlicht auf die kollaborativ mitwirkenden Benutzer zurückzuführen ist, die in der Regel keine Lexikographen sind. Diese können für ihre Leistungen die lexikographische und gesellschaftlich-sittliche Verantwortung in der Wörterbucherstellung alleine nicht tragen. Die Verantwortung für die Form und Inhalte der Wörter-

8 Academic dictionaries and encyklopedias. [Unter: http://translate.deacademic.com/anlehnungs bed%C3%BCrftig/de/; letzter Zugriff: 23. 7. 2015].

272

Vida Jesenšek

buchtexte, und folglich auch für die Qualität des Wörterbuches, obliegt auch im Fall der halb-kollaborativen nichtwissenschaftlichen Internetlexikographie vollständig den professionellen Lexikographen. Die Überlegungen führen zum Schluss, dass eine intensivere und mehr zeitgemäße Wörterbuchdidaktik erforderlich ist, um künftig mit kompetenten und qualitätsbewussten mitwirkenden Wörterbuchbenutzern rechnen zu können. Um mit Wiegand zu sprechen: „Für die Produktion von schlechten Wörterbüchern gibt es heutzutage keine sachlichen Gründe mehr.“ (Wiegand 1997: 198). Dies gilt auch für Produktion von Wörterbüchern, die auf kollaborativen Wegen entstehen.

6 Literatur Abel, Andrea/Meyer, Christian M. (2013): The dynamics outside the paper. User contributions to online dictionaries. In: Kosem, Iztok et al. (Hrsg.): Electronic lexicography in the 21st century: thinking outside the paper. Proceedings of the eLex 2013 conference, 17–19 October 2013, Tallinn, Estonia. Ljubljana/Tallinn: Trojina, Institute for Applied Slovene Studies/Eesti Keele Instituut, 179–194. Carr, Michael (1997): Internet dictionaries and lexicography. In: International Journal of Lexicography 10/3, 209–230. Fuertes-Olivera, Pedro A. (2009): The Function Theory of Lexicography and Electronic Dictionaries: Wiktionary as a Prototype of Collective, Free Multiple-Language Internet Dictionary. In: Bergenholtz, Henning/Nielsen, Sandro/Tarp, Sven (Hrsg.): Lexicography at a Crossroads. Dictionaries and Encyclopedias Today, Lexicographical Tools Tomorrow. Frankfurt a. Main [usw.]: Peter Lang, 99−134. Jesenšek, Vida (2014): Slovarji nove dobe ali Ni vse zlato, kar se sveti. In: Jesenšek, Marko (Hrsg.): Jeziki, literature in kulture v stiku. Ob 200-letnici M. J. Lermontova, 110-letnici Srečka Kosovela in 100-letnici Vitomila Zupana. Maribor: Univerza, 85−102. LEO Wörterbücher. Hrsg. v. LEO GmbH [http://dict.leo.org]. Macmillan Open Dictionary. Hrsg. v. Macmillan Publishers [http://www.macmillandictionary.com/open-dictionary/]. Mann, Michael (2010): Internet-Wörterbücher am Ende der „Nullerjahre“: Der Stand der Dinge. Eine vergleichende Untersuchung beliebter Angebote hinsichtlich formaler Kriterien. In: Lexicographica 26, 19–46. Melchior, Luca (2012): Halbkollaborativität und Online-Lexikographie. Ansätze und Überlegungen zu Wörterbuchredaktion und Wörterbuchforschung am Beispiel LEO Deutsch-Italienisch. In: Lexicographica 28, 337−372. Melchior, Luca (2014): Ansätze zu einer halbkollaborativen Lexikographie. In: Abel, Andrea/Klosa, Annete (Hrsg.): Der Nutzerbeitrag im Wörterbuchprozess. 3. Arbeitsbericht des wissenschaftlichen Netzwerks Internetlexikografie. OPAL 4, 27−48. [Unter: http://pub.ids-mannheim.de/ laufend/opal/pdf/opal2014-4.pdf; letzter Zugriff: 24. 07. 2015]. Meyer, Christian M./Gurevych, Iryna (2012): Wiktionary: A new rival for expert-built lexicons? Exploring the possibilities of collaborative lexicography. In: Granger, Sylviane/ Paquot, Magali (Hrsg.): Electronic Lexicography. Oxford: Oxford Univ. Press, 259−291. Meyer, Christian M./Gurevych, Iryna (2014): Methoden bei kollaborativen Wörterbüchern. In: Lexicographica 30/1, 187–212. OpenThesaurus. Synonyme und Assoziationen [http://www.openthesaurus.de]. Oxford English Dictionary. Hrsg. v. Oxford Univ. Press [http://www.oed.com].

Gesellschaftliche Verantwortung der nichtwissenschaftlichen Internetlexikographie

273

PONS Online Wörterbuch. Hrsg. v. PONS Verlag [http://de.pons.com/]. Storrer, Angelika (2010): Deutsche Internet-Wörterbücher. Ein Überblick. In: Lexicographica 27, 155–164. Storrer, Angelika/Freese, Katrin (1996): Wörterbücher im Internet. In: Deutsche Sprache 24/2, 97–136. Wiktionary, the free Dictionary [http://www.wiktionary.org]. Wiegand, Herbert Ernst (1997): Über die gesellschaftliche Verantwortung der wissenschaftlichen Lexikographie. In: Hermes 18, 177−201. Wiegand, Herbert Ernst/Jesenšek, Vida (2006): O družbeni odgovornosti znanstvene leksikografije. In: Jesenšek, Marko/Zorko, Zinka (Hrsg.): Jezikovna predanost. Akademiku prof. dr. Jožetu Toporišiču ob 80-letnici. Maribor: Slavistično društvo; v Ljubljani: SAZU, 361−378. Zimmer, Ben (2007): Charting the Digital Future of Dictionary Research: Prospects for Online Collaborative Lexicography. Vortrag an der Dictionary Society of North America biennial conference, Chicago/IL.

Carolin Müller-Spitzer

Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre Abstract: Wiegand’s opus magnum „Wörterbuchforschung“ ends with a chapter on the state and the relevant tasks for research into dictionary use in the middle of the 1990s. This article aims at reflecting the tasks and the relevance of dictionary usage research 20 years later. I will argue that the fundamentally changed lexicographic landscape makes it necessary to shift the focus of research. In my view, the most important aim of research into dictionary use can no longer be limited to improving dictionaries. Research into dictionary use should also raise more awareness for userorientation in general and should provide methodological reflection to enlighten the increasingly important usage statistics for online dictionaries. Another goal should be to look behind the scenes of collaborative dictionaries in order to provide background data to classify their relevance in relation to dictionaries elaborated by lexicographic experts. The crisis of lexicography makes it also necessary to broaden our view and concentrate on situations in which linguistic questions arise. In this context, we could examine in which of these situations the consultation of lexicographic data helps. In summary, the aim of research into dictionary use is to identify the fields where sound lexicographic work is really helpful for potential users. Keywords: research into dictionary use, log file analysis, collaborative lexicography, future of lexicography Schlagwörter: Wörterbuchbenutzungsforschung, Logfileanalyse, kollaborative Lexikographie, Zukunft der Lexikographie

1 Einleitung Die Wörterbuchbenutzungsforschung gilt als jüngstes Gebiet der Wörterbuchforschung. Nach Wiegand war der potentielle Nutzer eines Wörterbuchs noch Ende der 1970er Jahre der „bekannte Unbekannte“ (Wiegand 1977: 59). Trotz des in den 1980er Jahren in Heidelberg durchgeführten Projekts „Empirische Wörterbuchbenutzungsforschung“, deren Ergebnisse in Wiegands opus magnum „Wörterbuchfor-

Carolin Müller-Spitzer: Institut für Deutsche Sprache, R 5, 6–13, D-68161 Mannheim

276

Carolin Müller-Spitzer

schung“ (Wiegand 1998) einflossen, konstatiert beispielsweise Bogaards noch 2003, dass Wörterbuchbenutzerinnen als „for the moment relatively unknown“ (Bogaards 2003: 33) zu gelten haben. Auch verschiedene Benutzergruppen sind sehr unterschiedlich stark in den Studien vertreten. Sprachlerner sind nach wie vor die potentielle Benutzergruppe, mit der am meisten geforscht wird, wenig bekannt ist über Wörterbuchbenutzung von Muttersprachlerinnen oder einer allgemeineren Öffentlichkeit (vgl. u.a. Bogaards 2003: 28; Welker 2010: 10; Bowker 2012: 380). In den letzten Jahren sind allerdings zahlreiche Studien zur Wörterbuchbenutzungsforschung publiziert worden (vgl. z.B. Welker 2010; Töpel 2014). Neben vielen Einzelstudien zum Vergleich gedruckter und digitaler Wörterbücher (Dziemanko 2012), zu bestimmten Gestaltungsmitteln, die dem Auffinden von Einzelbedeutungen in Artikeln zu polysemen Stichwörtern dienen (Lew 2010; Lew/Tokarek 2010; Lew et al. 2014), und zu verschiedenen anderen Einzelfragen, wurden in einem Projekt zur Benutzungsforschung am Institut für Deutsche Sprache (IDS) systematische breitere Studien zu Onlinewörterbüchern durchgeführt. Diese wurden 2014 in einem Sammelband publiziert (Müller-Spitzer 2014, vgl. auch die Rezension von Lew 2015). Auch das methodische Niveau der Studien hat sich insgesamt gegenüber Mitte der 1990er Jahre deutlich verbessert (Rundell 2012: 3; Koplenig: 66–67); außerdem wurden mehr Studien durchgeführt, die eine gemeinsame Forschungsfrage untersuchen und sich dementsprechend aufeinander beziehen (vgl. z.B. die Hinweise bei Töpel 2014: 19–20; sowie Lew 2011a). Es gilt allerdings weiterhin, dass sich keine Forschungstradition im von Wiegand im folgenden Zitat skizzierten Sinne herausgebildet hat: „Weiterhin muß festgestellt werden: Obwohl es in einzelnen Arbeiten anregende Detailfragestellungen, bedenkenswerte Forschungsideen und auch interessante Einzelergebnisse gibt, […] gilt dennoch dies: Generalisierbare Ergebnisse, die nicht nur für spezifische Probandengruppen gelten und die daher von weiterreichendem Interesse sind, liegen m. W. nicht vor. […] Eine oder mehrere Forschungstraditionen haben sich in der gegenwartsbezogenen Benutzungsforschung noch nicht herausgebildet, und es fehlt an weiterreichenden forschungsleitenden Grundfragestellungen mit integrierender Kraft.“ (Wiegand 1998: 1027).

Wiegands Schlussfolgerung aus diesem Zustand war folgende: „Eine vordringliche Aufgabe ist die Initiierung eines Großprojekts zur theoriegesteuerten Datenbeschaffung zur Wörterbuchbenutzung, das interuniversitär organisiert werden muß und seine Probanden sowohl bei den DaF-Studierenden als auch in anderen philologischen Fächern rekrutiert.“ (Wiegand 1998: 1030)

Das Ziel sei dabei die „[…] Erarbeitung eines verbindlichen Begriffs der Benutzerfreundlichkeit zusammen mit einem standardisierten Operationalisierungskonzept mit dem Ziel der Erarbeitung und Erprobung von wörterbuchtypspezifischen Tests, die so zu geprüften Wörterbuchtests entwickelt werden, daß

Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre

277

jedes wichtige und neu erscheinende Wörterbuch hinsichtlich seiner Benutzerfreundlichkeit geprüft und öffentlich bewertet werden kann.“ (Wiegand 1998: 1030–31).

Abgesehen von der Frage, ob es inhaltlich sinnvoll und möglich wäre, eine so komplexe, von vielen Faktoren abhängige Frage wie den Erfolg einer Wörterbuchbenutzungshandlung überhaupt so generell zu operationalisieren (Lew 2011b: 3), zudem in einer Zeit, in dem diese Frage für jede neue mediale Aufbereitung neu gestellt werden müsste, ist es fraglich, ob diese zwei Aufgaben – Initiierung eines Großprojekts und Erarbeitung eines verbindlichen Begriffs der Benutzerfreundlichkeit – heute noch als vordringliche Aufgaben der Wörterbuchbenutzungsforschung zu gelten haben. Aus meiner Sicht haben sich die zentralen Aufgaben der Wörterbuchbenutzungsforschung etwas verschoben, und das hat nicht zuletzt mit der veränderten lexikographischen Landschaft zu tun. Der vorliegende Beitrag möchte daher die Aufgaben und die Relevanz der Wörterbuchbenutzungsforschung 20 Jahre nach Wiegands Kapitel zu „Stand und Aufgaben der Benutzungsforschung Mitte der 90er Jahre“ (Wiegand 1998: 1026–1031) neu reflektieren. Dafür wird in Kapitel zwei zunächst die Veränderung der lexikographischen Landschaft, v.a. in Deutschland, kurz skizziert, um dann im Hauptteil, dem dritten Kapitel, die Relevanz und Aufgaben der Wörterbuchbenutzungsforschung unter diesen veränderten Bedingungen aufzuzeigen. Der Artikel endet mit einem Resümee.

2 Die Veränderung der lexikographischen Landschaft seit Mitte der 1990er Jahre: eine kurze Skizze Seit Mitte der 90er Jahre, in denen Wiegand die Aufgaben der Wörterbuchbenutzungsforschung wie oben zitiert umrissen hat, hat sich die lexikographische Landschaft grundlegend verändert. Schon Mitte der 90er Jahre hatte der Computereinsatz v. a. die lexikographischen Prozesse stark modifiziert, und auch das Publizieren der Wörterbücher auf anderen Medien hatte bereits begonnen (vgl. u.a. Lehr 1996; Müller-Spitzer 2007). Noch viel maßgeblicher veränderte aber der Siegeszug des Internet und damit verbunden das Aufkommen kostenloser, nicht von renommierten Verlagen erstellter Wörterbücher die Wörterbuchlandschaft. Durch die Vielzahl an frei verfügbaren lexikographischen Inhalten im Netz, die zwar zum Teil qualitativ nicht mit den akademischen und den Verlagswörterbüchern mithalten konnten, die aber gleichzeitig sehr viele Nutzer fanden, brachen die Umsätze bei den gedruckten Wörterbüchern der Verlage ein. Dabei erwies es sich für die meisten Verlage als sehr schwierig, geeignete Modelle zu finden, digitale lexikographische Daten kostenpflichtig im Internet zu vermarkten. Die akademischen Wörterbücher wiederum brauchten sehr

278

Carolin Müller-Spitzer

lange, sich auf die veränderten medialen Bedingungen anzupassen. Bis heute sind aktuelle, wichtige Wörterbücher, wie zum Beispiel die Neubearbeitung des Grimmschen Wörterbuch1 (2DWB) nicht digital für Nutzerinnen verfügbar. Im Ergebnis sehen wir heute eine völlig veränderte lexikographische Landschaft. In Deutschland ist der Dudenverlag auf ein Bruchteil der alten Größe geschrumpft; eine Redaktion von wenigen Mitarbeitern hat nun die Aufgabe, alle Werke der DudenReihe aktuell zu halten. Tiefgreifende, dem Sprachwandel gerecht werdende und aktuellen Forschungsergebnissen Rechnung tragende Neubearbeitungen sind damit kaum möglich. Ähnlich sieht es bei Brockhaus-Wahrig und anderen Verlagen aus, d. h. die deutsche Verlagslexikographie in der bisher bekannten Qualität ist nicht mehr existent. Auch die akademische Lexikographie hat sich, wenn auch weniger stark, verändert. Gerade im Bereich der gegenwartsbezogenen Lexikographie hat sich mit dem Abschluss der Neubearbeitung des 2DWB und dem DWDS2 als Nachfolgeprojekt, das sich als lexikalisches System versteht, in dem Daten aus unterschiedlichen Ressourcen wie Korpora, bestehenden Wörterbüchern, lexikographischem Material aus Verlagen sowie neuen lexikographischen Bearbeitungen verbunden werden, eine deutliche Verschiebung vollzogen. Ein akademisches diachron ausgerichtetes Bedeutungswörterbuch gibt es in Deutschland nicht mehr. Auch der allgemeine Kosten- und Finanzierungsdruck macht dabei vor der wissenschaftlichen Wörterbuchlandschaft keinen Halt. Auch hier müssen genauere Nachweise darüber geführt werden, auf welche Dauer Projekte angelegt sind, ob mit einem (zumindest einigermaßen) pünktlichen Abschluss zu rechnen ist, ob die erarbeiteten Ressourcen auch genutzt werden etc. Dies alles ist nicht nur als eine negative Entwicklung zu bewerten, in allen diesen Veränderungen liegen wie immer auch Chancen. Aber, egal wie man sie sieht: Die gerade skizzierten Veränderungen sind unumkehrbar. Unter diesen Umständen ist es „[…] better to embrace a future that will come anyway, than to hang grimly on to a way of doing things whose time is passing“, wie Rundell es bezüglich des Entschlusses von Macmillan, keine gedruckten Wörterbücher mehr zu verlegen, ausdrückt.3 Im Rahmen dieser veränderten lexikographischen Landschaft gilt es jedoch mehr denn je, die begrenzten finanziellen und personellen Mittel sinnvoll einzusetzen. Genau dazu kann die Benutzungsforschung einen Beitrag leisten.  

1 http://www.uni-goettingen.de/de/118878.html und http://dwb.bbaw.de/neubearbeitung (zuletzt eingesehen am 17.7.2015). 2 www.dwds.de (zuletzt eingesehen am 17.7.2015). 3 Michael Rundell, Editor-in-chief, Macmillan Dictionaries, Euralex Mailing list, 6.11.12.

Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre

279

3 Relevanz und Aufgaben der Wörterbuchbenutzungsforschung in einer veränderten lexikographischen Landschaft Gerade in Zeiten knapper Ressourcen könnte man auf dem Standpunkt stehen, dass gerade nicht in die Erforschung der Benutzung lexikographischer Werke investiert werden sollte, sondern ausschließlich in die lexikographische Arbeit selbst. Trotzdem hat die Benutzungsforschung – sinnvollerweise wie ich finde – in den letzten Jahren immer mehr an Bedeutung gewonnen. Auch in der Wissenschaft werden der Nutzerbezug und Nutzerstatistiken vermehrt als wichtige Argumente für die Erarbeitung oder den Fortbestand bestimmter Wörterbücher herangezogen. Leider werden dieser Nutzerbezug und auch die Nutzungsstatistiken jedoch nicht immer durch seriöse empirische Daten fundiert. Nach wie vor ist es manches Mal der „bekannte Unbekannte“, dem recht phantasievoll bestimmte Nutzungsbedürfnisse und ein bestimmtes Nutzungsverhalten zugeschrieben wird. Wiegand sieht die zentrale Aufgabe der Benutzungsforschung darin, die lexikographische Praxis zu verbessern: „Der Sinn der Benutzungsforschung, ihr forschungslogischer Status und ihre Legitimation ergeben sich daraus, daß Wörterbücher erarbeitet werden, um die Praxis ihrer Benutzung zu ermöglichen, und daß daher wissenschaftliche Kenntnisse zu dieser kulturellen Praxis eine der Voraussetzungen u. a. dafür sind, daß neue Wörterbücher […] in dem Sinne benutzeradäquater sind, daß sie einen höheren Nutzungswert haben, wodurch sowohl die Voraussetzung für eine größere Benutzungseffizienz geschaffen wird als auch dafür, daß die Quote der erfolgreichen Benutzungshandlungen steigen kann.“ (Wiegand 1998: 259).

Viele aktuelle Wörterbuchbenutzungsstudien sind nach wie vor diesem Ziel verpflichtet. Dies ist auch sinnvoll, wenn die Aufgabe darin besteht, ein bestimmtes Wörterbuch zu verbessern. In Zeiten, in denen die Lexikographie aber selbst auf dem Prüfstand steht und es fraglich ist, in welchem Umfang fundierte lexikographische Arbeit weiter stattfindet, sehe ich die wichtigsten Aufgaben einer wissenschaftlich fundierten Wörterbuchbenutzungsforschung darüber hinaus aber auch in folgenden Bereichen, die sehr unterschiedlich breit und auch nicht alle neu sind: – Bewusstsein für den Nutzerbezug weiter zu schärfen – Nutzerstatistiken richtig einzuordnen und methodisch adäquat auszuwerten – hinter die Kulissen kollaborativer Wörterbücher zu schauen und über die dahinter liegenden Prozesse aufzuklären (u.a. weil kollaborative Wörterbücher teilweise als Ablösung der traditionellen Lexikographie angesehen werden) – Studien durchzuführen mit dem Ziel, die Effizienz lexikographischer Hilfsmittel gegenüber nicht-lexikographischen Hilfsmitteln zu untersuchen (und damit Kernbereiche für den Einsatz lexikographischer Hilfsmittel zu identifizieren).

280

Carolin Müller-Spitzer

Diese Bereiche sollen im Folgenden näher erläutert werden. Dabei beziehe ich mich ausschließlich auf die wissenschaftliche Lexikographie.

3.1 Bewusstsein für den Nutzerbezug schärfen Grundsätzlich sollte man – wie Wiegand (Wiegand et al. 2010: 99) – zwischen einer dokumentarisch ausgerichteten und einer benutzerorientierten Lexikographie unterscheiden. Für Wörterbücher, deren Hauptzweck es ist, ein geeignetes Hilfsmittel in Situationen zu sein, in denen kommunikativ oder kognitiv orientierte sprachliche Fragen oder Schwierigkeiten aufkommen, ist es mittlerweile unbestritten, dass der Nutzer im Zentrum aller konzeptionellen Überlegungen stehen sollte (Wiegand 1998: 259–260; Bogaards 2003: 26,33; Tarp 2008: 33–43). Für den dokumentarisch ausgerichteten Zweig der Lexikographie gilt die Benutzervoraussetzung nicht in gleicher Weise. Dies bedeutet auch, dass lexikographische Projekte, deren Hauptanliegen Sprachdokumentation ist, nicht in gleichem Umfang Benutzungsforschung betreiben müssen. Natürlich sollten auch diese Werke adressatengerecht sein, d. h. beispielsweise für Sprachhistoriker gut benutzbare Daten präsentieren, aber dies kann über allgemeinen fachlichen Austausch, Expertenbefragungen, Tagungsbesuche etc. sichergestellt werden. Auch sollte sorgfältig darauf geachtet werden, möglichst theorieunabhängig zu arbeiten und gleichzeitig die aktuelle Forschung so gut im Blick zu haben, dass man möglichst brauchbare Daten für künftige Forscherinnen dokumentiert. Bei Wörterbüchern, die Gebrauchsgegenstände sein sollen, d. h. die von bestimmten Menschen in bestimmten Situationen erfolgreich genutzt werden sollen, sieht das anders aus. Ob Wörterbuchbenutzungshandlungen mit diesem lexikographischen Hilfsmittel erfolgreich durchzuführen sind, ob man mit einem Wörterbuch den Erwartungen der Nutzerinnen entspricht, und ob Nutzer bisher unbekannte Funktionen sinnvoll einsetzen können, kann man empirisch erheben. Und dazu reicht es nicht, ein Wörterbuch auf einer Fachtagung vorzustellen und die Nachrichten von Nutzerinnen an die Wörterbuchredaktion zur Kenntnis zu nehmen, sondern dazu muss man „ins Feld gehen“. Nach wie vor gibt es jedoch große, auf lange Zeit angelegte Wörterbuchprojekte, die zu keiner Zeit systematisch erhoben haben, ob ihre lexikographische Konzeption tatsächlich in Bezug auf die anvisierten potentiellen Nutzer sinnvoll ist. Von diesen Projekten ließen sich zahlreiche aufzählen, sei es die Neubearbeitung des Grimmschen Wörterbuchs, die immerhin etwa fünf Jahrzehnte gedauert hat, sei es das Goethe-Wörterbuch4, das Deutsche Fremdwörterbuch5, und viele mehr. Breit angelegte empirische Studien hat es m. W. zu keinem dieser Großprojekte gegeben. Als Grund wird oftmals die mangelnde Zeit genannt. Dies entspricht sicher der Wahrheit: Auch  



4 http://www.uni-tuebingen.de/gwb/darstell.html (zuletzt eingesehen am 17.7.2015). 5 http://www.ids-mannheim.de/lexik/fremdwort.html (zuletzt eingesehen am 17.7.2015).

Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre

281

bei so lang angelegten Projekten müssen die einzelnen Lieferungen möglichst pünktlich vorliegen, sodass kaum die Möglichkeit besteht, eine solide empirische Studie, die Zeit braucht, in die alltägliche Arbeit zu integrieren. Trotzdem ist es meiner Meinung nach ein Fehler, v.a. in den oberen Entscheidungsebenen, nicht Sorge dafür zu tragen, dass genau das geschieht. Jedes lexikographische Projekt sollte sich entweder klar zur Sprachdokumentation bekennen (was selbstverständlich legitim ist), oder die Benutzbarkeit tatsächlich empirisch erheben. Es scheint mir nicht mehr angemessen, von „unseren Nutzern“ zu sprechen und dabei nur die zu meinen, die sich tatsächlich entweder auf Konferenzen oder durch Kontaktsuche an die Redaktion gemeldet haben. Am besten ist es dabei, Benutzungsforschung bereits vor Erscheinen eines Wörterbuches zu machen, damit die Erkenntnisse aus diesen Forschungen in die Schlusskonzeption des Wörterbuchs einfließen können. Die Benutzungsforschung hat zu dieser Bewusstseinsschärfung meinem Eindruck nach in den letzten Jahren einen wichtigen Beitrag geleistet, der aber – wie bereits gesagt – vor allem auf den Entscheidungsebenen noch mehr Anklang finden sollte. Ein weiteres Problem ist, dass gerade bei Onlinewörterbüchern oftmals allein die Nutzungsstatistiken als hinreichend betrachtet werden, um einen erfolgreichen Benutzerbezug nachweisen zu können. Dass solche Nutzungsstatistiken allerdings nicht zu naiv interpretiert werden sollten, ist ein weiteres Feld, auf dem die Benutzungsforschung Aufklärungsarbeit leisten sollte.

3.2 Nutzerstatistiken einordnen Die Anzahl von Klicks auf einer Webseite ist meist einer der ausschlaggebenden Faktoren dafür, wie teuer Werbeanzeigen auf der Seite verkauft werden können. Die Anzahl der Nutzerinnen, die auf einer Webseite landen, ist wiederum stark abhängig davon, wie sie von einer Suchmaschine gerankt wird. Suchmaschinenoptimierung, kurz: SEO (vgl. z.B. Enge et al. 2015), ist daher zu einem wichtigen Erfolgsfaktor für Webseiten geworden. Vor allem kommerzielle Anbieter müssen in diesem Bereich finanziell und personell viel investieren, um am Markt bestehen zu können. Bei wissenschaftlichen Projekten stellt sich das grundsätzlich anders dar, da man meist nicht von der Anzahl der Käufer (bei gedruckten Wörterbüchern) bzw. Nutzern abhängig ist. Trotzdem kommt es mehr und mehr in Mode, bei Projektevaluationen Zahlen vorzulegen bzw. vorlegen zu müssen, wie stark ein Wörterbuch genutzt wird. Dies liegt auch daran, dass diese Zahlen anscheinend so leicht zu erheben sind. Google selbst bietet natürlich Dienste dafür an: Erlaubt man Google Analytics6 beispielsweise Zugriff auf die Seite eines Onlinewörterbuchs, erhält man ohne Aufwand „professionelle Webanalysen“ (und den Verstoß gegen deutsches Datenschutzrecht gratis

6 http://www.google.com/intl/de_de/analytics/ (zuletzt eingesehen am 17.7.2015).

282

Carolin Müller-Spitzer

dazu). Diese zeigen die Zugriffe pro Tag, wieviel aktive Nutzerinnen gerade auf der Seite sind, welche Seiten sie vorher besucht haben etc. Viele Nutzer scheinen demnach dafür zu stehen, dass ein Wörterbuch regelmäßig von einer bestimmten Gruppe benutzt wird und daher eine feste Community hat. Steigert sich die Zahl dieser Nutzer, zeigt das eine wachsende Resonanz auf das Wörterbuch. Ist eine solche Schlussfolgerung so einfach zu ziehen? Daten müssen immer interpretiert werden. Wie der Paläoanthropologe Wolpoff es in einer Diskussion auf den Punkt brachte: “I have been in rooms with data and listened very carefully. The data never said a word.” (Wolpoff 1975: 15).

Das gleiche trifft auf Nutzungsstatistiken zu. Schaut man hinter die Kulissen solcher Nutzungsstatistiken (und lässt sie nicht durch ein kommerzielles Unternehmen durchführen), sieht man, dass eine Vielzahl interpretativer Schritte dabei stattfinden. Dies möchte ich hier kurz am Beispiel der Nutzungsstatistiken zu OWID7, einem Wörterbuchportal für wissenschaftliche lexikographische Ressourcen am IDS, erläutern. Die Logfiles, die auf dem Server alle Zugriffe auf die Seite protokollieren, sind zunächst eine ziemlich ungeordnete Menge von Protokollzeilen, wie der folgende Auszug zeigt: IP33 [11/May/2014:18:35:16 +0200] "GET /service/ccdbproxy?wort=Chlormonoxid HTTP/1.1" 200 110 IP15 [11/May/2014:18:35:17 +0200] "GET /nav/gehezu/TV?module=neo HTTP/1.1" 200 30614 IP15 [11/May/2014:18:35:29 +0200] "GET /suche/neo/erweitert HTTP/1.1" 200 24306 IP15 [11/May/2014:18:35:29 +0200] "GET /css/comp/forms.css HTTP/1.1" 200 1497 IP15 [11/May/2014:18:35:29 +0200] "GET /scripts/ErwFormHandler.js HTTP/1.1" 200 1820

Diese müssen, um sie sinnvoll auswerten zu können, zunächst einmal zu bestimmten Arten von Zugriffen gruppiert werden. Dies wird über Auswertungsskripte gemacht, in denen beispielsweise verschiedene URLs gruppiert werden, die für bestimmte erweiterte Suchen stehen, die Nutzerinnen in unserem Portal durchgeführt haben: def reqtype2conditionlist = [ 'erw. Suche': [ '^erweitert.jsp.*', '^suche/elex/.*', '^suche/komvb.*',

// Startseite wb.übergr. S. // erw. Suchen in elexiko // Komm.v.-Suche

7 www.owid.de (zuletzt eingesehen am 17.7.2015).

Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre

283

'^suche/neo/.*', // NEO-Suche '^suche/paraphrasen.*', // Bedeutungsparaphrasen '^para.jsp.*', // P.Bedeutungsparaphrasen '^suche/swwz/.*', // Volltextsuche in SWWZ '^service/suche/wb.*', // Wortbildungssuche '^service/suche/xpath.*' // EDAS-XPath-Suche ], … // weitere Suchtypen mit zugehörigen URL-Mustern ]

Nach solchen gruppierten Auswertungen kamen wir für das Jahr 2013 für OWID beispielsweise zu folgenden Zahlen: Wir konnten im Durchschnitt ca. 126.000 IDSexterne Zugriffe pro Monat auf www.owid.de zählen. Dabei haben wir automatische Crawler z. B. von Google von vorneherein von unserer Webseite auf bestimmten Gründen ausgeschlossen, d. h. diese greifen weniger häufig als üblich auf unsere Webseiten zu und machen daher nicht die große Masse an Zugriffen aus, wie es üblicherweise der Fall ist. Trotzdem reduziert sich diese Zahl an Zugriffen um fast 75%, wenn man versucht, nur inhaltliche Zugriffe zu zählen. Solche inhaltlichen Requests gab es 2013 im Durchschnitt 34.000 Mal im Monat. Für was stehen aber nun genau diese inhaltlichen Zugriffe? Unter diesen inhaltlichen Requests finden sich jegliche Nutzerinteraktionen auf unserer Seite, sei es der Aufruf einer Wortartikels, genauso aber auch das Auslösen einer Suche oder ein Klick auf einen Link. Rechnet man nur die Wortartikelansichten heraus, kommen wir im Durchschnitt auf etwa 5.400 Wortartikelansichten, wenn man unmittelbar wiederholte Zugriffe ignoriert (d. h. wenn jemand mehrmals hintereinander auf einen Link klickt, weil der Browser beispielsweise langsam lädt). Weiter können wir erheben, von wie vielen unterschiedlichen IP-Adressen („Unique Visitors“) diese Anfragen kommen (unter der Bedingung, dass man diese anonymisiert), und vieles mehr. Um nun zu klären, welche Nutzungsstatistik z. B. in Projektevaluationen einfließen sollen, sollte zunächst geklärt werden: Welche Art von Statistik ist interessant? Nur externe Zugriffe? Nur inhaltliche? Sollen Wortartikelaufrufe von anderen getrennt dokumentiert werden? etc. Diese Erläuterung soll nur deutlich machen: Um Nutzungsstatistiken richtig einordnen zu können, sollte man die interpretativen Schritte dahinter zumindest verstehen.8 Dies soll keinesfalls den Wert von Logfiles infrage stellen; aber genauso, wie  







8 Für den Kontext von Wikipedia zeigt dies z. B. ein Vortrag von Erik Zachte als ein Mitglied der Wikimedia Foundation sehr anschaulich. Er problematisiert dort selbst die Zahlen, die die Wikimedia Foundation üblicherweise an die Presse gibt: Erik Zachte, Wikistats: New Patterns (and some Old Metrics Nuanced). Presented at Wikimania London, on Aug 9, 2014, https://upload.wikimedia.org/ wikipedia/commons/f/f6/Wikistats_2014_Wikimania_London_Annotated.pdf (zuletzt eingesehen am 17.7.2015).  

284

Carolin Müller-Spitzer

es bei gedruckten wissenschaftlichen Wörterbüchern oft wichtiger war, ob die zentralen Fachbibliotheken das Werk bestellen oder nicht, können nicht alle in den Logfiles aufgezeichneten Zugriffe miteinander gleichgesetzt werden. Eine Diskussion, die in der wissenschaftlichen Lexikographie auf jeden Fall geführt werden sollte, ist daher, welchen Stellenwert welche Nutzungsstatistiken haben sollten. Die Benutzungsforschung kann hierbei v. a. methodische Aufklärungsarbeit leisten und versuchen, in den entsprechenden Kommissionen Problembewusstsein zu vertiefen. Daneben bieten Logfiles natürlich interessante Möglichkeiten für Studien, indem man beispielsweise untersuchen kann, ob frequente Wörter im Korpus auch häufig in einem allgemeinen einsprachigen Wörterbuch nachgeschlagen werden, oder ob polyseme Wörter häufiger nachgeschlagen werden als monoseme (MüllerSpitzer et al. 2015). Trotzdem gilt es immer zu bedenken, dass eben wenig bis gar nichts über den Kontext eines Zugriffs auf eine Webseite bekannt ist – zum einen aus prinzipiellen Gründen (d. h. dass man nicht weiß, was hinter einer IP steckt: eine Bibliothek, ein Kind, das am Rechner der Eltern spielt), zum anderen aus Datenschutzgründen. Man darf nach deutschem Datenschutzrecht beispielsweise nicht erheben, welche Webseiten Nutzer vorher und nachher besucht haben; und m. E. sollten öffentlich bezahlte Forscherinnen das auch respektieren, sodass die Bandbreite der Forschungsfragen, die man mit Logfiles untersuchen kann, begrenzt ist (vgl. z.B. Lew 2011a: 7).  

3.3 Hinter die Kulissen kollaborativer Wörterbücher schauen Eine ähnliche Aufklärungsarbeit wie bei den Nutzungsstatistiken ist m. E. bei den kollaborativen Wörterbüchern zu leisten. Für die meisten Sprachen ist das Wiktionary, das sprachlexikographische Pendant zur Wikipedia als Enzyklopädie, das wichtigste und am stärksten genutzte kollaborative Wörterbuch. Während anfangs Experten noch vermuteten, dass kein Laie beispielsweise ein Experte zum Wort Marmelade sei und deshalb wohl auch das Interesse, das Wiktionary kollaborativ mit Inhalten zu füllen, wesentlich kleiner sei als bei der Wikipedia, in der Expertinnen zu bestimmten Sachbereichen schreiben, scheint das Wiktionary zumindest zu den großen Sprachen immer umfangreicher und wichtiger zu werden. Da die Wikipedia tatsächlich zum Verschwinden der Verlags-Enzyklopädie in Deutschland geführt hat, stellt sich genauso die Frage, ob die kollaborativen Wörterbücher die traditionelle Lexikographie ablösen. Zwar kann das Wiktionary nach Meinung einiger Experten qualitativ nicht mit den von Lexikographinnen erarbeiteten mithalten (z.B. Hanks 2012); auf der anderen Seite scheint es auf die Mitarbeit und das Wissen vieler zurückgreifen zu können: “In contrast to traditional lexicons built by individual expert lexicographers, Wiktionary is collaboratively constructed by a large community of ordinary web users. To overcome the lack of

Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre

285

lexicographic experience in such a community, Wiktionary relies on the collective intelligence of many different authors – the ‚Wisdom of Crowds‘ phenomenon.” (Meyer/ Gurevych 2012: 271).

Doch wer genau ist diese „crowd“, die ihre Weisheit z. B. in das deutsche Wiktionary einfließen lässt? Die Wikimedia-Foundation – und das ist vorbildlich und ein Glücksfall für die Wissenschaft – veröffentlicht eine Vielzahl von Daten, nicht nur über ihre Inhalte, sondern auch die Logfiles mit allen Seitenzugriffen etc.9 Darüber hinaus kann man alle Überarbeitungen an Wiktionary-Artikeln entweder sukzessive über einen Datenstream verfolgen, oder über die Auswertung umfangreicher Protokolldateien nachvollziehen.10 Um also besser zu verstehen, wie viele Leute an der Er- und Überarbeitung des deutschen Wiktionary beteiligt sind, haben wir die Revisionen am deutschen Wiktionary über das Jahr 2014 hinweg beobachtet und ausgewertet.11 Um diese Revisionen in eine Ordnung zu bringen, haben wir zunächst automatische Prozesse von nicht-automatischen, d. h. menschlichen, Bearbeitungen getrennt. Diese unterschiedlichen Bearbeitungsarten sind in den Wiktionary-Logfiles gekennzeichnet. Gleichzeitig werden auch geringfügige von nicht-geringfügigen Bearbeitungen unterschieden. Diese müssen von den Wiktionary-Autorinnen selber in dieser Weise kategorisiert werden. Im Ergebnis zeigte sich, dass es insgesamt etwa 605.000 Revisionen von ca. 1.250 registrierten Nutzern gab (im Wiktionary werden die Autoren auch als Nutzer bezeichnet). Davon waren 140.658 Revisionen weder automatisch noch geringfügig, d. h. größere Eingriffe in Wörterbuchartikeln von menschlichen Nutzerinnen. Etwa 72% aller Revisionen wurden dagegen automatisch vorgenommen, entweder indem Inhalte aus Copyright-freien Wörterbüchern in das Wiktionary integriert oder automatische Konsistenzanpassungen durch sogenannte Bots vorgenommen wurden. Bei den menschlichen Bearbeitungen zeigte sich, dass die Anzahl der aktiven Wiktionary-Nutzer nahezu Zipf-verteilt ist, d. h. dass es sehr wenige sind, die aktiv in nennenswertem Umfang an diesem Wörterbuch schreiben.  







9 https://dumps.wikimedia.org/other/incr/ (zuletzt zugegriffen am 17.7.2015). 10 In diesen Protokolldateien befinden sich alle Zustände aller Seiten in der jeweiligen WikimediaRessource. Eine Protokolldatei vom Juni 2015 für das englische Wiktionary umfasst so bspw. 200 Gigabyte. Aus dieser Protokoll-Datei kann dann automatisiert jede Revision einer Seite seit Bestehen der Ressource extrahiert werden. 11 Siehe genauer Wolfer, Sascha, Müller-Spitzer, Carolin: How many people are a crowd? Quantitative analyses of revisions in the German and English Wiktionary Editions, erscheint.

286

Carolin Müller-Spitzer

Abb. 1: Wiktionary-Nutzer (i.S.v. von Autoren) nach Anzahl nicht geringfügiger Revisionen im deutschen Wiktionary 2014.

Dies entspricht laut Panciera et al. (2014) einem allgemeinen Muster in kollaborativen Unternehmungen: „In open communities, a small proportion of users produce a majority of the content and take on much of the required community maintenance work.“ (Panciera et al. 2014: 1)

Auch beim deutschen Wiktionary zeigt sich das: Die 30 aktivsten Nutzerinnen führten im Jahr 2014 89,3% aller nicht-automatischen, nicht-geringfügigen Revisionen durch. Die 60 aktivsten Nutzer führen bereits 96,5% aller nicht-automatischen, nicht-geringfügigen Revisionen durch. Wenn man sich diese Analysen anschaut, müsste deutlich werden: Eine inhaltliche Leistung, die deutlich über die bisherigen lexikographischen Werke hinausgeht, kann das deutsche Wiktionary nicht zeigen. Die wirklich aktiv arbeitenden Leute daran sind keine „crowd“, sondern eine Menge von etwa 30 Menschen, die ehrenamtlich an diesem frei verfügbaren Wörterbuch arbeiten. Es scheint sich somit hier nicht um ein vergleichbares „wisdom of crowds“-Phänomen wie bei der Wikipedia zu halten. Kann eine solche Menge tatsächlich auf breiter Ebene den Wortschatz besser dokumentieren als die verfügbaren Wörterbücher? Es ist ein offenes Geheimnis, dass viele lexiko-

Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre

287

graphische Inhalte im Wiktionary aus anderen Wörterbüchern stammen; diese werden auch in der Regel entsprechend kenntlich gemacht. Gleichzeitig führt das zurück zu den Nutzerstatistiken: Es ist denkbar, dass ein gutes lexikographisches Projekt Inhalte frei verfügbar im Netz publiziert und diese Inhalte sich in leicht veränderter Form im Wiktionary wiederfinden, die sicher dort in der Regel auch so kenntlich gemacht werden. Die Nutzer greifen jedoch dann auf das Wiktionary zu, weil ihnen diese Ressource bekannt ist. Im Sinne der Inhalte und der Adressaten, der Nutzer, muss das nicht schlecht sein. Die Statistik könnte dann nur zum Nachteil des wissenschaftlichen Wörterbuchs ausfallen – ein Argument mehr dafür, dass wissenschaftliche Wörterbücher nicht nur an der Anzahl der Zugriffe gemessen werden sollten. Auf Basis dieser Analysen kann man das Wiktionary m. E. besser einordnen. Das Wiktionary kann nur so gut sein wie die Wörterbücher, die auf dem Markt sind. Dementsprechend kann das Wiktionary inhaltlich nicht als Gefahr für die wissenschaftliche Lexikographie gesehen werden – im Gegenteil: Es ist mehr ein Argument für solide lexikographische Arbeit und sollte als Chance für einen zusätzlichen Verbreitungskanal wahrgenommen werden.

3.4 Effizienz lexikographischer Hilfsmittel untersuchen Heutzutage werden sehr viele sprachliche Fragen im Internet recherchiert – vielleicht oder sehr wahrscheinlich mehr, als es je Nachschlagehandlungen in gedruckten Wörterbüchern gab. Nicht immer werden dabei lexikographische Hilfsmittel genutzt. Es stellt sich daher die Frage, bei welchen dieser potentiellen Wörterbuchbenutzungssituationen es für Nutzerinnen effizienter wäre, lexikographische Ressourcen zur Beantwortung heranzuziehen, und bei welchen beispielsweise eine einfache Suchmaschinenanfrage reicht. Neben der Untersuchung aktueller Wörterbücher ist es daher für die Zukunft besonders wichtig, den Ausgangspunkt der Wörterbuchbenutzung nicht aus dem Auge verlieren, d. h. die Situationen, in denen sprachliche Schwierigkeiten aufkommen und aus denen heraus dann ein Nachschlagebedürfnis entsteht. Denn im Grunde muss man, wenn man mit der Benutzungsforschung dafür sorgen möchte, dass Wörterbücher besser den tatsächlichen Bedürfnissen entsprechen, genau bei diesen Nutzungsbedürfnissen anfangen. Theodore Levitt, ein US-amerikanischer Ökonom, schrieb in den 60er-Jahren einen einflussreichen Artikel mit dem Titel „Marketing Myopia“, in dem er genau auf diesen Aspekt hinweist: nämlich, dass es auch in der Industrie darum geht, sich nicht auf ein Produkt bzw. eine Produktart einzugrenzen, sondern sich auf den Zweck zu konzentrieren, für den dieses Produkt entwickelt wurde:  

“The railroads did not stop growing because the need for passenger and freight transportation declined. That grew. The railroads are in trouble today not because the need was filled by others (cars, trucks, airplanes, even telephones), but because it was not filled by the railroads them-

288

Carolin Müller-Spitzer

selves. They let others take customers away from them because they assumed themselves to be in the railroad business rather than in the transportation business. The reason they defined their industry wrong was because they were railroad-oriented instead of transportation-oriented; they were product-oriented instead of customer-oriented.” (Levitt 1960: 24).

Bezogen auf die Wörterbuchbenutzungsforschung könnte dies heißen, dass sie ihren Blick erweitern sollte: über die Untersuchung der Benutzung heute vorliegender Wörterbücher hinaus hin zu den sprachlichen Schwierigkeiten, in denen die Nachschlagebedürfnisse entstehen. Dabei bin ich wie auch Lew davon überzeugt, dass solche Untersuchungen nicht allein mit der Methode der „Deduktion“, d. h. mit der Befragung von Experten, zu bewältigen sind.  

“The studies […] here show over and over again that expert opinion, intuition, or purely deductive reasoning cannot replace solid empirical evidence from user studies: dictionary use is just too complex an affair to be that predictable.” (Lew 2011b: 3).

Eine Studie in dieser Art haben wir vor kurzer Zeit in Kooperation mit der Uni Mannheim durchgeführt.12 In dieser Studie sollte untersucht werden, ob der Einsatz von lexikographischen Hilfsmitteln bei der Textoptimierung in der Muttersprache hilfreich ist. Die Versuchsanordnung sah grob umrissen folgendermaßen aus: Alle Studierenden einer „Einführung in die Linguistik“-Vorlesung bekamen digital zwei Texte vorgelegt. Einer stammte von einer Schüler-Abschlussarbeit, der andere war ein Auszug aus einer Studienarbeit aus einem höheren Fachsemester. Beides waren authentische Texte, in denen verschiedene Lexik-, Satzbau- und Grammatikfehler vorkamen. Die Probanden (insgesamt 75) wurden nun auf drei Versuchsbedingungen aufgeteilt: In der ersten Bedingung wurde nur der Text gezeigt mit der Aufforderung, Fehler in den Texten zu korrigieren. In der zweiten Bedingung wurden die Fehler gelb markiert. Die Aufforderung lautete auch hier, die Fehler nach Möglichkeit zu korrigieren. In der dritten Versuchsbedingung wurden nicht nur die Fehler gelb markiert, sondern es wurden zusätzlich lexikographische Hilfsmittel angezeigt, mit deren Hilfe die Fehler zu korrigieren waren. Nachdem die Studierenden unter den jeweiligen Bedingungen die Texte bearbeitet hatten, wurden die Daten annotiert u. a. danach, ob an den als Fehler eingeordneten Textstellen Veränderungen vorgenommen wurden, und ob diese Veränderungen als Verbesserungen angesehen werden können (oder als Verschlechterungen oder sogar Sinnentstellungen). Die Studie war u. a. gedacht als eine Pilotstudie zu einer Art ‚intelligenten Schreibumgebung‘. Das Ziel war zu untersuchen, ob es hinreichend ist, in einer solchen Schreibumgebung Fehler in Texten zu markieren, oder ob es tatsächlich einen erheblichen Vorteil bringt, wenn man zusätzlich passende lexikographische Hilfsmittel in integrieren würde. Darüber hinaus können mit dieser Studie empirische Daten dazu  



12 Die Studie wird umfassend beschrieben in Wolfer et al.: The effectiveness of lexicographic tools for optimising written L1-texts [erscheint].

Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre

289

gewonnen werden, wie effizient der Einsatz von Hilfsmitteln bei der Textoptimierung in der Muttersprache ist. Es zeigte sich im Ergebnis, dass der Einsatz von Hilfsmitteln tatsächlich effizient für die Textoptimierung in dem von uns untersuchten Szenario war. Zum einen werden mit dem Einsatz der Hilfsmittel mehr Fehler (in unserer Studie als „Stolpersteine“ bezeichnet) verändert und v. a. verbessert (siehe Abb. 2). Dies muss aber nicht unbedingt effizient sein, wenn man dafür gleichzeitig länger braucht, um einen Text mithilfe lexikographischer Hilfsmittel zu verbessern; denn Leistung kann bekanntlich als Quotient aus Arbeit und der dafür benötigten Zeit aufgefasst werden. Die Versuchsteilnehmer in der Hilfsmittel-Versuchsbedingung brauchten tatsächlich am längsten (im Schnitt 31 Minuten gegenüber 27 in der Markierungs- bzw. 25 Minuten in der Nur-TextBedingung). Doch selbst unter Einbeziehung dieses zeitlichen Aspekts zeigte sich, dass die Probanden in der Hilfsmittelbedingung am effizientesten arbeiten konnten. Wenn man einen Messwert (Anzahl von Verbesserungen minus die Anzahl von Verschlechterungen und Sinnentstellungen) pro Minute ausrechnet, erreichen Personen in der Hilfsmittelbedingung 0,62 Punkte pro Bearbeitungsminute im Vergleich zu 0,46 Punkten in der Markierungs- und 0,19 Punkten in der Nur-Text-Bedingung (vgl. Abb. 3). In dieser Studie zeigte sich damit überraschend deutlich, dass der Einsatz von lexikographischen Ressourcen bei der Überarbeitung von Texten sehr sinnvoll ist.  

Abb. 2: Ergebnisse der Pilotstudie zum Einsatz von lexikographischen Hilfsmitteln bei der Textoptimierung: Anzahl der Stolpersteine, die pro VersuchsteilnehmerInnen verändert und verbessert wurden.

290

Carolin Müller-Spitzer

Abb. 3: Ergebnisse der Pilotstudie zum Einsatz von lexikographischen Hilfsmitteln bei der Textoptimierung: Leistung pro VersuchsteilnehmerInnen pro Bearbeitungsminute (Anzahl von Verbesserungen minus die Anzahl von Verschlechterungen und Sinnentstellungen in einer Minute).

Solche Studien sind meiner Ansicht nach eine empirische Grundlage dafür, für welche Bereiche oder Aufgaben der Einsatz lexikographischer Hilfsmittel nachweislich effizient ist. Die o. g. Ergebnisse sind somit wiederum eine gute Argumentationsgrundlage für gute Wörterbücher. Sie zeigen aber auch, wie wichtig es ist, die Wörterbücher zu den Nutzerinnen zu bringen – eine Aufgabe, bei der wir sicher eher am Anfang stehen. Solche Ergebnisse ernst zu nehmen bedeutet im Umkehrschluss aber auch, unliebsame Ergebnisse genauso konsequent anzunehmen. Sollte sich z. B. für bestimmte sprachliche Fragen in bestimmten Situationen zeigen, dass eine Korpusrecherche genauso effizient ist wie die Zuhilfenahme von lexikographischen Hilfsmitteln, würde dies natürlich auch bedeuten, dass genau für solche Situationen nicht unbedingt Wörterbücher erarbeitet werden müssten. Dies ist das „Problem“ an empirischen Daten: Solide empirische Arbeit bedeutet auch, sich nicht nur die Daten herauszupicken, die die eigenen Forschungsziele untermauern, sondern auch eigene Ziele zu revidieren, wenn es nötig ist.  



Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre

291

4 Resümee Mitte der 2010er Jahre ist es um die Sprachlexikographie in Deutschland inhaltlich weniger gut bestellt als Mitte der 90er Jahre. Dagegen sind die Möglichkeiten, lexikographische Inhalte andersartig und flexibler zu präsentieren, viel größer. Auch für die Benutzungsforschung eröffnen sich ganz neue Möglichkeiten der Datenerhebung. Wenn die Mittel für die lexikographische Arbeit immer begrenzter werden, wird sicherlich kein nationales Projekt zur Benutzungsforschung ins Leben gerufen, wie es Wiegand vorschwebte. Es scheint mir unter den gegebenen Umständen sinnvoller, eine Art Forschungsschwerpunkt zu etablieren, an den sich interessierte Forscherinnen wenden können, wenn sie empirische Wörterbuchbenutzungsstudien machen wollen. Nicht in jeder Arbeitsstelle kann gerade das methodische Know-how vorhanden sein, gute empirische Wörterbuchbenutzungsstudien durchzuführen. Genau dies haben wir am IDS versucht und zumindest in Grundzügen erreicht, wie nationale und internationale Kooperationsanfragen zeigen. Insgesamt ist Benutzungsforschung heute sinnvoller denn je. Man sollte in Zeiten knapper Ressourcen genau untersuchen, worauf diese Ressourcen konzentriert werden sollen, und auch aufklären bezüglich des naiven Umgangs von Nutzungsstatistiken sowie über Mythen kollaborativer Wörterbücher. Die Benutzungsforschung kann damit Argumente für das Fortbestehen qualitativ hochwertiger Arbeit liefern; allerdings kann sie auch unliebsame Wahrheiten zutage fördern. Die wissenschaftliche Lexikographie muss sich damit auch deutlicher positionieren: Will sie v. a. Sprachdokumentation leisten? Dann muss sie nicht den bekannten Unbekannten heranziehen, der das Wörterbuch in Situation x auf Weise y braucht, sondern kann sich klar diesem Ziel verpflichten. Soll ein Wörterbuch aber wirklich dazu da sein, in bestimmten sprachlichen Alltagssituationen benutzt zu werden, muss dies auch erforscht werden. Dann reicht es nicht, einen Relaunch einer Webseite eines Onlinewörterbuchs zu machen und diese zugrunde liegenden Entscheidungen aus der Innensicht des Teams zu begründen, sondern dann muss man solide und dementsprechend „mühsame“ empirische Arbeit machen, um hinreichend belastbare Daten zu erhalten. Dies ist viel aufwendiger, als allgemein angenommen wird, und benötigt in der Regel Kompetenzen aus unterschiedlichen Disziplinen. Gute Kenntnisse in sozialwissenschaftlicher Methodik und Datenanalyse sind für die Entwicklung einer guten Wörterbuchbenutzungsstudie notwendig. In der linguistischen Lehre werden diese Kompetenzen selten vermittelt. Insofern ist es oftmals eine Überforderung von Studierenden, wenn sie in eine Forschungsarbeit eine empirische Studie einbauen sollen, es sei denn sie haben ein zweites Standbein z. B. in den Sozialwissenschaften, der Psychologie oder Kognitionswissenschaft. Ganz allgemein gilt: Schlecht gemachte empirische Erhebungen sind Zeit- und Ressourcenverschwendung, da die darin erhobenen Daten nicht belastbar sind. Was wir brauchen, sind lieber kleinere, aber gut gemachte Erhebungen, die handwerklich sauber durchgeführt und fundiert analysiert werden.  

292

Carolin Müller-Spitzer

Wichtig scheint mir auch, dass die Wörterbuchbenutzungsforschung, wenn sie sich mehr auf die Ausgangspunkte der Wörterbuchbenutzung konzentriert (wie im letzten Abschnitt beschrieben), auch wieder mehr Berührungspunkte zu anderen linguistischen Forschungsfeldern bekommt, z. B. zu Fragen der Textproduktion, der Textoptimierung und des Textverstehens sowie auch zu Fragen der Sprachreflexion. In einer Analyse zu auffällig häufig nachgeschlagenen Wörtern im deutschen Wiktionary auf Basis von Logfiles stellten wir beispielsweise fest, dass das Wort larmoyant zu einer bestimmten Stunde im Jahr 2013 auffällig oft nachgeschlagen wurde. Die Spurensuche ergab, dass der Kommentator eines Spiels der deutschen Fußball-Nationalmannschaft (am 6.2.2013) bemerkte: „Der [Joachim Löw] ist jetzt aber richtig sauer. Das ist ihm ein bisschen zu larmoyant …“.13 Dies wiederum führte noch innerhalb derselben Stunde (und nur dieser) zu einem statistisch auffälligen Anstieg in der Abfrage dieses Stichworts. Das bedeutet, dass nicht wenige Menschen beim Schauen eines Fußballspiels sich die Mühe machen, die Bedeutung eines Wortes direkt nachzuschlagen, wenn sie es nicht genau verstehen. Solche Ergebnisse sind damit auch in Bezug auf Sprachreflexion oder Mediennutzung bei sprachlichen Fragen (die Nutzer werden in dem Moment kaum am Desktop-PC im Büro gesessen haben) interessant. Auf diese Weise kann die Wörterbuchbenutzungsforschung Geschichten entdecken oder Daten gewinnen, die auch für andere sprachwissenschaftlichen Bereiche relevant sein können.  

5 Literatur Bogaards, Paul (2003): Uses and users of dictionaries. In Piet van Sterkenburg (ed.), A Practical Guide to Lexikography. Amsterdam/Philadelphia: John Benjamins Publishing Company, 26–33. Bowker, Lynne (2012): Meeting the needs of translators in the age of e- lexicography: Exploring the possibilities. In Sylviane Granger & Magali Paquot (eds.): Electronic lexicography. Oxford: Oxford University Press, 379–397. Dziemanko, Anna (2012): On the use(fulness) of paper and electronic dictionaries. In: Electronic lexicography. Oxford: Oxford University Press, 320–341. Enge, Eric/Spencer, Stephan/Stricchiola, Jessie C./Fishkin, Rand (2015): The Art of SEO. 3 rev ed. Beijing/Köln: O’Reilly. Hanks, Patrick. 2012. Corpus evidence and electronic lexicography. In: Sylviane Granger/Magali Paquot (eds.): Electronic lexicography. Oxford: Oxford University Press, 57–82. Hanks, Patrick (2012): Corpus evidence and electronic lexicography. In: Sylviane Granger & Magali Paquot (eds.): Electronic lexicography. Oxford: Oxford University Press, 57–82. Koplenig, Alexander (2014): Empirical research into dictionary use A brief guide. In: Carolin MüllerSpitzer (ed.): Using Online Dictionaries. Berlin. Boston: Walter de Gruyter, 55–76.

13 Leider können hierzu keine frei zugänglichen Nachweise gegeben werden. Die Sportschau-Redaktion war so freundlich, uns einen DVD-Mitschnitt dieses Spiels zuzusenden.

Aufgaben und Relevanz der Wörterbuchbenutzungsforschung Mitte der 2010er Jahre

293

Lehr, Andrea (1996): Zur neuen Lexicographica-Rubrik „Electronic dictionaries“. In: Lexicographica 12, 310–317. Levitt, Theodore (1960): Marketing Myopia 38, 24–47 (Harvard Business Review). Lew, R., M. Grzelak/M. Leszkowicz (2014): How Dictionary Users Choose Senses in Bilingual Dictionary Entries: An Eye-Tracking Study. In: Lexikos 23(1), 228–254. (doi:10.4314/lex.v23i1). Lew, Robert (2010): Users Take Shortcuts: Navigating Dictionary Entries. In: Anne Dykstra/Tanneke Schoonheim (eds.): Proceedings of the XIV Euralex International Congress. Ljouwert: Afûk, 1121– 1132. Lew, Robert (2011a): User studies: Opportunities and limitations. In: Kaoru Akasu/Uchida Satoru (eds.): ASIALEX 2011 Proceedings Lexicography: Theoretical and practical perspectives. Kyoto: Asian Association for Lexicography, 7–16. Lew, Robert. 2011b. Studies in Dictionary Use: Recent Developments. In: International Journal of Lexicography 24(1), 1–4. Lew, Robert. 2015. Research into the use of online dictionaries. In: International Journal of Lexicography 28(2), 232–253. Lew, R./P. Tokarek (2010): Entry menus in bilingual electronic dictionaries. eLexicography in the 21st century: New challenges, new applications. Louvain-la-Neuve: Cahiers du CENTAL, 145–146. Meyer, Christian M./Iryna Gurevych (2012): Wiktionary: A new rival for expert-built lexicons? Exploring the possibilities of collaborative lexicography. In: Sylviane Granger/Magali Paquot (eds.): Electronic lexicography. Oxford: Oxford University Press, 259–291. Müller-Spitzer, Carolin (2007): Der lexikografische Prozess: Konzeption für die Modellierung der Datenbasis. Narr Francke: Attempto. Müller-Spitzer, Carolin (2014): Empirical data on contexts of dictionary use. In: Carolin Müller-Spitzer (ed.): Using Online Dictionaries. Berlin. Boston: Walter de Gruyter, 85–126. Müller-Spitzer, Carolin/Sascha Wolfer/Alexander Koplenig (2015): Observing Online Dictionary Users: Studies Using Wiktionary Log Files. In: International Journal of Lexicography 28(1), 1–26. (doi:10.1093/ijl/ecu029). Panciera, Katherine, Mikhil Masli/Loren Terveen (2014): Crème de la crème. Elite contributors in an online community. In: Proceedings of the 10th International Symposium on Open Collaboration (OpenSym 2014). New York: ACM, 1–10. [http://www.opensym.org/os2014/proceedings-files/ p500.pdf.]. Rundell, Michael (2012): It works in practice but will it work in theory? The uneasy relationship between lexicography and matters theoretical. In: Julie Matilde Torjusen/Ruth Vatvedt Fjeld (eds.): Proceedings of the 15th EURALEX International Congress 2012, Oslo/Norway, 7–11 August 2012. Oslo. [http://www.euralex.org/elx_proceedings/Euralex2012/pp47-92%20Rundell.pdf.]. Tarp, S. (2008): Lexicography in the borderland between knowledge and non-knowledge: general lexicographical theory with particular focus on learner’s lexicography. Tübingen: Max Niemeyer. Töpel, Antje (2014): Review of research into the use of electronic dictionaries. In: Carolin MüllerSpitzer (ed.): Using online dictionaries, 13–54. Welker, Herbert Andreas (2010): Dictionary use: a general survey of empirical studies. Brasília: Eigenverlag. Wiegand, Herbert Ernst (1977): Nachdenken über Wörterbücher: Aktuelle Probleme. In: Helmut Drosdowski/Helmut Henne/Herbert Wiegand (eds.): Nachdenken über Wörterbücher. Mannheim 1977, 51–102. Wiegand, Herbert Ernst (1998): Wörterbuchforschung: Untersuchungen zur Wörterbuchbenutzung, zur Theorie, Geschichte, Kritik und Automatisierung der Lexikographie. Berlin [usw.]: Walter de Gruyter. Wiegand, Herbert Ernst/Michael Beißwenger/Rufus H. Gouws/Matthias Kammerer/Angelika Storrer/ Werner Wolski (2010) = Wörterbuch zur Lexikographie und Wörterbuchforschung.Mit englischen

294

Carolin Müller-Spitzer

Übersetzungen der Umtexte und Definitionen sowie Äquivalenten in neuen Sprachen. Band 1: A–C. Berlin. New York: Walter de Gruyter. Wolpoff, Milford H. (1975): Discussion. In: Russell H. Tuttle (ed.): Paleoanthropology. Berlin. New York: Walter de Gruyter Mouton, 15–18.

Stefan J. Schierholz

Einige kurze Überlegungen zur Metalexikographie in der Lehre Abstract: In this article some general considerations on metalexicography, dictionary research, and lexicography are presented and a few possibilities to teach this in Master study programs are shown. Keywords: Metalexicography, Dictionary Research, Lexicography, Theory, European Master in Lexicography Schlagwörter: Metalexikographie, Wörterbuchforschung, Lexikographie, Theorie, Europäischer Master für Lexikographie

1 Einleitung Im Folgenden werden sechs kurze Kapitel vorgestellt, die zum Nachdenken über das wissenschaftliche Gebäude der Metalexikographie sowie deren Einsatz in der Lehre anregen sollen. In der Metalexikographie liegen verschiedene Theorien, Modelle, Teiltheorien, Quasitheorien, Theorieelemente u.ä. vor. Im Allgemeinen sind diese den Arbeiten zur Funktionslehre (vgl. u.a. Bergenholtz/Tarp 2002, Tarp 2008, 2009, 2013, 2014), der „Art and Craft Theory“ von Landau (1989) sowie den Arbeiten von Herbert Ernst Wiegand zuzuordnen. Die Funktionslehre setzt den Benutzerbezug und die Benutzungsinteressen in den Mittelpunkt ihrer Forschungsbemühungen. Diese Vorrangigkeit ist berechtigt, aber die Theoriehaftigkeit und die fehlende Vollständigkeit der Funktionslehre wird auch kritisiert (vgl. u.a. Swanepoel 2015, Schierholz im Druck). Die „Art and Craft-Theorie“ ist vor allem ein Handbuch mit Instruktionen zur praktischen Lexikographie. Es handelt sich um eine metalexikographische Arbeit, weil die praktischen Prozesse beschrieben, erläutert und in ihren strukturellen Beziehungen erfasst werden. Dies erfolgt auf einer relativ niedrigen Abstraktionsebene, so dass man aus wissenschaftstheoretischer Perspektive nicht von einer Theorie sprechen kann. Dies gilt insbesondere mit Blick auf die Auffassung zur Theoriebildung

Stefan J. Schierholz: Department Germanistik und Komparatistik. Friedrich-Alexander-Universität Erlangen-Nürnberg, Bismarckstr. 1, 91054 Erlangen, email: [email protected]

296

Stefan J. Schierholz

und Grundlagenforschung in Deutschland, die erfahrungsgemäß auf einem hohen abstrakten Niveau angesiedelt ist. Am weitesten ist die Theorie von Herbert Ernst Wiegand ausgebaut, die im Folgenden betrachtet werden soll. Es soll somit nicht versucht werden zu klären, welcher Ansatz der drei Ansätze am wertvollsten ist, welcher am weitesten ausgebaut ist, welcher am besten verständlich ist, welcher stringent argumentativ aufgebaut ist, welcher gegenüber wissenschaftstheoretischen Überprüfungen am widerstandsfähigsten ist oder welcher sich für welche Zwecke effektiv verwenden oder ausbauen lässt. Eine solche Diskussion würde sehr schnell zu einer umfangreichen Streit- und Grundsatzdiskussion führen. Ebenso soll hier nicht der Frage nachgegangen werden, welcher der drei Ansätze für die Lehre am besten geeignet sein könnte. Wenn also die Fragestellung dahingehend eingegrenzt wird, dass es hier nur um die Wiegand-Theorie gehen soll, und zwar um die Wiegand-Theorie in der Lehre, dann kann aber auch an diesem Punkt nicht ohne Weiteres fortgefahren werden; denn wollte man diese Fragestellung in der Gründlichkeit beantworten, wie man es von Herbert Ernst Wiegand aus seinen Publikationen gewohnt ist, müsste zuerst seine Theorie zusammenfassend referiert werden. Das allerdings würde den Rahmen dieses Beitrags sprengen. Zwar findet man mit der „Systematische(n) Einführung“ im WLWF (2010: 3–121) eine sehr gelungene didaktisch aufbereitete Zusammenfassung der Wiegand-Theorie; aber auch damit lassen sich nicht die hier zu behandelnden Fragen, die wichtige Voraussetzungen und Bestandteile der Wiegand-Theorie betreffen, beantworten.

2 Kritik aus der falschen Ecke Bevor mit einer sehr knappen Zusammenstellung ausgewählter grundlegender Bausteine der Wiegand-Theorie begonnen wird, sei daran erinnert, dass die Theorie auch allerlei Kritik ausgesetzt ist. So werden die scholastische Arbeitsweise, die übertriebene Granularität, die Nicht-Verstehbarkeit, die Verwendung und Kreierung terminologischer Monster, die Nichtübersetzbarkeit in andere Sprachen, die Beengung auf die Printlexikographie, die Abstraktheit u.v.m. bemängelt. Meist erfolgt das übrigens im mündlichen Diskurs und nicht in der schriftlichen wissenschaftlichen Auseinandersetzung. Eine Ausnahme macht da Michael Rundell (2012: 52ff.), der in einem Plenarvortrag zur EURALEX die übertriebene Granularität und damit einhergehende Unübersichtlichkeit kritisiert, mit der Wiegand die in Wörterbuchartikeln enthaltenen Mikrostrukturen mit Hilfe von Strukturgraphen darstellt. Rundell zieht letztlich daraus den Schluss, eine Theorie, zumindest diese Theorie, sei überflüssig, unverständlich und für die Lexikographie keinen Nutzen bringend. Rundell macht das u.a. anhand der Abbildung 1 zum semantischen Kommentar aus Wiegand (1999: 210) fest.

Einige kurze Überlegungen zur Metalexikographie in der Lehre

297

Abb. 1: Semantischer Kommentar (Wiegand 1999: 210 nach Rundell 2012:54).

Die Abbildung 1 enthält eine geringe Tiefe in Bezug auf ihre hierarchische Struktur und eine mittlere Komplexität in Bezug auf die Menge der dort abgebildeten Knoten. In der Metalexikographie ist man aus der Wiegand-Theorie andere Komplexitätsgrade gewohnt, wie z.B. anhand von Abbildung 2 aus Gouws/Wiegand (2011) demonstriert. Hier geht es um den zweiten Teil der „abstrakten hierarchischen vertikalarchitektonisch ausgebauten nichtüberdacht vorne linkserweiterten einfach komplexen reinen Artikelmikrostruktur“. Zwar ist das auch für erfahrene Metalexikographen eine relativ lange Abbildungsüberschrift, aber da alle Elemente in der Legende erklärt sind, ist es durchaus möglich, den Strukturgraphen zu verstehen und zu interpretieren. Abbildung 1 hingegen enthält einen übersichtlichen Strukturgraphen, so dass man sich nach dem Studium der Rundellschen Kritik fragt, ob nicht derjenige, der die Kritik übt, einfach nur überfordert ist, Theorie zu verstehen. Allerdings kann man aus der Gegenüberstellung und der Kritik auch folgern, dass bei der Verwendung komplexer Abbildungen – gleiches gilt natürlich für die Gegenstandsbereiche selbst und die Formulierungen im laufenden Text – in besonderer Weise die intendierten Adressaten zu berücksichtigen sind. In einem Fachtext in Lexicographica, Lexicographica Series Maior oder Lexikos wendet sich der Autor an die Experten des Fachs und da darf, soll und muss man gerne so theoretisch sein, wie man selbst kann und will bzw. wie es die Fragestellung und das Thema verlangen. Das ist eine gute deutsche Wissenschaftstradition, wie sie seit Leibniz, Humboldt, Schelling, Schleiermacher, Gadamer u.a. gepflegt wird. In anderen Wissenschaftskulturen mag es weniger abstrakt zugehen, jedoch waren die Resultate wissenschaftlicher Erkenntnisse mit einem hohen Abstraktionsgrad und oftmals in deutscher Sprache im 18., 19. und 20. Jahrhundert nicht selten wegweisend, so dass man davon in der Lexikographie und Wörterbuchforschung nicht abgehen muss. Dies betrifft in ganz besonderer Weise Arbeiten zur Grundlagenforschung, und dahin gehört auch die Wiegand-Theorie.

Abb. 2: […] Nicht vollständig ausgeführter einfach kommentierter und architektonisch angereicherter Strukturgraph zur abstrakten (und isomorphen konkreten) hierarchischen hybrid vertikalarchitektonisch ausgebauten nichtüberdacht vorne linkserweiterten einfach komplexen reinen Artikelmikrostruktur, die zum Typ des teilartikelextern vorne links binnenerweiterten Substantiv-Verb-Artikel gehört, wie wa16 in Abb. 2. Abkürzungen: PA.üd = Polysemieangabe (als Teil eines n-Polysemieangabentupels mit n > 2; PragsemA.üd = überdachte pragmatisch-semantische Angabe; KBeiA.üd = überdachte Kompetenzbeispielangabe; A-pragNM.üd = überdachte Angabe zur pragmatischen Nullmarkierung; v.BPA.üd = überdachte verdichtete Bedeutungsparaphrasenangabe; Mark.diat.üd = überdachte diatechnische Markierungsangabe; FK.üd = überdachter Formkommentar; RA-VF.üd = überdachte Rechtschreibangabe für Vergangenheitsformen; v.RekA.s.ang.üd = überdachte semantisch angereicherte verdichtete Rektionsangabe.

298 Stefan J. Schierholz

Einige kurze Überlegungen zur Metalexikographie in der Lehre

299

3 Die Benennung der Theorie Die Wiegand-Theorie wird von ihm selbst als „Allgemeine Theorie der Lexikographie“ bezeichnet (Wiegand 1998: 4f. sowie im Vorwort; WLWF 2010: 6). Die Namensvergabe geschieht allerdings eher beiläufig; denn diese Bezeichnung findet sich nur in den „Vorbetrachtungen“ des 1162 Seiten umfassenden Werks und ist auch nicht im Titel dieses umfangreichsten Einzelwerks zur lexikographischen Forschung enthalten, welches bekanntlich „Wörterbuchforschung“ heißt. Auch in der „Systematische(n) Einführung“ im WLWF, die ja eine Einführung in die „Lexikographie und Wörterbuchforschung“ ist, wird „Allgemeine Theorie der Lexikographie“ nur ein einziges Mal (2010: 6) genannt. Es ist auch kein Terminus einer Theorie, sondern eher eine Paraphrase, die vielleicht zutreffend, aber wenig charakteristisch für den Gegenstand ist, um den es geht. Man stelle sich vor, ein Grammatikexperte würde seine Grammatik eine „Allgemeine Theorie der Grammatik“ nennen. Das wäre wenig aussagekräftig in Bezug auf den Inhalt oder den Grammatiktyp, um den es dort geht. Vorteilhaft ist es, wenn bereits im Titel mindestens ein Attribut enthalten ist, das sich auf die theoretischen Annahmen, auf grundlegende Theorieelemente, die Methodologie oder auf Ergebnisse bezieht. Dies würde den Erkenntniswert und den Identifikationsgrad der Theorie erhöhen. Für die „Allgemeine Theorie der Lexikographie“ Herbert Ernst Wiegands soll unter Berücksichtigung des Gegenstands, der Form und des Aufbaus seiner Theorie vorgeschlagen werden, von der „Systematischen Empirischen Metalexikographie“1 mit der Abkürzung „S.E.M.“ zu sprechen, weil damit die Vorgehensweise erfasst wird, wie theoretische Elemente und Teiltheorien von Wiegand aufgebaut und zueinander in Beziehung gesetzt werden. Der mögliche Einwand, jede Theorie sei systematisch und empirisch, trifft hier nicht; denn zum einen müsste es präziser heißen, jede Theorie soll systematisch und empirisch sein, und zum anderen geht es hier gerade darum, die hohe Intensität, mit der systematisch und empirisch gearbeitet wird, hervorzuheben. Wiegands Vorgehensweise ist nämlich streng systematisch und auch empirisch fundiert; denn alle Strukturen, die man bei Wiegand findet, basieren auf empirischen Daten aus Wörterbüchern und sind Schritt für Schritt in allgemeine und zunehmend abstrakte Strukturen und Konzepte überführt, indem die Theorie auf der Basis mengentheoretischer Grundlagen und mit Hilfe der mathematischen Theorie von Boubarki (1957) aufgebaut wird. Damit ist zum einen der Einsatz einer induktiven Vorgehensweise skizziert; es gibt aber auch den Einsatz der deduktiven Methodik, vor allem dann, wenn Wiegand grundlegende Theorieelemente erarbeitet, begründet, terminologisch setzt und an-

1 Rufus H. Gouws war in mehreren Diskussionen bei der Suche nach einem passenden Terminus beteiligt.

300

Stefan J. Schierholz

schließend bis auf die konkrete Ebene, die lexikographische Angabe oder den Wörterbuchartikel, hin in höchster Granularität ausgestaltet.

4 Lexikographie Für den Umgang mit der Metalexikographie sind einige grundlegende terminologische Entscheidungen zu akzeptieren, die sich in der bisherigen Theoriebildung, aber auch in der Lehre als vernünftig erwiesen und zur Klärung des komplexen Sachverhalts beigetragen haben. Danach ist eine definitorische Klärung von (1) Lexikographie, (2) Wörterbuch und (3) Metalexikographie erforderlich. Unter Lexikographie ist eine eigenständige kulturelle Praxis zu verstehen, mit der Wörterbücher erstellt werden, und die darauf ausgerichtet ist, den Gebrauch dieser Wörterbücher zu ermöglichen (WLWF 2010: 3). Lexikographie gibt es überall auf der Welt, ist in nahezu jeder Sprache zu finden, zumindest in den Sprachen, in denen die lateinische Schrift verwendet wird und die einen historischen Hintergrund aufweisen. Lexikographie findet sich in verschiedenen Wörterbuchtypen, z.B. zweisprachige, historische, enzyklopädische Wörterbücher, Sprachwörterbücher, Sachwörterbücher, Fachwörterbücher, Spezialwörterbücher. Zur Lexikographie gehört der Theoriebereich der Metalexikographie, und in Wiegand (1998) wird Lexikographie in der Regel als Sprachlexikographie aufgefasst. Wenn man Lexikographie grundsätzlich als praktische Lexikographie auffasst, so ist dieser Terminus verhältnismäßig übersichtlich definierbar, und es lässt sich auch Einigkeit über seine Extension und den Gegenstandsbereich erzielen. Was man unter Wörterbuch versteht, lässt sich folgendermaßen zusammenfassen: Wörterbücher werden mit dem genuinen Zwecke gemacht, benutzt zu werden, und zwar als Nachschlagewerk, aber nicht als Podest, um damit ein Buch in dem obersten Regal des Bücherschranks besser erreichen zu können. Wörterbücher enthalten Daten, denen man Informationen entnehmen kann. Diese Daten können sich auf Sprache oder auf Dinge beziehen. Die Differenzierung in Daten und Informationen ist eine grundlegende und sehr wichtige in der Metalexikographie, weil damit erklärt werden kann, warum Benutzer manchmal unterschiedliche Informationen aus den gleichen Daten eines Wörterbuchs entnehmen. Informationen sind personal gebunden, und der Benutzer in actu entnimmt den Daten unter Zuhilfenahme seines Wissens Informationen, indem er die Daten interpretiert. Die Daten sind fix, die Interpretation wie auch das Wissen des Benutzers ist individuell. Die wichtigsten Wörterbuchtypen sind das Sprachwörterbuch, Sachwörterbuch und das „All(wörter-)buch“ (Wiegand 1988: 747ff.). Das Sprachwörterbuch hat den genuinen Zweck über sprachliche Eigenschaften zu informieren; das Sachwörterbuch hat den genuinen Zweck, über Sachen zu informieren; und das Allbuch soll über sprachliche und nicht-sprachliche Gegenstände informieren (WLWF 2010: 308). Der Terminus „Allwörterbuch“ (kurz: „Allbuch“) ist gut gewählt, weil er neutral ist,

Einige kurze Überlegungen zur Metalexikographie in der Lehre

301

und von der Bedeutung her keine Präferenzen für das Verständnis anbietet. Die Einteilung an sich beruht auf der Einteilung des Wissens nach Sprachwissen und Weltwissen, in der angenommen wird, dass in Sprachwörterbüchern Daten zur Sprache stehen und in Sachwörterbüchern Daten zu Sachen – oder, anders gesagt: das Weltwissen über Sachen mithilfe von Daten angegeben ist. Diese Einteilung kann aber nicht guten Gewissens aufrecht erhalten werden; denn eine saubere Trennung lässt sich nur mit ausgewählten Demonstrationsbeispielen durchführen (vgl. z.B. Engelberg/Lemnitzer 2009: 8ff. zu „Banane“), ist aber auf die meisten lexikographischen Angaben nicht übertragbar, weil insbesondere in den Angaben, die zum semantischen Kommentar zu rechnen sind, nicht klar zwischen Sprach- und Weltwissen unterschieden werden kann. Will man diese Einteilung aufrechterhalten, so gibt es wenige Sachwörterbücher und wenige Sprachwörterbücher2. Die meisten Wörterbücher, vor allem die in der universitären Ausbildung in den Geisteswissenschaften gängigen (z.B. Duden-Universalwörterbuch, Duden-GWDS, Lernerwörterbücher, Duden-Online, DWDS), sind Allwörterbücher. Es wäre wohl möglich, einzelne lexikographische Angaben danach zu differenzieren, ob sie primär über Sachen oder über Sprache informieren, aber schon bei der Sortierung von Wörterbuchartikeln ist diese Zweiteilung kaum durchzuhalten, und für ganze Wörterbücher erscheint dies ganz und gar unmöglich. Nahezu jede Bedeutungsangabe enthält nämlich nicht nur Daten zum Gebrauch eines Wortes in der Sprache, sondern auch zum Weltwissen bzw. zu der Sache, um die es geht. Man müsste wohl auch den Rechtschreibduden, in dem ja einige Artikel eine Bedeutungsangabe enthalten, zunächst quantitativ auswerten, ehe man ein sicheres Urteil über die Einordnung als Sprach- oder als Allwörterbuch fällen kann.3 Diese nicht klare Differenzierung (Sprachwissen – Sachwissen, Sprachwörterbuch – Sachwörterbuch, Sprachlexikographie – Sachlexikographie) hat nun erhebliche Folgen für die differenzierte Betrachtung der Metalexikographie.

5 Metalexikographie und einige Unklarheiten Metalexikographie wird in Wörterbuchforschung, Lexikonforschung und Allbuchforschung unterteilt (Wiegand 1998: 73; vgl. auch Abb. 3). Die Einteilung korrespondiert mit der Einteilung der Wörterbuchtypen in Sprachwörterbücher, Sachwörterbücher und Allbücher (s.o.) und mit der Unterscheidung in Sprachlexikographie, Sachlexiko-

2 Dazu gehören rückläufige Wörterbücher, Aussprachwörterbücher, Valenzwörterbücher, die aber teilweise auch Fachwörterbücher sind, da dort nur Sprachangaben fachlicher Art vorhanden sind. 3 Auf der willkürlich aufgeschlagenen Seite 178 (von „Am“ bis „2Ammer“) des Duden-Rechtschreibwörterbuchs (2006) findet man 80 Lemmata. 50 Lemmata enthalten eine Bedeutungsangabe, 20 Lemmata bieten nur die Orthographieangabe, 6 Lemmata sind Namen, 4 sind eine Abkürzung oder eine Kurzform.

302

Stefan J. Schierholz

graphie und Allbuchlexikographie (WLWF 2010: 308). Für die Wörterbuchforschung und ihre Forschungsgebiete bedeutet dies, dass sie sich nur mit der Sprachlexikographie beschäftigen, aber nicht mit der Sachlexikographie und der Allbuchlexikographie (Wiegand 1998: 118). Das bedeutet weiterhin, dass sich Wörterbuchforschung auf Sprachwörterbücher bezieht, und das bedeutet auch, dass die Wiegand-Texte zur Wiegand-Theorie in Bezug auf die lexikographischen Angaben – soweit nicht gesondert ausgewiesen – nur für Sprachangaben gültig sind. Wenn außerdem der Titel der Wiegand-Theorie Teil 1 „Wörterbuchforschung“ lautet, aber nicht „Metalexikographie“, dann geht es in der Theorie um Sprachlexikographie und die dort entwickelten Teiltheorien zur Wörterbuchbenutzungsforschung, zur systematischen Wörterbuchforschung, zur historischen Wörterbuchforschung und zur kritischen Wörterbuchforschung beziehen sich auf die Sprachlexikographie. Man kann in Wiegand (1998: 13ff.) nachlesen, dass er sich ausgiebig mit Lexikographie und Sprachlexikographie sowie den Beziehungen zur Wörterbuchforschung befasst, aber es bleibt dennoch zu fragen, ob Wiegand das dort, in anderen Texten (und auch im WLWF) so restringiert gemeint hat. Es entspricht nämlich nicht den Rezeptionserfahrungen und Interpretationen vieler Lexikographen und Wörterbuchforscher, da diese das in den Forschungsgebieten der Wörterbuchforschung Ausgearbeitete auch auf Allwörterbücher und Sachwörterbücher anwenden. Es kommt noch ein terminologisches Problem hinzu. Es ist nämlich nicht ganz klar, worin der Unterschied in der Bestimmung der Termini „Wörterbuchforschung“ und „Metalexikographie“ liegt. Im WLWF (2010: 4) heißt es, dass „in Zusammenhängen, in denen es auf die Unterscheidung verschiedener Arten von Lexikographie nicht ankommt, […] die Ausdrücke Wörterbuchforschung und Metalexikographie synonym verwendet werden [können]“. Und in Wiegand (1998: 73) ist zu lesen: „Wenn es nicht ausdrücklich auf den Unterschied zu den anderen Arten der Metalexikographie ankommt, können daher Wörterbuchforschung und Metalexikographie so verwendet werden, daß man damit auf den gleichen Gegenstand Bezug nimmt.“

Hingegen ist Abbildung 3 bei Verwendung der Legende so zu verstehen, dass „Wörterbuchforschung“ ein Teil der Metalexikographie ist. Eine weitere Hürde im Verständnis der Strukturierung der Metalexikographie und Wörterbuchforschung ergibt sich aus dem Schaubild in Abbildung 4 (Wiegand 1998: 9). Danach hat Wörterbuchforschung (1) als empirischen Gegenstandsbereich in der ersten Schicht u.a. die „Geschichte der Lexikographie“ und in der zweiten Schicht (Metabereich) die „Texte zur Geschichte der Lexikographie“ und danach erarbeitet Wörterbuchforschung (2) eine „Allgemeine Theorie der Lexikographie“. Die Erarbeitung einer allgemeinen Theorie der Lexikographie ist aus sachlicher Perspektive sicherlich richtig, aber es wird in Abbildung 4 nicht klar, wie diese „Allgemeine Theorie der Lexikographie“ in Verbindung zur Metalexikographie steht. Es müsste nämlich noch Erläuterungen zu einer Theorie geben, die sowohl die

Einige kurze Überlegungen zur Metalexikographie in der Lehre

303

Abb. 3: Metalexikographie (Wiegand 1998: 118).

Lexikonforschung als auch die Wörterbuchforschung und die Allbuchforschung umfasst. Wenn diese Theorie, die bei Wiegand in Abbildung 3 „Metalexikographie“ heißt, aus drei Teiltheorien besteht, dann müsste das Verhältnis der Teiltheorien zueinander zu klären, zu beschrieben und zu begründen sein. Und wenn viele Teile der Teiltheorien für die Wörterbuchforschung entwickelt werden, und wenn diese auch in den zwei benachbarten Theorien in nahezu gleicher Weise gelten – was hier aber unklar ist –, ist zu fragen, ob nicht die Unterteilung der Metalexikographie allzu artifiziell ist. Diese Unterteilung mag aus analytischen Gründen und zur besseren

Abb. 4: Wiegand in „Vorbetrachtung“ (1998: 9).

304 Stefan J. Schierholz

Einige kurze Überlegungen zur Metalexikographie in der Lehre

305

Darstellbarkeit sinnvoll sein, aber wenn dies nicht explizit formuliert ist, und wenn von den Synonymen „Metalexikographie“ und „Wörterbuchforschung“ die Rede ist, dann stiftet das bei Experten und besonders bei Lernenden Verwirrung. Wenn dann weiterhin der Gegenstandsbereich der praktischen Lexikographie mit ihren unterschiedlichen Ausprägungen nur bedingt das Sprachwörterbuch ist und stattdessen das Allbuch als der gängige Wörterbuchtyp auszumachen ist, somit sehr häufig die Allbuchlexikographie der empirische Gegenstandsbereich der Wörterbuchforschung sein müsste, dann müsste auch die Allbuchforschung im Zentrum der Theorieentwicklung stehen. Rezipiert man als Folge dieser Überlegungen die im Rahmen der Wörterbuchforschung erstellten Fachtexte als anwendbar auf die drei Arten der Lexikographie, so wären alle Theorieelemente der Metalexikographie zu subsumieren und die spezifischen Ausprägungen für Lexikonforschung, Wörterbuchforschung und Allbuchforschung wären gesondert zu benennen. Damit würde dann auch der vorgeschlagene Name „Systematische empirische Metalexikographie“ passen. Dies sollen Denkanstöße sein; eine detaillierte Ausarbeitung und Systematisierung muss hier aus Platzgründen unterbleiben.

6 Folgerungen für die Lehre Versucht man Folgerungen für die Lehre zu ziehen, so muss eine ausgiebige Didaktisierung geleistet werden. Diese soll in wenigen Schritten skizziert werden. Zur besseren Abgrenzung sei festgelegt, dass als Adressaten Studierende des „Europäischen Masters für Lexikographie“ (= EMLex) angesehen werden sollen, und zwar solche, die in Erlangen den EMLex studieren, sowie auch solche, die zukünftig diesen Studiengang in einem Erasmus Mundus Joint Master (ab WS 2016/17) studieren werden. Metalexikographie kann für die Lehre in einem übersichtlichen Schaubild und stark vereinfacht gegenüber den obigen Darstellungen folgendermaßen dargestellt werden. Die Erläuterungen zu Abbildung 5 lauten: (1) Die Kanten in dem Schaubild sind nicht gelabelt, wie es auch in vielen Fällen in der Generativen Grammatik üblich ist. Die usuelle Interpretation der Kanten (—–) ist „bezieht sich auf“ oder „besteht aus“. Die Pfeile (→) sind als „gerichtet auf“ zu lesen. In einer Theorie zur Metalexikographie muss das natürlich explizit und exhaustiv ausgearbeitet werden. (2) Die Unterscheidungen der praktischen Lexikographie sind oben bereits erklärt worden und bedürfen hier keines weiteren Kommentars. (3) Die Wörterbuchforschung umfasst die Sprachwörterbuchforschung, Sachwörterbuchforschung und Allwörterbuchforschung. (4) Die Wörterbuchbenutzungsforschung ist zu unterscheiden in die Wörterbuchbenutzung durch (a) Laien, (b) Wissenschaftler, (c) Lexikographen und (d) bei der

306

Stefan J. Schierholz

Abb. 5: Metalexikographie, Wörterbuchforschung und Lexikographie.

Wörterbuchkritik. Die Kritische Wörterbuchforschung befasst sich vor allem mit dem Aufbau von Wörterbüchern, dem Informationswert von Wörterbüchern, der Richtigkeit, der Vollständigkeit und der Präsentation von lexikographischen Angaben. Die Historische Wörterbuchforschung hat die Entwicklung von Wörterbüchern zu unterschiedlichen Themen und Bereichen zum Gegenstand sowie die Analyse historischer Wörterbücher. Die Systematische Wörterbuchforschung versucht die Forschungsbemühungen selbst zu strukturieren, Wörterbücher nach Typen zu ordnen und Hinweise für die lexikographische Praxis zu geben. Hier wird auch der lexikographische Prozess beschrieben. Dazu sind Theorien der lexikographischen Datenbearbeitung, der lexikographischen Datenbeschaffung, der lexikographischen Datenaufbereitung und der lexikographischen Datenauswertung erforderlich. Weiterhin ist eine Theorie der lexikographischen Textträger notwendig, die aus der Theorie der Wörterbuchform und der Theorie des Wörterbuchgegenstandes besteht. Und schließlich wird eine Theorie der Wörterbucheinteilung benötigt, deren Gegenstandsbereich Wörterbuchtypen und Wörterbuchklassen sind. (Wiegand 1998: 8f.). Für alle hier genannten Bereiche der Metalexikographie sind spezifische Methoden erforderlich, die bislang oftmals nur unzureichend ausgearbeitet sind (vgl. Mann/Schierholz 2014: 3ff.; Schierholz 2015).

Einige kurze Überlegungen zur Metalexikographie in der Lehre

307

(5) Die Abbildung 5 soll verdeutlichen, dass sich theoretische Texte in der Wörterbuchforschung auf alle Arten der Lexikographie beziehen können und dass eine zu strikte Trennung, auch wenn sie nur aus analytischen Gründen erfolgt, dem komplexen Sachverhalt des Gegenstandsbereichs nicht gerecht wird.

7 Fazit Das Ziel dieses Beitrags ist es, über Metalexikographie nachzudenken und zugleich darauf hinzuweisen, dass die Texte der Systematischen Empirischen Metalexikographie unterschiedlich verstanden und interpretiert werden können. Eine alternative Deutung mag dann einige Vorteile für die Anwendung haben, aber auch für die Weitervermittlung in der Lehre. Eine abschließende Klärung der Verhältnisse wird aufgrund dieses kurzen Beitrags nicht erwartet, eine Diskussion schon.

8 Literatur Bergenholtz, Henning / Tarp, Sven (2002): Die moderne lexikographische Funktionslehre. Diskussionsbeitrag zu neuen und alten Paradigmen, die Wörterbücher als Gegenstände verstehen. In: Lexicographica 18, 253–263. Bourbarki, Nicolaus (1957): Eléments de mathématique. I: Les structures fondamentales de l’analyse, livre I: Théorie des ensembles, chapitre 4: structures. Paris [engl. Fassung 1968]. Duden (2006): Die deutsche Rechtschreibung. 24., völlig neu bearb. und erw. Aufl. Herausgegeben von der Dudenredaktion. Mannheim [etc.] (Duden Bd. 1). Engelberg, Stefan / Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4., überarb. und erw. Aufl. Tübingen. Gouws, Rufus H./ Wiegand, Herbert Ernst (2011): Theoriebedingte Wörterbuchformprobleme und wörterbuchformbedingte Benutzerprobleme I. Ein Beitrag zur Wörterbuchkritik und zur Erweiterung der Theorie der Wörterbuchform. In: Lexikos 21, 232–297. Landau, Sidney I. (1989): Dictionaries. The Art and Craft of Lexicography. Cambridge [etc.] [1st print New York 1984]. Mann, Michael/ Schierholz, Stefan J. (2014): Methoden in der Lexikographie und Wörterbuchforschung. Ein Überblick mit einer Auswahlbibliographie. In: Lexicographica 30, 3–57. Rundell, Michael (2012): It works in practice but will it work in theory? The uneasy relationship between lexicography and matters theoretical. In: Fjeld, Ruth Vatvedt/ Torjusen, J.M. (eds.): Proceedings of the 15th EURALEX Congress. Oslo 2012, 47–92. Schierholz, Stefan J. (2015): Methods in Lexicography and Dictionary Research. In: Lexikos (AFRILEXreeks/series) 25, 323–352. Schierholz, Stefan J. (im Druck): Lexicography and Society. In: Domínguez Vázquez, María José/ Mirazo Balsa, Mónica/Válcarcel Riveiro, Carlos (eds.): Studies on Multilingual Lexicography (Lexicographica, Series Maior). Swanepoel, Piet (2015): The design of morphological/linguistic data in L1 and L2 monolingual, explanatory dictionaries: a functional and/or linguistic approach? In: Lexikos 25, 353–386.

308

Stefan J. Schierholz

Tarp, Sven (2008): Lexicography in the Borderland between Knowledge and Non-Knowledge. General lexicographical Theory with Particular Focus on Learner’s Lexicography. Tübingen (Lexicographica, Series Maior 134). Tarp, Sven (2009): Reflections on Lexicographical User Research. In: Lexikos 19, 275–296. Tarp, Sven (2013): Lexicographic Functions. In: Gouws, Rufus H. / Heid, Ulrich / Schweickard, Wolfgang / Wiegand, Herbert Ernst (eds.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography Berlin. Boston, 460–468 (Handbücher zur Sprach- und Kommunikationswissenschaft 5.4). Tarp, Sven (2014): Theory-Based Lexicographical Methods in a Functional Perspective: An Overview. In: Lexicographica 30, 58–76. Wiegand, Herbert Ernst (1988): Was eigentlich ist Fachlexikographie? Mit Hinweisen zum Verhältnis von sprachlichem und enzyklopädischem Wissen. In: Munske, Horst Haider/ Polenz, Peter von/ Reichmann, Oskar/Hildebrandt, Reiner (Hrsg.): Deutscher Wortschatz. Lexikologische Studien. Ludwig Erich Schmitt zum 80. Geburtstag von seinen Marburger Schülern. Berlin [etc.], 729–790. Wiegand, Herbert Ernst. (1998): Wörterbuchforschung. Untersuchungen zur Wörterbuchbenutzung, zur Theorie, Geschichte, Kritik und Automatisierung der Lexikographie. 1. Teilband. Berlin. New York. Wiegand, Herbert Ernst (1999): Semantics and Lexicography: Selected Studies (1976–1996). Edited by Antje Immken and Werner Wolski. Tübingen. Wiegand, Herbert Ernst (2010): Zur Methodologie der Systematischen Wörterbuchforschung: Ausgewählte Untersuchungs- und Darstellungsmethoden für die Wörterbuchform. In: Lexicographica 26, 249–330. WLWF-I (2010) = Wiegand, Herbert Ernst/ Beißwenger, Michael/ Gouws, Rufus H./ Kammerer, Matthias/ Storrer, Angelika/ Wolski, Werner (Hrsg.): Wörterbuch zur Lexikographie und Wörterbuchforschung/Dictionary of Lexicography and Dictionary Research. Bd. 1, A-C. Berlin.New York.

Werner Wolski

Lexikographie und Wörterbuchforschung im Alltag Abstract: The article deals with hitherto hardly adressed problems around the current situation of lexicographical practice: lack of linguistic knowledge in many areas, rejectable claims and influences on the German language etc. Finally, a concept of a dictionary is presented, thatcorresponds to the criticized problems in a satirical way. Keywords: everyday speech, lexicography, metalexicography, dictionaries, language criticism Schlagwörter: Alltagssprache, Lexikographie, Metalexikographie, Wörterbücher, Sprachkritik Über die Benutzung Man nicht viel sagen kann. Doch gilt in jedem Falle Für Frau wie auch für Mann: Wer ganz und gar nichts weiß, Und sowieso nichts kann, Den geht das ganze Sprachspiel Ja ohnehin nichts an! W.W.

1 Vorbemerkung Der vorliegende Beitrag schließt im Titel an einen Band an, der anlässlich des 65. Geburtstags unseres Jubilars publiziert worden ist: „Sprache im Alltag“. Dort werden Fragen der Lexikographie unter anderem auf „Sprache im Alltag“ und „Sprachwissenschaft für den Alltag – heute und morgen“ bezogen. Der Argumentationsrahmen ist im engeren Sinne der einer wissenschaftlichen Auseinandersetzung mit sprachlichen Eigenschaften und deren Beschreibung bzw. Kommentierung. Nur andeutungsweise werden Probleme thematisiert, die Gegenstand nachfolgend berücksichtigter Aspekte sind.

Werner Wolski: Gläsener Straße 3, 33100 Paderborn, email: [email protected]

310

Werner Wolski

Des Weiteren ist die Wahl des Titels ganz wesentlich motiviert durch die Mitte August 2015 beendeten Arbeiten an dem „Sachregister“ zu der „Internationalen Bibliographie zur germanistischen Lexikographie und Wörterbuchforschung“. Diese Bibliographie hatte Herbert Ernst Wiegand bereits in den Jahren 2006 und 2007 in drei Bänden publiziert. Im Jahre 2014 ist sie sodann um den Band der „Nachträge“ ergänzt worden: Die in zahlreichen Ausgangssprachen verfassten Titel der Bibliographie umfassen nahezu alle Zeiträume und sind auf eine Vielzahl von Sprachen bezogen. Das dazu erstellte Sachregister (eine Auftragsarbeit von H. E. Wiegand, die im Wissen um eine nicht in angemessener Weise mögliche Bezahlung in Angriff genommen wurde) ist nicht nur äußerst umfangreich, sondern es bietet erheblich mehr als ein gängiges Register: Die Daten sind reichhaltig kommentiert und vor allem miteinander vernetzt, sodass ein Gesamtüberblick über bisherige lexikographische Aktivitäten im Zusammenhang ermöglich wird. Zwischenzeitlich hatte Herbert Ernst Wiegand durch eine Hilfskraft zusätzlich eine erhebliche Anzahl eigener Ausdrücke (unter anderem aus dem WLWF) einarbeiten lassen, sodass auch diese Ausdrücke vertreten sind. Vor dem Hintergrund der im Rahmen der Erarbeitung zu registrierenden überwältigenden Menge an Details – die Palette reicht von Abbo-Glossen bis Yipunu, zweisprachige Computerlexikographie und Zulu-Lexikographie, von Benutzer-ex-actu bis Zugriffszeitenexperiment – haben sich mit Nachdruck verschiedene Fragen zum Status von Lexikographie (und damit zugleich auch zu demjenigen von Metalexikographie bzw. Wörterbuchforschung) im Alltag eingestellt, bezogen auf die gegenwärtigen Verhältnisse in Deutschland. Grundsätzlich handelt es sich dabei um keine anderen Fragen als die, welche man sich auch im Rahmen des erwähnten Bandes aus dem Jahre 2001 („Sprache im Alltag“) bereits hätte stellen können. Es geht um verschiedene Niederungen des banalen Alltags in dem Sinne, wie sie Gustav Mahler in einigen seiner Sinfonien zitierend berücksichtigt, indem er primitive und laute Stimmen einer Blaskapelle eingebaut hat. Es geht nicht um „Hochseilakte am Trapez“, wie einmal mit Blick auf das Werk von Paul Celan festgestellt worden ist (Wolski 1999), und wozu an anderer Stelle Parallelen zu gewissen Wortschöpfungen der Metalexikographie gezogen worden sind (Wolski 1997). Vielmehr geht es um Fragen der Art: – Welchen Stellenwert haben lexikographische Analysebemühungen und vor allem auch lexikographische Ergebnisdarstellungen in der heutigen deutschen Gesellschaft? – In welchem Verhältnis zu lexikographischen Ergebnisdarstellungen stehen allenthalben hervortretende (und oft beklagte) sprachliche Minderleistungen großer Teile der Bevölkerung sowie unqualifizierte Einflussnahmen auf sprachliche Äußerungsformen? Als bemerkenswerter Befund ist zu betrachten, dass Sprachwissenschaftler(innen), Lexikograph(inn)en oder gar Wörterbuchforscher(innen) bisher nicht oder nur sporadisch auf damit verbundene Probleme eingegangen sind, sondern sich der Stimme enthalten. Teils ist man sich aufgrund eines bestimmten Wissenschafts-Verständnis-

Lexikographie und Wörterbuchforschung im Alltag

311

ses offenbar „zu fein“ dafür, sich mit derartigen Problemen abzugeben. Auch dürften sich jüngere Wissenschaftler(innen) im Bereich der Lexikographie bzw. Wörterbuchforschung angesichts der Stellensituation davor scheuen, derart heikle Probleme öffentlich anzusprechen, um nicht ihre mögliche Bewerbung um die eine oder andere Stelle zu gefährden. Und die älteren Wissenschaftler(innen) sind möglicherweise derart mit eigenen Projekten oder anderen Interessenfeldern befasst, dass ihnen die Motivation dazu fehlt, sich auf kritische Stellungnahmen diesbezüglich einzulassen. Im Bewusstsein, damit brisante und bisher nicht (zumindest nicht im Kontext „wissenschaftlicher“ Arbeiten) behandelte Sachverhalte anzusprechen, sind die nachfolgenden Ausführungen auf unterschiedliche Rahmenbedingungen lexikographischer Nachschlagewerke bezogen. Die Lexikographie ist, wie es Herbert Ernst Wiegand immer wieder treffend und einfach ausgedrückt hat, diejenige „Praxis, die darauf gerichtet ist, dass Wörterbücher entstehen“. Der zugehörige Theoriebereich ist die Metalexikographie bzw. Wörterbuchforschung. Von dieser Auffassung wird auch im vorliegenden Beitrag ausgegangen. Natürlich ist zu bedenken, dass damit der Ausdruck Lexikographie – nur der Bezeichnung, nicht aber seinem Status nach – den Teilbereichen Lexikologie, Morphologie, Phonologie usw. parallelisiert wird, welche dem gängigen Verständnis entsprechend als Theoriebereiche aufzufassen sind, und die keinen Metabereich haben. Auch deshalb verstehen manche Theoretiker(innen) unter Lexikographie eine praxis- wie theoriebezogene Sparte gleichermaßen. Die Metalexikographie ist in den frühen 80er Jahren in Heidelberg entstanden, als Herbert Ernst Wiegand – unter Berücksichtigung verfügbarer Vorgänger-Arbeiten – zunehmend damit begonnen hatte, terminologische Grundlagen für die Lexikographie zu schaffen. Die Metalexikographie (als Synonym kann der Ausdruck Wörterbuchforschung gelten) ist der auf die Lexikographie bezogene Theoriebereich (Metabereich). Sie beinhaltet folglich qua Abstraktion und Verallgemeinerung die Systematisierung empirisch gegebener (beobachtbarer) Aktivitäten im zugeordneten Objektbereich. Zahlreiche der von ihm geprägten Ausdrücke sind heute Gemeingut und lassen sich insofern als „Termini“ ansprechen, als sie in einem Termini-Netz stehen, also wechselseitig in allen Definiens-Bestandteilen (außer den Funktionswörtern) aufeinander bezogen sind. Unmittelbar relevant sind im Rahmen der Erarbeitung bzw. Überarbeitung von Wörterbüchern allerdings nur sehr wenige terminologische Differenzierungen, die bereits seit Mitte/Ende der 80er Jahre zur Verfügung stehen. Bedeutsam für die lexikographische Praxis ist vor allem die sprachkritische Fundierung sämtlicher, mit Wörterbüchern verbundener, Fragen: Herbert Ernst Wiegand hat – auf der Basis eines durchdachten handlungstheoretisch fundierten sprachtheoretischen Ansatzes – eine Redeweise zur Verfügung gestellt, um auf lexikographische Sachverhalte geeignet Bezug nehmen und Textbausteine von Wörterbüchern überhaupt erst benennen zu können! Heute allerdings kommt der Lexikographie und gleichermaßen der Metalexikographie/Wörterbuchforschung – leider einschließlich auch in ihren vorteilhaften und

312

Werner Wolski

glaubwürdigen Ausprägungen – ein Status zu, der sich in Anlehnung an eine Formulierung von Theodor Adorno („Ästhetische Theorie“) als „Kunst, χωρίς [abseits] vom empirisch Seienden“ charakterisieren lässt (Adorno 1970: 8). Unter dem, was Theodor Adorno in seiner eigentümlichen Ausdrucksweise als das „empirisch Seiende“ fasst, wird in vorliegendem Beitrag all das verstanden, was sich zunehmend in dekadenten Einflussnahmen auf sprachliche Äußerungsformen zeigt, und was (vornehm ausgedrückt) Verflachung sowie sprachliche Verrohung beinhaltet – einschließlich des Entgegenkommens in Form der Rezeption absurdester Vorschläge in Wörterbüchern. Von Seiten eines Ignorantentums dieser Art werden seriöse lexikographische Analysebemühungen und Ergebnisdarstellungen, von denen man sich ein umfassendes Bild auch anhand der erwähnten Bibliographie und des dazu angefertigten Sachregistern machen kann, als im Abseits stehend (als „Kunst, χωρίς“) betrachtet, und höchstens noch als verachtenswerte „elitäre“ bzw. „schwer verständliche“ sprachliche und lexikographische Eskapaden wahrgenommen.

2 Präludium: Zur Rolle von Printwörterbüchern und zu Sachzwängen bei der Erarbeitung lexikographischer Daten 2.1 Erstes Szenario: Rolle von Printwörterbüchern heute Es sollte klar sein, dass man über Problembereiche lexikographischer Analysebemühungen und zum Status lexikographischer Ergebnisdarstellungen nicht gleichsam in der Totalperspektive (und auch nicht unabhängig vom Wörterbuch-Typ) urteilen kann, und dass diesbezügliche Urteile – je nach individueller Perspektive, eigenen Erfahrungen sowie interessebedingten Motivationen mit Äußerungsformen der Übertreibung bzw. Verharmlosung – nicht unproblematisch sind und auch nicht allseits unwidersprochen hingenommen werden dürften. Allerdings führt kein Weg daran vorbei, die heutige Situation der Wörterbuch-Verlage, was die Publikation von Printwörterbüchern angeht, (abgesehen von einigen Typen von Wörterbüchern) insgesamt als durchaus dramatisch einzuschätzen; vgl. dazu auch die Anmerkungen von Carolin Müller-Spitzer in vorliegendem Band. Eigentlich muss man, um den Kontrast zur heutigen Wirklichkeit aufzuzeigen, nicht bis kurz vor 1900 (1892) zurückgehen. Allerdings sei zitiert, was Arnold Schönberg über „den langen Weg der Entwicklung bis zur Komposition des Streichquartetts in ‚D‘“ berichtet: „Ich begann Streichquartette zu schreiben. Inzwischen war ‚Meyers Konversationslexikon‘, das wir auf Raten bezogen, beim langersehnten Buchstaben ‚S‘ angelangt, so daß ich unter dem Schlagwort ‚Sonate‘ erfahren konnte, wie der erste Satz eines Streichquartetts gebaut sein sollte.

Lexikographie und Wörterbuchforschung im Alltag

313

Ich war damals ungefähr 18 Jahre alt, hatte aber noch keine andere Unterweisung als diejenige, die mir Oskar Adler erteilt hatte. Während ich das ‚Lexikon‘ sorgfältig studierte, wurde ich mit einigen anderen Musikern bekannt […], die mir behilflich waren, meine Kenntnisse zu erweitern.“ (Schönberg 1974: 163).

Eine derartige Benutzungssituation wäre heute undenkbar. Schönberg hat sich in einer Enzyklopädie sachkundig gemacht bzw. – wie unser Jubilar dazu sagen würde – eine „partiell gezielte artikelinterne Zugriffshandlung“ vollzogen. Auf jeden Fall war es eine „erfolgreiche Konsultationshandlung“ durch Arnold Schönberg als „Benutzerin-actu“. Heute kann man eine Enzyklopädie, wie die von Meyer, für ein paar Euro auf dem Flohmarkt bekommen – aber niemand würde sich die hinstellen wollen. Statt eines „langersehnten Buchstabens“ werden heute Facebook-Nachrichten oder Nachrichten anderer sogenannter „sozialer Netzwerke“ am Smartphone „ersehnt“ – auch beim Autofahren oder beim Überschreiten des Zebrastreifens. Und wenn man etwas wissen will (Welcher der Teletubbis war schwul? Wann hat Lena den Eurovision Song Contest gewonnen?), dann schaut man im Internet nach. Ein Oberschüler hat das mit Blick in ein bekanntes Rechtschreib-Wörterbuch sehr schön folgendermaßen ausgedrückt (von zuverlässigen Gewährsleuten bezeugt): „Oh, ist wie Google – nur in Altmodisch!“ Darüber hinaus werden auch mehrbändige Wörterbücher nicht mehr als Printwörterbücher publiziert, Enzyklopädien sowieso nicht. Und von den einbändigen gemeinsprachlichen Wörterbüchern halten sich nur wenige auf dem Markt (jedenfalls in Deutschland). Wie schon an den Printwörterbüchern nahezu alle Errungenschaften der neueren Wörterbuchforschung vorbeigegangen sind (oder soll man jetzt schreiben vorbei gegangen?), so ist das Chaos der Angaben in den im Internet publizierten gemeinsprachlichen Wörterbüchern nicht zu übersehen, obwohl es Heterogenität und Fehlerhaftigkeit der Kommentierung immer gab. Davon macht man sich ein umfassendes Bild, wenn man jahrelang verschiedene Wörterbücher völlig überarbeitet hat. In diese Richtung gehen auch Anmerkungen von Annette Klosa vom IDS Mannheim anlässlich eines Interviews (rheinneckarblog.de, 21.03.2014, Minh Schredle: „Haben Lexika noch eine Zukunft?“). Zitiert wird die Äußerung: „Lexika sind wirtschaftlich uninteressant“. Befürchtet wird von A. Klosa zurecht auch, dass „Laienprojekte“ im Internet früher oder später die „Expertenarbeit komplett verdrängen“, dass „Verlässlichkeit“ der Angaben „bedroht“ sei, und dass überhaupt die durch „geschulte Experten“ geleistete Qualität von Wörterbüchern erheblich darunter leide. Hingewiesen wird unter anderem auch darauf, dass Förderprogramme und Mittel für laufende Arbeiten „massiv eingeschränkt“ bzw. gekürzt“ werden. Hinzuzufügen ist allerdings: Das „Frühneuhochdeutsche Wörterbuch“ (begonnen in Heidelberg, jetzt im Rahmen der Göttinger Akademie von Oskar Reichmann und dessen Frau A. Lobenstein-Reichmann erarbeitet) beispielsweise wird von der Deutschen Forschungsgemeinschaft mit vielen Millionen Euro gefördert; vgl. dazu auch Angaben im Internet.

314

Werner Wolski

2.2 Zweites Szenario: Erfahrungen aus der Praxis der Erarbeitung lexikographischer Daten Seit Jahrzehnten werden im Hinblick auf sämtliche Textteile Vorschläge zur Optimierung von Wörterbüchern der deutschen Gegenwartssprache (einschließlich solcher zu „Deutsch als Fremdsprache“, Schulwörterbücher usw.) gemacht. Aber nur wenige der Vorschläge haben sich bis heute in die lexikographische Praxis umsetzen lassen; vgl. z.B. Sammelbände wie Konerding/Lehr (Hrsg. 1997). Es gab einmal eine Phase (etwa seit Mitte der 80er Jahre), als unser Jubilar das Konzept der „praktischen Lexikologie“ entworfen hatte, als es vielfältige personelle und briefliche Kontakte mit Kollegen/Kolleginnen gab (so z.B. auch mit Helene Malige-Klappenbach, deren Briefe an HEW und WW erhalten sind, aber heute niemand mehr interessieren), und als es einen Kongress mit Günter Grass und Wolfgang Heißenbüttel zu Fragen der Lexikographie gab, u.a.m; vgl. den Diskussionsbericht Wolski (1986b). Auch ist „Lexicographica“ ins Leben gerufen worden: Die Titelgebung erfolgte übrigens spontan als Antwort auf eine entsprechende Frage unseres Jubilars (während einer gemeinsamen Bahnfahrt von Heidelberg nach Marburg). Vor allem traf man sich wöchentlich in Heidelberg, um Erfahrungen auszutauschen – oft auch zusammen mit Günther Drosdowski und mit anderen Kollegen/Kolleginnen der Duden-Redaktion sowie des IDS. Die „praktische Lexikologie“ beinhaltete, vorteilhafte sprachwissenschaftliche Errungenschaften in lexikographische Ergebnisdarstellungen umzusetzen. In die gleiche Zeit fiel auch der Aufschwung der Partikelforschung, sodass zur Kommentierung der Funktionswörter ganz konkrete Vorschläge gemacht werden konnten, so z.B. in Wolski (1986). Darauf, dass man diese und andere wortartenbezogene Vorschläge kaum geeignet in gemeinsprachlichen Wörterbüchern würde berücksichtigen können, wies nicht nur Günther Drosdowski bereits seinerzeit hin. Daran hat sich bis heute nichts (abgesehen von wenigen Details) geändert. Gleiches gilt auch für spätere Vorschläge; vgl. z.B. die Vorschläge zu LGwDaF aus Wiegand (Hrsg.)1998. Dies ist in großer zeitlicher Distanz angesichts der Konfrontation mit der Praxis in besonderer Weise deutlich geworden, und zwar im Rahmen der völligen Überarbeitung mehrerer Pons-Wörterbücher, hier neben dem Rechtschreibwörterbuch („Die deutsche Rechtschreibung“; mit vielen anderen gemeinsam erarbeitet) vor allem die Wörterbücher zu Deutsch als Fremdsprache („Großwörterbuch DaF“, „Kompaktwörterbuch DaF“) sowie das Schulwörterbuch („Großes Schulwörterbuch Deutsch“). Nur aufgrund einer außerordentlich fruchtbaren und vertrauensvollen Zusammenarbeit mit dem Projektleiter konnte gleichwohl vieles auch in sprachlicher Hinsicht so verwirklicht werden, wie dies eigenen Ansprüchen genügt, weshalb die völlige Neubearbeitung dieser Wörterbücher (einschließlich der Textteile im Wörterbuchverzeichnis und der Umtexte) weit über die Kommentierung in vorhandenen Wörterbüchern hinausgeht. Insgesamt ist die Erfahrung gemacht worden, dass Ansprüche und Vorschläge, wie diese vielfach aus theoretischer Perspektive formuliert werden, in der Praxis (d.h. im

Lexikographie und Wörterbuchforschung im Alltag

315

Rahmen der konkreten alltäglichen Arbeit!) nur in sehr begrenztem Umfang berücksichtigt werden können: Vorgegeben sind nicht nur XML-Dateien, mit denen mögliche Textelemente und Textbausteine festgelegt sind, sondern auch Angaben zur Art der durchzuführenden Arbeiten (z.B. zum Umfang neuer Einfügungen in das Wörterverzeichnis) – und nicht zuletzt genaue zeitliche Vorgaben. Deshalb waren Prioritäten zu setzen: Die Ausmerzung von Fehlern (einschließlich solcher der Beispielsätze, die falsch ein Komma statt eines Semikolons enthielten) ist äußerst zeitaufwändig. So konnten die Artikel zu den Funktionswörtern (abgesehen von korrekt als „Partikel“ versus Adverb und Konjunktion angesetzten Wortartenangaben und der zuzuordnenden Beispielangaben) nicht in jeder Hinsicht in gewünschter Weise bearbeitet werden. Für die Bedeutungsangaben ist durchweg angestrebt worden, sprachlich (samt Interpunktion) und inhaltlich korrekte Kommentierungen zu leisten, die sich völlig von denen in anderen Wörterbüchern unterscheiden, welche ständig vergleichend hinzugezogen worden sind; vgl. „Duden-Rechtschreibung (2006)“ (auch „Duden online“): „Wald aus Buchen“ (s.v. Buchenwald) und demgegenüber „Pons Großwörterbuch Daf (2011)“ mit zwei Artikeln: „Wald, in dem hauptsächlich Buchen wachsen“ sowie „eines der größten Konzentrationslager des Hitlerfaschismus zwischen […], und das seit 1991 neu gestaltete Gedenkstätte ist“. In den Umtexten wird zugleich den Ergebnissen der neueren Metalexikographie (i. S. des Jubilars) entsprochen, wonach nicht mehr – wie laut veralteter Auffassung – zwischen vermeintlich „rein sprachlicher“ Kommentierung und solcher enzyklopädischer Art unterschieden wird. Auch ist bei der Überarbeitung der Umtexte nicht infrage gekommen, z.B. Bedeutungsangaben als „Definitionen“ zu bezeichnen, u.a.m. Was die Komposita angeht, wäre es (z.B. für das „Pons Kompaktwörterbuch DaF“) völlig illusorisch gewesen, hierzu von dem Bearbeiter (in Zusammenarbeit mit dem Projektleiter) – zuvor – die Grundlegung einer linguistischen Theorie zu erwarten, was die Auswahl von Komposita (als separat angesetzte Lemmata) angeht bzw. deren unkommentierte Anführung am Ende von Substantiv-Artikeln: Denn erstens gibt es angesichts der Wortbildungsmöglichkeiten im Deutschen keine plausible und im Sinne der „praktischen Lexikologie“ leicht handhabbare Theorie dazu (ähnlich wie im Falle der Funktionswörter); zweitens sind Vorgaben durch das XML-Programm zu beachten gewesen, wo entsprechende Position besetzt werden musste; und drittens (und nicht zuletzt) ist dies auch ein Zeitproblem: Unter diesen Voraussetzungen ist es überhaupt nicht möglich, erst eine linguistische Theorie zu entwickeln (die ohnehin von einer konkurrierenden Theorie infrage gestellt würde), um dann darauf bezogen die Wörterbuchartikel geeignet zu gestalten: Man muss sich damit abfinden, dass es hierzu – wie zu anderen wortartenbezogenen Fragen – keine Patentlösungen gibt. Bereits die Abfassung der weit über hundert längeren, in das Wörterverzeichnis eingestreuten, Texte („Legasthenie“, „Lexikon“, „Lexikographie“, „Widerstandsbewegung“, „Wörterbücher“ usw. usw.) ist äußerst zeitaufwändig gewesen. An dieser Stelle können nur einige weitere problematische Aspekte angesprochen werden: In vielerlei Hinsicht ist z.B. zu bedenken gewesen, dass Abweichungen vom

316

Werner Wolski

„Duden“ (welcher leider weithin als die einzig korrekte Instanz betrachtet wird) insofern heikel sind, als potentielle Benutzer(innen) meinen könnten, es handele sich im Pons-Wörterbuch um falsche Angaben! Darauf wurde allerdings – z.B. falsche Betonungsangaben lateinischer oder altgriechischer Ausdrücke betreffend – keine Rücksicht genommen. Teils ist deshalb sogar ein Kommentar der Art „richtige Betonung so“ hinzugefügt worden. Was zum Wissensbestand eines Altphilologen gehört, kann heute auch in Wörterbuch-Redaktionen überhaupt nicht mehr vorausgesetzt werden. Von mangelnden Kenntnissen zeugen z.B. im „Duden-Rechtschreibung“ (teils nur verzeichnet in „Duden online“): „locus amoenus“ falsch mit langem „o“ bei locus (nicht umsonst im Lateinunterricht ein Standardbeispiel, um Schüler/Schülerinnen zum Lachen zu bringen, da nicht von „Lokus“ = ‚Klo’); vgl. auch Epitheton (falsch mit langem „i“), Hapax legomenon (falsch mit langem erstem „o“), Hypothalamus (falsch mit langem erstem „a“), Numerus clausus (falsch mit langem „u“ auf Numerus), Stimulus (falsch mit langem „i“), Poliklinik (falsch mit langem „o“; kommt nicht von „Po“, sondern geht auf griech. poly- zurückgeht (mit kurzem „o“), u.a.m. Andere erhebliche Defizite der Duden-Wörterbücher sind auch im Rahmen der völligen Überarbeitung von „Pons Großes Schulwörterbuch Deutsch“ erkannt worden: Grundsätzlich gibt es, was die Pluralbildungsangaben oder Steigerungsformen der Adjektive in vielen Bereichen angeht – im Unterschied zu manchen theoretischen Annahmen – Vagheitsspielräume dessen, was als usuell anzusehen ist. Absolut falsch sind allerdings die Pluralbildungsangaben für sehr viele Substantive in den genannten Duden-Wörterbüchern (so zu Papierkrieg und Schlaraffenland); vgl. auch den falschen Plural „rarissimuma“ (statt „rarissima“) zu rarissimum. Ebenso werden fälschlich und in nicht nachvollziehbarer Weise für zahlreiche Adjektive Steigerungsformen angesetzt (vgl. z.B. farbenblind und konzeptionell). Ansonsten konnten in erheblichem Umfang für sog. „Halbaffixe“ bzw. „Affixoide“ (vom Typ –lawine) eigene Artikel angesetzt werden. Hierzu ist nicht nur der Menge nach weit über entsprechende Artikel des LGwDaF hinausgegangen worden: Es mussten vielmehr überhaupt erst einheitliche Formulierungen geschaffen werden (!), die samt Interpunkten nachvollziehbar und korrekt sind (z.B. „als Erstglied zusammengesetzter Substantive; [Semikolon] drückt aus, dass das mit dem Zweitglied Bezeichnete [usw.]“). Im Unterschied zu dem Printwörterbuch des Duden sowie dem Online-Wörterbuch, wo nur ganz selten Einheiten dieser Art überhaupt angesetzt werden, weisen die mehrteiligen Affixoide zweimal die Vokalquantität der Länge auf (vgl. falsch mit Länge nur vorn bei Duden: hochanständig, hochmodern, und vieles andere mehr). Darüber hinaus ist z.B. für das „Kompakt-Wörterbuch DaF“ als Teil der Umtexte der sog. „Schlüssel Deutsch“ erarbeitet worden. Dieser umfangreiche Teil beinhaltet – erstmals überhaupt – eine zusammenhängende und reichhaltig untergliederte Darstellung sämtlicher Lebensbereiche in Deutschland (zum politischen System, zu Ämtern und Behörden, Rechtsfragen, zu Formen der Gesprächseröffnung bis zur Gesprächsbeendigung, zu Aspekten der Bildung und Ausbildung, sowie zum Schrift-

Lexikographie und Wörterbuchforschung im Alltag

317

verkehr usw.). Am Ende der einzelnen Abschnitte finden sich jeweils wichtige Formulierungsbestandteile (z.B. „das passive Wahlrecht: genießen (= selbst gewählt werden können, selbst wählbar sein)“. Die Textteile sind übrigens vor der Veröffentlichung an Instituten für „Deutsch als Fremdsprache“ (Heidelberg und Paderborn) mit zahlreichen Kandidat(inn)en auf Verständlichkeit hin überprüft worden. Dabei tauchten keinerlei Verständlichkeitsprobleme auf, da – trotz des damit verbundenen inhaltlichen und sprachlichen Anspruchs – in jeder Hinsicht auf gute Nachvollziehbarkeit geachtet worden ist (einfache Syntax, Erläuterung jedes problematischen Ausdrucks etc.). Gerade für ausländische Studierende ist ganz wichtig, ihnen einen korrekten Sprachgebrauch vorzuführen. Auch bei der kürzlich erfolgten Aktualisierung dieses Teils (erscheint demnächst) sind an dem Niveau der Ausführungen – in völliger Übereinstimmung mit der Auffassung des Projektleiters – keinerlei Abstriche gemacht worden.

3 Interludium: Sprachliche Probleme und Einflussnahmen auf sprachliche Äußerungsformen 3.1 Erstes Szenario: Rechtschreibprobleme In den Chor derer, welche allenthalben Defizite im Bereich der deutschen Rechtschreibung beklagen, möchte man eigentlich nicht einstimmen, da Anmerkungen dazu leicht ausufern könnten. Allerdings sind zu zwei Aspekten Notizen zu machen, auch weil sie sozusagen das Umfeld heutiger Lexikographie und Wörterbuchforschung abstecken: (a) Lese-Rechtschreib-Schwäche, und (b) Rechtschreibreform.

Zu (a) Lese-Rechtschreib-Schwäche: Zutreffend wird in einem Beitrag z.B. festgestellt: „Unsere Kinder verlernen das Schreiben“ und „Manche Lehrer sind selbst schwach in Rechtschreibung“ (faz.net, 08.07.2014, Heike Schmoll: „Sprachnotstand an Grundschulen“). In einem weiteren Beitrag (faz.net, 11.03, 2015, „Mangelnde Bildung: Rechtschreibung“) weist Heike Schmoll darauf hin, dass Grundschüler heute kaum noch Diktate schreiben müssen, und dass man Schüler „trotz massiver Rechtschreibdefizite in weiterführende Schulen entlässt“. Ähnlich äußert sie sich in dem zuerst erwähnten Beitrag, nämlich dass Schüler(innen) „mit Phantasienoten sogar aufs Gymnasium“ kommen. In dem Zusammenhang merkt Heike Schmoll an, dass oft behauptet werde, die Zahl der Kinder „mit vermeintlicher Lese-Rechtschreib-Schwäche (LRS)“ habe erheblich zugenommen. Zurückgeführt wird dies völlig zutreffend darauf, dass es nur an Übung und an einem „systematischen Rechtschreibunterricht“ mangele. Hinzugefügt sei: Es liegt

318

Werner Wolski

auch an einem verfehlten Unterricht, wenn falsche Schreibungen über Jahre hinweg gebilligt bzw. für normal gehalten werden, welche sich bei den Kindern nachhaltig einprägen. Dazu sind ergänzend folgende Anmerkungen zu machen: Zu diesem Komplex werden andernorts teils – interessebedingt – Irrlehren verbreitet, es handele sich bei der „Lese-Rechtschreib-Schwäche“ (LRS) um eine Krankheit: Vielmehr ist die LRS auf normale Vernachlässigung oder mangelnde Übung zurückzuführen. Zu unterscheiden ist davon die Erscheinungsform der „Legasthenie“. Von dieser sind nur etwa vier Prozent aufgrund z.B. einer minimalen zerebralen Dysfunktion betroffen, wie kompetente Theoretiker(innen) stets betonen. Dazu werden vielfältige Hilfsangebote gemacht (seriöse und unseriöse). Im Rahmen mehrfach in überfüllten Räumen durchgeführter Lehrveranstaltungen (an der Universität Paderborn) ist zu den „Heilmethoden“ für LRS und Legasthenie deutlich zu machen gewesen, worum es geht: Es geht gewöhnlich gewiss nicht darum, den Kindern zu helfen, sondern es geht um das Geschäftemachen mit dem Problem: Erst wird den Betroffenen eine „Legasthenie“ angedichtet (obwohl meist nur LRS), um dann z.B. teure Kurse (wie übrigens auch zur sog. „Dyskalkulie“) anzubieten. Dass Probleme rund um die Lese- und Rechtschreibschwäche (ohne dass im Einzelfall klar ist, wie man diese einordnet bzw. von der Legasthenie abgrenzt) durchaus nicht nur auf Grundschulkinder oder ältere Schüler(innen) bezogen werden können, wird heute ebenfalls gelegentlich angesprochen: Im Rahmen einer Universitäts-Tagung in Marburg (Oberhessische Presse, 18.09.2014, „Sprachwissenschaft in der Praxis“) beispielsweise ist eine „Lese- und Schreibschwäche bei einigen Studenten“ beklagt worden. In anderen Beiträgen bemängelt man, dass viele Student(inn)en den Vorlesungen nicht folgen könnten, u.a.m. Diese Problemlage ist allerdings gewiss nicht auf die Verhältnisse in Deutschland beschränkt. Eingegangen wird in einem Beitrag z.B. außer auf Japan auch auf Südkorea (sueddeutsche.de, 28.02.2015, „Digitalisierung in Japan: Sklaven ihrer Smartphones“). In dem Beitrag macht Brian Myers (Prof. in Busan/Südkorea) auf „dramatische“ Entwicklungen aufmerksam, welche auf die exzessive Nutzung von Smartphones durch Kinder und Student(inn)en zurückzuführen sind: Bücher werden kaum noch verstanden oder gelesen; die Schreibkompetenz der Student(inn)en ist erbärmlich: Sie lesen „höchstens noch die Schlagseiten der Webportale“ etc. In dem Zusammenhang ist von einer „schleichenden Re-Analphabetisierung“ die Rede, der sich Südkoreas Regierung „angepasst“ habe: „Sie publizieren, was wichtig ist, inzwischen in Comic-Form“. Dazu merkt Myers an, eine „post-alphabetische Gesellschaft“ tauge „nicht“ zur Demokratie. Von hierher ist es nur ein kleiner Schritt zu Hinweisen auf den Analphabetismus – einschließlich der Methoden, damit umzugehen. Eine der Methoden besteht darin, sich durch ein Primitiv-Niveau an diejenigen Gruppen anzubiedern (wie offenbar in Südkorea), die man für minderbemittelt hält bzw. gar für „Analphabeten“. Dieser Weg wird – so wichtig Verständlichkeit z.B. politischer Texte sicherlich ist (!) – bei uns mit

Lexikographie und Wörterbuchforschung im Alltag

319

dem Konzept „Leichte Sprache“ verfolgt. Darauf wird unter 3.1. gesondert eingegangen. An dieser Stelle sei lediglich darauf hingewiesen, dass es sogar eine Verordnung gibt, nach der jede Behörde ihren Internetauftritt in „Leichter Sprache“ bereitstellen muss (taz.de, 16.11.2012, Anja Maier, „Leichte Sprache im Bundestag“). Begründet wird dies so: „Das tut not, denn 7,5 Millionen Menschen in diesem Land sind funktionale Analphabeten, hat die Uni Hamburg im letzten Jahr festgestellt. 13,3 Millionen haben Schwierigkeiten beim Gebrauch der deutschen Sprache.“

Es ist allerdings darauf hinzuweisen, dass solche Zahlen mit Vorsicht zu genießen sind. Denn bei dem Ausdruck funktionaler Analphabetismus handelt es sich gewiss nicht um einen Terminus. Er lässt sich nicht – im wissenschaftstheoretischen Sinne von Definition – definieren, sondern bestenfalls plausibel operationalisieren. Gleichwohl wird oft der Eindruck vermittelt, es könne eine Definition geben, so in Grotlüschen/Riekmann (Hrsg. 2012: 17). Mit funktionaler Analphabetismus wird der Umstand umschrieben, dass ein gewisser Teil der Bevölkerung nur in sehr begrenztem Maße in der Lage ist, selbst einfachste Texte verstehen zu können, und dass dabei noch weniger die Kompetenz gegeben ist, Texte gleich welcher Art auch nur annähernd korrekt verfassen zu können. Dabei dürften unter die „funktionalen Analphabeten“ wohl nicht einmal in erster Linie „Menschen“ (vgl. das vorstehende Zitat) mit sog. „Migrationshintergrund“ fallen – jedenfalls soweit sie einen Deutschkurs erfolgreich besucht haben. Völlig unbeachtet bleibt bei allen Diskussionen rund um Lese-RechtschreibSchwäche – bis hin zur „Re-Alphabetisierung“ und zum „funktionalen Analphabetismus“ – ein Problem, das weit darüber hinausgeht, und das bisher von niemand angesprochen worden ist: Es gibt kaum einen Text (im Internet sowieso nicht) im Umfang von mehr als zehn Zeilen, der in jeder Hinsicht korrekt ist – wenn man hohe Maßstäbe setzt, und nicht lediglich die Rechtschreibung im engeren Sinne betrachtet. Dies ist zugegebenermaßen eine Auffassung, die von Seiten der Unbedarften sicherlich als „elitär“ eingeschätzt wird/würde: Viele (eher wohl: die meisten) wissen heute nicht zwischen „Worte“ (im Sinne satzartiger Äußerungen; vgl. aus Goethes Faust: „Der Worte sind genug gewechselt“ – und nicht „der Wörter“) und „Wörter“ (einzelne sprachliche Ausdrücke) zu unterscheiden. Das Semikolon kennt man weithin überhaupt nicht, sondern setzt das Komma fälschlich zwischen zwei vollständige Sätze; und viele Leute können „Begriffe“ nicht nur „verwenden“, sondern sogar in Form von Buchstabennudeln essen (wie Kindergärtnerinnen). Als kaum bekannt ist anzusehen, was man unter Begriff zu verstehen hat, nämlich eine Abstraktion, ein kognitiv verfügbares Wissen um den Gebrauch eines Ausdrucks/Worts. Einen „Begriff“ kann man nicht verwenden; das damit Bezeichnete ist nicht mit Wort/Ausdruck gleichzusetzen. Des Weiteren werden in völlig abwegiger Form zahlreiche Formen der Umschreibung (Typ: „Kommunikation ist Interaktion zwischen kommunizierenden Personen“) als „Definitionen“ gehandelt und akzeptiert. Bedauerlicherweise treten heute derartige

320

Werner Wolski

Defizite aufgrund mangelnder Ausbildung in großem Umfang auch in sog. „wissenschaftlichen“ Texten hervor. Aufgrund diesbezüglicher Ignoranz kann man als durchaus vielseitig erfahrener Korrektor und Verfasser von Schriften unterschiedlichster Art in die Situation geraten, im Rahmen der Auftragsarbeit für einen anderen (hier unbenannt bleibenden) Verlag als Pons, mit jungen Damen in Diskussionen dazu eintreten zu müssen, dass man auch derartige Korrekturen durchgeführt hat: Ihnen war aufgrund mangelhafter sprachlicher Kenntnisse alles fremd, was zu korrigieren war (auch völlig schiefe Formulierungen) – wie jenen Student(inn)en, denen man unbedingt empfehlen musste, sich doch eine ihren Neigungen entsprechende Tätigkeit zu suchen, und nicht ausgerechnet ein sprachbezogenes Studium zu wählen.

Zu (b) Rechtschreibreform: Missfallens-Äußerungen und Polemiken zur Rechtschreibreform gibt es genügend. Zur geschichtlichen Entwicklung bis zur Umsetzung der Reform sei auf Wolski (2009) verwiesen. An dieser Stelle sind dazu lediglich – im Zusammenhang auch mit den vorangehenden Ausführungen – einige Anmerkungen zu machen: Sicherlich ist es so, dass in allen gesellschaftlichen Kreisen (und durchaus nicht zuletzt bei den Lehrerinnen/Lehrern) durch die Reform eine völlige Verunsicherung eingetreten ist. Die ältere Bevölkerung beherrschte zuvor die Rechtschreibung durchaus sicher genug, soweit entsprechende individuelle Voraussetzungen gegeben waren (guter schulischer Unterricht bereits in der Grundschule, spätere häufige Praxis im Schreiben). Die heutige Situation zeichnet sich hingegen dadurch aus, dass die Fehlerträchtigkeit von Texten in unerträglichem Maße zugenommen hat, was leicht zu belegen wäre: Man schreibt, wie man will. Aber daran scheint sich gegenwärtig kaum jemand zu stören; und viele halten sich aus Furcht vor einem „Shitstorm“ im Internet mit ihrer berechtigten Kritik zurück. Abgesehen davon ist den Verfasser(inne)n von Texten allerdings auch kaum zumutbar, ständig z.B. im „Rechtschreib-Duden“ (auf den in fast jeder Quizsendung hingewiesen wird – natürlich rein zufällig!) nachzuschauen, sollten Zweifel bezüglich der Schreibung aufkommen. Die Probleme seit der Rechtschreibreform sind ganz wesentlich darauf zurückzuführen, dass in vielerlei Hinsicht schludrig gearbeitet worden ist, sodass viele Details unklar bleiben. Es reicht eben nicht aus anzunehmen, alles werde sich künftig irgendwie schon einspielen. Auf die lexikographischen Nachschlagewerke hatte die Reform bekanntlich teils verheerende Auswirkungen. Für das einzig renommierte deutsche Rechtschreib-Wörterbuch ist in der Weise verfahren worden, dass man – durch die Hintertür – seine verloren geglaubte Vormachtstellung dadurch aufrechterhalten (und erneuert) hat, dass Empfehlungen zur Schreibung gegeben worden sind. Mit dem Wirrwarr der Reform ist man aber auch im Rechtschreib-Duden (Bezug ist: 11. Aufl. 2009 sowie „Duden online“) in zwei Bereichen nicht zurechtgekommen:

Lexikographie und Wörterbuchforschung im Alltag

321

kaum zu durchschauende Trennungsmöglichkeiten, und die Probleme mit der Getrennt- und Zusammenschreibung. Da dieses Wörterbuch (neben anderen) bei der völligen Überarbeitung von Wörterbüchern (vgl. unter 2.2.) stets vergleichend eingesehen worden ist, könnten diesbezüglich – und darüber hinaus – sämtliche Unzulänglichkeiten benannt werden. – Durch die vielen Trennungsmöglichkeiten kann beim besten Willen niemand durchsteigen. Dies ist der Sache nach aber nicht dem Rechtschreib-Duden anzulasten; vgl. stellvertretend für viele Fälle: Ki-no-re-k-la-me, aber Re-kla-me (also einmal „k“ allein, einmal „kla“); vgl. auch Kul-tur-in-dus-trie und In-dus-t-rie (einmal „t“ solo, einmal „trie“); vgl. auch myo-morph, aber my-o-pisch, oder My-osi-tis, aber Myo-to-mie. – Die Angaben zur Getrennt- und Zusammenschreibung sind oft wirr; teils lässt man Problemfälle samt Stichwörtern einfach weg. Sieht man z.B. unter heiß (im Printwörterbuch: umrandetes Kästchen) nach, findet man: „der Motor hat sich heiß gelaufen“ (getrennt geschrieben), aber „jemandem die Hölle heißmachen“ (zusammen) – und zwar unter „Schreibung in Verbindung mit Verben“. Sollte es etwa (man weiß ja nicht, was darunter zu verstehen ist) an der „übertragenen Bedeutung“ liegen? So heißt es für stehen lassen/stehenlassen („am Bahnhof stehen lassen/stehenlassen“, „Suppe stehen lassen/stehenlassen“): „Bei übertragener Bedeutung kann getrennt [sic!] oder zusammengeschrieben werden“. Aber wo ist hier etwas „übertragen“? Wenn man eine „Suppe stehenlassen“ kann, dann müsste doch auch ein Motor „heißlaufen“ können – und nicht nur „heiß laufen“! – Wer nach der Schreibung von gut erhalten sucht, wird nicht fündig. Wahrscheinlich passt das nur nicht in die Lemma-Reihe mit alternativer Getrenntoder Zusammenschreibung: gut aussehend/gutaussehend, gut bezahlt/gutbezahlt, gut dotiert/gutdotiert; möglicherweise gibt es aber schlicht Zweifel, ob man das tatsächlich auch zusammenschreiben kann. Und schließlich: Man erkläre einmal jemandem, warum es heißt tot geglaubt und totgeglaubt, dann auch Totgeglaubte sowie tot Geglaubte? Hingewiesen sei auch auf die absurde Doppelform Andersdenkende und anders Denkende. Derartige Probleme bzw. Ungereimtheiten sind nicht die eines „Duden“ oder eines anderen Wörterbuchs, worauf bereits hingewiesen worden ist, sondern sie kommen durch die teils unausgegorenen und nicht durchdachten Reformbemühungen zustande. Damit mussten die Wörterbücher irgendwie versuchen, fertig zu werden.

3.2 Zweites Szenario: wahnhafte Einflussnahmen Aufgrund der letztlich undurchschaubaren Situation, was eine verlässliche sprachliche Orientierung (in sämtlichen Sprachfragen, nicht nur solcher zur Rechtschreibung) angeht, einer weithin gegebenen mangelnden Bildung bzw. Ausbildung großer

322

Werner Wolski

Teile der Bevölkerung, sowie der Überflutung des Internets mit unzähligen Beiträgen Unbedarfter (auch zu Sprachfragen), ist heute die Situation eingetreten, dass völlig wirre bis pervertierte Vorschläge bzw. Forderungen zunehmend an Einfluss gewinnen konnten und teils sogar akzeptiert worden sind. Hierzu werden an dieser Stelle exemplarisch lediglich zwei Facetten solcher Einflussnahmen angesprochen: (a) „politisch korrekte Sprache“ und (b) Gender-Wahn.

Zu (a) „politisch korrekte Sprache“: Es dürfte bekannt sein, dass sich beispielsweise der „Verband der Sinti und Roma“ von der Namensgebung „Zigeunersoße“ diskriminiert gefühlt und eine Änderung der Bezeichnung verlangt hat (focus.de, 15.08.2013, „Streit um die Zigeunersoße“), wo doch z. B. die Zigeuner in Rumänien (wie aus zuverlässigen Quellen bezeugt werden könnte) die Bezeichnung „Sinti und Roma“ selbst zurückweisen („Ich bin ein ţigan“). Kaum jemand dürfte früher – in der Dichtung sowie in Opern- und Operetten-Texten etc. – die Absicht verfolgt haben, Zigeuner oder auch Neger diskriminieren zu wollen; vgl. z.B. aus dem „Troubadour“ (Verdi) den „Coro di zingari“/“Zigeunerchor“. Jetzt allerdings sind beispielsweise die Ausdrücke Neger und Zigeuner aus dem Kinderbuch „Kleine Hexe“ von Ottfried Preußler getilgt worden (focus.de, 15.01.2013, „Verlag streicht ‚Neger‘ und ‚Zigeuner‘ aus Kinderbuch“). Dort heißt es dazu: „Ein Verlag hatte diese Begriffe kürzlich streichen lassen [Anmerkung: „Begriffe“ kann man nicht „streichen“, nur die Vorkommen/Verwendungsinstanzen von Ausdrücken bzw. Wörtern].“ – Auf solche Bestrebungen Bezug nehmend, ist deshalb in der Einleitung des Sachregisters zu der Bibliographie von Herbert Ernst Wiegand auch ausdrücklich darauf hingewiesen worden, dass derartigen abwegigen Ansprüchen nicht Rechnung getragen wird. Neben der korrekten Ansetzung z. B. von „Großes Wörterbuch der Zigeunersprache“ gibt es allerdings auch das Stichwort „Stigmatisierung im Wörterbuch“. Darauf, dass man in Kinderbücher von Ottfried Preußler und Astrid Lindgren eingegriffen hat, wird – immerhin – auch in einem Beitrag eingegangen, in dem sich Heidrun Kämper (IDS Mannheim) zu solchen Auswüchsen äußert (rheinneckarblog. de, 19.12.2013, Lydia Dartsch: „Wir müssen ein Bewusstsein stiften“). Dort spricht sich H. Kämper dafür aus, dass man zwar ein „Bewusstsein“ für eine derartige Benennungspraxis schaffen müsse, aber nicht so weit gehen solle, auch Klassiker wie Goethe und Schiller (die „sicher niemanden sprachlich diskriminieren“ wollten) und andere historische Texte „in politisch korrekte Sprache zu übertragen“ und somit umzuschreiben: „Alles andere wäre Geschichtsfälschung.“  



Lexikographie und Wörterbuchforschung im Alltag

323

Zu (b) Gender-Wahn: Nur als wahnhaft und pervertiert zu bezeichnende Vorschläge kursierten im Jahre 2014 im Internet – nicht nur in der Bild-Zeitung (die übrigens in sprachlicher Hinsicht, entgegen aller auch vom Verf. früher gehegten Vorurteile, keineswegs hinter anderen Zeitungen etc. zurücksteht): Danach haben „Soziologen der Berliner Humboldt-Uni einen offiziellen Leitfaden“ für „Feministisches Sprachhandeln“ entwickelt (bild.de, 21.04.2014, Hans-Jörg Vehlewald: „‘Mitarbeita‘, ‚Doktox‘. So soll unsere Sprache entmännlicht werden“). Beispielsweise will man (vgl. den Titel) Mitarbeita samt Plural Mitarbeitas ansetzen, oder auch männlich assoziierte „er“-Endungen (Drucker, Türöffner) in „Drucka“ und „Türöffna“ verändern. Kommentiert werden derartig Bestrebungen am Ende so: „Kleiner Trost: Die Uni-Leitung plant vorerst keine Umsetzung der Vorschläge in amtlichen Schriften …“. Nicht hingewiesen wird (weder in dem genannten, noch in anderen Beiträgen dazu) bedauerlicherweise darauf, dass die Initiatoren solcher Vorschläge unter dem Titel „Wissenschaftler bzw. Wissenschaftlerinnen“ laufen und als solche bezahlt werden! Alles begann, wie Ludwig Eichinger (Direktor des IDS Mannheim) in einem weiteren Beitrag feststellt, mit dem „Binnen-I“. Dieses hatte unser Jubilar übrigens einmal zutreffend (gesprächsweise bei einem Besuch) als „phallisches I“ bezeichnet. Angesichts neuer Anläufe der absonderlichsten Art bleibt Eichinger nach der Lektüre des Leitfadens, wie er zitiert wird, „vergleichsweise unaufgeregt – auch wenn vieles gewöhnungsbedürftig klingt“ (Focus online, 23.04.2014, „Gender-Wahnsinn an Berliner Uni“). Darüber hinaus wird auch sonst im Internet auf ähnliche Bestrebungen eingegangen: So heißen die Studentenwerke in Baden-Württemberg jetzt „Studierendenwerke“. Dies kostet der Landesregierung, die eine solche Änderung beschlossen hat, „ein paar Hunderttausend Euro“ für neue Anschriften an Gebäuden, für Briefköpfe usw. (spiegel.de, 22.08.2014, Daniel Kastner: „Gender, Gender, Geldverschwender“). Schließlich sei des Weiteren auf eine Internet-Seite hingewiesen, in der äußerst kritisch auf eine von Steuergeldern bezahlte Tagung hingewiesen wird (Termin: im Oktober 2015; [Anmerkung W.W.: Eingegangen werden kann darauf an dieser Stelle nicht weiter, da der vorliegende Beitrag zeitlich früher entstanden ist]): „Es lebe der Unsinn! Auf nach Berlin am 9. Oktober 2015. […] Es gibt Realsatire am laufenden Band. Dieter Hildebrandt würde blass, würde er noch leben.“ (Sciencefiles.org, 05.06.2015, von ScienceFiles/kritische Wissenschaft, „Realsatire: Geschlechterreflektierte [sic!] Pädagogik gegen Rechts“). Daraus geht hervor, dass man sich als „Faschist“ beschimpfen lassen muss, wenn man mit dem „Unsinn“ nicht einverstanden ist. Auch das gehört zur heutigen Realität (!) rund um pervertierte Einflussnahmen auf sprachliche Äußerungsformen. Bisher haben lexikographische Ergebnisdarstellungen viele der absurden Vorschläge des Typs „Mitarbeita“ nicht aufgegriffen. Aber es sind bereits längst – auf dem Wege der Anbiederung an den Gender-Wahn, und vermutlich aufgrund von

324

Werner Wolski

Verkaufsinteressen – wesentliche Schritte in diese Richtung gemacht worden: durch Erfindung zahlreicher weiblicher Parallelformen für männliche Ausdrücke. Dass dies ausgerechnet im Rechtschreib-Duden (sowie im „Duden online“) der Fall ist, ist eigentlich erschütternd und stimmt bedenklich. Aber renommierte Lexikograph(inn) en haben sich dazu bisher nie geäußert. Sie dürften derartiges auch nicht einmal bemerkt haben! Wenn man allerdings im Rahmen der Überarbeitung mehrerer Wörterbücher ständig andere Referenztexte beachtet, stößt man auf eigentlich Unglaubliches: Im Rechtschreib-Duden gibt es – in Form von Eigenprägungen – viele absurde weibliche Formen des Typs die Vorständin (zu Vorstand – ein Ausdruck, der bekanntlich Männer und Frauen umfasst; Meldung in Internet-Beiträgen vom 14.01.13). Man weiß nicht, ob man lachen oder weinen soll, wenn man auf weitere absurde Prägungen stößt: Es gibt Angsthäsin, Korinthenkackerin, Raufboldin, Sauberfrau, Scherzboldin, Päpstin mit Päpstinnen, Staatsmännin, Mittelsfrau, Müllfrau, Kopfgeldjägerin, Schwerenöterin, und viele weitere Absurd-Prägungen. Warum gibt es nicht zu Muffel die Muffelin, zu Tausendfüßler die Tausendfüßlerin, zu Messias die Messiasin etc.? Hier wäre noch viel Spielraum für Blödsinn! Im Jahre 2013 ist „der Duden“ vom VDS („Verein deutsche Sprache e.V.“) als „Sprachpanscher des Jahres“ ausgezeichnet worden – aber nicht für derartige Absonderlichkeiten, sondern (in eigentlich ungerechter Weise) aufgrund der Anführung verschiedener Anglizismen. Verkannt wird, dass man viele dieser Anglizismen heute in Wörterbüchern berücksichtigen muss –: Daran führt oft mangels Alternativen kein Weg vorbei! Auch diese Erfahrung ist im Rahmen der völligen Neubearbeitung mehrerer Wörterbücher gemacht worden. Hierzu ist bereits vom Verf. auch in einer Zuschrift an den VDS etwas angemerkt worden, was an dieser Stelle wiederholt sei: Schlimmer als das, was am „Duden“ bezüglich der Anglizismen zu kritisieren war, ist die völlig abwegige Antwort einer Sprecherin der Duden-Redaktion: „Wir machen die Sprache nicht, wir bilden sie objektiv ab“ (ZDF-Text vom 02.09.2013). Wem eigentlich glaubt man derartiges erzählen zu dürfen? Offenbar rechnet man mit dem sprichwörtlichen „Lieschen Müller“ und mit Unbedarften, welche außer dem Duden sowieso kein anderes Wörterbuch – und auch dies meist bloß dem Namen nach – kennen.

4 Purgatorium: „Leichte Sprache“ – noch steigerungsfähig! 4.1 Erstes Szenario: „Leichte Sprache“ Vor dem Hintergrund der angesprochenen sprachlichen Minderleistungen und den absurden Einflussnahmen (mit verwirklichten und – noch – nicht verwirklichten Vorschlägen) ist es nicht verwunderlich, dass man eine Marktlücke erkannt hat, mit

Lexikographie und Wörterbuchforschung im Alltag

325

der sich Geld verdienen lässt. Fadenscheinige Begründungen wie die, alle „Menschen“ (insbesondere auch solche „mit Lernschwierigkeiten“ oder „Behinderte“) einbeziehen zu wollen, müssen dafür herhalten. Es geht gewiss nicht darum, was im seriösen Sinne stets angestrebt werden sollte, nämlich Korrektheit mit Einfachheit der Ausdrucksweise sowie der syntaktischen Konstruktionen zu verbinden: Es geht bei der Ausrichtung auf „Leichte Sprache“ vielmehr darum, dass ein Primitiv-Niveau propagiert wird (vgl. z.B. Internet-Seiten wie http://www.leicht-gesagt.de). Bereits z.B. zur Bundestagswahl im Jahre 2009 (aber verschiedentlich schon zuvor bei Landtagswahlen) haben Bündnis 90/Die Grünen, SPD und „Die Linke“ ihre Programme in „Leichte Sprache“ umformulieren lassen – außer dankenswerterweise nicht die CDU/CSU und die FDP. Immerhin wird im Wahlprogramm der „Linken“ auf folgendes hingewiesen: „Liebe Leserin, lieber Leser, das ist keine Satire, wie auf den ersten flüchtigen Blick angenommen werden könnte […].“ Aber wie ein Hohn auf alle Bildungs-Ansprüche heißt es in „Leichter Sprache“ im Partei-Programm der SPD: „Gute Bildung ist wichtig für alle Menschen. Darum wollen wir: Alle Menschen sollen einen Schul-Abschluss machen.“ (vgl. die Internetseite dazu). Man muss nur das Niveau gegen Null senken –: dann klappt das ganz sicher, möchte man hinzufügen! Dass Real-Satire in einer lexikographischen Ergebnisdarstellung münden kann, zeigt das Wörterbuch „Halt! Leichte Sprache“ (als Ringbuch; mehrere Autoren/Autorinnen; keine Seitenzählung, da Zahlen dann wohl kaum „erlesen“ werden könnten!?). Ausgesucht wurden „400 schwere Wörter“ – kein Basis-Wortschatz, sondern neben Ausdrücken aus dem gesellschaftspolitischen Bereich häufig auch Fremdwörter und Fachausdrücke: Abmahnung, Aids, Arbeitslosen-Geld, Pränatal-Diagnostik, Psychiatrie, Reader, Website - bis hin zu Zivi und zugänglich. Hier kann es gewiss nicht darum gehen, dieses Machwerk ausführlich zu rezensieren. Vielmehr kann nur ausschnittsweise (wahrscheinlich ist dies eine Premiere, da sich bisher offenbar niemand sonst dazu geäußert hat – jedenfalls niemand aus Linguistik und Lexikographie/Wörterbuchforschung) kurz illustriert werden, wie vorgegangen wird: Beispielsweise werden im Vorspann – im Stil von Kindern mit LRS oder Sprachentwicklungs-Störungen/Verzögerungen – Erläuterungen gemacht: Solche Kinder können sich bekanntlich bei ihren Erzählungen nicht in ein Gegenüber hineinversetzen; vielmehr setzen sie das, was sie mitteilen wollen, auch bei anderen als bekannt voraus; vgl.: „Anita Kühnel: „Bei Leichter Sprache ist wichtig, dass man es [Was ist „es“?] gut verstehen kann. Was es heißen soll [usw.]. Gute Erklärungen, was es heißen soll. Beispiele, was es heißen soll.“

Zu dem hier naheliegenden Stichwort An-Alphabet [sic!] und darunter linksbündig angeordnetem An-Alphabetin wird kommentiert: „Das ist eine Person. Diese Person kann nicht lesen. Und nicht schreiben.“

326

Werner Wolski

4.2 Zweites Szenario: Konzept zu einem Wörterbuch An dieser Stelle wird das Konzept eines Wörterbuchs ansatzweise vorgestellt, das – auch, aber nicht nur – durch die Diskussionen um eine „Leichte Sprache“ inspiriert worden ist. Im Unterschied zu „Halt! Leichte Sprache“ zählen hier aber zum Lemmabestand ausschließlich Einheiten des deutschen Basis-Wortschatzes. Der vorläufige Arbeitstitel lautet: „Volkes Wort“. Es wäre dies, sollte es fertiggestellt werden können, das erste Wörterbuch, in welchem an den tatsächlichen gegenwärtigen Sprachgebrauch und an das Verstehens-Niveau weiter Bevölkerungsschichten angeschlossen wird. Damit wird konsequent Abstand genommen von einer Ausrichtung am „vorbildlichen“ sowie „korrekten“ Sprachgebrauch und gleichermaßen an heute als überholt anzusehende elitäre Forderungen nach schulischer und außerschulischer Sprachförderung. Wer angesichts der nachfolgenden Beispiele die Nase rümpft, dies alles für zynisch hält und vielleicht versucht ist, üble elitäre Bemerkungen dazu zu machen, dem sei entgegengehalten: Erstens hat bekanntlich bereits Martin Luther mit Nachdruck darauf hingewiesen, dass es gelte, „dem Volk aufs Maul zu schauen“. Und zweitens sollten sich potentielle Kritiker(innen) aus jeweiligen (auch politischen) Zuständigkeitsbereichen die Frage stellen, wer durch verschiedene Maßnahmen erst die Voraussetzungen für das hier anhand ausgewählter Beispiele präsentierte Sprachniveau geschaffen hat, wer sich Forderungen nach „leichter“ Sprache usw. unwidersprochen gebeugt hat, usw. Das Wörterbuch „Volkes Wort“ ist so konzipiert, dass es kein Wörterbuch für eine ausgewählte Zielgruppe sein soll (sprachlich Minderbemittelte, Lese- und Rechtschreib-Schwache usw.). Auch geht es nicht um eine beispielsweise bei der Lektüre von Parteiprogrammen vorauszusetzende Sprachkompetenz. Diesbezüglich ist von den Zuständigen durchaus nachdrücklich einzufordern, sich verständlich auszudrücken! Allerdings werden politische Konzepte gewöhnlich – auch mündlich und durchaus sehr verständlich – gesellschaftsweit in vielfältiger Form (gerade auch vor Wahlen) vermittelt. Und da ergeben sich für einen Großteil der Bevölkerung die gleichen Verstehens-Probleme wie für schriftliche Äußerungen. „Volkes Wort“ weist hinsichtlich seiner makro-, medio- und mikrostrukturellen Eigenschaften ganz wesentliche Neuerungen auf. An dieser Stelle sei den nachfolgend vorgestellten Kostproben lediglich der Hinweis vorangestellt: Es ist beispielsweise vorgesehen, dass jeder Ausdruck, der rechts vom Doppelpunkt vorkommt, ebenfalls als Stichwort/Lemma angesetzt wird – und zwar in der Form, wie er vorkommt! Beispiel zu beerdigen: „Tote“, „in“, „ein“ „Grab“, „ablegen“; vgl. auch „Hendi → Handy“; „weist → weißt (kuck wissen)“, so auch „wissen“, „kuck → richtig: guck“, „guck → gucken“ usw. usw. Insgesamt wird mit „Volkes Wort“ erstmals ernst gemacht mit dem, was die Sprecherin der Duden-Redaktion (vgl. unter 2.2.) so schön ausgedrückt hat: „Wir machen die Sprache nicht, wir bilden sie objektiv ab!“

Lexikographie und Wörterbuchforschung im Alltag

327

Ballermann: Kneipe in Mallorca (kuck dort), wo du oft bist, wo es gute Musik gibt, und wo du saufen und bumsen kannst beerdigen: Tote in ein Grab ablegen Bett: [bät] Sowas wo man drin schlafen oder noch was anderes machen kann – weist du ja was das ist! (kuck: richtig statt „weist“ = weißt) Bier: was man den ganzen Tag trinken kann, und was deine Frau aus dem Keller holt Ehe: [Eee-he] für Männer das gleiche wie Sex, nur viel teurer. Für Frauen das, was sie bei reichen Kerlen erreichen wollen, um versorgt zu sein Fabrik: wo man was macht, so wie dein Hendi (kuck: richtig = Handy) oder deine Schuhe fliegen: [fliiign] (wie im Flugzeug nur bisschen anders): in der Luft rummachen wie ein Vogel Fogel → musst bei „V“ kucken = Vogel Flugzeug: [fluuukzöik] fliegendes Ding mit dem man zum Ballermann kommt Frau: Du weist ja wie deine Alte ist. Sowas ist das ganz allgemein (kuck: richtig statt „weist“ = weißt) Gans: was so schnattert beim Bauer, und was Weinachten gebraten wird (kuck: richtig = Weihnachten) ganz: heist „alles zusammen“ (kuck: richtig = heißt). Pass auf! Das ist was anderes als das Tier: das schreipst du „Gans“ (kuck auch richtig = schreibst) Grab: Das Loch, wo Tote rein kommen Haus: das, wo du wonen kannst (kuck: richtig = wohnen) intelligent: [in-tel-li-gänt] wenn du viel kannst und ganz schlau bist, dann bist du so Kapelle (1) kleine Kirche, wo Tote erst liegen, bevor sie ins Grab kommen, und wo man singt Kapelle 2: Leute wo Musik machen beim Saufen – ist was anderes als „Kapelle (1)“

328

Werner Wolski

kaufen: was nehmen und dem andern Geld geben Mathe: das, wo man rechnet, wo man mit Zahlen rummacht („1 mal 1“ und so was) Name: das, wie was heißt. Wenn du „Uschi“ bist, ist das dein Name. Partei: [Pa-tai] das was du wählen sollst, wenn du Lust hast Rechtschreibung: [rechtschraibunk] Was die da oben bestimmt haben um richtig zu schreiben Regierung: [Regiierunk] Die da oben, wo über dich bestimmen schlau: [schlauuu] sowas wie intelligent (kuck bei „intelligent“) Schloss1: Teil in der Tür, wo man den Schlüssel nicht rein kriegt, wenn man besoffen ist Schloss2: ganz großes Haus, wo früher hohe Herren (Grafen und so) gewohnt haben Sprache: [schpraaache] was du kannst, wenn du sprechen und wie ein paar Leute sogar schreiben kannst Vogel [vooogl] Tier das meist fliegen kann, musst du aber schreiben mit „V“ und nich mit „F“ (guck: richtig = nicht) wählen: [weeelän] (1) was nehmen was dir gefällt, (2) da hingehen und heimlich eine Partei die für dich gut ist ankreuzen Weihnachten: Tage, wo ein Baum mit Kerzen in der Wohnung ist und du Geschenke kriegst (Schnaps und so) Wissenschaft: was Leute mit ne Menge Kohle machen, wenn die an der Uni waren, zum Beispiel Mathe oder Rechtschreibung Nachbemerkung: So wünschenswert ein solches Wörterbuch auch wäre, das dem tatsächlichen Sprachgebrauch des überwiegenden Teils der (vor allem jüngeren) deutschen Bevölkerung erstmals entsprechen könnte, so wenig verheißungsvoll erscheint die Verwirklichung des Projekts: Denn ein Wörterbuch ist eine Ware, die wesentlich zu dem Zweck angefertigt wird, auch benutzt zu werden. Es ist allerdings nicht davon auszugehen, dass diese von unserem Jubilar als „genuiner Zweck“ bezeichnete Voraussetzung („Benutzer-Voraussetzung“) im vorliegenden Fall je er-

Lexikographie und Wörterbuchforschung im Alltag

329

füllt werden könnte. Sollte man an eine Publikation als Printwörterbuch denken können? Oder sollte man es lieber als Internet-Wörterbuch vorsehen, in welches (außer dem Autor) auch engagierte Personen die ursprüngliche Vorlage ständig um eigene Vorschläge zu bereichern vermöchten? Dies alles ist gegenwärtig noch völlig offen. Auch aus Zeitgründen kann das Projekt (über die skizzierten Vorschläge hinaus) im Moment nicht weiter verfolgt werden – es sei denn, es würden Fördergelder zur Verfügung gestellt.

5 Schlussbemerkung Im vorliegenden Beitrag sind nur einige der Problembereiche angesprochen worden, die für die heutige Situation kennzeichnend sind, und die Einfluss auf lexikographische Ergebnisdarstellungen gewinnen sowie teils bereits gewonnen haben. Nicht angesprochen worden sind andere Aspekte, durch die sich das vermeintlich „wissenschaftliche“ Arbeiten heute auszeichnet: Kaum noch wird – anders, als es der Jubilar jahrzehntelang vorgemacht hat – korrekt bibliographiert. Vielmehr stützt man sich auf zufällig zur Kenntnis genommene Beiträge neueren Datums, während von den „Nachgeborenen“ die Arbeiten vor etwa 1990 als den Urzeiten der Menschheit angehörig betrachtet (oder auch der Zeit des Aussterbens der Dinosaurier) und demnach ignoriert werden. Dies hat teils auch verheerende Auswirkungen auf die Kommentierung von Lemmazeichen in Printwörterbüchern und Online-Wörterbüchern (man denke z. B. an die Funktionswörter). In der Schlussbemerkung des Sachregisters zur Bibliographie von Herbert Ernst Wiegand (erscheint demnächst) wird deshalb ausdrücklich auch auf derartige Miss-Stände eingegangen. Vorausgesetzt ist dabei wie selbstverständlich – in Orientierung an dem, was Bibliothekare/Bibliothekarinnen früher gelernt haben – die Fähigkeit, Titel korrekt aufnehmen zu können, und zwar einschließlich der Abfolge der Titelpositionen samt Interpunktion. Heute ist dieses Wissen auch bei vielen Verlagen nicht mehr vorhanden, was sich oft genug an Hinweisen zur Gestaltung ablesen lässt. Auch solche, nicht zu unterschätzende, Defizite sind im Zusammenhang mit den im vorliegenden Beitrag angesprochenen Problemen zu betrachten. Darüber hinaus verbleibt – vor dem Hintergrund der vielfältigen anderen, für nötig befundenen, Ausführungen zu dem heutigen Umfeld lexikographischer Ergebnisdarstellungen und zu absonderlichen Einflussnahmen auf sprachliche Äußerungsformen – schließlich lediglich das anzumerken, was Reich-Ranicki am Schluss seiner Sendungen (in Anlehnung an eine Formulierung aus Bertolt Brechts „Der gute Mensch von Sezuan“) immer so formuliert hat: „Und so sehen wir betroffen –: den Vorhang zu, und alle Fragen offen!“  

330

Werner Wolski

6 Literatur 6.1 Monographien, Sammelbände, Aufsätze Adorno, Theodor. (1970): Ästhetische Theorie. Frankfurt a.M.: Suhrkamp 1970. Grotlüschen, Anke/Riekmann, Wibke (Hrsg. 2012): Funktionaler Analphabetismus in Deutschland. Münster [usw.]: Waxmann (Alphabetisierung und Grundbildung, Band 10). Konerding, Klaus-Peter/Lehr, Andrea (Hrsg. 1997): Linguistische Theorie und lexikographische Praxis. Symposiumsvorträge, Heidelberg 1997. Tübingen: Max Niemeyer. Lehr, Andrea et al. (Hrsg. 2001): Sprache im Alltag. Beiträge zu neuen Perspektiven in der Linguistik. Herbert Ernst Wiegand zum 65. Geburtstag gewidmet. Hrsg. von Andrea Lehr, Matthias Kammerer, Klaus-Peter Konerding, Angelia Storrer, Caja Thimm, und Werner Wolski. Berlin. New York: Walter de Gruyter. Schönberg, Arnold (1974): Arnold Schönberg Gedenkausstellung 1974. Redaktion: Ernst Hilmar. Wien: Universal Edition AG. Wiegand, Herbert Ernst (Hrsg. 1998): Perspektiven der pädagogischen Lexikographie des Deutschen. Untersuchungen anhand von „Langenscheidts Großwörterbuch Deutsch als Fremdsprache“. Tübingen: Max Niemeyer. Wiegand, Herbert Ernst (2006–2014): Internationale Bibliographie zur germanistischen Lexikographie und Wörterbuchforschung. Berlin. New York: Walter de Gruyter 2006, 2007, 2014 [Band 1 und 2: 2006; Bd 3: 2007; Bd 4: Nachträge 2014; Sachregister erscheint wohl im Dezember 2015]. Wolski, Werner (1986a): Partikellexikographie. Ein Beitrag zur praktischen Lexikologie. Tübingen: Max Niemeyer. Wolski, Werner (1986b): Diskussionsbericht: Autorenwörterbücher – Last und Lust der Germanisten. Podiumsdiskussion mit Günter Grass und Helmut Heißenbüttel. In: Kontroversen, alte und neue. Akten des VII. Internationalen Germanisten-Kongresses, Göttingen 1985. Band 3: Wortschatz und Wörterbuch. Tübingen: Max Niemeyer 1986, 228–236. Wolski, Werner (1997): Die Fachsprache der Metalexikographie. In: Konerding/Lehr (Hrsg. 1997), 219–228. Wolski, Werner (1999): Gedeutetes verstehen – Sprachliches wissen. Grundfragen der Philologie zum Werk Paul Celans aus sprachwissenschaftlicher Sicht. Frankfurt [usw.]: Peter Lang. Wolski, Werner (2009): Wissenschaftliche Einführung: Zur Geschichte der deutschen Rechtschreibung. In: Pons Die deutsche Rechtschreibung, 7–35.

6.2 Wörterbücher Duden-Rechtschreibung (2006) = Duden. Die deutsche Rechtschreibung. 25., völlig neu bearbeitete und erweiterte Auflage. Mannheim [usw.]: Dudenverlag. Halt! Leichte Sprache (2008) = Halt! Leichte Sprache. Das neue Wörterbuch für Leichte Sprache. Hrsg. von „Mensch zuerst, Netzwerk People First Deutschland e.V“. 1. Aufl. Kassel. LGwDaF (1993) = Langenscheidts Großwörterbuch Deutsch als Fremdsprache. Hrsg. von Dieter Götz [u.a.]. Berlin [usw.]: Langenscheidt. Pons Die deutsche Rechtschreibung (2009) = Die deutsche Rechtschreibung. Bearbeitet von […].1. Aufl. Stuttgart: Pons GmbH. Pons Großwörterbuch DaF (2011) = Großwörterbuch Deutsch als Fremdsprache. Bearbeitet von W. Wolski. Unter Mitwirkung und Leitung der Redaktion Pons Wörterbücher. 1. Aufl. Stuttgart: Pons GmbH.

Lexikographie und Wörterbuchforschung im Alltag

331

Pons Kompaktwörterbuch DaF (2012) = Kompaktwörterbuch Deutsch als Fremdsprache. Bearbeitet von W. Wolski. Unter Mitwirkung und Leitung der Redaktion Pons Wörterbuch. 1. Aufl. Stuttgart: Pons GmbH. Pons Schulwörterbuch (2014) = Großes Schulwörterbuch Deutsch. Das Rechtschreib- und Bedeutungswörterbuch. Bearbeitet von W. Wolski. Stuttgart: Pons GmbH.