313 93 4MB
German Pages 250 Year 2021
Korpora in der Lexikographie und Phraseologie
LEXICOGRAPHICA Series Maior
Supplementary Volumes to the International Annual for Lexicography Suppléments à la Revue Internationale de Lexicographie Supplementbände zum Internationalen Jahrbuch für Lexikographie
Edited by Rufus Hjalmar Gouws, Ulrich Heid, Thomas Herbst, Anja Lobenstein-Reichmann, Oskar Reichmann, Stefan J. Schierholz and Wolfgang Schweickard
Volume 160
Korpora in der Lexikographie und Phraseologie Stand und Perspektiven Herausgegeben von Michał Piosik, Janusz Taborek und Marta Woźnicka
Die Publikation dieses Bandes wurde gefördert durch die Fritz Thyssen Stiftung für Wissenschaftsförderung.
ISBN 978-3-11-071680-1 e-ISBN (PDF) 978-3-11-071695-5 e-ISBN (EPUB) 978-3-11-071703-7 ISSN 0175-9264 Library of Congress Control Number: 2020952366 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Angaben sind im Internet über http://dnb.dnb.de abrufbar. © 2021 Walter de Gruyter GmbH, Berlin/Boston Satz: Integra Software Services Pvt. Ltd. Druck und Bindung: CPI books GmbH, Leck www.degruyter.com
Inhaltsverzeichnis Korpora in der Lexikographie und Phraseologie
VII
Rufus H. Gouws Expanding the use of corpora in the lexicographic process of online dictionaries 1 Vida Jesenšek Zur Komplexität der phraseologischen Bedeutung. Lexikographische Aspekte 21 Elżbieta Dziurewicz Lexikographische Behandlung von ausgewählten nicht lemmatisierten deutschen Idiomen 35 Carolina Flinz Korpora als primäre Quellen von Tourlex
57
Tamás Kispál Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern aus der Perspektive des Deutschen als Fremdsprache 85 Barbara Komenda-Earle Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen bis zum „Deutschen Wörterbuch“ von Jacob und Wilhelm Grimm. Digitalisierte historische Wörterbücher als Textkorpora Ryszard Lipczuk Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika 123 Meike Meliss Informationsspektrum und Angabeklassen in der lexikografischen Ressource zum gesprochenen Deutsch: LeGeDe 141 Christine Möhrs Quantitative und qualitative Ansätze zu Stichwortkandidaten für die lexikografische Ressource zum gesprochenen Deutsch: LeGeDe 175
105
VI
Inhaltsverzeichnis
Petra Oboňová Deutsche Fußballsprache in Live-Kommentaren
197
Milka Enčeva, Vida Jesenšek Zur Geschichte der Kolloquiumsreihe zur Lexikographie und Wörterbuchforschung in Südost- und Osteuropa (2000–2018). Begründet von H. E. Wiegand und P. Petkov 225
Korpora in der Lexikographie und Phraseologie Die mit Korpora ermittelten Daten sind im lexikographischen Prozess nicht mehr wegzudenken (vgl. Krishnamurthy, 2006)1. Ihr Einsatz in der Lexikographie reicht von der Ermittlung von Lemmata für konzipierte Wörterbücher, die mit Hilfe von Frequenzlisten erfolgen kann, über reiche syntagmatische Relationen, die sowohl die Valenz als auch weit verstandene syntagmatische Muster umfassen, bis hin zu der Ermittlung von Äquivalenzen in bi- und multilingualen Wörterbüchern. Wie Korpora eingesetzt werden (können), um konkrete Fragestellungen in der Lexikographie zu lösen, versuchen die Autoren von zehn Beiträgen in dem vorliegenden Sammelband zu beantworten. Es handelt sich um Referate, die während des „10. Kolloquiums zur Lexikographie und Wörterbuchforschung“ gehalten worden sind. Die Tagung mit dem Thema „Korpora in der Lexikographie – Stand und Perspektiven“ fand an der Adam-Mickiewicz-Universität in Poznań (Polen) am 19. und 20. Oktober 2018 mit Beitragenden aus Deutschland, Italien, Polen, der Slowakei, Slowenien, Spanien und Südafrika statt. In seinem englischsprachigen Beitrag verweist Rufus Gouws (Stellenbosch) auf die konstant bedeutende Rolle der Korpora in der Planung sowie Zusammenstellung von Wörterbüchern. Dabei hebt er hervor, dass die Online-Umgebung sowohl neue Herausforderungen als auch Gelegenheiten bietet, die Verwendung von Korpora zu erweitern, sodass sowohl der Lexikograph als auch der Benutzer direkt darauf zugreifen und sie verwenden können. Gouws betont dabei, dass die Implementierung dieser Prozeduren auch einen neuen Blick auf den lexikographischen Prozess und verschiedene Wörterbuchstrukturen erfordert. Einen Schwerpunkt in der metalexikographischen Forschung sollten dem Autor zufolge Erforschungen von Strukturen für neue lexikographische Prozesse, Verwendungen von Korpora und neue Methoden zum Abrufen von Informationen bilden. Vida Jesenšek (Maribor) diskutiert in ihrem Beitrag drei lexikographisch relevante, jedoch wenig berücksichtigte Aspekte der phraseologischen Bedeutung: Motiviertheit, Vagheit sowie Sprachhandlungspotential inklusive Sprechereinstellungen. Den Beitrag eröffnet die Skizzierung der prinzipiellen Komplexität der phraseologischen Bedeutung (Abschnitt 2), um im weiteren Teil, anhand der Beobachtung der aktuellen lexikographischen Behandlung ausgewählter Phraseme in allgemeinen Wörterbüchern mit Deutsch (Duden online, DWDS) und im speziellen deutschen phraseologischen Wörterbuch (Duden 11, Redewendungen), zu zeigen, wie unzulänglich die bisherige lexikographische Praxis ist (Abschnitt 3) und wie sie an Qualität gewinnen kann (Abschnitt 4).
1 Krishnamurthy, Ramesh. 2006. Corpus Lexicography. In: Brown, Keith (ed.): Encyclopedia of language and linguistics. Bd. 3. 2. Aufl., Amsterdam, Elsevier: 250–254. https://doi.org/10.1515/9783110716955-203
VIII
Korpora in der Lexikographie und Phraseologie
Im Rahmen ihres Beitrags „Lexikographische Behandlung von ausgewählten nicht lemmatisierten deutschen Idiomen“ beweist Elżbieta Dziurewicz (Poznań), dass Korpora innerhalb der Phraseographie sowohl bei den Fragen der Makro- als auch Mikrostruktur gewinnbringend Einsatz finden und damit zu einer verbesserten lexikographischen Beschreibung beitragen können. Die Autorin unterzieht einleitend konkrete phraseologische Kandidaten einer Frequenzanalyse anhand von DeReKo. Die frequentesten Phraseologismen werden in einer unter Deutschsprachigen aus Deutschland, Österreich und der Schweiz durchgeführten Onlinebefragung berücksichtigt. Auf der Basis der Frequenzanalyse und der Befragung stellt sich heraus, dass nur einige Einheiten von der ursprünglichen Liste Kriterien der Frequenz und Geläufigkeit erfüllen und deswegen Eingang in ein phraseologisches Wörterbuch finden sollten. Mithilfe des Korpus werden nachfolgend typische Umgebung, Varianten, Modifikationspotenzial und der thematische Bereich von sieben üblichen Phraseologismen untersucht. Der Beitrag von Carolina Flinz (Mailand) zeigt, dass Korpora die lexikographische Primärquelle von Tourlex2 sind, d. i. eine zweisprachige wiki-basierte OnlineRessource zur Tourismusfachsprache. In der lexikographischen Quellenstruktur von Tourlex sind, wie die Autorin schreibt, sowohl kleine als auch große zweckgebundene Korpora für die Erarbeitung spezifischer lexikographischer Schritte eingesetzt worden. Tourlex kann als dynamisches Wörterbuch funktionieren, indem weitere (kleinere und größere) Korpora hinzugefügt werden. Im Laufe des lexikographischen Prozesses haben sich auch die Benutzung des Internets als zusätzlicher Recherchemöglichkeit und die Kombination eines korpusbasierten (corpus-based) und eines korpusgesteuerten Ansatzes (corpus-driven) als fruchtbar erwiesen. Tamás Kispál (Göttingen) diskutiert in seinem Beitrag „Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern aus der Perspektive des Deutschen als Fremdsprache“ aus einer lernerlexikographischen Perspektive erstens die Frage, welche deutschen Onlinewörterbücher einen integrierten Zugriff auf Korpusbelege bieten. Zweitens wird die Frage beantwortet, wie Wörterbuchportale diese Belege in der virtuellen Mikrostruktur positionieren und wie sie das Auffinden des entsprechenden Moduls ermöglichen. Dabei ist hier zudem der Aufbau des Moduls der Korpusbelege in den Onlinewörterbüchern von Interesse. Schließlich stellt sich der Autor die Frage, welchen Mehrwert diese Korpusbelege für die Benutzer haben, die Deutsch als Fremdsprache lernen. Dabei werden die gestellten Fragen in zwei einsprachigen deutschen Onlinewörterbüchern, in DWDS und ELEXIKO, exemplarisch untersucht. Im Beitrag von Barbara Komenda-Earle (Szczecin) werden lexikographische Einträge zu den ältesten Phraseologismen des Deutschen am Beispiel der Somatismen untersucht. Die Formen der Somatismen werden in Anlehnung an Wörterbücher des Mittelhochdeutschen, das Frühneuhochdeutsche Wörterbuch und das
2
Korpora in der Lexikographie und Phraseologie
IX
„Deutsche Wörterbuch“ von Jacob und Wilhelm Grimm (1854–1961) verfolgt. Ziel des Beitrags ist es zu ermitteln, wie Phraseologismen in den Wörterbüchern berücksichtigt werden sowie inwieweit ältere historische Wörterbücher des Deutschen über Somatismen, insbesondere Kinegramme und Pseudokinegramme, Aufschluss geben können. Ryszard Lipczuk (Szczecin) untersucht in seinem Beitrag geflügelte Worte, die von Johann Wolfgang von Goethe, Friedrich Schiller, Heinrich Heine, Wilhelm Busch, Bertolt Brecht und anderen Autoren stammen. Es wurde überprüft, inwieweit sie in den heutigen Wörterbüchern registriert wurden. Als Grundlage der Untersuchung dienen: das 10-bändige Dudenwörterbuch (1999) sowie die deutsch-polnischen Großwörterbücher Pons (2007) und PWN (2010), darüber hinaus (für das Deutsche) die Büchmann-Lexika und (für das Polnische) die Lexika von Markiewicz/Romanowski sowie Markiewicz. Die Beiträge von Meike Meliss (Mannheim/Santiago de Compostela) und Christine Möhrs (Mannheim) präsentieren Hintergründe des LeGeDe-Projektes3. Dabei versteht sich die LeGeDe-Ressource als Prototyp für die lexikographische Darstellung der Besonderheiten des standardnahen, gemeinsprachlich gesprochenen Deutsch in der Interaktion, wie es in natürlichen Gesprächen im privaten und institutionellen Kontext genutzt wird. Dadurch wird eine lexikographische Sprachdokumentation korpusbasierter lexikalischer Besonderheiten des gesprochenen standardnahen Deutsch ermöglicht, was primär für Gesprächsforschende, Lexikologen, Sprachwissenschaftler und Sprachlehrende von großem Interesse sein kann. Ziel des Beitrages von Meike Meliss ist es dabei, die einzelnen Angaben als lexikographische Artikelsegmente detailliert zu beschreiben und damit die lexikographische Mikrostruktur der elektronischen LeGeDe-Ressource vorzustellen. Christine Möhrs zeigt Grundannahmen auf, vor deren Hintergrund im LeGeDe-Projekt eine korpusbasierte Methode zur Ermittlung von geeigneten Stichwortkandidaten für den in der Projektlaufzeit entwickelten LeGeDe-Prototyp erarbeitet wurde. Petra Oboňová (Trnava) analysiert in ihrem Beitrag die Kollokationen der deutschen Fußballsprache, die in den Live-Kommentaren der deutschen Bundesliga in der Saison 2018–2019 benutzt wurden. In der empirischen Analyse geht die Autorin von der theoretischen Annahme aus, dass die aus einer Basis und einem Kollokator bestehenden Kollokationen als „typische, spezifische und charakteristische Kombinationen von Wörtern“ (Hausmann 1985: 118) zu betrachten sind. Das Analyseergebnis ist ein Glossar mit Kollokationen der deutschen Fußballsprache, in dem Basen samt ihren Kollokatoren zu finden sind.
3
X
Korpora in der Lexikographie und Phraseologie
Der Band wird mit einem Beitrag zur Geschichte des Kolloquiums zur Lexikographie und Wörterbuchforschung abgerundet, das auf 10 Editionen in fünf Ländern Ostund Südeuropas zurückblicken kann. Dessen Werdegang wird von Milka Enčeva und Vida Jesenšek (Maribor) abschließend präsentiert. Poznań, im Februar 2021 Michał Piosik Janusz Taborek Marta Woźnicka
Rufus H. Gouws
Expanding the use of corpora in the lexicographic process of online dictionaries Abstract: The transition from printed to online dictionaries demands a new and critical look at the prevailing theory of lexicography that was primarily formulated for printed dictionaries. This applies to all aspects of lexicographic theory. One of the components relevant to both printed and online dictionaries is the lexicographic process. This paper gives a brief account of the lexicographic process with an indication of its position and role within a general theory of lexicography. Comments are made regarding the nature and extent of adaptations needed in the formulation of the phases of a lexicographic process in order to respond to the demands of the practice of online lexicography. It is claimed that a reappraisal of the data distribution structure is needed and it is shown how the dynamic nature of the online environment could impact on this structure and increase its scope as a lexicographic structure. A comprehensive data distribution structure opens the possibility for new ways of involving corpora in online dictionaries. Looking at a new form of communication made possible by the internet the distinction between pulling and pushing approaches in the retrieval of information is suggested for the lexicographic practice in the online environment. Corpora should not only be used by lexicographers when compiling their dictionaries but also by users when consulting dictionaries. A data pulling structure is proposed by means of which users can access corpora, including the internet, to find solutions for their unique and very specific lexicographic needs. Keywords: corpus, data distribution structure, data pulling structure, information retrieval structure, lexicographic process, lexicographic theory, search venues Schlagwörter: Data pulling-Struktur, Datendistributionsstruktur, Informationsabfragestruktur, Korpus, lexikographischer Prozess, Suchorte
Acknowledgement: This work is based on the research supported in part by the National Research Foundation of South Africa (Grant specific unique reference number (UID) 85434). The Grantholder acknowledges that opinions, findings and conclusions or recommendations expressed in any publication generated by the NRF supported research are that of the author, and that the NRF accepts no liability whatsoever in this regard. Rufus H. Gouws, Stellenbosch University, [email protected] https://doi.org/10.1515/9783110716955-001
2
Rufus H. Gouws
1 Introduction Dictionaries are containers of knowledge, cf. McArthur (1986). They present data to enable the knowledgeable target user to retrieve information in order to suffice the lexicographic needs that prompted the specific dictionary consultation procedure. As practical instruments, even the earliest dictionaries have had this assignment. The clay tablets produced in Babylon to provide Assyrian equivalents for Sumerian signs, cf. Al-Kasimi (1977: 1–2), already were compiled in response to the needs of an envisaged target user group. Today the user-perspective dominates the planning and compilation of dictionaries. This approach has to ensure that dictionaries include the kind of data that the target users need, and that the presentation of the data is done in an accessible way, determined by the reference skills of the envisaged target user group. Lexicography is dynamic – this applies to both the lexicographic practice and the theory of lexicography. Although the development of lexicography shows numerous changes, the user-directedness has remained a constant golden thread. Modernday lexicographic theory has as its main objective the provision of a sound scientific basis that can enhance the lexicographic practice. The lexicographic practice aims to provide dictionaries that can increase the success rate of consultation procedures executed by knowledgeable target users. All aspects of lexicography need to be viewed and assessed from the perspective of dictionaries as utility instruments – that result from an interactive relation between theory and practice. In discussing some aspects of e-lexicography and the relevance of theory, Rundell (2012: 74) refers to “a period of transition”, and talks about different ways in which dictionary makers have responded to new conditions. Significant transitions in the lexicographic practice, cf. Gouws (2018: 2), have some important things in common, e.g. the endeavours to present data in a better way and to improve the access of users to the data included in dictionaries. This applies to transitions like those from the clay tablet and papyrus leaves to parchment and paper, the move from thematically to alphabetically ordered dictionaries, the introduction of computers to the lexicographic practice, the emergence of lexicographic corpora and the transition from printed to online dictionaries. This last transition can be regarded as extremely significant. It was not a mere change in medium but as one of the most disruptive transitions, it has had comprehensive and far-reaching implications. This migration to the digital era has been a watershed in terms of presentation, access and contents, characterised by a vast array of new possibilities, opportunities and challenges. The transition from printed to online dictionaries has had an impact on every aspect of lexicography. According to Rundell (2012: 72), “it impacts directly on dictionary users.” To negotiate its influence one needs to take a critical look at the full lexicographic environment and all the changes brought about and those that still need to be introduced. This also demands a critical look at the prevailing and changing theory of lexicography and at the use of corpora, a dominant feature of modern-day lexicography.
Expanding the use of corpora in the lexicographic process of online dictionaries
3
2 Development phases in lexicographic theory Gouws (2005) already identified three phases in the development of lexicographic theory. The first phase was characterised by its focus on the linguistic contents of dictionaries. Here Zgusta (1971) played a major role. A second phase witnessed the introduction of extensive research regarding dictionary structures. The extensive publications of Herbert Ernst Wiegand, e.g. Wiegand (1984, 1989a, 1996, 1998, 2000, 2005, 2007, 2008), Wiegand/Beer (2013), Wiegand/Feinauer/Gouws (2013), Wiegand/ Gouws (2013, 2013a) and Wiegand/Smit (2013, 2013a) provided the theoretical point of departure for this phase. The ongoing need to acknowledge the needs of dictionary users was central in the third phase during which lexicographic functions came to the fore, as especially seen in publications by Bergenholtz and Tarp, e.g. Bergenholtz/ Tarp (2002), Tarp (2000, 2008, 2009). The contents, the structures and the functions of dictionaries have been important for printed dictionaries and remain important – also for online dictionaries. The transition of the lexicographic practice to the digital era emphasises the need for and the acknowledgement of an additional phase in the development of lexicographic theory. This is a phase that introduces and negotiates changes in metalexicographic work due to the changing medium opted for in the lexicographic practice. Research regarding the medium of lexicographic products need to be added as a fourth phase to the existing three phases identified in the development of lexicographic theory. Where research during the first three phases in the development of lexicographic theory was primarily directed at the practice of printed dictionaries, albeit that many aspects of this research are also applicable to online dictionaries, the nature of online lexicography compels metalexicographers to formulate innovative strategies directed specifically at the possibilities offered by the digital environment. A focus on the medium also implies new research regarding and a possible re-assessment of all components of a general theory of lexicography and its various subsections. This includes the lexicographic process – a point of departure for the focus of this paper. Lexicographic theory is formulated by metalexicographers, and dictionaries are compiled by lexicographers. Central to any lexicographic procedure, whether on the practical or the theoretical level, is the active participant – the lexicographer. Here the term lexicographer is used to denote both a person embarking on the compilation of dictionaries and the person involved in dictionary research, i.e. both the maker of dictionaries and the metalexicographer. To ensure a successful involvement with lexicography it is important that, from the perspective of lexicographic theory, some criteria and suggestions should be formulated to indicate the typical and minimum qualities of a lexicographer. Due to the professionalization of lexicography as both a practice and a field of study, it is important that potential lexicographers should be able to comply with specific criteria for a career in this field. Negotiating the changing medium also confirms new attitudes and approaches to the notion of a lexicographer. The new environment demands different types of
4
Rufus H. Gouws
expertise that can hardly be found in a single person. Lexicographic tools should no longer be produced by a single lexicographer as part of a lone ranger project, but the practice of lexicography can best be served by a team effort where, depending on the type of dictionary to be planned and compiled, linguist, metalexicographer, IT-expert and subject field expert, among others, combine their efforts.
3 The lexicographic process Wiegand (1984) already identified the four focal areas of dictionary research as historical dictionary research, research regarding dictionary criticism, research regarding dictionary use and systematic dictionary research. Wiegand (1998: 115) confirmed this division. Within the section of systematic dictionary research, provision is made for research regarding the dictionary form and research regarding dictionary structures. This is also a section of the field of dictionary research that should guide the various steps of specific lexicographic processes. A lexicographic process is part of a dictionary plan. According to Wiegand (1998: 136), a dictionary plan can be divided into two sections, i.e. an organisation plan and a dictionary conceptualisation plan. This is the real lexicographic part of the dictionary plan that should guide the lexicographic process. Wiegand (1998: 77) argues that a lexicographic process is constituted by all the lexicographic activities that need to be executed in order to produce a specific dictionary. For printed dictionaries Wiegand (1998: 135) identifies the following five subsections of the lexicographic process: - the - the - the - the - the
general material material material publishing
preparation acquisition preparation processing preparation
phase phase phase phase phase
For online dictionaries the publishing preparation phase can be complemented by the production phase that negotiates all the possibilities of making the dictionary accessible, e.g. on various platforms, in dictionary portals and for different types of devices. According to Wiegand (1989: 251) lexicography is a practice directed at the production of dictionaries so that a further practice, i.e. the cultural practice of dictionary use, can be enabled. This explanation of Wiegand has implications for the nature and extent of a lexicographic process. The lexicographic practice should not see its completion in the finished product but rather in the continued successful use of the product, where consultation procedures lead to optimal and successful retrieval of lexicographic information.
Expanding the use of corpora in the lexicographic process of online dictionaries
5
In online lexicography, the lexicographic process of any specific dictionary could be devised in such a way that it becomes a dynamic and infinite process. Putting the dictionary to use is not seen as a point of completion but as a starting point of a next phase that gives users the opportunity to respond to the product, its contents, data distribution and data presentation by giving advice to help with the ongoing updating and improvement of the dictionary. A system of simultaneous feedback, cf. De Schryver (2013), could be complemented by a system of continuous feedback. De Schryver (2013: 548) explains simultaneous feedback (SF) as: SF can be understood as entailing a dictionary-making method in terms of which the release of several small-scale parallel dictionaries triggers off feedback that is instantly channelled back into the compilation process of a main dictionary.
Continuous feedback would prevail where the ongoing updating of a completed dictionary (or other lexicographic product) is supported by comments and suggestions from the envisaged target users, following from their active use of the dictionary, in typical situations of use, in accordance with the genuine purpose of that dictionary. Continuous feedback could become a vital phase in the lexicographic process of online dictionaries. In this regard, it is important that the feedback should also be with regard to the dictionary sources, including the corpus utilised in the specific lexicographic process. Comments on the corpus could help lexicographers to re-assess their corpus and the way in which they are employing one or more corpora in obtaining the lexicographic data relevant to a specific dictionary.
4 Corpora and the lexicographic process According to Rundell (2012: 72) the migration form print to digital is not the biggest but the second biggest upheaval that lexicography has experienced in the last 30 years, albeit that its influence has had a tremendous impact on dictionary users. He regards the corpus revolution as the biggest upheaval, although it did not affect the users as immensely, because the end product is still a recognisable dictionary. Rundell (2012: 72) says: “The corpus revolution forced a major rethink of lexicographic practice in both ‘analysis’ and ‘synthesis’ modes . . .” As is the case with a lexicographic process, the corpus revolution should be seen as a dynamic and ongoing process with new trends in speech technology, computer and information science constantly presenting new possibilities and innovative changes. Within a typical lexicographic process, corpora have primarily been employed as part of the material acquisition phase, and to a lesser extent the material preparation and processing phases. Lexicographers use corpora to good effect to select their lemma candidates, the relevant senses of a lemma and to determine their respective frequencies of use. This could determine the position of a specific subcomment on
6
Rufus H. Gouws
semantics within the comment on semantics of a dictionary article. In addition, lexicographers rely on corpora for the extraction of co-text entries to be included as example sentences and collocations in the dictionary articles. Corpora are used to obtain data by means of which the dictionary can satisfy different lexicographic functions, especially the communicative functions of text reception, text production, translation and editing as well as the cognitive function. Where dictionaries exhibit a frame structure, cf. Kammerer/Wiegand (1998), the data distribution structure also has to allocate data to texts in the front and back matter sections and for this purpose, data can also be obtained from corpora to ensure a successful transtextual approach to lexicographic functions, cf. Gouws/Steyn (2005). The online environment does not only compel lexicographers to adapt dictionaries and lexicographic theory but also the lexicographic process and the use of corpora in executing the lexicographic process. In the subsequent sections, some aspects of changes in lexicographic theory will be discussed in order to show the implications for the lexicographic process, the approach to and the use of corpora.
5 Expanding the data distribution structure Following the discussion in Bergenholtz/Tarp/Wiegand (1999) the data distribution structure determines the positioning and ordering of data in the different textual components of a dictionary as a text compound and carrier of text types. In printed dictionaries with a frame structure, the venues to which data can be allocated are the central list, texts in the front matter section and texts in the back matter section. Two main types of data distribution structures can be distinguished. These are the single data distribution structure where the central list is the only venue for the distribution of data and an extended data distribution structure where outer texts are employed to accommodate some of the lexicographic data. This distinction is discussed in Bergenholtz/Tarp/Wiegand (1999: 1779). Within the central list of a dictionary, the user can find data in different search venues. Wiegand/Beer/Gouws (2013: 63) distinguish between a search field, a search area and a search zone. The word list constitutes a search field, each article is a search area and within an article, each individual slot that accommodates a type of lexicographic data is a search zone. Gouws (2018) argues in favour of an expansion of the search venues and suggests that a dictionary as a whole, i.e. all the components of the textual book structure, cf. Hausmann/Wiegand (1989: 330), constitutes a search region. Especially in online lexicography a search venue does not always include only a single dictionary but also other dictionaries in the same dictionary portal. Within a dictionary portal, a consultation that results in accessing more than one search region is executed within a broader search position, i.e. a search domain.
Expanding the use of corpora in the lexicographic process of online dictionaries
7
An increase in search venues also has an influence on the data distribution structures. In populating these new search venues, an additional type of data distribution structure comes to the fore, i.e. a comprehensive data distribution structure. Especially in online dictionaries, these new venues often are not constituents of the specific dictionary but fall within the scope of an expanded data distribution structure. Where a dictionary does not function in isolation but e.g. within a dictionary portal or a more comprehensive reference environment where the data distribution structure also determines the allocation of data to search venues beyond the search field, a comprehensive data distribution is realised. A topic coming to the fore in recent metalexicographic research is the influence of the transition from the printed to the digital environment on dictionary structures, cf. Gouws (2014, 2014a, 2014b, 2018a). All lexicographic structures devised for printed dictionaries need to be re-assessed for their possible use in online dictionaries, and online dictionaries need to be assessed to determine which new structures have been introduced. A comprehensive data distribution structure clearly shows that the traditional frame structure of printed dictionaries no longer prevails in online dictionaries. Online dictionaries do not have front or back matter sections. They may have other components besides the word list but these components are not necessarily texts. They may be texts but also video clips, graphs, etc. Consequently, Klosa/Gouws (2015) argue that the online dictionaries can display outer features. Although an online dictionary can still have a compound constituent structure it should no longer be regarded as only a text compound but should rather be seen as a feature compound – and these outer features could also be targets when embarking on the distribution of data. In online dictionaries, the dictionary with its outer features will typically be a search region but where the outer features do not constitute a formal part of a given dictionary they will be part of a search domain. These outer features, along with other dictionaries in a dictionary portal become structured venues for the positioning of lexicographic data. A comprehensive data distribution structure prevails when lexicographers need to distribute their data in more than a single dictionary. This structure allows the inclusion of dictionary-external sources, e.g. other dictionaries in the same dictionary portal, but a comprehensive data distribution structure could go beyond the feature compound and the dictionary portal by also accommodating sources that reside outside the dictionary portal. Where data are found in search venues beyond the dictionary portal, such venues constitute a search universe.
6 An information retrieval structure Lexicographers should be familiar with the data distribution possibilities of the dictionary they are compiling. Dictionary users should be familiar with what they can find in
8
Rufus H. Gouws
a given dictionary and where and how specific data can be accessed. The data distribution structure needs to be complemented by an information retrieval structure that can determine the different procedures a user can execute to reach all the different venues in order to retrieve the required information. This also applies where dictionaryexternal sources and even sources beyond the boundaries of a dictionary portal fall within the scope of a comprehensive data distribution structure. The information retrieval structure should assist users in accessing all venues within the search universe. Rundell (2016: 11) says: The Web and social media have created conditions which have overturned the older, top down media model, where a small number of providers (whether journalists or lexicographers) delivered expertly-curated content to a large number of consumers. Consumers were for the most part passive: a handful of ‘Letters to the Editor’ of a newspaper (or of a dictionary) represented the limits of user-participation. In the new paradigm, ordinary individuals can make a contribution, and increasingly expect to do so.
In his discussion, Rundell primarily focuses on the role of the dictionary user when participating in crowdsourcing, wikis and user-generated content and the potential value of this participation for dictionaries. However, in modern-day lexicography their participation could go much further and lexicographers need to make provision for extended user participation. This should be confirmed in a reformulation of the lexicographic process. One way of enhancing user participation is by expanding the use of an information retrieval structure that allows access to data in a search universe that exceeds the boundaries of single dictionaries and even dictionary portals. This could present lexicography with numerous innovative ways of enriching the results of dictionary consultation procedures.
7 A new approach to the use of corpora As part of the lexicographic process corpora have been used by lexicographers to obtain data, e.g. linguistic expressions to be considered as lemma candidates and example sentences and collocations for inclusion as cotext items. The expansion of data distribution structures to enable both a dictionary-internal and dictionaryexternal positioning of data activated the need for an identification of additional search venues and the need for an information retrieval structure. Systems of simultaneous and continuous feedback have given dictionary users the opportunity to participate in the lexicographic process by assisting lexicographers to improve the quality of their dictionaries. The comment by Rundell (2016: 11) that ordinary individuals can now make a contribution is valid. However, within a well-established dictionary culture it can also be expected that dictionary users have lexicographically come of age. Although they rely on dictionaries as authoritative sources from which they can retrieve information, the technical skills of users in the digital era,
Expanding the use of corpora in the lexicographic process of online dictionaries
9
especially Generation Z, the net citizens or netizens, in accessing data should never be underestimated. They are used to accessing the internet and too often use Google as their first point of entrance when embarking on a search for information – also traditional lexicographic information. Lexicographers need to take a critical look at their own products and try to determine how dictionaries can become the preferred information retrieval instrument for members of the new generation. One of the innovative procedures to add value to the consultation experience of dictionary users is to enrich the data acquisition phase of a lexicographic process. This should be done in such a way that the user would be allowed to access primary and secondary sources, including the corpora that the lexicographer has used, in order to obtain more data than that found in the default presentation of a specific dictionary. When consulting a dictionary for text production purposes the user might need additional typical occurrences of a given word or expression. The relevant dictionary search zones for cotext entries like example sentences and collocations have limited space and the given items will not necessarily suffice the specific needs of a specific user. By including a link in a dictionary article to give the user access to the corpus enables the user to make a selection based on many more actual occurrences of the word represented by the lemma sign. The use of corpora could be increased significantly if access is given to both lexicographer and user. Dictionaries are typically sources of curated data. The user will realize that when consulting a corpus he/she is looking at non-curated data. Where a speech community has embraced a comprehensive dictionary culture, the users of dictionaries will realise this difference between the data in a dictionary and the data in another source, including a corpus. Having access to a corpus can really enhance the extent to which the lexicographic functions of a given dictionary is satisfied. Tarp/Fuertes-Olivera (2016: 277) already discussed advantages and disadvantages of using the internet as a corpus. They argue that lexicographers can use the internet as a corpus in two ways. They can compile their own corpora from texts found on the internet or they use the internet directly as a corpus to obtain data for specific lexicographic uses. Yet again, the lexicographer is the active participant in such a procedure. Some dictionaries already go one step further by giving their users access to dictionaryexternal sources, including the internet, to obtain additional data. Figure 1 displays a screenshot from dict. cc for the lemma sign cellphone.
10
Rufus H. Gouws
Figure 1: From dict.cc.
By clicking on the information icon (“i”) for the lemma cellphone in the left column on the screen the user is directed to the screenshot displayed in Figure 2 where the sources from the search universe that contain data regarding the word cellphone are listed.
Expanding the use of corpora in the lexicographic process of online dictionaries
11
Figure 2: From dict.cc.
A click on any one of these entries guides the user to the selected source. Figure 3 displays the result when the user clicks the entry TheFreeDictionary:
12
Rufus H. Gouws
Figure 3: From TheFreeDictionary.
Users also have the option to move from the article in dict. cc to the internet. Figure 4 displays the destination of the search when clicking on the entry Google:
Expanding the use of corpora in the lexicographic process of online dictionaries
13
Figure 4: From Google (via dict.cc).
Rundell (2016: 11), as cited in a previous section, says, also with reference to dictionary users: “In the new paradigm, ordinary individuals can make a contribution, and increasingly expect to do so.” However, this contribution of dictionary users should not be restricted to their comments and suggestions by means of processes of simultaneous and continuous feedback. The question is not only how can a user contribute more to dictionaries, but also how can users receive more from dictionaries. This can be achieved, among others, by employing a lexicographic process that gives users access to dictionary-external sources and the relevant lexicographic corpora to supplement the information they retrieve from the data on offer in a specific dictionary. Gouws/Tarp (2017: 391) say: Today we are in the middle of a new transition of the material and technological basis of lexicography with the introduction of new production tools and methods as well as new platforms and media for presenting the lexicographic product and the extensive use of corpora for the
14
Rufus H. Gouws
collection of material. The development and technological innovation are going faster than ever before. (. . .) We know the point of departure but we still only have a vague idea of where we will eventually arrive.
Lexicographers also know the point of departure but not where they will eventually arrive. Seeing the theory and practice of lexicography as a team effort compels lexicographers to learn from other disciplines, including Information Science and Computer Science. One possible way of improving the information retrieval dictionaries allow their users is to introduce a lexicographic pulling structure to complement the traditional lexicographic pushing structure.
8 Towards a lexicographic pulling structure Within the field of Information Science Duan et al. (n. d.) explain the difference between a push-medium and a pull-medium: In the sender-push model, the sender knows the identity of a receiver in advance and pushes the message in an asynchronous manner to the receiver. The receiver accepts the entire message, may choose to optionally examine the message, and then accept or discard it. An important aspect of sender-push model is that the entire message is received before any receiver-side processing is performed. In the receiver-pullmodel, it is the receiver who initiates the message transfer by explicitly contacting the sender. The sender passively waits for the receiver and delivers the entire content upon receiving a request. Since it is the receiver who initiates the message transfer, the receiver would have explicit greater control over the message transfer and implicit greater trust in the received content, than in the sender-pushmodel. (Duan et al., n. d.)
Linking these concepts to lexicography Müller-Spitzer (2013: 369) says: Generally, the Internet is considered to be a ‘pull-medium’ rather than a ‘push-medium’ like television, radio, or books . . . Therefore, users are both sender and receiver. They are active in ‘pulling’ data from the website, saving relevant parts, etc. Thus, the Internet provides a very new form of communication in general.
And also It is communication in an innovative combination with new media . . . This general property of the Internet as communication medium obviously has consequences for the property of online dictionaries as one type of text on the Internet. The process of pulling and, thus, representing lexicographic data according to a user request, is essential for EDs and must be considered when the textual structures of EDs are being looked at.
In typical dictionary consultation procedures dictionaries maintain a monodirectional transfer of data. The lexicographer gives and the user takes. With regard to pulling and pushing the lexicographer is the sender who decides on the nature and extent of data to be included in the search field, the search area and the search zone.
Expanding the use of corpora in the lexicographic process of online dictionaries
15
The user is the receiver who takes what is on offer; albeit with some choice in those online dictionaries where a user-profile are used. Dictionary use remains an application of data-pushing procedures with both corpora and other sources determined by the lexicographers who select the data to be presented to the users. Current technology makes it possible to compile dictionaries that can enable users to execute detailed search procedures. When the consultation within the dictionary does not render the necessary results, they could look beyond the search venues within that search region and access a search domain and even a search universe in order to find exactly what they need. By introducing a data-pulling approach in lexicography users can access dictionary-external sources, the lexicographic corpus as well as the internet to obtain additional data. The success of such an approach is determined by a data-pulling structure that enables a retrieval of information in accordance with the needs of the specific user. Gouws (2018b) introduced the idea of a data-pulling structure in dictionaries. A lexicographic data-pulling structure is constituted by an ordered number of elements to enable the phases needed by a dictionary user to proceed from any given point in an online dictionary (either an item or search zone in a dictionary article or an article-external positon like an outer feature) to dictionary-external sources from which the user can retrieve information to satisfy the lexicographic needs that initiated the specific consultation. If, for example, the dictionary does not provide etymological data, but the user is interested in the etymology of a given word, the data-pulling structure could provide a brief pop-up menu at the data-pulling position in the article. This menu then presents the user with data-pulling markers that identify the relevant dictionary-external sources functioning as candidate venues for data-pulling as well as the data types that could be found in a specific source. A click on a specific marker, guides the user to that venue from where that specific data can be pulled. In a similar way, additional cotextual items like example sentences and collocations could also be found. When pulling from the internet the issue of curated versus non-curated data needs to be negotiated. When a user is guided to a dictionary-external source, a pop-up message can inform him/her that they are moving towards a search venue where the data have not been curated by the lexicographers of the dictionary functioning as starting point of the consultation procedure.
9 Data-pulling, corpora and the lexicographic proces Introducing a lexicographic data-pulling structure and giving users the option to access dictionary-external search venues in order to select the specific kind of data to satisfy their specific information needs will change the nature of online dictionaries. Such a dictionary becomes a first venue for information retrieval and in many
16
Rufus H. Gouws
cases it will still remain the end destination of the consultation procedure. However, to increase the information retrieval possibilities an online dictionary can also function as a transition area from which the user chooses to move on to other sources beyond the textual components and features of the specific dictionary. The online dictionary is no longer an isolated product or only a part of a dictionary portal. It becomes a reference network instrument and is elevated to an integrated information device. The dictionary user becomes an active participant in using provided data but also in finding data and retrieving information not directly provided by the lexicographer. To a certain extent, users can take control to get from the search universe exactly what they need without being confronted with a situation of data not relevant to their needs or even lexicographically non-relevant data overload. This could be realised by an overarching data distribution and information retrieval structure. Corpora, whether the internet or a dictionary-specific corpus, become versatile components with the potential to assist the lexicographer as well as the user and to enable the user to find data not considered by the lexicographer for inclusion in a dictionary. As a result, a re-assessment of the lexicographic process is needed. The five phases identified by Wiegand (1998: 135) for printed dictionaries can be maintained as the obligatory lexicographic process. In these five phases, slight adaptations might be needed to account for different approaches in online lexicography. An additional phase, constituting an extended obligatory lexicographic process, can be included. This phase will not necessarily be employed in the lexicographic process of all dictionaries. This phase integrates dictionary use into the lexicographic process and comprises two subsections – both optional components of a lexicographic process. Firstly, it should promote the implementation of procedures of continuous feedback and secondly it should introduce active user participation by means of data-pulling procedures. The latter could be directed at the dictionary-specific corpus but also at the internet as a corpus.
10 In conclusion Corpora have played an important role in the planning and compilation of dictionaries and will continue to do so. The online environment offers new challenges and opportunities to expand the use of corpora so that both lexicographer and user can directly access and use them. Implementing these procedures also demands a new look at the lexicographic process and various dictionary structures. Changes in structures are needed and new structures need to be introduced. Research regarding the structures to accommodate new lexicographic processes, the use of corpora and new ways of retrieving information should retain a prominent focus in metalexicographic research. Online dictionaries can then yet again fulfil the assignment that Amos Komensky (1631) identified for his dictionary the Ianua Linguarum Reserata, that is to unlock the gate of tongues.
Expanding the use of corpora in the lexicographic process of online dictionaries
17
References General references Al-Kasimi, Ali-M. (1977): Linguistics and Bilingual Dictionaries. Leiden: E.J. Brill. Bergenholtz, Henning/Tarp, Sven (2002): Die moderne lexikographische Funktionslehre. Diskussionsbeitrag zu neuen und alten Paradigmen, die Wörterbücher als Gebrauchsgegenstände verstehen. In: Lexicographica 18, 253–263. Bergenholtz, Henning/Tarp, Sven/Wiegand, Herbert Ernst (1999): Datendistributionsstrukturen, Makro- und Mikrostrukturen in neueren Fachwörterbüchern. In: Hoffmann, Lothar, et al. (eds.): Fachsprachen. Languages for Special Purposes. An International Handbook of SpecialLanguage and Terminology Research. Berlin: De Gruyter, 1762–1832. De Schryver, G.-M. (2013): The concept of simultaneous feedback. In: Gouws, Rufus H., et al. (eds.), 548–556. Duan, Zhenhai/Kartik Gopalan/Yingfei Dong (n. d.): Push vs. Pull: Implications of Protocol Design on Controlling Unwanted Traffic. https://pdfs.semanticscholar.org/6f63/ d37b4f8dd655e3594185e74daf4689f55aa1.pdf; last access on August 26, 2019. Gouws, Rufus H. (2005): Meilensteine auf dem historischen Weg der Metalexikographie. In: Lexicographica 21, 158–178. Gouws, Rufus H. (2014): Article Structures: Moving from Printed to e-Dictionaries. In: Lexikos 24, 155–177. Gouws, Rufus H. (2014a): Makrostruktuuraanpassings vanaf gedrukte na e-woordeboeke. In: Tydskrif vir Geesteswetenskappe 54 (3), 481–504. Gouws, Rufus H. (2014b): Expanding the notion of addressing relations. In: Lexicography 1 (2), 159–184. Gouws, Rufus H. (2018): Expanding the data distribution structure. In: Lexicographica 34, 225–237. Gouws, Rufus H. (2018a): Accessibility, access structures and access procedures. In: Jesenšek, Vida/Enceva, Milka (eds.): Wörterbuchstrukturen zwischen Theorie und Praxis. Berlin: De Gruyter, 35–56. Gouws, Rufus H. (2018b): 'n Leksikografiese datatrekkingstruktuur vir aanlyn woordeboeke. In: Lexikos 28, 177–195. Gouws, Rufus H., et al. (2013) (eds.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin: De Gruyter. Gouws, Rufus H./Steyn, Mariza (2005): Integrated outer texts: a transtextual approach to lexicographic functions. In: Barz, Irmhild/Bergenholtz, Henning/Korhonen, Jarmo (eds.): Schreiben, Verstehen, Übersetzen und Lernen: Zu ein- und zweisprachigen Wörterbüchern mit Deutsch. Frankfurt a.M./Bern/New York/Paris: Peter Lang, 127–136. Gouws, Rufus H./Tarp, Sven (2017): Information overload and data overload in lexicography. In: International Journal of Lexicography 30 (4), 389–415. Hausmann, Franz J., et al. (1998–1991) (eds.): Wörterbücher. Dictionaries. Dictionnaires. An International Encyclopedia of Lexicography. Berlin: De Gruyter. Hausmann, Franz J./Wiegand, Herbert Ernst (1989): Component Parts and Structures of Monolingual Dictionaries. In Hausmann, Franz J., et al. (1998–1991) (eds.), 328–360. Kammerer, Matthias/Wiegand, Herbert Ernst (1998): Über die textuelle Rahmenstruktur von Printwörterbüchern. Präzisierungen und weiterführende Überlegungen. In: Lexicographica 14, 224–238.
18
Rufus H. Gouws
Klosa, Annette/Gouws, Rufus H. (2015): Outer features in e-dictionaries. In: Lexicographica 31, 142–172. McArthur, Tom (1986): Worlds of Reference. Cambridge: Cambridge University Press. Müller-Spitzer, Carolin (2013): Textual structures in electronic dicitionaries. In: Gouws, Rufus H., et al. (eds.), 367–381. Rundell, Michael (2012): It Works in Practice but Will it Work in Theory? The Uneasy Relationship between Lexicography and Matters Theoretical. In: Vatvedt Fjeld, R./Matilde Torjusen, J. (eds.): Proceedings of the 15th EURALEX International Congress, 7–11 August 2012, Oslo: Oslo: Department of Linguistics and Scandinavian Studies, University of Oslo, 47–92. Rundell, Michael (2016, unpublished): Dictionaries and Crowdsourcing, Wikis and User-generated Content. Tarp, Sven (2000): Theoretical challenges to LSP lexicography. In: Lexikos 10, 189–208. Tarp, Sven (2008): Lexicography in the Borderland between Knowledge and Non-knowledge. General Lexicographical Theory with Particular Focus on Learner’s Lexicography. Tübingen: Max Niemeyer. Tarp, Sven (2009): Beyond Lexicography: New visions and challenges in the information age. In: Bergenholtz, Henning/Nielsen, Sandro/Tarp, Sven (eds.): Lexicography at a crossroads. Bern: Peter Lang, 17–32. Tarp, Sven/Fuertes-Olivera, Pedro A. (2016): Advantages and Disadvantages in the Use of Internet as a Corpus: The Case of the Online Dictionaries of Spanish Valladolid-UVa. In: Lexikos 26, 273–295. Wiegand, Herbert Ernst (1984): On the structure and contents of a general theory of lexicography. In: Hartmann, Reinhard R.K. (ed.): LEX’eter ‘83 Proceedings. Tübingen: Max Niemeyer, 13–30. Wiegand, Herbert Ernst (1989): Der gegenwärtige Status der Lexikographie und ihr Verhältnis zu anderen Disziplinen. In: Hausmann, Franz J. et al. (1998–1991) (eds.), 246–280. Wiegand, Herbert Ernst (1989a): Aspekte der Makrostruktur im allgemeinen einsprachigen Wörterbuch: alphabetische Anordnungsformen und ihre Probleme. In: Hausmann, Franz J., et al. (1998–1991) (eds.), 371–409. Wiegand, Herbert Ernst (1996): A theory of lexicographic texts. An overview. In: SA Journal of Linguistics 14/4, 134–149. Wiegand, Herbert Ernst (1998): Wörterbuchforschung. Berlin: De Gruyter. Wiegand, Herbert Ernst (2000): Über Suchbereiche, Suchzonen und ihre textuellen Strukturen in Printwörterbüchern Ein Beitrag zur Theorie der Wörterbuchform. In: Wiegand, Herbert Ernst (ed.): Wörterbücher in der Diskussion 4. Tübingen: Max Niemeyer, 233–301. Wiegand, Herbert Ernst (2005): Über die Datenakzessivität in Printwörterbüchern. Einblicke in neueren Entwicklungen einer Theorie der Wörterbuchform. In: Lexikos 15, 1–35. Wiegand, Herbert Ernst (2007): Über Zugriffspfade in Printwörterbüchern. Ein Beitrag zur Schnittstelle von Benutzungshandlungen und Wörterbuchform. In: Lexikos 17, 180–211. Wiegand, Herbert Ernst (2008): Wörterbuchregister. Grundlagen einer Theorie der Register in modernen Printwörterbüchern. In: Lexikos 18, 256–302. Wiegand, Herbert Ernst/Beer, Sandra (2013): Textual architectures in printed dictionaries. In: Gouws, Rufus H., et al. (eds.), 253–273. Wiegand, Herbert Ernst/Beer, Sandra/Gouws, Rufus H. (2013): Textual structures in printed dictionaries. An overview. In: Gouws, Rufus H., et al. (eds.), 31–73. Wiegand, Herbert Ernst/Feinauer, Ilse/Gouws, Rufus H. (2013): Types of dictionary articles in printed dictionaries. In: Gouws, Rufus H., et al. (eds.), 314–366. Wiegand, Herbert Ernst/Gouws, Rufus H. (2013a): Macrostructures in printed dictionaries. In: Gouws, Rufus H., et al. (eds.), 73–110.
Expanding the use of corpora in the lexicographic process of online dictionaries
19
Wiegand, Herbert Ernst/Gouws, Rufus H. (2013b): Addressing and addressing structures in printed dictionaries. In: Gouws, Rufus H., et al. (eds.), 273–314. Wiegand, Herbert Ernst/Smit, Maria (2013a): Microstructures in printed dictionaries. In: Gouws, Rufus H., et al. (eds.), 149–214. Wiegand, Herbert Ernst/Smit, Maria (2013b): Mediostructures in printed dictionaries. In: Gouws, Rufus H., et al. (eds.), 214–253. Zgusta, Ladislav (1971): Manual of Lexicography. The Hague: Mouton.
Dictionaries Komensky, A. 1631. Ianua Linguarum Reserata. dict.cc: https://www.dict.cc/; last access on August 26, 2019. TheFreeDictionary: https://www.thefreedictionary.com/; last access on August 26, 2019.
Vida Jesenšek
Zur Komplexität der phraseologischen Bedeutung. Lexikographische Aspekte Abstract: Determining of a usually complex phraseological meaning is one of the most important areas of a phraseological research. Its corresponding lexicographical documentation and presentation require a systematic and methodically thorough determination and evaluation of empirical language data, as based on the use of textual examples. In the article, three lexicographically relevant aspects of the phraseological meaning and the problem of their lexicographical treatment are discussed: motivation, vagueness and pragmatic potential including speaker’s attitudes. The results are based on the selected examples from the representative German dictionaries Duden online and DWDS (as of 2019) and the German phraseological dictionary Duden 11, Redewendungen. The aim of the research is to point out, once again, inadequacies in phraseological practice and to make suggestions for the improvement. Keywords: phraseology, phraseological meaning, pragmatic potential, lexicography Schlagwörter: Phraseologie, phraseologische Bedeutung, pragmatisches Potential, Lexikographie
1 Einleitung Die Erfassung und Beschreibung der lexikalischen Bedeutung zählen zu den wichtigsten Gebieten der linguistischen Forschung wie auch der theoretischen und praktischen Lexikographie. Der vielfältige phraseologische Wortschatz erscheint dabei noch insbesondere in einem schwierigen Lichte (vgl. Kühn 2003 und 2004 sowie die dort angegebene Literatur), zumal die phraseologische Bedeutung grundsätzlich komplex und Aspekte ihrer adäquaten lexikographischen Erfassung entsprechend zahlreich und vielschichtig sind. Die Komplexität1 der phraseologischen
1 Die Auffassung der semantischen Komplexität unterscheidet sich teilweise von deren Verständnis bei Burger (2015: 74–75). Während Burger die Komplexität insbesondere auf kompositionelle Phrasem-Strukturen bezieht und parallel mit weiteren semantischen Eigenschaften der Phraseologie behandelt (Polysemie, Synonymie, Vagheit und Expressivität), wird sie im vorliegenden Beitrag als grundsätzliche Eigenschaft der phraseologischen Bedeutung verstanden. Vida Jesenšek, Universität Maribor, [email protected] https://doi.org/10.1515/9783110716955-002
22
Vida Jesenšek
Bedeutung umfasst sowohl system- als auch gebrauchsspezifische Aspekte verschiedener Art, was die lexikographische Erfassung entscheidend erschwert. So wundert es nicht, dass die herkömmliche ein- und zweisprachige Lexikographie (mit Deutsch) zu diesem Punkt beträchtliche Mängel aufweisen. Dieses Manko wird von der phraseologischen und metalexikographischen Forschung seit einiger Zeit kritisch betrachtet, etliche Vorschläge zur besseren lexikographischen Praxis wurden bisher aber nur spärlich umgesetzt (vgl. u. a. Grzybek 1984, Kühn 2004, Korhonen 2011, Jesenšek 2014, 2015, 2018, 2019). Auffallend ist, dass Wörterbücher ihre Benutzer viel zu oft zu extremen Vereinfachungen der Bedeutung einzelner phraseologischer Ausdrücke hinführen, etwa dazu, dass man sie durch quasisynonyme Einwort-Entsprechungen semantisch „erklären“ kann (vgl. hierzu ausführlich Dobrovol’skij 2002: 430–431). Zum einen ist es problematisch, dass durch die angenommenen Synonymierelationen zwischen idiomatischer Mehrwortlexik und Einzellexemen nur ein Teil der phraseologischen Gesamtbedeutung lexikographisch erfasst wird, nämlich derjenige der scheinbaren Referenzidentität, also der denotativen Bedeutung. Zum anderen bleibt der essenzielle Aspekt der phraseologischen Bildlichkeit, phraseologietheoretisch als Merkmal der Idiomatizität anerkannt, lexikographisch entweder völlig unberücksichtigt oder er wird bestenfalls inadäquat behandelt; dabei handelt es sich um eine semantische Qualität, die bei motivierten Phrasemen „grundsätzlich einen unabdingbaren Bestandteil des Inhaltsplanes“ darstellt (ebd.: 432). Vergleicht man Phraseme mit ihren denotativ übereinstimmenden Einwortlexemen, so erweist sich in der Regel, dass erstere durch einen semantisch-pragmatischen Mehrwert ausgezeichnet sind. Um die Aspekte der komplexen phraseologischen Bedeutung identifizieren und somit lexikographisch adäquat erfassen zu können, benötigt man eine methodisch durchdachte systematische Ermittlung der Sprachdaten zu den Eigenheiten des Phrasemgebrauchs. Mehr noch: Bei mehreren Phrasemklassen ist die lexikographische Erfassung der phraseologischen Bedeutung ohne empirische Daten zum textuellen Vorkommen gar nicht möglich. Das gilt etwa für die Bedeutung pragmatischer Phraseme (Routineformeln), bei denen kontextuelle und situative Gebrauchsaspekte bedeutungskonstituierend sind und somit zum notwendigen Teil ihrer lexikographischen Erfassung werden. Die bisherige lexikographische Praxis in vielen (allgemeinen und speziellen) Wörterbüchern ist in dieser Hinsicht nicht zufriedenstellend, zudem uneinheitlich und inkonsequent, was sich an den Beispielen im weiteren Verlauf dieses Beitrags auch zeigen wird. Bedeutungsparaphrasen zu vielen Phrasemen betreffen oft nur das Denotative, während nichtdenotative, funktional-pragmatische, soziale oder expressive Bedeutungskomponenten nicht expliziert werden oder im besten Fall nur an den Belegen/Beispielen bzw. wertenden Markierungen (salopp, scherzhaft, umgangssprachlich u. a.) nachvollziehbar sind. Eine adäquate Erfassung der komplexen phraseologischen Bedeutung bleibt für die praktische Lexikographie nach wie vor eine große Herausforderung.
Zur Komplexität der phraseologischen Bedeutung. Lexikographische Aspekte
23
In diesem Beitrag2 werden drei lexikographisch relevante Aspekte der phraseologischen Bedeutung näher diskutiert: Motiviertheit, Vagheit und Sprachhandlungspotential samt Sprechereinstellungen. Die Überlegung erfolgt anhand der aktuellen lexikographischen Erfassung der Phraseme in zwei repräsentativen allgemeinen Wörterbüchern mit Deutsch (Duden online, DWDS) und im speziellen deutschen phraseologischen Wörterbuch (Duden 11, Redewendungen). Das Ziel ist, erneut auf die Unzulänglichkeit der lexikographischen Praxis hinzuweisen und Verbesserungsvorschläge zu unterbreiten. In Abschnitt 2 wird vorerst die prinzipielle Komplexität der phraseologischen Bedeutung skizziert, im darauffolgenden Abschnitt 3 werden ausgewählte Bedeutungsaspekte der Phraseologie anhand aktueller Wörterbuchpraxis kommentierend erörtert. Der Beitrag schließt mit der Diskussion der Analyseergebnisse und einem Ausblick auf künftige lexikographische Erfassung der phraseologischen Bedeutung.
2 Zur prinzipiellen Komplexität der phraseologischen Bedeutung Phraseme sind formal-strukturell und semantisch-pragmatisch komplex. Ihre Semantik-Pragmatik3 ist in der Regel vielschichtig und mehrdimensional. Zu den festen Anteilen der phraseologischen Bedeutung zählen die deskriptive (referenzielle) sowie die nichtdeskriptive Bedeutung. In der Redeweise der gängigen linguistischen Semantik umfasst die Letztere soziale und expressive Bedeutungsanteile. Funktioniert die deskriptive Bedeutung als Beschreibung von Referenzen und Situationen, zeigt die soziale Bedeutung soziale Beziehungen, Werte, Konventionen und/oder soziale Interaktionen an; die expressive Bedeutung dient schließlich zum Ausdruck subjektiver, persönlicher Emotionen, Empfindungen, Bewertungen und Einstellungen (vgl. Löbner 2002: 47–48). Die letztgenannte Dimension der komplexen lexikalischen Bedeutung wird nicht selten mit dem Begriff der Konnotation gedeckt, so z. B. bei Burger (2015: 77), der hierbei über den konnotativen Mehrwert der Phraseologie spricht, welcher unter Umständen aktiviert bzw. realisiert werden kann, vgl.: „Viele Phraseme haben unter konnotativen Aspekten ein Plus gegenüber einer nicht-phraseologischen äquivalenten Formulierung. Zum Teil handelt es
2 Der Beitrag entstand im Rahmen der von der Slowenischen Forschungsagentur (ARRS) finanzierten Untersuchungen zur slowenischen Identität und Kultur in Sprachkontakträumen (P6-0372). 3 Zur Schwierigkeit, sogar zur Unmöglichkeit einer klaren Abgrenzung zwischen Semantik und Pragmatik vgl. u. a. Gutzmann/Schumacher (2018); darin werden vielfältige Fälle besprochen, bei denen semantische und pragmatische Bedeutungsaspekte aufeinandertreffen und welche die so genannte Semantik-Pragmatik-Schnittstelle darstellen. In diesem Beitrag werden beide Aspekte als ganzheitlich-integrativ aufgefasst.
24
Vida Jesenšek
sich dabei aber um latente Eigenschaften, die erst in bestimmten Kontexten wirksam werden.“ Zu den bedeutsamen konnotativen Aspekten der phraseologischen Bedeutung zählen nach Burger die Bildhaftigkeit bei metaphorischen Phrasemen oder rhetorische Merkmale mancher phraseologischen Ausdrücke (Metonymie, Reim und andere Tropen, paarige Strukturen). Der textuelle Einsatz derartiger Phraseme führt beim Rezipienten zur Aktivierung verschiedener Assoziationen, die persönlich-individueller aber auch sozial-kultureller Art sein können und das Verständnis sowie die Interpretation steuern mögen (vgl. Löbner 2002: 48). Die Letzteren sind lexikographisch von besonderer Bedeutung, zumal sie in der Regel auf das pragmatische Wirkungspotential der Phraseologie hinweisen. Abgesehen von der teilweise differenten Auffassung der Bedeutungskomplexität sprachlicher Ausdrücke gilt, dass die phraseologische Bedeutung ganzheitlich, mehrdimensional und in der Idiomatizität einzelner Komponenten begründet ist. Mit dem Begriff der Idiomatizität bezeichnet man die Relation der ganzheitlichen Bedeutung eines Phrasems mit Einzelbedeutungen seiner Komponenten, die aus synchroner Sicht oft gar nicht nachvollziehbar ist. Hierzu spricht man oft von der semantischen Motivation bzw. Motiviertheit. Dazu verfügen Phraseme über kommunikativ-pragmatisches Potenzial. Betrachtet man die Phraseologie im Text, so ist zu hinterfragen, was Sprecher dadurch tun und welche Wirkungen beim Rezipienten evoziert werden können. Aus diesem Blickwinkel seien Phraseme „pragmatisch besonders geladen“ (Kühn 1994: 420); sie verfügen über potenzielle textuell-kommunikative Funktionen, die bedeutungsinhärent und somit lexikographisch relevant sind. An der lexikographischen Behandlung der Phraseologie in der gängigen lexikographischen Praxis (mit Deutsch) bemerkt man eine Art Verlegenheit gegenüber der Erfassung einzelner semantisch-pragmatischer Anteile der ganzheitlichen phraseologischen Bedeutung. Während der deskriptive Bedeutungsanteil als Bezug auf das Außersprachliche (Referenzialität, Denotation) in der Regel nicht fehlt, werden nichtdenotative Bedeutungsaspekte lexikographisch sehr selektiv und auch sehr unterschiedlich behandelt.
3 Lexikographisch relevante nichtdenotative Bedeutungsaspekte der Phraseologie 3.1 Motiviertheit Mit Motiviertheit meint man eine graduierbare, also eine stärker oder schwächer ausgeprägte semantische Eigenschaft der Phraseologie, die besagt, dass die phraseologische Bedeutung anhand ihrer freien Bedeutung bzw. anhand der Bedeutung einzelner Komponenten nachvollziehbar ist (vgl. u. a. Burger 2015: 67–69). Die phrasemexterne Wortgruppen- und/oder Komponenten-Bedeutung gilt somit als Motivationsbasis für
Zur Komplexität der phraseologischen Bedeutung. Lexikographische Aspekte
25
die phraseologische Bedeutung. Motiviertheitsaspekte können individuell-kognitiver, textueller oder historischer Natur sein und sie werden beim Rezipienten gegebenenfalls identifiziert und/oder aktualisiert. Von der historisch bedingten Motiviertheit ist dann die Rede, wenn ein phraseologischer Ausdruck vom Sprecher/Hörer anhand seines etymologischen Wissens semantisiert werden kann; von der textuell bedingten Motiviertheit redet man dann, wenn die phraseologische Bedeutung durch den Kontext semantisch nachvollziehbar gemacht wird; von der kognitiv bedingten und daher psycholinguistisch interpretierbaren Motiviertheit spricht man immer dann, wenn eine phraseologische Wortverbindung und/oder deren einzelne Komponenten bestimmte Assoziationen beim Rezipienten hervorrufen und dadurch zum Phrasemverständnis beitragen. Am wichtigsten sei der semantische Motiviertheitsaspekt, also die Beteiligung der phrasemexternen Bedeutung einzelner Komponenten an der Konstituierung der phraseologischen Gesamtbedeutung – die Phraseologieforschung spricht hierbei von der semantischen Basis des Phrasems, die systembedingt ist und mit der phraseologischen Bedeutung in engem Zusammenhang steht (Burger 2015: 67–68). Phraseme, die über eine phrasemexterne semantische Basis verfügen, gelten als motivierte Phraseme. Im Kontext dieses Beitrags ist von Interesse, inwieweit die Eigenschaft der phraseologischen Motiviertheit jeglicher Art lexikographisch relevant ist und welche Rolle sie bei der lexikographischen Erfassung der phraseologischen Bedeutung innehat. Betrachten wir die lexikographische Behandlung des Phrasems sich aus dem Staub machen in den drei ausgewählten Lexika mit Deutsch: (1)
sich aus dem Staub machen (= ausreißen) (DWDS) sich aus dem Staub[e] machen (umgangssprachlich: sich [rasch und unbemerkt] entfernen; eigentlich = sich in einer Staubwolke heimlich aus dem Schlachtgetümmel entfernen) (Duden online) sich aus dem Staub[e] machen (ugs.): sich rasch (und heimlich) entfernen Kein Mensch . . . stiehlt grundlos ein Auto und macht sich damit aus dem Staube /. . ./ ♦ Diese Wendung bezog sich ursprünglich wohl auf den Staub, der in einem Schlachtgetümmel aufgewirbelt wird und der einem eine unauffällige Flucht ermöglicht. (Duden 11)
Das DWDS verzeichnet das Phrasem unter Bedeutung 1 zum Lemma Staub (‚Menge feinster, sich ablagernder oder in der Luft schwebender fester Teilchen‘), Duden online unter Bedeutung 1 zum Lemma Staub (‚etwas, was aus feinsten Teilen (z. B. von Sand) besteht, in der Luft schwebt, sich als [dünne] Schicht auf die Oberfläche von etwas legt‘). In den beiden allgemeinen Wörterbüchern erfolgt die Angabe des Phrasems unter der erstgenannten Bedeutung der nominalen Komponente Staub. Es kann geschlussfolgert werden, dass die Komponente Staub die semantische
26
Vida Jesenšek
und somit die Motivationsbasis des Phrasems darstellt, vom Lexikographen als solche anerkannt wird und somit das semantische Kriterium für die mikrostrukturelle Anordnung des Phrasems darstellt. Zum Vorschein kommt die Komponente ‚heimlich, unbemerkt‘ in der phraseologischen Gesamtbedeutung ‚sich rasch, unbemerkt, heimlich entfernen‘, obgleich aus synchroner Sicht, ohne den historischen Hintergrund des Phrasems zu kennen, nur schwer identifizierbar. Diese für die entsprechende Entschlüsselung der Motivationsbasis notwendige Komponente der Bedeutungsbeschreibung liefern Duden online, indem, eingeführt durch das die Ursprünglichkeit betonende eigentlich, auf historische Gegebenheiten und Situationen referiert wird und ebenso Duden 11, indem die semantische Motivationsbasis in der Form einer so genannten Herkunftserklärung (i. e. einer Etymologie-Angabe) dargelegt wird. Zugleich wird deutlich, dass die Angabe der Einwort-Entsprechung im DWDS (ausreißen) keine adäquate lexikographische Bedeutungserfassung darstellt, da die semantische Komponente ‚unbemerkt, heimlich‘ dadurch nicht beachtet wird. Vergleichbares ist auch am folgenden Beispiel zu beobachten: (2)
er lügt wie gedruckt (= er lügt sehr stark) (DWDS) lügen wie gedruckt (umgangssprachlich emotional: unglaublich lügen; nach der Erfahrung, dass Gedrucktes oft nicht der Wahrheit entspricht) (Duden online) lügen wie gedruckt (ugs.): hemmungslos lügen . . . der lügt wie gedruckt. Hat er nicht gesagt, er stamme aus der Gegend von Genua? Er ist aber Sizilianer! ♦ Mit der Wendung wird impliziert, dass Gedrucktes erfahrungsgemäß oft nicht der Wahrheit entspricht. (Duden 11)
Das DWDS verzeichnet das Phrasem (eigentlich seine Realisierung im Satz) unter Beispielen zum Lemma lügen, und zwar zusammen mit der Paraphrasierung der semantisch undurchsichtigen Komponente wie gedruckt; Duden online dokumentiert es mit doppelter Markierung (umgangssprachlich und emotional) unter den so genannten Wendungen zum Lemma lügen und fügt einen historischen Kommentar (interpretierbar als Etymologie-Angabe) hinzu. In allen drei Wörterbüchern erscheint das Phrasem unter seiner nichtidiomatischen verbalen Komponente lügen. Angaben zur Entschlüsselung der idiomatischen Komponente wie gedruckt, interpretierbar als historisch bedingte semantische Basis des Phrasems, liefern Duden online und der Duden 11 mit jeweils explizitem Bezug auf Erfahrungen historisch-kultureller Art, während das DWDS hierzu eine nichtidiomatische Paraphrasierung anbietet (sehr stark). Durch die Berücksichtigung weiterer Lexika (Duden Redensarten, DWB) wird deutlich, dass die bisherige uneinheitliche Erklärung der
Zur Komplexität der phraseologischen Bedeutung. Lexikographische Aspekte
27
Phrasem-Entstehung auch differente Interpretationen der semantischen Motivationsgrundlage zulässt, vgl.: Meist wird die Redensart als volkstümlicher Vorwurf gegen den mangelnden Wahrheitsgehalt von Zeitungen und Büchern gedeutet. Man könnte sie aber auch anders erklären: Der Lügner geht so geschickt vor, dass seine Lügen den Anschein erwecken, man könne ihnen genauso vertrauen wie dem gedruckten Wort, im Sinne des Zitats aus Goethes »Faust«: »Denn was man schwarz auf weiß besitzt, kann man getrost nach Hause tragen.« (Duden Redensarten 2007: 111)
Eine ähnliche Erklärung findet man im DWB, wenn die Grimms den Simrock zitieren und die Handlung des Lügens mittels Bedeutungsparaphrase ausführlich und äußerst negativ charakterisieren: lügen können, wie gedruckt; er lügt, wie wenns gedruckt wär, er stiehlt wie wenn erlaubt wär. Simrock sprichw. 354; frevelhaft, unverschämt, niederträchtig, schamlos, boshaft lügen (DWB)
Erneut stellt man fest, dass die Berücksichtigung der Motiviertheit als Eigenschaft mancher phraseologischen Ausdrücke zu ihrer adäquateren lexikographischen Erfassung beitragen kann, zumal dadurch eventuelle nichtdenotative, in unserem Fall negativ wertende Bedeutungsanteile nachvollziehbar werden (‚unverschämt, schamlos, boshaft‘). Aus dieser Perspektive wirkt die Bedeutungserklärung im DWDS (er lügt sehr stark) vereinfachend und kann nicht als adäquate Erfassung der phraseologischen Bedeutung angesehen werden.
3.2 Vagheit Die sprachliche Eigenschaft der Vagheit wird als eine Art semantischer Ungenauigkeit, als Unschärfe sprachlicher Formen, Strukturen und Äußerungen angesehen und somit als deren semantische Flexibilität interpretiert.4 Semantisch vage sind gegebenenfalls auch phraseologische Wortverbindungen. Dabei handelt es sich um Unklarheit, Ungenauigkeit des Begriffsumfangs (der Extension in der Redeweise der Semantikforschung, der Denotation) und somit um Unbestimmtheit der Referenzen (Sachverhalte, Gegebenheiten, Emotionales, Handlungen, Situationen), auf die sich ein Phrasem beziehen kann. Inhaltliche Konzepte solcher Ausdrücke sind allgemein, relational und dadurch verhältnismäßig offen. Vage Ausdrücke können sich auf Vieles beziehen, sie sollen jedoch individuell und kontextuell interpretierbar sein, da nur dadurch Verständlichkeit der Kommunikation gewährleistet werden kann. Semantisch vage Phraseme erlauben eine Anpassung der Denotation im
4 Der Begriff der sprachlichen Vagheit wird in der Linguistik divers diskutiert und zum Teil auch unterschiedlich aufgefasst. Man ist sich vor allem nicht einig, nach welchen Kriterien man die Vagheit identifizieren und von ähnlichen semantischen Phänomenen wie Unbestimmtheit, Kontextabhängigkeit, Mehrdeutigkeit, Vieldeutigkeit, Ambiguität unterscheiden kann (vgl. u. a. Dönninghaus 2005).
28
Vida Jesenšek
jeweiligen Kontext der Äußerung, jedoch bleiben sie weiterhin relativ unbestimmt. Burger (2015: 76) spricht in solchen Fällen über so genannte Leerformeln, die erst in produktiv-rezeptiven Prozessen vom Sprecher/Hörer konkretisiert (aufgefüllt laut Burger) und somit disambiguiert werden – dies ermöglichen der Kontext im weiten Sinne, einschließlich textuelle Einbettung, Textsorte,5 funktionale Ausprägung, gleicherweise aber auch Weltkenntnisse beim Rezipienten, die durch das textuelle Vorkommen des Phrasems aktiviert werden (können). Durch den semantischpragmatischen Aspekt der Vagheit zeichnen sich viele Sprichwörter aus, indem sie generelle, verallgemeinerte Inhalte vermitteln und im Text ein „Ausweichen ins Allgemeine“ ermöglichen (vgl. Lüger 1999: 254). Ihre Interpretation im Sinne einer Disambiguierung, also einer sinnvollen Auflösung der semantisch-pragmatischen Vagheit ist nur kontextuell möglich, die Ausdrucksbedeutung wird somit zur Äußerungsbedeutung (Lesart), die Semantik zur Pragmatik (vgl. Löbner 2002: 64–66). Erfolgt die lexikographische Erfassung derartiger Phraseme kontextisoliert, so ist im Prinzip keine klare semantisch-pragmatische Erläuterung möglich. Es fehlen eindeutige referenzielle Bezüge (Denotation) sowie situative, textuelle, funktionalpragmatische Präzisierungen des üblichen Phrasemgebrauchs. Vgl.: (3)
zwei Fliegen mit einer Klappe schlagen (= einen doppelten Zweck auf einmal, durch ein Mittel erreichen) (DWDS) zwei Fliegen mit einer Klappe schlagen (umgangssprachlich: einen doppelten Zweck auf einmal erreichen) (Duden online) zwei Fliegen mit einer Klappe schlagen (ugs.): einen dopelten Zweck auf einmal erreichen Wer mit seiner Kapitalanlage Steuern sparen will, kann mit dem Kauf einer Immobilie zwei Fliegen mit einer Klappe schlagen. /. . ./ Wie man zwei Fliegen mit einer Klappe schlägt: Jobrotation – Chance für Betriebe und Arbeitssuchende. /. . ./ (Duden 11)
Das DWDS verzeichnet das Phrasem mit der Markierung bildlich unter Bedeutung 1 (‚in zahlreichen Arten vorkommendes, kleines, zweiflügeliges, oft schädliches Insekt . . .‘) zum Lemma Fliege), Duden online unter Wendungen zu Bedeutung 1 (‚ . . . gedrungenes, kleines Insekt mit zwei Flügeln . . .‘) zum Lemma Fliege). Man sieht, die Bedeutungsparaphrasen in allen drei beobachteten Wörterbüchern sind nahezu identisch und sie enthalten keine referenziellen Bezugspunkte; es wird nicht präzisiert, worauf sich zwei Fliegen beziehen könnten, welche Art von
5 Einen äußerst angebrachten kommunikativen Bereich für den Einsatz von vagen (phraseologischen) Ausdrücken stellt die Textsorte Horoskop dar.
Zur Komplexität der phraseologischen Bedeutung. Lexikographische Aspekte
29
Handlung gemeint werden kann, was man dadurch erzielen kann usw. Die Beispielangaben im Duden 11 deuten zwar auf den Kontext der Finanzen bzw. des Arbeitsmarktes hin, allerdings sind viele weitere Kontexte denkbar. An der lexikalen Füllung der phraseologischen Struktur lassen sich die Referenz und seine konkrete Lesart nicht nachvollziehen. Für eine präzisere Erfassung der phraseologischen Bedeutung wäre somit die Präsentation solcher Daten notwendig, die beim Rezipienten die Prozesse der Disambiguierung und Referenzbestimmung ermöglichen würden, so z. B. die Angaben zur üblichen (kon)textuellen und situativen Einbettung oder zum pragmatischen Potential und dessen Funktion im Text bzw. dessen Wirkung beim Rezipienten.
3.3 Sprachhandlungspotential und Sprechereinstellungen Die Erforschung pragmatischer Aspekte der Phraseologie hebt sehr oft die als Bewertung qualifizierbaren Handlungen hervor, die mit Phrasemen vollzogen werden (können). Das Wertungspotential phraseologischer Ausdrücke gründet gegebenenfalls in ihrem Bedeutungsgehalt, also enthält die ganzheitliche phraseologische Bedeutung phraseologischer Ausdrücke – möglicherweise auch negative, abwertende bzw. positive, aufwertende Bedeutungsanteile, vgl. etwa ins Gras beißen, den Löffel abgeben im Gegensatz zu sein Leben aushauchen, ins ewige Leben eingehen, aus dem Leben abberufen werden für das Denotat ‚sterben‘. Während der negative Wertungsgehalt bei den genannten Phrasemen aus synchroner Perspektive und ohne Bezug auf kulturell-historische Motivationsbasis eher verdeckt bleibt, lässt sich das Positive zumindest teilweise anhand der phrasemexternen Bedeutung einiger Komponenten entschlüsseln (ewiges Leben, abberufen werden), vgl. (4) und (5): (4)
salopp, derb er musste ins Gras beißen (= sterben) (DWDS) ins Gras beißen (salopp: sterben; vermutlich nach der antiken Vorstellung, dass der Kämpfer beim Todeskampf in Erde oder Gras beißt) (Duden online) ins Gras beißen (ugs.): [eines gewaltsamen Todes] sterben Das geplante Unternehmen war ihm viel zu gefährlich; er hatte keine Lust, ins Gras zu beißen. Der Soldat H. hatte hingegen einer Einheit angehört, bei der es nicht üblich war, ins Gras zu beißen. (Duden 11)
(5)
salopp den Löffel abgeben (= sterben) (DWDS) den Löffel sinken lassen/fallen lassen/hinlegen/wegwerfen/wegschmeißen/ abgeben (salopp: sterben) (Duden online)
30
Vida Jesenšek
den Löffel ebgeben/hinlegen/fallen lassen/wegschmeißen (salopp verhüll.: sterben) Der Soldat stirbt auch nicht, er fällt, oder er hat den Löffel weggeschmissen. . . . ich hätte nie im Leben freiwillig den Löffel abgegeben. Der Löffel steht in dieser Wendung für die lebensnotwendige Tätigkeit des Essens. (Duden 11) In allen beobachteten Wörterbüchern erfolgt die lexikographische Erfassung der Bedeutung durch die Angabe des denotativ gleichen Einwortlexems (sterben), während wertende Bedeutungsanteile durch stilistische Markierungen (salopp, derb, verhüllend) und teilweise durch kulturhistorische motivierungsanzeigende Elemente bzw. Belegangaben, falls diese vorhanden sind, erschließbar seien. Lediglich der Duden 11 ist in der Bedeutungserfassung präziser, zumal jeweils (obgleich uneinheitlich) auch die Todesursache thematisiert wird: ‚gewaltsam‘ in (4) und ‚Aufhören mit der Nahrungszunahme‘ in (5). Bei Sprichwörtern werden zwei funktional-pragmatische Handlungsaspekte festgelegt: In sozialer Funktion sind sie als Formulierungen von sozial anerkannten Überzeugungen, Werten und Normen interpretierbar (Grzybek 1984), in kontextuell-pragmatischer Funktion gelten sie in konkreten Texten und Situationen zugleich als Ausdruck von Sprachhandlungen wie Warnung, Überredung, Argument, Bestätigung, Trost, Besänftigung, Überzeugung, Mahnung, Zurechtweisung, Feststellung, Charakterisierung, Erklärung, Beschreibung, Rechtfertigung, Zusammenfassung (vgl. u. a. Röhrich/Mieder 1977, Kindt 2002, Jesenšek 2014). Beide Aspekte sind in einem wechselseitigen Verhältnis aufzufassen, denn „dass ein Sprichwort z. B. als Stütze in einer Argumentation verwendet werden kann (= kontextuelle Funktion), ist nur möglich, wenn es vom Sprecher und vom Hörer als Formulierung einer generellen Regel (= soziale Funktion) aufgefasst wird“ (Burger 2015: 108). Das textuelle Vorkommen mancher Phraseme ist also mit ihrem Sprachhandlungspotential verbunden; der Sprecher kann mit Hilfe der Phraseologie im Text sprachlich handeln, eine oder mehrere Sprachhandlungen vollziehen. Vgl.: (6)
du kannst stehen, du hast noch junge Beine (= bist noch jung) (DWDS) jüngere Beine haben (umgangssprachlich: besser als eine ältere Person laufen können) (Duden online) jüngere Beine haben (ugs.): besser als ein Älterer laufen können Kannst du das nicht erledigen? Du hast doch jüngere Beine. (Duden 11)
Das DWDS verzeichnet das Phrasem mit der Markierung umgangssprachlich, übertragen unter Beispielen zu Bedeutung 1 (‚Körperglied . . .‘) zum Lemma Bein, das Duden online unter Wendungen zu Bedeutung 1 (‚zum Stehen und Fortbewegen
Zur Komplexität der phraseologischen Bedeutung. Lexikographische Aspekte
31
dienende Gliedmaße . . .‘) zum Lemma Bein. Man sieht: Im DWDS wird die phraseologische Bedeutung verallgemeinert, simplifiziert und dadurch reduziert (jung sein) dargestellt, allerdings deutet die Form der Satzrealisierung auf eine pragmatische textuelle Funktion hin, nämlich auf die Sprachhandlung des Argumentierens für STEHEN. Duden online und der Duden 11 beziehen die Bedeutungsbeschreibung auf die semantische Komponente ‚laufen‘, was als Aktivierung der Semantik der Komponente Beine interpretierbar ist. Die (kon)textuelle Beobachtung des Phrasemgebrauchs deutet darauf hin, dass die illokutive Bedeutungskomponente AUFFORDERUNG bzw. VORSCHLAG ZUR HILFE dem Phrasem immanent ist; dies wird durch die Beispielangabe in Duden 11 auch implizit angegeben – man fragt sich nur, ob eine derartige lexikographische Praxis für den Wörterbuchbenutzer nachvollziehbar ist und einen entsprechenden Rahmen für die Bedeutungsinterpretation zulässt. Vgl. auch: (7)
jeder kehre vor seiner Tür (= jeder kümmere sich um seine eigenen Schwächen) (DWDS) vor seiner eigenen Tür kehren (umgangssprachlich: sich um seine eigenen Angelegenheiten kümmern) (Duden online) vor seiner eigenen Tür kehren/fegen: die eigenen Fehler ablegen [bevor man andere kritisiert] Europa muss auch vor der eigenen Tür kehren. Es muss seine Verantwortung für die Geschichte und Gegenwart der europäisch-afrikanischen Beziehungen annehmen . . . (Duden 11)
Auffallend sind vorerst uneinheitliche Bedeutungsparaphrasen; es werden verschiedene Referenzen angeführt (Schwäche, Angelegenheit, Fehler), was auf die Vagheit der phraseologischen Bedeutung hindeuten mag, vgl. hierzu Kap. 3. 2. Die dem Phrasem immanente Illokution AUFFORDERUNG bzw. RAT wird lediglich angedeutet, und zwar durch die konjunktivische Form der verbalen Phrasemkomponente im DWDS (jeder kehre . . .) bzw. durch das Modalverb müssen in der Belegbeispielangabe im Duden 11. Dadurch werden soziale und handlungspragmatische Bedeutungsanteile lexikographisch zwar anerkannt, jedoch nicht transparent präsentiert. Das Sprachhandlungspotential mancher Phraseme geht häufig Hand in Hand mit Sprechereinstellungen, die gleichzeitig versprachlicht werden. Vgl.: (8)
sich etwas aus dem Kopf schlagen (einen Plan o. Ä. aufgeben) (Duden online) sich etw. aus dem Kopf schlagen (ugs.): ein Vorhaben aufgeben Sie müssen sich das aus dem Kopf schlagen. Sie ist kein Mädchen, das mit einem Freund gehen könnte. (Duden 11)
32
Vida Jesenšek
Die Erfassung der phraseologischen Bedeutung in (8) muss als vereinfachend und reduziert angesehen werden. Der wertende Bedeutungsanteil wird nicht thematisiert; die negative Einstellung des Sprechers zur Referenz (Plan, Vorhaben, vom Sprecher als ‚ablehnend, unrealisierbar, unpassend, unangebracht, unrealistisch‘ gehalten) und das damit verbundene Handlungspotential (AUFFORDERUNG) ist unter Umständen nur im Duden 11 erkennbar, und zwar anhand des einführenden Aufforderungssatzes in der Belegbeispielangabe (sie müssen . . .). Fazit: Die Auswertung ausgewählter Beispiele in den drei gängigen und repräsentativen Wörterbüchern mit Deutsch hat gezeigt, dass die lexikographische Behandlung der komplexen phraseologischen Bedeutung qualitativ nicht ausreichend ist und dass sie etlichen Anforderungen der metalexikographischen und phraseologischen Forschung nicht entspricht. Erhebliche Mängel werden deutlich: – Uneinheitlichkeit, Unvollständigkeit, Vereinfachung, Generalisierung; dies ist vor allem an der Postulierung einer Quasi-Synonymie zwischen Phrasem und Einwortlexem in der Funktion einer Bedeutungsparaphrase nachvollziehbar – Bedeutungsparaphrasen, falls vorhanden, sind primär semantikbezogen, mitunter unsystematisch mit Hinweisen auf bildliches Potential bzw. kulturhistorischen Inhalt der Komponenten bereichert – nichtdenotative Bedeutungsanteile verschiedenster Art werden nur ausnahmsweise explizit angesprochen; eventuell sind sie mit gemeint und an den Belegbzw. Belegbeispielangaben implizit nachvollziehbar – vielfältige spezifische Aspekte der komplexen phraseologischen Bedeutung werden nur ausnahmsweise expliziert – Wortschatzrelationen (Synonymie u. A.) werden in der Regel nicht aufgezeigt.
4 Schlussfolgerungen „Die semantische Beschreibung von Phraseologismen gehört sowohl theoretisch wie praktisch zu den problematischen und schwierigen Gebieten von Phraseologie und Phraseographie – zu viele semantische Aspekte kumulieren in der Beschreibung von Phrasemen . . .“ (Kühn 2004: 147). Wohl hat sich diesbezüglich in der praktischen Lexikographie bis dato nicht viel geändert. Weiterhin bestehen ernste Mängel in der lexikographischen Erfassung des so genannten pragmatischen Mehrwerts der Phraseologie (typisches bzw. präferiertes textuelles Verhalten, (proto)typische Kontexte und Gebrauchssituationen, illokutives Potential, immanente Sprechereinstellungen u. a.), nicht viel besser schneiden Wörterbücher auch bei der systematischen Integration phrasemspezifischer semantischer Merkmale wie Bildhaftigkeit, Motiviertheit, Vagheit, Expressivität ab. Die nichtdeskriptiven Bedeutungsanteile der komplexen phraseologischen Bedeutung werden in der gängigen lexikographischen Erfassung der phraseologischen Bedeutung mehr oder weniger ignoriert,
Zur Komplexität der phraseologischen Bedeutung. Lexikographische Aspekte
33
was insbesondere für nichtmuttersprachliche Sprecher einer Sprache, hier des Deutschen, in produktiven Zusammenhängen einen ernsten Nachteil darstellt. Nach der Auffassung mehrerer Autoren, vgl. stellvertretend Kühn (2004), ist die unzulängliche lexikographische Praxis auf die Tatsache zurückzuführen, dass Beschreibungsansätze und -praktiken der Erfassung von phraseologischer Bedeutung sehr oft, wenn nicht vorherrschend, auf Konzepten der strukturellen Semantik gründen. Dies hat zur Folge, dass die spezifische Komplexität der phraseologischen Bedeutung und die Eigenheiten des Gebrauchs oft am Rande oder überhaupt nicht behandelt werden. Eine bessere Praxis ist allerdings denkbar und auch realisierbar, nämlich dann, wenn durch systematische Auswertung empirischer Korpusdaten, d. h. durch die Analyse einer relevanten Anzahl entsprechender Kontexte eine detaillierte und ganzheitliche Bedeutungsbeschreibung einzelner Phraseme wie auch systematische Festlegung von Gebrauchsüblichkeiten und -tendenzen ermöglicht wären. Durch die angemessene korpusbasierte lexikographische Ermittlung und Erfassung der phraseologischen Bedeutung sollte für den Wörterbuchbenutzer das Wissen über die denotativen sowie nichtdenotativen Bedeutungsanteile einzelner Phraseme und gleichermaßen das Wissen über ihr übliches textuelles Vorkommen erschließbar sein. Nicht zuletzt ist an dieser Stelle auf die lexikographische Beschreibungssprache hinzuweisen: Die komplexe phraseologische Bedeutung soll lexikographisch so dargestellt werden, dass die Kluft zwischen dem Geschriebenen und dem Verstandenen bzw. Interpretierten von Seiten des Benutzers kleinstmöglich ist (vgl. Bielińska 2018). Eine bessere lexikographische Erfassung der phraseologischen Bedeutung ist somit Aufgabe der Phraseologieforschung, der praktischen Lexikographie bzw. Phraseographie, der Korpuslinguistik und der Wörterbuchbenutzungsforschung.
Literatur Bielińska, Monika (2018): Einige Überlegungen zu lexikographischen Kohärenzstrukturen. In: Jesenšek, Vida/Enčeva, Milka (Hrsg.): Wörterbuchstrukturen zwischen Theorie und Praxis. Berlin: de Gruyter, 73–84. Burger, Harald (2015): Phraseologie. Eine Einführung am Beispiel des Deutschen. Berlin: Erich Schmidt Verlag. Dobrovol’skij, Dmitrij (2002): Phraseologie als Datenbank. In: Hartmann, Dieter/Wirrer, Jan (Hrsg.): Wer A sägt, muss auch B sägen. Beiträge zur Phraseologie und Sprichwortforschung aus dem Westfälischen Arbeitskreis. Baltmannsweiler: Hohengehren Schneider Verlag, 429–432. Dönninghaus, Sabine (2005): Die Vagheit der Sprache: Begriffsgeschichte und Funktionsbeschreibung anhand der tschechischen Wissenschaftssprache. Wiesbaden: Harrasowitz Verlag. Duden online = Duden Das Onlinewörterbuch. Berlin: Dudenverlag, Bibliographisches Institut. . Duden Redensarten = Redensarten. Herkunft und Bedeutung. 2. überarbeitete und ergänzte Aufl. Mannheim etc.: Dudenverlag, 2007.
34
Vida Jesenšek
Duden 11 = Redewendungen. Wörterbuch der deutschen Idiomatik. Hrsg. v. Scholze-Stubenrecht, Werner/Haller-Wolf, Angelika. 4., neu bearbeitete und aktualisierte Aufl. Berlin etc.: Dudenverlag, 2013. Ausg. Berlin: Dudenverlag. DWB = Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm. . DWDS = Digitales Wörterbuch der deutschen Sprache. . Grzybek, Peter (1984): Zur lexikographischen Erfassung von Sprichwörtern. In: Grzybek, Peter/ Eismann, Wolfgang (Hrsg.): Semiotische Studien zum Sprichwort – Simple Forms Reconsidered I. Tübingen etc.: Narr, 345–350. Gutzmann, Daniel/Schuhmacher, Petra B. (2018): Schnittstelle Semantik-Pragmatik. In: Wöllstein, Angelika, et al. (Hrsg.): Grammatiktheorie und Empirie in der germanistischen Linguistik. Berlin: de Gruyter, 471–510. Jesenšek, Vida (2013): Das lexikographische Beispiel in der Parömiographie. Formen und Funktionen. In: Lexikos 23, 150–171. Jesenšek, Vida (2014): Pragmatic and stylistic aspects of proverbs. In: Hrisztova-Gotthardt, Hrisztalina/Aleksa Varga, Melita (Hrsg.): Introduction to paremiology. A comprehensive guide to proverb studies. Warsaw/Berlin: de Gruyter, 133–161. Jesenšek, Vida (2015): Sprichwörter in einem allgemeinen elektronischen Wörterbuch. Theoretische und methodische Überlegungen anhand deutsch-slowenischer Sprachdaten in mehrsprachigen Online-Wörterbüchern von PONS. In: Grandl, Christian/McKenna, Kevin J. (Hrsg.): Bis dat, qui cito dat. Gegengabe in paremiology, folklore, language, and literature. Honoring Wolfgang Mieder on his seventieth birthday. Frankfurt am Main etc.: Peter Lang, 189–198. Jesenšek, Vida (2018): Korpusempirische Sprachdaten in der Parömiographie: Potenzial und Grenzen. In: Gondek, Anna/Jurasz, Alina/Szczek, Joanna (Hrsg.): Einblicke, Rückblicke: Beiträge zur deutschen Phraseologie und Parömiologie aus intra- und interlingualer Sicht. Bd. 1. Baltmannsweiler: Schneider Verlag Hohengehren, 59–74. Jesenšek, Vida (2019): Phraseologie und Pragmatik. In: Krevs Birk, Uršula (Hrsg.): Wort – Text – Kultur. Studien zu Ehren von Prof. Dr. Siegfried Heusinger zum 85. Geburtstag = Beseda – besedilo – kultura. Razprave v počastitev 85-letnice prof. dr. Siegfrieda Heusingerja. Ljubljana: Znanstvena založba Filozofske fakultete, 141–153. Kindt, Walther (2002): Kommunikative Funktionen von Sprichwörtern: Ein Beispiel für die notwendige Verbindung von Phraseologie und Pragmatik. In: Piirainen, Elisabeth/Piirainen, I. Tapani (Hrsg.): Phraseologie in Raum und Zeit. Akten der 10. Tagung des Westfälischen Arbeitskreises Phraseologie/Parömiologie (Münster, 2001). Baltmannsweiler: Schneider Verlag Hohengehren, 273–286. Korhonen, Jarmo (2011): Phraseologie und Lexikografie: Phraseologismen in ein- und zweisprachigen Wörterbüchern mit Deutsch. Burlington, Vermont: The University of Vermont. Kühn, Peter (1994): Pragmatische Phraseologie: Konsequenzen für die Phraseographie und Phraseodidaktik. In: Sandig, Barbara (Hrsg.): EUROPHRAS 1992. Tendenzen der Phraseologieforschung. Bochum: Brockmeyer, 411–428. Kühn, Peter (2003): Phraseme im Lexikographie-Check: Erfassung und Beschreibung von Phrasemen im einsprachigen Wörterbuch. In: Lexikographica 19, 97–118. Kühn, Peter (2004): Phrasemsemantik: Von der Kontextisolierung zur Gebrauchsspezifizierung. In: Brdar-Szabó, Rita/Knipf-Komlósi, Elisabeth (Hrsg.): Lexikalische Semantik, Phraseologie und Lexikographie. Abgründe und Brücken. Festgabe für Regina Hessky. Frankfurt am Main: Peter Lang, 147–157. Löbner, Sebastian (2002): Semantik. Eine Einführung. Berlin/New York: de Gruyter. Lüger, Heinz-Helmut (1999): Satzwertige Phraseologismen. Eine pragmalinguistische Untersuchung. Wien: Edition Praesens. Röhrich, Lutz/Mieder, Wolfgang (1977): Sprichwort. Stuttgart: Metzler.
Elżbieta Dziurewicz
Lexikographische Behandlung von ausgewählten nicht lemmatisierten deutschen Idiomen Abstract: The following article focuses on the identification and analysis of idiomatic expressions that are not lemmatized in best known printed dictionaries of idioms. As the first step a list of potential phraseological neologisms was created. To validate those phraseological candidates, several steps were used. The first group of selected idioms were those which frequency was 500 occurrences in corpus Deutsches Referenzkorpus (DeReKo). Then an online survey was conducted among German native speakers from Germany, Austria and Switzerland. Those expressions which were known by more than 50% of the informants and had a relatively high frequency are taken into detailed corpus-based analysis. The selected seven idiomatic expressions are analyzed using the DeReKo in terms of the meaning, the frequent partner words, possible variants and modifications. Based on the results of the corpus research, a lemmatization in a German-Polish online dictionary of idioms is proposed. In it, in addition to an equivalent, a style marking, synonyms an example are also given. Keywords: phraseology, phraseography, idiom, phraseological dictionaries Schlagwörter: Phraseologie, Phraseographie, Idiom, phraseologische Wörterbücher
1 Einleitung 1.1 Zielsetzung und Motivation Mit dem folgenden Beitrag wird bezweckt, ausgewählte deutsche in einsprachigen phraseologischen Wörterbüchern nicht lemmatisierte Phraseologismen, die als relativ frequent und gebräuchlich einzustufen sind, korpusbasiert zu analysieren. Zugleich liefert der Artikel eine Lemmatisierung der sieben untersuchten Phraseologismen für ein deutsch-polnisches phraseologisches Onlinewörterbuch.1
1 Der folgende Beitrag versteht sich als Fortsetzung der 2018 angefangenen Studie im Rahmen derer die folgenden sieben Idiome analysiert wurden: – die Karten werden neu gemischt – (etw ist/war für jmdn) wie ein Sechser im Lotto Elżbieta Dziurewicz, Adam-Mickiewicz-Universität, Poznań, [email protected] https://doi.org/10.1515/9783110716955-003
36
Elżbieta Dziurewicz
Die durchgeführte Analyse beschränkt sich auf Phraseologismen im engeren Sinne2, d. h. auf solche Wendungen, die im Zentrum-Peripherie-Modell3 zentral anzusiedeln sind. Berücksichtigt werden ausschließlich Phraseologismen, die das Merkmal der Polylexikalität, relativen Festigkeit und der Idiomatizität aufweisen (vgl. Burger 2010) und die nicht in den relevantesten phraseologischen Nachschlagewerken wie dem Duden 11 Redewendungen (2008), der Deutschen Idiomatik. Wörterbuch der deutschen Redewendungen im Kontext von Schemann (2011) und dem Großen Lexikon der sprichwörtlichen Redensarten von Röhrich (2004) erfasst sind. Die Motivation für diese Studie ist vorwiegend didaktischer Natur. Phraseologismen (darunter auch Idiome) bilden einen wesentlichen Bestandteil des Wortschatzes. Heutzutage herrscht weitgehend Einigkeit darüber, dass sie aufgrund ihrer hohen Frequenz (sowohl in geschriebenen als auch in mündlichen Texten) sowie ihres sprachübergreifenden Charakters einen festen Platz im fremdsprachlichen Unterricht haben sollten.4 Für Lernende stellen Wörterbücher eine wichtige Stütze im Lernprozess dar. Wenn sie auf eine neue Einheit stoßen, sollten sie diese in einem Wörterbuch nachschlagen können. Dies ist bei den im Folgenden behandelten Idiomen nicht möglich. Obwohl diese Phraseologismen zum sprachlichen Usus gehören, was einerseits mithilfe einer Frequenzanalyse im Korpus und andererseits durch eine unter deutschsprachigen Muttersprachlerinnen und Muttersprachlern durchgeführte Befragung bestätigt wurde, sind sie in den genannten Standardwörterbüchern zur Phraseologie nicht notiert. Dieses Fehlen kann in einigen Fällen auf ihren Neologismusstatus zurückgeführt werden. Es befinden sich dort allerdings ebenfalls Einheiten, deren Anfänge in die erste Hälfte des 20. Jahrhunderts zurückreichen. Aus diesem Grund wird auf den Terminus phraseologischer Neologismus (vgl. Schreiber/Mahlow/JuskaBacher 2012) nicht zurückgegriffen.5 Die Frage ob sie in der Tat als phraseologische
– – – – –
Der Drops ist gelutscht. jmd spielt mit jmdm Blindekuh Das Leben ist kein Ponyhof. wie die Geier mit einem Fingerschnipp
Die Ergebnisse wurden während der Tagung 10 Kolloquium zur Lexikographie und Wörterbuchforschung am 20.10.2018 präsentiert und in Dziurewicz (2019) veröffentlicht. Für wertvolle Tipps und Wortmeldungen bedanke ich mich ganz herzlich bei den Teilnehmerinnen und Teilnehmern des Kolloquiums, insbesondere bei Prof. Vida Jesenšek und Prof. Rufus H. Gouws, die meine bisherige Methodologie um Fragen der Etymologie und Synonyme erweitert haben. 2 Zur Differenzierung zwischen Phraseologie im engeren und weiteren Sinne vgl. u. a. Palm (1997). 3 Weiterführendes zur Zentrum-Peripherie-Konzeption, vgl. Lüger (2019). 4 Zum Stellenwert der Phraseologie im Fremdsprachenunterricht vgl. u. a. Kühn (1992), Hessky (1997), Lüger (1997, 2004), Jesenšek (2006), Gündoğdu (2007), Hallsteindøttir (2011) und Ehrhardt (2014). 5 Die Frage der phraseologischen Neologismen wurde innerhalb der Phraseologie bis dato vernachlässigt und wird erst in der Studie von Schreiber/Mahlow/Juska-Bacher (2012) und in
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
37
Neologismen fungieren, die nach 2000 entstanden, ist im vorliegenden Beitrag zweitrangig. Ausschlaggebend ist hier vielmehr die Tatsache, dass sie weit verbreitet und bekannt sind und deshalb in ein phraseologisches Wörterbuch aufgenommen werden sollten.
1.2 Methode der Arbeit Die Analyse umfasste fünf wesentliche Schritte. Zuerst wurde eine Liste potenzieller Phraseologismen erstellt. Sie entstammen vorwiegend eigenen Korpusrecherchen, die ich bei der Arbeit an dem Lehrwerk Phraseologie des Deutschen für polnische Deutschlernende in den Jahren 2016 bis 2020 durchgeführt habe (vgl. Dziurewicz/ Woźniak 2020). Als weitere Quellen galten Medien (insbesondere Presse), Literatur (primär Kinder- und Jugendliteratur) sowie Privatgespräche. Im zweiten Schritt wurde der Status der gesammelten Einheiten in den drei bereits erwähnten phraseologischen Wörterbüchern überprüft. Alle Einheiten, die mindestens in einem dieser Wörterbücher registriert wurden, wurden aus der weiteren Analyse ausgeschlossen. Nur Wendungen, die in allen drei Wörterbüchern nicht lemmatisiert waren, wurden einer Frequenzanalyse im Deutschen Referenzkorpus (DeReKo) unterzogen.6 Diejenigen Einheiten, die mindestens 500 Belege im Korpus hatten, wurden im dritten Schritt der Studie, bei der Online-Befragung berücksichtigt, die einen dritten Schritt der Studie darstellte. Insgesamt 40 Personen, davon 20 Deutsche, 10 Österreicherinnen/Österreicher und 10 Schweizerinnen/Schweizer, nahmen an der Befragung teil. Die erhobenen Angaben zur Person umfassten Alter, Geschlecht, Wohnort und Bildungsabschluss7. Die Fragen bezogen sich auf 20 Einheiten, deren Bekanntheitsgrad sowie ihre Stilmarkierung. Absichtlich wurde bei der Formulierung der Fragen auf die in der
Kovbasyuk (2018) aufgegriffen. Einen bedeutenden Beitrag im Bereich der Parömiologie leistet Mieder (2018), indem er in seinem Plädoyer für eine Parömiographie und Parömiologie moderner Sprichwörter auf ihre möglichen Quellen aufmerksam macht und eine Liste deutscher Sprichwortkandidaten präsentiert. 6 Eine Reihe der Kandidaten waren nur in Schemann (2011) notiert und mussten demnach aus der Untersuchung ausgeschlossen werden. Sie bedürfen allerdings einer exhaustiven Behandlung für die Fremdsprachenlerner, da in diesem Wörterbuch phraseologische Einheiten nur mit Hilfe eines Kontextes erklärt werden und es fehlt eine Bedeutungsangabe in Form einer Paraphrase. 7 Die Frage lautete: Was ist Ihr höchster Bildungsabschluss? Mögliche Antworten waren: kein Schulabschluss, Grund-/Hauptschulabschluss; Realschule, Abitur, abgeschlossene Ausbildung, Fachhochschulabschluss; Hochschule (Diplom); Hochschule (Magister); Hochschule (Promotion).
38
Elżbieta Dziurewicz
Phraseologie gängigen Termini Phrasem, Phraseologismus, Idiom verzichtet, weil Laien mit diesen nur selten vertraut sind. Die Fragen lauteten wie folgt: – Die Redewendung: den Spagat schaffen mit der Bedeutung etwas miteinander vereinbaren können: a) ist mir unbekannt b) schon gehört, Bedeutung aber unklar c) kenne und verstehe ich, verwende sie selbst nicht d) kenne ich und verwende sie selbst –
Die Redewendung: den Spagat schaffen ist Ihrer Meinung nach; a) Eher standardsprachlich (hochdeutsch) b) Eher umgangssprachlich c) Eher salopp d) Ich weiß nicht
Im vierten Schritt, der korpusbasierten Analyse, wurden nur jene Phraseologismen miteinbezogen, die mehr als die Hälfte der Befragten kannten (d. h. all diejenigen, die bei der Frage zur Geläufigkeit Antwort c oder d angekreuzt haben). Auf diese Weise wurden die untersuchten Einheiten – wie im Falle der von Hallsteinsdóttir/ Šajánková/Quasthoff (2006) erstellten Optimumliste – nach dem Kriterium der Frequenz und Geläufigkeit ausgesondert.8 Bei der Korpusrecherche stand die Frage nach den lexikalischen und grammatischen Präferenzen des jeweiligen Ausdrucks im Mittelpunkt des Interesses. Auf Grundlage der Ergebnisse der korpusbasierten Analyse und der Befragung wurde im letzten fünften Schritt eine Lemmatisierung vorgeschlagen. Diese berücksichtigt in Anlehnung an Taborek (2018) die Fragen der Makro- (Zuordnung) und Mikrostruktur (Nennform, Stilmarkierung, Beispiele und Äquivalente).
2 Fallstudien Die Analyse besteht aus zwei Teilen, einem korpusbasierten sowie einem lexikographischen Teil und ist nach demselben Muster aufgebaut. Einleitend (im Punkt a) wird eine korpusbasierte Analyse in DeReKo via COSMAS II im Hinblick auf folgende Faktoren vorgenommen: Bedeutung, Varianten, typische Umgebung mithilfe
8 Hollós (2017) hat ebenso bei ihren zehn Vorschlägen für die Konzipierung phraseologischer Online-Wörterbücher auf die Relevanz der Frequenz- und Geläufigkeitsuntersuchungen hingewiesen.
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
39
der Kookkurrenzanalyse9, Modifikationen (in erster Linie wendungsinterne Veränderungen wie z. B. Reduktion, Expansion, Substitution) und Sachgruppen, in denen die untersuchten Einheiten verwendet werden10. Im zweiten Teil (Punkt b) wird die mögliche Lemmatisierung dargelegt. Ettinger (2007: 894) verlangt für den fremdsprachlichen Unterricht „eine präzisere und umfassendere Beschreibung“ der Phraseologismen in Wörterbüchern.11 Diese Forderung wird im Folgenden berücksichtigt. Die bearbeiteten Artikel sind ausführlich und enthalten Informationen zur Stilmarkierung, zur typischen Verwendung, zur möglichen Herkunft, zu Äquivalenten und Synonymen. Dadurch sollten sie nicht nur beim Verstehen der Idiome dienlich sein, sondern die Lernenden auch dabei unterstützen, das entsprechende Idiom im passenden Kontext zu verwenden. Wegen der umfangreichen Beschreibung sind die vorbereiteten Artikel in erster Linie für ein elektronisches Wörterbuch gedacht. Dies entspricht wiederum den Bedürfnissen der Lernenden, welche neuesten Untersuchungen zufolge neue Vokabeln und Wendungen bevorzugt in Onlinewörterbüchern nachschlagen (vgl. Hollós 2017). Bei den verbalen Idiomen werden Nennformen in ihren finiten Formen (3. Ps. Sg. Ind. Aktiv) formuliert, wodurch die Lernenden zusätzliche Informationen über externe Valenz erhalten12. Frequente Varianten werden mit einem Schrägstrich markiert, während fakultative Komponenten durch runde Klammern gekennzeichnet werden. Nach dem Lemma ist ein polnisches Äquivalent zu finden, das in Bezug auf Bedeutung, Stilschicht und Form mit dem deutschen Idiom übereinstimmen sollte (vgl. Misiek 2011: 135 ff.). Daran anschließend befindet sich ein Beleg, der weder zu lang noch zu komplex sein sollte. Außerdem sollte dieser häufige Partnerwörter (jedoch keinen allzu schwierigen Wortschatz) enthalten und die typische Struktur verdeutlichen (vgl. Dziurewicz 2015: 53). Am Ende des Artikels befinden sich Synonyme, bei denen im Regelfall sowohl phraseologische als auch nichtphraseologische Ausdrücke bzw. Lexeme angegeben werden. Bei einigen untersuchten Idiomen war es außerdem möglich, ihre Herkunft bzw. ihre Motivation zu erklären, wodurch ihr Memorieren erleichtert wird.
9 Als Standardwerte werden in Anlehnung an Perkuhn/Belica (2004) fünf Wörter links und rechts ausgewählt. Es werden jeweils Untersuchungen mit und ohne Lemmatisierung und Funktionswörter vorgenommen. 10 Hierbei wird auf die von Dornseiff (2004) vorgeschlagenen Hauptgruppen zurückgegriffen, z. B. Wissenschaft, Essen und Trinken, Sport und Freizeit, Gesellschaft. 11 Mit den Fragen der Erfassung von phraseologischen Einheiten befassen sich ausführlich Kühn (2003), Mellado Blanco (2009), Durčo (2010), Stantcheva (2003) und Jesenšek/Grzybek (2014). Außerdem ist das Kapitel XII des HSK-Bandes zur Phraseologie aus dem Jahr 2007 dieser Problematik gewidmet. Im Bereich des deutsch-polnischen Kontrasts sind die Publikationen von Lipczuk/Lisiecka-Czop/Misiek (2011), Lipczuk/Lisiecka-Czop/Sulikowska (2012) und Bielińska (2010, 2011) zu nennen. 12 Für diese Vorgehensweise plädieren u. a. Krohn (1994) und Ernst (2011).
40
Elżbieta Dziurewicz
2.1 Jmd schafft den Spagat a) Korpusbasierte Analyse Die Trefferquote für diese Einheit beträgt 304313. Der Phraseologismus bedeutet, dass jemand unterschiedliche Dinge miteinander vereinbart. Die Kookkurrenzanalyse in DeReKo verweist auf die Präposition zwischen, die mit Abstand die höchste Frequenz hat (vgl. Beleg 1)14 und mit deren Hilfe ausgedrückt wird, was sich miteinander verbinden lässt (z. B. Beruf mit Familie oder Tradition mit Moderne). Es zeichnet sich die Tendenz ab, das analysierte Idiom mit dem Modalverb müssen zu verwenden (vgl. 2). Die Korpusdaten deuten zudem darauf hin, dass das Idiom relativ häufig zusammen mit Modaladverbien wie z. B. spielend, mühelos, gekonnt, perfekt und souverän eingesetzt wird. Was die grammatischen Kategorien anbelangt, so wird das Verb schaffen bevorzugt im Präsens verwendet. In zahlreichen Belegen sind ebenfalls Infinitivkonstruktionen, die von den Verben gelingen und versuchen (vgl. 4) eingeleitet werden, gebräuchlich. In allen angeführten Belegen wird das Substantiv Spagat übertragen, also im Sinne einer schwer überwindbaren Hürde verwendet. Während im Beleg 1 ausgedrückt wird, dass die Partei ÖVP Schwierigkeiten hat, die Interessen der Regierung und der Opposition miteinander zu vereinbaren, erstrecken sich Belege 2 und 3 inhaltlich auf den Sport. Im Beleg 2 bezieht sich der Ausdruck auf Probleme mit dem Generationswechsel bei Skispringern und in Beleg 3 auf das entsprechende Training. (1) Solcherart hat es die ÖVP mit ihren drei Regierungsmitgliedern schwer, den Spagat zu schaffen zwischen Regierung und Opposition. Der Vorwurf, sie versuche beides zur gleichen Zeit, manifestiert sich nun in den Umfragen: Zwischen vier und sechs Prozentpunkte (sie hält bei 36,4) könnte das Minus am 30. Mai betragen, prognostizierten einige Meinungsforschungsinstitute. (Die Presse, 14.05.2010) (2) Nein, Springer mit großen Namen waren im Herbst ihrer Karriere, und es war klar, dass diese Generation den Weltmarkt nicht dominiert. Wir mussten den Spagat schaffen, aus diesen Athleten Topleistungen herauszuquetschen und junge Springer an den Weltcup heranzuführen. (Hannoversche Allgemeine, 21.11.2016) (3) Dennoch versuchen beide Teams in der Vorbereitung den Spagat zwischen allgemeinem und eben dem punktuellen – auf den 25. Februar ausgerichtetem Training – zu schaffen. Torsten König, Trainer des Tabellenzweiten aus Reislingen „versucht etwas zu verändern in der Saisonvorbereitung“, berichtet Hasenlust. (Braunschweiger Zeitung, 08.02.2007)
13 Stand: Mai 2019. 14 In den Belegsätzen sind die obligatorischen Komponenten des Idioms fett markiert. Die jeweils besprochenen Partnerwörter sind dagegen kursiv gesetzt.
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
41
Der Phraseologismus weist eine Präferenz für Kontextpartner aus den Sachgruppen Gesellschaft und menschliches Zusammenleben auf und lässt vereinzelt Veränderungen seiner Struktur zu. Vorgefunden wurden Belege für Reduktion, bei der das Hilfsverb haben ausgelassen wird. Dieses Verfahren ist insbesondere in Schlagzeilen anzutreffen (vgl. Ptashnyk 2009, Sakowski 2017). Darüber hinaus lassen sich vereinzelt Expansionen belegen, bei denen die phraseologische Basis um Adjektive wie z. B. groß erweitert wird (vgl. 4). (4) Abschließend meint Windholz: „Entscheidend ist für mich die volle Transparenz. Ich gehe unbeirrbar meinen Weg. Gemeinsam mit meinem Koalitionspartner schaffen wir den großen Spagat: sinnvolle Investitionen, intelligentes Sparen und eine schlanke Verwaltung. So, wie wir das jetzt angelegt haben, wird das eine reine Erfolgsstory.“ (NÖN, 24.03.2011)
b) Lexikographische Behandlung Im Polnischen konnte keine idiomatische Entsprechung für jmd schafft den Spagat gefunden werden. Die Analyse im Narodowy Korpus Języka Polskiego (NKJP) hat ergeben, dass dieser Ausdruck nur eine wörtliche Bedeutung hat. Aus diesem Grund wird das Idiom mittels des Lexems godzić coś ze sobą übertragen. In der Glosse sind Kollokatoren zu finden, die aufgrund der Korpusrecherche als einschlägig gelten15. Im Beleg wird darüber hinaus der frequenteste Kookkurrent zwischen angegeben. Als Synonyme werden ein Lexem und ein Idiom notiert. Als mögliche Varianten kommen die Verben hinbekommen und kriegen in Frage, die der Umgangssprache zuzurechnen sind. Lemmatisierung jmd schafft einen Spagat (umg) – ktoś godzi coś ze sobą (życie osobiste z zawodowym), ktoś łączy coś w harmonijny sposób Beleg: Frauen schaffen den Spagat zwischen Familie und Beruf ja auch. Wieso Männer nicht? (St. Galler Tagbl., 10.05.2011) Varianten: jmd kriegt/bekommt den Spagat hin (umg) Synonyme: etw vereinbaren; etw unter einen Hut bringen mögliche Motivation: wortwörtlich eine schwierig auszuführende Übung, bei der die Beine weit voneinander gespreizt sind und eine Linie bilden. Übertragen steht die große Entfernung zwischen den Beinen für schwer überwindbare Schwierigkeiten.
15 Zur Rolle der Glossen in Wörterbüchern vgl. Nerlicki (2011, 2012, 2015).
42
Elżbieta Dziurewicz
2.2 Die Sache/Der Käse/Der Kuchen ist gegessen a) Korpusbasierte Analyse Der Phraseologismus bedeutet das wars, die Sache ist abgeschlossen. Während die Variante mit dem Substantiv Sache 1121 Treffer, aufweist, kommt diejenige mit Käse 824 und mit Kuchen 66716 Mal vor. Es bestand im Falle dieser Einheit eine Schwierigkeit in der Abgrenzung des tatsächlichen idiomatischen und wortwörtlichen Gebrauchs. Deshalb musste mehr als die Hälfte der nicht intendierten Treffer aus der Analyse ausgeschlossen werden. Zu den häufigsten Partnerwörtern gehören die Modaladverbien endgültig (vgl. 5) und definitiv, die die Abgeschlossenheit zusätzlich betonen. Als ein signifikanter Kollokator fungiert des Weiteren die Präposition für, mit deren Hilfe angegeben wird, für wen (z. B. für eine Fußballmannschaft) die Sache abgeschlossen ist (vgl. 6). Den Korpusrecherchen zufolge ist etwa jeder fünfte Beleg negiert, wie in Beleg 7. Die vorgenommene Kookkurrenzanalyse zeigt außerdem, dass das Idiom relativ oft innerhalb einer Infinitivkonstruktion mit dem Verb scheinen auftritt (vgl. 8). Der Phraseologismus weist eine besonders starre Struktur auf. Die behandelten Modifikationsarten konnten nicht ermittelt werden. Inhaltlich erstrecken sich die Textstellen primär auf Sport und Freizeit (davon v. a. Fußball) sowie Gesellschaft (insbesondere Politik). (5) Zu diesem Zeitpunkt führten die Kasseler zwar schon mit 2:0, doch vielleicht wäre mit dem möglichen Anschlusstreffer noch einmal ein Ruck durch die Nürnberger Mannschaft gegangen. Dem war leider nicht so, stattdessen kassierten die Gäste genau 15 Sekunden vor Drittelschluss gar noch das 0:3. Damit war der Käse endgültig gegessen. (NZ, 27.09.2002) (6) „In einer Stunde mach’ ich den Laden zu. Dann ist die Sache für uns gegessen“, reagiert eine Schlecker-Verkäuferin in der Neckarstadt an ihrem letzten Arbeitstag verärgert auf neugierige Besucher. Ein paar Lippenstifte stehen im Regal, einige Glückwunschkarten warten auf Käufer – ansonsten gähnende Leere. „Ich kann die Verbitterung der Frauen verstehen“, sagt ein Kunde. (Mannh. Morgen, 28.06.2012) (7) Dieser sei zwar „ein wichtiger Schritt“, es gebe aber nach wie vor „keine Veranlassung zu Triumphalismus“. „Die Sache ist noch nicht gegessen“, sagte Gusenbauer unmittelbar nach seiner Rückkehr vom Besuch beim belgischen Außenminister Louis Michel in Brüssel vor Diplomaten in Wien. (Presse, 25.05.2000)
16 Stand: Juni 2019.
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
(8)
43
Schon nach 26 Minuten schien der Käse gegessen zu sein. Die Gäste aus dem Saarland führten mit 2:0. Dabei hatte Waldalgesheim stark begonnen, durch Eugen Koslowski schon nach 20 Sekunden die erste Möglichkeit gehabt. Wie so oft waren es individuelle Fehler, die zu Gegentoren führten. Ausgerechnet zwei, die in Auersmacher noch bärenstark agiert hatten, patzten. (RZ, 21.04.2011)
b) Lexikographische Behandlung Bei der Angabe des Lemmas werden die nominalen Varianten nach absteigender Frequenz angeordnet. Interessanterweise scheint in beiden Sprachen wichtig zu sein, die Abgeschlossenheit bildhaft auszudrücken. Es konnte eine Reihe an umgangssprachlichen Idiomen ermittelt werden, die als synonyme Ausdrücke fungieren. Unter Synonymen wird als erster ein nichtidiomatischer Ausdruck angegeben und dann folgen drei Idiome. Lemmatisierung Die Sache/Der Käse/Kuchen ist gegessen (umg) – no i po ptakach/ptokach (pot); coś przepadało; musztarda po obiedzie; mleko się rozlało. Beleg: Ein spannendes Meisterschaftsfinish ist also garantiert. Bei der U15 hingegen ist der Kuchen schon gegessen. (NÖN, 17.05.2012) Synonyme: Das war’s; Der Zug ist abgefahren; Der Drops ist gelutscht; Schnee von gestern mögliche Motivation: Das Idiom verweist auf die Tatsache, dass etwas unwiderruflich geschehen ist. Man kann die gegessenen Lebensmittel nicht mehr wiederherstellen.
2.3 Etwas geht/schießt durch die Decke a) Korpusbasierte Analyse Das Idiom bedeutet, dass etwas stark ansteigt. Für die Variante mit dem Verb gehen wurden 1446 und für diejenige mit schießen 370 Belege dokumentiert.17 Vereinzelt wurden Treffer ermittelt, in denen die untersuchte Einheit in der Bedeutung wütend werden verwendet wird. Daher mussten alle Vorkommen manuell gesichtet werden, um anschließend diese Bedeutungsvariante auszuklammern. Das Partnerwort, das am häufigsten in der Umgebung erscheint ist die Wortform Preise, die in allen Kontexten als Subjekt des Satzes auftritt (vgl. 9). Als weitere häufige nominale Füller
17 Stand: Juli 2019.
44
Elżbieta Dziurewicz
gelten Aktien, Zahlen, Nachfrage und Umsätze. Ferner treten Modaladverbialien wie z. B. förmlich, geradezu, regelrecht (vgl. 10), richtig und schlagartig auf, die unmittelbar am Idiom stehen. Was die grammatischen Kategorien anbelangt, so lassen sich keine eindeutigen Tendenzen bezüglich der Tempora beobachten, vorgefunden wurden vor allem Präsens, Futur I und Präteritum. In Bezug auf den Modus macht der Indikativ die Mehrheit der Belege aus, wobei auch Formen des Konjunktivs II relativ oft belegt wurden (vgl. 11). (9) Rekorde aus der Welt der Kunst beflügeln auch den Buchmarkt. Während auf Auktionen die Preise für zeitgenössische Kunst durch die Decke gehen, wird eine Flut neuer Ratgeber über Kunstinvestment in die Buchläden gespült. Eine neue Serie bietet Amüsantes und Hilfreiches zum Thema. In drei Bänden beantwortet Karlheinz Schmid kurz und bündig die Fragen: Wie wird man Sammler, Galerist, Künstler? (FOCUS, 19.11.2007) (10) Inzwischen aber ist das Tief überwunden. Bei Meier’s Weltreisen seien die Buchungszahlen für den Winter regelrecht „durch die Decke geschossen“. Auch Dertour und Tui sprechen von Zuwächsen im Vergleich zum Vorjahr. Studiosus-Sprecher Ilic zeigt sich ebenfalls optimistisch: „Die Buchungen ziehen wieder an.“ Ein Grund dafür sei die Medienpräsenz des Gastgeberlandes. Aber auch sinkende Hotel- und Flugpreise spielen eine Rolle. (SZ, 22.01.2015) (11) Die Inflationsrate in Europa hat sich noch weiter von den erklärten Stabilitätszielen entfernt, Euroland droht im Deflationssumpf aus sinkenden Preisen und Rezession zu versinken. Zudem fahren auch die USA, Japan oder Großbritannien eine Nullzinspolitik. Würde die EZB nicht auf denselben Zug mit aufspringen, dann würde der Euro durch die Decke gehen und die europäische Exportwirtschaft – vor allem die deutsche – unter der Last der starken Währung einbrechen, mit fatalen Folgen für den Arbeitsmarkt. (NN, 06.06.2014) Der Phraseologismus weist eine eindeutige Präferenz für Kontextpartner aus der Sachgruppe Wirtschaft auf. Was die Modifikationen anbelangt, weist er eine besonders starre Struktur auf. Es wurden weder Reduktionen noch Expansionen belegt.
b) Lexikographische Behandlung Bei der Lemmatisierung wurden beide Verben nach absteigender Frequenz berücksichtigt. Im Polnischen wurde keine idiomatische Entsprechung gefunden. Der Ausgangsphraseologismus und das Äquivalent korrespondieren miteinander in Bezug auf die Stilschicht. Der Beleg enthält den häufigen Kollokator Preise.
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
45
Lemmatisierung etw geht/schießt durch die Decke (umg) – coś rośnie na potęgę (pot); coś idzie w górę Beleg: Chinas Häuserpreise gehen durch die Decke. (SZ, 30.10.2009) Synonyme: etw steigt stark an; etw geht in die Höhe; etw geht rasant nach oben mögliche Motivation: Mit der Bildhaftigkeit wird ausgedrückt, dass etwas so groß ist, dass es über die Decke eines Gebäudes hinausgeht.
2.4 ein Lackmustest für a) Korpusbasierte Analyse Der Phraseologismus ein Lackmustest für bedeutet ein Test, ein Gradmesser für etwas und wird in DeReKo 996 Mal dokumentiert.18 Die Einheit besitzt einen Neologismusstatus, weil sie zum ersten Mal in den 90er Jahren des 20. Jahrhunderts erschienen ist. Unter den häufigsten Partnerwörtern befinden sich die Verben gelten (vgl. 12) und sein sowie Substantive wie Ernsthaftigkeit, Glaubwürdigkeit (vgl. 13) und Demokratie, die als Teil der Präpositionalphrase anzusehen sind. Darüber hinaus kann die Form etwas wird zum Lackmustest (vgl. 14) als einschlägig gelten. Die angeführten Verben werden vorrangig im Präsens eingesetzt. Lexeme wie Koalition, Regierung, EU und Nato deuten in den Korpusbelegen darauf hin, dass der Phraseologismus überwiegend in der Sachgruppe Gesellschaft (Untergruppe: Politik) verwendet wird. Was das Modifikationspotenzial anbelangt, so lassen sich Belege vorfinden, in denen anstelle der Präposition für der Genitiv steht (vgl. 15). Zudem sind vereinzelt Belege für Expansion anzutreffen, bei der zur phraseologischen Basis das Adjektiv eigentlich hinzugefügt wird (vgl. 16). (12) Im neuen Prozess gegen den einst reichsten Mann Russlands, Michail Chodorkowskij, droht einer zum Verlierer zu werden, der gar nicht im Gerichtssaal sitzt: Präsident Dmitrij Medwedew. Das Verfahren gilt als Lackmustest für die Machtverhältnisse zwischen Medwedew und Premier Putin. Medwedew hatte mehrfach eine Unabhängigkeit der Gerichte in Russland angemahnt und den Rechtsnihilismus beklagt. (FOCUS, 06.04.2009) (13) CDU und FDP forderten ein Machtwort der neuen SPD-Führung. „Beck ist weg, und die Probleme der SPD sind ungelöst“, sagte CDU-Generalsekretär Ronald Pofalla. Die Frage, ob Steinmeier die geplante Zusammenarbeit der hessischen SPD mit der Linken stoppen könne, sei ein erster Lackmustest für die Glaubwürdigkeit des Kanzlerkandidaten. (NN, 09.09.2008) (14) Der Einsatz am Hindukusch wird zum Lackmustest für die Nato. Im geschundenen tobt ein Krieg zwischen als Gotteskriegern getarnten Terroristen und
18 Stand: August 2019.
46
Elżbieta Dziurewicz
einer hochgerüsteten Streitmacht aus 40 vorwiegend westlichen Staaten. Die Deutschen stellen mit 3500 Soldaten das drittgrößte Kontingent im relativ befriedeten Norden. (Braunschw. Z., 14.02.2008) (15) Die Einstellung zum sowjetischen Generalsekretär Michail Gorbatschow und dessen „neuem Denken“ ist für den FDP-Außenminister, wie Freunde wissen, „ein Lackmustest der Koalition“, – eine Warnung an die Adresse Kohls. (Spiegel, 18.07.1988) (16) Der Ratifikationsprozess ist denn auch der eigentliche Lackmustest für die jetzt in Marrakesch abgeschlossene Konkretisierung des Kyoto-Protokolls, eines äusserst komplizierten Vertragswerks. Er soll nach dem Willen vieler Länder bis zum Umweltgipfel im September 2002 in Johannesburg abgeschlossen sein. „Johannesburg“, das unter dem Stichwort „Rio + 10“ stattfindet, ist allerdings nicht nur ein symbolisches Datum. (NZZ, 12.11.2001)
b) Lexikographische Behandlung Interessanterweise wird das Idiom im Polnischen in der gleichen Bedeutung verwendet. Anstelle des Tests, der im deutschen Kompositum zu finden ist, erscheint im Polnischen jedoch das Substantiv Papier. Anzumerken ist, dass sich Lackmuspapier in der hier behandelten Bedeutung im Deutschen nicht durchsetzen konnte. Vorgefunden wurden nur vereinzelt Treffer für diese übertragene Bedeutungsvariante. Lemmatisierung ein Lackmustest für – papierek lakmusowy/wyznacznik/sprawdzian czegoś Beleg: Regierung und Opposition könnten es heute beweisen. Vielleicht ist das ein Lackmustest für die Demokratie. (Protokoll der Sitzung des Parlaments Bayerischer Landtag am 17.03.2011) Synonyme: ein Test/Gradmesser/Bewährungsprobe/harte Prüfung für etwas Varianten: als Lackmustest gelten, zum Lackmustest für etw werden mögliche Herkunft: Die Einheit entstammt ursprünglich der Chemie, in der der Lackmustest zur Bestimmung des pH-Wertes dient. Mit dessen Hilfe kann schnell festgestellt werden, ob es sich bei einem Stoff um eine Säure oder eine Base handelt.
2.5 Hirn/Gehirn einschalten a) Korpusbasierte Analyse Das Idiom bedeutet mitdenken, überlegt vorgehen und wurde 821 Mal in DeReKo ermittelt, wobei 471 Belege davon auf das Substantiv Hirn und 350 auf Gehirn
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
47
entfallen19. Zu den häufigsten Kollokatoren gehören die Modalverben sollen und müssen (vgl. 17). Ferner werden die Adverbien mal und einfach relativ oft in der Nachbarschaft eingesetzt (vgl. 18). Der Phraseologismus steht entweder als reiner Infinitiv Präsens oder wird innerhalb eines Satzgefüges verwendet, bei dem er als Hauptsatz auftritt, während der Nebensatz bevorzugt von den Konjunktionen wenn oder bevor eingeleitet wird (vgl. 19). Der untersuchte Phraseologismus wird vorrangig in den Sachgruppen Sport und Freizeit, Gesellschaft und menschliches Zusammenleben gebraucht. Die Analyse des Modifikationspotenzials ergab, dass das Idiom grammatische Modifikation, bei der anstelle des Singulars Plural verwendet wird (vgl. 20), und Expansion, bei der zur Ausgangsstruktur das Attribut eigen (vgl. 21) hinzugefügt wird, zulässt. Zu betonen ist nicht zuletzt, dass diese Einheit in der Mehrzahl meist die Rolle einer Routineformel übernimmt und als Aufforderung bzw. Bitte verwendet wird. (17) Schalke-Manager Horst Heldt fordert Kopfarbeit von den königsblauen Profis: „Die Spieler müssen ihr Hirn einschalten.“ Zu simpel, zu leicht durchschaubar, zu ideenlos präsentierten sie sich im Hinspiel. „Wir haben uns völlig unnötig in eine schwierige Ausgangssituation gebracht“, schimpfte Heldt. Trotzdem soll alles gut werden, nachdem sich der in Helsinki geschonte Raúl endgültig zu Schalke bekannt hat und die Rangnick-Mannschaft mit dem 4:2 von Mainz ein Lebenszeichen von sich gegeben hat. (Norkurier, 25.08.2011) (18) Ein glänzendes Stück Ihres Autors Thomas Tuma. Hätten die quotengeilen Verantwortlichen von RTL und Sat.1 einfach nur mal ihr Hirn eingeschaltet, hätten sie sich gleich denken können, dass „echte“ Millionäre den Teufel tun werden, sich für so eine Schwachsinns-Schau zur Verfügung zu stellen. Dafür können eigentlich nur Hochstapler und Pleitiers in Frage kommen. Deshalb gibt es zu Recht auf der nach oben offenen Schadenfreude-Skala 100 Punkte! Jeder blamiert sich, so gut er kann. (Spiegel, 22.01.2001) (19) Leverkusen – Nach der harschen Kritik Littbarskis an Schiedsrichter Steinborn („Der Schiri war der zwölfte Mann der Rostocker“) muss der Assistenzcoach von Bayer Leverkusen im Wiederholungsfall mit Konsequenzen rechnen. „Er sollte das Hirn einschalten, bevor er losplaudert. Wir werden Kontakt mit dem Verein aufnehmen und darum ersuchen, er möchte seinen Wachhund zurückpfeifen“, sagte Manfred Amerell. (SPON, 19.02.2001) (20) Später, das Stück ist zu Ende, loben die jungen Zuschauer im lockeren Zwiegespräch mit den Akteuren Nadines Klassenlehrer. Er versucht schließlich, das Cybermobbing gegen Lea einzudämmen. Allen scheint bewusst zu sein: Was einmal den Weg ins World Wide Web gefunden, entfaltet dort lange, vielleicht für immer seine Wirkung, ob positiv oder negativ. User sollten also nicht nur den Rechner, sondern auch ihre Hirne einschalten! (RZ, 28.01.2012)
19 Stand: April 2019.
48
Elżbieta Dziurewicz
(21) Selbstdenken. Es gibt gute Gründe, das eigene Hirn einzuschalten. Unsere Wahrnehmung ist selektiv, unser Gedächtnis unzuverlässig, unsere Denkoperationen sind oft unzulänglich. Peter R. Hofstätter hat zwischen „Dummheit erster Art“ und „Dummheit zweiter Art“ unterschieden. Dummheit erster Art nannte er, wenn wir keine Muster, Regeln oder Handlungsmöglichkeiten erkennen, wo sich grundsätzlich welche finden ließen. (Die Presse, 09.04.2011)
b) Lexikographische Behandlung Die lexikographische Erfassung dieser Einheit gestaltet sich als relativ schwierig, weil diese sowohl als ein nominativer d. h. satzgliedwertiger Phraseologismus (vgl. Burger 2010) als auch als eine Routineformel, die keine Anpassung an den Kontext verlangt, sondern an eine konkrete Situation gebunden ist, auftritt20. Diese Information ist in Form einer Glosse verzeichnet. Zusätzlich werden zwei Belege aufgelistet. Lemmatisierung (das) Hirn/Gehirn einschalten (umg) (oft als Aufforderung, die jemanden zum Mitdenken anregen sollte) – włączamy myślenie (umg), pomyśl dwa razy (umg) Beleg: Die Stadtpolitiker sollen mal ihr Gehirn einschalten. (Mannh. Morgen, 02.03.2016) Synonyme: etwas mit Verstand tun; mitdenken; seinen Grips anstrengen; aufpassen, was man sagt mögliche Herkunft: Höchstwahrscheinlich ist der Phraseologismus eine reduzierte Form des Spruches Vor Inbetriebnahme des Mundwerks ist das Gehirn einzuschalten, bei dem damit gespielt wird, dass das Gehirn (das als Ort des Denkens fungiert) – einem Gerät ähnlich – eingeschaltet wird, um zu funktionieren.
2.6 eins und eins zusammenzählen a) Korpusbasierte Analyse Dieser Phaseologismus bedeutet sich etwas denken können und ist 734 Mal21 in DeReKo vertreten. Die Kookkurrenzanalyse verweist auf die Modalverben müssen (vgl. 22) und können, die überdurchschnittlich häufig direkt am Phraseologismus stehen. Auffällig ist außerdem die Verwendung zusammen mit der Fokuspartikel nur
20 Zu Problemen bei der Erfassung von pragmatischen Phraseologismen vgl. Ruusila (2014). 21 Stand: Mai 2019.
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
49
(vgl. 23). Syntaktisch gesehen kommt die Einheit bevorzugt innerhalb eines Subjekt- oder Relativsatzes vor (vgl. 24). Der Phraseologismus wird nur sporadisch abgewandelt. Belegt wurden vereinzelt Substitutionen, bei denen eins durch zwei ausgetauscht wird (vgl. 25). Nach der Analyse zahlreicher Belege sowie frequenter Partnerwörter wurde festgestellt, dass dem Phraseologismus die Sachgruppen Gesellschaft (darunter insbesondere Wahl, Politik) und menschliches Zusammenleben zuzuordnen sind. (22) Nun, dieser Prozess dürfte noch eine Reihe von Fragen aufwerfen. In einem Indizienprozess muss man halt eins und eins zusammenzählen, und das ist nicht unbedingt einfach, wie bei der vorliegenden Affäre ersichtlich. (Luxumburger Tageblatt, 16.04.2008) (23) Während sich Bundestrainer Bernhard Peters und sein australischer Kollege Barry Dancer am Tag vor dem Finale gegenseitig die Favoritenbürde zuschoben, ist für den früheren Bundestrainer und „Goldschmied“ Paul Lissek die Sache klar. „Deutschland ist der Favorit, da muss man nur eins und eins zusammenzählen“, meinte Lissek, der jetzt in Diensten von WM-Gastgeber Malaysia steht. (Mannh. Morgen, 09.03.2002) (24) Im Borussia-Park erklangen Lieder über den DFB-Pokalsieg und den Meistertitel, Max Eberl kann das gut verstehen. „Wenn du zu Hause spielst, wie du momentan spielst, gegen wen du gewinnst, und wie du gewinnst“, sagte der Sportdirektor, „dann kann jeder, der eins und eins zusammenzählen kann, auch träumen und hoffen.“ Und eins und eins ergibt in diesem konkreten Fall Champions-League-Qualifikation. Mindestens. (RZ, 13.02.2012) (25) „Jeder, der eins und zwei zusammenzählen kann, wird anhand dieses Vergleichs erkennen, daß ein Ersatz zusätzlicher Straßenbahnlinien durch Busverkehr sinnlos wäre“, erklärt AL-GR Markus Scheucher. (Kleine Ztg., 01.07.1997)
b) Lexikographische Behandlung Die polnische idiomatische Entsprechung enthält ebenfalls Zahlen unter den obligatorischen Komponenten (allerdings tritt anstelle eins die Zahl zwei auf). Die Variante zwei und zwei zusammenzählen wurde in DeReKo ebenfalls ermittelt. Ihre Frequenz war allerdings zu niedrig, um eine zuverlässige Kookkurrenzanalyse durchführen zu können. Das Idiom gehört zu den sogenannten Interphraseologismen.22 Da die Modalverben müssen und können aufgrund der Korpusrecherche einen usuellen, wiederholbaren Charakter aufweisen werden sie bei den Varianten berücksichtigt.
22 Im Englischen gibt es das Idiom put two and two together, im Norwegischen lautet die Entsprechung legge to og to sammen. Mit den Interphraseologismen befassen sich Piirainen (2011, 2012) und Schatte (2006) eingehend.
50
Elżbieta Dziurewicz
Lemmatisierung jmd zählt eins und eins zusammen (umg) – ktoś wiąże ze sobą dwa proste fakty, co pozwala mu na zrozumienie sytuacji/zdarzenia/zjawiska; ktoś dodaje dwa do dwóch (umg) Beleg: Wer eins und eins zusammenzählen kann, kommt leicht darauf: Deutschland hat die größte Zahl an Einwohnern, bietet also potentiell immer den größten Markt unter den Ländern Europas. (NN, 15.08.1998) Varianten: Man muss (nur) eins und eins zusammenzählen, Wenn man nur eins und eins zusammenzählen kann Synonyme: Schlüsse ziehen; sich etwas denken können; von selbst eine Begründung finden; sich etwas zusammenreimen können (umg) mögliche Herkunft: Diese Einheit stammt aus der Mathematik, in der das Addieren von Zahlen zu den Grundrechenarten gehört. Durch diese Metapher wird darauf verwiesen, dass etwas sehr leicht ist.
2.7 ein Rosinenpicken a) Korpusbasierte Analyse Im Falle der nächsten Einheit handelt es ich um eine grammatische Modifikation, genauer gesagt um eine Substantivierung des Idioms sich die Rosinen aus dem Kuchen picken. Wegen ihrer relativ hohen Frequenz (Trefferzahl: 66323) kann sie allerdings separat behandelt werden. Diese Einheit hat die Bedeutung absahnen, sich nur das Beste nehmen.24 In der unmittelbaren Nachbarschaft treten v. a. die Verben erlauben (vgl. 26), geben, zulassen, unterbinden und verhindern auf. Die Korpusanalyse liefert zahlreiche Treffer für den negierten Gebrauch (vgl. 27). Darüber hinaus wurden in zahlreichen Belegen Passivformen ermittelt (vgl. 28). Die Form es wird kein Rosinenpicken geben/erlauben ist als relativ neu einzustufen. Die ersten Belege in DeReKo stammen aus dem Jahr 1997. Der Phraseologismus weist eine Präferenz für Kontextpartner aus der Sachgruppe: Gesellschaft (insbesondere Politik – auffällig ist der Zusammenhang mit
23 Stand: August 2019. 24 Die analysierte Einheit erfüllt in dieser Form das Merkmal der Polylexikalität nicht. Sie wird in die folgende Analyse aus zwei Gründen aufgenommen. Erstens – wie bereits angedeutet – ist sie als eine Substantivierung des Idioms sich die Rosinen aus dem Kuchen picken einzustufen. Zweitens ist es auffallend, dass sie eindeutig den Gebrauch mit bestimmten Verben wie beispielsweise erlauben und geben präferiert. Zusammen bilden sie syntagmatic pattern (Steyer 2016: 294). Gemeint sind damit frequente Strukturformen wie es wird kein Rosinenpicken geben und Rosinenpicken (ist nicht) erlaubt. Demnach bildet sie primär den Gegenstand der Phraseologie und nicht der Wortbildung.
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
51
dem Brexit) auf. Was das Modifikationspotenzial anbelangt, so sind relativ viele Belege für Expansionen, durch Adjektive wie britisch, erheblich, groß und privat anzutreffen. (26) Das rief die kommunalen Spitzenverbände auf den Plan: „Der Gesetzentwurf erlaubt Privatunternehmen das Rosinenpicken und degradiert die Kommunen zu Lückenbüßern für kostenträchtige Entsorgungsaufgaben“, erklärten die Präsidenten von Städtetag, Landkreistag sowie Städte- und Gemeindebund. (RZ, 01.06.2011) (27) Beide Punkte sollen im Abkommen geregelt sein. Für die Idee, die Staatsbeihilfen in den einzelnen Abkommen zu regeln, klingt das stark nach einer Absage. Das allerwichtigste Prinzip bleibe für die EU-Kommission aber: „Es kann kein Rosinenpicken geben.“ (St. Galler Tagbl., 06.03.2018) (28) Ob sich diese Sicht in der EU politisch durchsetzen wird, ist fraglich. Täte sie es, würde ein Beitritt zur CP der Schweiz die Umsetzung der Masseneinwanderungsinitiative stark erleichtern. Im Gegenzug müsste sie alle übrigen Binnenmarktregeln übernehmen (den Drittstaaten kann und soll laut der Studie kein „Rosinenpicken“ gewährt werden) und institutionelle Arrangements akzeptieren. Hinzu kommt, dass die Schweiz eine Lösung bis Februar braucht, während die Diskussion der EU mit London viel länger dauern wird. (NZZ, 30.08.2016) (29) Ein britisches „Rosinenpicken“ könne es aber auch nicht geben, sagte Merkel. Die Verhandlungen über den künftigen Status Großbritanniens könnten erst beginnen, wenn die britische Regierung offiziell ihren Austrittsantrag gestellt hat. Wann das geschehen soll, sagte sie nicht. (taz, 29.06.2026) b) Lexikographische Behandlung Im Polnischen tritt ebenfalls ein kulinarischer Phraseologismus als Entsprechung auf, wobei anstelle der Rosinen das Substantiv Sahne gebraucht wird. Sowohl das deutsche als auch das polnische Idiom sind der Umgangssprache zuzurechnen. Da zahlreiche Belege ermittelt wurden, bei denen anstelle einer Affirmation eine Negation auftritt, wird die negierte Form als mögliche Variante aufgeführt. Lemmatisierung (ein) Rosinenpicken (umg) – spijanie śmietanki (pot); zagarnianie najlepszej części dla siebie Beleg: Sigmar Gabriel (SPD) sagte: Rosinenpicken wird es nicht geben. Wer am EUBinnenmarkt teilhaben wolle, müsse Teil der Gemeinschaft sein (RZ, 19.01.2017) Varianten: Es wird kein Rosinenpicken geben Synonyme: absahnen; sich nur das Wertvollste sichern; sich nur das Beste nehmen
52
Elżbieta Dziurewicz
mögliche Herkunft: Die deutsche Wendung geht entweder auf die englische Einheit: Cherry Picking oder auf die deutsche sich die [besten/größten/dicksten] Rosinen herauspicken zurück.
3 Schlussfolgerungen Das Ziel dieser Studie bestand darin, die in den phraseologischen deutschen Wörterbüchern, genauer gesagt im Duden 11 Redewendungen, der Deutschen Idiomatik. Die Deutschen Redewendungen im Kontext von Schemann (2011) und im Großen Lexikon der sprichwörtlichen Redensarten von Röhrich (2003) nicht registrierten Idiome, die allerdings als etablierte Einheiten gelten können, korpusbasiert zu analysieren und anschließend eine Lemmatisierung vorzuschlagen. Alle gesammelten phraseologischen Kandidaten, die in den genannten drei Wörterbüchern nicht verzeichnet waren, wurden einleitend einer Frequenzanalyse mithilfe des DeReKo unterzogen. Jene Einheiten, deren Frequenz mindestens 500 Belege betrug, wurden in der bei den Deutschsprachigen aus Deutschland, Österreich und der Schweiz durchgeführten Onlinebefragung berücksichtigt. Um bei der eingehenden Korpusanalyse Eingang zu finden, wurde für den Mindestbekanntheitsgrad ein Wert von 50 Prozentpunkten festgelegt, d. h. die Idiome wenigstens der Hälfte der Befragten geläufig sein mussten. Auf der Basis der durchgeführten Frequenzanalyse und der Befragung stellte sich heraus, dass lediglich sieben Einheiten von der ursprünglichen Liste die genannten Kriterien der Frequenz und Geläufigkeit erfüllen und deswegen Eingang ins phraseologische Wörterbuch finden sollten. Mithilfe des Korpus war es im nächsten Schritt möglich, die typische Umgebung, die Varianten, das Modifikationspotenzial und den thematischen Bereich für diese sieben, zum Usus gehörenden Phraseologismen zu untersuchen. Darüber hinaus wurden zahlreiche, ihren tatsächlichen Sprachgebrauch widerspiegelnde Belege nachgewiesen. Dies belegt, dass Korpora innerhalb der Phraseographie sowohl bei Fragen der Makro- als auch der Mikrostruktur gewinnbringend Einsatz finden und damit zu einer verbesserten lexikographischen Beschreibung beitragen können. Nichtsdestotrotz sollte im Folgenden auf drei Schwierigkeiten, die im Rahmen der durchgeführten Korpusrecherche aufgetreten sind, kurz eingegangen werden. Problematisch ist erstens, dass mündliche Sprache in DeReKo kaum vorhanden ist. Schreiber/Mahlow/Juska-Bacher (2012: 5) konstatieren: „Im Deutschen existiert bislang kein Korpus der mündlichen Sprache, das groß genug und zudem aktuell wäre, um phraseologische Neologismen durch korpusgesteuerte Analysen suchen zu können“. Während die mündliche Sprache unterrepräsentiert ist, sind Pressetexte übervertreten. Das war insbesondere im Falle des phraseologischen Kandidaten Hätte hätte Fahrradkette auffällig. Dieser musste aus der weiteren Analyse wegen zu niedriger Frequenz ausgeklammert werden, obwohl ihn beinahe 100 % der Befragten
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
53
kannten. Man kann vermuten, dass diese Einheit primär im Mündlichen zum Einsatz kommt und deshalb auch die Trefferzahl in DeReKo nicht ausreichend war. Zweitens kann sich die automatische Suche im Falle der Phraseologismen, die nicht immer eine übertragene Verwendung finden, als schwierig gestalten. Belege müssen dann manuell gesichtet werden (wie im Falle des Idioms Die Sache/Der Käse/Der Kuchen ist gegessen). Drittens erfordert die Analyse der Bedeutung bisweilen ebenfalls eine manuelle Sichtung. Im Rahmen des vorliegenden Beitrags musste im Falle des Idioms durch die Decke gehen überprüft werden, ob die meisten Treffer in der Bedeutung stark ansteigen gebraucht werden. Sporadisch wurden ebenfalls Treffer dokumentiert, bei denen die Einheit wütend werden bedeutete. Anhand der mithilfe des Korpus ermittelten Daten wurde abschließend eine Lemmatisierung für ein deutsch-polnisches Wörterbuch vorgeschlagen. Die Artikel enthalten Auskunft zur Bedeutung, Stilmarkierung, Herkunft und zum typischen Gebrauch. Zudem werden Synonyme angegeben. Bei den polnischen Äquivalenten befinden sich in der Regel phraseologische und nichtphraseologische Entsprechungen. Da die Artikel recht umfangreich sind, sind sie primär für ein phraseologisches Online-Wörterbuch vorgesehen, bei dem jede Art Platzbeschränkung aufgehoben wird.25 Mithilfe der erarbeiteten Artikel wird in erster Linie die passive phraseologische Kompetenz gefördert. Da die Artikel derart umfassend sind, können sie Deutschlernende nicht nur beim Verstehen der Einheiten unterstützen, sondern dabei helfen, das Idiom in einem spezifischen, durch den Beleg und eventuell Glossen beschränkten Rahmen zu verwenden.
Literatur Monographien und Aufsätze Bielińska, Monika (2010): Lexikographische Metatexte. Eine Untersuchung nicht integrierter Außentexte in einsprachigen Wörterbüchern des Deutschen als Fremdsprache. Frankfurt am Main [u. a.]: Peter Lang. Bielińska, Monika (2011): Phraseologismen in den Metatexten einsprachiger Lernerwörterbücher des Deutschen als Fremdsprache. In: Zieliński, Lech/Ludwig, Klaus-Dieter/Lipczuk, Ryszard (Hrsg.): Deutsche und polnische Lexikographie nach 1945 im Spannungsfeld der Kulturgeschichte. Frankfurt am Main [u. a.]: Peter Lang, 205–218. Burger, Harald (42010): Phraseologie: eine Einführung am Beispiel des Deutschen. Berlin: Erich Schmidt Verlag. Burger, Harald/Dobrovol’skij, Dmitrij/Kühn, Peter/Norrick, Neal R. (2007) (Hrsg.): Phraseologie. Ein internationales Handbuch der zeitgenössischen Forschung. Berlin/New York: Walter de Gruyter.
25 Potenziale von Onlinewörterbüchern werden ausführlich in Lemberg (2001) behandelt.
54
Elżbieta Dziurewicz
Ďurčo, Peter (2010): Feste Wortverbindungen und Lexikographie. Kolloquium zur Lexikographie und Wörterbuchforschung. Berlin/New York: Walter de Gruyter. Dziurewicz, Elżbieta (2015): Korpusbasierte Analyse der Phraseologismen im Deutschen am Beispiel des phraseologischen Optimums für DaF. Hamburg: Verlag Dr. Kovač. Dziurewicz, Elżbieta (2019): Lemmatisierung ausgewählter neuer Idiome. Eine lexikografische und korpusbasierte Studie. In: Nerlicki, Krzysztof/Komenda-Earle, Barbara/Sztandarska, Katarzyna (Hrsg.): Texte und Wörterbücher. Translatorische, lexikalische und glottodidaktische Aspekte. Hamburg: Verlag Dr. Kovač, 173–186. Dziurewicz, Elżbieta/Woźniak, Joanna (2020): Phraseologie des Deutschen für polnische Deutschlernende. Warszawa: Wydawnictwo Naukowe PWN. Ehrhardt, Claus (2014): Idiomatische Kompetenz: Phraseme und Phraseologie im DaF-Unterricht. In: Gdl-Journal 1. [Unter: ; letzter Zugriff: 01.08.2019]. Ernst, Peter (2011): Gibt es eine österreichische Phraseologie? In: Lipczuk, Ryszard/Lisiecka-Czop, Magdalena/Misiek, Dorota (Hrsg.): Phraseologismen in deutsch-polnischen und polnischdeutschen Wörterbüchern. Theoretische und praktische Aspekte der Phraseologie und Lexikographie. Hamburg: Verlag Dr. Kovač, 177–190. Ettinger, Stefan (2007): Phraseme im Fremdsprachenunterricht. In: Burger, Harald/Dobrovol´skij, Dmitrij/Kühn, Peter/Norrik, Neal R. (Hrsg.): Phraseologie/Phraseology. Ein internationales Handbuch zeitgenössischer Forschung/An International Handbook of Contemporary Research. Berlin/New York: Walter de Gruyter, 893–908. Gündoğdu, Mehmet (2007): Die Behandlung der Phraseologismen im Unterricht Deutsch als Fremd- und Zweitsprache. In: Deutsch als Zweitsprache, Heft 2, 11–18. Hallsteinsdóttir, Erla (2011): „Aktuelle Forschungsfragen der deutschsprachigen Phraseodidaktik“. Linguistik online 47, 3–31. [Unter: http://www.linguistik-online.de/47_11/hallsteinsdottir. html; letzter Zugriff: 1.08.2019] Hallsteinsdóttir, Erla/Šajánková, Monika/Quasthoff, Uwe (2006): Phraseologisches Optimum für Deutsch als Fremdsprache. Ein Vorschlag auf der Basis von Frequenz- und Geläufigkeitsuntersuchungen. In: Linguistik online 27, 117–136. [Unter: < https://bop.unibe.ch/ linguistik-online/article/view/746/1272>; letzter Zugriff: 05.10.2018]. Hessky, Regina (1997): Feste Wendungen – ein heißes Eisen? Einige phraseodidaktische Überlegungen für den DaF-Unterricht. In: Deutsch als Fremdsprache 34, 139–143. Hollós, Zita (2017): Wörterbuchkritik – phraseologischen Wörterbücher. In: Bielińska, Monika/ Schierholz, Stefan (Hrsg.): Wörterbuchkritik. Dictionary Criticism. Berlin/New York: Walter de Gruyter, 323–352. Jesenšek, Vida (2006): Phraseologie und Fremdsprachenlernen. Zur Problematik einer angemessenen phraseodidaktischen Umsetzung. In: Linguistik online 27, 137–147. [Unter: https://bop.unibe.ch/linguistik-online/article/view/747/1274; letzter Zugriff: 05.08.2019]. Jesenšek, Vida/Grzybek, Peter (2014) (Hrsg.): Phraseologie im Wörterbuch und Korpus. Phraseology in Dictionaries and Corpora. Maribor/Bielsko-Biała/Budapest/Kansas/Praha: Univerza v Mariboru. Kovbasyuk, Larysa (2018): Deutsche phraseologische Neologismen. Am Beispiel der Null- und Zehner Jahre. In: НАУКОВИЙ ВІСНИК ХЕРСОНСЬКОГО ДЕРЖАВНОГО УНІВЕРСИТЕТУ, Серія: ЛІНГВІСТИКА Випуск 34 Том 2, 125–129. Krohn, Karin (1994): Hand und Fuß. Eine kontrastive Analyse von Phraseologismen im Deutschen und Schwedischen. Göteborg: Acta Univ. Gothoburgensis. Kühn, Peter (1992): Phraseodidaktik. Entwicklungen, Probleme und Überlegungen für den Muttersprachenunterricht und den Unterricht Deutsch als Fremdsprache. In: Fremdsprachen Lehren und Lernen 21, 169–186.
Lexikographische Behandlung von nicht lemmatisierten deutschen Idiomen
55
Kühn, Peter (2003): Phraseme im Lexikographie-Check: Erfassung und Beschreibung von Phrasemen im einsprachigen Lernerwörterbuch. In: Lexicographica 19, 97–118. Lemberg, Ingrid (2001): Aspekte der Online-Lexikographie für wissenschaftliche Wörterbücher. In: Lemberg, Ingrid/Schröder, Bernhard/Storrer, Angelika (Hrsg.): Chancen und Perspektiven computergestützter Lexikographie. Tübingen: Niemeyer, 71–91. Lipczuk, Ryszard/Lisiecka-Czop, Magdalena/Misiek, Dorota (2011): Phraseologismen in deutsch-polnischen und polnisch-deutschen Wörterbüchern. Theoretische und praktische Aspekte der Phraseologie und Lexikographie. Hamburg: Verlag Dr. Kovač. Lipczuk, Ryszard/Lisiecka-Czop, Magdalena/Sulikowska, Anna (Hrsg.) (2012): Frazeologizmy w słownikach niemiecko-polskich i polsko-niemieckich na przykładzie Pons Duży Słownik i Langenscheidt Słownik Partner. Szczecin: Zapol. Lüger, Heinz-Helmut (1997): Anregungen zur Phraseodidaktik. In: Beiträge zur Fremdsprachenvermittlung 32, 69–120. Lüger, Heinz-Helmut (2004): Idiomatische Kompetenz – ein realistisches Ziel? Thesen zur Phraseodidaktik. In: Beiträge zur Fremdsprachenvermittlung, Sonderheft 7, 121–169. Lüger, Heinz-Helmut (2019): Phraseologische Forschungsfelder. Impulse, Entwicklungen und Probleme aus germanistischer Sicht. In: Beiträge zur Fremdsprachenvermittlung 61, 2019, 51–82. Mellado Blanco, Carmen (2009): Theorie und Praxis der idiomatischen Wörterbücher. Tübingen: Niemeyer. Mieder, Wolfgang (2018): „Neue Zeiten, neue Weisheiten“. Plädoyer für eine Parömiographie und Parömiologie moderner Sprichwörter. In: Gondek, Anna/Jurasz, Alina/Szczęk, Joanna (Hrsg.): Einblicke und Rückblicke: Beiträge zur deutschen Phraseologie und Parömiologie aus intra- und interlingualer Sicht, Bd. 1. Baltmannsweiler: Schneider, 17–43. Misiek, Dorota (2011): Phraseologismen in polnisch-deutschen und deutsch-polnischen Wörterbüchern – ein Analyseverfahren. In: Zieliński, Lech/Ludwig, Klaus-Dieter/Lipczuk, Ryszard (Hrsg.) Deutsche und polnische Lexikographie nach 1945 im Spannungsfeld der Kulturgeschichte. Frankfurt am Main [u. a.]: Peter Lang, 131–141. Nerlicki, Krzysztof (2011): Glossierung der Phraseologismen in einem zweisprachigen Wörterbuch: Vor- und Nachteile für die Benutzer. In: Lipczuk, Ryszard/Lisiecka-Czop, Magdalena/Misiek, Dorota (Hrsg.): Phraseologismen in deutsch-polnischen und polnisch-deutschen Wörtebüchern. Hamburg: Verlag Dr. Kovač, 139–151. Nerlicki, Krzysztof (2012): Rola glos w rozumieniu i poprawnym stosowaniu frazeologizmów niemieckich. In: Lipczuk, Ryszard/Lisiecka-Czop, Magdalena/Sulikowska, Anna (Hrsg.): Frazeologizmy w słownikach niemiecko-polskich i polsko-niemieckich na przykładzie Pons Duży Słownik i Langenscheidt Słownik Partner. Szczecin: Zapol, 141–172. Nerlicki, Krzysztof (2015): Phraseologische Glossen – ein Differenzierungsversuch an Beispielen aus ausgewählten deutsch-polnischen Wörterbüchern. In: Mańczak-Wohlfeld, Elżbieta/Podolak, Barbara (Hrsg.): Words and dictionaries. A Festschrift for Professor Stanisław Stachowski on the occasion of his 85th birthday. Kraków: Jagiellonian University Press, 215–230. Palm, Christine (1997): Phraseologie. Eine Einführung. Tübingen: Narr Verlag. Perkuhn, Rainer/Belica, Cyril (2004): Eine kurze Einführung in die Kookkurrenzanalyse und syntagmatische Muster. Institut für Deutsche Sprache, Mannheim. 2004. [Unter: http:// www1.ids-mannheim.de/kl/misc/tutorial.html; letzter Zugriff: 05.08.2019]. Piirainen, Elisabeth (2011): Weit verbreitete Idiome und das „Lexikon der gemeinsamen bildlichen Ausdrücke: Gewinn für den Fremdsprachenunterricht? In: Deutsch als Fremdsprache 3/48, 157–165. Piirainen, Elisabeth (2012): Widespread idioms in Europe and beyond: toward a lexicon of common figurative units. Frankfurt am Main [u. a.]: Peter Lang.
56
Elżbieta Dziurewicz
Ptashnyk, Stefaniya (2009): Phraseologische Modifikationen und ihre Funktionen im Text. Eine Studie am Beispiel der deutschsprachigen Presse. Essen: Schneider Verlag Hohengehren. Ruusila, Anna (2012): Lexikografische Darstellung pragmatischer Phraseologismen. Wörterbuchartikelmodell für pragmatische Phraseologismen in einem deutsch-finnischen elektronischen Spezialwörterbuch. Frankfurt am Main: Peter Lang. Sakowski, Krzysztof (2017): Modifizierte Phraseologismen in Schlagzeilen am Beispiel der Zeitung „Die Welt“ – eine pragmatisch orientierte Analyse. Łódź: Primum Verbum. Schatte, Czesława (2006): Zu Interphraseologismen in der Mehrsprachigkeitsdidaktik. In: Studia Germanica Gedanensia 14, 143–156. Schreiber, David/Mahlow, Cerstin/Juska-Bacher, Britta (2012): Phraseologische Neologismen: Identifikation und Validierung. In: Yearbook of Phraseology 3, 3–30. Stantcheva, Diana (2003): Phraseologismen in deutschen Wörterbüchern. Ein Beitrag zur Geschichte der lexikographischen Behandlung von Phraseologismen im allgemeinen einsprachigen Wörterbuch von Adelung bis zur Gegenwart. Hamburg: Verlag Dr. Kovač. Steyer, Katrin (2016): Patterns. Phraseology in a state of flux. In: International Journal of Lexicography 28, 3, 279–298. Taborek, Janusz (2018): Korpusbasiertes kontrastives Beschreibungsmodell für Funktionsverbgefüge. In: Schmale, Günter (Hrsg.): Lexematische und polylexematische Einheiten des Deutschen. Tübingen: Stauffenburg Verlag, 135–154.
Wörterbücher Dornseiff, Franz (2004): Der deutsche Wortschatz nach Sachgruppen. 8. Auflage. Berlin/New York: Walter de Gruyter. Duden 11 = Duden Redewendungen. Wörterbuch der deutschen Idiomatik. 4., neu bearbeitete und aktualisierte Aufl. Berlin: Dudenverlag. 2013. Röhrich, Lutz (2003): Lexikon der sprichwörtlichen Redensarten. Freiburg: Herder. Schemann, Hans (2011): Deutsche Idiomatik. Wörterbuch der deutschen Redewendungen im Kontext. Berlin/New York: Walter de Gruyter.
Carolina Flinz
Korpora als primäre Quellen von Tourlex Abstract: Corpora found their way into lexicography a long time ago and are also used as the primary sources of many contemporary dictionaries. Their use in the lexicographical process has opened up a variety of new possibilities (Lemnitzer/ Zinsmeister 2015: 170) that were previously unthinkable with traditional collections of documents. Corpora are also the lexicographic primary source of Tourlex, a newly conceived bilingual wiki-based resource, designed to support future employees of the tourism industry, with a special focus on collocations (Flinz 2019). In particular specific partial corpora are used for different lexicographic work steps (Wolf 2010: 23): the creation of a small specialized comparison corpus (Lemnitzer/Zinsmeister 2015: 138) based on the text type „General Terms and Conditions of Travel“ and large corpora, such as the reference corpus DeReKo and German Web 2013. In addition, documents and contexts were also researched from the Internet. The purpose of this paper is to reflect on the corpora that have been used as a data basis for Tourlex in order to show that both small and large corpora can be used for different lexicographic purposes: The prerequisite for the use of different corpora, however, is that the respective objectives are defined in advance. After an overview of the use of corpora in the phase of data collection in the lexicographic process of dictionary projects (§ 2), the primary sources (cf. Wiegand 1998: 140) of Tourlex and the used approach are presented (§ 3). In the fourth section, the extraction of the lemma candidate list and the finding of equivalence relations both of individual lexemes and of collocations are described in detail. The model used is systematized and its application is presented exemplarily. Keywords: LSP dictionaries, corpora, collocations, equivalents Schlagwörter: Fachwörterbücher, Korpora, Kollokationen, Äquivalenten
1 Einleitung Korpora haben schon seit langem Eingang in die Lexikographie gefunden und sind auch primäre Quellen von vielen zeitgenössischen Wörterbüchern. Mit ihrer Nutzung haben sich im lexikographischen Prozess vielfältige und neue Möglichkeiten ergeben (vgl. Lemnitzer/Zinsmeister 2015: 170), die vorher mit den traditionellen Belegsammlungen nicht denkbar waren.
Carolina Flinz, Universität Mailand, [email protected] https://doi.org/10.1515/9783110716955-004
58
Carolina Flinz
Korpora sind auch die lexikographische Primärquelle von Tourlex1, eine zweisprachige wiki-basierte Online-Ressource zur Tourismusfachsprache, die als Ausbauwörterbuch (vgl. Schröder 1997: 60; Engelberg/Storrer 2016: 34 f.) für das Sprachenpaar Deutsch-Italienisch konzipiert wurde und einen besonderen Fokus auf Kollokationen und auf mehr oder weniger feste Wortverbindungen legt. Es wurden zweckgebunde Teilkorpora benutzt, die für unterschiedliche Arbeitsschritte verwendet wurden (vgl. Wolf 2010: 23): die Erstellung eines kleinen spezialisierten Vergleichskorpus (vgl. Lemnitzer/Zinsmeister 2015: 138) und großer Korpora, wie das Referenzkorpus DeReKo und German Web 2013. Zusätzlich wurden Belege und Kontexte auch aus dem Internet recherchiert. Da Tourlex ein Pilotprojekt ist, wurde die Auswahl der Texte für das kleine zweckgebundene Spezialkorpus2 (vgl. Scherer 2006: 5) auf eine bestimmte Textsorte beschränkt: Es wurde die Teiltextsorte des Reisekatalogs „Allgemeine Reisebedingungen“ ausgewählt, weil sie einer der wichtigsten Grundlagen für das Vertragsverhältnis zwischen Reisekunde und Reiseveranstalter ist3, doch aufgrund ihrer spezifischen Lexik italienischen DaF-Lernenden4 viele Schwierigkeiten bereitet, die weder mit anderen Tourismus-Fachwörterbüchern (vgl. Flinz 2015: 43 f.) noch mit den üblichen mehrsprachigen Ressourcen gemeistert werden können. Die existierenden Ressourcen führen entweder die relevanten Begriffe nicht als Lemma auf oder bieten kaum Informationen zu ihrer Benutzung, wenn die Stichwörter enthalten sind. Vor diesem Hintergrund wurden die „Allgemeinen Reisebedingungen / Indicazioni contrattuali di viaggio“ als Teiltextsorte5 für das deutsch-italienische Vergleichskorpus gewählt. Mit diesem Aufsatz werden die Korpora, die als Datengrundlage für Tourlex benutzt worden sind, reflektiert, um zu zeigen, dass sowohl kleine als auch große Korpora für lexikographische Zielsetzungen benutzt werden können. Voraussetzung für ihren Einsatz ist jedoch, dass die jeweiligen Ziele im Voraus festgelegt worden sind. Nach einem Überblick über die Benutzung von Korpora in der Phase der Datenbeschaffung im lexikographischen Prozess von Wörterbuchprojekten (§ 2) werden
1 Informationen zum lexikographischen Prozess von Tourlex sind in Flinz (2019: 9–35) zu finden. Das Wörterbuchprojekt wurde dank eines Forschungsstipendiums der Alexander von Humboldt Stiftung ermöglicht. 2 Ein Korpus, das eine Fachsprache zum Gegenstand hat, kann als Spezialkorpus definiert werden (vgl. Lemnitzer/Zinsmeister 2015: 141). 3 Die allgemeinen Reisebedingungen regeln Storno-, Haftungs- und Gewährleistungsklauseln, sowie Preis- und Leistungsänderungsklauseln (vgl. Gabler Wirtschaftslexikon, https://wirtschaftslexikon. gabler.de/definition/allgemeine-reisebedingungen-arb-29801). 4 DaF ist die Abkürzung für Deutsch als Fremdsprache. 5 Tourlex ist ein Wörterbuch im Ausbau. Die Datengrundlage orientiert sich an den Textsorten des Tourismusbereiches und wird im Laufe des Projektes erweitert und ergänzt werden.
Korpora als primäre Quellen von Tourlex
59
die Primärquellen (vgl. Wiegand 1998: 140) von Tourlex sowie der verwendete Ansatz vorgestellt (§ 3). Im vierten Abschnitt wird detailliert auf die Extrahierung der Lemmatakandidatenliste und auf die Auffindung von Äquivalenzbeziehungen sowohl von einzelnen Lexemen als auch von Kollokationen eingegangen. Das benutzte Modell wird systematisiert und seine Anwendung exemplarisch dargestellt.
2 Korpora als Datengrundlage für Wörterbuchprojekte Korpora sind Sammlungen schriftlicher oder gesprochener Äußerungen in digitaler Form, die in der Lexikographie meistens mit einem korpusbasierten, quantitativqualitativen Ansatz ausgewertet werden (vgl. Lemnitzer/Zinsmeister 2015: 13; 37). Auch wenn einige lexikographische Werke6 im Printmedium in unterschiedlichem Maße noch Zitatsammlungen7 benutzen (Klosa 2007: 108), trotz des Risikos, dass sprachliche Details somit ausgeschlossen werden können (vgl. Aktins/Rundell 2008: 52), sind heute Korpora8 die Primärquellen (vgl. Wiegand 1998: 140; Engelberg/ Lemnitzer 2009: 235–237) vieler zeitgenössischer Wörterbücher, unabhängig davon, ob sie von Verlagen oder von wissenschaftlichen Institutionen veröffentlicht werden (vgl. Klosa 2020: 11). Mit ihrer Nutzung haben sich Möglichkeiten erschlossen, die mit keinem anderen Quellentyp möglich sind, da sie ortsunabhängig zugänglich sind und ein authentisches Bild der abgebildeten Sprache liefern (vgl. Geyken/ Lemnitzer 2016: 203). Eine Analyse der Umtexte aktueller allgemeinsprachlicher (de) und zweisprachiger (de-it) online-lexikographischer Ressourcen hat dies bestätigt, sowie weitere Aspekte hervorgehoben: (1) Mehrere einsprachige deutsche Verlagswörterbücher, wie Duden oder Wahrig benutzen große Korpora, die aus unterschiedlichen Textsorten (wie Romanen, Sachbüchern, Zeitungen etc.) bestehen, die für lexikographische Zwecke zusammengestellt worden sind. Nicht alle lexikographischen Ressourcen geben jedoch Auskunft über die Datenbasis: Während die Dudenredaktion z. B. explizite
6 Eine Kombination von Korpora und Zitatsammlungen wird sogar noch für die neu bearbeitete Version des Deutschen Fremdwörterbuchs (DFWB) benutzt (vgl. Klosa 2020: 12). 7 Die Sammlungen sind das Ergebnis der Arbeit von Exzerptoren und Exzepertorinnen, die Zitate mit Angabe der Fundstelle auf Belegzettel notiert haben (vgl. Geyken/Lemnitzer 2016: 202). 8 Das Internet als Korpus und Web-Korpora, die automatisch aus dem Internet extrahiert werden, wie z. B. die Korpora der TenTen Familie in der Sketch-Engine-Umgebung und Google Books werden dazu gerechnet.
60
Carolina Flinz
Informationen9 über das Korpus zur Verfügung stellt (Größe, Komposition), sind auf der Homepage des Brockhaus10 kaum Informationen vorhanden; (2) Einsprachige deutsche Wörterbücher, die von wissenschaftlichen Institutionen erstellt worden sind, benutzen meistens Korpora. Das digitale Wörterbuch der deutschen Sprache (DWDS) benutzt das DWDS-Kernkorpus (https://www.dwds. de/d/korpora/%23part_1); die Ressource elexiko (https://www.owid.de/docs/ elex/start.jsp) greift auf ein im DeReKo (http://www1.ids-mannheim.de/kl/pro jekte/korpora.html) erstelltes virtuelles Korpus als Primarquelle zurück; (3) Zweisprachige Wörterbücher (Leo, dict.cc, Pons) geben kaum Informationen zu ihrer Datenbasis (vgl. dazu auch Flinz 2021 in Vrb.); (4) Kommentare von Nutzerinnen und Nutzern werden teilweise miteinbezogen (u. a. Duden, Brockhaus, Pons). Korpora sind in der Tat die Datenbasis vieler Wörterbücher, aber detaillierte Informationen zu ihrer Größe, Komposition, angewendeten Methode sowie ihre Anbindung an der Ressource sind eine Rarität mit Ausnahme von lexikographischen Werken, die von wissenschaftlichen Institutionen erstellt worden sind. Diese Tatsache ist auch damit verbunden, dass die Erstellung von Korpora mit methodischen Problemen verbunden ist, die aber mit einer sorgfältigen Planung gelöst werden können11: – Die Auswahl des Korpustyps12 muss gut überlegt werden, da nicht alle Korpustypen für alle lexikographischen Zwecke geeignet sind. Korpora müssen bestimmten Anforderungen gerecht werden, u. a. hinsichtlich der Größe (vgl. u. a. Lemnitzer/Zinsmeister 2015: 137; Kupietz/Schmidt 2015: 302 f.; Perkuhn/Belica 2006: 6), denn je größer ein Korpus, desto höher die Wahrscheinlichkeit, seltene Konstruktionen zu finden oder gute Ergebnisse aus statistischen Analysen zu bekommen (vgl. Geyken 2007: 37); – Die Herkunft und Qualität der Texte müssen ebenfalls überprüft werden. Die Texte, die das Korpus bilden, sollten nicht willkürlich, sondern nach bestimmten Kriterien gewählt werden;
9 Das Dudenkorpus, eine digitale Volltextsammlung, die mehr als fünf Milliarden Wortformen aus unterschiedlichen Textsorten enthält, wird als Basis für die Erfassung und Bearbeitung des Wortschatzes benutzt. Die Basis wird ständig erweitert und ergänzt (https://www.duden.de/ueber_ duden/Partner). 10 Das Brockhaus gibt nur allgemeine Informationen ohne auf die Größe oder Komposition des Korpus einzugehen (https://brockhaus.de/info/service/redaktionelle-grundsaetze/). 11 Eine Anleitung zum methodischen Vorgehen beim Aufbau eines Korpus und eine Reflektion über mögliche Probleme findet sich in Hunston (2008) und in Lemnitzer/Zinsmeister (2015: 48–55). 12 Zu den Typen von Korpora auch für lexikographische Zwecke (u. a. Referenzkorpus, Spezialkorpus, einsprachiges Korpus, mehrsprachiges Korpus, synchrones Korpus, diachrones Korpus, statisches Korpus, dynamisches Korpus) vgl. Lemnitzer/Zinsmeister (2015: 137) und Geyken/Lemnitzer (2016: 206–208).
Korpora als primäre Quellen von Tourlex
61
– Die Dokumentation der Primärdaten13 durch Metadaten spielt eine wichtige Rolle, da Metadaten die Nachvollziehbarkeit der Belege sichern und den Wert eines Korpus wachsen lassen; – Die Annotation der Daten wird als eine wertvolle Anforderung eingestuft, da sie für die Identifizierung spezifischer formbasierter Angaben unumgänglich ist14. In der lexikographischen Praxis werden Korpora vor allem für die Datenextraktion und -analyse benutzt – ein Prozedere, das von einem Zusammenspiel von automatisierten Verfahren und manueller Auswahl/Interpretation der Daten charakterisiert ist (vgl. Geyken/Lemnitzer 2016: 208). Korpora können für folgende Zwecke verwendet werden: für die Erstellung der Lemmakandidatenliste, indem statistische Daten, wie z. B. die Vorkommenshäufigkeit, ermittelt werden (Geyken/Lemnitzer 2012); für die Exploration der Verwendungsweise eines Stichwortes mit Hilfe von Keywords in Context (KWICs); für die Ermittlung der Wortbedeutung (Walter 2011) und pragmatischer Eigenschaften; für die Extrahierung von Kollokationen und Mehrwortverbindungen (u. a. Firth 1957; Sinclair 1991; Dunning 1993; Evert 2005; 2009; Fellbaum 2007); für die Identifikation von Neologismen (Steffens/al Wadi 2013) und neuen Wortbedeutungen (Cook et al. 2013); als Quelle für Beispiele (u. a. Didakowski/Geyken/Lemnitzer 2012; Kilgarriff et al. 2008); für die Identifizierung von lexikalisch-semantischen (u. a. Biemann/Bordag/Quasthoff 2004; Lemnitzer/Kunze 2007; Sierra et al. 2008; Jones 2010; Storjohann 2010) und syntagmatischen Relationen (Geyken 2011); für die Herstellung von Verweisstrukturen (Abel/Lemnitzer 2014) etc.15. Auf Korpora16 kann man heute unterschiedlich zugreifen, denn viele Korpusprojekte bieten Online-Abfragemöglichkeiten: Das Leibniz-Institut für Deutsche Sprache ermöglicht die Suche in DeReKo mit COSMAS II17 (mit Registrierung) während die Brandenburgische Akademie der Wissenschaften das Wortinformationssystem DWDS zur Verfügung stellt (ohne Registrierung, auch wenn trotzdem eine Registrierung empfohlen ist). Weitere Alternativen, die sich ebenfalls für den Aufbau eines eigenen
13 In Korpora werden drei Ebenen unterschieden: die Primärdaten, die Metadaten und die Annotation (vgl. u. a. Lemnitzer/Zinsmeister 2015: 43–48; Geyken/Lemnitzer 2016: 205). 14 Während die morphosyntaktische Annotation mit vielen Tools sogar automatisiert möglich ist (u. a. bei Sketch Engine), ist die wortübergreifende Annotation weniger verbreitet (vgl. Geyken/Lemnitzer 2016: 213). 15 Für einen Überblick, wie man aus Primärquellen Angabenklassen erstellen kann vgl. Geyken/ Lemnitzer (2016: 210–235). Es muss hinzugefügt werden, dass spezifische lexikographische Angaben (wie die Silbentrennung, die Wortbildung etc.) auch aus anderen Datenquellen wie z. B. sprachtechnologischen Programmen entnommen werden können. 16 Ein- und mehrsprachige Ressourcen in den meisten europäischen Sprachen sind u. a. in „Clarin-D“, (25.08.19) aufgelistet. 17 Alle Leistungen der Korpusrecherchewerkzeuge COSMAS I und II sollen in der Zukunft von KorAP, einer neuen Korpusanalyseplattform, übernommen werden (vgl. https://korap.ids-mann heim.de).
62
Carolina Flinz
Korpus eigenen, sind Tools18 die online verfügbar sind, wie u. a. AntConc19 (kostenfrei), WordSmith20 (kostenpflichtig) und Sketch Engine (bis 2022 dank eines europäischen Projektes kostenlos). Jedoch nur mit akkuraten Analysen können Lexikographen aus der Fülle von Texten, die gebrauchten Informationen filtern und auswählen21 und nur mit dem Heranziehen aller verfügbaren Quellen kann ein hochwertiges lexikographisches Produkt erstellt werden (vgl. Ďurčo 2010: 131).
3 Kleine und große Korpora für Tourlex 3.1 ‚Quellenstruktur‘ von Tourlex „Selber kochen oder auswärts essen gehen?“ (Lemnitzer/Zinsmeister 2015: 137). Das war eine der ersten Fragen, die am Anfang des Projektes in der Phase der Datenbeschaffung22 (vgl. dazu Flinz 2019: 18–19) gestellt wurde. Die Entscheidung war nicht so einfach, da in der Literatur für die Benutzung von großen und bestehenden Korpora, die die natürliche, authentische Sprache repräsentieren (Tognini-Bonelli 2001), plädiert wird (vgl. § 2). Jedoch weder DeReKo, das wegen seiner breiten Abdeckung von Texttypen als ‚universell verwendbare empirische Grundlage‘ definiert wird (Kupietz/ Schmidt 2015: 299), noch das DWDS-Korpus, konnten benutzt werden, da touristische Texte auch nicht als virtuelle Korpora (Kupietz/Schmidt 2015) zusammengestellt werden konnten. Die Entscheidung fiel auf ein kombiniertes Vorgehen (Abb. 1), d. h. die Nutzung zweckgebundener Teilkorpora, die für unterschiedliche Arbeitsschritte verwendet werden sollten (vgl. Wolf 2010: 23). Das kleine vergleichbare Spezialkorpus („Allgemeine Reisebedingungen“ und „Condizioni generali di contratto di vendita di pacchetti turistici“, im Folgenden mit ARB-CGV abgekürzt) wurde für die Erstellung der Stichwortliste, Identifizierung der Äquivalente, Extrahierung der Kollokationen, Ermittlung der semantischen Relationen
18 Zu Suchwerkzeugen und Abfragesprachen vgl. u. a. Lemnitzer/Zinsmeister (2015: 94–97). 19 Vgl. https://www.laurenceanthony.net/software/antconc/. 20 Vgl. https://www.lexically.net/wordsmith/. 21 Die automatische Auswahl von Belegen ist auch möglich (vgl. dazu Kilgarriff 2008). 22 Als Sekundärquellen wurden sowohl Wörterbücher im Printformat als auch im Online-Format verwendet: das DWDS-Wörterbuch, canoo.net, Duden Online und Wiktionary für grammatische Informationen (Genus, Numerus, Deklination), IPA-Zeichen und Worttrennung; Il nuovo dizionario di tedesco, Leo, dict.cc, Langenscheidt, Pons, Langenscheidt Tourismus, Wiktionary um Äquivalente, syntagmatische Angaben und Beispiele zu untersuchen. Als Tertiärquellen wurden Handbücher und Grammatiken zu Rate gezogen. Zu dieser dritten Kategorie können auch die sprachliche Intuition der Lexikographin und die linguistische Bibliothek (vgl. Geyken/Lemnitzer 2016: 200 f.) hinzugerechnet werden, die auch in diesem Projekt eine wichtige Rolle gespielt haben.
Korpora als primäre Quellen von Tourlex
63
Abb. 1: Graphische Darstellung der Primärquellen und ihrer Ziele in Tourlex.
verwendet, während die großen deutschen Korpora (DeReKo, German Web 2013) als Referenzkorpora für die Ergänzung der Stichwortliste, für intralinguale Analysen zu Abgrenzung der Fachsprache sowie für Entscheidungen zu den Zugriffstrukturen eingesetzt wurden. Für die Erstellung des Korpus ARB-CGV wurde im Internet nach Reisekatalogen von Reiseveranstaltern in deutscher und italienischer Sprache recherchiert und es wurden die Exemplare von folgenden Reiseveranstaltern ausgewählt: 1) Dertour, FTI Touristik, Interchalet, Kiwi Tours, Novasol, Olimar, Piccolonia, Reisegeier, Camino-Reisen, Wolters Reisen, Tui für das deutsche Korpus; 2) Alpitour, Columbia Turismo, Eden Viaggi, Italia Tourism Online, Itermar, King Holidays, Settemari, Veratour, I Viaggi del Turchese für das italienische Korpus. Aus den Reisekatalogen wurden die Texte der Teiltextsorte „Allgemeine Reisebedingungen“ bzw. „Condizioni generali di contratto di vendita di pacchetti turistici“ extrahiert: Nach der manuellen Bereinigung (Konvertierungsfehler, Tippfehler) wurden die Dateien in Sketch Engine hochgeladen und Metadaten dazu (u. a. Textsorte, Name des Veranstalters, Datum der Herstellung des Textes, Datum der Extraktion aus dem Internet, Link zur Online-Quelle) erstellt. Das ad hoc erstellte Vergleichskorpus ARB-CGV23 (vgl. Tab. 1) spielte trotz der niedrigen Tokenzahl aufgrund seiner Spezialisiertheit eine zentrale Rolle24 für das Projekt. Für die Korpusanalyse wurden die in der Sketch-Engine-Umgebung implementierten Tools (vgl. Kilgarriff et al. 2004: 108–112) verwendet, wie Word List, zur Erstellung von Listen auf der Basis der absoluten Häufigkeit (Wörter, Lemmata, Substantive, Verben etc.); Keywords, zur Extrahierung der einzelnen und multiplen Schlüsselwörter auf der Basis von Referenzkorpora; Word Sketches, zur automatischen Zusammenfassung des grammatischen und kollokationellen Verhaltens eines Wortes;
23 Die hohe Standardisierung der Textsorte hat die Entscheidung begründet, die Zahl der Texte auf zehn zu beschränken. Das Hinzufügen weiterer Spezialkorpora für die Erarbeitung anderer Bereiche des Wörterbuches ist in Planung. 24 Zu den Vorteilen von kleinen spezialisierten Korpora für kontrastive Studien vgl. Wolf 2004, 2010 und Kratochvilová 2009.
64
Carolina Flinz
Tab. 1: Eigenschaften des Vergleichskorpus. Name des Korpus
Name des Korpus
ARB
CGV
Dateien
Tokens
.
.
Deutsch
Italienisch
Italian TreeTagger; Marco Baroni’s Tagset .
RFT-Tagger .; STTS Tagset
Sprache
Aufbereitung
Concordance, zur Darstellung von Wörtern (Lemmata etc.) im Kontext; Thesaurus, zur Visualisierung von Synonymen und ähnlichen Wörtern auf der Basis des Kollokationsprofils; N-Grams, zur Extrahierung von N-Grammen (Bigramme, Trigramme etc.). Das Korpus, bzw. die Liste der Keywords in Context (KWICS) wurde anschließend mit dem Tool Lexpan (Lexical Pattern Analyzer, vgl. Steyer 2013: 110 f.)26 durchsucht. Hiermit wurden syntagmatische Strukturen auf Festigkeit, Varianz, Slotbesetzung und kontextuelle Einbettungsmuster explorativ untersucht. In einem zweiten Schritt wurden weitere Korpora integriert: das Referenzkorpus DeReKo (1) und das German Web Corpus 2013 (2). (1) Das Deutsche Referenzkorpus DeReKo (DeReKo)27 mit seinen 43 Milliarden Wörtern (Stand 18.03.2019) ist ‚die weltweit größte linguistisch motivierte Sammlung elektronischer Korpora‘. Es unterliegt stetigem Wachstum (3.1 Billionen Tokens pro Jahr, vgl. Kupietz et al. 2018: 4353) und wird kontinuierlich überarbeitet. In DeReKo sind unterschiedliche Typen von Korpora enthalten, wie auch historische Korpora (wie das Goethe Korpus und das Grimm Korpus) und vergleichbare Korpora (wie die Wikipedia Korpora). Die geschriebenen deutschsprachigen Texte entsprechen unterschiedlichen Textsorten, wie Tageszeitungen, Zeitschriften, literarischen Texten, Fachtexten28 etc. Das Korpus ist mit dem Korpusrechercheund Analysesystem COSMAS II (Corpus Search, Management and Analysis System) durchsuch- und analysierbar (vgl. Bodmer Mory 2014). Die Ergebnisse können nach Jahr, Textsorte, Herkunft etc. gefiltert werden. Automatisch berechnete
25 Die digitale Aufbereitung der Texte (Tagging und Lemmatisierung) erfolgte automatisch durch entsprechende Tools, die in Sketch Engine integriert sind. 26 Lexpan ist ein einzelsprachenunabhängiges Analyseprogramm, das im Projekt ‚Usuelle Wortverbindungen‘ des Leibniz-Instituts für Deutsche Sprache entwickelt wurde (http://www1.ids-mann heim.de/lexik/uwv/lexpan.html). 27 Vgl. DeReKos Version (2019-I) unter https://cosmas2.ids-mannheim.de/cosmas2-web/faces/ home.xhtml. 28 Informationen zu den letzten Releases von DeReKo können u. a. aus Kupietz et al. 2018 entnommen werden.
Korpora als primäre Quellen von Tourlex
65
Kookkurrenzen können mit zwei Tools erstellt werden: die Kookkurrenzdatenbank (CCDB), die automatisch berechnete Kookkurrenzprofile zu 220.000 Wörtern visualisiert, und die in COSMAS II implementierte statistische Kookkurrenzanalyse, die signifikante Wortkombinationen ermittelt, und zwar nicht nur als Bigramme, sondern auch als rekurrente syntagmatische Strukturen. KWICs und Korpusstellen werden in Signifikanzclustern zusammengestellt, wobei die Parameter (u. a. Kookkurenzspanne, Korpusbasis) auch individuell festgelegt werden können. Zusätzlich wurde das Tool DeReKoll eingesetzt, das die syntagmatischen Muster der Lemmata der provisorischen Stichwortliste von Tourlex aus der CCDB und DeReKo extrahiert: Die Menge der Wortformen, die in den Reisebedingungen (ARV und CGV) vorkommen wurde als das Vokabular dieser Fachsprache definiert (dazu vgl. Flinz/Perkuhn 2018: 962). Basierend auf der CCDB-Sammlung von typischen allgemeinsprachlichen Formulierungen (Belica 2007) wurden die Verbindungen herausgefiltert, die nur (bzw. bis zu einem gewissen Grad) aus Wörtern bestehen, die in diesem Fachsprachenwortschatz enthalten sind29; (2) Das German Web Corpus (2013) gehört zu der TenTen Familie der Sketch Engine Korpora und ist ein automatisch generiertes Internetkorpus aus dem Jahr 2013 mit 16.5 Billionen Wörtern (86,85% deutsche Texte, 6,54% österreichische Texte, 6,24% schweizerische Texte; 0,38% Texte aus anderen deutschsprachigen Ländern). Das lemmatisierte und morphosyntaktisch annotierte Korpus befindet sich in der Sketch Engine Webanwendung. Das Korpus kann mit unterschiedlichen implementierten Tools durchsucht werden (vgl. oben). Neben dem Vergleichskorpus, DeReKo und German Web Corpus 2013, wurde hinzu auch das Internet benutzt, um Probleme in der Äquivalenzbeziehung zu lösen oder um weitere Kontexte zu finden. Im weiteren Verlauf des Projektes können weitere kleine dynamische Spezialkorpora hinzugefügt werden (Abb. 2), so dass weitere Bereiche der Tourismusbranche im Wörterbuch addiert werden können:
29 Dieses Verfahren wurde auf der Wortformenebene operationalisiert.
Teiltextsorte 1 Teiltextsorte 2 (Allgemeine (Orientierungstext) Reisebedingungen)
Teiltextsorte 3
Textsorte 1 (Reisekataloge)
Teiltextsorte... Teiltextsorte 1
Textsorte...
Teiltextsorte 2
Textsorte 2 (Reiseführer)
Vergleichbare Spezialkorpora
Tourlex
Korpus 1 (DeReKo)
Korpus 2 (German Web 2013)
Deutsche Korpora
Korpus...
66 Carolina Flinz
Abb. 2: ‚Quellenstruktur im Ausbau‘.
Korpora als primäre Quellen von Tourlex
67
3.2 Der Ansatz In der korpusgestützten Lexikographie30 werden für die Erstellung von lexikographisch bearbeiteten Wörterbüchern31 zwei Ansätze unterschieden: der corpus-based (oder auch korpusvalidierende) und der corpus-driven (auch korpusgesteuerte) Ansatz (vgl. dazu Klosa 2007: 106; 112; Klosa 2010: 104). Im ersten Fall sucht man in einem Korpus nach Beispielen, die bestimmte Argumente unterstützen, während im zweiten Fall das Korpus als Ganzes ausgewertet wird und die gewonnenen Daten vollständig beschrieben werden (vgl. Tognini-Bonelli 2001: 65; 84). In der lexikographischen Praxis können beide Ansätze kombiniert werden (vgl. Storjohann 2005: 254). Lemnitzer spricht von einem korpusbasierten, quantitativ-qualitativen Ansatz (Lemnitzer/Zinsmeister 2015: 37): Die Daten werden aus Korpora extrahiert, aber zusätzlich interpretiert und lexikographisch bearbeitet. Für Tourlex wurden beide Ansätze angewendet und es wurden sowohl quantitative als auch qualitative und quantitativ-qualitative Arbeitsschritte im Laufe der Arbeit getätigt (Abb. 3):
Abb. 3: Ansatz und Arbeitsschritte in Tourlex.
30 Klosa (2007: 110) differenziert zwischen der korpusgestützten und der korpusgebundenen Lexikographie. In der korpugebundenen Lexikographie werden außer den Korpusdaten keine weiteren Quellen hinzugezogen. Diese Art von Lexikographie wird zurzeit von der korpusgestützen Lexikographie überholt. 31 Vgl. die Unterscheidung zwischen automatisch erstellten Wortschatzinformationensystemen und lexikographisch bearbeiteten Wörterbüchern (Müller-Spitzer 2003).
68
Carolina Flinz
4 Lexikographische Primärquellen und ihre lexikographischen Anwendungen 4.1 Die Extrahierung der Lemmakandidatenliste aus ARB Die provisorische Stichwortliste32 wurde durch systematische Korpusauswertungen des Korpus ARB erstellt, nachdem im Voraus festgelegt wurde, dass in der Liste die übliche Nennform (auch Grundform oder Zitierform genannt) aufgenommen werden sollte33. Für ihre Erstellung wurden unterschiedliche Frequenzlisten34 extrahiert und kombiniert: (1) Liste n. 1. Sie wurde automatisch mit der Funktion Wordlist (Parameter Nouns) auf der Basis der absoluten Häufigkeit erstellt (vgl. Abb. 4). Aus dieser Liste konnten die häufigsten Substantive des Korpus entnommen und extrahiert werden. Nach Bereinigung der Liste, indem unwichtige Abkürzungen35 (wie u. a. ‚S‘ mit 167 Okkurrenzen), Reiseveranstalternamen (wie u. a. ‚Camino-Reisen‘ mit 88 Okkurrenzen, ‚FTI‘ mit 52 Okkurrenzen) und Fehler (wie ‚B‘, das eigentlich ‚z. B.‘ wäre, mit 80 Okkurrenzen) getilgt wurden, wurde die Liste in eine Excel-Tabelle eingetragen; (2) Liste n. 2. Sie wurde automatisch mit der Funktion Keywords (Option single words) auf der Basis des integrierten Referenzkorpus German Web 2013 extrahiert (vgl. Abb. 5). Aus der Keywordsliste wurden dann Veranstalternamen (wie u. a. ‚Olimar‘ mit 141 Okkurrenzen, ‚Piccolonia‘ mit 42 Okkurrenzen‚ ‚FTI‘ mit 53 Okkurrenzen, ‚NOVASOL‘ mit 18 Okkurrenzen), Fehler (wie u. a. ‚INTER‘ mit 48 Okkurrenzen, ‚CHALET‘ mit 41 Okkurrenzen), andere Wortarten (wie u. a. Adjektive ‚unbenommen‘, ‚ticketlose‘), uninteressante Stichwörter, (wie u. a. ‚Hyperlink‘ mit 29 Okkurrenzen) gelöscht. Einige Keywords, die fehlerhaft waren, die jedoch wichtig schienen, wurden hingegen korrigiert und aufgenommen (‚Reisebeginnab‘, anstelle von ‚Reisebeginn‘; ‚Reiseendes‘, anstelle von ‚Reiseende‘). Die endgültige Liste wurde mit Informationen zum Score, zur Okkurrenz im Untersuchungskorpus und im Referenzkorpus ergänzt und in o. g. Excel-Tabelle eingefügt; (3) Liste n. 3. Die Liste DeReKo Keywords wurde auf der Basis des Referenzkorpus DeReKo erstellt36 (Abb. 6) und sie berücksichtigt sowohl das statistische Assoziationsmaß
32 Aufgrund der Pilotnatur des Wörterbuchprojektes wurde entschieden, sich vorerst nur auf die Wortart ‚Substantiv‘ zu beschränken. Eine Vervollständigung mit anderen Wortarten ist in Planung. Als Mustereintrag wurde in Tourlex jedoch schon ein Verb verarbeitet, vgl. ‚absagen‘ (https://wiki. uni-mannheim.de/tourlex/index.php?title=Absagen). 33 Zum Verhältnis Grundform und Wortformen in Korpora vgl. Sinclair (1991: 41–42). 34 Es wurde vorerst eine Mindestfrequenz von „5“ ausgewählt. Anschließend wurden auch die unteren Frequenzschichten extrahiert und notiert. 35 Abkürzungen, die für fremdsprachliche Benutzer von Interesse waren, wie z. B. ‚BGB‘ das für ‚Bürgerliches Gesetzbuch‘ steht, wurden in die endgültige Lemmaliste aufgenommen. 36 Die Liste wurde dank der internen Werkzeugen des Leibniz-Institut für Deutsche Sprache erstellt. Dazu vgl. Flinz 2019: 19.
Abb. 4: Wortliste nach der Wortart ‚Substantiv‘.
Korpora als primäre Quellen von Tourlex
69
70
Carolina Flinz
Abb. 5: Keywords des Korpus mit German Web 2013 als Referenzkorpus.
37 Informationen zu den Abkürzungen: ‚Rg‘: Rang; ‚DeR‘: DeReKo; ‚RB‘: Korpus Reisebedingungen; ‚Win‘: Winner.
Abb. 6: Die Term-Extraktions-Liste mit DeReKo (2017-II) als Referenzkorpus.37 Korpora als primäre Quellen von Tourlex
71
72
Carolina Flinz
Chi-Quadrat (chi2) als auch das Assoziationsmaß Log-Likelihood-Ratio (LLR)38. Daraus wurden Eigennamen (wie u. a. ‚Piccolonia‘ mit 42 Okkurrenzen, Olimar mit 141 Okkurrenzen), Fehler (wie u. a. ‚Chalet‘ mit 48 Okkurrenzen), Kennzeichnungen von Reisearten (wie u. a. ‚XFTI‘ mit 7 Okkurrenzen, ‚XTUI‘ mit 6 Okkurrenzen) gelöscht. Anders als die zwei anderen Listen (Liste n.1 und Liste n.2) enthält diese Liste Wortformen und diese Tatsache war auch für spätere Arbeitsschritte von Bedeutung. Anschließend wurde auch die Streuung der Wörter in den unterschiedlichen Subkorpora (die einzelnen Reiseveranstalter) verifiziert, so dass die Aufnahme von spezifischen Stichworten, die z. B. nicht in DeReKo enthalten waren, aber eine niedrige Streuungszahl in ARB hatten, berücksichtigt werden konnte (dazu vgl. Flinz 2019: 23). Die aus den drei Listen entnommenen Informationen wurden zusammengeführt und mit der Excel-Funktion Merge in eine einzige Liste überführt (Dubletten wurden gelöscht). Die daraus resultierende Lemmakandidatenliste (175 Lemmata)39 wurde dann anschließend redaktionell bearbeitet und online gestellt40.
4.2 Auffindung von Äquivalenzbeziehungen im ARB-CGV Das Vergleichskorpus ARB-CGV war eines der wichtigsten Primärquellen für die Identifizierung von Äquivalenzbeziehungen sowohl für einzelne Lexeme als auch für Kollokationen / Mehrwortverbindungen41 und für die Extrahierung der Verwendungsangaben. Für den Prozess der Auffindung der Äquivalenzbeziehungen wurde ein mehrphasiges Modell (Abb. 7) entwickelt, das aus den folgenden sechs Schritte besteht: (1) Metalexikographische Analyse der Stichwörter in zweisprachigen Wörterbüchern (L1L2) bezüglich des äquivalenten Lexems, der äquivalenten Kollokation / Wortverbindung und der Verwendungsbeispiele; (2) Analyse der Kontexte in zweisprachigen Parallelkorpora (L1 L2) bezüglich des äquivalenten Lexems, der äquivalenten Kollokation / Wortverbindung und der Verwendungsbeispiele; (3) Extrahierung der Kookkurrenzen im L1-Korpus zur Ermittlung der Kollokationen und Mehrwortverbindungen; (4) Extrahierung der Kookkurrenzen im L2-Korpus zur Ermittlung der Kollokationen und Mehrwortverbindungen;
38 Exemplarisch wurde hier die Anordnung nach dem Assoziationsmaß chi2 dargestellt. 39 Ein korrektiver formaler Vergleich mit anderen Wörterbuchlisten konnte nicht durchgeführt werden, da keine anderen Wörterbücher dieses Typus zum Sprachenpaar Deutsch-Italienisch existieren. 40 Vgl. https://wiki.uni-mannheim.de/tourlex/index.php?title=Stichwörter. 41 Für Tourlex war sowohl der empirische (Belica/Perkuhn 2015: 218; Firth 1957: 194; Evert 2009: 1213; Steyer 2013: 76) als auch der theoretische Begriff (Hausmann 1984: 401 f.) von Bedeutung. Vgl. dazu Flinz 2019: 26–27.
Abb. 7: Korpusbasiertes kontrastives Analyse-Modell für den Äquivalenzfindungsprozess.
Korpora als primäre Quellen von Tourlex
73
74
Carolina Flinz
(5) Vergleich der Ergebnisse zu (1), (2), (3), (4) und Schlussfolgerungen zu den Äquivalenzbeziehungen; (6) Weitere Recherchen im Internet, um Äquivalente und Kontexte zu finden oder zu überprüfen. Das Modell, das sich an Vorarbeiten im Bereich der korpusbasierten kontrastiven Analyse anlehnt42, erwies sich vorteilhaft sowohl für Stichwörter, die schon in anderen zweisprachigen Ressourcen verzeichnet waren (aber meistens ohne Informationen zum kollokationellen Verhalten) als auch für Stichwörter, die in zweisprachigen Ressourcen nicht enthalten oder nicht der Fachsprache des Tourismus zuzuordnen waren. Im Folgenden soll exemplarisch auf zwei Stichwörter eingegangen werden, die prototypisch für die obengenannten problematischen Fälle stehen: (a) Das Stichwort ist in fast keinem zweisprachigen Wörterbuch enthalten. Als Beispiel wird ‚Nichtantritt‘ exemplifiziert. Als Erstes wurde das Stichwort in zweisprachigen Ressourcen (Schritt 1) und Parallelkorpora (Schritt 2) untersucht. Die Ergebnisse sind in Tab. 2 zusammengefasst:
Tab. 2: Analyse von Stichwortäquivalenten von ‚Nichtantritt‘. Nichtantritt Pons
nein
Dict.cc
Leo
nein
ReversoContext Linguee
nein
Ja, ‚no show‘ nein
42 Bezüglich Phraseologismen sind u. a. die Arbeiten von Taborek 2011 und Dziurewicz 2015 zu erwähnen, während zu Funktionsverbgefügen u. a. Taborek 2018: 136–140 und 2018a 198–200. Zu der Analyse von Mehrworteinheiten vgl. Ďurčo 2018: 111–118. 43 Pons Online-Wörterbuch (https://de.pons.com). 44 Dict.cc Dizionario tedesco-italiano (https://deit.dict.cc). 45 Leo (https://www.leo.org/englisch-deutsch). 46 Reverso Context besteht aus übersetzten Texten offizieller Dokumente und mehrsprachiger Websites, vgl. https://context.reverso.net/übersetzung/about. 47 Linguee benutzt ‚zuverlässige‘ Übersetzungen aus offiziellen Dokumenten und Websites. Vgl. https://www.linguee.it/italiano-tedesco/about#about.
Korpora als primäre Quellen von Tourlex
75
Es wurde festgestellt, dass das Wort in keiner einzigen Ressource mit Ausnahme von ReversoContext zu finden war (Abb. 8):
Abb. 8: Screenshot zum Suchergebnis von ‚Nichtantritt‘ in ReversoContext.
Es fällt jedoch auf, dass im Parallelkorpus von ReversoContext die Äquivalenz nur partiell ist48, da ‚no show‘ in einer niedrigeren Abstraktionsebene einzuordnen ist, wie z. B. Gespräche unter Angestellten (vgl. Hoffmann 1976: 184–186). Für die Auffindung der möglichen Äquivalente wurden sowohl die L2-fachsprachliche Kompetenz als auch das Internet benutzt und die Äquivalenzauswahl fiel auf ‚mancata partenza‘. Anschließend wurden das Wortprofil und die Kookkurrenzen von ‚Nichtantritt‘ im L1-Korpus (Schritt 3, s. o.) und von ‚mancata partenza‘ im L2-Korpus (Schritt 4, s. o.) extrahiert und analysiert. Zusammenfassend hat sich folgendes Bild ergeben (Tab. 3):
48 Bedauerlicherweise sind in ContextReverso weder Informationen zur Quelle noch zur Übersetzungs-Richtung zu finden. Die einzige Information ist: ‚verschiedene Quellen‘ (https://context.re verso.net/übersetzung/deutsch-italienisch/Nichtantritt).
76
Carolina Flinz
Tab. 3: ‚Nichtantritt‘ und ‚mancata partenza‘ im Vergleich. Stichwort
Informationen aus den Kookkurrenzen
Nichtantritt
bei Nichtantritt bei Nichtantritt der Reise bei Nichtantritt des Fluges bei Nichterscheinen bzw. Nichtantritt
mancata partenza
per la mancata partenza per la mancata partenza di uno o più turisti per eventuali mancate partenze per mancate partenze e interruzioni del viaggio
Übersetzung ins Deutsche
bei Nichtantritt bei Nichtantritt von einem oder mehreren Touristen bei eventuellen Nichtantritten bei Nichtantritt und Reiseunterbrechungen
Die Ergebnisse wurden im Anschluss für die lexikographische Beischreibung in Tourlex benutzt. (b) Das Stichwort ist in mehreren Wörterbüchern enthalten, jedoch mit kaum Informationen zu den Kontexten. Als Beispiel wird ‚Umbuchung‘ veranschaulicht. Als Erstes (Schritt 1) wurde Folgendes festgestellt: – Das Stichwort ist bei Dict.cc nicht vorhanden; – Das Äquivalent ist bei Pons vorhanden, aber nur partiell korrekt, da ‚cambiamento di biglietto‘ (dt. Ticketumbuchung) viel spezifischer ist, denn eine Umbuchung kann sowohl Tickets als auch Reisen betreffen. Außerdem sind keine Beispiele aufgelistet; – Bei Leo betrifft das Äquivalent nicht die Tourimusfachsprache (‚voltura‘, ‚scrittura di storno‘, dt. Umbuchung in der Buchhaltung), sondern ist dem Rechnungswesen zuzuordnen; – Bei ReversoContext sind unterschiedliche Übersetzungen zu finden, die den mehrfachen Bedeutungen des Terminus entsprechen. Für die Tourimusfachsprache ist ‚cambio di prenotazione‘, ‚cambiamento della prenotazione‘ angegeben; – Bei Linguee sind unterschiedliche Übersetzungen vorzufinden, die jedoch sehr unübersichtlich sind, da L1-Lexem und L2-Lexem oft nicht übereinstimmen. Für die Tourimusfachsprache findet man ‚cambio di prenotazione‘.
Korpora als primäre Quellen von Tourlex
77
Die anschließende Kookkurrenzanalyse konnten Folgendes hervorheben (Tab. 4): Tab. 4: ‚Umbuchung‘ und ‚modifica della prenotazione‘ im Vergleich. Stichwort
Informationen aus den Kookkurrenzen
Umbuchung
kostengünstige Umbuchung kostenlose Umbuchung unentgeltliche Umbuchung
Übersetzung ins Deutsche
die Umbuchung führt zu . . . die Umbuchung kostet . . . eine Umbuchung ist (nicht) möglich Umbuchung des Veranstalters Umbuchung der Reise/n Umbuchung des Hotels Umbuchung des Flugs eine Umbuchung zulassen eine Umbuchung anbieten eine Umbuchung vornehmen Umbuchung und Stornierung cambio di prenotazione
nicht vorhanden
cambio della prenotazione
nicht vorhanden
modifica / modifica della prenotazione / modifica delle prenotazioni / modifica del pacchetto turistico
modifica della destinazione modifica del complesso alberghiero per modifica della destinazione % per modifica della destinazione no penali corrispondere le spese conseguenti alla modifica richiedere la modifica accettare la modifica modifica dopo la partenza modifica e annullamento
Umbuchung des Reiseziels Umbuchung des Hotels für Umbuchung des Reiseziels % für Umbuchung des Reiseziels keine Kosten die Kosten für Umbuchung bezahlen die Umbuchung beantragen die Umbuchung annehmen eine Umbuchung nach der Abreise Umbuchung und Stornierung
variazione della prenotazione
la variazione della prenotazione comporta l’addebito di un costo richiedere la variazione
die Umbuchung kostet eine Umbuchung beantragen
Wie man dieser Zusammenfassung entnehmen kann, sind für ‚Umbuchung‛ unterschiedliche Übersetzungsmöglichkeiten im Korpus (ARB-CGV) zu finden, die aber in den Wörterbüchern nicht aufgelistet werden. Die Internetrecherche hat auch in diesem Fall eine wichtige Rolle gespielt, vor allem für die Übersetzung der Kontexte.
78
Carolina Flinz
Ohne die Anwendung des mehrphasigen Modells wäre nur eine partielle Äquivalenzfindung möglich gewesen: Ohne die Analyse von syntaktischen, semantischen, morphologischen und lexikalischen Beziehungen hätte keine Identifizierung der Äquivalenten stattgefunden49. Die Kontexte wurden auch benutzt, um das kollokationelle Verhalten sowohl intralingual als auch interlingual beschreiben zu können. Kollokationen und usualisierte Einheiten des Lexikons wurden induktiv rekonstruiert und auf Festigkeit, Varianz und Musterhaftigkeit (Steyer 2013: 76) überprüft. In einem weiteren Schritt wurde durch die Nutzung von DeReKoll für Tourlex ein intralingualer Vergleich durchgeführt: Hiermit konnten die syntagmatischen Muster der Lemmata aus der CCDB und DeReKo extrahiert werden und die spezifischen Verbindungen des Spezialkorpus denen der Standardsprache gegenübergestellt werden50. Ein intralingualer / interlingualer Vergleich hat anschließend stattgefunden: Mit der Erstellung von Füllertabellen51 war es möglich, Wortverbindungen in beiden Sprachen zu rekonstruieren, die dann nach syntaktischen Kriterien systematisiert wurden. Verwendungsbeispiele des Stichwortes und des Äquivalentes wurden auch aus den primären Quellen (Korpus ARB-CGV) entnommen. Die Entscheidung, Beispiele sowohl aus dem deutschen als auch dem italienischen Korpus hinzuzufügen, wurde auf Basis von Benutzerrückmeldungen getroffen: Mit diesen zweisprachigen Beispielen aus authentischen Quellen können die Benutzerinnen und Benutzer Tourlex für unterschiedliche Zielsetzungen benutzen.
5 Zusammenfassung und Fazit In der lexikographischen ‚Quellenstruktur‘ von Tourlex sind sowohl kleine als auch große zweckgebundene Korpora für die Erarbeitung spezifischer lexikographischer Schritte eingesetzt worden. Es wurde ein kleines vergleichbares Spezialkorpus erstellt, um die provisorische Stichwortkandidatenliste zu generieren (§ 4.1) und mit Hilfe eines korpusbasierten kontrastiven mehrphasigen Analyse-Modells wurden induktiv Äquivalenzbeziehungen bestimmt (§ 4.2). Die primären Quellen sollten jedoch nicht als etwas Statisches, sondern als etwas Dynamisches ‚im Ausbau‘ gesehen werden, da sowohl weitere ‚kleine‘ Spezialkorpora als auch weitere größere Korpora hinzugefügt werden können. Die Benutzung des Internets als zusätzliche Recherchemöglichkeit hat sich bei
49 Zu der Notwendigkeit von Vergleichskorpora für die Identifizierung von Äquivalenten vgl. u. a. Sinclair/Payne/Pérez 1996: 177; Calzolari 1996: 6; Prinsloo 2013: 1346. 50 Es sind interessante Fälle zum Vorschein gekommen, wie u. a. die bevorzugten Verbindungen des Lexems ‚Rücktritt‘, die durch Rücktritte bestimmter Personen von Positionen in der Politik oder Sport geprägt sind und nicht auf Reisekontexte verweisen (vgl. Flinz/Perkuhn 2018: 963–964). 51 Die Füllertabellen wurden mit Lexpan, das einzelsprachenunabhängig ist, erstellt. Die KWICs wurden aus Sketch Engine exportiert und in Lexpan importiert. Dazu vgl. http://uwv.ids-mannheim. de/lexpan/.
Korpora als primäre Quellen von Tourlex
79
Problemfällen, die mit dem spezialisierten Korpus nicht bearbeitet werden konnten, als lohnenswertes Vorgehen erwiesen. Mit diesem Vorgehen wurde versucht, dem alten Prinzip des Heranziehens aller verfügbaren Quellen zu folgen. Auch die Kombination von einem korpusvalidierenden (corpus-based) und einem korpusgesteuerten (corpus-driven) Ansatz, in dem sich quantitative, qualitative und quantitativ-qualitative Arbeitsschritte gegenseitig ergänzt haben, hat sich im Laufe des lexikographischen Prozesses als fruchtbar erwiesen. Abschließend soll darauf hingewiesen werden, dass jeder dieser Schritte die Erstellung eines besseren (jedoch nie perfekten) lexikographischen Produktes zum Ziel hatte (vgl. Durco 2010: 131) und mit der Tatsache verbunden war, dass dynamische Wörterbücher von einem ständigen Überdenken charakterisiert sind, das Einfluss auf alle Phasen und Teile des lexikographischen Prozesses ausüben kann.
Literatur Forschungsliteratur Abel, Andrea/Lemnitzer, Lothar (2014) (Hrsg.): Vernetzungsstrategien, Zugriffsstrukturen und automatisch ermittelte Angaben in Internetwörterbüchern. OPAL 2/2014. Mannheim: Institut für Deutsche Sprache. Aktins, B.T. Sue/Rundell, Michael (2008): The Oxford Guide to Practical Lexicography. Oxford: Oxford University Press. Belica, Cyril (2007): Kookkurrenzdatenbank CCDB – V3. Eine korpuslinguistische Denk- und Experimentierplattform für die Erforschung und theoretische Begründung von systemisch-strukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs. Mannheim: Institut für Deutsche Sprache. Belica, Cyril/Perkuhn, Rainer (2015): Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster. In: Haß, Ulrike/Storjohann, Petra (Hrsg.): Handbuch Wort und Wortschatz. Berlin: de Gruyter, 201–225. Biemann Chris/Bordag, Stefan/Quasthoff, Uwe (2004): Automatic Acquisition pf Paardigmatic Relations using Iterated Cooccurrencies. In: Proceedings of LREC2004, Lisboa, Portugal. Bodmer Mory, Franck (2014): Mit COSMAS II „in den Weiten der IDS-Korpora unterwegs“. In: Ansichten und Einsichten. 50 Jahre Institut für Deutsche Sprache. Mannheim: Institut für Deutsche Sprache, 376–385. Calzolari, Nicoletta (1996): Lexicon and corpus: a Multi-faceted Interaction. In: Gellerstam, Martin, et al. (Hrsg.): EURALEX ’96 Proceedings I. Göteborg: Göteborg University, 3–16. Cook, Paul, et al. (2013): A lexicographic appraisal of an automatic approach for detecting new word senses. In: Kosem, I., et al. (Hrsg.): Electronic lexicography in the 21st century: thinking outside the paper. Proceedings of the eLex 2013 conference, 17–19 October 2013, Tallinn, Estonia. Ljubljana/Tallinn: Trojina, Institute for Applied Slovene Studies/Eesti Keele Instituut, 48–65. Didakowski, Jörg/Geyken, Alexander/Lemnitzer, Lothar (2012): Automatic example sentence extraction for a contemporary German dictionary. In: Vatvedt Fjeld, Ruth/Torjusen, Julie Matilde (Hrsg.): Proceedings of the 15th EURALEX International Congress. 7–11 August 2012. Oslo: Department of Linguistics and Scandinavian Studies, 343–349.
80
Carolina Flinz
Dunning, Ted (1993): Accurate methods for the statistics of surprise and coincidence. In: Journal of Computational Linguistics, 19/1, 61–74. Ďurčo, Peter (2010): Einsatz von Sketch Engine im Korpus – Vorteile und Mängel. In: Ptashnyk, Stefaniya/Hallsteinsdóttir, Erla/Bubenhofer, Noah (Hrsg.): Korpora, Web und Datenbanken: computergestützte Methoden in der modernen Phraseologie und Lexikographie. Corpora, web and databases. Baltmannsweiler/Hohengehren: Schneider-Verlag, 119–131. Ďurčo, Peter (2018): Vom Nutzen der vergleichbaren Korpora bei der kontrastiven lexikographischen Erfassung von Mehrworteinheiten. In: Jesenšek, Vida/Enčeva, Milka (Hrsg.): Wörterbuchstrukturen zwischen Theorie und Praxis. Einführung. Berlin/Boston: de Gruyter, 107–118. DWDS-Referenzkorpora [Unter: https://www.dwds.de/d/k-referenz#korpus21; letzter Zugriff: 25.08.19]. Dziurewicz, Elzbieta (2015): Korpusbasierte Analyse der Phraseologismen im Deutschen am Beispiel des phraseologischen Optimums für DaF. Hamburg: Dr. Kovač. Engelberg, Stefan/Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4. überarb. u. erw. Aufl. Tübingen: Stauffenburg. Engelberg, Stefan/Storrer, Angelika (2016): Typologie von Internetwörterbüchern und -portalen. In: Klosa, Annette/Müller-Spitzer, Carolin (Hrsg.): Internetlexikografie. Ein Kompendium. Berlin/ Boston: de Gruyter, 31–63. Evert, Stefan (2005): The Statistics of Word Cooccurencies: Word Pairs and Collocations. Dissertation, Institut für maschinelle Sprachverarbeitung, Universität Stuttgart 2005. [Unter: https://elib. uni-stuttgart.de/bitstream/11682/2573/1/Evert2005phd.pdf; letzter Zugriff: 25.08.19]. Evert, Stefan (2009): Corpora and Collocations. In: Lüdeling, Anke/Merja, Kytö (Hrsg.): Corpus Linguistics. An International Handbook. Vol. 2, 1212–1248. Fellbaum, Christiane (Hrsg.) (2007): Idioms and Collocations: Corpus-based Linguistic and Lexicographic Studies. London: Continuum. Firth, John Rupert (1957): Modes of meaning. In: Papers in Linguistics 1934–1951, London: Oxford University Press, 190–215. Flinz, Carolina (2015): Online-Fachwörterbücher des Tourismus: Bestandsaufnahme und Darstellung der Hauptmerkmale. In: Calanas Continente, José A./Robles i Sabater, Ferran (Hrsg.): Die Wörterbücher des Deutschen. Entwicklungen und Perspektiven. Frankfurt am Main: Peter Lang, 43–58. Flinz, Carolina (2019): Der lexikographische Prozess bei Tourlex (ein deutsch-italienisches Fachwörterbuch zur Tourismussprache) für italienische DaF-Lerner. In: Klosa, Annette/Storrer, Angelika/Taborek, Janusz (Hrsg.): Internetlexikographie und Sprachvermittlung. Berlin/ Boston: de Gruyter, 9–35. Flinz, Carolina (2021): ,Wird eine Reise storniert oder annulliert?‘ Kollokationen und mehr oder weniger feste Wortverbindungen in deutsch-italienischen Online-Wörterbüchern. In: Schafroth, Elmar/Mollica, Fabio/Mellado Blanco, Carmen (Hrsg.): Kollokationen. Theoretische, forschungspraktische und fremdsprachendidaktische Überlegungen. Frankfurt am Main: Lang, 69–92. Flinz, Carolina/Perkuhn, Rainer (2018): Wortschatz und Kollokationen in „Allgemeine Reisebedingungen“. Eine intralinguale und interlinguale Studie zum fachsprachlichlexikographischen Projekt „Tourlex“. In: Krek, Simon, et al. (Hrsg.): Proceedings of the 18th Euralex International Congress, 17–21 July 2018, Ljubljana, Slovenia. Ljubljana University Press, Faculty of Arts; Ljubljana. 959–967. Geyken, Alexander (2007): The DWDS corpus: A reference corpus for the German language of the 20th century. In: Fellbaum, Christiane (Hrsg.): Collocations and Idioms: Linguistic, lexicographic, and computational aspects. London: Continuum, 23–41.
Korpora als primäre Quellen von Tourlex
81
Geyken, Alexander (2011): Statistische Wortprofile zur schnellen Analyse der Syntagmatik in Textkorpora. In: Abel, Andrea/Zanin, Renata (Hrsg.): Korpora in Lehre und Forschung. BozenBolzano: University Press, 115–137. Geyken, Alexander/Lemnitzer, Lothar (2012): Using Google Books Unigrams to Improve the Update of Large Monolingual Reference Dictionaries. In: Vatvedt Fjeld, Ruth/Torjusen, Julie Matilde (Hrsg.): Proceedings of the 15th EURALEX International Congress. 7–11 August 2012. Oslo: Department of Linguistics and Scandinavian Studies, 362–366. Geyken, Alexander/Lemnitzer, Lothar (2016): Automatische Gewinnung von lexikografischen Angaben. In Klosa, Annette/Müller-Spitzer, Carolin (Hrsg.): Internetlexikografie: Ein Kompendium. Berlin/Boston: de Gruyter, 195–241. Hausmann, Franz J. (1984): Wortschatzlernen ist Kollokationslernen. Zum Lehren und Lernen französischer Wortverbindungen. In: Praxis des neusprachlichen Unterrichts 31, 385–406. Hoffmann, Lothar (1976): Kommunikationsmittel Fachsprache. Eine Einführung. Berlin: Akademie Verlag. Hunston, Susan (2008): Collection strategies and design decisions. In: Lüdeling, Anke/Kytö, Merja (Hrsg.): Corpus Linguistics. An International Handbook. Bd. 1. Berlin/New York: de Gruyter, 154–168. Institut für Deutsche Sprache (2017): Deutsches Referenzkorpus/Archiv der Korpora geschriebener Gegenwartssprache 2017-II (Release vom 01. 10.2017). Mannheim: Institut für Deutsche Sprache. [Unter: www.ids-mannheim.de/DeReKo; letzter Zugriff: 25.08.19]. Jones, Steven (2010): Using web data to explore lexico-semantic relations. In: Storjohann, Petra (Hrsg.): Lexical-Semantic Relations. Theoretical and practical perspectives. Amsterdam: Benjamins, 49–67. Kilgarriff, Adam, et al. (2004): The Sketch Engine. In: Williams, Geoffrey/Vessier, Sandra (Hrsg.): Proceedings of the 11th EURALEX International Congress, Lorient, France, July 6–10. Bd. 1. Lorient: Université de Bretagne Sud, 105–115. Kilgarriff, Adam, et al. (2008): GDEX: Automatically Finding Good Dictionary Examples in a Corpus. In: Proceedings of the XIII EURALEX International Congress. Barcelona: Universidad Pompeu Fabra, 425–433. Klosa, Annette (2007): Korpusgestützte Lexikographie: besser, schneller, umfangreicher? In: Kallmeyer, Werner/Zifonun, Gisela (Hrsg.): Sprachkorpora – Datenmengen und Erkenntnisfortschritt. Berlin/New York: de Gruyter, 105–122. Klosa, Annette (2010): On the combination of automated information and lexicographically interpreted information in two German online dictionaries. In: Granger, Sylviane/Paquot, Magali (Hrsg.): eLexicography in the 21st century. New challenges, new applications. Proceedings of eLex 2009. Louvain-la-Neuve, 22–24 October 2009. (Cahiers du Cental 7) Louvain: UCL Presses Universitaires, 157–163. Klosa, Annette (2020): The lexicography of German. In: Hanks, Patrick/de Schryver, Gilles-Maurice (Hrsg.): International handbook of modern lexis and lexicography. Berlin: Springer, 1–21. Kratochvilová, Iva (2009): Zwischen Potenzialität und Aktualität: Eine korpusbasierte Analyse der semantischen Prosodie von Mehrwortverbindungen aus diskursiver Sicht. In: Libuše Spáčilová/Lenka Vaňková (Hrsg.): Germanistische Linguistik und die neuen Herausforderungen in Forschung und Lehre in Tschechien. Brno: Brno Academicus. 283–291. Kupietz, Marc/Schmidt, Thomas (2015): Schriftliche und mündliche Korpora am IDS als Grundlage für die empirische Forschung. In: Eichinger, Ludwig M. (Hrsg.): Sprachwissenschaft im Fokus. Positionsbestimmungen und Perspektiven. Berlin/Boston: de Gruyter, 297–322.
82
Carolina Flinz
Kupietz, Marc, et al. (2018): The German Reference Corpus DeReKo: New Developments – New Opportunities. In: Calzolari, Nicoletta, et al. (Hrsg.): Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki: European Language Resources Association (ELRA), 4353–4360. Lemnitzer, Lothar/Kunze, Claudia (2007): Computerlexikographie. Tübingen: Narr. Lemnitzer, Lothar/Zinsmeister, Heike (2015): Korpuslinguistik. Eine Einführung. 3. Aufl. Tübingen: Narr. Müller-Spitzer, Carolin (2003): Ordnende Betrachtungen zu elektronischen Wörterbüchern und lexikographischen Prozessen. In: Lexicographica 19, 140–168. Perkuhn, Rainer/Belica, Cyril (2006): Korpuslinguistik – Das unbekannte Wesen oder Mythen über Korpora und Korpuslinguistik. In: Sprachreport: Informationen und Meinungen zur deutschen Sprache 22, 1. Mannheim: Institut für Deutsche Sprache, 1–8. Prinsloo, D. J. (2013): The utilization of bilingual corpora for the creation of bilingual dictionaries. In: Gouws, Rufus H., et al.: Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/Boston: de Gruyter Mouton, 1344–1356. Scherer, Carmen (2006): Korpuslinguistik. Heidelberg: Winter. Schröder, Martin (1997): Brauchen wir ein neues Wörterbuchkartell? Zu den Perspektiven einer computerunterstützten Dialektlexikographie und eines Projekts „Deutsches Dialektwörterbuch“. In: Zeitschrift für Dialektologie und Linguistik 64, 1, 57–66. Sierra, Gerardo, et al. (2008): Definitional verbal patterns for semantic relation extraction. In: Terminology 14/1, 74–98. Sinclair, John (1991): Corpus Concordance Collocation. Oxford. Sinclair, John/Payne, Jonathan/Pérez Hernández, Chantal (1996) (Hrsg.): Corpus to Corpus: a study of Translation Equivalence. In: International Journal of Lexicography 9 (3), 171–178. Steffens, Doris/al-Wadi, Doris (2013): Neuer Wortschatz. Neologismen im Deutschen 2001–2010. Mannheim: Institut für Deutsche Sprache. Steyer, Kathrin (2013): Usuelle Wortverbindungen. Zentrale Muster des Sprachgebrauchs aus korpusanalytischer Sicht. Tübingen: Narr. Storjohann, Petra (2005): Paradigmatische Relationen. In: Haß Ulrike (Hrsg.): Grundfragen der elektronischen Lexikographie. Elexiko – das Online-Informationssystem zum deutschen Wortschatz. Berlin/New York: de Gruyter. Storjohann, Petra (2010) (Hrsg.): Lexical-Semantic Relations. Theoretical and practical perspectives. Amsterdam: Benjamins. Taborek, Janusz (2011): Korpusbasierte Analyse der Phraseologismen. Dargestellt am Beispiel von ausgewählten verbalen Phraseologismen mit Komponenten aus dem Bereich Fußball. In: Lipczuk, Ryszard, et al. (Hrsg.): Phraseologismen in deutsch-polnischen und polnisch-deutschen Wörterbüchern. Theoretische und praktische Aspekte der Phraseologie und Lexikographie. Hamburg: Dr. Kovač, 73–82. Taborek, Janusz (2018): Korpusbasiertes kontrastives Beschreibungsmodell für Funktionsverbgefüge. In: Schmale, Günter (Hrsg.): Lexematische und polylexematische Einheiten des Deutschen. Tübingen: Stauffenburg, 135–154. Taborek (2018a): Funktionsverbgefüge in bilingualen deutsch-polnischen Wörterbüchern. Korpusbasierte Analyse – syntagmatische Muster – Äquivalenz. In: Jesenšek, Vida/Enčeva, Milka: Wörterbuchstrukturen zwischen Theorie und Praxis. Einführung. Berlin/Boston: de Gruyter, 197–214. Tognini-Bonelli, Elena (2001): Corpus Linguistics at Work. Amsterdam: Benjamins. Walter, Stephan (2011): Definitionsextraktion aus Urteilstexten. PhD Thesis. Universität des Saarlandes 2011. Online: [Unter: http://www.coli.uni-saarland.de/~stwa/publications/Disser tationStephanWalter.pdf; letzter Zugriff: 25.08.19].
Korpora als primäre Quellen von Tourlex
83
Wiegand, Herbert Ernst (1998): Wörterbuchforschung. Untersuchungen zur Wörterbuchbenutzung, zur Theorie, Geschichte, Kritik und Automatisierung der Lexikographie. 1. Teilband. Berlin/New York: de Gruyter. Wolf, Norbert Richard (2004): Plädoyer für eine Korpuslinguistik. In: Germanistik im Spiegel der Generationen, 132–140. Wolf, Norbert Richard (2010): Korpora in der Korpuslinguistik. In: Kratochvìlovà, Iva/Wolf, Norbert Richard (Hrsg.): Kompendium Korpuslinguistik. Eine Bestandsaufnahme aus der deutsch-tschechischer Perspektive. Heidelberg: Winter Verlag, 17–25.
Zitierte Wörterbücher Brockhaus = Wörterbücher Canoonet = Deutsche Wörterbücher und Grammatik ReversoContext = Dict.cc = Dizionario tedesco-italiano DUDEN = DWDS = Das Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart. https://www.dwds.de elexiko = Online-Wörterbuch zur deutschen Gegenwartssprache Gabler Wirtschaftslexikon = Zanichelli = Il nuovo dizionario di tedesco. Hrsg. v. Giacoma, Luisa/Kolb, Susanne Bologna: Zanichelli/Klett Pons, 3. Aufl. 2014. Langenscheidt = Deutsch-Italienisch Wörterbuch Langenscheidt Fachwörterbuch = Tourismus Leo = Wörterbücher Deutsch, Italienisch Linguee = Dizionario tedesco-italiano < https://www.linguee.it> PONS = Online-Wörterbuch https://de.pons.com TOURLEX = Zweisprachiges Internet-Fachwörterbuch zur Tourismussprache Wiktionary = https://www.wiktionary.org
Tamás Kispál
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern aus der Perspektive des Deutschen als Fremdsprache Abstract: Due to the requirement of didactics for the integration of corpora when learning and teaching German as a foreign language, access to corpus citation in two German online dictionaries, in DWDS and ELEXIKO, is examined as an example. The question of the positioning of the corpus data in the virtual macrostructure is followed by a look at the structure of this module in online dictionaries. The differentiated access structure of online dictionaries is particularly evident from the innovative, manipulable virtual structure. The added value of the corpus citation for users learning German as a foreign or second language is then dealt with. Keywords: online dictionaries, access structure, corpus citation, didactics of German as a foreign language Schlagwörter: Onlinewörterbücher, Zugriffsstruktur, Korpusbelege, DaF-Didaktik
1 Einführung Korpusbelege können das Sprachenlernen bekanntlich sinnvoll unterstützen. Ihr Einsatz beim Zweitspracherwerb und insbesondere im Unterricht Deutsch als Fremdsprache wird jedoch erst in der letzten Zeit, seit ca. zehn Jahren intensiver diskutiert (vgl. Fandrych/Tschirner 2007, Lüdeling/Walter 2009). Wörterbuchdidaktik ist Gegenstand von Untersuchungen sowohl in der Lexikografie als auch in der Fremdsprachendidaktik. Bei der letzteren besteht noch viel Entwicklungsbedarf, insbesondere bei den digitalen Wörterbüchern. In der Fremdsprachendidaktik werden Wörterbücher häufig allgemein als Lern- und Arbeitswerkzeuge (vgl. Roche 2016: 470) oder spezieller als mögliche Ressourcen zum Wortschatzlernen (vgl. Kurtz 2016: 446) unter anderem behandelt. Die Relevanz der Wörterbuchdidaktik wird jedoch im Unterricht des Deutschen als Fremdsprache seltener oder kaum thematisiert (vgl. Kühn 2010a: 307, Kühn 2010b: 1256). Huneke/Steinig (2013) enthält z. B. nur eine Liste von Wörterbüchern im Anhang als nützliche Arbeitsmittel für den Unterricht, behandelt die Wörterbuchdidaktik jedoch nicht. Falls dies in die Fremdsprachendidaktik doch integriert wird, wird die Rolle der digitalen Wörterbücher, meist in der Wortschatzarbeit, immer häufiger hervorgehoben (vgl. Rösler 2012: 176). Das kontextualisierte und strukturierte Wortschatzlernen wird bevorzugt (Brinitzer 2013: 60–71, Kühn 2010b: Tamás Kispál, Georg-August-Universität Göttingen, [email protected] https://doi.org/10.1515/9783110716955-005
86
Tamás Kispál
1254), und oft auch der Arbeit mit Wörterbüchern gegenübergestellt. Das Dilemma „Mit oder ohne Wörterbuch?“ wird bis heute thematisiert (vgl. Brinitzer 2013: 68). Barkowski (2014: 162–165) gibt in einer aktualisierten Reihe zur Lehrerfortbildung einen kurzen Einblick in die Arbeit mit Wörterbüchern, mit guten Beispielen, wobei sowohl gedruckte als auch digitale Wörterbücher aus der Perspektive des Deutschen als Fremdsprache behandelt werden. Vorliegender Beitrag diskutiert aus einer lernerlexikografischen Perspektive folgende Fragen: Welche deutschen Onlinewörterbücher bieten einen integrierten Zugriff auf Korpusbelege? Wie positionieren die Wörterbuchportale diese Belege in der virtuellen Mikrostruktur und wie ermöglichen sie das Auffinden des entsprechenden Moduls? Wie ist der Aufbau des Moduls der Korpusbelege in den Onlinewörterbüchern? Welchen Mehrwert haben diese Korpusbelege für die Benutzer, die Deutsch als Fremdsprache lernen? Diese Fragen werden in zwei einsprachigen deutschen Onlinewörterbüchern, in DWDS und ELEXIKO exemplarisch untersucht.
2 Korpusbelege beim Deutschlernen Der systematische Einsatz der Ergebnisse der Korpuslinguistik in der Fremdsprachenvermittlung hat mehr Tradition im Englischen als im Deutschen als Fremdsprache. Seit ca. zehn Jahren wird allerdings öfter auch die Relevanz der Korpuslinguistik für Deutsch als Fremdsprache betont. Fandrych/Tschirner (2007) plädieren für einen Perspektivenwechsel und untersuchen verschiedene Aspekte beim Zusammenhang dieser zwei großen Bereiche. Auf allen sprachlichen Ebenen, von der Phonetik über die Morphosyntax bis zu der Textebene können Erkenntnisse der Korpuslinguistik auf das Deutsche als Fremdsprache angewandt werden. Grammatikalitätsurteile oder verschiedene sprachliche Mittel können an repräsentativen Korpora überprüft werden, wobei „elektronische Korpora auch für die Erforschung und die Lehre des Deutschen im nichtdeutschsprachigen Raum bisher ungeahnte Möglichkeiten eröffnen“ (Fandrych/Tschirner 2007: 203). Lüdeling/Walter (2009) betrachten die Situation aus der Sicht von Lehrenden, Didaktikern und Lernenden. Die Ziele dieser drei Gruppen stehen in einer engen Verbindung zueinander. Im Folgenden soll jedoch die Lernerperspektive im Vordergrund stehen. Laut Lüdeling/Walter (2009: 8) können Lernende mit einer Datenbank gewinnbringend arbeiten. Die Lerner sollen bei der Suche nach Beispielen für die Verwendung von Korpora sensibilisiert werden. Sie sollen mit der Google-Suche kritisch umgehen und lernen, wie sie ihre produktiven Fertigkeiten und ihren Wortschatz mithilfe von Konkordanzen systematisch verbessern können. Sie plädieren für ein spezifisches Korpustraining für die Lernenden, das im DaF-Bereich ein Desiderat sei, aber auch heute, zehn Jahre später wohl immer noch ein Desiderat ist. Lüdeling/Walter (2009: 8) betonen auch die Relevanz von authentischen Beispielen
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern
87
in Wörterbüchern. Authentische Beispiele bzw. konstruierte Beispiele in Wörterbüchern haben bekanntlich jeweils ihre Stärken und Schwächen. Prinsloo (2013: 514) schlägt vor, einen Ansatz anzuwenden, der diese beiden Beispieltypen auf einem Kontinuum darstellt und die maximale Effizienz von illustrativen Beispielen für Textproduktions- und Textrezeptionszwecke anstrebt.
3 Zugriffsstruktur in Onlinewörterbüchern Die Erreichbarkeit der Daten in Wörterbüchern wird in der Printlexikographie über den Terminus Zugriffsstruktur beschrieben. Mit anderen Worten: Die Datenakzessivität wird durch Zugriffsstrukturen ermöglicht (Wiegand 2010: 302). Während sich die Zweiteilung der Zugriffsstrukturen in äußere und innere Zugriffsstruktur in Printwörterbüchern relativ gut begründen lässt, indem einerseits der Zugriff in einem Wörterverzeichnis auf einen Wörterbuchartikel, andererseits der Zugriff innerhalb des Wörterbuchartikels auf ein bestimmtes Datenelement untersucht wird, gestaltet sich die Situation bei elektronischen Wörterbüchern und Onlinewörterbüchern viel komplexer. Gerade in elektronischen Wörterbüchern hat sich die Zugriffsstruktur durch die zahlreichen Suchmöglichkeiten aufgewertet. Wenn Herbst/Klotz (2003: 256–258) in ihrer Lexikographie-Einführung über Zugriffsmöglichkeiten im elektronischen Wörterbuch schreiben, beschränken sie sich noch auf CD-Wörterbücher, die oft einfach digitalisierte Versionen von vorhandenen Wörterbüchern sind. Engelberg/Lemnitzer (2009: 73) wenden jedoch die Zugriffsstrukturen in der vierten Auflage ihrer Lexikographie-Einführung bereits auf Onlinewörterbücher bzw. Wörterbuchportale an. Bei Onlinewörterbüchern kann man zwar die Termini äußere und innere Zugriffsstruktur immer noch verwenden, aber aufgrund der Vernetzungen zeigt sich ein viel komplexeres Bild, insbesondere bei Wörterbuchportalen, bei denen mehrere Onlinewörterbücher miteinander verknüpft sind. Engelberg/Müller-Spitzer (2013: 1027) betrachten die Zugriffsstruktur als eines der Kriterien bei der Typologie von Wörterbuchportalen in ihrem englischsprachigen Aufsatz (vgl. Abb. 1 mit der deutschsprachigen Terminologie aus Engelberg/Lemnitzer 2009: 74). Demnach kann man die Wörterbuchnetze (z. B. OWID) u. a. mit externer, äußerer und innerer Zugriffsstruktur von anderen Wörterbuchportalen insoweit unterscheiden, als einerseits die Wörterbuchsuchmaschinen (z. B. WÖRTERBUCH-PORTAL) über eine äußere und externe Zugriffsstruktur, andererseits die Wörterbuchsammlungen (z. B. OW-OST) nur über eine externe Zugriffsstruktur verfügen. Bei diesen drei Typen verfügen die Wörterbücher über eine hohe oder sehr hohe Eigenständigkeit, während beim vierten Typ, dem virtuellen Wörterbuchportal (z. B. LEO) die Wörterbücher eine geringe Eigenständigkeit und eine hohe Vernetzung aufweisen (vgl. Engelberg/Storrer 2016: 53). Externe Zugriffsstruktur bedeutet den Zugriff auf andere Onlinewörterbücher in einem Wörterbuchportal. In diesem Sinne spielen
88
Tamás Kispál
Abb. 1: Typologie von Wörterbuchportalen in Engelberg/Lemnitzer (2009: 74).
bei Wörterbuchportalen, zu denen immer mehr deutsche Onlinewörterbücher gehören, auch Querverweise, Verlinkungen zwischen Wörterbüchern eine sehr wichtige Rolle. Die Datenakzessivität wird in Wörterbüchern auch insoweit erschwert, als man in der Metalexikographie häufig von einem Informationsüberfluss (information overload) gesprochen wird, wenn den Wörterbuchbenutzern in den Konsultationssituationen zu viele lexikographische Daten zur Verfügung stehen. Gouws/Tarp (2016) unterscheiden in ihrer Typologie zunächst zwischen dem Überfluss an lexikographischen und nichtlexikographischen Daten, meistens Werbungen. Der Überfluss an lexikographischen Daten lässt sich weiter in einen absoluten und einen relativen Datenüberfluss einordnen. Der relative Datenüberfluss liegt zum Beispiel bei technischen Daten auf dem Bildschirm eines Geräts vor. Beim absoluten Datenüberfluss handelt es sich um den Überfluss von konkreten Daten, die bei einer konkreten Konsultationssituation irrelevant sind. Hier stellt sich auch die Frage, inwieweit sich Korpusbelege als relevante oder irrelevante Daten bei der Wörterbuchbenutzung erweisen. Es hängt natürlich von der konkreten Wörterbuchbenutzungssituation ab. Eine Untersuchung zur Wörterbuchbenutzung von spanischen Deutschlernenden wies z. B. eine relativ hohe Nutzung in der Suche nach Korpusbelegen in Wörterbüchern nach, insbesondere bei Lernenden in Deutschland (vgl. Meliss 2015: 417–418). Durch die Möglichkeit der Einstellung von sichtbaren Informationen auf dem Bildschirm eines elektronischen Geräts kann der Benutzer den Datenüberfluss vermeiden. Diese benutzerdefinierte reale Mikrostruktur (alle Angaben) oder virtuelle Mikrostruktur (sichtbare Angaben) (Engelberg/Lemnitzer 2009: 171) ist ein Mehrwert von elektronischen Wörterbüchern im Vergleich zu Printwörterbüchern, was nicht nur eine wichtige Frage des Wörterbuchdesigns ist, sondern auch zu mehr Effektivität bei der Wörterbuchbenutzung beitragen kann (Debus-Gregor/Heid 2013: 1005). Ob die Benutzer das Wörterbuchdesign, innovative Merkmale sowie die erwähnte Mög-
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern
89
lichkeit der Einstellung der virtuellen Mikrostruktur auch wahrnehmen, wird jedoch von Forschern immer wieder in Frage gestellt (Debus-Gregor/Heid 2013: 1005, Klosa/Koplenig/Töpel 2014: 358, Müller-Spitzer/Koplenig 2014: 184). Obwohl die empirische Untersuchung von Koplenig/Müller-Spitzer (2014: 139) Anfang der 2010er Jahre noch eine Tendenz nachweist, laut der Onlinewörterbücher auf Geräten mit einem großen Bildschirm benutzt werden, also auf PCs und Laptops, ist heute wahrscheinlich eher von einer Tendenz in Richtung kleinere Geräte wie Tablets und Smartphones auszugehen. Das könnte die Relevanz des Wörterbuchdesigns, der innovativen Elemente und damit auch der Zugriffsstruktur erhöhen, u. a. bei einzelnen Informationstypen wie den Korpusbelegen.
4 Deutsche Onlinewörterbücher mit Zugriff auf Korpusbelege Im Folgenden werden einige ausgewählte deutsche Onlinewörterbücher daraufhin untersucht, ob sie einen Zugriff auf Korpusbelege anbieten und wenn ja, wie das erfolgt. Lernende des Deutschen als Fremdsprache bevorzugen zwar auch auf fortgeschrittenem Niveau oft zweisprachige Wörterbücher. Folgender Beitrag beschränkt sich aber auf einsprachige Wörterbücher aus folgenden Gründen: 1) Der Mangel an Zuverlässigkeit von zweisprachigen Wörterbüchern, wie bekannt bei Printwörterbüchern, bestätigt sich auch bei mehreren beliebten zweisprachigen Onlinewörterbüchern. Bei der Untersuchung von fünf deutsch-englischen Onlinewörterbüchern haben Dyka/Scharf (2014: 275–277) Mangel an Systematik nicht nur in der Äquivalentdifferenzierung, der Markierungspraxis und der Präsentation der Trefferlisten, sondern auch in der Integration von Korpora und der Auswahl der Beispiele nachgewiesen. Bei den untersuchten Wörterbüchern hat nur Linguee ein integriertes Korpus. Leo, dict.cc, Beolingus und Pons enthalten keine Korpusbelege. Viele Beispielsätze seien in allen fünf deutsch-englischen Onlinewörterbüchern unbrauchbar bzw. unzutreffend. 2) Korpusbelege sind eher in einsprachigen als in zweisprachigen Onlinewörterbüchern vorhanden. Nach Dyka/Scharf (2014: 278) sollten die Nutzer die in zweisprachigen Wörterbüchern aufgefundenen Vorschläge selbst in Verlagswörterbüchern, einsprachigen Wörterbüchern oder Parallelkorpora verifizieren. 3) Das Nachschlagen von Informationen in Korpora ist wegen ihres höheren Sprachniveaus mit größerer Wahrscheinlichkeit bei Lernenden auf einer höheren Niveaustufe zu erwarten, die auch viel häufiger einsprachige Wörterbücher benutzen. Für die Auswahl der hier zu untersuchenden allgemeinen einsprachigen Onlinewörterbücher sind folgende zwei Kriterien relevant: hoher Bekanntheitsgrad und wissenschaftlicher Hintergrund. Dementsprechend könnten m. E. vier Wörterbücher in Frage kommen: ONLINE-DUDEN, DWDS, ELEXIKO und WORTSCHATZ-PORTAL. Von diesen vier Wörterbüchern werden hier zwei Wörterbücher, DWDS (vgl. 4.2) und
90
Tamás Kispál
(vgl. 4.3) einer ausführlichen Analyse unterzogen. Bei ONLINE-DUDEN sind mögliche Belegangaben nicht identifizierbar. Deshalb ist es für die vorliegende Untersuchung kaum relevant. Wegen des hohen Bekanntheitsgrades und der häufigen Verwendung dieses Onlinewörterbuchs wird allerdings darauf kurz eingegangen (vgl. 4.1). WORTSCHATZ-PORTAL soll späteren Untersuchungen vorbehalten bleiben. Bei der Behandlung des Zugriffs auf Korpusbelege stellen sich folgende Fragen: 1) Welche deutschen Onlinewörterbücher bieten einen integrierten Zugriff auf Korpusbelege? 2) Wie positionieren die Wörterbuchportale diese Belege in der virtuellen Mikrostruktur und wie ermöglichen sie das Auffinden des entsprechenden Moduls? 3) Wie ist der Aufbau des Moduls der Korpusbelege in den Onlinewörterbüchern? 4) Welchen Mehrwert haben diese Korpusbelege für die Benutzer, die Deutsch als Fremd- oder Zweitsprache lernen? ELEXIKO
4.1 ONLINE-DUDEN ONLINE-DUDEN benutzt „in erster Linie das Dudenkorpus – eine digitale Volltextsammlung, die bereits mehr als drei Milliarden Wortformen aus unterschiedlichen Textsorten (wie Romanen, Sachbüchern, Zeitungen, Zeitschriften u. a.) enthält und ständig erweitert wird“ (www.duden.de/hilfe, letzter Zugriff: 02.09.2019). Welche Angaben Beispielangaben, d. h. konstruierte Beispiele, und welche Belegangaben sind, ist allerdings durch die fehlenden Belegstellenangaben nicht ersichtlich. Beim Lemma Frage sind alle Beispielangaben anscheinend konstruierte Beispiele (z. B. es stellt sich die Frage, ob das reichen wird; über wissenschaftliche, politische Fragen sprechen) (vgl. Abb. 2). ONLINE-DUDEN macht den direkten Zugriff auf Korpusbelege auf der Website nicht möglich. In diesem Wörterbuch ist allerdings die Möglichkeit der benutzerdefinierten Änderung der Mikrostruktur bei der computergenerierten Angabeklasse „Typische Verbindungen“ vorhanden, indem man zu dem Stichwort die dazugehörigen Adjektive, Verben und Substantive findet (z. B. Kollokationen mit Verben zu Frage: Frage stellen, aufwerfen, klären) (vgl. Abb. 3). Das kann sich einerseits aus der Perspektive der Deutschlernenden besonders bei der Verwendung von Kollokationen sehr hilfreich erweisen. Andererseits sollten Lernende diese Verbindungen, die aus dem Dudenkorpus korpusbasiert erstellt wurden, aufgrund der fehlenden redaktionellen Bearbeitung mit Vorsicht verwenden (Kispál 2018: 189–190).
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern
91
Abb. 2: Wörterbuchartikel zum Lemma Frage in ONLINE-DUDEN (Beispiele, letzter Zugriff: 02.09.2019).
4.2 DWDS Das Digitale Wörterbuch der deutschen Sprache (DWDS), das auch „Das Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart“ genannt wird, hat drei Ressourcen: „Wörterbücher“, „Textkorpora“ sowie „Statistische Auswertungen“. Die Wörterbuch-Komponente von DWDS basiert auf der digitalisierten und
92
Tamás Kispál
Abb. 3: Wörterbuchartikel zum Lemma Frage in ONLINE-DUDEN (Typische Verbindungen, letzter Zugriff: 02.09.2019).
aktualisierten Version von WDG und auf Teilen von GWDS. DWDS ist ein Wortschatzportal, d. h. ein hybrides Portal, bei dem ein Wörterbuchnetz mit einem lexikologischen Portal verknüpft wurde (vgl. Engelberg/Storrer 2016: 56). Die lexikologischen Informationen sind hier die Korpusbelege, die Wortprofile oder die Zeitverlaufsgrafiken, von denen nun die Korpusbelege relevant sind. Nach dem Eintippen eines Wortes auf der Startseite des Portals im Suchfeld („Suche im Wortauskunftssystem“) erscheint der Treffer aus dem Wörterbuch. Außerdem besteht die Möglichkeit direkt in Textkorpora zu suchen. In diesem Fall soll der Benutzer auf der Startseite zunächst das Modul „Textkorpora“ aufrufen und dort das gesuchte Wort im Suchfeld („Suche in Korpora“) eintippen. Es gibt folglich diese zwei Zugriffsmöglichkeiten, um den Zugang zu Korpusbelegen zu erhalten. Bei der Suche im Wörterbuch findet der Benutzer eine vertikale Mikrostruktur, die der Mikrostruktur in einem Printwörterbuch ähnelt, mit der Möglichkeit einer teilweise benutzerdefinierten Änderung der virtuellen Mikrostruktur. Die einzige benutzerdefinierte Änderung der Mikrostruktur ist die Möglichkeit vom Ein- und Ausblenden einiger Beispielangaben, bei konstruierten Beispielen. Im Gegensatz zu Printwörterbüchern folgt jede neue Angabeklasse in einer neuen Zeile, was die Struktur ebenfalls relativ benutzerfreundlich macht. Dem Lemma folgen, wie in Printwörterbüchern üblich, zunächst orthographische, grammatische und phonetische Angaben, anschließend Bedeutungen, wobei den einzelnen Bedeutungen sowohl konstruierte Beispiele (z. B. das ist eine Frage der Begabung) als auch Belegbeispiele (z. B. „Sein oder Nichtsein, das ist hier die Frage“ – Shakespeare, Hamlet, III 1) zugeordnet werden (vgl. Abb. 4). Die Belegbeispiele sind durch die Belegstellenangaben relativ einfach erkennbar und im Wörterbuchartikel auffindbar. Außer den Bedeutungsangaben werden noch drei weitere Angabeklassen hervorgehoben: Thesaurus, Typische Verbindungen sowie Verwendungsbeispiele. Letzteres enthält weitere Korpusbelege (z. B. „Die Frage kommt so sicher wie das Amen in der Kirche.“ – Die Zeit, 27.04.2000, Nr. 18), was auch hier durch die Belegstellenangaben ersichtlich ist (vgl. Abb. 5).
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern
93
Abb. 4: Wörterbuchartikel zum Lemma Frage in DWDS (Bedeutungen, Ausschnitt, letzter Zugriff: 02.09.2019).
Die kurze Bemerkung „maschinell ausgesucht aus den DWDS-Korpora“ weist darauf hin, dass die Belegauswahl nicht redaktionell betreut wird und dementsprechend eher eine zufällige Auswahl anzeigt. Ihre fehlende Zuordnung zu den Bedeutungsangaben ist dadurch aus metalexikographischer Sicht auch nachvollziehbar. Die Abgrenzung dieser Belegbeispiele von den konstruierten Beispielen und das teilweise Einordnen dieser zwei Beispielangaben in verschiedenen Wörterbuchartikelpositionen sind allerdings ziemlich verwirrend und dadurch weniger benutzerfreundlich. Dem nicht kundigen Wörterbuchbenutzer kann das Auffinden der weiteren Belegangaben am Ende des Wörterbuchartikels Schwierigkeiten bereiten. Da die Repräsentativität der Korpusbelege durch die maschinelle Suche fraglich ist, ist auch ihre Relevanz bzw. Effektivität für Deutschlernende gering. Statt die strukturelle, grammatische, semantische, textuelle Varianz des Stichwortes zu zeigen, sind wieder-
94
Tamás Kispál
Abb. 5: Wörterbuchartikel zum Lemma Frage in DWDS (Verwendungsbeispiele, letzter Zugriff: 02.09.2019).
holte Strukturen bei den maschinell ausgesuchten Korpusbelegen nicht selten. Die Belegangaben, die jedoch den einzelnen Bedeutungen zugeordnet werden, sind aus sprachlicher Sicht eher repräsentativ. Allerdings sind sie, wie auch allgemein in WDG, oft Belege aus der Literatur, die sich aus der Sicht der Deutsch lernenden Benutzer als weniger hilfreich erweisen können. Der Vorteil der maschinell ausgewählten Korpusbelege (unter den „Verwendungsbeispielen“) ist demgegenüber, dass sie häufig auch Belege aus neueren Quellen enthalten (vgl. Abb. 5). Das relativiert die vorher erwähnte fehlende Relevanz dieser Korpusbelege für die Benutzer mit Deutsch als Fremdsprache. Im Modul „Textkorpora“ kann man zurzeit in zwölf verschiedenen Korpora frei recherchieren und in weiteren sechs nach Anmeldung. Dieses Modul des Systems gehört nicht zum Wörterbuch und deshalb ist es weniger eine lernerlexikographische Frage, sondern vielmehr eine korpuslinguistische, was über das Ziel dieses Beitrags hinausgeht. Die Recherche in dieser Korpusdatenbank gibt allerdings den Deutschlernenden eine Möglichkeit, grammatische Regeln, Konstruktionen, Wortverbindungen effektiv zu überprüfen. Man kann getrennt in vier verschiedenen Textklassen recherchieren: Belletristik, Wissenschaft, Gebrauchsliteratur und Zeitung (vgl. Abb. 6). Meliss (2013: 187) ist jedoch zuzustimmen, dass sich die Komplexität der Informationen in DWDS „nur für einen lexikographisch geschulten Benutzer mit hohen bis sehr hohen Kenntnissen der deutschen Sprache als angebracht“ erweist.
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern
95
Abb. 6: Korpusabfrage zum Lemma Frage in DWDS (Ausschnitt, letzter Zugriff: 02.09.2019).
Der Zugriff auf Korpusbelege in DWDS lässt sich folgendermaßen zusammenfassen (Tab. 1): Tab. 1: Zugriff auf Korpusbelege in DWDS. Zugriff auf Korpusbelege
Positionierung der Korpusbelege
Aufbau des Moduls für Korpusbelege
Mehrwert für DaFLernende
Wörterbuch Textkorpora
Wörterbuch Vertikale Mikrostruktur . Bedeutungen . Verwendungsbeispiele Textkorpora
– Vertikale Mikrostruktur – Keine benutzerdefinierte Mikrostruktur
Korpusbelege bei den Bedeutungsangaben: ggf. typisch für sprachliche Strukturen
4.3
ELEXIKO
Das unter owid.de erfasste Online-Wortschatz-Informationssystem Deutsch ist „das Portal für wissenschaftliche, korpusbasierte Lexikografie des Instituts für Deutsche Sprache“, wie der Benutzer auf der Startseite lesen kann. OWID ist ein Wörterbuchnetz mit mehreren integrierten Wörterbüchern und einer elaborierten Zugriffsstruktur (vgl. Kap. 3), von denen hier das Onlinewörterbuch ELEXIKO untersucht wird. Das Prinzip der Korpusbasiertheit war für die Erarbeitung der Wörterbuchartikel in diesem Wörterbuch entscheidend (Klosa/Koplenig/Töpel 2014: 282). Die Relevanz
96
Tamás Kispál
der Korpusbasiertheit zeigt sich auch durch den Zugriff auf Belegangaben auf zwei verschiedenen Wegen. Einige Wörter enthalten keine Bedeutungsangaben in OWID, sondern nur „Lesartenübergreifende Angaben“. Sie wurden nicht weiter redaktionell bearbeitet. Bei diesen Wörtern ist der Zugriff auf Belege direkt auf der ersten Seite sichtbar (z. B. Bildungsträger) (vgl. Abb. 7).
Abb. 7: Wörterbuchartikel zum Lemma Bildungsträger in ELEXIKO (Ausschnitt, letzter Zugriff: 02.09.2019).
In der vertikal laufenden Mikrostruktur sind in diesem Fall vier verschiedene Angabeklassen zu finden: Orthografie, Grammatik- und Kookkurrenzprofil, Verteilung im ELEXIKO-Korpus und Belege. Um direkt auf die Belege zuzugreifen, muss der Benutzer auch nicht weiterklicken, weil die automatisch ausgewählten Belege auf der Seite der Lesartenübergreifenden Angaben aufgeführt werden. Eine benutzerdefinierte Mikrostruktur ist hier bei den Belegen nicht gegeben. Alle ausgewählten Belege sind sichtbar. Teil der virtuellen Mikrostruktur ist jedoch die Möglichkeit, die grammatischen Angaben und das Kookkurrenzprofil des Stichwortes vom Benutzer selbst auszuwählen. Um zu weiteren Korpusdaten zu kommen, kann man beim Modul Kookkurrenzprofil in die Kookkurrenzdatenbank gehen, in der der Benutzer das Kookkurrenzprofil des Stichwortes selber erkunden kann, z. B. unter Bildungsträger: u. a. Adjektive vor dem Stichwort (privat, extern) sowie Verben nach dem Stichwort (bieten, veranstalten). Das kann den Deutschlernenden wertvolle Hinweise auf die Verwendung des Stich-
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern
97
wortes geben, auch wenn das eher eine korpuslinguistische Fragestellung ist, wie oben bei DWDS erwähnt. Die redaktionell bearbeiteten Wörterbuchartikel haben eine differenziertere Mikrostruktur, bei der den lesartenübergreifenden Angaben „Lesartenbezogene Angaben“ folgen (vgl. Abb. 8).
Abb. 8: Wörterbuchartikel zum Lemma Frage in ELEXIKO (letzter Zugriff: 02.09.2019).
Nach einem Klick auf die einzelnen Lesarten kann man unter der „Bedeutungserläuterung“ „Belege anzeigen“ (z. B. „Wahrscheinlich schützt Östrogen vor der Arthrose, und Diabetiker leiden öfter unter der Degeneration. Immer noch gibt es viele
98
Tamás Kispál
ungeklärte Fragen zu diesem Krankheitsbild“ – Mannheimer Morgen, 28.02.2011) oder diese „Belege verbergen“ (vgl. Abb. 9).
Abb. 9: Wörterbuchartikel zum Lemma Frage in ELEXIKO (Bedeutungserläuterung mit Belegen, Ausschnitt, letzter Zugriff: 02.09.2019).
Die Strukturierung durch diese sogenannten Registerkarten, die die Onlinepräsentation der lexikographischen Angaben auf verschiedene Bildschirmseiten verteilen und nicht die traditionelle vertikale Anordnung verfolgen, ist eine innovative Entwicklung der Wörterbuchredaktion (Klosa/Koplenig/Töpel 2014: 316–318). Die Daten auf den einzelnen Registerkarten stellen im Sinne von Gouws (2018: 52–53) eigene Wörterbuchartikel dar, die als restringierte Wörterbuchartikel zusammen den vollständigen Wörterbuchartikel ergeben. Auf Korpusbelege kann man auch auf der Registerkarte „Sinnverwandte Wörter“ zugreifen (vgl. Abb. 10).
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern
99
Abb. 10: Wörterbuchartikel zum Lemma Frage in ELEXIKO (Sinnverwandte Wörter, Ausschnitt, letzter Zugriff: 02.09.2019).
Bei den Synonymen steht je ein aufklappbarer Beleg aus dem Korpus. Als Synonym des Wortes Frage erscheint z. B. das Wort Nachfrage, mit folgender Bemerkung: „Zwischen Frage und Nachfrage liegt eine Folgerelation der Art ‚Stimulus-Respons‘ (also Aktion – Reaktion) vor“ sowie mit einem passenden Beleg, bei dem beide Wörter im Kontext im gleichen Satz erscheinen.
100
Tamás Kispál
Gelegentlich kann man auch in der Liste der Kollokationen auf Korpusbelege zugreifen. Unter dem Lemma Meinung findet man beispielsweise beim Reiter „Kollokationen“ u. a. die Frage „Was macht man mit einer Meinung?“. Zur Basis Meinung stehen hier viele mögliche Verben als Kollokatoren. Beim Kollokator austauschen steht ein Beleg nach diesem aufklappbarem Verwendungshinweis: „In gemeinsamen Kontexten des ELEXIKO-Korpus werden austauschen und Meinung pluralisch verwendet (vgl. den Beleg)“ (vgl. Abb. 11).
Abb. 11: Wörterbuchartikel zum Lemma Meinung in ELEXIKO (Kollokationen, Ausschnitt, letzter Zugriff: 02.09.2019).
Auch diese Beispiele zeigen, dass ELEXIKO von der Möglichkeit der benutzerdefinierten virtuellen Mikrostruktur bei den Belegen in vielen Positionen Gebrauch macht. Bei der Überprüfung des Wörterbuchdesigns durch Nutzerbefragungen stellte sich einerseits heraus, dass die Befragten die Belege in ELEXIKO als besonders wichtig erachten. Ob sie aber andererseits die Belege auch lesen, kann aus den Studienergebnissen nicht abgeleitet werden (Klosa/Koplenig/Töpel 2014: 365). Die Interpretation der oben dargestellten Beispiele setzt bei DaF-Lernern ein fortgeschrittenes Niveau voraus. Auf der Niveaustufe C1 könnten allerdings solche Belegbeispiele den Lernenden helfen, Synonyme in einer Produktionssituation oder auch in einer Rezeptionssituation voneinander abzugrenzen.
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern
101
Zusammenfassend enthält die folgende Tabelle die untersuchten Aspekte beim Zugriff auf Korpusbelege in ELEXIKO (vgl. Tab. 2): Tab. 2: Zugriff auf Korpusbelege in ELEXIKO. Zugriff auf Korpusbelege
Positionierung der Korpusbelege
Aufbau des Moduls für Korpusbelege
Mehrwert für DaFLernende
. Lesartenübergr. Angaben . Lesartenbez. Angaben
. Lesartenübergr. Angaben: Vertikale Mikrostruktur
– Benutzerdef. Mikrostruktur – Belege auf verschiedenen Registerkarten
– Korpusbelege bei den Lesartenbez. Angaben: typisch für sprachl. Strukturen – Anwendbar in Rez.und Prod.situationen
. Orthografie . Gr. - u. Kookkurrenzprofil . Verteilung im Korpus . Belege . Lesartenbez. Angaben . Lesart: Bed.erläuterg: Belege
5 Fazit Onlinewörterbücher mit Korpusbelegen könnten einen wesentlichen Beitrag dazu leisten, die aktuelle Forderung der DaF-Didaktik nach der Integration von Korpora beim Lernen und Lehren des Deutschen als Fremdsprache zu erfüllen. Es gibt heute relativ wenige deutsche einsprachige Onlinewörterbücher, die einen Zugriff auf Korpusbelege ermöglichen. DWDS und ELEXIKO gehören zu den auf wissenschaftlicher Grundlage erstellten und zuverlässigen Onlineressourcen, deren Verwendung nicht nur deutschen MuttersprachlerInnen, sondern auch Lernenden des Deutschen als Fremdsprache empfohlen werden kann. Die Datenakzessivität ist in Onlinewörterbüchern komplexer als in Printwörterbüchern. Durch die dynamische Struktur, die virtuelle Mikrostruktur ist auch der Zugriff auf Korpusbelege in Onlinewörterbüchern differenzierter. Während DWDS auch einen direkten äußeren Zugriff auf Textkorpora anbietet, sind die Korpusbelege in ELEXIKO nur über dieses Wörterbuch erreichbar. DWDS enthält sowohl konstruierte Beispiele als auch Belegbeispiele. Durch die strenge Korpusbasiertheit von ELEXIKO findet der Benutzer dort ausschließlich Belegbeispiele. Dies hilft auch den Deutschlernenden die Stichwörter in authentischen Kontextsituationen zu überprüfen. Die gewöhnlich einfachere sprachliche Struktur von konstruierten Beispielen in DWDS kann jedoch auch weniger fortgeschrittenen Deutschlernenden passende Hilfe bieten. Benutzer von DWDS haben einen relativ einfachen Zugriff auf Korpusbelege in der vertikalen Mikrostruktur: 1) unter Bedeutungsangaben Zugriff auf die dem Akademiewörterbuch entnommenen Belege, die jedoch wegen ihrer
102
Tamás Kispál
häufigen literarischen Quelle für DaF-Lernende weniger geeignet sein könnten, 2) unter den Verwendungsbeispielen Zugriff auf Belege, die zwar aktueller sind, aber durch die maschinelle Auswahl wohl weniger repräsentativ und daher für Lernende auch nicht immer ideal sind. Die Zugriffsstruktur von ELEXIKO kann durch die von den Benutzern manipulierbaren virtuellen Registerkarten einzelnen Benutzerwünschen in Wörterbuchbenutzungssituationen vielmehr entsprechen als die Zugriffsstruktur von DWDS. 1) Bei den Korpusbelegen, die bei den Lesartenübergreifenden Angaben direkt sichtbar sind, ist ein besserer Zugriffserfolg zu erwarten. 2) Bei den Lesartenbezogenen Angaben ist wegen der differenzierteren Struktur durch weitere Klicks mit mehr Aufwand zu rechnen. Die elaborierte Zugriffsstruktur der Online-Wörterbücher macht auch den Zugriff auf andere Angaben möglich wie die typischen Verbindungen in ONLINE-DUDEN (vgl. Kispál 2018: 189), die Kollokationen und Konstruktionen in ELEXIKO (vgl. Kispál 2018: 191–192) oder die Wortwolken (Engelberg/Müller-Spitzer/Schmidt 2016: 184), die in DWDS Wortprofile genannt werden. Da diese Zugriffsstrukturen, wie auch die graphenbasierte Suche (vgl. Engelberg/Müller-Spitzer/Schmidt 2016: 182–190), ein großes Potenzial für die Deutschlernenden bieten, könnte ihre Untersuchung einen wertvollen Beitrag zur Fremdsprachendidaktik und Wörterbuchbenutzungsforschung leisten. Inwieweit die Deutschlernenden von den differenzierten Zugriffsstrukturen in den Onlinewörterbüchern im Allgemeinen und dem Zugriff auf Korpora im Speziellen Gebrauch machen, könnten Untersuchungen zur Wörterbuchbenutzung herausstellen. Um den Informationsüberfluss und die Orientierungslosigkeit zu vermeiden, plädieren logischerweise viele Forscher für den weiteren Einsatz der innovativen einstellbaren sichtbaren Bildschirmoberflächen in Onlinewörterbüchern, aber auch für die Relevanz der Vermittlung der dazu nötigen Wörterbuchbenutzungskompetenz (Müller-Spitzer/Koplenig 2014: 184, Schmitz 2013: 1020). Diese Kompetenz brauchen auch Lernende des Deutschen als Fremdsprache, wenn sie die Vorteile der von den Benutzern manipulierbaren virtuellen Mikrostruktur beim Fremdsprachenerwerb nutzen möchten. Die Fremdsprachendidaktik soll dementsprechend auch die Vermittlung dieser Wörterbuchbenutzungskompetenz in ihren Aufgabenbereich aufnehmen.
Literatur Monografien und Aufsätze Barkowski, Hans, et al. (2014): Deutsch als fremde Sprache. München: Klett-Langenscheidt. Brinitzer, Michaela, et al. (2013): DaF unterrichten. Basiswissen Didaktik Deutsch als Fremd- und Zweitsprache. Stuttgart: Klett.
Zugriff auf Korpusbelege in deutschen einsprachigen Onlinewörterbüchern
103
Debus-Gregor, Esther/Heid, Ulrich (2013): Design criteria and ‚added value‘ of electronic dictionaries for human users. In: Gouws, Rufus H., et al. (Hrsg.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume. Berlin/Boston: de Gruyter, 1001–1013. Dyka, Susanne/Scharf, Eva (2014): Vergleichende Analyse von Artikelstrukturen deutschenglischer Onlinewörterbücher. In: Mann, Michael (Hrsg.): Digitale Lexikographie. Ein- und mehrsprachige elektronische Wörterbücher mit Deutsch: aktuelle Entwicklungen und Analysen. Hildesheim: Olms, 251–280. Engelberg, Stefan/Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4. Aufl. Tübingen: Stauffenburg. Engelberg, Stefan/Müller-Spitzer, Carolin (2013): Dictionary portals. In: Gouws, Rufus H., et al. (Hrsg.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume. Berlin/Boston: de Gruyter, 1023–1035. Engelberg, Stefan/Müller-Spitzer, Carolin/Schmidt, Thomas (2016): Vernetzungs- und Zugriffsstrukturen. In: Klosa, Annette/Müller-Spitzer, Carolin (Hrsg.): Internetlexikografie. Ein Kompendium. Berlin/Boston: de Gruyter, 153–195. Engelberg, Stefan/Storrer, Angelika (2016): Typologie von Internetwörterbüchern und -portalen. In: Klosa, Annette/Müller-Spitzer, Carolin (Hrsg.): Internetlexikografie. Ein Kompendium. Berlin/ Boston: de Gruyter, 31–63. Fandrych, Christian/Tschirner, Erwin (2007): Korpuslinguistik und Deutsch als Fremdsprache. Ein Perspektivenwechsel. In: Deutsch als Fremdsprache 44, 195–204. Gouws, Rufus H. (2018): Accessibility, access structures and access procedures. In: Jesensek, Vida/Enceva, Milka (Hrsg.): Wörterbuchstrukturen zwischen Theorie und Praxis. Berlin/Boston: de Gruyter, 35–56. Gouws, Rufus H./Tarp, Sven (2016): Information overload and data overload in lexicography. In: International Journal of Lexicography 30, 389–415. Herbst, Thomas/Klotz, Michael (2003): Lexikografie. Eine Einführung. Paderborn: Schöningh. Huneke, Hans-Werner/Steinig, Wolfgang (2013): Deutsch als Fremdsprache. Eine Einführung. 6. Aufl. Berlin: Erich Schmidt. Kispál, Tamás (2018): Print- und Onlinewörterbuchmikrostrukturen und Kollokationen aus der DaFLerner-Perspektive. In: Jesensek, Vida/Enceva, Milka (Hrsg.): Wörterbuchstrukturen zwischen Theorie und Praxis. Berlin/Boston: de Gruyter, 173–196. Klosa, Annette/Koplenig, Alexander/Töpel, Antje (2014): Benutzerwünsche und -meinungen zu dem monolingualen deutschen Onlinewörterbuch Elexiko. In: Müller-Spitzer, Carolin (Hrsg.): Using Online Dictionaries. Berlin/Boston: de Gruyter, 281–384. Koplenig, Alexander/Müller-Spitzer, Carolin (2014): General issues of online dictionary use. In: Müller-Spitzer, Carolin (Hrsg.): Using Online Dictionaries. Berlin/Boston: de Gruyter, 127–141. Kurtz, Jürgen (2016): Lehr-/Lernmaterialien und Medien zum Wortschatzlernen. In: Burwitz-Melzer, Eva, et al. (Hrsg.): Handbuch Fremdsprachenunterricht. 6. Aufl. Tübingen: Francke, 445–448. Kühn, Peter (2010a): Wörterbücher/Lernerwörterbücher. In: Krumm, Hans-Jürgen, et al. (Hrsg.): Deutsch als Fremd- und Zweitsprache. Ein internationales Handbuch. 1. Halbband. Berlin/ New York: de Gruyter, 304–315. Kühn, Peter (2010b): Materialien für das Wortschatzlehren und -lernen. In: Krumm, Hans-Jürgen, et al. (Hrsg.): Deutsch als Fremd- und Zweitsprache. Ein internationales Handbuch. 2. Halbband. Berlin/New York: de Gruyter, 1252–1258. Lüdeling, Anke/Walter, Maik (2009): Korpuslinguistik für Deutsch als Fremdsprache. Sprachvermittlung und Spracherwerbsforschung. Stark erweiterte Fassung von Lüdeling/ Walter (2010). [Unter: https://www.linguistik.hu-berlin.de/de/institut/professuren/ korpuslinguistik/mitarbeiter-innen/anke/pdf/LuedelingWalterDaF.pdf; letzter Zugriff: 02.09.2019]
104
Tamás Kispál
Lüdeling, Anke/Walter, Maik (2010): Korpuslinguistik. In: Krumm, Hans-Jürgen, et al. (Hrsg.): Deutsch als Fremd- und Zweitsprache. Ein internationales Handbuch. 1. Halbband. Berlin/ New York: de Gruyter, 315–322. Meliss, Meike (2013): Online-Lexikographie im DaF-Bereich: Eine erste kritische Annäherung: Bestandsaufnahme – Nutzen – Perspektiven. In: Revista de Estudos Alemaes 4, 176–199. Meliss, Meike (2015): Was suchen und finden Lerner des Deutschen als Fremdsprache in aktuellen Wörterbüchern? Auswertung einer Umfrage und Anforderungen an eine aktuelle DaFLernerlexikographie. In: Informationen Deutsch als Fremdsprache 42, 401–432. Müller-Spitzer, Carolin/Koplenig, Alexander (2014): Online dictionaries: expectations and demands. In: Müller-Spitzer, Carolin (Hrsg.): Using Online Dictionaries. Berlin/Boston: de Gruyter, 143–188. Prinsloo, Daniel J. (2013): New developments in the selection of examples. In: Gouws, Rufus H., et al. (Hrsg.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume. Berlin/Boston: de Gruyter, 509–516. Roche, Jörg (2016): Kriterien für die Auswahl von Lernmaterialien und Medien. In: Burwitz-Melzer, Eva, et al. (Hrsg.): Handbuch Fremdsprachenunterricht. 6. Aufl. Tübingen: Francke, 466–471. Rösler, Dietmar (2012): Deutsch als Fremdsprache. Eine Einführung. Stuttgart: Metzler. Schmitz, Ulrich (2013): Monolingual and bilingual electronic dictionaries on the Internet. In: Gouws, Rufus H., et al. (Hrsg.): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume. Berlin/Boston: de Gruyter, 1013–1023. Wiegand, Herbert Ernst (2010): Wörterbuch zur Lexikographie und Wörterbuchforschung. Band 1. Berlin/New York: de Gruyter.
Wörterbücher ONLINE-DUDEN = Duden-online-Wörterbuch. [Unter http://www.duden.de; letzter Zugriff: 02.09.2019] DWDS = Digitales Wörterbuch der deutschen Sprache. [Unter http://www.dwds.de; letzter Zugriff: 02.09.2019] ELEXIKO = Online-Wörterbuch zur deutschen Gegenwartssprache. In: OWID [Unter http://www.owid. de/elexiko_/index.html; letzter Zugriff: 02.09.2019] GWDS = Duden – Das große Wörterbuch der deutschen Sprache. 10 Bde. 3. Aufl. Hrsg. v. ScholzeStubenrecht, Werner. Mannheim: Bibliographisches Institut, 1999. LEO = LEO [Unter http://www.leo.org; letzter Zugriff: 02.09.2019] OWID = Online-Wortschatz-Informationssystem Deutsch. [Unter http://www.owid.de; letzter Zugriff: 02.09.2019] OW-OST = Online-Wörterbücher zu Osteuropäischen Sprachen. [Unter http://www.hist.uzh.ch/ fachbereiche/oeg/links/woerterbuch.html; letzter Zugriff: 02.09.2019] WDG = Wörterbuch der deutschen Gegenwartssprache. 6 Bde. Hrsg. v. Klappenbach, Ruth/ Steinitz,Wolfgang. Berlin: Akademie-Verlag, 1964–1977. WÖRTERBUCH-PORTAL = Wörterbuch-Portal [Unter http://www.woerterbuch-portal.de; letzter Zugriff: 02.09.2019] WORTSCHATZ-PORTAL = Wortschatz-Portal an der Universität Leipzig [Unter http://www.wortschatz. uni-leipzig.de; letzter Zugriff: 02.09.2019]
Barbara Komenda-Earle
Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen bis zum „Deutschen Wörterbuch“ von Jacob und Wilhelm Grimm. Digitalisierte historische Wörterbücher als Textkorpora Abstract: The article investigates lexicographical entries on the oldest phraseologisms of German using the example of somatisms. The forms of the somatisms are followed on the basis of dictionaries of Middle High German, the Early Modern High German Dictionary and the German Dictionary by Jacob and Wilhelm Grimm (1854–1961). The aim of the article is to determine how phraseologisms in the dictionaries are taken into account and to what extent older German historical dictionaries can provide information during the investigation of somatisms, in particular kinegrams and pseudokinegrams. Keywords: somatic phraseologisms, kinegrams, dictionaries of Middle High German, The Dictionary of Early New High German, The German Dictionary by Jacob and Wilhelm Grimm, language change Schlagwörter: Somatismen, Kinegramme, Wörterbücher des Mittelhochdeutschen, Frühneuhochdeutsches Wörterbuch, Deutsches Wörterbuch von Jacob und Wilhelm Grimm, Sprachwandel
1 Gegenstand und Ziel des Beitrags Im Beitrag wird den lexikographischen Einträgen zu den ältesten Phraseologismen des Deutschen am Beispiel der Somatismen nachgeforscht. Somatismen sind Phraseologismen, derer Komponenten Teile des menschlichen Körpers bezeichnen. Meistenteils gehören Somatismen zu den ältesten Schichten des phraseologischen Bestandes jeder Nationalsprache (vgl. Jewdokimow 1997: 1). Unter Somatismen wird weiter zwischen Kinegrammen und Pseudokinegrammen spezifiziert. Als Beispiele von Somatismen aus älteren Wörterbucheinträgen dürften an dieser Stelle dienen einem an den bart grîfen, bî dem barte swërn (Einträge bei Lexer
Barbara Komenda-Earle, Universität Szczecin, [email protected] / [email protected] https://doi.org/10.1515/9783110716955-006
106
Barbara Komenda-Earle
1872–1878), einem ins auge greifen, mit munt und hant, mit gesameter hant und ganzem munde, bein über bein sitzen (Einträge in DWB). Die Formen der Somatismen werden in Anlehnung an Wörterbücher des Mittelhochdeutschen, das Frühneuhochdeutsche Wörterbuch und das Deutsche Wörterbuch von Jacob und Wilhelm Grimm (1854–1961) verfolgt. Ermittelte Formen der Somatismen werden mit den aktuell üblichen phraseologischen Formen und Einträgen in Wörterbüchern der Gegenwart in Vergleich gezogen, vgl. z. B. jdm. in den Bart greifen, bei dem Bart schwören, Beine übereinanderschlagen, mit Hand und Mund. Falls vorhanden, werden Änderungen der Form, der Bedeutung und der funktionalen Angliederung der untersuchten Formen besprochen. Das Ziel des Beitrags ist zu ermitteln, wie Phraseologismen in den Wörterbüchern berücksichtigt werden sowie inwieweit ältere historische Wörterbücher des Deutschen bei der Untersuchung von Somatismen, insbesondere Kinegrammen und Pseudokinegammen Aufschlüße geben können.
2 Kinegramme und Pseudokinegramme Kinegramme bilden einen besonderen Typ von Phraseologismen, die die konventionalisierte nonverbale Verhalten sprachlich fassen und kodieren, z. B. Achseln zucken, Hände reiben, sich die Hände schütteln, jdm. auf die Schulter klopfen, die Stirn runzeln. Von anderen Phraseologismen unterscheiden sie sich dadurch, dass sie fast regelmäßig eine Bedeutung einer zweiten Ebene erkennen lassen, d. h. Kinegramme geben zugleich den emotionalen oder psychischen Vorgang wieder (vgl. Burger 1976: 318, 319, Burger/Buhofer/Sialm 1982: 56 ff., auch Burger 22003, 42010). Als eine Subklasse der Kinegramme werden bei Burger (1976, 22003, 42010) sowie Burger/Buhofer/Sialm (1982) sog. unechte Kinegramme, anders Pseudokinegramme unterschieden. Pseudokinegramme sind Phraseologismen, bei denen die Ausführung der versprachlichten Geste oder Körperaktion in Wirklichkeit ungewöhnlich erscheine, z. B. sich die Haare raufen, die Hände ringen, jdm. den nackten Hintern zeigen oder realiter nicht möglich, z. B. seine Hände in Unschuld waschen, bzw. nur eingeschränkt möglich ist, z. B. jdn. auf den Händen tragen (mit Einschränkungen möglich, z. B. wenn es sich um Kinder oder Geliebte handelt). Pseudokinegramme sind also Phraseologismen, die in den wörtlichen Wortfolgen keine real nachweisbaren Handlungen mehr wiedergeben z. B. jdm. etwas in den Bart werfen ‚jdm. zu nahe treten, jdn. antasten‘ (DWB), sich die Haare raufen ‚sich die Haare ausreißen zum Ausdruck von Trauer, Verzweiflung, Zorn‘, sich an der Nase zupfen ‚sich vor Verlegenheit an die Nase fassen‘ (DWB).
Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen
107
In sehr vielen Fällen haben sie sich bis heute als Phraseologismen erhalten, wobei sie oft in anderen morphosyntaktischen Formen und anderen Bedeutungen vorkommen, z. B. sich die Haare raufen ‚vor Verzweiflung nicht wissen, was man tun soll, völlig ratlos sein‘, sich an der Nase fassen ‚sich um die eigenen Fehler und Schwächen kümmern‘. Sprachhistorisch gesehen sind Kinegramme tendenziell phraseologisch. Neben Routinehandlungen des Alltags wie z. B. Höflichkeitsformen, Abschieds- und Anredeformen, Beschimpfungen, unterliegt die verbale Kodierung des nonverbalen Verhaltens den Phraseologisierungsprozessen am stärksten (vgl. Burger/Buhofer/Sialm 1982: 347, 360)
3 Historische Bemerkungen zu Phraseologismen in Wörterbüchern bis zum 20. Jh Umfassende Sprichwortsammlungen mit deutschen Phraseologismen entstehen erst im Frühneuhochdeutschen. An dieser Stelle sind in erster Linie solche Werke des 16. Jh. zu erwähnen wie Johannes Agricola’s Sybenhundert und fünffzig Teütscher Sprichwörter (1534), Sebastians Franks Schöne/ Weiße/ Herrliche Clugreden/ vnnd Hoffsprüch (1541), Josua Maalers Die teütsch spraach (1561) (vgl. Mieder 2003). Als eine Wörterbuchkomponente werden Phraseologismen in allgemeinen deutschen Wörterbüchern des 17. und 18. Jh. mitberücksichtigt (vgl. Burger et al. 1982: 372–382). Im 18. Jh. und insbesondere zu Anfang des 19. Jh. beginnt eine Welle phraseologischer Spezialwörterbücher im deutschen Sprachraum, in denen Phraseologismen (als Redensarten betrachtet) jenseits der Sprichwörter behandelt werden, z. B. Sailer (1810/21987), Eiselein (1840), Körte (21861), Frischbier (1882–1883), Borchardt/Wustmann/Schoppe (1888/71954), Richter (21893), Schrader (1896/71912). Es sind jeweils lexikographische Arbeiten, die sich stark auf die Herkunft und kulturgeschichtliche Bedeutung phraseologischer Wortverbindungen konzentrieren (vgl. Komenda-Earle 2015: 146–148). In allgemeinen Wörterbüchern des Deutschen des 19. Jh. – gemeint sind hier große Wörterbücher wie Adelung (1793–1801), Campe (1807–1811), DWB (1854–1961), Sanders (1872), M. Heyne (1890–1895/21905–1906), Heinsius (1818–1822) – wird Phraseologie regelmäßig berücksichtigt, jedoch immer noch ohne terminologische Entscheidungen und ohne methodisch abgesicherte Behandlung in der Makro- und Mikrostruktur (vgl. Komenda-Earle 2015: 148).
108
Barbara Komenda-Earle
Seit spätestens dem 18. Jahrhundert entstehen außerdem äußerst umfangreiche Projekte, die sich ausschließlich der Aufgabe widmen, Phraseme, immer noch vor dem Hintergrund der Sprichwörtern behandelnd, zu versammeln und zu beschreiben. An dieser Stelle sind die großen phraseologischen Nachschlagewerke WanderDSL (1867–1880) und Röhrich-LdspR (41991/1999, 2004) zu nennen. Ein großangelegtes Projekt ist das im 20 Jh. entstandene historische Wörterbuch des figurativen Sprachgebrauchs des Deutschen von Keith Spalding mit dem An historical dictionary of German figurative usage (1959–2000) in 6 Bänden (in der englischen Sprache verfasst) (vgl. Dräger 2009: 26, Komenda-Earle 2015: 147–148). Letztendlich gehört die Aufmerksamkeit dem monumentalen Lexikon Samuel Singers Thesaurus proverbiorum medii aevi. Lexikon der Sprichwörter des romanischgermanischen Mittelalters (TPMA). Das Lexikon umfasst 13 Bände, entstanden in über achtzigjähriger Sammelarbeit im 19. / 20. Jh. und aufgelegt Ende letzten Jahrhunderts (1996–2001). Es enthält eine detaillierte Präsentation der Gebrauchskontexte von Phraseologismen aus 12 europäischen Sprachen (als Sprichwortmaterial betrachtet), einschließlich Mittellatein und Mittelgriechisch, und einen unvergleichbar großen Reichtum an Quellenangaben aus dem Zeitraum von 500 bis 1500; einbezogen wurden antike Quellen der mittelalterlichen Sprichwörter und Belege vom 16. Jh. bis teilweise zum 18. Jh., die älteres Sprichwortgut erhalten.
4 Phraseologismen in Wörterbüchern des Mittelhochdeutschen Wörterbücher des Mittelhochdeutschen sind keinesfalls als phraseologische Wörterbücher konzipiert. Ihre Ziele sind die Erfassung und Beschreibung des gesamten erhaltenen mittelhochdeutschen epochen- und gattungsübergreifenden Wortschatzes im Zeitraum von ca. 1050–1350/ 1450 (bei Lexer und im BMZ fehlen genaue Angaben zu dem dokumentierten Zeitraum). Dem Benutzerzweck entsprechend sind sie als Bedeutungswörterbücher angelegt, die auf zahlreiche Umschreibungen verzichten (vgl. Lexer 1872–1878: X, BMZ 1872–1878). Lexer (1872–1878: X, Vorwort) erklärt: Was die feststellung und entwicklung der bedeutungen betrifft, so habe ich mich dabei der möglichsten Kürze befleissigt (. . .) Manchmal ist keine Bedeutung beigefügt, wenn sie sich aus den folgenden Belegen von selbst ergibt.
Diese Lücke füllt wesentlich Phraseologisches Wörterbuch des Mittelhochdeutschen. Redensarten, Phraseologismen, feste Wortverbindungen in Texten von 1050–1350 (2006) von Jesko Friedrich aus.
Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen
109
Das Wörterbuch von Friedrich (2006) fügt sich methodisch in den Kontext der aktuellsten phraseologischen Forschung ein, indem es u. a. – Indizien der Exzeption von Phraseologismen in Texten befolgt, – aktuelle Typologie in Bezug auf mittelhochdeutsche Phraseologismen anwendet, – Probleme der diachronen (und synchronen) Varianz der Phraseologie in der vorangestellten Untersuchung erörtert, – Veränderungen der lexikalischen und morphosyntaktischen Struktur sowie der Semantik von mitteldeutschen Phraseologismen bis zu ihrem Verklingen (Aussterben) anspricht. Das Wörterbuch basiert auf einigen hundert Texten vor allem aus den Bereichen der schönen Literatur und Sachliteratur. Die etwa 500 Seiten umfangreiche Untersuchung (es fehlen Angaben zu Anzahl der Lemmata) versteht der Autor „eher als Ergänzung denn als bloßes Material des Mitelhochdeutschen Wörterbuchs“ (Friedrich 2006: 16). Phraseologismen findet man in alt- und mittelhochdeutschen Wörterbüchern, allenfalls unter einzelnen Lemmata. Die Stärke der mittelhochdeutschen Wörterbücher liegt in den angesammelten Belegen aus den Primärquellen. Die Interpretation und linguistisch fundierte Beurteilung der aus den Belegen herauszuabrahierenden Wortverbindungen wird dem Forscher überlassen. Nur in seltenen Fällen lässt sich von der Anzahl der mittelhochdeutschen Belege auf sich herauszubildende phraseologische Einheiten schließen, vgl. die Einheit auf die Knie fallen samt ihren Varianten: BMZ si vielen nider an diu knie Mar. 181. er strûhte an sîniu knie Nib. 1500,3. Iw. 140. er kom ûf diu knie Parz. 740,25. er viel ûf sîniu knie das. 120,30. daʒ houbet hanht ich nider unz ûf mîniu knie Walth. 19,33. diu decke von oben nider gie dem orse vaste für diu knie Trist. 6686. — Lexer (1872–1878) an blôʒen kniewen ligen Loh. 302, ûffen knien ligen Pass. 352,9. sich lâʒen an diu knie ib. K, 663,5, ûf diu knie Ulr. Wh. 116d. Ga. 1. 345,290. an diu knie vallen Loh. 3061 (vgl. knievallen). dienen ûf einem knie Ls. 1. 561,82.
Aus den Belegen lassen sich folgende historische Varianten des Phraseologismus auf die Knie fallen exzerpieren: auf seine knie fallen, an die knie niederfallen, auf die knie kommen, durativ: an bloßen knien liegen. Ob jdm. auf den knien dienen ebenfalls eine Variante des Phraseologismus darstellt oder ob es sich hier um einen separaten Phraseologismus handelt, kann anhand der Einträge in BZM und Lexer nicht entschieden werden. Dazu wären auch Textanalysen notwendig. Ein synchroner Schnitt über Wörterbücher des Mittelhochdeutschen lässt einen Korpus von damals auftretenden Somatismen ermitteln und neben Übereinstimmungen verschiedenartige Differenzen zwischen damals und heute erkennen.
110
Barbara Komenda-Earle
Die Unterschiede betreffen den Grad der Phraseologisierung, die lexikalische und morphosyntaktische Struktur des Phraseologismus, mitunter seine Semantik. Die Belege können in folgende Gruppen geteilt werden (im Sinne Burgers 4 2010, 2003: 130–143): – Phraseologismen, die sich nicht verändert haben: mhd. augen machen (Lexer, Friedrich) → nhd. (große) Augen machen mhd. jdm. umbe den hals vallen (Friedrich)→ nhd. jdm. um den Hals fallen mhd. gewapent unze uf die zene ‚vollständig bewaffnet‘ (Friedrich)1 → bewaffnet bis auf die Zähne – Phraseologismen mit einer anderen lexikalischen oder/und morphosyntaktischen Besetzung, die gegenwärtig mit derselben Bedeutung erkennbar sind: mhd. über die ahseln sehen (Lexer) → jdn. über die Achsel ansehen (DuRe) mhd. bein über bein sitzen (Lexer) → Beine übereinanderschlagen mhd. mit der ferse den abschiedssegen erteilen ‚fliehen‘ (BMZ) → Fersengeld geben (DuRe) mhd. in die funst lachen (BMZ) → sich ins Fäustchen lachen (DuRe) mhd. einem in daʒ hâr vallen (BMZ) → sich in die Haare geraten/ kriegen (DuRe) mhd. nase rimpfen (Lexer) → sich die Nase über jdn./etwas rümpfen (DuRe) mhd. jdm. den nac/ nacken keren (Friedrich) → jdm. den Rücken kehren ‚sich von jdm. abwenden‘ (DuRe) – Phraseologismen, die der Form nach gänzlich oder weitgehend gleich geblieben sind, deren Bedeutung sich aber bis heute verändert hat: mhd. die zene zesamene bizen (wörtliche Bedeutung) (Friedrich) → die Zähne zusammenbeißen ‚Schmerzen, schwere Zeiten, Unangenehmes o. Ä. tapfer ertragen‘ (DuRe) – Phraseologismen, die sich in der Form und in der Bedeutung verändert haben: mhd. sine/die hende zusammenschlagen (Friedrich) → die Hände über dem Kopf zusammenschlagen ‚über etwas entsetzt sein‘ – Phraseologismen, die bis heute untergegangen sind: mhd. in daʒ ouge grîfen/ slahen (Lexer) mhd. einem an den bart grîfen (Lexer) mhd. bî dem barte swërn (Lexer) mhd. die feust lecken (BMZ) mhd. einem auf den fuesz nâch eilen, einem vuesz halten ‚Widerstand leisten‘ (BMZ) mhd. die hende winden (Lexer), die/sine hende winden (Friedrich)
1 Bei der Angabe der Phraseologismen nach Friedrich (2006) wird auf die Sonderzeichen des Mittelhochdeutschen verzichtet.
Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen
111
mhd. bî dem kinn begrîfen/ nehmen/ vâhen (Lexer) mhd. jdm. strubet der nac ‚jd. leidet unter schweren Lasten‘ (Bedeutung unklar) (Friedrich) mhd. den nacken vur die ougen ziehen ‚unvernünftig/ blind machen/ verblenden‘ (Friedrich) mhd. etw. zem nacken werfen ‚etwas aufgeben, wegwerfen‘ (Friedrich) mhd. sine zene uf jdm. verstozen ‚jdn. attackieren‘ (Friedrich) mhd. (die) schenkel vliegen lassen ‚sein Pferd antreiben‘ (Friedrich) mhd. (jds.) schenkel vliegen als Bezeichnung der Beinbewegung eines Reites, der sein Pferd antreibt (Friedrich)
5 Phraseologismen im Frühneuchhochdeutschen Wörterbuch FWB-online ist die Online-Version des Frühneuhochdeutschen Wörterbuches (FWB), die eine Fortsetzung des 1985–2012 zu Hälfte bearbeiteten Wörterbuches von Oskar Reichmann und Mitarbeitern darstellt. Seit 2013 wird das Wörterbuch als Forschungsprojekt der Akademie der Wissenschaften zu Göttingen fortgeführt. Das Frühneuhochdeutsche Wörterbuch beschreibt den Wortschatz der hochdeutschen Sprache von der Mitte des 14. Jahrhunderts bis zur Mitte des 17. Jahrhunderts. Quellen, die dem Wörterbuch zugrunde liegen, sind Primärquellen (originale Handschriften und Drucke sowie Glossare, Wortverzeichnisse, lexikologische Anmerkungsteile, Register aller Art, literarische Texte aller Gattungen, fachtheologische Texte, Fachtexte aller Art, didaktische Texte, chronikalische und berichtende Texte, Rechts- und Wirtschaftstexte, darunter Weistümer, Gesetzestexte, zeitgenössische Wörterbücher) und sekundäre Quellen (lexikologische Untersuchungen, Wörterbücher, Sachregister zu Texteditionen, Sachlexika), und zwar jeweils insofern, als sie frühneuhochdeutsche Textbelege enthalten. Das Quellenkorpus des Frühneuhochdeutschen Wörterbuches besteht aus annähernd 1000 unter Raum-, Zeit- und Textsortenaspekten gezielt zusammengestellten Texten und Textsammlungen. Der Gesamtumfang des Quellenkorpus beträgt rund 400 000 Seiten.2 Das Frühneuhochdeutsche Wörterbuch ist ein Bedeutungswörterbuch. Dabei wird Semantik in einem weiteren Sinne aufgefasst. Neben typischen lexikologischen Informationen wie das Wort(lemma), Wortvarianten, Angaben zur Wortart und zur Morphologie, Hinweise zur Etymologie, die Erläuterung der Bedeutung, zum Teil in Verbindung mit kulturgeschichtlicher In-
2 https://fwb-online.de/.
112
Barbara Komenda-Earle
formation, Angaben zur onomasiologischen Vernetzung des Wortes wird auch ihre syntagmatische Verwendung berücksichtigt. Die Auffassung der Phraseologismen – in FWB als Phraseme3 erfasst – berücksichtigt Dimensionen ihrer historischen Entwicklung von freien Wortverbindungen zu vollständig lexikalisierten Wortschatzeinheiten: Da Phraseme einerseits in einem fließenden Übergangsverhältnis zu den freien Verbindungen und andererseits zu vollständig lexikalisierten Einheiten stehen, muß ihre Erläuterung den Ort auf der Übergangsskala möglichst genau abbilden, auf dem sich das einzelne Phrasem befindet. (FWB, Vorwort, Positionen des Wörterbuchartikels. VIII: Angabe typischer Syntagmen)
Das Anliegen der Wörterbuchverfasser ist, möglichst viele phraseologische Einheiten des Frühneuhochdeutschen zu berücksichtigen: Es ist also mit besonderer Aufmerksamkeit darauf zu achten, daß die Grenze zwischen freien Verbindungen und Phrasemen nicht so hoch angesetzt wird, daß viele bei näherem Hinsehen phraseologische Einheiten als solche unerkannt bleiben. (FWB, Vorwort, Zum Gegenstand des Wörterbuchs)
Gemäß dem historischen Verständnis der Phraseologismen werden die Wortverbindungen folgendermaßen im Wörterbuch berücksichtigt: (1) Phraseme, die relativ deutlich lexikalisiert sind, also einer der Bedeutungen ihrer Komponenten nur noch locker zuzuordnen sind, stehen unter einer eigenen Bedeutungsposition, z. B. unter dem Stichwörtern Haar, Hand, Haupt4: Phraseme: har auf har machen ‚Streit anfangen‘; eines seiner hare haben wollen ‚mit jm. anbändeln wollen‘; jm. ein har krümmen ‚jm. Schaden zufügen‘; jm. die hare zu etw. leihen ‚für jn. bei einer Gelegenheit einstehen‘; etw. mit den haren herbei ziehen ‚etw. erzwingen wollen‘; hare lassen müssen ‚etw. einstecken müssen, zu Schaden kommen‘; sich jm. in die hare wünschen ‚mit jm. eine (kriegerische) Auseinandersetzung beginnen wollen‘; jn. in den haren haben› mit jm. streiten‹; ˹ mit jm. zu har liegen, sich mit jm. in die hare legen ‚sich mit jm. streiten‘; die hare (Subj.) jm. zu / gen berge, obsich gehen / stehen ‚sich fürchten, sich entsetzen‘; sich graue hare um etw. wachsen lassen ‚sich über etw. ärgern‘; sich die hare spalten lassen ‚sich betrügen lassen‘. Phraseme: lange hände haben ‚einen langen Arm haben‘5; die hände im busen haben ‚faul sein‘; die hand in den schos legen; jm. die hand bieten; jm. sind hand und fus gebunden; etw. / jn. auf (den) händen tragen; jn. an die hand nemen; alles geht ze händen ‚verläuft nach Wunsch‘.
3 Termini Phraseologismus und Phrasem werden im Folgenden synonym verwendet, wobei vermerkt wird, dass der Terminus Phrasem sich in der linguistischen Literatur immer mehr durchsetzt und den lange geläufigeren Terminus Phraseologismus ersetzen mag. 4 Die Einträge werden in der originellen Notationsweise des FWB angeführt. 5 Merkwürdigerweise wird in diesem Falle die Bedeutung des frühneuhochdeutschen Phraseologismus mithilfe des entsprechenden gegenwärtigen Phraseologismus wiedergegeben.
Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen
113
Phraseme: das haupt werfen ‚sich umdrehen‘; das haupt legen ‚sterben‘; die füsse das haupt regieren; etw. (Subj.) kostet jn. das haupt ‚jm. geht etw. ans Leben‘; etw. auf js. haupt legen ‚jm. die Verantwortung für etw. übergeben‘; sein haupt an etw. setzen ‚sein Leben für etw. einsetzen, opfern‘; auf dem haupt gehen / tanzen ‚verrückt sein vor Freude oder Übermut‘; jn. vom haupt tun ‚jn. enthaupten‘; etw. (Subj.) geht jm. über / an das haupt ‚etw. wächst jm. über den Kopf, wird ihm zu viel‘.
(2) Phraseme, die teilweise lexikalisiert sind, also noch deutlich einer der Bedeutungen ihrer Komponenten zuzuordnen sind, erscheinen in der Reihe der dieser Bedeutung zugehörigen Syntagmen und werden gegenüber freien Verbindungen mit einer zusätzlichen Kennzeichnung versehen, z. B. unter den Stichwörtern Haar, Hand, Haupt: Syntagmen: das haar abschneiden / abziehen / läutern / versengen, die hare puffen, mit etw. streichen, hare aus etw. lesen, sich die hare aus dem haupt brechen (zum Ausdruck des Leides und Schmerzes); das h.(Subj.) wachsen, die hare auf dem haupt steigen; die hare am leib; das böse / graue / grobe / kleine / lange / schöne / unreine haare Syntagmen: das haupt beschweren / (empor)heben / höhen / neigen / salben / waschen / wiegen, zu einem pfand setzen, in gold verwirken, jm. das h. abschlagen / abschmeissen / abschneiden / abschiessen / abschwingen / spalten; (. . .) zwei finger auf das h. legen (bei einem Schwur), asche auf das h. legen (als Zeichen der Trauer und der Klage), (. . .) einen streich auf das h. geben, bei / zu js. häupten liegen / stehen; h. und gliedmassen; (. . .) Syntagmen: die hände abkeren / anschlagen ›klatschen‹ / aufbieten ›zum Gebet erheben‹ / aufhalten / aufheben / binden / verliesen / waschen, in etw. stossen / tunken, die h. auf den mund legen, jm. die h. durchstechen / geben / reichen; etw. / jn. an der h. füren, etw. ab der hände nemen, auf den händen und füßen gehen, jn. mit der h. anrüren / nemen, jn. bei der h. leiten, sich mit der h. ätzen ›sich kratzen‹, mit der h. etw. [tun, z. B. jn. schlagen, jm. die füsse waschen], in einer h. lam sein, etw. in die h. nemen, in der h. etw. haben / tragen, jm. etw. in die h. legen, jm. nägel durch die hände schlagen, jm. wunden in die h. hauen; eine h. vol (ungefähre Mengenangabe); die h. des herren; die rechte / linke / auswendige [›Handrücken‹] aufgerekte / besudelte / flache / offene / reine / weisse / unflätige / unschuldige h., geschlossene / zusammen gehenkte hände; gicht, rücken, wunde der hand; ein schlag mit der h., eine münze mit händen
(3) Unikale phraseologische Einheiten erscheinen unter einem eigenen Lemma; Mehrere Phraseologismen sind im Moment elektronisch nur unter verbalen Komponenten abrufbar, z. B. Phraseme: den star stechen, jm. die ader stechen, ‚jn. zur Ader lassen‛6 (unter stechen) Phraseme: einem in die ferse hauen ‚jm. Schaden zufügen‛ (unter hauen) Phraseme: sich selbst bei der nase greifen ›sich um die eigenen Angelegenheiten kümmern‹ in seinen busen greifen ›sich auf sich selbst besinnen‹ (unter greifen)
6 Vgl. Anmerkung 5.
114
Barbara Komenda-Earle
Der Wert der Phraseologismen in FWB als einem historischen Bedeutungswörterbuch wird „eins der Mittel für die Bedeutungserschließung von lexikalischen Einheiten sein“ sowie „eine willkommene Gelegenheit für die Öffnung der Bedeutungserläuterung in Richtung auf Sacherläuterungen“ (FWB, Lexikographische Einleitung, Der Gegenstand des Wörterbuches) bieten. Das FWB hat mit der Position Syntagmen eine eigene Informationsposition für Phraseme im Wörterbuchartikel konzeptionell angelegt. Durch die Informationsposition bietet das FWB dem Phraseologen die Möglichkeit, den Prozess des Werdens von Phrasemen, der bekanntlich von einer losen Wortverbindung über mehr oder weniger phraseologissierte bis teilweise und vollkommen idiomatisierte Einheit erläuft, zu beobachten.
6 Phraseologismen im DWB Das DWB (1854–1961) umfasst 32 Teilbände, insgesamt 67.744 Spalten und etwa 330.000 Stichwörter und bildet ein worthistorisches Grundlagenwerk der deutschen Sprache. Das Quellenverzeichnis des DWB umfasst 4.000 Quellen. Dem Wörterbuch wurde eine umfangreiche Sammlung von Textbelegen aus ca. 25.000 unterschiedlichen Quellen seit dem 15. Jh. zugrunde gelegt.7 Das DWB war von Anfang an als ein sprachhistorisches Werk, ein Bedeutungsund Belegwörterbuch, konzipiert und gilt bis heute als Musterwerk der historischen Lexikographie. Es enthält umfassende etymologische Angaben, sehr zahlreiche Kontexte, Quellenhinweise, Bedeutungsvarianten und Gebrauchsweisen im historischen Querschnitt, grammatische Eintragungen und Wortbildungen. Lexikalische Einheiten werden oft durch Sinnrelationen wie Synonymie und Antonymie aufeinander bezogen. Einzelne Artikel erhalten Belege seit den ersten Auftreten in der Schriftlichkeit bis zu den zur Untersuchungszeit aktuellen Belegen. Die Belegtexte des DWB stammen überwiegend aus literarischen Texten und anderen Nachschlagewerken. Da die Belege von den Autoren oft aus dem Gedächtnis angeführt wurden, können manchmal Abweichungen von dem Originaltext auftreten. Die digitalisierte Version des DWB liegt seit 2003 vor. Der phraseologische Status der phraseologischen Einheiten, d. h. Nennform, Festigkeit, Gebräuchlichkeit lässt sich erst mit mehreren Belegen beweisen. Eine
7 Vgl. http://dwb.uni-trier.de/de/das-woerterbuch/das-dwb/.
Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen
115
Systematik der Behandlung des phraseologischen Materials im heutigen Sinne ist in DWB allerdings nicht vorhanden. Trotz aller Konsequenz der Grundkonzeption sind hinsichtlich der langen Entstehungszeit des DWB unterschiedliche Arbeitsstile der Lexikographen, die durch die Entwicklung der sprachwissenschaftlichen Paradigmen und die Entwicklung der Sprache selbst begründet sind, deutlich spürbar. Dies führt auch zu gewissen Inkonsequenzen und Uneinheitlichkeiten der Bearbeitung. Besonders reiche, dennoch sehr uneinheitliche Struktur haben die noch im 19. Jh. erarbeiteten Abschnitte mit Anfangsbuchstaben A-F und H-R. Das DWB deckt mit seinem Volumen an Belegen die Geschichte der deutschen Phraseologie fast lückenlos ab. Die Belegsuche durch DWB gleicht einem korpuslinguistischen Zugang8 zu (noch) nicht digitalisierten Texten, was einen der größten Vorteile seiner 1998– 2003 digitalisierten Fassung ausmacht9. Die Belegzettel des DWB, noch nicht ganz elektronisch erfasst10, werden an der Zahl auf 6,4 Millionen geschätzt und entsprechen damit durchaus den Anforderungen an ein modernes Korpus (Dräger 2011: 68). Der Untersuchung von Phraseologismen in DWB wurde in den letzten Jahren relativ viel Aufmerksamkeit zugewendet. Thematisiert wurden vor allem der kulturhistorische und etymologische Wert des Wörterbuchs (Mieder 1986), Möglichkeiten seiner Nutzung als Textkorpus (Dräger 2009, 2011: 79–88.), die Markierung der phraseologischen Phänomena in DWB (Stancheva 2012), die Bedeutung des DWB bei der Rekonstruktion des phraseologischen Wandels (Komenda-Earle 2015). Die Behandlung der Phraseologismen in DWB wird an dem Artikel Nase veranschaulicht. Der Artikel Nase zählt insgesamt14 Spalten (Band 13, Sp. 396 bis 410) und enthält zahlreiche Phraseologismen, Sprichwörter und Kollokationen mit der Komponente Nase. Das Lemma Nase ist in insgesamt 68 Teile gegliedert, durchnummeriert mit römischen und arabischen Zahlen und Buchstaben.
8 Zur Nutzung des DWB als Textkorpus vgl. auch Dräger 2009. 9 Das Wörterbuch wurde von dem Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften in Trier retrodigitalisiert und im Internet sowie auf CD-Rom publiziert. Im Rahmen der andauernden Pflegearbeiten werden strukturelle Veränderungen und Korrekturen dieser Version vorgenommen mit dem Zweck, eine Abbildung der DWBStichwörter in moderne Lemmata zu integrieren, was den Nutzern auch eine den heutigen Sprachstandards angemessene Suche erleichtern sollte. Die Wörterbuchsubstanz soll anschließend in die Panelstruktur der DWDS-Website überführt werden, was auch die wörterbuchübergreifende Suche ermöglichen wird. 10 Vgl. http://150-grimm.bbaw.de/. Die Digitalisierung der Belegzettel ist laut Angaben auf der Website geplant, womit ein neues, historisch sehr interessantes Korpus entstünde (vgl. auch Dräger 2009: 68).
116
Barbara Komenda-Earle
Phraseologismen werden im Text meistens nicht hervorgehoben, dagegen werden sehr oft ihre Bedeutungsumschreibungen in Kursivdruck gesetzt, mitunter in dahinterfolgenden Klammern, z. B. aus voller nase schreien (sehr laut durch die nase reden) durch die nase reden (näseln) Phraseologismen werden unterschiedlich und sehr uneinheitlich gekennzeichnet, so z. B. als Redensart, übertragen, bildlich, z. B. redensart: einem die nase aus dem gesicht fluchen übertragen: auf die nase fallen, mit einem vorhaben scheitern Unterschiedliche Bedeutungen von Phraseologismen sind oft dem Fließtext des Artikelfragments bzw. zusätzlichen Kommentaren im Fließtext zu entnehmen. So wird z. B. bei (sich) an der Nase zupfen, die Nase rümpfen, jdm. die Tür vor der Nase zuschließen jeweils zwischen der wörtlichen (kinetischen) und phraseologischen Bedeutung unterschieden: an der nase zupfen: so zupfte er sich (vor verlegenheit) wechselsweise bald an der nase bald am bart. Wieland 20, 224; zupf dich an deiner nase! bekümmere dich um deine angelegenheiten. Spiesz henneb. idiot. 171. die nase rümpfen, kräuseln, kräusen (kraus machen), wegen widerlichen geruches oder spöttisch: die nasen rümpfen, corrugare nares Maaler 303b; die nasen uber einen rümpfen, subsannare Dief. gl. 561b; einem die thür vor der nase zuschlieszen, zuschlagen (Rädlein 667b), eigentlich und bildlich.
Etymologische Ausführungen lassen die Herkunft der Pseudokinegramme bis zur Motivation aus der Tierwelt verfolgen: die nase hoch (in die höhe) tragen, heben, erheben, aufwerfen (vgl. 1, e), eigentlich, zunächst vom spürhunde: der hund trägt die nase hoch, wenn er was im winde hat. Zedler 23, 715; übertragen, als zeichen der überhebung, des hochmutes, der andere nicht beachtet, über sie hinwegsieht: die nase hoch tragen, hohe dinge begehren. Zedler 23, 71211;
Gängige Praxis des DWB ist die Angabe von mehreren Varianten eines Phraseologismus, z. B. die nase aufspünden (th. 1, 744), aufsperren (1, 742), aufreiszen für die nase halten, stellen, stoszen, reiben (Schm. 1, 1758 Fromm.), werfen, in derber weise vorhalten, vorwerfen (vgl. in die nase, unter die nase reiben, stoszen, rücken): an der nase: an der (wie bei der, mit der) nase führen, herumführen, herumziehen (s. th. 41, 434. 42, 1178. 1185); an der nasen herum führen.
11 Eine detaillierte Kommentierung der DWB-Bibliographie muss an dieser Stelle erspart bleiben.
Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen
117
die nase in etwas stecken, stoszen, begraben, worin haben: du solt die nasen nicht darein stoszen,
Bei sehr zahlreichen Phraseologismen erscheinen sowohl ihre Synonyme als Antonyme, z. B. übertragen, als zeichen der überhebung, des hochmutes, der andere nicht beachtet, über sie hinwegsieht: die nase hoch tragen, hohe dinge begehren. Zedler 23, 712; die nase niedrig tragen, senken, hängen lassen u. dgl. de näse hangen laten, sich schämen. brem. wb. 3, 219; die nase einspannen, einziehen, nicht hoch tragen:
Das Wörterbuch verfügt über sehr reiches Kommentar- und Verweissystem, die den semantischen, formalen und etymologischen Verbindungen zwischen einzelnen Einträgen nachforschen lässt, z. B.: die nase biegen (s. 1, e), beugen, krümmen, herumdrehen: die nase krümmen, rümpfen. das innere der nase wird angezeigt durch präpositionen (vergl. I, 5): aus der nase flieszen, triefen, ziehen, schnauben u. dgl.:
Im DWB wird Mehrfachlemmatisierung verwendet, so dass formale Varianten eines Phraseologismus durch Stichwort- oder Volltextsuche an mehreren Stellen gefunden werden können, z. B. erscheint der Phraseologismus jdm. etwas unter die Nase reiben in zwei Varianten an vier verschiedenen Stellen. Formale Varianten jmdm. etw. unter die Nase reiben in DWB (Angaben nach www.oldphras.net) sind: – jmdm. etw. unter die Nase reiben (DWB – ‚Nase‘). – jmdm. etw. unter die Nase reiben (DWB – ‚einreiben‘). – jmdm. etw. unter die Nase schieben (DWB – ‚Auge‘). – jmdm. etw. unter die Nase stoßen (DWB – ‚Nase‘). Phraseologismen erscheinen in DWB als eigene Unterlemmata oder haben den Status von lexikographischen Beispielen, z. B. eine nase oder lange nase: einem eine lange nase machen, ziehen, ihn durch gestus einer mittels der ausgespreiteten finger gleichsam verlängerten nase verspotten. SCHM. 1, 1758 Fromm., vgl. gecknasen th. 41, 1925; einem ein nasen machen, einen vermupfen oder verspotten, uncis naribus indulgere. MAALER 303b; (. . .) mit der langen nasen abweisen, respuere DENZLER 210a; eine nase laufen oder holen, seines suchens oder hoffens verfehlen. ZEDLER 23, 712.
118
Barbara Komenda-Earle
7 Zusammenfassung: Methodische Probleme bei der Untersuchung der Phraseologie auf den ältesten Stufen des Deutschen. Ergebnisse der Untersuchung Bekannte Hauptprobleme bei der Untersuchung der Phraseologie historischer Sprachstufen sind mangelhafte Sprachkompetenz und lückenhafte Überlieferung. Die gängigen alt-, mittel- und frühneuhochdeutschen Wörterbücher haben lange kein fundiertes phraseologisches Konzept. Die älteren von ihnen sind hilfreich beim Auffinden relevanter Belege aus den Primärquellen, eine linguistisch fundierte Beurteilung von Wortverbindungen lässt sich anhand der Wörterbücher nicht schlechthin machen. Weitere problematische Fragen, mit denen man im Umgang mit Wörterbüchern zur älteren deutschen Sprache konfrontiert wird, sind vor allem Fragen – der Positionierung des Phraseologismus im Artikel, – der Nennform des Phraseologismus, – der Erläuterung der Bedeutung(en) des Phraseologismus, – der Darstellung von Varianten des Phraseologismus. Diese Probleme betreffen allerdings auch die Phraseographie im Allgemeinen und werden auch in Hinsicht auf moderne phraseologische Wörterbücher immer wieder ausgearbeitet und neu diskutiert. Das Ansetzen von phraseologischen Einheiten im allgemeinen Wörterbuch ist kompliziert. Im historischen Bedeutungswörterbuch insofern schwieriger, als die Wortverbindungen auf verschiedenen Stufen des Werdens zu Phrasemen begriffen werden. Mit den Konzeptionen des Werkes von Friedrich (2006) und des entstehenden FWB werden mehrere methodische Fragen der Phraseologie auf älteren Sprachstufen gelöst. Historische Nachschlagewerke lassen per se immer noch viele Fragen offen und aus dem Grund bieten sie ein weites Feld für diachrone Angaben und historische Analysen. So lässt sich anhand der im Beitrag ermittelten Beispiele von Somatismen aus Wörterbüchern feststellen, dass Phraseologisierungsprozesse bei Kinegrammen bereits im Mittelhochdeutschen angesetzt haben. Dafür spricht die relative Festigkeit der Wortverbindungen, die formal-strukturell Eigenschaften freier Wortverbindungen sowie eine große Zahl der Varianten mit einer gemeinsamen Bedeutung erkennen lassen, vgl. das Beispiel auf die Knie fallen. Mehrere Somatismen haben bereits im Mittelhochdeutschen sekundäre phraseologische Bedeutungen, vgl. z. B. mit der ferse den abschiedssegen erteilen ‚fliehen‘.
Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen
119
Beispiele von Kinegrammen des Mittelhochdeutschen die hare stehen/ gehen jm. zu / gen berge/ obsich und sich graue hare um etw. wachsen lassen, die im Neuhochdeutschen bereits mit neuen phraseologischen Bedeutungen ‚sich fürchten, sich entsetzen‘ und ‚sich über etw. ärgern‘ erscheinen, überzeugen, dass bei zahlreichen Einheiten vollständige Phraseologisierung und Idiomatisierung vor dem 17. Jh stattgefunden hat. Beispiele von Kinegrammen wie die Hand auf den Mund legen, jdm. die Hand geben, etwas in der Hand haben, die im Frühneuhochdeutschen noch als freie Syntagmen funktionieren und gegenwärtig phraseologische Bedeutungen aufweisen, deuten darauf hin, dass zahlreiche Einheiten erst im Neuhochdeutschen intensiveren Prozessen des semantischen (und ggf. auch strukturellen) Wandels unterliegen. Die Entwicklung des Kinegramms graue haare bekommen (Friedrich), gegenwärtig sich wegen/ über etwas keine grauen Haare wachsen lassen, vgl. mhd. graue haare bekommen Kinegramm, in der wörtlichen Bedeutung ‚(vor Angst/Gramm) graue Haare bekommen‘ (Friedrich), fhd. sich graue hare um etw. wachsen lassen ‚sich über etw. ärgern‘ (FNW), nhd. sich wegen/ über etwas keine grauen Haare wachsen lassen ‚sich wegen etwas keine unnützen Sorgen machen‘ veranschaulicht, dass mittelhochdeutsche Phraseme auf dem Weg ins Neuhochdeutsche mannigfaltigem Wandel in morphosyntaktischer, semantischer und funktionaler Hinsicht unterlegen haben.
Literaturverzeichnis Wörterbücher Adelung = Adelung, Johann Christoph (1793–1801): Grammatisch-kritisches Wörterbuch der Hochdeutschen Mundart mit beständiger Vergleichung der übrigen Mundarten, besonders aber der oberdeutschen. Zweyte, vermehrte und verbesserte Ausgabe. Leipzig: Breitkopf. BMZ = Mittelhochdeutsches Wörterbuch. Mit Benutzung des Nachlasses von Georg Friedrich Benecke ausgearbeitet von Wilhelm Müller und Friedrich Zarncke. 3 Bde. Leipzig 1854–1866: S. Hirzel. Borchardt, Wilhelm/Wustmann, Gustav/Schoppe, Georg (1888/71954): Die sprichwörtlichen Redensarten im deutschen Volksmund nach Sinn und Ursprung erläutert. (neu bearbeitet von Alfred Schimer). Leipzig: Brockhaus. Campe, Joachim Heinrich (1807–1811): Wörterbuch der deutschen Sprache. Veranstaltet und herausgegeben von Joachim Heinrich Campe. Braunschweig: Schulbuchhandlung. DWB = Grimm, Jacob/Grimm, Wilhelm: Deutsches Wörterbuch von Jacob und Wilhelm Grimm. 16 Bände in 32 Teilbänden (1854–1961). Leipzig: Verlag von S. Hirtel sowie [Unter: http://dwb.bbaw.de/, http://dwb.uni-trier.de/de/http://dwb.uni-trier.de/de/, http://www.woerterbuchnetz.de/DWB/, letzter Zugriff: 21.08.2019] und als CD-Ausgabe Deutsches Wörterbuch: Elektronische Ausgabe der Erstbearbeitung (2004). Frankfurt a. M.:, Zweitausendeins.
120
Barbara Komenda-Earle
Eiselein, Josua (1840/ 1980): Sprichwörter und Sinnreden des deutschen Volkes in alter und neuer Zeit. Freiburg: Fridrich Wagnerische Buchhandlung. Friedrich, Jesko (2006): Phraseologisches Wörterbuch des Mittelhochdeutschen. Redensarten, Sprichwörter und andere feste Wortverbindungen in Texten von 1050–1350. Tübingen: Niemeyer. Frischbier, Hermann (1882–1883): Preußisches Wörterbuch: ost- und westpreußische Provinzialismen in alphabetischer Folge. 2 Bände. Berlin: Enslin. FWB = Frühneuhochdeutsches Wörterbuch [Unter: https://www.fwb-online.de letzter Zugriff: 21.08.2019] Heinsius, Theodor (1818–1822): Volkstümliches Wörterbuch der deutschen Sprache mit Verzeichnung der Aussprache und Betonnung für die Geschäfts- und Lesewelt. 4 Bände. Hannover: Hahn. Heyne, Moritz (21905–1906): Deutsches Wörterbuch. Leipzig: Verlag S. Hirtzel Stuttgart. Körte, Wilhelm (21861): Die Sprichwörter und sprichwörtlichen Redensarten der Deutschen. Nebst den sprichwörtlichen Redensarten der deutschen Zechbrüder und Alter Praktik Großmutter, v.i. der Sprichwörter ewigem Wetterkalender. Leipzig: F. A. Brockhaus. Lexer = Matthias Lexer (1872–1878): Mittelhochdeutsches Handwörterbuch. 3 Bände. Leipzig: S. Hirtzel. Lexer, Matthias von (371983): Mittelhochdeutsches Wörterbuch (samt den Nachträgen von U. Pretzel). Stuttgart: S. Hirzel. Richter, Albert (21893): Deutsche Redensarten. Sprachlich und kulturgeschichtlich erläutert. 2., vermehrte Auflage. Leipzig: Albert Richter. Röhrich, Lutz (2004): Lexikon der sprichwörtlichen Redensarten. Digitale Bibliothek 42. Berlin. Röhrich, Lutz (41991/1999 [zuerst: 1973]): Lexikon der sprichwörtlichen Redensarten. 5 Bände. Freiburg/Basel/Wien: Herder. Sailer, Johann Michael (1810/21987): Die Weisheit auf der Gasse oder Sinn und Geist deutscher Sprichwörter. Nördlingen: Franz Greno. Sanders (1872): Wörterbuch der deutschen Sprache. Mit Belegen von Luther bis auf die Gegenwart. 3 Bände. Leipzig: Verlag von Otto Wigand. Schrader, Herman ((1896/71912): Der Bilderschmuck der deutschen Sprache in Tausenden volkstümlicher Redensarten. Nach Ursprung und Bedeutung erklärt. Berlin: Verlag von Emil Felber. Singer, Samuel (1996–2002): Thesaurus proverbiorum medii aevi. Lexikon der Sprichwörter des romanisch-germanischen Mittelalters. 13 Bände. Berlin u.a.: de Gruyter. Spalding, Keith (1959–2000): An historical dictionary of German figurative usage. 6 Bände. Oxford: Blackwell. Wander, Karl Friedrich Wilhelm (1867/ 1987): Deutsches Sprichwörter-Lexikon. Ein Hausschatz für das deutsche Volk. 5 Bände. Unveränderter fotomechanischer Nachdruck der Ausgabe Leipzig 1867. Kettwig: Athenaion.
Internetquellen Online-Lexikon zur diachronen Phraseologie. Deutsche Sprichwörter und Redewendungen im Sprachwandel. Online-Lexikon zur diachronen Phraseologie des Deutschen in neuhochdeutscher Zeit (OLdPhras) [Unter: https://www.oldphras.net/web/, letzter Zugriff: 21.08.2019]
Zur Erfassung von Phraseologismen in Wörterbüchern seit dem Mittelhochdeutschen
121
Sekundärliteratur Burger, Harald (1976): „die achseln zucken“ – Zur sprachlichen kodierung nicht-sprachlicher kommunikation. In: Wirkendes Wort. Deutsche Sprache in Forschung und Lehre 26, 311–334. Burger, Harald (2003): Phraseologie. Eine Einführung am Beispiel des Deutschen. 4., neu bearbeitete Auflage. Berlin: Erich Schmidt. Burger, Harald (42010): Phraseologie. Eine Einführung am Beispiel des Deutschen. 4., neu bearbeitete Auflage. Berlin: Erich Schmidt. Burger, Harald/Buhofer, Annelies/Sialm, Ambros (1982): Handbuch der Phraseologie. Berlin/New York: de Gruyter. Dräger, Marcel (2009): Auf der Suche nach historischen Phrasemen – oder: Wörterbücher als Korpora. In: Linguistik online 39, 33–64, http://www.linguistik-online.de/39_09/draeger. html. Dräger, Marcel (2011): Der phraseologische Wandel und seine lexikographische Erfassung. Konzept des „Online-Lexikons zur diachronen Phraseologie (OLDPhras)“. Dissertation (pdfManuskript). [Unter: http://www.freidok.uni-freiburg.de/volltexte/8528/, letzter Zugriff: 21.08.2019]. Dräger, Marcel (2012): Plädoyer für eine diachrone Perspektive in der Phraseographie. In: Filatkina, Natalia/Kleine-Engel, Ane/Dräger, Marcel/Burger, Harald (Hrsg.): Aspekte der historischen Phraseologie und Phraseographie. Heidelberg: Universitätsverlag Winter, 193–226. Jewdokimow, Alexander (1997): Aspekte historischer Phraseologie. Über die Prozesse der primären Phraseologisierung in den altgermanischen Sprachen. Universität Hamburg. Komenda-Earle, Barbara (2015): Sprachhistorische Entwicklungsprozesse der Idiomatik. An Beispielen von realhistorisch motivierten verbalen Idiomen des Deutschen. Baltmannsweiler: Schneider Verlag Hohengehren. Mieder, Wolfgang (1986): „alle redensarten und sprüchwörter sind aus den quellen zu belegen“. Sprichwörtliches im Deutschen Wörterbuch der Brüder Grimm. In: Muttersprache. Vierteljahresschrift zur deutschen Sprache 96, 33–52. Mieder, Wolfgang (2003): Grundzüge einer Geschichte des Sprichwortes und der Redensart. In: Besch, Werner/Betten, Anne/Reichmann, Oskar/Sonderegger, Stefan (Hrsg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 3. Teilband. Berlin/New York: de Gruyter, 2559–2569. Stancheva, Diana (2012): Angaben zu phraseologischen Phänomena im „Deutschen Wörterbuch“ von Jacob Grimm und Wilhelm Grimm. In: Filatkina, Natalia/Kleine-Engel, Ane/Dräger, Marcel/ Burger, Harald (Hrsg.): Aspekte der historischen Phraseologie und Phraseographie. Heidelberg: Universitätsverlag Winter, 245–262.
Ryszard Lipczuk
Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika Abstract: In this paper quotations (winged words) are researched which come from J. W. Goethe, Fr. Schiller, H. Heine, W. Busch, B. Brecht as well from other authors (e.g. Das also war des Pudels Kern!; Die Axt im Haus erspart den Zimmermann; Denk ich an Deutschland in der Nacht, dann bin ich um den Schlaf gebracht; Dieses war der erste Streich, doch der zweite kommt sogleich; Und der Haifisch, der hat Zähne). The number of them in three great dictionaries was checked: the monolingual German Duden dictionary (1999) and the German-Polish dictionaries: PONS (2007) and PWN (2010), as well the works (for Germany) of Büchmann, (for Polish) Markiewicz/Romanowski and Markiewicz. Keywords: phraseology, winged words, German lexicography, German-Polish dictionaries, Goethe, Schiller, Heine, Busch, Brecht Schlagwörter: Phraseologie, geflügelte Worte, deutsche Lexikografie, deutsch-polnische, Wörterbücher, Goethe, Schiller, Heine, Busch, Brecht
1 Zum Begriff „geflügelte Worte“ Der Terminus geflügelte Worte stammt von dem deutschen Lehrer und Philologen Georg Büchmann (1822–1884), der im Jahre 1864 ein Lexikon „Geflügelte Worte. Der Citatenschatz des Deutschen Volkes“ veröffentlichte. Das Buch erlebte viele Auflagen, neulich erschien es unter dem Titel „Der neue Büchmann“. Gemeint sind damit Worte, die „auf Flügeln das Ohr des Hörers oder das Auge des Lesers“ erreichen (vgl. Donalies 2009: 97). Es handelt sich um bekannte, viel zitierte Aussprüche, die aus literarischen oder anderen Werken stammen bzw. Äußerungen von bekannten historischen Personen sind. Ihre Herkunft kann meist eindeutig nachgewiesen werden. Eingebürgert haben sich im Deutschen Zitate, die von solchen historischen Persönlichkeiten stammen wie Martin Luther (z. B. Dem Volk aufs Maul schauen; Hier stehe ich, ich kann nicht anders), Otto von Bismarck (z. B. Eisen
Anmerkung: Der Beitrag stützt sich in großem Maße auf meine Monographie: Lipczuk, Ryszard (2018c): Geflügelte Worte in Wörterbüchern. Eine Untersuchung zur deutschen und deutsch-polnischen Lexikografie = Stettiner Beiträge zur Sprachwissenschaft. Bd. 10. Hamburg: Verlag Dr. Kovač. Ryszard Lipczuk, Universität Szczecin, [email protected] https://doi.org/10.1515/9783110716955-007
124
Ryszard Lipczuk
und Blut, Politik ist die Kunst des Möglichen) oder Friedrich der Große (z. B. In meinem Staate kann jeder nach seiner Façon leben; Kerls, wollt Ihr denn ewig leben?). Recht viele geflügelte Worte, von denen manche zugleich Sprichwörter sind, gehen auf die Bibel zurück (z. B.: Wer sucht, der findet; Viele sind berufen, aber wenige sind auserwählt; das schwarze Schaf), während Alea iacta est (Julius Cäsar), Curriculum vitae (Cicero) auf die Antike zurückgehen. In Polen erscheint der Ausdruck „skrzydlate słowa“ (eine Lehnübersetzung des deutschen Ausdrucks) – wohl zum ersten Mal – bei Piotr Chmielowski im Jahre 1895 im Buch Współcześni poeci polscy („Die zeitgenössischen polnischen Dichter“, Petersburg). Nach Chlebda (2005a: 11) wurde die polnische Bezeichnung „skrzydlate słowa“ als offizieller Terminus zum ersten Mal in einem Lexikon der literarischen Termini (hrsg. von Janusz Sławiński) im Jahre 1976 eingeführt, aber lange Zeit bis in die 90er Jahre hinein erschien es kaum in sprachwissenschaftlichen Lexika. Markiewicz/Romanowski (2005: 5) nennen darüber hinaus ein polnisches Lexikon literarischer Termini von Stanisław Sierotwiński, 3. Aufl. im Jahre 19701. Geflügelte Worte sind Zitate, aber nicht alle Zitate lassen sich den geflügelten Worten zurechnen, auch deshalb, weil die Letzteren einen begrenzten Umfang haben sollen (dazu Cieciura 2015: 86, Tarsa 1994: 88). Im Jahre 1990 erschien eine Sammlung von Zitaten mit Quellenangaben „Ungeflügelte Worte“ von Hans-Joachim Schoeps. In der Einleitung schreibt der Verfasser: „was schon im Büchmann steht, blieb daher mit wenigen Ausnahmen unberücksichtigt, da ich nur mehr oder weniger Unbekanntes aufgeschrieben habe“ (Schoeps 1990: 7). Hier ein Beispiel (nach Schoeps 1990: 15) von Wilhelm Busch: Früher, als ich unerfahren Und bescheidener war als heute, Hatten meine höchste Achtung Andere Leute
Dieses kurze Gedicht stammt zwar von einem bekannten Dichter Wilhelm Busch, seine Herkunft ist also nachweisbar, aber man kann annehmen, dass die Verse nicht allgemein bekannt sind. Das sind also ungeflügelte Worte. Zwischen den einzelnen Begriffen lassen sich keine strikten Grenzen abstecken. So können manche Sprichwörter oder Sentenzen, aber auch Aphorismen zugleich geflügelte Worte sein. Für die Letzteren soll aber gelten, dass ihre Herkunft noch erkennbar oder zu erschließen ist, dass sie von bestimmten Autoren, Politikern, aus bestimmten literarischen, wissenschaftlichen (z. B. philosophischen), musikalischen Werken, aus Filmen, aus der Werbung etc. stammen. Es wäre wohl angebracht, ihre Frequenz im öffentlichen Diskurs zu überprüfen. Die hohe Verwendungsfrequenz, sei
1 Mir ist die 4. Auflage vom Jahre 1986 bekannt. Der Verfasser des Lexikons meint hier lediglich Ausdrücke literarischer Herkunft.
Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika
125
es auch im Internet, würde ein Argument dafür sein, sie als „geflügelt“ anzusehen. Es lassen sich jedenfalls keine eindeutigen Kriterien finden, die geflügelte Worte von ungeflügelten Worten unterscheiden können. So enthalten die deutschen und auch die polnischen Sammlungen (Büchmann, Markiewicz/Romanowski), obwohl sie als „geflügelte Worte“ („skrzydlate słowa“) betitelt sind, viele Ausdrücke, die man kaum dieser Kategorie zuordnen kann. Die geflügelten Worte verstehe ich als phraseologisierte Einheiten, die von der originalen Form abweichen können, aber auch als bestimmte Zitate, die den Status der Phraseologismen, Sprichwörter o. ä. nicht aufweisen. In diesem Sinne will ich eine weite Auffassung der geflügelten Worte vertreten, anders als viele Forscher, besonders in Polen, die diese Kategorie als eine Untergruppe der Phraseologismen ansehen (z. B. Chlebda 2005a). Dagegen will ich bestimmten originalen Ausdrücken den Status der geflügelten Worte nicht absprechen, wie: Kennst du das Land, wo die Zitronen blühen; Was ist der langen Rede kurzer Sinn?; Daran erkenne ich meine Pappenheimer. Solche Ausdrücke erfüllen die Kriterien der Geflügeltheit: sie sind weitgehend bekannt, werden heute gebraucht, ihre Herkunft ist nachweisbar. Die Anhänger einer engen Auffassung würden dagegen nur solche Formen als „geflügelt“ zulassen: das Land, wo die Zitronen blühen, der langen Rede kurzer Sinn, seine Pappenheimer (er)kennen. Auch für das Polnische gibt es ähnliche Beispiele. So ist der bekannte Satz aus dem Gedicht von Julian Tuwim Stoi na stacji lokomotywa („Auf der Station steht eine Lokomotive“) sicher kein Phraseologismus, kein Sprichwort und keine Sentenz, er ist aber – auch unter weniger Gebildeten – bekannt und wird oft zitiert2. Auch bestimmte Einzelwörter werden den geflügelten Worten zugerechnet, z. B. Zeitgeist, Gretchenfrage, Wahlverwandtschaften im Deutschen oder ciemnogród (von angeblich bornierten Menschen), targowica („Verrat, Denunziation des eigenen Landes zugunsten des Feindes“) im Polnischen.
2 Einige Bemerkungen zur Forschung sowie zu Wörterbüchern und Lexika der geflügelten Worte Zu wichtigen Forschern auf dem Feld der geflügelten Worte gehört u. a. der deutschamerikanische Parömiologe Wolfgang Mieder, der seine Aufmerksamkeit auch den Zitaten von Goethe und Schiller, u.zw. in ihren sprachspielerischen Formen schenkte. Für das Polnische sind in erster Linie die Arbeiten des Slawisten aus Opole (Oppeln) Wojciech Chlebda bekannt, der sich mit theoretischen Aspekten der Geflügeltheit beschäftigte, aber auch Fallstudien zu Zitaten von bestimmten polnischen Autoren
2 Auch Fleischer (1982: 84) zählt nicht nur Langue-Einheiten, sondern auch Redeeinheiten zur Klasse der geflügelten Worte.
126
Ryszard Lipczuk
(wie Adam Mickiewicz) verfasste. Als Stettiner möchte ich auch einige Autoren aus Szczecin (Stettin) erwähnen: Jolanta Ignatowicz-Skowrońska, Barbara KomendaEarle, Ewa Komorowska, Ryszard Lipczuk, Katarzyna Sztandarska (vgl. das Literaturverzeichnis am Ende des Beitrags). Neben den Büchmann-Ausgaben und mehreren anderen Lexika (wie Bünting 2005) sei hier auch ein umfangreiches Lexikon aus der DDR-Zeit von Böttcher/Krolop/Zimmermann (1984) erwähnt. Eine umfangreiche Sammlung der geflügelten Worte in Polen stammt von Henryk Markiewicz und Andrzej Romanowski, die erste Ausgabe ihres Lexikons erschien im Jahre 1990. Interessant sind auch die Nachschlagewerke von Jerzy Bralczyk, obwohl der Autor den Terminus „skrzydlate słowa“ kaum verwendet. Von den zweisprachigen in Polen erschienen Wörterbüchern der geflügelten Worte seien hier genannt: (Tschechisch – Polnisch) Orłoś/Hornik (1996), (Russisch – Polnisch) Chlebda/Mokijenko/Szuleżkowa (2003), (Deutsch – Polnisch) Walter/Komorowska/Krzanowska et al. (2013).
3 Zur Methode der empirischen Untersuchung Da eine große Menge der geflügelten Worte aus der schönen Literatur stammt, seien hier eben solche Ausdrücke fokussiert. Ich habe versucht ausgewählte geflügelte Worte aus deutschsprachigen literarischen Texten im Hinblick auf ihre Präsenz in einigen Wörterbüchern und Lexika zu untersuchen. Als Lexika – also nicht Wörterbücher im engen Sinne – wurden von mir in erster Linie die Nachschlagewerke von (für die deutsche Sprache) Georg Büchmann (die Ausgaben von 1972 und 2016) sowie die Duden-Zitatensammlung (Dud Zit 2017) und für das Polnische Markiewicz/Romanowski (2005), Markiewicz (2012) eingestuft: als Lemmata findet man hier verschiedene Zitate, von denen nur manche zu Phraseologismen oder Sprichwörtern geworden sind. Nicht alle dort verzeichneten Zitate kann man übrigens – trotz der Betitelung – den geflügelten Worten zurechnen, weil sie oft umfangreich sind und im allgemeinen Gebrauch der deutschen bzw. polnischen Sprachgemeinschaft nicht funktionieren. Als Sprachwörterbücher dagegen wurden für meine Untersuchung das einsprachige deutsche 10bändige Duden-Wörterbuch vom Jahre 1999 sowie die zwei zur Zeit größten deutsch-polnischen Wörterbücher: Pons (2007) und PWN (2010) herangezogen. Als Lemmata erscheinen hier immer Langue-Einheiten, u. zw. Einzellexeme bzw. (seltener) phraseologische Ausdrücke. Ausgegangen wird hier davon, dass nicht nur die Lexika der geflügelten Worte (wie Büchmann oder Markiewicz/Romanowski), sondern auch allgemeine Sprachwörterbücher (weiter: Wörterbücher genannt) bestimmte Ausdrücke dieser Art berücksichtigen sollen.
Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika
127
Die Mikrostruktur der einsprachigen (aber auch in bestimmtem Maße) der zweisprachigen Wörterbücher enthält ja in der Regel verschiedenartige Kontexte. Gemeint sind nicht nur typische Wortverbindungen wie Kollokationen, sondern auch Phraseologismen, Sprichwörter, Sentenzen etc., viele von ihnen können zugleich geflügelte Worte sein. In unserem Beitrag werden zuerst geflügelte Worte von Johann Wolfgang von Goethe und Friedrich Schiller dargestellt, weiter auch solche von Heinrich Heine, Wilhelm Busch und Bertolt Brecht.
3.1 Geflügelte Worte von Johann Wolfgang Goethe und Friedrich Schiller in den Wörterbüchern In erster Linie kam es uns darauf an, ausgewählte geflügelte Worte von Johann Wolfgang Goethe und Friedrich Schiller im Hinblick auf ihre Aufnahme in die drei Sprachwörterbücher zu prüfen. Gerade von diesen beiden Koryphäen der deutschen Literatur stammt eine große Menge von mehr oder weniger bekannten Zitaten. Eine wahre Schatztruhe an Zitaten, auch geflügelten Worten erweist sich besonders das Drama „Faust“ (1808/32) von dem u. a. folgende Aussagen stammen: „Es irrt der Mensch, solang’ er strebt“, „Die Botschaft hör’ ich wohl, allein mir fehlt der Glaube“, „Hier bin ich Mensch, hier darf ich’s sein!“, „Das also war des Pudels Kern!“, „Grau, teurer Freund, ist alle Theorie“, „Nach Golde drängt, am Golde hängt doch alles“, „Das ist der Weisheit letzter Schluss“ usw. Bei der Besprechung der geflügelten Worte in den Wörterbüchern (allerdings nicht in den Lexika) wird von mir (in Anlehnung an die bestehenden Lexika) der Inhalt der einzelnen Ausdrücke kurz präsentiert.
3.1.1 Das einsprachige Duden-Wörterbuch (1999) Im Duden-Wörterbuch (1999) findet man folgende Ausdrücke (hier in alpabetischer Reihenfolge genannt), die auf Goethe zurückgehen. Aus dem Drama „Faust“ stammen: Das also war des Pudels Kern! Der Ausruf Fausts, als der ihn begleitende Pudel sich vor seinen Augen in eine menschliche Gestalt verwandelt, Mephisto tritt in Gestalt eines Scholaren hervor. Der heutige Gebrauch: Überraschung über etwas, was sich lange nicht erkennen ließ.
128
Ryszard Lipczuk
Das Ewig Weibliche zieht uns hinan Die Worte stammen vom Chorus mysticus im Hinblick auf Fausts Erlösung und in Anknüpfung an die unmittelbar vorhergehende Anrede des Doktor Marianus an die Mater gloriosa. Heute wird mit diesen Worten die Anziehungskraft der Frauen angesprochen, die die Männer zum Streben nach Höherem anspornt. Der Weisheit letzter Schluss Am Ende seines Lebens hat Faust die Vision eines paradiesischen Landes und sagt: Das ist der Weisheit letzter Schluss: /Nur der verdient sich Freiheit wie das Leben/ Der täglich sie erobern muss. Heute wird das Zitat in der Bedeutung „höchste Weisheit“ verwendet, oft auch ironisch als „Das ist noch nicht der Weisheit letzter Schluss“. Die Zeit ist kurz, die Kunst ist lang Anknüpfung an die lateinische Sentenz: Vita brevis, ars longa. In Goethes „Faust“ heißt es in der Szene „Nacht“: Ach Gott! Die Kunst ist lang, und kurz ist unser Leben. Es irrt der Mensch, solang` er strebt Die Worte Gottes, als Mephisto ihn um Erlaubnis bittet, Faust auf den schlechten Weg führen zu dürfen. Heute wird auch die abgewandelte Form gebraucht: Es irrt der Mensch, solang` er lebt, um auszudrücken, dass uns immer wieder Irrtümer unterlaufen können. Selbst ist der Mann! Die Worte richtet der Kaiser gegenüber Faust. Der Ausdruck hat heute einen sprichwörtlichen Charakter und bedeutet etwa eine Aufforderung an sich selbst oder jemand anderen: „man muss sich selbst helfen“. Nach Dud Zit (2017) gibt es heute auch die Form: „Selbst ist die Frau!“ Zwei Seelen wohnen, ach! In meiner Brust Faust diskutiert mit seinem Famulus. Während sich Wagner enthusiastisch über den Umgang mit Büchern äußert, bekennt sich Faust auch zu sinnlichen Freuden. Die Worte werden zitiert, „wenn jemand vor einer schwierigen Entscheidung steht, wenn er hin- und hergerissen ist und sich nicht entschließen kann, eine von zwei ihm akzeptabel erscheinenden, aber sehr gegensätzlichen Möglichkeiten zu wählen“ (Dud Zit 2017).
Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika
129
Goethe – andere Werke Der rote Faden Der Ausdruck stammt aus dem Roman „Die Wahlverwandtschaften“ (1809), „wo die alles verbindende Hauptidee im Tagebuch Ottiliens mit dem durchlaufenden roten Faden im Tauwerk der englischen Marine verglichen wird“ (Dud Zit 2017). Goethe prägte diese Wendung „in Kenntnis des roten Fadens, der als vor Diebstahl sichernde Kennzeichnung in die Seile der Royal Navy eingezogen war“ (Kramer 2018: 87). Die Forderung des Tages Man findet diesen Ausdruck in den „Maximen und Reflexionen“. Auf die Frage, was die Pflichten des Menschen sind, fällt die Antwort: Die Forderung des Tages. Das Zitat verweist darauf, dass sich der Mensch den Aufgaben zu stellen hat, deren Bewältigung er als Notwendigkeit erkennt. Ehernes Gesetz Der Ausdruck stammt aus dem Gedicht „Das Göttliche“: der Mensch ist den unveränderlichen Schicksalsgesetzen unterworfen, aber sein edles nützliches Tun unterscheidet ihn von anderen Wesen. Erlaubt ist, was gefällt Der begeisterte Künstler Torquato Tasso äußert diese Worte (im gleichnamigen Drama) gegenüber der Prinzessin Leonore, worauf diese antwortet: Erlaubt ist, was sich ziemt Die Prinzessin beendet ihre Ausführung mit den Worten: „Nach Freiheit strebt der Mann, das Weib nach Sitte“. Getretener Quark wird breit, nicht stark Der Ausdruck stammt aus dem „Buch der Sprüche“ in „Westöstlichem Divan“ und geht wahrscheinlich auf ein tatarisches Sprichwort zurück. „Mit dem Zitat soll ausgedrückt werden, dass etwas, dem inhaltliche Tiefe fehlt, auch durch noch so unverhältnismäßig großen Aufwand nicht auf ein höheres Niveau gebracht werden kann“ (Dud Zit 2017). Nur die Lumpe sind bescheiden, brave freuen sich der Tat Dieser Ausspruch stammt aus dem Gedicht Goethes „Rechenschaft“ (1810), das eine Art Trinklied ist und von dem mit Goethe befreundeten Komponisten Carl Friedrich Zelter vertont wurde.
130
Ryszard Lipczuk
Wo viel Licht ist, ist auch starker Schatten Diese Worte äußert die Titelgestalt in „Götz von Berlichingen“ (1773) als Reaktion auf den Wunsch einer anderen Gestalt, dass Götz viel Freude an seinem Sohn erleben möge Friedrich Schiller Daran erkenne ich meine Pappenheimer Die Redewendung „seine Pappenheimer kennen“ hat die Bedeutung „wissen, mit welchen Leuten man zu tun hat“. Sie geht auf das Lob zurück, das Wallenstein den Männern des Regiments des Grafen von Pappenheim ausspricht. Sie haben sich von ihm, anders als andere Regimente, nicht abgewendet und ihm Treue bewahrt. Dem Glücklichen schlägt keine Stunde In dem „Die Piccolomini“ (1799) überschriebenen Teil seines Wallenstein-Dramas lässt Schiller diese Worte den in seine Cousine verliebten Max Piccolomini sagen. Man gebraucht sie heute (oft scherzhaft), wenn jemand vergisst, auf die Zeit zu achten oder wenn jemand sich nicht um Termine kümmern muss. Ich sei, gewährt mir die Bitte, in eurem Bunde der Dritte Der Tyrann von Syrakus in Schillers Ballade „Die Bürgschaft“ (erschienen 1798) gerührt von der Treue beider Freunde bittet sie darum, in diesen Freundschaftsbund aufgenommen zu werden: „Ich sei, gewährt mir die Bitte, in eurem Bunde der Dritte“. Der Mohr hat seine Schuldigkeit getan, der Mohr kann gehen Das inzwischen abgewandelte Zitat (im Original steht statt Schuldigkeit das Wort Arbeit) findet sich im Trauerspiel „Die Verschwörung des Fiesco zu Genua“. Der „Mohr von Tunis“, der für Fiesco bei der Verschwörung gegen den Dogen gearbeitet hat, tritt mit diesen Worten von der Bühne ab. Das Zitat wird verwendet, um Enttäuschung auszudrücken, dass man keinen Dank für seine Arbeit bekommen hat. Der ruhende Pol Schiller verwendet diesen Ausdruck in seinem Gedicht „Der Spaziergang“, wo die Gegensätzlichkeit von Natur und Kultur durch die wechselnden Bilder eines Spaziergangs veranschaulicht wird. Heute versteht man darunter einen Menschen, der bei Unruhe die Übersicht behält und selbst Ruhe ausstrahlt.
Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika
131
Die Axt im Haus erspart den Zimmermann Mit diesem Ausspruch beschließt der Titelheld im Drama „Wilhelm Tell“ seine Arbeit am Hoftor. Das Zitat bedeutet, dass jemand, der im Umgang mit Handwerkszeug geschickt ist, Hilfe eines Fachmanns nicht braucht. Früh übt sich, was ein Meister werden will Mit diesen Worten reagiert Wilhelm Tell im gleichnamigen Schauspiel auf den Vorwurf seiner Ehefrau, dass ihre beiden Söhne sich mit einer Armbrust beschäftigen. Sein Maß ist voll Im Drama „Die Jungfrau von Orleans“ äußert diese Worte die Titelheldin, die angetreten ist, den Feind zu besiegen. Sie bedeuten: „nun reicht es, jetzt ist meine Geduld zu Ende“. (Was ist) der langen Rede kurzer Sinn? Was ist der langen Rede kurzer Sinn? – diese rhetorische Frage stellt der kaiserliche Kriegsrat an den Chef des Dragonenregiments Butler, der zuvor eine Lobeshymne auf Wallenstein geäußert hat („Die Piccolomini“ als Teil der Wallenstein-Trilogie).
3.1.2 Goethe- und Schillerzitate in Pons (2007) und PWN (2010) In den beiden deutsch-polnischen Wörterbüchern wurden insgesamt 19 Zitate gefunden, u. zw.: Pons (2007) und PWN (2010) Neun geflügelte Worte sind in den beiden dt.-poln. Wörterbüchern, d. h. sowohl in PONS (2007) als auch im PWN-Wörterbuch (2010) verzeichnet worden, manchmal in einer verkürzten Form, und immer ohne Quellenangabe, z. B. seine Pappenheimer kennen („wissen, mit wem man zu tun hat“) statt: Daran erkenne ich meine Pappenheimer. Sie werden als Kontexte in deren Mikrostruktur angeführt. Darunter befinden sich drei Ausdrücke, die von Goethe und sechs, die von Schiller stammen. Nach den deutschen Ausdrücken nennen wir die in PONS und PWN genannten polnischen Äquivalente. Zusätzlich werden die in Markiewicz/Romanowski (2005) verzeichneten polnischen Entsprechungen angeführt (Abkürzung: M). Man findet hier auch eine Information, wenn der entsprechende Ausdruck im Duden-Wörterbuch fehlt (Abkürzung: nicht D).
132
Ryszard Lipczuk
(Das ist – PONS) der Weisheit letzter Schluss ([to jest] szczyt mądrości) Kommentar: Das polnische Äquivalent kann man nicht als adäquat bezeichnen: es lässt sich nur dann vorstellen, wenn der deutsche Satz negiert ist, etwa: das ist nicht der Weisheit letzter Schluss – to nie jest szczyt mądrości. Sonst ist als polnische Übersetzung möglicherweise der Satz: to jest największa mądrość akzeptierbar. der rote Faden (Pons: myśl przewodnia, motyw przewodni, PWN: motyw przewodni, lejtmotyw książk) M – czerwona nić Kommentar: Die Äquivalente in den beiden bilingualen Wörterbüchern scheinen annehmbar zu sein, im Gegensatz zum unverständlichen czerwona nić bei Markiewicz/Romanowski. Wo viel Licht ist, ist auch starker Schatten (Pons: prov nie ma światła bez cienia, PWN przysł każdy kij ma dwa końce) Kommentar: Das letztgenannte Äquivalent każdy kij ma dwa końce hat eher umgangssprachlichen Charakter und passt nicht an dieser Stelle. seine Pappenheimer kennen (fam/pot wiedzieć, z kim się ma do czynienia) M – Daran erkenne ich meine Pappenheimer – Po tym poznaję moich Pappenheimerów Kommentar: Auch hier sind die Äquivalente in den beiden bilingualen Wörterbüchern angemessen, während der polnische Satz in Markiewicz/Romanowski als eine wortwörtliche Wiedergabe des deutschen Satzes wohl gar nicht gebräuchlich ist. Seine Uhr ist abgelaufen (Pons: geh jego czas minął), jmds Uhr ist abgelaufen (PWN: wybiła czyjaś ostatnia godzina) nicht D: Diese Worte äußert Wilhelm Tell im gleichnamigen Drama gegenüber dem tyrannischen Reichsvogt Geßler, als er den Entschluss fasst, ihn zu ermorden. Der Mohr hat seine Schuldigkeit getan, der Mohr kann gehen (murzyn zrobił swoje, murzyn może odejść prov/przysł). der ruhende Pol (Pons: oaza spokoju), jmd ist der ruhende Pol (PWN: ktoś jest uosobieniem spokoju) Kommentar: Das Pons-Äquivalent oaza spokoju (Oase der Ruhe) scheint hier nicht angebracht zu sein. das Maß ist voll (miarka się przebrała) nicht D (Was ist) der langen Rede kurzer Sinn (krótko mówiąc) M – Jakiż jest krótki sens tej długiej mowy?
Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika
133
Kommentar: Diesmal scheint die Übersetzung in Markiewicz/Romanowski richtiger zu sein, aber auch die lakonische Partizipialphrase krótko mówiąc kann man nicht als falsch bezeichnen. Nur in PONS (aber nicht in PWN) sind verzeichnet: Selbst ist der Mann/die Frau (trzeba umieć sobie samemu radzić) Das ist des Pudels Kern (to jest sedno sprawy) Die Axt im Haus erspart den Zimmermann (prov kto sam potrafi posługiwać się narzędziami, nie musi zatrudniać fachowca) Früh übt sich, was ein Meister werden will (prov kto chce zostać mistrzem, musi wcześnie zacząć ćwiczyć) (das ewig Gestrige) Ewiggestrige(r) (osoba o wstecznych poglądach, o. zacofana) nicht D: Es sind die Worte Wallensteins (aus dem gleichnamigen Drama Schillers), als er sich Gedanken macht, ob er den Kaiser verlassen soll. „Das ewig Gestrige“ ist es, was ihn an schneller Entscheidung hindert. Heute versteht man darunter „die alltäglichen, festen Gewohnheiten und Vorstellungen, an denen die Menschen oft festhalten“ (Dud Zit 2017). Und als Ewiggestrigen bezeichnet man jemanden, der für rückständig und unfähig, sich neuen Gedanken zu öffnen, gehalten wird. Nur im PWN-Wörterbuch: Erlaubt ist, was gefällt (wszystkie chwyty dozwolone pot) das Land, wo die Zitronen blühen (von Italien) (kraj, gdzie cytryna dojrzewa) nicht D: Mit dem Vers „Kennst du das Land, wo die Zitronen blühen?“ beginnt das berühmte Lied der Mignon in Goethes Roman „Wilhelm Meisters Lehrjahre“. Das geheimnisvolle Mädchen Mignon drückt sein Verlangen nach seiner Heimat Italien aus. Erich Kästner (1899–1974) hat diesen Vers im Jahre 1928 abgewandelt zu: Kennst du das Land, wo die Kanonen blühen?, wobei er damit Deutschland meinte. Der Worte sind genug gewechselt (, lasst mich auch endlich Taten sehen) (wystarczy słów, niech przemówią czyny) nicht D: Diese Worte äußert der Theaterdirektor (im Drama „Faust“) in einem Gespräch mit dem Theaterdichter. Bei Dichtungen für das Theater komme es in erster Linie auf die Publikumswirksamkeit an. Heute wird das Zitat als Aufforderung verwendet, lange Reden zu unterlassen und lieber entschlossen zu handeln. der Dritte im Bunde sein (być trzecim uczestnikiem): Das polnische Äquivalent scheint nicht überzeugend zu sein. Besser wären möglicherweise: dołączyć do kogoś, dołączyć do czyjegoś grona
134
Ryszard Lipczuk
Ernst ist das Leben, heiter die Kunst (życie jest poważne, sztuka jest radosna) nicht D: Dieser klassische Spruch stammt aus Schillers Trilogie „Wallenstein“ („Wallensteins Lager“). Er wird in Zusammenhängen zitiert, in denen von hohen Aufgaben der Kunst gesprochen wird.
3.1.3 Zusammenfassendes Viele von den bekannten Goethe- und Schillerzitaten sind im Duden-Großwörterbuch zu finden: von den 100 untersuchten Ausdrücken sind immerhin 24 (24% der untersuchten geflügelten Worte) in diesem 10-bändigen Nachschlagewerk präsent. Trotzdem ist dieses Ergebnis nicht unbedingt zufriedenstellend. Von dem größten Wörterbuch der deutschen Gegenwartssprache könnte man schon erwarten, dass die – oft sehr bekannten – Goethe- oder Schillerzitate in noch größerem Grade berücksichtigt werden, u. zw. als Kontexte in der Mikrostruktur. Das Duden-Wörterbuch hat ja auch einen Dokumentationswert, es verzeichnet viele Zitate (die nicht immer „geflügelt“ sind) aus verschiedenen Quellen, nicht nur aus literarischen Texten. Im Duden-Wörterbuch fehlen u. a.: von Goethe: Allein der Vortrag macht des Redners Glück; Bewundert viel und viel gescholten; Das eigentliche Studium der Menschheit ist der Mensch; Die Botschaft höre ich wohl, allein mir fehlt der Glaube; Die Tat ist alles, nichts der Ruhm; Edel sei der Mensch, hilfreich und gut; Im Deutschen lügt man, wenn man höflich ist; In der Beschränkung zeigt sich der Meister; Mehr Licht!; Mein geliebtes Deutsch; Meine Ruh ist hin, mein Herz ist schwer; Verweile doch, du bist so schön! Von Schiller vermisst man u. a.: Allzu straff gespannt, zerspringt der Bogen; Der brave Mann denkt an sich selbst zuletzt; Ernst ist das Leben, heiter die Kunst; Freude, schöner Götterfunken; Seid umschlungen, Millionen! In Bezug auf die beiden bilingualen Wörterbücher kann man dagegen sagen, dass die Anzahl der verzeichneten Zitate (in originaler bzw. modifizierter Form) recht zufriedenstellend ist. Interessant ist, dass die umfangreichen polnischen Lexika der Zitate und geflügelter Worte (Markiewicz/Romanowski 2005 und Markiewicz 2012) recht viele Zitate von Goethe und Schiller enthalten. Das polnische Lexikon von Markiewicz/ Romanowski (2005) verzeichnet immerhin 123 Zitate von Goethe und 16 von Schiller. Für die meisten werden auch polnische Übersetzungen genannt, wobei man nicht alle Äquivalente als gelungen bezeichnen kann.
Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika
135
3.2 Geflügelte Worte von Heinrich Heine, Wilhelm Busch, Bertolt Brecht Auch von anderen deutschsprachigen Schriftstellern und Dichtern stammen viele bekannte Zitate, von denen manche zu Phraseologismen oder Sprichwörtern geworden sind. Hier seien drei Autoren genannt, von denen mehrere wichtige Zitate stammen: Heinrich Heine, Wilhelm Busch und Bertolt Brecht. So findet man im Büchmann-Lexikon von 2016 folgende Ausdrücke (in Klammern die Erscheinungszeit): Heinrich Heine: Was schert mich Weib, was schert mich Kind! (1822); Mensch, bezahle deine Schulden (1825); Dort, wo man Bücher verbrennt, verbrennt man am Ende Menschen (1821); Auf Flügeln des Gesanges (1822); Ich weiß nicht, was soll es bedeuten, dass ich so traurig bin. Ein Märchen aus alten Zeiten, das kommt mir nicht aus dem Sinn (1823); Kein Talent, doch ein Charakter (1843); Denk ich an Deutschland in der Nacht, dann bin ich um den Schlaf gebracht (1843); Ich hatte einst ein schönes Vaterland (1844) usw. (insgesamt 35 Ausdrücke). Wilhelm Busch: Zwei Knaben, jung und heiter; Drei Wochen war der Frosch so krank, Jetzt raucht er wieder, Gott sei Dank!; Die bösen Buben von Korinth; Diogenes der Weise aber kroch ins Fass und sprach: ja, ja, das kommt von das!; Max und Moritz (1865); Dieses war der erste Streich, doch der zweite kommt sogleich (1865); Der Vogel, scheint mir, hat Humor (1874) (insgesamt 26 Ausdrücke). Bertolt Brecht: Nur wer im Wohlstand lebt, lebt angenehm (1928); Und man siehet die im Lichte Die im Dunkeln sieht man nicht (1930); Und weil der Mensch ein Mensch ist Drum will er was zu essen, bitte sehr! (1934) u. a. Sowohl in Büchmann (2016) als auch im polnischen Lexikon Markiewicz/Romanowski (2005) sind u. a. zu finden: Und der Haifisch, der hat Zähne (1928), Doch die Verhältnisse, sie sind nicht so! (1928), Erst kommt das Fressen, dann kommt die Moral (1928); Verehrtes Publikum, los, such dir selbst den Schluss! Es muss ein guter da sein, muss, muss, muss(1943). Es zeigte sich, dass manche bekannten Zitate dieser Autoren in keinem der untersuchten Nachschlagewerke verzeichnet sind. Keine dieser Zitate von Heine, Busch und Brecht wurden in den untersuchten Sprachwörterbüchern (Duden 1999, Pons 2007, PWN 2010) gefunden, obwohl es manche von ihnen sicher „verdient“ haben, aufgenommen zu werden, z. B.: Ich weiß nicht, was soll es bedeuten, dass ich so traurig bin. Ein Märchen aus alten Zeiten, das kommt mir nicht aus dem Sinn (Heine); Dieses war der erste Streich, doch der zweite kommt sogleich (Busch); Und der Haifisch, der hat Zähne; Doch die Verhältnisse, sie sind nicht so!; Erst kommt das Fressen, dann kommt die Moral (Brecht). Die drei letzteren Brecht-Zitate sind übrigens im polnischen Lexikon von Markiewicz/Romanowski verzeichnet.
136
Ryszard Lipczuk
3.3 Titel literarischer Werke Obwohl man auch manche Titel von literarischen Werken als geflügelte Worte oder als Phraseologismen betrachten kann, kommen sie in den von uns untersuchten lexikografischen Arbeiten nur selten oder überhaupt nicht vor. Greift man auf deutschsprachige Gegenwartsautoren, so ist festzustellen, dass die Titelnamen zwar (allerdings sehr selten) in den entsprechenden Lexika auftreten, vor allem im Lexikon „Zitate und Aussprüche“ (Dud Zit 2017) und in Büchmann (2016), aber kaum in der Mikro- oder Makrostruktur des großen Duden-Wörterbuchs (1999) und in den beiden deutschpolnischen Wörterbüchern: Pons (2007) und PWN (2010) zu finden sind. Die meisten Einträge in den Lexika betreffen die Werke von Max Frisch: Nun singen sie wieder (1945), Biedermann und die Brandstifter (1953), Homo Faber (1957), Mein Name sei Gantenbein (1964) und Heinrich Böll: Wo warst du Adam? (1951), Und sagte kein einziges Wort (1953), Das Brot der frühen Jahre (1955), (Doktor Murkes) gesammeltes Schweigen (1958), Gruppenbild mit Dame (1971).
3.4 Zusammenfassung Mehrere geflügelte Worte von Goethe und Schiller haben in das größte deutsche Wörterbuch und – selbstverständlich in geringerem Maße – in die Mikrostruktur der deutsch-polnischen Großwörterbücher – Eingang gefunden, wobei viele von den wichtigen Zitaten dort fehlen. Bekannte Aussprüche von anderen Autoren wie Heine, Busch, Brecht sind zwar in den Büchmann-Lexika und in Duden-Zitatenlexika verzeichnet, sie fehlen aber in allen drei Sprachwörterbüchern. Interessanterweise findet man recht viele geflügelte Worte, die auf deutsche Dichter und Schriftsteller zurückgehen, in den polnischen Lexika von Markiewicz/ Romanowski und Markiewicz. Für die meisten werden auch polnische Äquivalente angeführt, wobei man nicht alle Übersetzungen als adäquat bezeichnen kann. Die Übersetzungsprobleme resultieren aus dem spezifischen kulturellen Hintergrund des gegebenen Zitats oder aus einem einzelsprachspezifischen Wortspiel. Sehr selten sind in den Wörterbüchern bekannte Titel literarischer Werke zu finden, die meisten fehlen auch in den untersuchten Lexika. Das 10-bändige Duden-Wörterbuch vom Jahre 1999 enthält zwar in seiner Mikrostruktur viele Belege, allerdings findet man dort recht selten typische geflügelte Worte, darunter solche, die aus der deutschsprachigen belletristischen Literatur stammen. So erlaube ich es mir hier ein Desiderat zu stellen, die geflügelten Worte literarischer Herkunft noch häufiger in einsprachige deutsche Wörterbücher, und wo möglich auch in deutsch-polnische Wörterbücher aufzunehmen.
Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika
137
Literaturverzeichnis Wörterbücher und Lexika Böttcher, Kurt/Berger, Karl Heinz/Krolop, Kurt/Zimmermann, Christa (1984): Geflügelte Worte. Zitate, Sentenzen und Begriffe in ihrem geschichtlichen Zusammenhang. Leipzig: VEB Bibliographisches Institut. Bralczyk, Jerzy (2006): Polak potrafi. Przysłowia, hasła i inne polskie zdania osobne. Warszawa: Świat Książki. Bralczyk, Jerzy (2015): 500 zdań polskich. Warszawa: Agora. Büchmann, Georg (1972): Geflügelte Worte. Der Zitatenschatz des deutschen Volkes. 32. Aufl. Berlin: Haude & Spenersche Verlagsbuchhandlung. Büchmann, Georg (2007): Der neue Büchmann. Geflügelte Worte. Der klassische Zitatenschatz bearb. und aktualisiert von Winfried Hofmann. 43. Aufl. München: Ullstein (1. Taschenausg.). Bünting, Karl-Dieter (2005): Lexikon der Zitate und Redensarten. Königswinter: Tandem Verlag. Chlebda, Wojciech/Mokijenko, Walerij M./Szuleżkowa, Swetlana G. (2003): Rosyjsko-polski słownik skrzydlatych słów. Łask: Oficyna Wydawnicza LEKSEM. Der neue Büchmann (2016). Geflügelte Worte. Der klassische Zitatenschatz bearb. und aktualisiert von Winfried Hofmann. 5. unveränd. Taschenausg. München: Ullstein. D – Duden (1999). Das große Wörterbuch der deutschen Sprache in zehn Bänden. Mannheim: Dudenverlag. Dud Zit (2017). Duden. Zitate und Aussprüche. Herkunft, Bedeutung und aktueller Gebrauch 7500 Zitate von der klassischen Antike bis heute. 4. überarb. u. erweit. Aufl. Berlin: Dudenverlag. M – Markiewicz, Henryk/Romanowski, Andrzej (2005): Skrzydlate słowa. Wielki słownik cytatów polskich i obcych. Wyd. nowe poprawione i znacznie rozszerzone. Kraków: Wydawnictwo Literackie. Markiewicz, Henryk, et al. (2012): Skrzydlate słowa. Wielki słownik cytatów polskich i obcych 2. Kraków: Wydawnictwo Literackie. Orłoś, Teresa Zofia/Hornik, Joanna (1996): Czesko-polski słownik skrzydlatych słów. Kraków: Universitas. Pons (2007): Wielki słownik niemiecko-polski. Poznań: Klett. PWN (2010): Wielki słownik niemiecko-polski. Großwörterbuch Deutsch-Polnisch. Warszawa: PWN. Sierotwiński, Stanisław (1986): Słownik terminów literackich. 4. Aufl. Wrocław et al.: Zakład Narodowy im. Ossolińskich. Walter, Harry/Komorowska, Ewa/Krzanowska, Agnieszka, et al. (2013): Deutsch-polnisches Wörterbuch der geflügelten Worte. In 80 geflügelten Worten rund um die Welt. Niemieckopolski słownik skrzydlatych słów, czyli w 80 skrzydlatych słów dookoła świata. Szczecin/ Greifswald: Zapol.
Sekundärliteratur Chlebda, Wojciech (2005a): Szkice o skrzydlatych słowach. Interpretacje lingwistyczne. Opole: Wydawnictwo Uniwersytetu Opolskiego. Chlebda, Wojciech (2005b): O roku ów! . . . Mały mickiewiczowski raport skrzydlatologiczny. In: Poradnik Językowy 10, 28–42. Chlebda, Wojciech (2007): Ala ma kota w krainie czarów. In: Chlebda, Wojciech (Hrsg.): Frazeologia a językowy obraz świata przełomu wieków. Opole: Wydawnictwo Uniwersytetu Opolskiego, 325–330.
138
Ryszard Lipczuk
Cieciura, Piotr (2015): Skrzydlate słowa w tekstach czeskiej reklamy. In: Problemy frazeologii europejskiej X. Łask: Oficyna Wydawnicza LEKSEM, 85–97. Online: http://pfe.leksem.pl/ wp-content/uploads/Cieciura.pdf (letzter Zugriff: 6.04.2017). Donalies, Elke (2009): Basiswissen. Deutsche Phraseologie. Tübingen/Basel: A. Francke Verlag. Fleischer, Wolfgang (1982): Phraseologie der deutschen Gegenwartssprache. Leipzig: Bibliographisches Institut. Ignatowicz-Skowrońska, Jolanta (2015): Skrzydlate słowa Juliana Tuwima. In: Studia Językoznawcze. Synchroniczne i diachroniczne aspekty polszczyzny. 14, 225–248. Ignatowicz-Skowrońska Jolanta (2017): O kilku skrzydlatych słowach Henryka Sienkiewicza. In: Studia Językoznawcze: synchroniczne i diachroniczne aspekty badań polszczyzny. 16, 97–106. Komenda-Earle, Barbara (2015): Sprachhistorische Entwicklungsprozesse der Idiomatik. An Beispielen von realhistorisch motivierten verbalen Idiomen des Deutschen. Baltmannsweiler/ Hohengehren: Schneider Verlag. Komenda-Earle, Barbara (2018): Geflügelte Worte in der Übersetzung und im Wörterbuch. Mit exemplarischen Lemma-Entwürfen für das Sprachenpaar Polnisch-Deutsch. In: Nerlicki, Krzysztof/Komenda-Earle, Barbara/Sztandarska, Katarzyna (Hrsg.): Texte und Wörterbücher. Translatorische, lexikalische und glottodidaktische Aspekte. Hamburg: Verlag Dr. Kovač, 89–108. Komorowska, Ewa (2011): Das deutsch-polnische Wörterbuch der biblischen Phraseologie mit historisch-etymologischen Kommentaren – ausgewählte Probleme. In: Lipczuk, Ryszard/ Lisiecka-Czop, Magdalena/Misiek, Dorota (Hrsg.): Phraseologismen in deutsch-polnischen und polnisch-deutschen Wörterbüchern. Theoretische und praktische Aspekte der Phraseologie und Lexikographie. Hamburg: Verlag Dr. Kovač, 217–225. Kramer, Undine (2018): Maritimer Wortschatz in allgemeinen einsprachigen Wörterbüchern des Deutschen und im individualsprachlichen Goethe-Wörterbuch. In: Lisiecka-Czop, Magdalena/ Sztandarska, Katarzyna/Utermöhlen, Bernd (Hrsg.): Sprachen in fach- und berufsbezogenen Kontexten. Theoretische und praktische Überlegungen. Hamburg: Verlag Dr. Kovač, 73–90. Lipczuk, Ryszard (2018a): Geflügelte Worte in ein- und zweisprachigen Wörterbüchern. In: Gondek, Anna/Jurasz, Alina/Szczęk, Joanna (Hrsg.): Einblicke und Rückblicke: Beiträge zur deutschen Phraseologie und Parömiologie aus intra- und interlingualer Sicht. Bd. II. Hohengehren: Schneider Verlag, 23–37 Lipczuk, Ryszard (2018b): Titel literarischer Werke als geflügelte Worte in ein- und zweisprachigen Wörterbüchern. In: Lisiecka-Czop, Magdalena/Sztandarska, Katarzyna/Utermöhlen, Bernd (Hrsg.): Sprachen in fach- und berufsbezogenen Kontexten. Theoretische und praktische Überlegungen. Hamburg: Verlag Dr. Kovač, 179–193. Lipczuk, Ryszard unter Mitarbeit von Katarzyna Sztandarska (2018c): Geflügelte Worte in Wörterbüchern. Eine Untersuchung zur deutschen und deutsch-polnischen Lexikografie. Hamburg: Verlag Dr. Kovač. Mieder, Wolfgang (1983): „Nach Zitaten drängt, am Zitate hängt doch alles!“ Zur modernen Verwendung von Goethe-Zitaten. In: Mieder, Wolfgang (Hrsg.): Deutsche Sprichwörter in Literatur, Politik, Presse und Werbung. Hamburg: Buske, 158–180. Mieder, Wolfgang (1995): Sprichwörtliches und Geflügeltes. Sprachstudien von Martin Luther bis Karl Marx. Bochum: Universitätsverlag Dr. N. Brockmeyer. Mieder, Wolfgang (2009): „Geben Sie Zitatenfreiheit!“ Friedrich Schillers gestutzte Worte in Literatur, Medien und Karikaturen. Wien: Praesens Verlag. Mieder, Wolfgang (2011): „Wie anders wirkt dies Zitat auf mich ein!“. Johann Wolfgang von Goethes entflügelte Worte in Literatur, Medien und Karikaturen (anhand von: http://www.praesens.at/ praesens2013/?p=2007, letzter Zugriff: 5.05.2018)
Deutsche geflügelte Worte literarischer Provenienz in Wörterbüchern und Lexika
139
Schoeps, Hans-Joachim (1990): Ungeflügelte Worte. Was nicht im Büchmann stehen kann, erweit. u. überarb. Neuaufl. Mit einem Nachwort von Julius H. Schoeps. Stuttgart/Bonn: Burg Verlag. Sztandarska, Katarzyna (2011): Phraseologismen im Verdeutschungswörterbuch von Eduard Engel. In: Lipczuk, Ryszard/Lisiecka-Czop, Magdalena/Misiek, Dorota (Hrsg.): Phraseologismen in deutsch-polnischen und polnisch-deutschen Wörterbüchern. Theoretische und praktische Aspekte der Phraseologie und Lexikographie. Hamburg: Verlag Dr. Kovač, 281–288. Tarsa, Jadwiga (1994): O definicji skrzydlatych słów. In: Filologia rosyjska 33. Księga pamiątkowa ku czci Profesora Zdzisława Kempfa. Opole: Wydawnictwo Uniwersytetu Opolskiego, 84–88.
Meike Meliss
Informationsspektrum und Angabeklassen in der lexikografischen Ressource zum gesprochenen Deutsch: LeGeDe Abstract: The main aim of this contribution is to present the range of lexicographic information from LeGeDe, an electronic prototype for lexical and interactional features of spoken German. The focus lies on the detailed description of the different lexicographical information classes using illustrative examples and figures from the resource. In addition to highlighting the lexicographic microstructure and providing an overview of the outer texts and the multimedia information offer, the contribution also presents detailed background data on the conception of the LeGeDe resource. Innovative aspects and possible applications are outlined and forwardlooking desiderata are offered. Keywords: online lexicography, spoken German in interaction, corpus linguistics, microstructure, lexicographic information classes Schlagwörter: Onlinelexikografie, Lexik des gesprochenen Deutsch in der Interaktion, Korpuslinguistik, Mikrostruktur, lexikografische Angabeklassen
1 Einleitung Die LeGeDe-Ressource versteht sich als Prototyp für die lexikografische Darstellung der Besonderheiten des standardnahen, gemeinsprachlich gesprochenen Deutsch in der Interaktion, so wie es in natürlichen Gesprächen im privaten und institutionellen Kontext genutzt wird1. Die Entwicklung dieses multimedialen Prototypen bietet erstmals die Möglichkeit der lexikografischen Sprachdokumentation korpusbasierter lexikalischer Besonderheiten des gesprochenen standardnahen Deutsch und spricht als mögliche Zielgruppen primär Gesprächsforschende, LexikologInnen, SprachwissenschaftlerInnen und Sprachlehrende an2.
1 Der vorliegende lexikografische Prototyp wurde in dem Forschungsprojekt „Lexik des gesprochenen Deutsch“ (=LeGeDe) zwischen 2016 und 2019 am Leibniz-Institut für Deutsche Sprache in Mannheim konzipiert und erstellt. Die Autorin war in der besagten Zeit am IDS Koleiterin des Projekts. 2 In Ergänzung zu den konzeptionellen Arbeiten im LeGeDe-Projekt wurden auch verschiedene Arten von empirischen Studien zu Erwartungshaltungen an eine neuartige lexikografische Ressource zu Besonderheiten der gesprochensprachlichen Lexik durchgeführt. Viele der Ergebnisse Meike Meliss, Universität Santiago de Compostela, Spanien, [email protected] https://doi.org/10.1515/9783110716955-008
142
Meike Meliss
Sowohl aus der Sicht der Gesprächsforschung als auch aus lexikologischer Perspektive war es notwendig, eine neuartige Form der lexikografischen Sprachbeschreibung und –darbietung zu entwickeln, für die bislang kaum Vorbilder existierten. Für die Erfüllung der Projektziele mussten daher im Laufe der Projektzeit innovative lexikografische Beschreibungsformate für stark kontextualisierte lexikalische Daten in audioelektronischer Form, ebenso wie neuartige lexikografische Angabetypen, die auf die Funktion lexikalischer Einheiten in interaktionalen Kontexten Bezug nehmen, entwickelt werden. Für die erstellten Wörterbuchartikel wurde somit sowohl für die formale als auch für die inhaltliche und interaktional-funktionale Ebene ein umfangreiches Spektrum von Angabeklassen als Artikelsegmente eingesetzt (Engelberg/Lemnitzer 2009: 156 ff., Wiegand 1989b: 427). Seit September 2019 kann die LeGeDe-Ressource öffentlich frei konsultiert werden3 und zeichnet sich u. a. durch folgende Merkmale aus (vgl. Engelberg/Lemnitzer 2009, Engelberg/Storrer 2016): – elektronisch/digital, internetbasiert – neu konzipiert – Ausbauwörterbuch: dynamisch – nicht automatisch sondern redaktionell ausgearbeitetes Informationsangebot – ohne Nutzerbeteiligung – einsprachig – gegenwartssprachlich/standardsprachlich – medial: gesprochen/interaktional – korpusbasiert – multimedial – multimodular – semasiologisch: form-bedeutungs-/funktionsorientiert – mit internem und externem Verlinkungsangebot Ziel des vorliegenden Beitrages ist es, die einzelnen Angaben als lexikografische Artikelsegmente detailliert zu beschreiben und damit hauptsächlich die lexikografische Mikrostruktur der elektronischen LeGeDe-Ressource vorzustellen (Engelberg/ Lemnitzer 2009: 166 ff., Wiegand 1989a, 1989b). So befassen sich daher Abschnitt 2 zunächst mit der Präsentation des LeGeDe-Projekts und Abschnitt 3 mit der ausführlichen Information zu der Konzeption der LeGeDe-Ressource. Abschnitt 4 präsentiert das Informationsspektrum der Ressource mit illustrativen Beispielen und
konnten in dem lexikografischen Prozess berücksichtigt und in der Ressource entsprechend umgesetzt werden (vgl. Meliss/Möhrs/Ribeiro Silveira 2018b, 2019a). 3 Die LeGeDe-Ressource ist in das IDS-Portal OWIDplus eingebettet und kann unter www.owid.de/ legede/ konsultiert werden.
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
143
Abbildungen. Abschließend werden die innovativen Aspekte und Anwendungsmöglichkeiten skizziert und ausblickende Desiderata angeboten.
2 Das LeGeDe-Projekt Das LeGeDe-Projekt basiert auf folgenden Hauptannahmen und Beobachtungen, die kurz dargestellt werden. Einerseits existieren Unterschiede auf verschiedenen sprachlichen Ebenen zwischen dem gesprochenen im Vergleich zum geschriebenen Deutsch. Die Divergenzen bezüglich der Lexik können sich sowohl im Bestand als auch in Verbindung mit deren Form, Bedeutung und Verwendung manifestieren (vgl. Deppermann/Proske/Zeschel Hrsg. 2017, Fiehler 2016, Imo 2007, Schwitalla 2012). Obwohl eine Vielzahl von interaktionslinguistischen Einzelstudien vorliegen, steckt die korpusbasierte Lexikografie des Gesprochenen jedoch noch in den Kinderschuhen (Meliss 2016: 195; Eichinger 2017: 283). Sowohl die Ergebnisse der besagten projektbezogenen Umfragen zu den Erwartungshaltungen an eine lexikografische Ressource für Spezifika des gesprochenen Deutsch (vgl. Meliss/Möhrs/Ribeiro Silveira 2018b, 2019a) als auch entsprechende stichprobenhaft durchgeführte lexikografische Untersuchungen bestätigen, dass die lexikografische Kodifizierung der Merkmale der gesprochenen Sprache in der Interaktion in den aktuellen Wörterbüchern bisher nicht zufriedenstellend berücksichtigt wird (vgl. Meliss 2016, 2021, Meliss/Möhrs 2017, 2018, 2019, 2020, Moon 1998, Siepmann 2015, Trap-Jensen 2004)4. Trotz einiger jüngster Fortschritte in der Erstellung von gesprochensprachlichen Korpora zu verschiedenen Sprachen und Sprachvarietäten (vgl. Barcala et al. 2018, Fandrych/Meißner/Slavcheva Hrsg. 2014, Fandrych/Meißner/Wallner Hrsg. 2017, Schmidt 2014a, 2014b, 2017, Verdonik/Sepesy Maučec 2017) sind die Erfahrungen mit ihrer Nutzung in der Lexikografie bis jetzt eher selten. Daher kann sich die LeGeDe-Ressource kaum auf bestehende Modelle stützen, die z. B. der Erstellung einer geeigneten Stichwortliste oder der multimedialen Darstellung als Orientierungshilfe hätte dienen können. Es ist aber andererseits auch zu beobachten, dass der Informationsbedarf zu Inhalt, Form und Funktion typisch gesprochensprachlicher Lexik in den letzten Jahren allgemein und in unterschiedlichen Anwendungsbereichen, wie z. B. in Unterricht und Lehre (speziell im Sekundarbereich und in den Bereichen Deutsch als Fremd- und/oder Zweitsprache) sowie im Verlagswesen in Verbindung mit der Erstellung von geeigneten Unterrichtsmaterialien gestiegen ist (vgl. Handwerker/Bäuerle/Sieberg Hrsg. 2016, Imo/Moraldo Hrsg. 2015, Moraldo/Missaglia Hrsg. 2013, Reeg/Gallo/Moraldo Hrsg. 2012, Sieberg 2013). So wird z. B. im „Gemeinsamen europäischen Referenzrahmen für
4 Lediglich zum Dänischen kann hier ein kleines lexikografisches Projekt zu Interjektionen genannt werden (Hansen/Hansen 2012).
144
Meike Meliss
Sprachen“ (=GeR) zum Beurteilungsraster zur mündlichen Kommunikation und dem Parameter „Interaktion“ u. a. für Niveau C1 explizit darauf hingewiesen, dass der Lernende „[. . .] aus einem ohne weiteres verfügbaren Repertoire von Diskursmitteln eine geeignete Wendung auswählen [kann], um seine/ihre Äußerung angemessen einzuleiten, wenn er/sie das Wort ergreifen oder behalten will, oder um die eigenen Beiträge geschickt mit denen anderer Personen zu verbinden“ (Trim/North/ Coste 2001: 37). Sowohl Meliss/Möhrs (2018: 81 ff.) als auch Fandrych/Meißner/Wallner (2018: 3 ff.) weisen darauf hin, dass Korpora der gesprochenen Sprache von großem Interesse für viele Forschungs- und Anwendungsszenarien sind und gewinnbringend für die Sprachdidaktik eingesetzt werden können, wenn den Lehrenden und Lernenden ein benutzergerechter Zugang zu dem Material angeboten wird. Schließlich zeigen auch die Ergebnisse der im LeGeDe-Projekt durchgeführten Studien zu den Erwartungen künftiger NutzerInnen an die Ressource, dass sowohl bei den L1- als auch bei den L2-Sprechenden des Deutschen zu jeweils über 70 % Bedarf an einem WB zu Spezifika des gesprochenen Deutsch vorhanden ist (Meliss/Möhrs/Ribeiro Silveira 2018b: 124 f.). Diese Beobachtung bestätigt die grundsätzliche Annahme zum ansteigenden Bedarf an einer Ressource zu Spezifika des Gesprochenen sowohl in der Forschung als auch in der Lehre. Das Hauptziel des LeGeDe-Projekts ist die Erstellung einer korpusbasierten elektronischen Ressource des gesprochenen Deutsch auf der Grundlage von korpusbasierten Untersuchungen zu den Besonderheiten von mündlichem Sprachgebrauch in der Interaktion im Bereich des Lexikons5. Die besagten Annahmen sind Ausgangspunkte für die konzeptionellen Überlegungen zur Entwicklung der Ressource im LeGeDe-Projekt, für die quantitative und qualitative Methoden miteinander verknüpft wurden. Auf diese Weise konnten die Spezifika gesprochensprachlicher Lexik des Deutschen auf der Datengrundlage des am Leibniz-Institut für Deutsche Sprache erstellten Forschungs- und Lehrkorpus Gesprochenes Deutsch (=FOLK)6 (Schmidt 2014a, 2014b, 2017) analysiert und für die lexikografische Anwendung aufbereitet werden. Folgende zentrale theoretische, methodologische und anwendungsorientierte Aspekte haben sich bei der Beschäftigung mit dem Thema in der Projektarbeit ergeben:
5 Es handelt sich um ein Drittmittelprojekt der Förderlinie „Innovative Vorhaben“, welches im Leibniz Wettbewerb eingeworben werden konnte. Die Kooperation zwischen den Abteilungen Pragmatik und Lexik des Leibniz-Instituts für Deutsche Sprache in Mannheim ermöglichte während der dreijährigen Projektlaufzeit eine Verbindung der entsprechenden Fachkompetenzen, die für die Erstellung einer korpusbasierten lexikografischen Ressource des gesprochenen Deutsch in der Interaktion absolut notwendig sind. Für weitere allgemeine Informationen zu dem Projekt „Lexik des gesprochenen Deutsch“ verweisen wir auf die LeGeDe-Projektwebseite: . 6 FOLK ist in das Archiv für Gesprochenes Deutsch integriert und kann über die Datenbank für Gesprochenes Deutsch (=DGD2) abgerufen werden.
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
145
– Entwicklung von quantitativen und qualitativen Verfahren zur Identifizierung von interaktionstypischen, gesprochensprachlichen lexikalischen Elementen und deren spezifischen Merkmalen (vgl. Meliss/Möhrs 2017) – Erstellung einer Stichwortkandidatenliste und Auswahl geeigneter Stichwörter für die Ressource (vgl. Meliss et al. 2018a, Meliss 2020b) – Entwicklung von korpusbasierten quantitativen und qualitativen Verfahren für die lexikalische und interaktional ausgerichtete Datenanalyse und Beschreibung auf verschiedenen sprachlichen Ebenen (vgl. Meliss et al. 2018a) – Bestimmung der lexikalischen Besonderheiten von mündlichem Sprachgebrauch auf verschiedenen Ebenen (Form, Inhalt/Funktion, Situation etc.) (vgl. Meliss/ Möhrs 2017, 2018, 2019, 2020) – Entwicklung sowohl neuartiger lexikografischer Angabeklassen, die u. a. auf die Funktion lexikalischer Einheiten in Interaktionskontexten Bezug nehmen, als auch von innovativen lexikografischen Beschreibungsformaten in multimedialer Form (vgl. Meliss et al. 2019b) – Entwicklung weiterer korpuslinguistischer Methoden und Tools zur Abfrage und Strukturierung von automatisch generierten korpusbasierten Daten (vgl. Lemmenmeier-Batinić 2020, Möhrs/Meliss/Batinić 2017)
3 Hinweise zur Konzeption der LeGeDe-Ressouce Die einzelnen Phasen und Arbeitsschritte zur Entwicklung der LeGeDe-Ressource folgen dem lexikografischen Prozess zur Erstellung von Internetwörterbüchern, wie es u. a. in Klosa (2013a, 2013b) und Klosa/Tiberius (2016: 75 f.) beschrieben wird. Die lexikografische Umsetzung stellt sich dabei neuen Herausforderungen, die in Verbindung mit einer Reihe von unterschiedlichen Fragestellungen stehen. Für den vorliegenden Beitrag sind v. a. folgende Fragen von zentralem Interesse: – Welche Zielgruppen und Benutzungssituationen wären für ein Wörterbuch zum Gesprochenen denkbar? – Wie können Informationen zu Form, Inhalt und Funktion von lexikalischen Elementen des gesprochenen in der Interaktion auf der Mikrostrukturebene der geplanten Ressource angemessen multimedial beschrieben und dargestellt werden? – Wie können korpusbasierte, mündliche Sprachdaten (z. B. Audiodateien, Transkripte) gewinnbringend in die Ressource integriert werden? Zu anderen relevanten lexikografischen Themenbereichen in Verbindung mit der Erstellung der LeGeDe-Ressource, wie z. B. zu der Stichwortansetzung soll auf den Beitrag von Möhrs (2021) und auf weitere projektrelevante Publikationen verwiesen werden (Meliss/Möhrs 2017, 2019, 2020; Meliss et al. 2018a; 2019b; Möhrs/Meliss/ Batinić 2017).
146
Meike Meliss
3.1 Zielgruppe Die Frage nach der anvisierten Zielgruppe spielt eine fundamentale Rolle für die Art und Weise der lexikografischen Umsetzung der erhobenen Daten. Da die LeGeDe-Ressource zunächst als Wissensspeicher und Wortschatzdokumentation fungieren soll, stehen die Daten v. a. einem wissenschaftlich interessierten Kreis zur Verfügung. Die besagte Ressource schafft aber auch eine Grundlage für Maßnahmen zur Verbesserung eines an der Sprachrealität der Gegenwart orientierten Unterrichts von Deutsch als Fremd- bzw. Zweitsprache und kann außerdem die Fundierung eines sprachreflexiven L1-Unterrichts unterstützen. So ist u. a. aus den Ergebnissen der projektbegleitenden empirischen Befragungen hervorgegangen, dass Benutzer und Benutzerinnen in Lernsituationen (v. a. in Produktionssituationen) von der LeGeDe-Ressource profitieren könnten, wenn Experten (Wissenschaftler, Lehrende etc.) eine entsprechende Mittlerposition einnehmen (Meliss/Möhrs/Riberiro Silveira 2018b: 132; 2019a: 116).
3.2 Datenanalyse und Datenstrukturierung Unterschiedliche quantitative und qualitative Verfahren zur lexikalischen Bedeutungsdisambiguierung und zur Entwicklung von Wortprofilen, die als methodologische Ansätze in der korpusbasierten Lexikologie und Lexikografie gelten (vgl. u. a. Engelberg 2015, 2018, 2019; Engelberg et al. 2011), werden mit der interaktionslinguistischen Analyse sprachlicher Einheiten und der Beschreibung ihrer Formen und Funktionen in der Interaktion (vgl. u. a. Deppermann 2007, Couper-Kuhlen/Selting 2018) vereint und für den lexikografischen Prozess genutzt. Über das im Projekt entwickelte Werkzeug ‚Lexical Explorer‘ wird ermöglicht, die quantitativen Daten von FOLK zu durchsuchen und abzufragen. Unterschiedliche Informationen, wie u. a. automatisch generierte Frequenzdaten zum Formenbestand, zu Kollokationen, Kookkurrenzen etc. werden nicht nur bei der ersten korpusbasierten Annäherung an die Daten durch entsprechende Hypothesenbildung sondern auch bei der Interpretation der Analyseergebnisse unterstützend genutzt. Außerdem bietet ein Häufigkeitsklassenvergleich mit Teilkorpora aus DEREKO (=Deutsches Referenzkorpus) einen quantitativen Vergleich zwischen den Daten beider Korpora an (vgl. Meliss et al. 2018a, 2019b). Auf der Grundlage von qualitativen lexikalisch-semantischen und interaktionslinguistischen Einzelbeleganalysen wurden verschiedene Kodierschemata entwickelt, die jeweils die Besonderheiten der unterschiedlichen grammatischen Kategorien (Verb, Nomen, Diskurspartikel etc.) gerecht werden. Die Datengrundlage für die Analyse eines Lemmas ist jeweils eine Zufallsstichprobe aus FOLK, aus der die ersten 100 gültigen Belege auf der Basis von qualitativen Einzelanalysen kodiert wurden (= 100-Stichprobe). Neben Metadaten zum Treffer und zum Transkript, die automatisch extrahiert vorliegen, wurden formale (Person, Numerus, Modus etc.), inhaltliche (Bedeutung,
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
147
Bedeutungsumschreibung etc.), kombinatorische (Strukturmuster, Kookkurrenzen etc.), morphosyntaktische (Realisierungsmöglichkeiten der Aktanten etc.), funktionale, sequenzbezogene sowie prosodische Aspekte betrachtet und festgehalten. Da sich schon in der 100-Stichprobe die Notwendigkeit ergeben hat, einerseits die Ebene der Bedeutung und andererseits die funktionale Ebene der ausgewählten Stichwörter mit teilweise unterschiedlichen Analyseparametern und Methoden zu untersuchen und zu strukturieren, wurden für die weiteren Untersuchungen zwei teilweise unterschiedliche Verfahren angesetzt, die sich dann auch direkt auf eine unterschiedliche lexikografische Darstellung der Ergebnisse ausgewirkt haben. Im Zentrum von Modul 1 der LeGeDe-Ressource steht die semantisch und syntaktisch motivierte Disambiguierung der einzelnen Lesarten eines Stichwortes, während im Zentrum von Modul 2 die Beschreibung der interaktionalen Funktionen steht. Entsprechend wurden die weiteren Analyse-, Strukturierungs- und Beschreibungsverfahren den Anforderungen des jeweiligen Moduls angepasst und sollen im Folgenden detailliert dargestellt werden. Die Verteilung des Informationsangebotes auf zwei unterschiedliche Module ist folglich damit zu begründen, dass sich bestimmte Kategorien, wie z. B. die Diskursund Modalpartikeln und verfestigte interaktionale Einheiten adäquater mit interaktionslinguistischen als mit lexikalisch-semantischen Ansätzen beschreiben lassen.
3.2.1 Modul 1 Für das Informationsangebot in Modul 1 wurden die Kodierergebnisse der besagten 100-Stichprobe in ihren jeweiligen Gesprächssequenzen nach Form, Bedeutung und Kombinatorik (Strukturmuster, Kollokationen, feste Wendungen, interaktionale Einheiten etc.) in Verbindung mit dem Kontext und den Metadaten analysiert und auf der Grundlage einer semantisch-syntaktischen Disambiguierung einzelne Lesarten identifiziert. Als Orientierungshilfe für die jeweilige Lesartendisambiguierung dienten dafür entsprechende lexikografische Informationen ausgewählter Wörterbücher (z. B. E-VALBU, LGWB-DaF, Duden-online, DWDS). Durch den Vergleich der Daten aus der Stichprobe mit denen aus gängigen lexikografischen Werken, die hauptsächlich auf der geschriebenen Sprache basieren, wurden verschiedene Ziele verfolgt, die im Folgenden kurz dargestellt werden. a. Mögliche, besonders interessante gesprochensprachliche Phänomene bieten solche Kandidaten, die sich als Lesarten identifiziren lassen, die nur in den FOLKDaten belegt werden konnten, aber nicht in den konsultierten Wörterbüchern kodifiziert sind (so konnten z. B. für gucken in FOLK wesentlich mehr Lesarten belegt werden als in den konsultierten Wörterbüchern). Diese Fälle erlauben den Schluss, dass es sich zumindest um Lesarten handelt, die in der gesprochenen Interaktion – auf der Grundlage der LeGeDe-Stichprobe – als üblich gelten.
148
Meike Meliss
b. Die Identifizierung von Lesarten, die nicht in den FOLK-Daten belegt werden konnten, aber in den konsultierten Wörterbüchern kodifiziert sind, erlaubt den Schluss, dass es sich zumindest um Lesarten handelt, die in der gesprochenen Interaktion – auf der Grundlage der LeGeDe-Stichprobe – eher selten sind. Da sie nicht in der LeGeDe-Stichprobe belegt werden konnten, wurden sie für die LeGeDe-Ressource ausgeschlossen. Ein Verlinkungsangebot zu einigen elektronischen Wörterbüchern der deutschen Gegenwartssprache ermöglicht aber ein weiterführendes Informationsangebot. c. Spezifische formale und morphosyntaktische Eigenschaften im Gesprochenen (z. B. Präferenz für Modus Imperativ bei gucken in der Bedeutung: „richtungsorientiert visuell wahrnehmen“) ermöglichen die Identifikation von Distributionsbeschränkungen. d. Mögliche Fälle mit typisch gesprochensprachlichen kombinatorischen Merkmalen sind solche mit unterschiedlichen kombinatorischen Eigenschaften, die explizit in den FOLK-Daten der LeGeDe-Stichprobe belegt werden konnten, aber in den konsultierten Wörterbüchern nicht oder nur unzureichend explizit kodifiziert bzw. thematisiert sind. Diese Fälle umfassen verschiedene Bereiche u. a. in Verbindung mit folgenden Phänomenen: – Information zu den Strukturmustern und nicht realisierten Aktanten: z. B. konnte für kriegen in der Bedeutung „bekommen“ die Rolle „Sender“ nicht belegt werden; – Information zu reduzierten Strukturmustern und der ergänzenden Verwendung von deiktischen Elementen: z. B. bei gucken und schauen in der Bedeutung: „richtungsorientiert visuell wahrnehmen“; – Information zu typischen Verbindungen / Kollokationen: So zeigt z. B. wissen in der Bedeutung „informiert sein“ eine sehr häufige Verbindung mit den Partikeln ja und aber auf. Das Adjektiv gut in der Bedeutung von „positiv bewertet“ tritt häufig mit echt und das Adverb eben mit gerade auf. – Information zu festen Wendungen (z. B. keine Ahnung haben, gucken wo jemand bleibt, frei kriegen, Besuch kriegen, die Kurve kriegen) oder Routineformeln (z. B. guten Appetit, danke schön);
3.2.2 Modul 2 Die Analysen für das Informationsangebot in Modul 2 basieren ebenfalls auf der besagten 100-Stichprobe und liefern Hinweise auf relevante Phänomene und v. a. auf die Frage, welche Belege Kandidaten für eine interaktional ausgerichtete Beschreibung sein könnten. Dabei standen im Zentrum des Interesses u. a. Einheiten mit einer spezifischen kommunikativen Funktion im Gespräch wie z. B. die verschiedenen Muster mit den Verben wissen (ich weiß nicht, weißt du, ich weiß, wer weiß, was weiß ich), gucken (guck mal, mal gucken) und schauen (schau mal, mal schauen)
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
149
oder die polyfunktionalen Stichwörter eben, gut, ja und schön, die u. a. auch den Kategorien ‚Modalpartikel‘ und ‚Diskurspartikel‘ zuzuordnen sind. In den Fällen, in denen die 100-Stichprobe zwar Hinweise auf verfestigte Muster gibt, diese jedoch in nicht ausreichender Anzahl vorliegen, um belastbare Aussagen treffen zu können, wurden separate, gezielte Abfragen in FOLK generiert. Diese Belege wurden nach einer Zufallsauswahl extrahiert und ergänzend zur Analyse hinzugezogen. Für die Analysen für Modul 2 wurde außerdem das grundlegende Ausgangskodierschema um weitere relevante formale und funktionale Parameter ergänzt. Auf der Grundlage der Kodierung wurden anschließend die ermittelten typischen, rekurrenten und verfestigten Form-Funktions-Zusammenhänge unter Berücksichtigung der Sequenz- und Interaktionskontexte beschrieben und für ein lexikografisches Informationsangebot entsprechend aufbereitet. Da sich die Analysen beider Module zunächst auf die jeweilige LeGeDe-Ausgangsstichprobe beziehen, wurden nur die Phänomene (Bedeutungen, kommunikative Muster, Funktionen) beschrieben, die hier belegt werden konnten. Solche Phänomene, die ggf. Gegenstand von Beschreibungen in anderen wissenschaftlichen Einzelstudien und/oder lexikografischen Werken sind, aber nicht in der LeGeDe-Stichprobe dokumentiert werden konnten, sind daher nicht Teil des LeGeDe-Informationsangebotes.
4 Das Informationsangebot der LeGeDe-Ressource Für jedes Stichwort bietet die LeGeDe-Ressource ein umfangreiches Informationsspektrum an (vgl. Abschnitt 4.2), welches durch verschiedene Außentexte (vgl. Abschnitt 4.1) „umrahmt“ wird. Die lexikografische Struktur (vgl. Engelberg/Lemnitzer 4 2009, Wiegand 1989a, 1989b) und das Vernetzungsangebot (vgl. Engelberg/Müller-Spitzer/Schmidt 2016) sind dementsprechend komplex und vielfältig (vgl. Meliss/Möhrs 2020). Außerdem konnten verschiedene Wünsche aus den Umfragen bezüglich der multimedialen Präsentationsmodalitäten berücksichtigt werden (vgl. Abschnitt 4.3)7.
4.1 Außentexte Die Außentexte stellen ein zusätzliches Informationsangebot zur Verfügung, welches sich an unterschiedliche Nutzer wendet und die verschiedensten Möglichkeiten einer internetbasierten Ressource ausnutzt (vgl. Klosa/Gouws 2015). Der Informationstext „Über LeGeDe“ stellt in ausführlicher Form die theoretischen und methodologischen
7 Siehe dazu auch das Informationsangebot in der LeGeDe-Ressource.
150
Meike Meliss
Grundlagen des LeGeDe-Projekts dar und bietet detaillierte Informationen zu den einzelnen lexikografischen Angabeklassen an. Dieser Text richtet sich wegen seiner Ausführlichkeit und Komplexität besonders an ein interessiertes Fachkollegium, das neben dem Interesse an der Ressource an sich, Interesse an metalexikografischen und methodologischen Fragestellungen hat. Die „Benutzungshinweise“ sind hingegen so konzipiert, dass sie den Wörterbuchbenutzenden auf schnelle, anschauliche und direkte Art und Weise den Zugang zu der Ressource und den einzelnen Strukturelementen durch eine „Guided Tour“ visuell näherbringen. Das „Glossar“ verfolgt das Ziel, bestimmte linguistische Fachbegriffe, die in der Ressource eine zentrale Rolle einnehmen, durch Kurzdefinitionen zu erklären bzw. über ein Verlinkungsangebot zu terminologischen Datenbanken zu verweisen. Im Vordergrund steht dabei hauptsächlich das Ziel, den für die Erstellung der LeGeDe-Ressource verfolgten terminologischen Ansatz anzudeuten bzw. zu skizzieren. Der Zugriff auf den entsprechenden Glossareintrag ist dabei entweder direkt über einen konkreten Terminus in der Ressource möglich oder über das alphabetisch angeordnete komplette Glossar. Der Außentext „Literatur“ bietet einen Einblick in die relevante Forschungsliteratur. Der Zugriff ist ebenfalls entweder über die Kurzverweise in den einzelnen Wörterbuchartikeln oder über die komplette Liste möglich.
4.2 Lexikografisches Informationsspektrum Der Wunsch der zukünftigen Nutzenden einer lexikografischen Ressource zu Spezifika des Gesprochenen nach einem Informationsangebot, welches in speziellem Maße die Besonderheiten des gesprochenen Deutsch hervorhebt, wird u. a. in der Frage Welche Informationen sollten in einem Onlinewörterbuch des gesprochenen Deutsch angeboten werden? unserer Onlineumfrage (vgl. Abb. 1) deutlich geäußert (vgl. Meliss/Möhrs/Riberiro Silveira 2018b, 2019a). Sowohl durch die korpusbasierte Methode zur Stichwortkandidatenauswahl (vgl. Meliss et al. 2018a) als auch durch die korpusbasierte Analysemethode konnten quantitative und qualitative Daten zu Besonderheiten des Gesprochenen aus FOLK ermittelt und bei der lexikografischen Umsetzung an verschiedenen Stellen besonders explizit dargestellt, kommentiert bzw. visualisiert werden. Das Informationsspektrum für jedes Stichwort wird in einem Überblicksartikel (vgl. Abschnitt 4.2.1), einem Modul 1 zu lexikalisch-semantischer Information in Verbindung mit den unterschiedlichen Lesarten der Lemmata, die in der LeGeDe-Stichprobe identifiziert werden konnten (vgl. Abschnitt 4.2.2) und in einem Modul 2 mit relevanter Information zu dem Funktionsspektrum der Lemmata (vgl. Abschnitt 4.2.3) dargestellt. Für beide Module wurden für die weitere Beschreibung der einzelnen Lemmata spezifische lexikografische Angabeklassen genutzt bzw. neu entwickelt, die sich neben dem klassischen Angebot auch durch völlig neuartige lexikografische Informationen und Formate auszeichnen. Verschiedene inhaltlich-funktionale
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
Abb. 1: Erwartungen an das Informationsangebot (Online-Umfrage).
151
152
Meike Meliss
Schnittstellen zwischen beiden Modulen werden durch interne Verknüpfungen explizit gemacht.
4.2.1 Überblicksartikel zu jedem Stichwort Für jedes Stichwort, welches für die LeGeDe-Ressource aus der Stichwortkandidatenliste ausgewählt wurde (vgl. Möhrs 2021), steht zunächst ein Überblicksartikel, der aus unterschiedlichen Teilen besteht, zur Verfügung. Der deskriptive Überblickstext bietet allgemeine, zusammenfassende bedeutungs- und funktionsorientierte Informationen an (vgl. Abb. 2 zu WISSEN8). Die deutliche modulare Zweiteilung des Informationsangebotes ermöglicht einerseits die Präsentation der lexikalisch-semantischen Information, die an den jeweiligen Lesarten eines Lexems orientiert ist (=Modul 1: Bedeutungen) und andererseits die Darbietung der funktionsspezifischen, interaktional ausgerichteten Information (=Modul 2: Funktionen im Gespräch). Neben den Einwortlemmata (z. B. wissen) können auch unterschiedliche mehrteilige, teilweise musterhafte Einheiten als komplexe, mehrteilige Lemmata (z. B. ich weiß nicht) auftreten. Nicht für jedes Stichwort ist allerdings die modulare Zweiteilung, wie sie für WISSEN in Abb. 2 vorgestellt wird, sinnvoll. So wird für das Stichwort KRIEGEN nur Information in Modul 1 bereitgestellt (kriegen als Voll- und Hilfsverb). Für Partikeln wie HALT und JA werden hingegen nur Informationen in Modul 2 (halt: Modalpartikel; ja: Diskurspartikel, Modalpartikel) angeboten. In beiden Modulen erfolgt der Zugriff über die verschiedenen Lemmazeichengestaltangaben (=LZGAs). Diese werden formal und kategorial voneinander unterschieden (wissen als ‚Vollverb‘ und als ‚Verbalsyntagma‘). So sind z. B. die LZGAs zu dem Stichwort WISSEN folgende: Modul 1: wissen als Vollverb Modul 2: wissen als Nukleus eines Verbalsyntagmas: – ich weiß nicht – weißt du – ich weiß – wer weiß – was weiß ich Jeder LZGA werden entsprechende Etikettierungen zugeordnet. In Modul 1 handelt es sich um lesartdisambiguierende (z. B. wissen: ‚informiert sein‘, ‚kennen‘ etc.) und in Modul 2 um funktionsdifferenzierende Label (‚Unsicherheitsmarker‘, ‚Diskursmarker‘, ‚etcetera-Formel‘ etc.).
8 Alle Stichwörter, die noch keine formal-kategoriale Zuordnung erfahren haben, werden in diesem Beitrag durch Kapitälchen ausgezeichnet. Es handelt sich zunächst nur um eine abstrakte Einheit, die typographisch von den formgleichen Lemmata differenziert werden soll.
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
153
Abb. 2: Überblicksartikel zu WISSEN (Screenshot).
In dem Überblicksartikel werden außerdem sowohl modulübergreifende Informationen zu automatisch errechneten, korpusbasierten Häufigkeitsklassen des jeweiligen Stichwortes für die Daten der zu vergleichenden Korpora (DEREKo vs. FOLK) in visualisierter Form angeboten als auch der Zugriff auf FOLK und den Lexical Explorer bereitgestellt. Die kreisförmige Abbildung zu WISSEN zeigt die Häufigkeitsklasse (HK) des Lemmas in FOLK und in DeReKo. Vergleicht man die beiden eingefärbten Kreisringe, erhält man eine Vorstellung des Frequenzunterschiedes eines Lemmas in den beiden Korpora (je größer der Kreis im Vergleich, desto häufiger das Lemma im
154
Meike Meliss
Verhältnis). Das Lemma WISSEN ist in FOLK der HK3 und in DEREKO der HK8 zugeordnet. Die Differenz beträgt daher 5 zu Gunsten von FOLK.9 Weitere lexikografische Informationen zu den einzelnen Stichwörtern werden über die externe Verlinkung zu verschiedenen anderen Wörterbüchern mit online-Zugriff angeboten (z. B. DWDS). Ein Kurzhinweis auf relevante Forschungsliteratur ermöglicht die Verknüpfung zu den ausführlichen Literaturangaben, die für die einzelnen Stichwörter der LeGeDe-Ressource relevant sind und als Umtextangebot vorliegt. Zur Verständnissicherung werden außerdem ausgewählte Fachtermini in den Textpassagen mit einem Glossar, welches ebenfalls als Umtext vorliegt, verbunden. So kann man z. B. in dem Übersichtstext zu WISSEN zu dem Begriff Epistemik genauere Information im Glossar erhalten. Wie komplex die Vernetzungsstruktur der LeGeDe-Ressource ist, wird schon an dem präsentierten Überblicksartikel zu WISSEN deutlich.
4.2.2 Lexikografische Angaben in Modul 1 Im Zentrum von Modul 1 steht die spezifische Information zu den einzelnen Lesarten und deren Kombinatorik, die durch relevante lesartübergreifende Informationen ergänzt wird. Ein weiteres optionales Informationsangebot ermöglicht Kommentare zu Besonderheiten. 4.2.2.1 Lesartübergreifende Information zu den einzelnen Lemmata (i) Die bearbeiteten Lemmata von Modul 1 treten in einfacher Form, d. h. zunächst als Einwortlemmata auf. Die formal-kategoriale Information erfolgt über folgende grammatische Kategorien: – Vollverb: gucken, kriegen, schauen, wissen [. . .] – Hilfsverb: kriegen [. . .] – Adjektiv: gut, schön [. . .] – Adverb: eben [. . .] – Nomen: Ahnung [. . .]
9 Die Darstellung ist zusammengesetzt aus 17 konzentrischen Kreisen, also 16 Kreisringen, die jeweils für eine HK stehen. Das häufigste Wort eines Korpus definiert die HK 0, die in der Abbildung durch den äußersten Kreisring dargestellt ist. Der innerste Kreisring steht für die HK 16 (1/216 so häufig, wie das häufigste Wort), da diese die seltensten Wörter in FOLK repräsentiert. Ein Vergleich mit niedrigeren HK in DEREKO (bis HK 32) ist für unsere Zwecke nicht sinnvoll, daher wurden für die Visulisierung für DEREKO, parallel zu FOLK auch nur 16 HK berücksichtigt. Der Ring, der die HK visualisiert, in der sich das Lemma in FOLK wiederfindet, ist jeweils türkis eingefärbt. Der Ring, der die HK visualisiert, in der das Lemma in unserem Vergleichskorpus DEREKO zu finden ist, ist hingegen grau eingefärbt (vgl. Meliss et al. 2019b).
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
155
(ii) Weitere optionale formale Informationen beziehen sich auf die Morphemstruktur bei komplexen lexikalischen Formen (z. B.: Ahnung: ahn- (Verbalstamm) – Derivationssuffix: -ung). (iii) Für ein Informationsangebot zu möglicher Formvarianz u. a. auf phonischer Ebene steht ein optionaler Textblock zur Verfügung (vgl. Bsp. 1) (1) kriegen [Vollverb] Anstelle der Realisierung eines auslautenden ‚k-Lautes‘ (Auslautverhärtung) lässt sich eine deutliche Tendenz zu der Realisierung eines ‚ich-Lautes‘ feststellen [kriecht] [. . .]. (iv) Zur Forschungsliteratur können Kurzverweise, die speziell für diesen Informationsblock relevant sind, aufgeführt werden. Sie verlinken mittels eines Pop-upFensters zum Umtext „Literatur“. 4.2.2.2 Lesartenspezifische Information (i) Die einzelnen LZGAs weisen im Allgemeinen unterschiedliche Lesarten auf. So konnten z. B. in der LeGeDe-Stichprobe für gucken neun Lesarten und verschiedene Muster (u. a. guck mal, mal gucken, müssen wir mal gucken) identifiziert werden (vgl. Abb. 3). Gerade zu dem Stichwort GUCKEN konnte festgestellt werden, dass die Diskrepanz zwischen der bisherigen lexikografischen Kodifizierung und der Korpusbefunde sehr groß ist, denn in den gängigen Wörterbüchern konnten nicht mehr als drei Lesarten zu gucken dokumentiert werden (Meliss/Möhrs 2017, 2018). Die einzelnen Lesarten werden durch eine Kurzettikettierung zur semantischen Disambiguierung gekennzeichnet und ihre Bedeutung durch kurze Bedeutungsparaphrasen umschrieben. (ii) Für alle Lesarten werden illustrative Audiobelege mit einem entsprechenden Transkriptausschnitt angeboten. Diese sind in einen ausführlichen Belegblock integriert, zu dem neben einem aussagekräftigen Belegtitel auch eine kurze Beschreibung des Kontextes und optional ein Analysekommentar gehört. Ein Audiosymbol lädt den Benutzenden explizit ein, sich die Datei anzuhören (vgl. Abb. 4). (iii) Zusätzlich gibt es die Möglichkeit, in einem kurzen Kommentar auf formale Auffälligkeiten hinzuweisen. In diesem optionalen Textfeld können unterschiedliche Aspekte, wie u. a. das auffällige kombinatorische Verhalten in Verbindung mit Modalverben, der Gebrauch von bestimmten Modi oder die Verknüpfung mit bestimmten Partikeln oder deiktischen Ausdrücken kommentiert werden (vgl. Bsp. 2–3). (2) gucken in der Bedeutung von ‚abwarten‘: In dieser Lesart ist der Gebrauch der 1. Person Plural Indikativ bzw. des Imperativs in Verbindung mit der Modalpartikel mal auffällig. Dies ist als Aufforderung (teilweise auch modalisiert durch das Modalverb müssen) an alle Interagierenden zu verstehen, zunächst zu überlegen, nicht zu handeln, sondern abzuwarten.
156
Meike Meliss
Abb. 3: Etikettierungen und Bedeutungsparaphrasen zu gucken (Modul 1) (Screenshot).
Abb. 4: Belegblock zu gucken in der Bedeutung ‚richtungsorientiert visuell wahrnehmen‘ (Modul 1) (Screenshot).
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
157
(3) schauen in der Bedeutung von ‚überprüfen‘: Diese Bedeutungsvariante von schauen zeigt eine deutliche Verlagerung des Fokus von der visuellen Wahrnehmung auf den Aspekt des Überprüfens bzw. Feststellens auf. In der Hälfte der Belege wird außerdem durch die Kombination mit den Modalpartikeln mal und halt eine gewisse Beiläufigkeit bzw. Unverbindlichkeit durch den Sprechenden ausgedrückt. (iv) Die relevante Information zu der Kombinatorik in Verbindung mit den einzelnen Lesarten wird durch die Beschreibung der Strukturmuster, der festen Verbindungen sowie der Kollokationen und der interaktionalen Einheiten explizit gemacht. Die Strukturmuster werden zunächst durch eine abstrahierte, formelhafte Information angeboten. Die einzelnen Aktanten, aus denen die Strukturmuster zusammengesetzt sind, werden bezüglich ihrer semantischen Rolle, ihrer syntaktischen Funktion und den morphosyntaktischen Realisierungsmöglichkeiten genauer erklärt und Besonderheiten angegeben (vgl. Bsp. 4 zu schauen). Kurze Belegblöcke illustrieren die jeweiligen kombinatorischen Möglichkeiten (vgl. Abb. 5)
Abb. 5: Ausschnitt: Kurzbelegblöcke zu schauen in der Bedeutung ‚überprüfen‘ (Modul 1) (Screenshot).
158
Meike Meliss
(4) schauen in der Bedeutung ‚überprüfen‘: jemand schaut (was der Fall ist) [irgendwo] jemand: Person, die etwas überprüft/feststellt syntaktische Funktion: Subjekt was der Fall ist: Sachverhalt, der an einem bestimmten Ort überprüft bzw. festgestellt wird syntaktische Funktion: satzförmiges Komplement: fakultativ Realisierungsform: – indirekte Entscheidungsfrage eingeleitet mit ob – indirekte Ergänzungsfrage eingeleitet durch ein w-Element – abhängiger, uneingeleiteter Verbzweitsatz Besonderheiten: – die indirekten Ergänzungsfragen weisen teilweise eine Verbzweitposition auf – wenn das satzförmige Komplement nicht realisiert wird, steht das Verbalsyntagma (z. B.: ich schau mal) meist am Ende einer Sequenz und bildet einen thematischen Abschluss mit teilweise spezifischen interaktionalen Funktionalitäten. irgendwo: Ort der visuellen Wahrnehmung zur Überprüfung bzw. Feststellung von etwas syntaktische Funktion: Situativsupplement: lokal Realisierungsform: – meistens in Form von deiktisch gebrauchten Lokaladverbien wie hier, da, dort Unter dem weiten Oberbegriff „Feste Wendungen/Kollokationen“ werden in der LeGeDe-Ressource verschiedene Arten von mehr oder weniger festen lexikalischen Einheiten und (usuelle) Verbindungen, ohne eine weitere Spezifizierung bzw. terminologische Präzisierung vorzunehmen, zusammengefasst. So stehen hier Kollokationen, feste (idiomatische) Wendungen, Routineformeln, Sprichwörter etc. nebeneinander (vgl. Bsp. 5–8) und werden auch durch entsprechende Belegblöcke illustriert. (5) wissen in der Bedeutung von ‚informiert sein‘: Bescheid wissen: Mit dieser Wendung geben Sprechende zu verstehen, dass sie selber oder eine andere Person tatsächlich über einen nicht näher benannten Sachverhalt informiert sind oder stellen dies in Frage.
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
159
(6) gut in der Bedeutung ‚positiv bewertend‘: Vor das Adjektiv gut treten in der LeGeDe-Stichprobe weitere Adjektive bzw. Adverbien, die die Bedeutung von gut entweder relativieren (z. B. ganz) oder intensivieren (z. B. sehr und echt). (7) gut in der Bedeutung ‚positiv bewertend‘: guten Appetit: Die Routineformel guten Appetit wird von Sprechenden typischerweise vor Beginn einer Mahlzeit als eine Art Wunschformel geäußert, womit auch der Beginn des gemeinsamen Essens (als Vorgang) markiert wird. Im Transkriptausschnitt zeigt sich außerdem eine typische Paarsequenz, die bei der Verwendung dieser Formel in der Interaktion zu beobachten ist [. . .] (8) schauen in der Bedeutung ‚richtungsorientiertes visuelles Wahrnehmen‘: Einem geschenkten Gaul schaut man nicht ins Maul:Dieses Sprichwort bedeutet, dass man, wenn man etwas geschenkt bekommt, damit zufrieden sein und das Geschenk nicht kritisch überprüfen oder hinterfragen sollte. Durch die Auflistung in Modul 1 von interaktionalen Einheiten, die in der LeGeDeStichprobe in direkter inhaltlicher Verbindung mit einzelnen Lesarten des entsprechenden Stichwortes belegt werden konnten, wird die Einrichtung einer direkten Bedeutungs-Funktions-Schnittstelle zu interaktionalen Funktionalitäten ermöglicht, die in Modul 2 genauer beschrieben werden (vgl. Bsp. 9–11). (9) Ahnung in der Bedeutung ‚Wissen‘: keine Ahnung: Anzeige von Nicht-Wissen: Das Muster keine Ahnung fungiert als interaktionale Einheit, mit der Sprechende anzeigen, dass sie kein Wissen über einen Sachverhalt besitzen. (10) wissen in der Bedeutung ‚informiert sein‘: ich weiß nicht: Unsicherheitsmarker: Mit ich weiß nicht drücken Sprechende aus, dass sie sich hinsichtlich der Wahrheit, Genauigkeit, Gültigkeit bzw. Angemessenheit einer Aussage unsicher sind und markieren die Vagheit dieser Angabe. ich weiß: Beanspruchung von Wissen: Das Muster ich weiß fungiert als Anzeige von Wissen bei Reaktion auf eine Äußerung oder als Beanspruchung von Wissen. Sprechende bekennen sich mit diesem Muster dazu, informiert zu sein. (11) schön in der Bedeutung ‚passend‘: schön: Diskurspartikel: Bewertung: Zu der Verwendung als Adjektiv mit der Bedeutung ‚passend‘ tritt in der LeGeDe-Stichprobe auch die Verwendung von schön als Diskurspartikel auf. Dabei nehmen Sprechende mit schön Bezug auf eine vorausgegangene Äußerung und bewerten den Inhalt dieser Äußerung, die Äußerung an sich oder eine Handlung als positiv. Sie drücken so auf inhaltlicher Ebene ihre persönliche Haltung dem jeweiligen Bewertungsgegenstand gegenüber aus.
160
Meike Meliss
In einem weiteren optionalen Textfeld ist es außerdem möglich, auf Auffälligkeiten in Bezug auf ausgewählte Metadaten und ihre Frequenz hinzuweisen (vgl. Bsp. 12). (12) schauen in der Bedeutung ‚richtungsorientiert visuell wahrnehmen‘: Etwa ein Drittel aller Belege der LeGeDe-Stichprobe zu schauen konnten dieser Lesart zugeordnet werden. Dabei können mehr als die Hälfte dieser Belege privaten Interaktionssituationen zugerechnet werden (Alltagsgespräche: Spieleinteraktion, beim Kochen, beim Renovieren, beim Spazierengehen etc.). In diesem Kontext kommt der situationsbezogene imperativische Gebrauch in Verbindung mit einer lokalen Deixis besonders deutlich zum Ausdruck. In öffentlichen Interaktionssituationen konnte diese Bedeutung von schauen hingegen kaum belegt werden.
4.2.3 Lexikografische Angaben in Modul 2 Im Zentrum von Modul 2 stehen neben allgemeiner funktionsübergreifender Information v. a. die funktionsspezifischen Besonderheiten, die durch Informationen zur Syntax/Sequenz und Prosodie bereichert werden. Auch für dieses Modul stehen ausführliche Belegblöcke zur Verfügung, die die Transkriptausschnitte10 in Verbindung mit der entsprechenden Audiodatei anbieten. 4.2.3.1 Funktionsübergreifende Information (i) Gegenstandsbereich von Modul 2 sind sowohl Einwortlemmata (z. B. eben11, gut, ja) als auch Mehrwortlemmata (z. B. keine Ahnung12, weiß nicht, mal gucken) (vgl. Meliss 2020b). Die formal-kategoriale Information erfolgt über folgende Kategorien: – Nominalsyntagma: keine Ahnung [. . .] – Verbalsyntagma: ich weiß nicht, weißt du, mal gucken [. . .] – Diskurspartikel: ja, gut [. . .] – Modalpartikel: eben, halt, ja [. . .] (ii) Bei komplexen Formen werden weitere genauere formale Informationen bezüglich der beteiligten Elemente aufgeführt (vgl. Bsp. 13 + 14): (13) keine Ahnung: Determinativum keine und Substantiv Ahnung (14) weißt du: Phrase aus der 2. P. Sg. des Verbs wissen (weißt) und dem Personalpronomen du
10 Die entsprechenden Belege wurden nach GAT2-Basistranskript nachtranskribiert. Zu den Transkriptionskonventionen GAT2 vgl. Selting et al. 2009. 11 Zu eben siehe auch Möhrs/Torres (2020). 12 Zu keine Ahnung siehe auch Möhrs (2020).
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
161
(iii) Die Information zu möglichen formalen Varianten erfolgt u. a. auf der lautlichen (vgl. Bsp. 15, 16) und der kompositionellen Ebene (vgl. Bsp. 17): (15) eben: [ebent] – Epithese eines stimmlosen [t] (16) wissen: [weißt du], [weißte], [weiß_u], [weiß_du] – teils Klitisierung und phonetische Reduktion (17) (ich) weiß nicht / weiß (ich) nicht (iv) Eine Auflistung von in der LeGeDe-Stichprobe belegten Möglichkeiten zur Kombinatorik wird meistens mit einem Kommentar begleitet (vgl. Bsp. 18–20) (18) eben: (vgl. auch Abb. 6) dann eben, halt eben, ja eben, eben auch, eben dann, eben nicht Manche Partikelkombinationen können eine Funktionsverstärkung mit sich bringen bzw. ihre eigene spezifische Funktion eröffnen (z. B. Verweis auf gemeinsames Wissen durch ja). (19) halt: dann halt, halt eben, halt dann, halt jetzt Die meisten kombinierten Elemente werden rechts von der Partikel realisiert. In der linken Peripherie findet sich in der LeGeDe-Stichprobe lediglich die Partikel dann. (20) ja: ja klar, ja natürlich, ja aber; Durch die Kombination mit weiteren Partikeln wie klar und natürlich kann der Grad der Zustimmung in der Funktion ‚Zustimmungssignal‘ erhöht werden. Die Kombination ja aber ist eine verfestigte Konstruktion mit der eigenen interaktionalen Funktion ‚Einräumung‘. (v) Kurzverweise auf relevante Literaturangaben, die speziell für diesen Informationsblock, d. h. für die Information zu der interaktionalen Funktion, relevant sind, werden ebenfalls funktionsübergreifend angeboten (vgl. Abb. 6 zu eben). (vi) In einem optionalen Textblock können außerdem funktionsübergreifende Informationen zu Metadaten angeführt werden (vgl. Abb. 6 zu eben).
162
Meike Meliss
Abb. 6: Funktionsübergreifende Information zu eben als Modalpartikel (Modul 2) (Screenshot).
4.2.3.2 Funktionsspezifische Informationen (i) Jede einzelne Funktion, die einem ein- oder mehrteiligen Lemma zugeschrieben werden kann, wird entsprechend etikettiert. So weist z. B. was weiß ich als komplexe Mehrworteinheit ein breites funktionales Spektrum auf. Eine Funktionskurzbeschreibung soll dazu beitragen, die einzelnen Möglichkeiten voneinander abzugrenzen (vgl. Abb. 7).
Abb. 7: Funktionsspezifische Information zu was weiß ich: Funktionskurzbeschreibung (Modul 2) (Screenshot).
Im Falle einer semantischen Verknüpfung zu einer der Lesarten des entsprechenden Einwortlemmas wird ein Querverweis hergestellt und über die Etikettierung auf die entsprechende Lesart, die in Modul 1 genauer beschrieben wird, verwiesen und verlinkt (vgl. Bsp. 21–23).
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
163
(21) keine Ahnung: Anzeige von Nicht-Wissen Mit keine Ahnung zeigen Sprechende an, dass sie kein Wissen über einen Sachverhalt besitzen. (vgl. dazu auch Ahnung in der Bedeutung ‚Wissen‘) (22) ich weiß nicht Unsicherheitsmarker Mit ich weiß nicht zeigen Sprechende an, dass sie sich hinsichtlich der Wahrheit/ Genauigkeit einer Aussage unsicher sind und markieren die Vagheit dieser Angabe. (vgl. dazu auch wissen in der Bedeutung ‚informiert sein‘) (23) mal schauen Verschiebung einer Handlung in die Zukunft Mit mal schauen schieben Sprechende eine Handlung, Entscheidung, Einschätzung, Bewertung, Planung o. Ä. zeitlich auf. Damit dient mal schauen häufig als (vorläufiges) Beendigungssignal (vgl. dazu auch schauen in den Bedeutungen ‚abwarten‘ und ‚überprüfen‘). (ii) Ein Langbelegblock mit entsprechendem Belegtitel, Belegkontext, funktional ausgerichteter Beleganalyse und einem Link zur Audiodatei dient zur Illustration und wird auch visuell deutlich durch ein Audiosymbol markiert, um den Benutzenden explizit darauf hinzuweisen, sich die Datei auch anzuhören (vgl. Abb. 8 + 9).
Abb. 8: Belegblock für ich weiß nicht als Unsicherheitsmarker (Modul 2) (Screenshot).
164
Meike Meliss
Abb. 9: Belegblock für guck mal als Diskursmarker (Modul 2) (Screenshot).
(iii) Die Funktionsabstrahierung (vgl. Abb. 10 + 11) fasst die jeweils beschriebene Funktion auf einer allgemeineren Ebene zusammen. Das verwendete Symbol, welches an dieser Stelle als Strukturanzeiger verwendet wird (Engelberg/Lemnitzer 2009: 155 f., Wiegand 1989b: 428) illustriert, dass es sich hierbei um zentrale Informationen handelt.
Abb. 10: Funktionsabstrahierung: ich weiß nicht als Unsicherheitsmarker (Modul 2) (Screenshot).
Abb. 11: Funktionsabstrahierung: guck mal als Diskursmarker (Modul 2) (Screenshot).
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
165
(iv) Kurze Informationen zur Syntax- und Sequenz-Realisierung (vgl. Abb. 12 + 13) und zur Prosodie (vgl. Abb. 14 + 15) die, wie bei ja und eben als Modalpartikel vs. Diskurspartikel distinktiv sein können, werden ebenfalls geliefert und mit kurzen Transkriptausschnitten belegt.
Abb. 12: Syntax-Sequenz-Realisierung: ja als Modalpartikel zur Wissensaktualisierung (Modul 2) (Screenshot).
Abb. 13: Syntax-Sequenz-Realisierung: ja als Diskurspartikel: Diskursmarker (Modul 2) (Screenshot).
166
Meike Meliss
Abb. 14: Prosodie: eben als Modalpartikel zur Kohärenzherstellung (Modul 2) (Screenshot).
Abb. 15: Prosodie: eben als Diskurspartikel: Zurückforderung eines Wissensanspruch (Modul 2) (Screenshot).
(v) Informationen zu weiteren Auffälligkeiten, die hauptsächlich in Verbindung mit den Metadaten stehen, können in einem optionalen Textfeld bereitgestellt werden (vgl. Bsp. 24). (24) schön: Diskurspartikel: Abschlussmarker Die Verwendung von schön als Abschlussmarker tritt überwiegend in handlungsschematischen Interaktionen wie u. a. Unterrichtsstunden, Planungen oder Spielinteraktionen auf, in denen einzelne Themen und Handlungen systematisch nacheinander bearbeitet werden und die aufeinander aufbauen.
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
167
4.3 Multimediales Informationsangebot Bei der Präsentation des Informationsangebotes in der LeGeDe-Ressource wurde versucht, möglichst viele der Modalitäten, die von den Befragten unserer Umfragen erwünscht wurden, aufzugreifen (Meliss/Möhrs/Ribeiro Silveira 2018b: 129 ff., 2019a: 113 ff.). Neben dem allgemeinen Wunsch nach der Inkorporierung von Audiodateien (vgl. Abb. 16) wurden ebenfalls auf Wunsch der Befragten Transkripte in den Belegblöcken und ein vielseitiges internes (u. a. zu den Umtexten: Glossar und Literatur) und externes Verlinkungsangebot (u. a. zu FOLK, dem Lexical Explorer und anderen Wörterbüchern) (vgl. Abb. 17) in die Ressource „eingebaut“.
Abb. 16: Visualisierung der Ergebnisse der OU zu möglichen Präsentationsmodalitäten.
Abb. 17: Ergebnisse der OU zu Verlinkungsmöglichkeiten.
168
Meike Meliss
5 Innovation, Anwendung und Ausblick Da das LeGeDe-Projekt auf keine Vorbilder zurückgreifen konnte, kann durchaus behauptet werden, dass die Tatsache, einen lexikografischen Prototypen zur Darstellung von Spezifika der gesprochensprachlichen Lexik des Deutschen auf der Datengrundlage eines Korpus des Gesprochenen in der Interaktion erstellt zu haben, äußerst innovativ ist. In Verbindung mit diesem Vorhaben gab es Anlass zu einer Reihe von methodologischen und technischen Herausforderungen. Dazu gehören u. a. die quantitative Ermittlung der relevanten Stichwortkandidaten durch ein eigens entwickeltes methodologisches Vorgehen (Meliss et al. 2018a, Möhrs 2021) sowie die qualitative Analyse und anschließende Strukturierung der Daten für die lexikografische Umsetzung. Das Spektrum an lexikografischen Angabeklassen, welches klassische Angaben mit neuartigen Angabeklassen kombiniert, die eigens für die Beschreibung bestimmter lexikalischer Phänomene in der Interaktion entwickelt wurden, ist multimodular. Damit wurde zum ersten Mal für die Darstellung lexikalischer Phänomene des Gesprochenen in der Interaktion ein Vorschlag für neuartige Angabeklassen entwickelt, der ermöglicht, die spezifischen Phänomene für lexikografische Zwecke adäquat zu strukturieren und zu beschreiben. Die Integration von authentischen Korpusbelegen erfolgt zunächst über ausgewählte Transkriptausschnitte, über die eine Schnittstelle zu den Audiodateien und zu den ausführlichen Informationen zu den Metadaten der DGD hergestellt wird. Damit ist die LeGeDe-Ressource eine der wenigen lexikografischen Ressourcen, die eine direkte Verknüpfung zu den entsprechenden Korpusdaten in Audioformat aufweist und gleichzeitig außerdem das Mitlesen der Transkriptausschnitte ermöglicht. In diesem Sinne zeichnet sich der multimediale Charakter der Ressource auch dadurch aus, dass für die Korpusdaten neben den Transkripten Audiodateien und teilweise auch entsprechende Videodateien über den Zugriff auf die DGD zur Verfügung stehen. Die Verknüpfung zu dem Tool ‚Lexical Explorer‘ stellt den Benutzenden außerdem einen direkten Zugriff auf die der Ressource zugrundeliegenden Korpusdaten und eigene erweiterte quantitative Analysemöglichkeiten bereit. Die völlige Neukonzipierung einer lexikografischen Ressource zur Darstellung von gesprochensprachlichen Spezifika ermöglichte in besonderem Maße die konkrete Berücksichtigung von bestimmten empirisch erhobenen Erwartungshaltungen der zukünftigen Benutzenden an so eine neuartige Ressource. Ausgehend von den Daten, die die LeGeDe-Ressource bereitstellt, könnten in Zukunft aus anwendungsorientierter Perspektive heraus u. a. korpusbasierte Lernmaterialien zur konkreten Behandlung spezifischer Phänomene der Lexik in der mündlichen Interaktion für die Nutzung im DaF-, DaZ- und DaM-Unterricht entstehen. Diese Möglichkeit geht konform mit den Anworten der OU zu der künftigen Zielgruppe einer Ressource zum Gesprochenen, da DaF-Lehrende und Lernende sowohl von den L1- als auch von den L2-Befragten als Hauptzielgruppe gesehen wurden (Meliss/Möhrs/Riberiro Silveira 2019a: 108 f.). So kann man durchaus behaupten, dass die LeGeDe-Res-
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
169
source dank der unterschiedlichen Zugriffe auf die Korpusdaten und das strukturierte und selegierte, multimediale Informationsangebot neben ihrem primären Ziel der sprachwissenschaftlichen Dokumentation vielfältige Möglichkeiten für anwendungsorientierte Szenarien bietet. Das Glossar und die Benutzungshinweise, die mit vielen ausführlichen Informationen für die Benutzenden als Außentexte zur Verfügung stehen, leisten dazu u. a. eine optimale Hilfestellung. Bedingung für eine adäquate anwendungsorientierte Nutzung ist allerdings, dass die SprachdidaktikerInnen diese Nutzungsmöglichkeiten kennen (vgl. Fandrych/Meißner/Wallner 2018, Meliss/Möhrs 2018, Meliss 2021). Die Bearbeitung derjenigen Phänomenbereiche, die in dem LeGeDe-Prototypen der ersten Arbeitsphase nicht aufgenommen werden konnten13, könnten zusammen mit der quantitativen Erweiterung der Lemmaanzahl zu den schon behandelten Phänomenen ein breites zukünftiges lexikografisches Arbeitsfeld bieten. Auch die zusätzliche Entwicklung einer erweiterten Suchfunktion u. a. über kategoriale Parameter und kommunikative Funktionen würde besonders dem Wunsch der L2-Befragten der OU entgegenkommen (Meliss/Möhrs/Riberiro Silveira 2019a: 111 f.) und könnte somit gleichzeitig eine Verbindung zu Nachschlagehandlungen für Produktionszwecke im L2-Bereich herstellen. Neben diesen konkreten Desiderata für mögliche weiterführende Arbeiten wäre es wünschenswert, wenn die theoretischen, methodologischen und technischen Grundlagen, die zur Erstellung des LeGeDe-Prototypen entwickelt wurden, in zukünftigen korpusbasierten lexikografischen Projekten zum Gesprochenen in der Interaktion gewinnbringend genutzt und weiterentwickelt werden könnten (Meliss/Möhrs 2020: 29 ff.). Auf diese Weise kann der Kreis von lexikologischer und interaktionslinguistischer Forschung, lexikografischer Umsetzung und Anwendung durch ihre multiplen Wechselwirkungen sinnvoll geschlossen werden.
Literaturangaben Forschungsliteratur Barcala, Mario/Domínguez, Eva/Fernández, Alba/Rivas, Raquel/Santalla, Maria Paula/Vázquez, Victoria/Villapol, Rebeca (2018): El corpus ESLORA de español oral: diseño, desarrollo y explotación. In: CHIMERA: Romance Corpora and Linguistic Studies 5.2, 217–237. Couper-Kuhlen, Elizabeth/Selting, Margret (2018): Interactional Linguistics. Studying language in social interaction. Cambridge etc.: Cambridge University Press.
13 Weitere lexikalische Phänomenbereiche (wie z. B. der Bereich der Wortbildung oder der Bereich der Interjektionen) bilden ebenfalls höchst interessante Felder für die lexikografische Umsetzung von gesprochensprachlichen Spezifika (cfr. Meliss 2020a). Für weitere Ausbau- und Erweiterungsmöglichkeiten soll besonders auf die Ausführungen in Meliss/Möhrs (2020) hingewiesen werden.
170
Meike Meliss
Deppermann, Arnulf (2007): Grammatik und Semantik aus gesprächsanalytischer Sicht. Berlin/ New York: de Gruyter. Deppermann, Arnulf/Proske, Nadine/Zeschel, Arne (2017) (Hrsg.): Verben im interaktiven Kontext. Bewegungsverben und mentale Verben im gesprochenen Deutsch. Tübingen: Narr. Eichinger, Ludwig M. (2017): Gesprochene Alltagssprache. In: Deutsche Akademie für Sprache und Dichtung/Union der deutschen Akademien der Wissenschaften (Hrsg.): Vielfalt und Einheit der deutschen Sprache. Zweiter Bericht zur Lage der deutschen Sprache. Tübingen: Stauffenburg, 283–331. Engelberg, Stefan (2015): Gespaltene Stimuli bei Psych-Verben. Kombinatorische Mustersuchen in Korpora zur Ermittlung von Argumentstrukturverteilungen. In: Engelberg, Stefan, et al. (Hrsg.): Argumentstruktur zwischen Valenz und Konstruktion. Tübingen: Narr, 469–491. Engelberg, Stefan (2018): The argument structure of psych-verbs: A quantitative corpus study on cognitive entrenchment. In: Boas, Hans/Ziem, Alexander (Hrsg.): Constructional approaches to syntactic structures in German. Boston/Berlin: de Gruyter, 47–84. Engelberg, Stefan (2019): Argumentstrukturmuster. Ein elektronisches Handbuch zu verbalen Argumentstrukturen im Deutschen. In: Czicza, Dániel/Dekalo, Volodymyr/Diewald, Gabriele (Hrsg.): Konstruktionsgrammatik VI. Varianz in der konstruktionalen Schematizität. Tübingen: Stauffenburg, 13–38. Engelberg, Stefan/König, Svenja/Proost, Kristel/Winkler, Edeltraud (2011): Argumentstrukturmuster als Konstruktionen? Identität – Verwandtschaft – Idiosynkrasien. In: Engelberg, Stefan/Holler, Anke/Proost, Kristel (Hrsg.): Sprachliches Wissen zwischen Lexikon und Grammatik. Berlin/New York: de Gruyter, 71–112. Engelberg, Stefan/Lemnitzer, Lothar (2009): Lexikographie und Wörterbuchbenutzung. 4. überarbeitete und erweiterte Auflage. Tübingen: Stauffenburg. Engelberg, Stefan/Müller-Spitzer, Carolin/Schmidt, Thomas (2016): Vernetzungs- und Zugriffsstrukturen. In: Klosa, Annette/Müller-Spitzer, Carolin (Hrsg.): Internetlexikografie. Ein Kompendium. Berlin/Boston: de Gruyter, 111–152. Engelberg, Stefan/Storrer, Angelika (2016): Typologie von Internetwörterbüchern und -portalen. In: Klosa, Annette/Müller-Spitzer, Carolin (Hrsg.): Internetlexikografie. Ein Kompendium. Berli/Boston: de Gruyter, 31–63. Fandrych, Christian/Meißner, Cordula/Slavcheva, Adriana (2014) (Hrsg.): Gesprochene Wissenschaftssprache: Korpusmethodische Fragen und empirische Analysen. Heidelberg: Synchron. Fandrych, Christian/Meißner, Cordula/Wallner Franziska (2018): Das Potenzial mündlicher Korpora für die Sprachdidaktik: Das Beispiel GeWiss. In: Deutsch als Fremdsprache 55.1, 3–13. Fandrych, Christian/Meißner, Cordula/Wallner Franziska (2017) (Hrsg.): Gesprochene Wissenschaftssprache –digital. Verfahren zur Annotation und Analyse mündlicher Korpora. Tübingen: Stauffenburg. Fiehler, Reinhard (2016): Gesprochene Sprache. In: Wöllstein, Angelika, (Hrsg.): Duden – Die Grammatik. Unentbehrlich für richtiges Deutsch. Berlin: Dudenverlag, 1181–1260. Handwerker, Brigitte/Bäuerle, Rainer/Sieberg, Bernd (2016) (Hrsg.): Gesprochene Fremdsprache Deutsch. Baltmannsweiler: Schneider. Hansen, Carsten/Hansen, Martin H. (2012): A dictionary of spoken Danish. In: Fjeld, Ruth Vatvedt/ Torjusen, Julie Matilde (Hrsg.): Proceedings of the 15th EURALEX International Congress. 7–11 August 2012. Oslo, Norway. Oslo: Department of Linguistics and Scandinavian Studies, University of Oslo, 929–935. Imo, Wolfgang (2007): Construction Grammar und Gesprochene-Sprache-Forschung. Konstruktionen mit zehn matrixsatzfähigen Verben im gesprochenen Deutsch. Tübingen: Niemeyer.
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
171
Imo, Wolfgang/Moraldo, Sandro M. (2015) (Hrsg.): Interaktionale Sprache und ihre Didaktisierung im DaF-Unterricht. Tübingen: Stauffenburg. Klosa, Annette (2013a): The lexicographical process (with special focus on online dictionaries). In: Gouws, Rufus H., et al. (Hrsg.): Dictionaries. An international encyclopedia of lexikography. Supplementary volume: Recent developments with focus on electronic and computational lexicography. Berlin/Boston: de Gruyter, 517–524. Klosa, Annette (2013b): Aktuelle Tendenzen in der deutschen Lexikographie der Gegenwart. In: Stickel, Gerhard/Váradi, Tamás (Hrsg.): Lexical Challenges in a Multilingual Europe. Contributions to the Annual Conference 2012 of EFNIL in Budapest. Frankfurt am Main: Lang, 75–93. Klosa, Annette/Gouws, Rufus Hjalmar (2015): Outer features in e-dictionaries. In: Lexicographica 31, 142–172. Klosa, Annette/Tiberius, Carole (2016): Der lexikografische Prozess. In: Klosa, Annette/MüllerSpitzer, Carolin (Hrsg.): Internetlexikografie. Ein Kompendium. Berlin/Boston: de Gruyter, 65–110. Lemmenmeier-Batinić, Dolores (2020): Lexical Explorer: Extending access to the Database of Spoken German for user-specific purposes. In: Corpora 15.1, 55–76. Meliss, Meike (2016): Gesprochene Sprache in DaF-Lernerwörterbüchern. In: Handwerker, Brigitte/ Bäuerle, Rainer/Sieberg, Bernd (Hrsg.): Gesprochene Fremdsprache Deutsch. Baltmannsweiler: Schneider, 179–199. Meliss, Meike (2021): Die LeGeDe-Ressource: korpusbasierte lexikografische Einblicke und anwendungsorientierte Ausblicke. In: ZDaF 1/2021, 3–15. Meliss, Meike (2020a): Lexik des gesprochenen Deutsch in der Interaktion: Partikelverben und ihre Besonderheiten. In: García Adánez, Isabel/Gil Valdés, Ma Jesús/Sánchez Hernández, Paloma/ Schilling Rodríguez, Ma Luisa/Szumlakowski Morodo, Irene (Hrsg.): Das Leben in einem Rosa Licht sehen. Festschrift für Rosa Piñel/Homenaje a Rosa Piñel. Bern: Peter Lang, 77–97. Meliss, Meike (2020b): Musterhaftigkeit in der Lexik des gesprochenen Deutsch: eine handlungs- und funktionsorientierte Annäherung mit lexikografischer Anwendungsperspektive. In: Mellado Blanco, Carmen, et al. (Hrsg.): Produktive Muster in der Phraseologie. Monolingual und kontrastiv. Hamburg: Verlag Dr. Kovač, 181–202. Meliss, Meike/Möhrs, Christine (2017): Die Entwicklung einer lexikografischen Ressource im Rahmen des Projektes LeGeDe. In: Sprachreport 4.17, 42–52. Meliss, Meike/Möhrs, Christine (2018): Lexik in der spontanen, gesprochensprachlichen Interaktion: Eine anwendungsorientierte Annäherung aus der DaF-Perspektive. In: GFL 3/2018, 79–110. Meliss, Meike/Möhrs, Christine (2019): Herausforderungen eines innovativen lexikografischen Projekts zu Besonderheiten des gesprochenen Deutsch in der Interaktion. In: Doval, Irene/ Liste Lamas, Elsa (Hrsg.): Germanistik im Umbruch – Linguistik, DaF und Übersetzung. Berlin: Frank & Timme, 13–25. Meliss, Meike/Möhrs, Christine (2020): Der LeGeDe-Prototyp: Zur Erstellung eines korpusbasierten Online-Wörterbuchs zu lexikalischen Besonderheiten im gesprochenen Deutsch. Aktueller Stand und Perspektiven. In: Lexikos 30, 1–41. Meliss, Meike/Möhrs, Christine/Batinić, Dolores/Perkuhn, Rainer (2018a): Creating a List of Headwords for a Lexical Resource of Spoken German. In: Čibej, Jaka/Gorjanc, Vojko/Kosem, Iztok/Krek, Simon (Hrsg.): Proceedings of the XVIII EURALEX International Congress. Lexicography in Global Contexts, 17–21 July, Ljubljana. Ljubljana: Znanstvena založba Filozofske fakultete Univerze v Ljubljani, 1009–1016. Meliss, Meike/Möhrs, Christine/Ribeiro Silveira, Maria (2018b): Erwartungen an eine korpusbasierte lexikografische Ressource zur „Lexik des gesprochenen Deutsch in der Interaktion“: Ergebnisse aus zwei empirischen Studien. In: Zeitschrift für Angewandte Linguistik 68, 103–138.
172
Meike Meliss
Meliss, Meike/Möhrs, Christine/Ribeiro Silveira, Maria (2019a): Anforderungen und Erwartungen an eine lexikografische Ressource des gesprochenen Deutsch aus der L2-Lernerperspektive. In: Lexicographica 34, 89–121. Meliss, Meike/Möhrs, Christine/Ribeiro Silveira, Maria/Schmidt, Thomas (2019b): A corpus-based lexical resource of spoken German in interaction. In: Kosem, Iztok/Zingano Kuhn, Tanara/ Correia, Margarita/Ferreria, José Pedro/Jansen, Maarten/Pereira, Isabel/Kallas, Jelena/ Jakubíček, Miloš/Krek, Simon/Tiberius, Carole (Hrsg.): Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference. 1–3 October 2019, Sintra, Portugal. Brno: Lexical Computing CZ, s.r.o, 783–804. Möhrs, Christine (2020): “Hast du eine Ahnung, . . . ?“ Eine lexikografische und korpusbasierte Untersuchung am Beispiel des Lexems Ahnung. In: Behr, Janina, et al. (Hrsg.): Schnittstellen der Germanistik. Festschrift für Hans Bickes. Berlin: Peter Lang, 185–214. Möhrs, Christine (2021): Quantitative und qualitative Ansätze zu Stichwortkandidaten für die lexikografische Ressource zum gesprochenen Deutsch: LeGeDe. In: Piosik, Michał/Taborek, Janusz/Woźnicka, Marta (Hrsg.): Korpora in der Lexikographie und Phraseologie – Stand und Perspektiven. Berlin/Boston: de Gruyter, 175–195. Möhrs, Christine/Meliss, Meike/Batinić, Dolores (2017): LeGeDe – towards a corpus-based lexical resource of spoken German. In: Kosem, Iztok, et al. (Hrsg.): Electronic Lexicography in the 21st century. Proceedings of eLex 2017 Conference. 19–21 September 2017. Leiden, the Netherlands. Brno: Lexical Computing CZ s.r.o., 281–298. Möhrs, Christine/Torres Cajo, Sarah (2020): The microstructure of a lexicographical resource of spoken German: meanings and functions of the lemma eben. In: Rasprave: Journal of the Institute of Croatian Language and Linguistics 46/2, 921–939. Moon, Rosamund (1998): On using spoken data in corpus lexicography. In: Fontenelle, Thierry, et al. (Hrsg.): Proceedings of the 8th EURALEX International Congress. 4–8 August 1998. Liège, Belgium. Liège: English and Dutch Departments, University of Liège, 347–355. Moraldo, Sandro M./Missaglia, Federica (2013) (Hrsg.): Gesprochene Sprache im DaF-Unterricht. Grundlagen – Ansätze – Praxis. Heidelberg: Winter. Reeg, Ulrike/Gallo, Pasquale/Moraldo, Sandro M. (2012) (Hrsg.): Gesprochene Sprache im DaFUnterricht. Zur Theorie und Praxis eines Lerngegenstandes. Berlin: Waxmann. Schmidt, Thomas (2014a): The Research and Teaching Corpus of Spoken German – FOLK. In: Calzolari, Nicoletta, et al. (Hrsg.): Proceedings of the 9th International Conference on Language Resources and Evaluation. 26–31 May 2014. Reykjavik, Iceland. Reykjavik: European Language Resources Association, 383–387. Schmidt, Thomas (2014b): Gesprächskorpora und Gesprächsdatenbanken am Beispiel von FOLK und DGD. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 15, 196–233. Schmidt, Thomas (2017): DGD –Die Datenbank für Gesprochenes Deutsch. Mündliche Korpora am Institut für Deutsche Sprache (IDS) in Mannheim. In: Zeitschrift für Germanistische Linguistik 45, 451–463. Schwitalla, Johannes (2012): Gesprochenes Deutsch. Eine Einführung. 4. Aufl. Berlin: Schmidt. Selting, Margret/Auer, Peter/Barth-Weingarten, Dagmar u. a. (2009): Gesprächsanalytisches Transkriptionssystem 2 (GAT2). In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 10, 353–402. Sieberg, Bernd (2013): Sprechen lehren, lernen und verstehen. Stufenübergreifendes Studien- und Übungsbuch für den DaF-Bereich. Tübingen: Julius Groos. Siepmann, Dirk (2015): Dictionaries and spoken language: A corpus-based review of French dictionaries. In: International Journal of Lexicography 28, 139–168.
Informationsspektrum und Angabeklassen in der lexikografischen Ressource LeGeDe
173
Trap-Jensen, Lars (2004): Spoken language in dictionaries: Does it really matter? In: Williams, Geoffrey/Vessier, Sandra (Hrsg.): Proceedings of the 11th EURALEX International Congress. 6–10 July 2004. Lorient, France. Lorient: Faculté des Lettres et des Sciences Humaines, Université de Bretagne Sud, 311–318. Trim, John/North, Brian/Coste, Daniel (2001): Gemeinsamer europäischer Referenzrahmen für Sprachen: lernen, lehren, beurteilen. Niveau A1, A2, B1, B2, C1, C2. Berlin: Langenscheidt. Verdonik, Darinka/Sepesy Maučec, Mirjam (2017): A speech corpus as a source of lexical information. In: International Journal of Lexicography 30, 143–166. Wiegand, Herbert Ernst (1989a): Arten von Mikrostrukturen im allgemeinen einsprachigen Wörterbuch. In: HSK 1, 462–501. Wiegand, Herbert Ernst (1989b): Der Begriff der Mikrostruktur: Geschichte, Probleme, Perspektiven. In: HSK 1, 409–462.
(Online)Wörterbücher Duden-online: Dudenredaktion (o.J.): Online unter: [letzter Zugriff: 13.08.2019]. DWDS = Das Wortauskunftssystem zur deutschen Sprache in Geschichte und Gegenwart. [Online unter: ; letzter Zugriff: 13.08.2019]. E-VALBU: Elektronisches Valenzwörterbuch deutscher Verben. IDS-Mannheim. Online unter: [letzter Zugriff: 13.08.2019]. Götz, Dieter (Hrsg.) (2015): Langenscheidt Großwörterbuch Deutsch als Fremdsprache: das einsprachige Wörterbuch für alle, die Deutsch lernen. (Neubearbeitung) Unter Zusammenarbeit mit der Langenscheidt-Redaktion. München: Langenscheidt. (=LGWB-DaF) LeGeDe = Lexik des gesprochenen Deutsch (2019). [Online unter: ; letzter Zugriff: 13.11.2020]. Schumacher, Helmut/Kubczak, Jacqueline/Schmidt, Renate/de Ruiter, Vera (2004): VALBU. Valenzwörterbuch deutscher Verben. Tübingen: Narr (Studien zur Deutschen Sprache 31). = VALBU
Sonstige Onlinequellen DeReKo = Deutsches Referenzkorpus 2017-I (Release 08.03.2017). Mannheim: Institut für Deutsche Sprache. [Unter: ; letzter Zugriff: 13.08.2019]. DGD = Datenbank für gesprochenes Deutsch (2012). [Unter: ; letzter Zugriff: 13.08.2019]. FOLK = Forschungs- und Lehrkorpus Gesprochenes Deutsch (Release 2.11 vom 30.11.2018). Mannheim: Institut für Deutsche Sprache. [Unter: ; letzter Zugriff: 13.08.2019]. LeGeDe-Projektwebseite. [Unter: ; letzter Zugriff: 13.08.2019].
Christine Möhrs
Quantitative und qualitative Ansätze zu Stichwortkandidaten für die lexikografische Ressource zum gesprochenen Deutsch: LeGeDe Abstract: In this paper, the basic assumptions are presented against the background of the development of a corpus-based method to determine suitable headword candidates for the LeGeDe-prototype (LeGeDe= Lexik des gesprochenen Deutsch), a lexicographical resource on spoken German. In a first quantitatively oriented step, potential one-word headword candidates are identified with the help of frequency class comparisons from a corpus for spoken (FOLK) and a subset from a corpus for written German (DEREKO). Qualitative analyses based on a project-specifically defined sample of data from the FOLK corpus lead to multi-word headword candidates. The results of the qualitative analyses were also compared with the results of studies from the research literature as well as (quantitative-orientated) bi- and trigram analyses. In their multi-word form, these candidates are particularly characterized by the fact that they assume a very special interactional function in the (authentic) interaction and have to be described as a whole unit. The paper explains this combined procedure, which was extracted in the LeGeDe-project for the appointment of headword candidates. Keywords: online dictionary, headword candidates, spoken German in interaction, corpus-based methods Schlagwörter: Onlinewörterbuch, Stichwortkandidaten, gesprochenes Deutsch in der Interaktion, korpubasierte Methoden
1 Einleitung Die Ressource, mit der sich dieser Beitrag beschäftigt, entstand im Rahmen des von der Leibniz-Gemeinschaft (Leibniz-Wettbewerb 2016, Förderlinie 1: Innovative Projekte) finanzierten Drittmittelprojektes1 „Lexik des gesprochenen Deutsch“
1 AntragstellerInnen des Projektes waren: Annette Klosa-Kückelhaus, Arnulf Deppermann, Stefan Engelberg und Thomas Schmidt (IDS Mannheim). Christine Möhrs, Leibniz-Institut für Deutsche Sprache, Mannheim, [email protected] https://doi.org/10.1515/9783110716955-009
176
Christine Möhrs
(LeGeDe)2. Die Laufzeit des Projektes betrug drei Jahre und wurde am Leibniz-Institut für Deutsche Sprache (IDS) in Mannheim als Kooperationsprojekt der Abteilung „Lexik“ und der Abteilung „Pragmatik“ (vgl. Meliss/Möhrs 2017; Möhrs/Meliss/Batinić 2017; Meliss et al. 2019b) durchgeführt. Die Zusammenarbeit der beiden Abteilungen ermöglichte eine Verbindung der entsprechenden Fachkompetenzen, die für die Schaffung einer korpusbasierten lexikografischen Ressource des gesprochenen Deutsch im Zusammenspiel notwendig ist. Das Projektteam setzte sich aus Forschern mit den Schwerpunkten Lexikographie, Korpuslinguistik und interaktionale Linguistik zusammen, um die verschiedenen Perspektiven umzusetzen. Die Arbeitsthesen im Projekt lassen sich mit vier Grundannahmen zusammenfassen: (i) Die erste Annahme ist, dass es auf verschiedenen Ebenen Unterschiede im Lexikon des gesprochenen vs. geschriebenen Deutsch gibt – dies wird seit mehreren Jahren in der Forschungsliteratur postuliert und ist in Einzelstudien nachgewiesen worden (vgl. u. a. Schwitalla 2012; Deppermann/Proske/Zeschel 2017; Günthner 2017; Bergmann 2017; Helmer/Deppermann 2017). (ii) Zweitens kann nachgewiesen werden, dass die lexikografische Dokumentation interaktionstypischer Besonderheiten des gesprochenen Deutsch in bislang sowohl gedruckt als auch online publizierten Wörterbüchern unzureichend ist (vgl. u. a. Meliss/Möhrs/Ribeiro Silveira 2018b; Meliss/Möhrs 2018). (iii) Drittens zeigen Forschungsergebnisse, dass ein systematischer Informationsbedarf über gesprochenes Deutsch für den Unterricht und im Hinblick auf Lehrmaterialien besteht – sowohl für Muttersprachler als auch für Nicht-Muttersprachler des Deutschen (vgl. u. a. Handwerker/Bäuerle/Sieberg 2016; Meliss 2016). (iv) Schließlich gibt es nur sehr wenige Projekte, die sich der gesprochenen Sprache aus lexikografischer Perspektive widmen. Es gibt ein kleines Projekt zum gesprochenen Dänisch (vgl. Hansen/Hansen 2012), das sich auf Interjektionen konzentriert, und es gibt theoretische Überlegungen zum gesprochenen Slowenisch (vgl. Verdonik/Sepesy Maučec 2017). Die Entwicklung eines Wörterbuches für lexikalische Besonderheiten des gesprochenen Deutsch stellte daher ein innovatives Vorhaben dar. Neben dem Hauptziel – der Entwicklung einer online verfügbaren korpusbasierten lexikografischen Ressource zur Lexik des gesprochenen Deutsch – können weitere Teilziele des LeGeDe-Projektes formuliert werden: (1) Die Bestimmung der Besonderheiten des Sprachgebrauchs auf verschiedenen Ebenen (Form, Inhalt/Funktion, Gesprächssituation etc.), mit Schwerpunkt auf lexikalischen Besonderheiten.
2 LeGeDe-Projektwebseite [Unter: ; letzter Zugriff: 27.01.2021].
Quantitative und qualitative Ansätze zu Stichwortkandidaten
177
(2) Die Entwicklung weiterer (korpus-)linguistischer Methoden zur Analyse und Strukturierung gesprochener Sprachdaten. (3) Die Entwicklung innovativer Arten lexikographischer Informationen, die sich auf die Funktion lexikalischer Einheiten in interaktionalen Kontexten beziehen. (4) Und die Integration der lexikografischen Ressource in das Wörterbuchportal OWIDplus3. Der Schwerpunkt dieses Beitrags liegt in der Darstellung, welche Grundannahmen zu Stichwortkandidaten für die LeGeDe-Ressource angesetzt wurden (vgl. Abschnitt 2). Außerdem wird erläutert, welche (korpusbasierten) Methoden zur Ermittlung von Stichwortkandidaten projektspezifisch herangezogen wurden. Auf Basis der beschriebenen Methode wird der Stichwortkandidatenansatz für die Ressource näher erläutert. Dabei wird deutlich, dass im LeGeDe-Projekt ein kombiniertes Verfahren aus quantitativen und qualitativen Methoden zur Definition von Stichwortkandidaten angesetzt wurde (vgl. Abschnitt 3). Abschnitt 4 geht konkret auf die Auswahl an Stichwörtern im LeGeDe-Prototyp ein und zeigt, welche Kandidaten im LeGeDePrototyp ausführlich beschrieben sind. Einige abschließende Bemerkungen runden den Beitrag ab (vgl. Abschnitt 5).
2 Grundannahmen: Stichwortkandidaten Eine der zentralen Forschungs- und Methodikfragen, mit denen sich das LeGeDeProjekt beschäftigt hat, steht in Verbindung mit der Identifizierung typisch gesprochen-sprachlicher Lexik. In einem direkten Bezug zu den distinktiven Merkmalen der Lexik der geschriebenen vs. der gesprochenen Sprache in der Interaktion steht die Erstellung einer Stichwortliste (vgl. u. a. Klosa 2013a, Klosa 2013b, Klosa/Tiberius 2016, Klosa/Schnörch/Schoolaert 2010, Schnörch 2005, Stadler 2014, Wiegand 1983) mit Kandidaten für die LeGeDe-Ressource. Die Kandidaten sollen möglichst typische Phänomene des Gesprochenen in der natürlichen, spontanen Interaktion aufweisen und sich quantitativ deutlich von der geschriebenen Sprache abgrenzen. Die Datengrundlage des LeGeDe-Projektes für gesprochen-sprachliche Interaktionen stellt das „Forschungs- und Lehrkorpus Gesprochenes Deutsch“4 (= FOLK) dar, das am IDS erstellt wurde und stetig erweitert und gepflegt wird. FOLK ist integriert in das „Archiv für Gesprochenes Deutsch“5 (= AGD) und ist über die „Datenbank für
3 OWIDplus [Unter: ; letzter Zugriff: 27.01.2021]; LeGeDePrototyp [Unter: ; letzter Zugriff: 27.01.2021]. 4 FOLK [Unter: ; letzter Zugriff: 27.01.2021]. 5 AGD [Unter: ; letzter Zugriff: 27.01.2021].
178
Christine Möhrs
Gesprochenes Deutsch“6 (= DGD) abrufbar (vgl. Schmidt 2014a). Das Korpus beinhaltet Gesprächsaufnahmen und Transkripte im deutschsprachigen Raum in unterschiedlichen privaten, institutionellen und öffentlichen Kontexten (vgl. Schmidt 2014b; Schmidt 2014c). Es stellt in einzigartiger Weise die Gesprächswirklichkeit des Deutschen in ihrer Vielfalt dar und erweist sich als geeignete Datengrundlage für den LeGeDe-Prototyp, da es die mündliche Interaktion u. a. durch folgende Merkmale gut reflektiert: (1) medial mündlich, (2) authentisch (nicht elizitiert), (3) spontan (nicht vorbereitet), (4) ‚aktuell‘ (Aufnahmen ab 2003, Großteil nach 2010), (5) standardnah. FOLK ist das größte Korpus für das gesprochene Deutsch in der Interaktion, reflektiert den technischen und methodischen ‚State of the art‘, bietet vier Annotationsebenen (cGAT-Transkript, Normalisierung, Lemmatisierung, PoS) an, beinhaltet detaillierte Metadaten zu SprecherInnen und Gesprächsereignissen und ermöglicht eine strukturierte Tokensuche mit Konkordanzen. Grundsätzlich ging es im LeGeDe-Projekt vor allem um jene Phänomene, die als „standardnah“ eingeordnet werden können – in dem Sinne, dass keine Dialekte (wie bayerisch), Soziolekte (wie Jugendsprache) oder Idiolekte berücksichtigt wurden. Das vordergründige Interesse galt solchen Phänomenen des gesprochenen Deutsch, die häufiger oder anders als im geschriebenen Deutsch verwendet werden (z. B. hinsichtlich Bedeutung oder Funktion in der verbalen Interaktion). Einerseits können unter Berücksichtigung dieser Grundannahmen einzelne sprachliche Ausdrücke definiert werden, die diesen Kriterien entsprechen. Andererseits lassen sich auf Grund dieser Annahmen auch bestimmte Phänomenbereiche und dabei auch teils Wortklassenbereiche abstecken, in denen sich Einzelausdrücke in Gruppen zusammenfassen lassen. Die Tab. 1 zeigt eine Auswahl von relevanten Bereichen/Wortklassen, die für die weiteren Analysen und die Methodenfindung im LeGeDe-Projekt eine wichtige Rolle gespielt haben (vgl. dazu auch Möhrs/Meliss/ Batinić 2017: 283; Meliss/Möhrs 2017: 42–44). In Ergänzung zu Erkenntnissen aus der Forschungsliteratur (vgl. u. a. Bergmann 2017, Günthner 2018, Helmer/Deppermann 2017, Helmer/Deppermann/Reineke 2017, Imo 2007, Zeschel 2017) wurden im LeGeDe-Projekt korpusbasierte quantitative Methoden entwickelt, um den Stichwortkandidatenansatz für eine Ressource zum gesprochenen Deutsch im Abgleich mit geschrieben-sprachlichen Daten auch aus dieser
6 DGD [Unter: ; letzter Zugriff: 27.01.2021].
Quantitative und qualitative Ansätze zu Stichwortkandidaten
179
Tab. 1: Phänomenbereiche/Wortklassen mit typisch gesprochensprachlichen Beispielen. Phönomenbereich/Wortklasse
Beispiel
Verben Entlehnungen Wortbildung Passepartoutwörter Teilsynonyme Gesprächswörter Diskurspartikeln (i. w. S.) Formeln, Muster, Konstruktionen
ich dachte, guck, meinste okay, cool rum-, mega-, -mäßig machen, tun gucken/schauen/sehen eben, äh gut, sicher guck mal, alles klar
quantitativen Perspektive zu unterstützen. Der korpusbasierte Ansatz zur Definition geeigneter Stichwortkandidaten im LeGeDe-Projekt wird in Abschnitt 3 näher beleuchtet.
3 Korpusbasierte Methoden: Der Stichwortkandidatenansatz im LeGeDe-Projekt Für die Erstellung einer Stichwortkandidatenliste wurde im LeGeDe-Projekt eine korpusbasierte und interpretative Methode entwickelt (vgl. dazu auch Meliss et al. 2018a), mit der die wichtigsten Kandidaten der typischen gesprochenen Lexik in der Interaktion aufgedeckt werden konnten.7 Der Vergleich zur Schriftsprache des Deutschen erfolgte über eine Teilmenge aus dem „Deutschen Referenzkorpus“8 (= DEREKO) (vgl. z. B. Kupietz/Keibel 2009; Kupietz et al. 2018). Das frequenzgesteuerte korpusbasierte Verfahren, bei dem die Häufigkeitsklassen der Lemmata aus FOLK und aus DEREKO ermittelt und diese dann in einem direkten Vergleich betrachtet werden können, ist über das frei zugängliche Tool LEXICAL EXPLORER9 nachvollziehbar (vgl. Lemmenmeier-Batinić 2020). Für das Verfahren wurde ein quantitativer Lemmavergleich zwischen FOLK und DEREKO durchgeführt. Zur Berechnung der Unterschiede in der Lemmaverteilung in
7 Für umfängliche Beratung, Unterstützung und Mitarbeit zu diesem Themenkomplex dankt das LeGeDe-Team ausdrücklich den Kollegen Rainer Perkuhn, Cyril Belica und Marc Kupietz (aus dem Programmbereich „Korpuslinguistik“ der Abteilung „Digitale Sprachwissenschaft“ am IDS). 8 DEREKO [Unter: ; letzter Zugriff: 27.01.2021]. 9 LEXICAL EXPLORER [Unter: ; letzter Zugriff: 27.01.2021]. Das Tool LEXICAL EXPLORER wurde von Dolores Lemmenmeier (geb. Batinić) im Rahmen des LeGeDe-Projektes entwickelt.
180
Christine Möhrs
den beiden zu vergleichenden, sehr unterschiedlich großen Korpora wurden verschiedene Effektgrößenmaße (odds ratio, %diff, relative risk, binary log of relative risk und Häufigkeitsklassen) und Maße der statistischen Signifikanz (Log-LikelihoodRatio und Chi-Quadrat) verwendet. Anschließend wurde die Tabelle mit dem Lemmavergleich in das Tool LEXICAL EXPLORER integriert, um die Daten schnell und einfach einsehen, filtern und sortieren zu können. Mit Hilfe dieses Tools können die Stichwortkandidaten automatisch strukturiert und verschiedene Filterparameter an die Rechercheinteressen der Benutzenden angepasst werden. Darüber hinaus wurde für jedes Lemma ein direkter Link zu den Korpusbeispielen in FOLK angelegt.10 Nach der Untersuchung der Ergebnisse verschiedener Messungen des Frequenzvergleichs wurde die Differenz der „Häufigkeitsklassen“ (= HK) (vgl. Keibel 2008, 2009) für die weiteren Vergleiche ausgewählt. Es handelt sich um eine Messung, die sich an der Wortverteilung an Zipfs Gesetz orientiert, das in der deutschen Lexikografie verwendet wird (vgl. Klosa 2013b). Da auch die anderen Messungen, die häufig für den Lemma-Frequenzvergleich verwendet werden, in das Tool integriert wurden, können die Auswirkungen anderer Messungen aber auch weiterhin untersucht und in Studien miteinander verglichen werden. Für den Häufigkeitsklassenvergleich wurden die häufigsten Wörter in einem Korpus in der Häufigkeitsklasse 0 eingeordnet. Die Wörter, die etwa halb so häufig sind, werden der Klasse 1, die Wörter, die etwa halb so häufig sind wie die in der Klasse 1, entsprechend der Klasse 2 zugeordnet etc. Für DEREKO konnten mit diesem Verfahren 36 und für FOLK 16 Häufigkeitsklassen ermittelt werden. Der unterschiedliche Wert der Häufigkeitsklassen zweier Korpora, der sich bei einem Vergleich der Korpora ergibt, wird als die „Differenz der Häufigkeitsklassen“ (fc_diff = fc(dereko) – fc(folk)) bezeichnet. Da z. B. das Lemma kriegen in FOLK in der Klasse 5 und in DEREKO in der Klasse 12 liegt, beträgt die Differenz zwischen den Klassen den Wert 7 (fc_diff) und erweist sich so zunächst durch die hohe Häufigkeitsklassendifferenz als möglicher Stichwortkandidat (vgl. Abb. 1). Da das Hauptaugenmerk der LeGeDe-Ressource besonders auf den Lemmata liegt, die in FOLK häufig vorkommen, wurden die relevanten Kandidaten für die LeGeDe-Stichwortkandidatenliste durch die Auswahl der Lemmata mit der FOLK fc kleiner als 9 und DEREKO fc kleiner als 15 ausgefiltert. Durch die Einstellung dieser Filterparameter konnten außerdem diejenigen Lemmata herausgefiltert werden, die zwar einen hohen fc_diff haben, aber in beiden Korpora dennoch selten sind, wie z. B. Spinosaurus mit einem fc_diff von 7 (fc 15 in FOLK und fc 22 in DEREKO). Andere Lemmata wie z. B. Proseminar, Transistor oder Schornsteinfeger wurden mit
10 Eine Voraussetzung, um die Korpusbeispiele aus FOLK über den LEXICAL EXPLORER einsehen zu können, ist ein persönlicher Account bei der DGD. Dieser kann kostenlos beantragt werden (DGDRegistrierung [Unter: ; letzter Zugriff: 27.01.2021]).
Quantitative und qualitative Ansätze zu Stichwortkandidaten
181
Abb. 1: Ausschnitt aus dem LEXICAL EXPLORER zu kriegen11.
diesem Verfahren ebenfalls ausgeschlossen. Obwohl diese Lemmata eine hohe Häufigkeitsdifferenz zwischen beiden Korpora aufweisen, werden sie nicht in die Stichwortkandidatenliste aufgenommen, da sie in FOLK nur eine geringe absolute Frequenz aufweisen. Nachdem die Lemmaliste nach dem absteigenden fc_diff sortiert wurde, konnten 322 Einwortlemmata (Stand: 2018), deren fc_diff mindestens den Wert 2 betrug, die als mögliche Stichwortkandidaten erzielt wurden, manuell untersucht werden.12 Bei der Durchsicht wurde geprüft, ob sie wirklich geeignete Stichwortkandidaten für die LeGeDe-Ressource sind. In diesem Schritt wurden Lemmata, die in sehr spezifischen Kontexten oder Transkripten in FOLK auftreten, wie z. B. Zentimeter (Maptask) und Dialekt (sprachbiografische Interviews), manuell aussortiert. Die Top-25 der möglichen Stichwortkandidaten (vgl. Abb. 2) vermitteln einen ersten Eindruck von denjenigen Kandidaten, die für die LeGeDe-Ressource grundsätzlich relevant waren. Die hohe Häufigkeitsklassendifferenz bei den Interjektionen (ah, ach, oh), Modalpartikeln (ja, halt), Gesprächspartikeln (okay, ja, na) und Verben (gucken, kriegen) weist mit der beschriebenen quantitativen Perspektive auf Besonderheiten im Gesprochenen vs. Geschriebenen hin, die in weiteren Schritten durch qualitative Studien im LeGeDe-Projekt in Auswahl genauer analysiert wurden. Die Kombination aus automatisierten, quantitativen Verfahren und manueller, qualitativer Analyse der Korpusdaten hat sich als effektiver Weg erwiesen, um die Stichwortkandidatenauswahl für eine Ressource zu Spezifika der Lexik des gesprochenen Deutsch anzugehen. Die quantitative Auswahl der behandelten Stichwörter aus der umfangreichen Stichwortkandidatenliste einer jeden lexikografischen Ressource bezieht sich auf
11 „Study corpus“ steht für FOLK, PoS für „Part of Speech“. 12 Auf den Webseiten des LeGeDe-Prototyps [Unter: ; letzter Zugriff: 27.01.2021) kann unter der Rubrik „Über LeGeDe“ auch die Liste der 322 Stichwortkandidaten (Stand 2018) abgerufen werden. Auf der Basis dieser Liste wurden die Stichwörter ausgewählt, die dann im LeGeDe-Prototyp ausführlich beschrieben sind.
182
Christine Möhrs
Abb. 2: Top 25 der möglichen Stichwortkandidaten dargestellt mit einem Ausschnitt aus dem LEXICAL EXPLORER mit der höchsten fc_diff zwischen FOLK und DEREKO (Stand 2018)13.
den anvisierten Umfang der Ressource und seine statische vs. dynamische „Dictionary under construction“-Konzeption (vgl. Atkins/Rundell 2008: 160 ff.; Klosa 2013b: 518; Schnörch 2005: 71). Da die LeGeDe-Ressource zunächst als lexikografischer
13 Erläuterung zur Abb. 2: Top 25 Lemmata mit der höchsten fc_diff zwischen FOLK und DEREKO, mit FOLK fc (FOLK HK) kleiner als 9, DEREKO fc (DEREKO HK) kleiner als 15 und fc_diff von mindestens 2 Klassen. HK Diff steht für fc_diff; Filter:1 steht für die Lemmata, die für die Stichwortliste berücksichtigt wurden (ausgeschlossen werden mit dem Auswählen dieses Parameters Ziffern, Eigennamen, etc.); PoS steht für „Part of Speech“, mit dem ein Lemma in FOLK auftritt.
Quantitative und qualitative Ansätze zu Stichwortkandidaten
183
Prototyp geplant wurde, erfolgte die Auswahl der behandelten Stichwörter aus der Stichwortkandidatenliste nach Kriterien in Zusammenhang mit dem Anspruch, eine Bandbreite von unterschiedlichen Phänomenen bzw. Phänomenbereichen anzubieten und dabei gleichzeitig auch die Möglichkeit zu haben, Ergebnisse aus wissenschaftlichen Teilstudien berücksichtigen zu können. Mit der oben beschriebenen Methode konnten Lemmata, die verschiedene Phänomenbereiche abdecken, wie u. a. Partikeln, Interjektionen, Routineformeln, Vagheitsausdrücke, deiktische Ausdrücke und Lemmata mit Besonderheiten in Bezug auf ihre Kombinatorik, Stil und Register etc. identifiziert werden. Diese für die gesprochene Sprache relevanten Bereiche wurden zum großen Teil bereits in der Forschungsliteratur als typische Phänomene des Gesprochenen aufgelistet (vgl. u. a. Schwitalla 2012; Fiehler 2016) und in Einzelstudien ausführlich beschrieben. Als korpusbasierter Nachweis für die Durchgängigkeit dieser Phänomene in der gesprochenen Sprache kann bereits die Liste der Top 25 Lemmata mit dem höchsten fc_diff dienen (vgl. den Ausschnitt in Abb. 2). So sind beispielsweise (i) die Modalpartikeln wie halt und mal sowie (ii) Interjektionen wie ah, ach, oh, oh, eh im gesprochenen Deutsch sehr verbreitet, aber ihre funktionale und interaktionale Beschreibung in den gängigen Wörterbüchern bis jetzt nur unzureichend abgedeckt. (iii) Die Lemmata irgendetwas, irgendwie und sozusagen, die auch in der Liste der Top 25 vorkommen, zeugen von einem vorherrschenden Gebrauch von Vagheitsausdrücken in der gesprochenen Alltagssprache. Weitere Beispiele für Lemmata, die in der Stichwortliste als mögliche Kandidaten identifiziert werden konnten, sind (iv) „Passepartout“Wörter wie Ding, Sache, machen, tun. Darüber hinaus wurden mehrere (v) lexikalische Alternativen zu den Ausdrücken des geschriebenen Standarddeutschen ausfindig gemacht (z. B. kriegen vs. bekommen). Bei der Untersuchung der Adverbien in der Gesamtliste der 322 Stichwortkandidaten konnten auch verschiedene Arten von (vi) deiktischen Ausdrücken, wie z. B. temporäre (nachher, jetzt) und lokale Adverbien (da, hier) identifiziert werden, die in der gesprochenen Sprache eine besondere Rolle einnehmen. (vii) Einige Adjektive, wie z. B. gut, klar, cool, toll, super, fertig, geil, krass, ehrlich, schön, die eine hohe Differenz im Häufigkeitsklassenvergleich aufweisen, sind ebenfalls Gegenstand des Interesses, da sie in der gesprochenen Sprache neben anderen Funktionen auch als Diskurspartikel fungieren können. Außerdem konnten mit der beschriebenen korpusbasierten Methode (viii) mehrere verbale Lemmata identifiziert werden, die verschiedenen semantischen Untergruppen zugeordnet werden können, wie z. B. die der Verben der Wahrnehmung (visuell, auditiv: gucken, schauen, sehen, hören), mentale Verben und Verben der Kognition (wissen, glauben, denken, meinen, überlegen, verstehen, kennen), Verben der Fortbewegung (gehen), Verben der Kommunikation (reden, sagen, fragen), Verben der Emotion (mögen, gefallen) und Modalverben (können, müssen). Qualitative Einzelstudien zeigen, dass die Verben dieser semantischen (Sub-)Klassen ein wichtiges Potenzial in interaktionalen Kontexten besitzen und mehrere spezielle Bedeutungen, Funktionen und
184
Christine Möhrs
formale Besonderheiten aufweisen (vgl. u. a. Blühdorn et al. 2017; Deppermann/ Proske/Zeschel 2017; Imo 2007). Die Erkennung von Einwort-Lemmata ist allerdings nur der erste Schritt für die Definition von Stichwortkandidaten, um Besonderheiten der Lexik des gesprochenen Deutsch in der Interaktion darzustellen. Darüber hinaus können diese EinwortLemmata die lexikalische Grundlage zahlreicher Mehrwortlemmata bzw. musterhafter Verwendungsweisen bilden (z. B. ich weiß nicht, was weiß ich, guck mal, keine Ahnung), die als mehrteilige Stichwortkandidaten berücksichtigt werden können. Eine genauere Untersuchung der durch das beschriebene Verfahren ermittelten Stichwortkandidaten für die LeGeDe-Ressource verweist auf verschiedene Phänomene bzw. Phänomenbereiche, die sich auch durch Rückbezüge zu einschlägigen wissenschaftlichen Studien (vgl. u. a. Bergmann 2017; Betz 2017; Betz/Deppermann 2018; Blühdorn 2019; Günthner 2018; Helmer/Deppermann 2017; Helmer/Deppermann/Reineke 2017; Imo 2007; Reineke 2016; Wegner 2015; Weidner 2015) als besonders gesprochen-sprachlich relevant identifizieren ließen und daher für den LeGeDe-Prototypen ausgewählt wurden. (i) Im Verbalbereich sind aus formal-inhaltlicher und interaktionaler Perspektive u. a. Verwendungsformen mit Distributionsbeschränkungen in der Verbalmorphologie wie z. B. bei gucken: guck (Modus: Imperativ) und wissen: du weißt/ weißt du → weißte (Verschmelzungen bzw. Komplementierungsmuster) für den LeGeDe-Prototyp von Interesse gewesen. (ii) Relevant waren auch zahlreiche Verwendungsmuster u. a. in Form eines Verbalsyntagmas (guck mal, mal schauen, was weiß ich, ich weiß nicht etc.) oder eines Nominalsyntagmas (keine Ahnung), die im interaktionalen Kontext eine spezifische Funktion besitzen. (iii) Die Verwendung von Teilsynonymen wie z. B. von kriegen vs. bekommen/erhalten oder von gucken bzw. schauen vs. sehen ist insbesondere aus der Perspektive von Stil und Register und in Verbindung mit ihrem unterschiedlichen Kombinationspotenzial interessant. (iv) Die für die gesprochene Sprache typischen Diskurspartikeln und Modalpartikeln bilden ebenfalls einen umfangreichen Bereich des anvisierten Gegenstandsbereiches, für den zunächst für den LeGeDe-Prototypen gut und schön einerseits und eben, halt und ja andererseits ausgewählt wurden. Folgende weitere wichtige Phänomenbereiche konnten für den entwickelten LeGeDe-Prototyp in der ersten Phase nicht bearbeitet werden, bilden aber weitere interessante Bereiche für lexikografische Überlegungen gesprochen-sprachlicher Phänomene: (v) Im Bereich der Entlehnungen – sowohl aus anderen Sprachen (Anglizismen: cool, okay etc.) als auch aus deutschen Sprachvarietäten (soziolektal: geil, krass, Mama, wieso etc.) – zeigen sich interessante, gesprochen-sprachliche Phänomene, die u. a. in Zusammenhang mit ihrer Gebrauchsfrequenz, dem
Quantitative und qualitative Ansätze zu Stichwortkandidaten
185
Vorkommen in bestimmten Interaktionstypen, den Sprechendengruppen, der grammatischen Integration und der phonetischen Realisierung stehen. (vi) Im Bereich der Wortbildung lassen sich u. a. zahlreiche Affixe mit formalen Besonderheiten und/oder neuen Bedeutungsnuancen verbuchen (vgl. Meliss 2020): a) rum- (-ärgern, -blödeln, -gammeln, -hängen, -laufen, -machen, -sitzen etc.), b) rein- (-bringen, -gehen, -kommen, -machen, -passen, -tun etc.), c) rauf- (-gehen, -schmieren etc.), d) mega- (-crazy, -einfach, -gut, -krass, -lang, -schlecht, -schwer, -stressig, -viel etc.), a) super- (-cool, -easy, -gut, -lecker, -safe, -schön, -toll, -viel etc.), f) sau- (-blöd, -dumm, -geil, -gut, -teuer etc.), g) -mäßig (alters-, freizeit-, hobby-, kosten-, vereins-, zahlen- etc.). (vii) Die Untersuchung zu Gebrauch und Bedeutung von Passepartoutwörtern (machen, tun, Ding, Sache etc.) sowie von Ausdrücken und Formeln der Vagheit (irgend [-wann, -was, -wie, -wo] etc.) stehen v. a. in Verbindung mit der Bedeutungskonstituierung in der Interaktion. (viii) Die für die gesprochene Sprache in der Interaktion besonders typischen Interjektionen (ach, ah, oh etc.) sind weitere interessante Kandidaten für eine lexikografische Ressource zum Gesprochenen in der Interaktion. Auch in den durchgeführten projektbegleitenden empirischen Befragungen wurde der Gegenstandsbereich einer zukünftigen lexikografischen Ressource des gesprochenen Deutsch thematisiert (vgl. dazu die Information unter „Empirische Forschung“ auf der LeGeDe-Webseite14 sowie eine ausführliche Darstellung in Meliss/ Möhrs/Ribeiro Silveira 2018b; Meliss/Möhrs/Ribeiro Silveira 2019a). Diesbezüglich konnte daher u. a. an die Ergebnisse der Frage „Welche Art von Stichwörtern würden Sie in einem WB des gesprochenen Deutsch erwarten?“ aus der im LeGeDe-Projekt durchgeführten Onlineumfrage (= OU) angeknüpft werden, die besonders den Wunsch nach Stichwörtern, die – im Vergleich zur geschriebenen Sprache – eine spezifische Kombinatorik aufweisen, deutlich unterstreichen. Jeweils rund drei Viertel aller Befragten der OU erwarten in einem Wörterbuch des gesprochenen Deutsch sowohl Stichwörter, die eine formelhafte Verwendung besitzen, als auch Stichwörter mit einem anderen Kombinationspotenzial (vgl. Abb. 3). Der Vergleich mit entsprechenden Antworten zu einer parallelen Frage aus dem Experteninterview zeigt ähnliche Ergebnisse. Lexikalische Einheiten, die in der gesprochenen
14 LeGeDe-Projektwebseite, Unterpunkt „Empirische Forschung“ [Unter: ; letzter Zugriff: 27.01.2021].
186
Christine Möhrs
Abb. 3: Erwartungen zu Stichwörtern (Online-Umfrage).
Sprache ein anderes Kombinationspotenzial als in der geschriebenen Sprache aufweisen, stehen in der Expertenumfrage an oberster Stelle auf der Wunschliste von möglichen Stichwörtern. Dies beinhaltet – laut Äußerungen der interviewten ExpertInnen – Konstruktionen, lexikalische Ausdrücke, syntagmatische Kombinationen, Formeln, Chunks etc. und auch Mehrwortlemmata.
4 Die Stichwörter des LeGeDe-Prototyps In Summe sind im LeGeDe-Prototyp 10 Hauptlemmata ausgewählt worden (vgl. Abb. 4), zu denen es teils ein-, teils mehrteilige Unterlemmata gibt. Die Hauptlemmata konnten mithilfe der quantitativen Methode extrahiert und als relevante Stichwortkandidaten für die LeGeDe-Ressource ermittelt werden (vgl. Abschnitt 3). Die manuellen, qualitativ ausgerichteten Analysen der Korpusdaten aus FOLK zu diesen Stichwörtern haben dann unter Hinzunahme der Ergebnisse aus bereits etablierten Studien zu Einzelphänomenen sowie auch quantitativen Daten zu Bi- und
Quantitative und qualitative Ansätze zu Stichwortkandidaten
187
Abb. 4: Wortwolke zu den Hauptlemmata des LeGeDe-Prototyps15.
Trigrams, die über den LEXICAL EXPLORER über das gesamte FOLK-Korpus abgerufen werden können, auch das Vorkommen mehrteiliger Konstruktionen bzw. Muster als relevante Stichwörter für den Prototyp hervorgebracht. In den Analysen wurde deutlich, dass die Muster in ihrer Mehrteiligkeit eine spezifische Funktion in der Interaktion übernehmen und somit als eigenständige Formen zu behandeln sind. Für das Lemma wissen zeigt ein Blick in die ersten zehn Bi-Gramme mit wissen an 2. Position z. B. die Kombinationen aus ich weiß bzw. wer weiß (vgl. in Abb. 5 an erster und zehnter Stelle), die schließlich auch als Stichwortkandidaten für den LeGeDe-Prototyp angesetzt wurden (vgl. Tab. 2). Für den LeGeDe-Prototyp wurden also zu einigen der in Abb. 4 aufgeführten Hauptlemmata auch mehrteilige Lemmata angesetzt, die in Tab. 2 dargestellt sind. Die fett gedruckten Einheiten16 (vgl. Tab. 2) sind als die Hauptlemmata zu lesen. Im LeGeDe-Prototyp gibt es zu ihnen einen sogenannten Überblicksartikel, in dem das Spektrum an Informationen zum Lemma mit allen Unterlemmata und zum Spektrum an Bedeutungen sowie Funktionen überblicksartig zusammengestellt ist. Darunter abgesetzt (vgl. Tab. 2) sind die jeweiligen Unterlemmata aufgeführt, hinter denen
15 Die Schriftgröße der Lemmata in der Wortwolke steht für ihre absolute Frequenz in FOLK: Je größer die Schrift desto häufiger ist das Stichwort im Korpus vertreten. 16 Die Online-Oberfläche des LeGeDe-Prototyps arbeitet mit einem Farbschema, um die beiden Beschreibungsebenen „Bedeutungen“ vs. „Funktionen im Gespräch“ voneinander zu unterscheiden: Die Überblicksartikel sind in schwarz fett dargestellt, die Stichwörter aus Modul 1 („Bedeutungen“) in Rot und die Stichwörter aus Modul 2 („Funktionen im Gespräch“) in Blau. Dieses Farbschema wird dann an verschiedenen Stellen im Prototyp zur Unterscheidung immer wieder aufgegriffen.
188
Christine Möhrs
Abb. 5: Bigramme zum Lemma wissen (an 2. Position).
jeweils eine Wortklassenzuordnung bzw. eine Phrasenartzuordnung (z. B. Vollverb, Adjektiv oder Nominalsyntagma, Verbalsyntagma) steht. Bei der einen Gruppe von Unterlemmata (nicht kursiv/nicht fett; im LeGeDePrototyp in einem „Modul 1: Bedeutungen“ beschrieben) handelt es sich um Einwort-Lemmata, die im Prototyp besonders unter dem Aspekt der lexikologischen Bedeutung beschrieben werden. Insbesondere bei ein- oder mehrteiligen Einheiten, die eine spezifische interaktionale Funktion besitzen, kann nicht immer eindeutig eine Wortklassenzuordnung vorgenommen werden (vgl. zum Thema Wortarten in der gesprochenen Sprache z. B. Dabóczi 2017 oder Imo 2012). Die in der Tabelle kursiv gesetzten Unterlemmata (im LeGeDe-Prototyp in einem „Modul 2: Funktionen im Gespräch“ beschrieben) sollen im Unterschied zu den anderen Unterlemmata aus Modul 1 solche Stichwortkandidaten repräsentieren, die eine ganz besondere interaktionale Funktion besitzen. Die mikrostrukturelle Beschreibung greift für diese in der Tabelle kursiv gesetzten Stichwörter auf Beschreibungen zurück, die sich an interaktionslinguistischen Parametern orientieren (Sequenzanalyse, Prosodie, Interaktionskontext etc.). Nicht immer konnten im Ergebnis der manuell-qualitativen Analysen, auf Basis einer projektspezifisch definierten Stichprobe aus FOLK-Daten, zu jedem Hauptlemma durchgängig beide Gruppen von Unterlemmata nachgewiesen werden. Zu Ahnung liegt beispielsweise sowohl ein Modul 1 (Ahnung [Nomen]) als auch ein Modul 2 (keine Ahnung [Nominalsyntagma]) vor, wohingegen zu kriegen ausschließlich Indizien für das Modul 1 oder zu halt oder ja solche für Modul 2 in der Stichprobe gefunden wurden. Die Analysen greifen im Ergebnis auf das zurück, was die Stichprobe aus FOLK an Vorkommen zeigt. Es ist nicht ausgeschlossen, dass bei der
Quantitative und qualitative Ansätze zu Stichwortkandidaten
189
Tab. 2: Haupt- und Unterlemmata im LeGeDe-Prototyp. Ahnung Ahnung [NOMEN] keine Ahnung [NOMINALSYNTAGMA]
ja
eben
kriegen kriegen [VOLLVERB] kriegen [HILFSVERB]
eben [ADVERB] eben [MODALPARTIKEL] eben [DISKURSPARTIKEL]
ja [DISKURSPARTIKEL] ja [MODALPARTIKEL]
gucken gucken [VOLLVERB] guck mal [VERBALSYNTAGMA] mal gucken [VERBALSYNTAGMA]
schauen schauen [VOLLVERB] schau mal [VERBALSYNTAGMA] mal schauen [VERBALSYNTAGMA]
gut
schön gut [ADJEKTIV] gut [DISKURSPARTIKEL]
halt halt [MODALPARTIKEL]
schön [ADJEKTIV] schön [INTENSITÄTSPARTIKEL] schön [DISKURSPARTIKEL] wissen wissen [VOLLVERB] ich weiß nicht [VERBALSYNTAGMA] weißt du [VERBALSYNTAGMA] ich weiß [VERBALSYNTAGMA] wer weiß [VERBALSYNTAGMA] was weiß ich [VERBALSYNTAGMA]
Analyse größerer Datenmengen zu einem Hauptlemma nicht auch noch weitere Unterlemmata aufgedeckt werden könnten. Hier setzt die Analyse der Stichprobe eine pragmatische Grenze.17 Die Überlegungen, wie es unter Berücksichtigung der entwickelten korpusbasierten Methoden zur Auswahl dieser Stichwortkandidaten für den LeGeDe-Prototyp gekommen ist (vgl. Abschnitt 3), wird in der Ressource in zweierlei Hinsicht für den Nachschlagenden transparent gemacht. Einerseits wird zu jedem Hauptlemma im sogenannten Überblicksartikel ein Link zum LEXICAL EXPLORER angeboten, der direkt zu den Ergebnissen in diesem Tool zu dem spezifischen Lemma führt, von dem der Nachschlagende aus dem Link gefolgt ist. So lässt sich die im Projekt verfolgte Methode nachvollziehen. Außerdem kann der Nachschlagende bei Interesse noch weiter im LEXICAL EXPLORER recherchieren.
17 Zu der mikrostrukturellen Beschreibung der Stichwörter siehe auch den Beitrag von Meliss in diesem Band. Darin wird im Detail auf die Beschreibungen im Überblicksartikel, im Modul 1 („Bedeutungen“) und im Modul 2 („Funktionen im Gespräch“) eingegangen.
190
Christine Möhrs
Andererseits wird im LeGeDe-Prototyp in Form einer Visualisierung die Häufigkeitsklassenzuordnung zu FOLK bzw. zu der Teilmenge aus DEREKO, die für diesen Zweck definiert wurde, dargestellt (vgl. zwei exemplarische Beispiele in Abb. 6). gucken
ja
Abb. 6: Visualisierung der Häufigkeitsklassen (FOLK, DEREKO) zu gucken und ja.
Die beiden Häufigkeitsklassen (HK) sind in der Visualisierung gleichzeitig auch so dargestellt, dass sie in einem Verhältnis zueinander betrachtet werden können. Die Darstellung ist zusammengesetzt aus 17 konzentrischen Kreisen, also 16 Kreisringen, die jeweils für eine HK stehen. Das häufigste Wort eines Korpus definiert die HK 0, die in der Abbildung durch den äußersten Kreisring dargestellt ist. Der innerste Kreisring steht für die HK 16 (1/216 so häufig, wie das häufigste Wort), da dieser die seltensten Wörter in FOLK repräsentiert und ein Vergleich mit niedrigeren HK in DEREKO (bis HK 32) für LeGeDe Zwecke nicht sinnvoll ist. Die HK, in der sich das Lemma in FOLK wiederfindet, ist im LeGeDe-Protoyp jeweils Türkis eingefärbt. Die HK, in der das Lemma im Teilkorpus aus DEREKO zu finden ist, ist Dunkelgrau eingefärbt. Die Ringe sind mit einer entsprechenden Legende versehen, die die Zuordnung zum jeweiligen Korpus erleichtern soll. Vergleicht man die beiden eingefärbten Kreisringe, erhält man eine ungefähre Vorstellung des Frequenzunterschiedes eines Lemmas in den beiden Korpora (je größer der Kreis im Vergleich, desto häufiger das Lemma im Verhältnis zum jeweiligen Korpus).18 Die Visualisierung von gucken in Abb. 6 zeigt ein recht prototypisches Verhältnis der beiden Häufigkeitsklassen im Vergleich. ja zeigt – zunächst noch ganz unabhängig von seinen spezifischen Funktionen in Interaktionskontexten – mit seinem Vorkommen in Häufigkeitsklasse 0 in FOLK sehr deutlich, wie überaus häufig dieses Lemma in gesprochen-sprachlichen Kontexten vertreten ist.
18 Die Visualisierung der Häufigkeitsklassen wurde im Projekt von Maria Ribeiro Silveira entwickelt.
Quantitative und qualitative Ansätze zu Stichwortkandidaten
191
5 Abschließende Bemerkungen In diesem Beitrag wurden die Grundnahmen aufgezeigt, vor deren Hintergrund im LeGeDe-Projekt eine korpusbasierte Methode zur Ermittlung von geeigneten Stichwortkandidaten für den in der Projektlaufzeit entwickelten LeGeDe-Prototyp erarbeitet wurde. In einem ersten quantitativ ausgerichteten Schritt wurden mit Hilfe von Häufigkeitsklassenvergleichen aus FOLK und einer Teilmenge aus DEREKO potenzielle Stichwortkandidaten ermittelt. Die Extraktion konnte für Einwort-Lemmata durchgeführt werden. Manuelle qualitativ ausgerichtete Analysen über eine projektspezifisch definierte Stichprobe aus FOLK führten schließlich im Abgleich mit den Ergebnissen aus Einzelstudien aus der Forschungsliteratur und unter Hinzunahme von der Betrachtung von Bi- und Tri-Gramme (abrufbar über den LEXICAL EXPLORER über die gesamte Menge aus FOLK) zu auch mehrteiligen Stichwortkandidaten. Diese Kandidaten zeichnen sich in ihrer mehrteiligen Form besonders dadurch aus, dass sie in der (authentischen) Interaktion eine ganz besondere interaktionale Funktion einnehmen und als ganze Einheit zu beschreiben sind. Mit diesem kombinierten Verfahren konnten für den LeGeDe-Prototyp geeignete und relevante Stichwortkandidaten ausgewählt werden. Sie sind im Prototyp ausführlich beschrieben. Der quantitativ-qualitative Ansatz, den das LeGeDe-Projekt zur Definition von Stichwortkandidaten in einer lexikografischen Ressource verfolgt hat, greift einerseits auf etablierte Verfahren in der Lexikografie zurück und zeigt andererseits auf, wie für diese neuartige Ressource mit dem Ansetzen von mehrteiligen Stichwortkandidaten umgegangen wurde.
Literatur Atkins, Beryl T.S./Rundell, Michael (2008): The Oxford guide to practical lexicography. Oxford: Oxford University Press. Bergmann, Pia (2017): Gebrauchsprofile von weiß nich und keine Ahnung im Gespräch. Ein Blick auf nicht-responsive Vorkommen. In: Blühdorn, Hardarik, et al. (Hrsg.): Diskursmarker im Deutschen. Reflexionen und Analysen. Göttingen: Verlag für Gesprächsforschung, 157–182. Betz, Emma (2017): Diskursmarker aus konversationsanalytischer Sicht: Prosodisch integriertes ja am Beginn von responsiven Turns. In: Blühdorn, Hardarik, et al. (Hrsg.): Diskursmarker im Deutschen. Reflexionen und Analysen. Göttingen: Verlag für Gesprächsforschung, 183–206. Betz, Emma/Deppermann, Arnulf (2018): Indexing priority of position: Eben as response particle in German. In: Research on Language and Social Interaction 51 (2), 171–193. Blühdorn, Hardarik (2019): Modalpartikeln und Akzent im Deutschen. In: Linguistische Berichte 259, 275–317. Blühdorn, Hardarik, et al. (2017) (Hrsg.): Diskursmarker im Deutschen. Reflexionen und Analysen. Göttingen: Verlag für Gesprächsforschung.
192
Christine Möhrs
Dabóczi, Viktória (2017): Wort und Wortarten aus Sicht der gesprochenen Sprache. Identifikation von Wort aus Sicht der gesprochenen Sprache und deren Auswirkung auf die Wortartenklassifikation im Deutschen. Frankfurt am Main: Peter Lang. Deppermann, Arnulf/Proske, Nadine/Zeschel, Arne (2017) (Hrsg.): Verben im interaktiven Kontext. Bewegungsverben und mentale Verben im gesprochenen Deutsch. Tübingen: Narr. Fiehler, Reinhard (2016): Gesprochene Sprache. In: Wöllstein, Angelika (Hrsg.): Duden – Die Grammatik. Unentbehrlich für richtiges Deutsch. Berlin: Dudenverlag, 1181–1260. Günthner, Susanne (2017): Diskursmarker in der Interaktion – Formen und Funktionen univerbierter guck mal- und weißt du-Konstruktionen. In: Blühdorn, Hardarik, et al. (Hrsg.): Diskursmarker im Deutschen. Reflexionen und Analysen. Göttingen: Verlag für Gesprächsforschung, 103–130. Günthner, Susanne (2018): Routinisierte Muster in der Interaktion. In: Deppermann, Arnulf/ Reineke, Silke (Hrsg.): Sprache im kommunikativen, interaktiven und kulturellen Kontext. Berlin/Boston: De Gruyter, 29–50. Handwerker, Brigitte/Bäuerle, Rainer/Sieberg, Bernd (2016) (Hrsg.): Gesprochene Fremdsprache Deutsch. Baltmannsweiler: Schneider. Hansen, Carsten/Hansen, Martin H. (2012): A dictionary of spoken Danish. In: Fjeld, Ruth Vatvedt/ Torjusen, Julie Matilde (Hrsg.): Proceedings of the 15th EURALEX International Congress. 7–11 August 2012. Oslo, Norway. Oslo: Department of Linguistics and Scandinavian Studies, University of Oslo, 929–935. Helmer, Henrike/Deppermann, Arnulf (2017): ICH WEIß NICHT zwischen Assertion und Diskursmarker: Verwendungsspektren eines Ausdrucks und Überlegungen zu Kriterien für Diskursmarker. In: Blühdorn, Hardarik, et al. (Hrsg.): Diskursmarker im Deutschen. Reflexionen und Analysen. Göttingen: Verlag für Gesprächsforschung, 131–156. Helmer, Henrike/Deppermann, Arnulf/Reineke, Silke (2017): Antwort, epistemischer Marker oder Widerspruch? Sequenzielle, semantische und pragmatische Eigenschaften von ich weiss nicht. In: Deppermann, Arnulf/Proske, Nadine/Zeschel, Arne (Hrsg.): Verben im interaktiven Kontext. Bewegungsverben und mentale Verben im gesprochenen Deutsch. Tübingen: Narr, 377–406. Imo, Wolfgang (2007): Zur Anwendung der Construction Grammar auf die gesprochene Sprache – der Fall „ich mein(e)“. In: Ágel, Vilmos/Hennig, Mathilde (Hrsg.): Zugänge zur Grammatik der gesprochenen Sprache. Tübingen: Niemeyer, 3–34. Imo, Wolfgang (2012): Wortart Diskursmarker? In: Rothstein, Björn (Hrsg.): Nicht-flektierende Wortarten. Berlin/Boston: De Gruyter, 48–88. Keibel, Holger (2008, 2009): Mathematische Häufigkeitsmaße in der Korpuslinguistik: Eigenschaften und Verwendung. In: Mannheim: Institut für Deutsche Sprache. [Unter: http://www1.ids-mannheim.de/fileadmin/kl/dokumente/freqMeasures.html; letzter Zugriff: 27.01.2021]. Klosa, Annette (2013a): The lexicographical process (with special focus on online dictionaries). In: Gouws, Rufus H., et al. (Hrsg.): Dictionaries. An international encyclopedia of lexikography. Supplementary volume: Recent developments with focus on electronic and computational lexicography. Berlin/Boston: De Gruyter, 517–524. Klosa, Annette (2013b): Aktuelle Tendenzen in der deutschen Lexikographie der Gegenwart. In: Stickel, Gerhard/Váradi, Tamás (Hrsg.): Lexical Challenges in a Multilingual Europe. Contributions to the Annual Conference 2012 of EFNIL in Budapest. Frankfurt am Main: Lang, 75–93. Klosa, Annette/Schnörch, Ulrich/Schoolaert, Sabine (2010): Stichwort, Stichwortliste und Eigennamen in elexiko. In: Dykstra, Anne/Schoonheim, Tanneke (Hrsg.): Proceedings of the XIV EURALEX International Congress. 6–10 July 2010. Leeuwarden: Fryske Akademy, 653–663.
Quantitative und qualitative Ansätze zu Stichwortkandidaten
193
Klosa, Annette/Tiberius, Carole (2016): Der lexikografische Prozess. In: Klosa, Annette/MüllerSpitzer, Carolin (Hrsg.): Internetlexikografie. Ein Kompendium. Berlin/Boston: De Gruyter, 65–110. Kupietz, Marc, et al. (2018): The German Reference Corpus DEREKO: New Developments – New Opportunities. In: Calzolari, Nicoletta, et al. (Hrsg.): Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). Miyazaki: European Language Resources Association (ELRA), 4353–4360. Kupietz, Marc/Keibel, Holger (2009): The Mannheim German Reference Corpus (DEREKO) as a basis for empirical linguistic research. In: Minegishi, Makoto/Kawaguchi, Yuji (Hrsg.): Working Papers in Corpus-based Linguistics and Language Education. Tokyo: Tokyo University of Foreign Studies (TUFS), 53–59. Lemmenmeier-Batinić, Dolores (2020): Lexical Explorer: Extending access to the Database of Spoken German for user-specific purposes. In: Corpora 15, 55–76. Meliss, Meike (2016): Gesprochene Sprache in DaF-Lernerwörterbüchern. In: Handwerker, Brigitte/ Bäuerle, Rainer/Sieberg, Bernd (Hrsg.): Gesprochene Fremdsprache Deutsch. Baltmannsweiler: Schneider, 179–199. Meliss, Meike (2020): Lexik des gesprochenen Deutsch in der Interaktion: Partikelverben und ihre Besonderheiten. In: García Adánez, Isabel, et al. (Hrsg.): Das Leben in einem Rosa Licht sehen. Festschrift für Rosa Piñel/Homenaje a Rosa Piñel. Bern: Peter Lang, 77–97. Meliss, Meike/Möhrs, Christine (2017): Die Entwicklung einer lexikografischen Ressource im Rahmen des Projektes LeGeDe. In: Sprachreport 4/2017, 42–52. Meliss, Meike/Möhrs, Christine (2018): Lexik in der spontanen, gesprochensprachlichen Interaktion: Eine anwendungsorientierte Annäherung aus der DaF-Perspektive. In: GFL 3/2018, 79–110. Meliss, Meike/Möhrs, Christine/Batinić, Dolores/Perkuhn, Rainer (2018a): Creating a list of headwords for a lexical resource of spoken German. In: Čibej, Jaka/Gorjanc, Vojko/Kosem, Iztok/Krek, Simon (Hrsg.): Proceedings of the 18th EURALEX International Congress 2018. 17–21 July 2018. Ljubljana, Slovenia. Ljubljana: Znanstvena založba Filozofske fakultete Univerze v Ljubljani, 1009–1016. Meliss, Meike/Möhrs, Christine/Ribeiro Silveira, Maria (2018b): Erwartungen an eine korpusbasierte lexikografische Ressource zur „Lexik des gesprochenen Deutsch in der Interaktion“: Ergebnisse aus zwei empirischen Studien. In: Zeitschrift für Angewandte Linguistik 68, 103–138. Meliss, Meike/Möhrs, Christine/Ribeiro Silveira, Maria (2019a): Anforderungen und Erwartungen an eine lexikografische Ressource des gesprochenen Deutsch aus der L2-Lernerperspektive. In: Lexicographica 34, 89–121. Meliss, Meike/Möhrs, Christine/Ribeiro Silveira, Maria/Schmidt, Thomas (2019b): A corpus-based lexical resource of spoken German in interaction. In: Kosem, Iztok/Zingano Kuhn, Tanara/ Correia, Margarita/Ferreria, José Pedro/Jansen, Maarten/Pereira, Isabel/Kallas, Jelena/ Jakubíček, Miloš/Krek, Simon/Tiberius, Carole (Hrsg.): Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference. 1–3 October 2019, Sintra, Portugal. Brno: Lexical Computing CZ, s.r.o, 783–804. Möhrs, Christine/Meliss, Meike/Batinić, Dolores (2017): LeGeDe – towards a corpus-based lexical resource of spoken German. In: Kosem, Iztok/Tiberius, Carole/Jakubíček, Miloš/Kallas, Jelena/Krek, Simon/Baisa, Vít (Hrsg.): Electronic Lexicography in the 21st century. Proceedings of eLex 2017 Conference. 19–21 September 2017. Leiden, the Netherlands. Brno: Lexical Computing CZ s.r.o, 281–298.
194
Christine Möhrs
Reineke, Silke (2016): Wissenszuschreibungen in der Interaktion. Eine gesprächsanalytische Untersuchung impliziter und expliziter Formen der Zuschreibung von Wissen. Heidelberg: Winter. Schmidt, Thomas (2014a): The Database for Spoken German – DGD2. In: Calzolari, Nicoletta/ Choukri, Khalid/Declerck, Thierry/Loftsson, Hrafn/Maegaard, Bente/Mariani, Joseph/Moreno, Asuncion/Odijk, Jan/Piperidis, Stelios (Hrsg.): Proceedings of the 9th International Conference on Language Resources and Evaluation. 26–31 May 2014. Reykjavik, Iceland. Reykjavik: European Language Resources Association, 1451–1457. Schmidt, Thomas (2014b): The Research and Teaching Corpus of Spoken German – FOLK. In: Calzolari, Nicoletta/Choukri, Khalid/Declerck, Thierry/Loftsson, Hrafn/Maegaard, Bente/ Mariani, Joseph/Moreno, Asuncion/Odijk, Jan/Piperidis, Stelios (Hrsg.): Proceedings of the 9th International Conference on Language Resources and Evaluation. 26–31 May 2014. Reykjavik, Iceland. Reykjavik: European Language Resources Association, 383–387. Schmidt, Thomas (2014c): Gesprächskorpora und Gesprächsdatenbanken am Beispiel von FOLK und DGD. In: Gesprächsforschung. Online-Zeitschrift zur verbalen Interaktion 15, 196–233. Schnörch, Ulrich (2005): Die elexiko-Stichwortliste. In: Haß, Ulrike (Hrsg.): Grundfragen der elektronischen Lexikographie. elexiko – das Online-Informationssystem zum deutschen Wortschatz. Berlin/New York: De Gruyter, 71–90. Schwitalla, Johannes (2012): Gesprochenes Deutsch. Eine Einführung. 4. Aufl. Berlin: Schmidt. Stadler, Heike (2014): Die Erstellung der Basislemmaliste der neuhochdeutschen Standardsprache aus mehrfach linguistisch annotierten Korpora. Mannheim: Institut für Deutsche Sprache. Verdonik, Darinka/Sepesy Maučec, Mirjam (2017): A speech corpus as a source of lexical information. In: International Journal of Lexicography 30 (2), 143–166. Wegner, Lars (2015): „ . . . mal kucken/schauen/sehen . . . “-Konstruktionen in Elternsprechtagsgesprächen – zur engen Verknüpfung von syntaktischen Konstruktionen und kommunikativen Gattungen. In: Bücker, Jörg/Günthner, Susanne/Imo, Wolfgang (Hrsg.): Konstruktionsgrammatik V. Konstruktionen im Spannungsfeld von sequenziellen Mustern, kommunikativen Gattungen und Textsorten. Tübingen: Stauffenburg, 163–186. Weidner, Beate (2015): Das funktionale Spektrum von ja im Gespräch. Ein Didaktisierungsvorschlag für den DaF-Unterricht. In: Imo, Wolfgang/Moraldo, Sandro M. (Hrsg.): Interaktionale Sprache und ihre Didaktisierung im DaF-Unterricht. Tübingen: Stauffenburg, 165–196. Wiegand, Herbert Ernst (1983): Was ist eigentlich ein Lemma? Ein Beitrag zur Theorie der lexikographischen Sprachbeschreibung. In: Wiegand, Herbert Ernst (Hrsg.): Studien zur neuhochdeutschen Lexikographie III. Hildesheim: Olms, 401–474. Zeschel, Arne (2017): Denken und wissen im gesprochenen Deutsch. In: Deppermann, Arnulf/ Proske, Nadine/Zeschel, Arne (Hrsg.): Verben im interaktiven Kontext. Bewegungsverben und mentale Verben im gesprochenen Deutsch. Tübingen: Narr, 249–336.
Online-Ressourcen [letzter Zugriff: 27.01.2021] AGD [Unter: ]. FOLK [Unter: ]. DEREKO [Unter: ]. DGD [Unter: ]. LeGeDe-Projektwebseite [Unter: ].
Quantitative und qualitative Ansätze zu Stichwortkandidaten
195
LeGeDe-Projektwebseite, Unterpunkt „Empirische Forschung“ [Unter: ]. LeGeDe-Prototyp [Unter: ]. LEXICAL EXPLORER [Unter: ]. OWIDplus[Unter: ].
Petra Oboňová
Deutsche Fußballsprache in Live-Kommentaren Abstract: The article presents a linguistic analysis of the German vocabulary. We will deal with the lexis and collocations that are related to football. The reason is that football is the most popular sport in Germany today. Football catches the interest not only of German viewers, but also foreign viewers. In the Bundesliga or other leagues in Germany there are also foreign players who need to learn football terms as a foreign language. The German language has a system of combinatorial rules in lexicons that is specific and idiosyncratic. Therefore, collocations are structured differently from other language varieties. The aim of the article is to create a collocation glossary that optimally covers the lexis and collocations of this subject area. Keywords: language, football, live-commentaries, collocations, glossary Schlagwörter: Sprache, Fußball, Live-Kommentare, Kollokationen, Glossar
1 Theoretische Ausführungen Im Jahre 1957 hat John Rupert Firth in seiner Publikation als einer der ersten den Begriff Kollokation erwähnt. Sein Satz „You shall know a word by the company it keeps!“ (Firth 1968: 179) wurde zu einem eingängigen und viel zitierten Slogan. Der vorliegende Beitrag widmet sich aus dieser Sicht der lexikalischen Bearbeitung der Lexik und der Kollokationen, die in der Fußballsprache verwendet werden. Der Grund dafür ist, dass Fußball heutzutage der populärste Sport nicht nur in Deutschland ist. In der deutschen Bundesliga spielen auch sehr viele ausländische Fußballspieler, die zum Lernen der Lexeme, bzw. Kollokationen unterschiedliche didaktische Materialien brauchen. Zur Lernergruppe zählen noch Fußballtrainer, die die deutschen Mannschaften trainieren, aber zum Teil auch aus anderen Staaten herkommen. Die letzte Gruppe bilden Zuschauer differenter Nationalitäten, die keine Möglichkeit haben, Fußball in ihrer Muttersprache zu sehen oder Live-Kommentare in ihrer Muttersprache zu lesen und aus diesem Grund wollen sie die deutschen Live-Kommentare lesen und verstehen.
Petra Oboňová, Universität der Heiligen Kyrill und Method, Trnava, [email protected] https://doi.org/10.1515/9783110716955-010
198
Petra Oboňová
1.1 Kollokationen Der Gegenstand des vorliegenden Beitrags ist der lexikalische Bestand mit usuellen und typischen Kollokationen in der deutschen Fußballsprache. Das Duden online (2019) definiert die Kollokation im Bereich Sprachwissenschaft als „a) inhaltliche Kombinierbarkeit sprachlicher Einheiten (z. B. dick + Buch, aber nicht: dick + Haus)“ oder „b) Zusammenfall verschiedener Inhalte in einer lexikalischen Einheit (z. B. englisch to swim und to float in deutsch schwimmen).“ Die Kollokationen sind nach Hausmann (1985: 118) „typische, spezifische und charakteristische Zweierkombinationen von Wörtern.“ Nach dieser Definition bestehen die Kollokationen aus zwei Wörtern, die im Text zusammen auftreten. Sie bestehen aus einer Basis und einem hinzutretenden Kollokator (vgl. Hausmann 1985: 119). Hausmann (2004: 316) erweitert diese Definition um sog. Tripelkollokationen. Diese entstehen als Verbindung von zwei Kollokationen, die aber zusammen eine Tripel-Struktur bilden. Mit dieser Definition identifiziert sich Ďurčo, der die Kollokationen als Mehrworteinheiten, die letztendlich auf binäre Strukturen zurückzuführen sind. Diese Struktur erweitert sich bei den Verben nicht einmal, sodass sogar die Ausgangsstruktur trinär oder quartärer sein kann, je nach der Verbsemantik. (vgl. Ďurčo 2016: 13) Aus phraseologischer Perspektive kann man weitere Definitionen des Begriffs Kollokationen bei Fleischer (1997: 251) „eine restringierte Verbindung ist also einerseits nicht frei, aber anderseits auch nicht fest.“ oder Burger (1998: 50) „Ich schlage vor, den Terminus Kollokation für den ganzen Bereich der festen Wortverbindungen, die nicht oder nur schwach idiomatisch sind, zu verwenden.“ finden. Im Unterschied zu den idiomatischen Wendungen ist die Bedeutung von einer Kollokation nicht übertragen, sondern ihre Gesamtbedeutung erschließt sich aus den Einzelbedeutungen aller Bestandteile einer Kollokation. In der empirischen Analyse dieses Beitrags werden die Kollokationen aus korpuslinguistischer Sicht betrachtet. Sie werden als Wortverbindungen von zwei oder mehreren lexikalischen Einheiten aufgrund ihrer Frequenz in den untersuchten Texten definiert.
1.1.1 Kollokationenforschung Häcki Buhofer (2014: IX) erläutert die Notwendigkeit der Kollokationsforschung folgend: „Kollokationen bereiten selten Schwierigkeiten beim Textverständnis. [. . .] Fehlen sie aber, oder sind zwei Wörter falsch kombiniert, dann wirkt der Text stilistisch auffällig oder sogar falsch.“ (Häcki Buhofer 2014: IX) Wenn man die Kollokationen kennt und verwendet, heißt das, dass man die deutsche Sprache richtig produziert. (vgl. Häcki Buhofer 2014: IX) Deshalb wächst heutzutage Interesse an Produktion der Kollokationenwörterbücher, bzw. der Glossarien mit Kollokationen zu verschiedenen Themen. Kollokationen-
Deutsche Fußballsprache in Live-Kommentaren
199
wörterbücher oder Glossarien helfen nicht nur den Lernenden, sondern auch den Muttersprachlern, die gebräuchlichen Wortverbindungen auszusuchen und zu produzieren. Pädagoge können mithilfe von Kollokationenwörterbücher die Schüler korrigieren und ihre Texte stilistisch verbessern, weil diese als ein didaktisches Beiheft dient. Mit dem Nachschlagen in das Kollokationenwörterbuch können TextverfasserInnen angemessene und Texte produzieren, die stilistisch korrekt sind. (vgl. Häcki Buhofer 2014: X)
1.2 Fußballsprache Heutzutage kann man Sport als ein fester Bestandteil der Gesellschaft wahrnehmen. Durch die sportlichen Leistungen eigener Gesellschaftsmitglieder wird das gesellschaftliche System dargestellt. Sport gibt den Gesellschaftsmitgliedern eine Gelegenheit, sich mit dem Staat und der Gesellschaft zu identifizieren. Das zeigt, dass Sport im engen Zusammenhang mit Nation und Gesellschaft steht. Die Mitglieder einer Gesellschaft führen Gespräche über Sport, wozu sie sportspezifische und sportfachliche Wörter oder Wendungen brauchen. Röthig definiert die Sportsprache als „eine zur größeren Gruppe der Sondersprachen gehörige Sprache, die den Wirklichkeitsbereich Sport und Leibesübungen in erster Linie mit einem spezifischen Wortschatz erfasst.“ (Röthig 1992: 450) In diesem Sinne wird sie sowohl in der Fachliteratur, in der Sportberichterstattung, als auch von Sportlern verwendet und unter dem Aspekt Fachsprache betrachtet. (vgl. Röthig 1992: 450) Man kann die Sportsprache als eine Art der Sondersprache betrachten, da diese zur Kommunikation der Personen unterschiedlicher Berufe, Ausbildung oder gesellschaftlicher Niveau dient. Mithilfe von dieser Sprache kommunizieren zusammen verschiedene für Sport interessierte Personen, die man als Sportgemeinde bezeichnet kann. Zu dieser Sportgemeinde gehören nicht nur die Sportler, Trainer oder Schiedsrichter, sondern auch die Sportberichter, Begeisterten, Laien usw. (vgl. Tworek 2012: 144). Tworek (2012: 145) unterscheidet drei Verwendungsbereiche, in denen die Sportsprache auftritt, und zwar „a) die der Wissenschaftssprache ähnelnden Texte, [. . .], b) Texte, die zur direkten Kommunikation unter Sportlern, zwischen Sportlern und Trainern dienen, [. . .], c) Texte, die zur medialen Wiedergabe bzw. Darstellung sportlicher Ereignisse dienen“ (mehr dazu Tworek 2000: 334–340.). Für meine Analyse sind eben die Texte relevant, die zur medialen Darstellung sportlicher Ereignisse dienen und in der Form von Live-Kommentaren veröffentlicht werden. Aus diesen Live-Kommentaren erstelle ich ein eigenes Korpus. „Fußballspiele sind komplexe stereotype Handlungsabläufe.“ (Jürgens 1997: 210) Bei Fußball werden immer bestimmte typische Handlungen ausgeführt, die für Fußball charakteristisch sind. Diese Handlungstypen existieren unabhängig von Textsorte, in der man über Fußball berichtet, z. B. der Handlungstyp Weiterbewegen des Balles. (vgl. Jürgens 1997: 210) Die Live-Kommentare wurden aus der Web-Seite Sportportal (http://www.sportal.de/, Datum des Zugriffs: 10.07.2019) genommen und analysiert, die sich mit den Live-Kommentaren
200
Petra Oboňová
beschäftigt. Es handelt sich um alle Live-Kommentare der deutschen Bundesliga in Saison 2018/2019. „Das Spezifikum der Sportsprache als Fachsprache liegt in dem spezifischen Wortschatz, zu dem die Terminologie der einzelnen Sportdisziplinen bzw. Sportarten gehört.“ (Wróbel 2015: 11) Termini, die in diesem Bereich verwendet werden, werden auch in die Alltagssprache übernommen, deshalb kann man die Grenze zwischen Fach- und Alltagssprache feststellen. Es sind uns oft Termini so vertraut, dass man sie für Allgemeingut hält. (vgl. Wróbel 2015: 11).
1.3 Lexikografie der Fußballsprache Im Jahre 1863 wurden die Regelnd des Fußballs niedergeschrieben, womit der englische Verband und auch die Fußballlexikografie entstanden ist. Im Jahre 1903 hat Konrad Koch seinen Beitrag „Deutsch Kunstausdrücke des Fußballspiels“ publiziert, in dem er ein Glossar mit den englisch-deutschen Substantiven, Verben und attributiv und prädikativ gebrauchten Partizipien erstellt hat. Erst im Jahre 1972 ist eine linguistische einsprachige Erarbeitung des deutschen Fußballwortschatzes erschienen, und zwar im Werk „Wörterbuch der Fußballsprache“ von Burkhardt (2006) und „Lernwörterbuch des Fußballsprache Deutsch-Französisch FranzösischDeutsch“ von Seelbach (2008), zu erwähnen. In den letzten zehn Jahren wächst das Interesse an Fußballsprache und ihrer Lexikografie, was auch an der Entstehung von digitalen Wörterbüchern, z. B. das Kicktionary oder Fussball Lexikon zu beobachten ist (vgl. Taborek 2012: 126–128).
1.4 Zuordnung der Live-Kommentare zu einer Textsorte „Die Bezeichnung Textsorte wird heute unreflektiert in allen Bereichen der institutionellen, aber auch der Alltagskommunikation verwendet, nicht nur in wissenschaftlichen (und speziell linguistischen) Kontexten, sondern durchaus auch im Alltagsverkehr der Kommunizierenden.“ (Heinemann 2007: 9) In diesem Sinnen gehören Textsorten zu den Alltagsphänomenen, in denen nicht nur wissenschaftliche Texte einbezogen sind, sondern auch Texte mit den alltäglichen Themen, wie Fußball. Für unsere Anordnung benutzen wir die vier Grundkonzepte von Heinemann (2007: 11). Er geht davon aus, dass die Textsorte eine Menge von Texten mit gemeinsamen Charakteristika ist. Diese können aber auf verschiedenen Sprachebenen definiert werden, die er als folgende vier Konzepte bezeichnet: a) Textsorten als grammatisch geprägte Einheiten, b) Textsorten als semantisch-inhaltlich geprägte Einheiten, c) Textsorten als situativ determinierte Einheiten, d) Textsorten als durch die kommunikative Funktion determinierte Einheiten.
Deutsche Fußballsprache in Live-Kommentaren
201
Die Textsorten, die nach dem Grundkonzept a) untersucht sind, haben gleiche formalen und strukturellen Eigenschaften. In einer Textsorte gibt es Texte mit gleichen Tempusmorphemen, Pronomina oder gleichem m Nomen-Verb-Quotient. Das Konzept b) ist auf gleichen semantischen Eigenschaften begründet. Zu einer Textsorte werden Texte mit gleichen Text-Thema-Strukturen zugeordnet. Bei dem Grundkonzept c) geht es um die Zuordnung eines Textes zur Textsorte aufgrund der Situation, in der der Text gefasst wurde. Bei dem letzten Grundkonzept handelt es sich um die Zuordnung eines Textes zur Textsorte anhand seiner Funktion, also anhand dessen, was mit dem Text gezielt sein sollte. (vgl. Heinemann 2007: 12–14) Ausgehend von diesen vier Grundkonzepten kann man die Live-Kommentare folglich analysieren. Live-Kommentare kennzeichnen sich durch gleiche formale Eigenschaften, da alle Live-Kommentare immer die gleiche Struktur haben, wobei sich um die deutschen und fremdsprachlichen Live-Kommentare handelt. Die gleiche Struktur weisen auch die Live-Kommentare zu anderen Sportarten, nicht nur zum Fußball auf. In den Live-Kommentaren wird der begrenzte Fachwortschatz benutzt, der für die Sportsprache typisch ist. Fachwortschatz ändert sich in den Live-Kommentaren nach der Sportart, zu der die Live-Kommentare geschrieben werden. Immer sind die Live-Kommentare situativ bezogen, da sie nur bei einem Situationstyp entstehen, u. z. kurz vor dem Spiel, während des Spiels und als Zusammenfassung gleich nach dem Spiel. Die Live-Kommentare haben die Funktion, die wichtigsten Informationen zum Spiel an die Leser online zu vermitteln, um nicht Videoaufnahme schauen zu müssen. Ausgehend von dieser vier Grundkonzepte zur Textsortenbestimmung kann man feststellen, dass die Live-Kommentare im Internet als eine selbständige Textsorte wehrnehmen werden können.
2 Empirische Analyse Mit der Fußballsprache beschäftigten sich schon mehrere Autoren, wie Martin Sierks (2012), der die Fußballsprache aufgrund ihrer Geschichte und Sprachwandelaspekte analysierte, Niklas Frielingsdorf (2009) mit seiner linguistischen Untersuchung der aktuellen Presseberichterstattung oder Harald Dankert (1969), der den Zusammenhang zwischen der Sportsprache und Kommunikation beschrieb. Ein Wörterbuch oder Glossar der Fußballsprache erstellten die Autoren Armin Brukhardt (2006) und Florian Simmen (2010). Was uns aber interessiert, ist eine neue spezifische Textsorte und zwar die geschriebene Fußballsprache in den Live-Kommentaren und ihre Untersuchung. In folgenden Unterkapiteln beschreibe ich deshalb die Methoden der Untersuchung und ein System, das bei der Untersuchung benutzt wird. Danach folgt ein Glossar der spezifischen Lexik mit Kollokationen in den Live-Kommentaren.
202
Petra Oboňová
2.1 Analysetool Im Rahmen dieses Beitrags werden für die Forschung quantitative und qualitative Methoden der Korpuslinguistik verwendet. Aufgrund der Kombinatorik von Wörtern kann ein Glossar von sprachlichen Einheiten in der Fußballsprache erstellt werden. Dabei handelt es sich um sprachliche Einheiten, die gemeinsam und fest in Texten auftreten. Zur Untersuchung, ob bestimmte sprachliche Einheiten das gemeinsame und feste Vorkommen aufweisen, wähle ich die Software Sketch Engine. „Im Unterschied zu anderen Methoden der statistischen Ermittlung von Textwörtern im Korpus liegt der größte Vorteil von Sketch Engine darin, dass wir Tabellen mit Kollokaten in allen vordefinierten grammatischen Relationen zur untersuchten Basis bekommen.“ (Ďurčo 2010: 121) Sketch Engine ist eine Software, die erlaubt, Korpora zu organisieren und Textanalyse zu betreiben. Es ist möglich, mit den vorhandenen Korpora zu arbeiten und diese durchzusuchen. Für den vorliegenden Beitrag ist aber wichtig, eigenes Korpus zu erstellen und mit diesem weiter zu arbeiten. Ein allgemeiner Überblick über verschiedene Tools, die Sketch Engine anbietet, steht unter https://www.sketchen gine.eu/ zur Verfügung. Wenn wir das eigene Korpus in Sketch Engine erstellen, lassen wir dieses annotieren. Annotation ist eine Prozedur, durch die unser Text in den Quellcode des Programms Sketch Engine gespeichert wird. Das Analysetool bietet viele Methoden für vielseitige quantitative und qualitative Untersuchungen an. Man kann zuerst die Wortliste nach den morphologischen Kriterien erstellen, die die häufigsten Lexeme mit Frequenzangabe beinhaltet. Auf Grund dieser Liste ermitteln wir folglich die frequentiertesten Lexeme. Gleichzeitig werden alle Konkordanzen also die Umgebung eines Wortes im Text erfasst. Unser Ziel ist, die Kollokabilität der relevanten Lexik zu ermitteln und auf dieser Basis ein thematisches Glossar zu erstellen.
2.2 Fußballwortschatz in Live-Kommentaren In diesem Beitrag analysiere ich Live-Kommentare der deutschen Bundesliga. In diesem Sinne stellt mein Ansatz ein Grenzgebiet zwischen der geschriebenen und gesprochenen Sprache dar. Ich setze voraus, dass man in gesprochener Fußballsprache im Unterschied zu geschriebener Form die Emotionen ausdrückt und neben hochsprachlichen auch umgangssprachliche Ausdrücke verwendet. Chovanec (2009: 125–127) unterscheidet zwei Typen der Live-Kommentare, und zwar online, bzw. instant und offline, bzw. delayed. Der Unterschied besteht darin, dass die online-Kommentare das Fußballspiel in realer Zeit beschreiben und offline-Kommentare nachfolgend nach dem Spiel entstehen. In folgenden Unterkapiteln werde ich die Fußballsprache und darunter die Kollokationen in der Fußballsprache analysieren. Damit diese Analyse
Deutsche Fußballsprache in Live-Kommentaren
203
möglich wäre, benötigt man die Texte, aus denen man Lexeme und Kollokationen ermitteln können. Als Quelle bei dieser Analyse gilt die Web-Seite www.sportal.de. Auf dieser Web-Seite stehen die Live-Kommentare ganzer Saison zur Verfügung und diese Kommentare wurden zu jedem Spiel online veröffentlicht.
2.2.1 Definition der Live-Kommentaren Live-Kommentare sind Beschreibungen von Fußballspielen, die im Internet zu jedem Spiel veröffentlicht werden. Diese werden nach den wichtigen Situationen aktualisiert, deshalb hat man immer aktuelle Informationen, was am Feld passiert, auch wenn man keine Möglichkeit hat, das Spiel zu sehen. Wie oben erwähnt, stellen die Live-Kommentare ein Grenzgebiet zwischen geschriebener und gesprochener Sprache, weil sie einerseits in geschriebener Form existieren und andererseits über die Merkmale gesprochener Sprache verfügen, und zwar, sie entstehen spontan in Momenten, wenn auf dem Feld etwas Wichtiges passiert, genauso wie die gesprochenen Kommentare von Reporteuren. Daher bezeichne ich die Live-Kommentare als eine Art der sekundären gesprochenen Sprache, und zwar als die konzeptuell gesprochene getippte Sprache. Allgemein ist eine Textsorte die Klasse von Texten mit gemeinsamen textexternen und/oder textinternen Merkmalen. Nach Dimter (1981: 16) weist die Textsorte der Kommentare folgende Merkmale auf: sie verfügen über die Mitteilungsfunktion, bzw. Darstellungsfunktion, da sie die Informationen über das Fußballspiel mitteilen; sie sind auf Raum und Zeit bezogen und als Monolog eingerichtet. Zur Illustration wird ein Beispiel eines Live-Kommentars auf der Abb. 1 und 2 angeführt. Die Abb. 1 stellt Anfang des Fußballspiels dar. Den Text soll man in der Richtung von unten nach oben lesen, weil zuerst die Begrüßung und die allgemeinen Informationen zu den spielenden Fußballmannschaften genannt werden. Die neuen Informationen werden immer oben hinzugefügt. Man bekommt Informationen über Mannschaften und dann die Information über den Anfang des Spieles. Folglich werden die Beschreibungen der Situationen auf dem Feld veröffentlicht. Wenn eine Fußballmannschaft ein Tor schießt, steht der Ball im Live-Kommentar als die Bezeichnung des Tores. Die Abb. 2 stellt das Ende, bzw. Endergebnis des Fußballspiels mit den Graphiken dar. Oben stehen die Namen der Mannschaften mit ihren Logos und das Endergebnis des Fußballspiels. Die Graphik unter diesen Informationen stellt den ganzen Verlauf des Spiels, und zwar, wer und wann das Tor schießt, welche Mannschaft wann die gelbe, bzw. gelb-rote Karte bekommt. Darunter stehen die Informationen über Datum und das Stadion. Ganz unten steht Zusammenfassung des Fußballspiels.
204
Petra Oboňová
Abb. 1: Anfang und Verlauf des Fußballspiels1.
1 Sportportal online. 2019. Im Internet verfügbar unter: http://www.sportal.de/fussball/1bundes liga/bayern-muenchen/vfb-stuttgart/2019-01-27.html?subpage=vorschau. 10.07.2019.
Deutsche Fußballsprache in Live-Kommentaren
205
Abb. 2: Ende des Fußballspieles2.
2.2.2 Analyse der Live-Kommentare Für die vorliegende Untersuchung habe ich die Kommentare von letzter Saison der deutschen Bundesliga benutzt, was bedeutet, alle Fußballspiele vom 24. August 2018 bis 18. Mai 2019. Insgesamt geht es um 306 Fußballspiele, die auf den 3 008 Normseiten des Textes kommentiert wurden. Im Programm Sketch Engine stellen
2 Sportportal online. 2019. Im Internet verfügbar unter: http://www.sportal.de/fussball/1bundes liga/bayern-muenchen/vfb-stuttgart/2019-01-27.html?subpage=vorschau. 10.07.2019.
206
Petra Oboňová
diese Fußballkommentare 855 628 Tokens3 dar. Der Hauptgrund für die Analyse der Live-Kommentare ist die Zweckrichtung auf die Fremdsprachenlernenden, nicht auf die Experten im Bereich des Fußballs. Es gibt eine große Zahl an Monographien oder Wörterbüchern, die die Fußballsprache als einen Teil der Fachsprache beschreiben, beispielsweise Harald Burger (1984). Diese beschäftigen sich mit der Fußballsprache als der hochsprachlichen Fachsprache, die auf dem Gebiet von Experten (in diesem Beitrag Fußballtrainer und Fußballspieler) auftritt. Unsere Untersuchung bringt die Ergebnisse auch für Laien, also für Fans, Zuschauer oder Lernenden.
2.2.3 Glossar der Kollokationen in den Live-Kommentaren Im vorliegenden Glossar stehen die Kollokationen, die in den erwähnten Live-Kommentaren aus der Saison 2018/2019 verwendet wurden. Das Kriterium war die Frequenz über 200 Vorkommen im Korpus. Das bedeutet, wenn ein Vorkommen eines Substantivs oder Verbs (als Basis der Kollokation) mehr als 200 war, steht dieses Substantiv oder Verb im Glossar. Zu den ausgewählten Lexemen wurden auf Grund des Korpus die Kollokatoren ermittelt, und zwar nach den Kriterien, ob sie im Text als Attribut (im Glossar als A bezeichnet), Verb mit dem Subjekt oder Objekt (im Glossar als V bezeichnet), Substantiv (im Glossar als S bezeichnet) oder Bestandteil des Kompositums (im Glossar als K bezeichnet) vorkommen. Das Ergebnis stellt 100 Lexeme mit ihren Kollokatoren alphabetisch gereiht dar. Abschluss r, -es, -ü-e A: aussichtsreicher/ direkter/ gefährlicher/ klarer/ nennenswerter/ vernünftiger Abschluss V + Subjekt: Abschluss bleibt aus/ geht vorbei/ kommt von [+Spieler/ Mannschaft] / landet [+lokale Bestimmung] V + Objekt: einen Abschluss abblocken/ verbuchen/ verhindern/ verzeichnen Abseits s, -, V + Objekt: auf Abseits entscheiden; aus Abseits kommen/ starten; (hauchdünn) im Abseits stehen; wegen Abseits abpfeifen/ zurückpfeifen agieren h. A: genug/ hinten/ vorne agieren V + Subjekt: Assistent/ Club/ Mannschaft/ Spieler agiert Aktion e, -, -en A: erste/ gefährliche/ gelungene/ gute/ letzte/ nächste/ nennenswerte/ starke/ tolle/ unglückliche/ unnötige/ wichtige/ zielstrebige Aktion S: Aktion der Gastgeber/ Gäste
3 Token ist jedes einzelne Vorkommen eines Wortes oder einer anderen sprachlichen Einheit im Text.
Deutsche Fußballsprache in Live-Kommentaren
207
V + Objekt: bei der Aktion applaudieren/ stehen; sich bei der Aktion verletzen; in Aktion treten; zu Aktion führen/ kommen K: Abschluss-/ Abwehr-/ Angriff-/ Ball-/ Defensiv-/ Einzel-/ Offensiv-/ Rettungs-/ Toraktion Angriff r, -(e)s, -e A: gespielter/ guter/ schneller/ schöner/ starker/ vielversprechender/ vorgetragener/ wütender Angriff S: Angriff der Gäste/ Hausherren/ Partie; Ende des Angriffs; Angriff für Angriff V + Subjekt: Angriff bringt etw./ endet/ kommt/ läuft/ reicht V + Objekt: Angriff aufbauen/ fangen/ leiten/ starten/ stoppen/ tragen/ unterbinden; sich an Angriff beteiligen; auf Angriff warten; in den Angriff gehen; mit Angriff kommen; sich um Angriff bemühen K: Angriffsmodus/ -welle; Doppel-/ Entlastungs-/ Gegen-/ Konter-/ Schnellangriff; Power-Angriff Arm r, -(e)s, -e A: ausgestreckter/ linker/ rechter Arm V + Objekt: die Arme heben/ hochreißen; in die Arme flanken/ fliegen; in den Armen landen; die Kugel sicher in seinen Armen begraben K: Ober-/ Unterarm Aufstellung e, -, -en A: folgende Aufstellung S: Aufstellung beider/ der Teams/ Mannschaften; Blick auf die Aufstellung V + Subjekt: die Aufstellung sieht folgend/ so aus V + Objekt: Aufstellung bekannt geben; mit dieser/ solcher Aufstellungen beginnen K: Mannschaft-/ Startaufstellung Ausgleich r, -(e)s, -e A: direkter/ erneuter/ möglicher/ schneller/ später/ verdienter/ zwischenzeitlicher Ausgleich S: Ausgleich aus dem Nichts; (Groß-/Riesen-)Chance zum Ausgleich V + Subjekt: Ausgleich fällt (auf der Gegenseite/ glücklich/ jetzt) / gelingt (in der Nachspielzeit/ nach der Pause) V + Objekt: Ausgleich besorgen/ erzielen/ hinnehmen/ kassieren/ verdienen; nah am Ausgleich sein; sich für den Ausgleich sorgen; sich mit dem Ausgleich belohnen; vor dem Ausgleich bewahren, zum Ausgleich kommen Ball r, -(e)s, -ä-e A: abgefälschter/ flacher/ hoher/ langer/ ruhender/ scharfer/ starker/ weiter Ball V + Subjekt: Ball flattert/ fliegt/ geht/ kommt/ prallt/ rutscht/ segelt/ springt/ tippt auf/ zappelt (von [+Spieler] / [+Richtungsbestimmung]; Ball chippt/ rollt [+lokale Bestimmung] / [+modale Bestimmung] V + Objekt: einen Ball antippen/ bekommen (von links/ rechts) / bringen/ erobern/ halten/ legen/ nehmen/ spielen/ treffen; am Ball sein; an den Ball kommen; gegen den Ball agieren/ pressen; hinter dem Ball sein; hinter den Ball kommen; (nicht) genug Druck hinter den Ball bekommen; über den Ball fallen/ schlagen/ treten; zum Ball gehen/ kommen K: Ballbesitz/ -gewinn/ -verlust; Chip-/ Diagonal-/ Eck-/ Flanken-/ Flatter-/ Kopf-/ Match-/ Schiedsrichterball Bank e, -, -ä-e V + Objekt: auf der Bank Platz nehmen/ sitzen; zur Bank eilen K: Auswechsel-/ Ersatz-/ Trainerbank
208
Petra Oboňová
Begegnung e, -, -en A: heutige/ letzte/ vergangene Begegnung S: Beginn der Begegnung V + Subjekt: Begegnung beginnt/ endet ([+lokale Bestimmung] / [+modale Bestimmung]) V + Objekt: Begegnung pfeifen; in der Begegnung starten; in die Begegnung gehen/ kommen; zur Begegnung willkommen Beginn r, -(e)s, -e A: guter/ schwungvoller/ starker/ verhaltener Beginn S: Beginn der Berichterstattung/ des ersten/ zweiten... Durchgangs/ der (ersten/ zweiten) Hälfte/ der Saison/ des Spiels K: Saison-/ Spiel-/ Wiederbeginn Bein s, -(e)s, -e A: gestrecktes/ hohes/ langes/ linkes/ rechtes/ schnelles Bein S: Beine des Keepers V + Objekt: Bein ausfahren/ halten/ lassen/ reißen/ stellen/ treffen/ ziehen; Beine abschließen/ stellen/ zusammen bekommen; wieder auf den Beinen sein; den Ball durch die Beine durchlassen/ rollen/ spielen/ stecken; den Ball in die Beine rollen/ spielen blocken h. A: letztlich blocken V + Objekt: Abschluss/ Ball/ Gegenspieler/ Hereingabe/ Kopfball/ Kugel/ Schuss/ Versuch blocken; (in Not) zur Ecke blocken Boden r, -s, -öV + Objekt: am Boden liegen/ zu Boden gehen Chance, e, -, -n A: dicke/ große/ gute/ nächste/ reale/ vergebene Chance S: Chance des Spiels/ der Partie; Chance auf den Klassenerhalt V + Objekt: Chance bekommen/ nutzen; zur Chance kommen; auf Chance warten K: Abschluss-/ Doppel-/ Groß-/ Konter-/ Riesen-/ Schuss-/ Torchance; Mega-Chance Defensive e, -, -n A: eigene/ gegnerische/ gute/ kompakte/ kontrollierte/ organisierte/ schwache Defensive S: beste Defensive der (Bundes-)Liga V + Subjekt: Defensive steht kompakt V + Objekt: Defensive stabilisieren/ stärken; sich auf die Defensive konzentrieren; in Defensive stehen Druck r, -(e)s, -e A: enormer/ extremer/ gehöriger/ ordentlicher/ wirklicher Druck S: Druck der Gäste/ Hausherren V + Subjekt: Druck nimmt zu! V + Objekt: Druck aufbauen/ ausüben/ erhöhen/ halten/ verspüren/ verstärken; keinen Druck bringen; ohne Druck spielen; unter Druck setzen K: Angriffs-/ Gegnerdruck; Druckwelle
Deutsche Fußballsprache in Live-Kommentaren
209
Duell s, -s, -e A: direktes/ erstes/ erstklassiges/ heutiges/ letztes/ spannendes/ vergangenes/ wichtiges Duell S: Duell der Aufsteiger/ der Teams/ zweier Tabellennachbarn V + Subjekt: das Duell endet/ folgt (gleich) V + Objekt: Duell entscheiden/ gewinnen; sich im Duell durchsetzen; zum Duell einladen/ kommen/ willkommen K: Kopfball-/ Lauf-/ Luft-/ Sprintduell; Bundesliga-Duell; Aufsteiger-Duell; Mann-gegen-MannDuell; Nord-Duell; Süd-Duell Durchgang r, -(e)s, -ä-e A: erster/ zweiter/ dritter … Durchgang S: Beginn/ Ende/ Mitte/ Verlauf des ersten/ zweiten... Durchgangs V + Subjekt: der erste Durchgang geht zu Ende; der zweite Durchgang läuft/ startet ([+modale Bestimmung]) V + Objekt: Durchgang beenden/ nachspielen/ pfeifen/ präsentieren/ sehen/ starten/ zeigen Ecke e, -, -en A: anschließende/ folgende Ecke; linke/ obere/ rechte/ untere Ecke S: auf Kosten einer Ecke V + Subjekt: Ecke bleibt ohne Ertrag; Ecke bringt (keine) Gefahr; Ecke fliegt/ landet/ segelt/ springt ([+lokale Bestimmung] / [+modale Bestimmung] / [+Richtungsbestimmung]) V + Objekt: Ecke bekommen/ bringen/ erarbeiten/ führen/ holen/ schlagen K: Eckball/ -fahne/ -stoß; Club-/ Mauer-/ Strafraum-/ Torecke Elfmeter r, -s, A: direkter/ gerechtfertigter/ umstrittener/ vehementer/ vergebener/ verschossener/ verwandelter Elfmeter S: Elfmeter in Nachspielzeit V + Objekt: Elfmeter bekommen/ fordern/ halten/ verschießen/ verwandeln; per Elfmeter ausgleichen/ treffen K: Elfmeterpunkt/ -raum; Elfmeter-Betrug; Foul-/ Handelfmeter Ende s, -s, -n S: Ende der ersten Halbzeit/ Hälfte/ Partie/ Saison V + Objekt: sich dem Ende zuneigen K: Auftrag-/ Saison-/ Spielende Entscheidung e, -, -en A: endgültige/ falsche/ gute/ harte/ korrekte/ richtige/ vertretbare Entscheidung S: Entscheidung des Referees/ Schiedsrichters V + Subjekt: Entscheidung fällt (am letzten Spieltag) V + Objekt: Entscheidung bestätigen/ machen/ treffen/ verpassen; gegen die Entscheidung (lautstark) protestieren; mit der Entscheidung (nicht) einverstanden sein; sich für die Entscheidung sorgen; sich (lautstark) über die Entscheidung beschweren/ regen K: Abseits-/ Einwurf-/ Elfmeter-/ Fehl-/ Freistoß-/ Schiedsentscheidung erzielen h. A: alleine etw. erzielen V + Objekt: Anschlusstreffer/ Ausgleich/ Doppelpack/ Dreierpack/ Führung/ Saisontreffer/ Siegtor/ Siegtreffer/ Tor/ Treffer erzielen
210
Petra Oboňová
Feld s, -(e)s, -er A: halbes Feld S: Doppelpass über das halbe Feld V + Objekt: Feld betreten/ überlassen/ verlassen; aufs Feld kommen/ schicken/ zurückkehren; ins Feld springen; über das halbe Feld marschieren; vom Feld gehen/ humpeln K: Halb-/ Mittel-/ Spielfeld Flanke e, -, -en A: abgefälschte/ flache/ halbhohe/ hohe/ präzise/ scharfe/ schöne/ starke Flanke V + Subjekt: Flanke fliegt/ landet/ segelt (von [+Name der Spieler] / [+Richtungs-bestimmung]) V + Objekt: Flanke erreichen/ finden/ geraten/ köpfen/ lenken/ misslingen/ rutschen/ schlagen ([+lokale Bestimmung] / [+modale Bestimmung] / [+Richtungsbestimmung]); flanken h. A: flach/ folglich/ gleich/ links/ rechts/ sofort flanken V + Objekt: im Lauf/ in die Mitte flanken Flügel e, -s, A: linke/ rechte Flügel V + Objekt: linke/ rechte Flügel besetzen; auf der linken/ rechten Flügel freispielen/ spielen Folge e, -, -n S: Folge einer Ecke V + Objekt: ohne Folgen bleiben Foul s, -s, -s A: hartes/ klares/ kleines/ taktisches/ unnötiges Foul V + Objekt: Foul begehen/ sehen/ zeigen; für das Foul Karte sehen; mit dem Foul stoppen; sich mit dem Foul helfen K: Elfmeter-/ Offensiv-/ Stürmerfoul Freistoß r, -es, -ö-e A: anschließender/ ausgeführter/ direkter/ fälliger/ folgender/ indirekter/ vielversprechender Freistoß S: Ausführung des Freistoßes; auf Kosten des Freistoßes V + Subjekt: Freistoß fliegt/ kommt/ landet (von [+Name der Spieler] / [+Richtungs-bestimmung]) V + Objekt: den Freistoß treten; auf Freistoß entscheiden; per Freistoß antworten/ aufspielen; sich den Ball zum Freistoß legen; zum Freistoß bereitliegen/ treten Fuß r, -es, -ü-e A: falscher/ linker/ rechter/ starker Fuß V + Objekt: einen Fuß halten/ hinhalten/ legen; das (nächste) Tor auf dem Fuß haben Führung e, -, -en A: erneute/ komfortable/ knappe/ verdiente Führung S: Führung der Gastgeber/ Gäste/ aus dem Nichts V + Objekt: Führung bringen/ halten/ verdienen; in Führung bringen/ gehen K: Gäste-/ Halbzeit-/ Klub-/ Pausen-/ Spiel-/ Tabellen-/ Zweikampfführung
Deutsche Fußballsprache in Live-Kommentaren
211
Gast r, -(e)s, -ä-e A: heutige Gäste S: Abschluss/ Aktion/ Angriff/ Chance/ Freistoß/ Führung/ Gelegenheit/ Hälfte/ Konter/ Sechzehner/ Seite/ Strafraum/ Tor/ Torchance/ Torschuss der Gäste; Druck auf die Gäste; Wechsel bei den Gästen V + Subjekt: Gäste beginnen/ führen/ kommen/ spielen/ starten (mit folgender Aufstellung) / wechseln Gastgeber r, -s, A: heutige Gastgeber S: Abschluss/ Aktion/ Eckstoß/ Konter/ Seite/ Tor/ Vorstoß der Gastgeber V + Subjekt: Gastgeber agieren/ beginnen/ führen/ kommen/ spielen/ starten (mit folgender Aufstellung) / versuchen/ wechseln Gegner r, -s, A: heutiger/ schwacher/ starker/ unbequemer Gegner S: Fehler/ Hälfte/ Tor des Gegners V + Objekt: Gegner treffen; gegen/ mit Gegner spielen gewinnen h. A: allesamt/ lediglich/ letztendlich/ nie/ unbedingt gewinnen V + Objekt: Auswärtsspiel/ Bundesligaspiel/ Duell/ Laufduell/ Partie/ Pflichtspiel/ Raum/ Sicherheit/ Spiel/ Zweikampf gewinnen Halbzeit e, -, -en A: erste/ schwache/ starke/ zweite Halbzeit S: Beginn/ Ende/ Mitte der (ersten/ zweiten) Halbzeit V + Subjekt: Halbzeit beginnt/ läuft/ endet ([+modale Bestimmung]) Hand e, -, -ä-e A: eigene/ leere/ linke/ rechte Hand V + Objekt: in die Hand nehmen; mit der Hand spielen Hausherr r, -n, -en A: gute/ langsame Hausherren S: Abschluss/ Angriff/ Druck/ Führung/ Gegenstoß/ Pressing/ Schlussmann/ Sechzehner/ Seite/ Strafraum/ Tor/ Überlegenheit der Hausherren; Angriff/ Startelf/ Wechsel bei den Hausherren; Chance/ Führung/ Niederlage/ Strafstoß für die Hausherren V + Subjekt: Hausherren beginnen/ führen/ nähern sich (dem Kasten) / reagieren/ starten (mit folgender Aufstellung) / wechseln/ wirken [+modale Bestimmung] Hälfte e, -, -n A: eigene/ erste/ gegnerische/ tiefe/ zweite Hälfte S: Hälfte der Gäste/ (ersten/ zweiten) Halbzeit; Beginn/ Ende/ Mitte/ Nachspielzeit/ Schlussphase der (ersten/ zweiten) Hälfte; Solo durch die gegnerische Hälfte V + Subjekt: (erste/ zweite) Hälfte läuft V + Objekt: eigene Hälfte befreien; Hälfte festsetzen; durch die gegnerische Hälfte marschieren/ spazieren; in der (eigenen/ gegnerischen) Hälfte spielen K: Saison-/ Spiel-/ Spielfeld-/ Tabellenhälfte
212
Petra Oboňová
Hereingabe e, -, -n A: anschließende/ flache/ halbhohe/ hohe/ perfekte/ scharfe Hereingabe V + Subjekt: Hereingabe fliegt/ gerät/ kommt/ landet/ segelt (von [+Name der Spieler] / [+Richtungsbestimmung]) V + Objekt: Hereingabe blocken/ bringen/ fangen/ köpfen/ verlängern/ verpassen/ wehren Karte e, -, -en A: gelbe/ gelb-rote Karte V + Objekt: Karte bekommen/ geben/ sehen/ zeigen; mit der Karte bestrafen/ bewerten/ verwarnen; ohne Karte davonkommen K: Ampelkarte Kasten r, -s, -ä/A: eigener/ gegnerischer Kasten S: Kasten der Gäste; in Richtung Kasten V + Objekt: Kasten verfehlen/ verlassen; über den Kasten jagen/ setzen Keeper r, -s, A: eigener/ junger Keeper S: Keeper der Gäste V + Subjekt: Keeper fängt/ fischt/ hält/ lenkt/ pariert/ reißt den Ball; Keeper wehrt V + Objekt: den Ball/ das Leder/ die Pille über den Keeper heben/ lupfen/ schießen K: Ersatz-/ Stammkeeper Konter r, -s, A: direkter/ entscheidender/ gefährlicher/ perfekter/ schneller Konter S: Konter der Gastgeber/ Gäste V + Subjekt: Konter zum [+Veränderung im Stand] V + Objekt: Konter einleiten/ laufen/ spielen/ starten/ stoppen/ unterbinden/ verhindern; auf Konter lauern; über Konter kommen; zum Konter ansetzen K: Kontergefahr köpfen h. A: links/ oben/ rechts/ vorbei köpfen V + Objekt: Ball/ Ecke/ Flanke/ Hereingabe/ Kugel/ Leder/ Tor köpfen Kugel e, -, -n V + Subjekt: Kugel fliegt/ schlägt/ springt (von [+Name der Spieler] / [+Richtungs-bestimmung]); Kugel landet/ rauscht/ rollt/ rutscht/ zischt [+Richtungsbestimmung]; V + Objekt: Kugel begraben/ bekommen/ bringen/ legen/ lenken/ nehmen/ schieben/ verlieren; an die Kugel kommen; mit der Kugel laufen. Leder s, -s, V + Subjekt: Leder jagt/ landet/ legt sich/ nickt/ rauscht/ rutscht/ schlenzt/ spitzelt [+Richtungsbestimmung] V + Objekt: Leder bekommen/ bringen/ drücken/ fischen/ heben/ köpfen/ lenken/ schieben/ setzen/ treiben/ wehren; sich Leder schnappen; ans Leder kommen; am Leder sein K: Kunstleder
Deutsche Fußballsprache in Live-Kommentaren
213
Liga e, -, -en A: zweite Liga S: Defensive/ Mannschaft/ Offensive/ Rest/ Team der Liga K: Bundes-/ Regionalliga Linie e, -, -n A: direkte/ ganze/ kurze/ letzte Linie K: Grundlinie V + Objekt: vor der Linie stehen; Ball von der Linie kratzen Mann r, -(e)s, -ä-er A: frischer/ junger/ neuer/ überragender/ zentraler Mann S: Mann des Abends/ Spiels/ Tages V + Subjekt: Männer gewinnen/ kassieren/ laufen V + Objekt: Mann ins Spiel bringen; mit Mann und Maus verteidigen K: Abwehr-/ Defensiv-/ Ersatz-/ Flügel-/ Mittelfeld-/ Offensiv-/ Schluss-/ Tormann Mannschaft e, -, -en A: aktivere/ bessere/ dominierende/ schlechtere Mannschaft S: Aufstellung/ Leistung der Mannschaft V + Subjekt: Mannschaft agiert/ spielt [+modale Bestimmung] V + Objekt: Mannschaft einstellen/ führen/ sehen/ trainieren K: Mannschaftsaufstellung/ -kapitän Minute e, -, -n A: erste/ gespielte/ kommende/ letzte/ satte/ spannende/ verbleibende/ vergangene Minuten S: Minuten der Nachspielzeit V + Subjekt: die letzten Minuten laufen; [+Nummer] Minuten reichen (nicht) / verbleiben K: Spielminute; Anfangs-/ Schlussminuten Mittelfeld s, (e)s, -r A: defensives/ gesichertes/ linkes/ rechtes/ zentrales Mittelfeld S: Mittelfeld der Tabelle V + Objekt: durchs Mittelfeld marschieren; im Mittelfeld spielen K: Tabellenmittelfeld Niederlage e, -, -n A: bittere/ drohende/ deutliche/ einzige/ heutige/ hohe Niederlage S: Serie/ [+Nummer] Spiel(e) ohne Niederlage V + Objekt: Niederlage einstecken/ hinnehmen/ kassieren/ verhindern; gegen Niederlage stemmen K: Auftakt-/ Pflichtspiel-/ Saisonniederlage Offensive e, -, -n A: aktuelle/ eigene/ starke/ volle Offensive V + Objekt: Offensive unterstützen/ verstärken K: Schlussoffensive
214
Petra Oboňová
Partie e, -, -n A: ausgeglichene/ faire/ heutige/ letzte/ sieglose/ spannende/ unterhaltsame/ vergangene Partie S: Abschluss/ Beginn/ Schiedsrichter/ Torschuss der Partie V + Subjekt: Partie beginnt/ endet/ läuft/ plätschert ([+modale Bestimmung]) K: Auswärts-/ Bundesliga-/ Hinrunden-/ Liga-/ Rückrundenpartie Pass r, -es, -ä-e A: feiner/ finaler/ flacher/ langer/ perfekter/ schlampiger/ schneller/ schöner/ tiefer/ toller/ ungenauer/ überragender Pass S: Pass aus dem Mittelfeld/ in den Sechzehner V + Subjekt: Pass kommt [+Richtungsbestimmung] V + Objekt: Pass bedienen/ bringen/ fangen/ schicken/ spielen/ suchen K: Diagonal-/ Doppel-/ Fehl-/ Quer-/ Rück/ Steck-/ Steil-/ Zauberpass; Passquote Pause e, -, -en A: kurze Pause V + Objekt: in die Pause gehen; aus/ nach der Pause kommen K: Behandlungs-/ Halbzeit-/ Länderspiel-/ Sommer-/ Spiel-/ Winterpause Pfosten r, -s, A: linker/ rechter Pfosten S: Höhe/ Richtung des Pfostens; V + Objekt: am Pfosten lauern; den Ball neben den Pfosten setzen; den Ball/ die Kugel/ das Leder um den Pfosten lenken K: Außen-/ Innen-/ Torpfosten Platz r, -es, -ä-e A: aktueller/ europäischer/ fremder/ internationaler Platz V + Objekt: einen Platz nehmen/ verlassen; auf dem Platz stehen K: Bank-/ Champions-League-/ Europapokal-/ Relegation-/ Tabellenplatz; Platzwahl Position e, -, -en A: aussichtsreiche/ ähnliche/ gefährliche/ gute/ halblinke/ halbrechte/ linke/ mittige/ rechte/ zentrale Position K: Abschluss-/ Abseits-/ Freistoß-/ Linksverteidiger-/ Rechtsverteidiger-/ Schussposition Problem s, -s, -e A: arge/ enorme/ große/ muskuläre/ sichtliche Probleme V + Objekt: ohne Probleme spielen/ wegen Probleme nicht im Kader stehen/ mitwirken/ spielen Punkt r, -(e)s, -e A: komplette drei/ mögliche/ wichtige Punkte K: Elfmeter-/ Mittel-/ Schluss-/ Zeitpunkt; Punktgewinn/ -teilung/ -verlust Reihe e, -, -n A: eigene/ zweite Reihe S: Reihe der Gäste/ hochklassiger Chancen V + Objekt: in den eigenen Reihen halten/ laufen; durch die eigenen Reihen laufen K: Abwehr-/ Defensiv-/ Offensiv-/ Pressing-/ Sturmreihe
Deutsche Fußballsprache in Live-Kommentaren
215
Richtung e, -, -en A: andere/ entgegensetzte Richtung S: Richtung Eck/ Eckfahne/ Elfmeterpunkt/ Fünfmeterraum/ Grundlinie/ Kasten/ Pfosten/ Sechzehner/ Strafraum/ Tor/ Winkel rollen i. A: links/ rechts rollen V + Subjekt: Ball/ Kugel/ das Runde rollt Rückstand r, -(e)s, -ä-e A: erneuter/ früher/ höher/ möglicher/ zweimaliger Rückstand V + Objekt: Rückstand aufholen/ betragen/ bewahren/ verhindern/ verkürzen; einem Rückstand hinterherlaufen/ rennen; auf den Rückstand reagieren; mit Rückstand in die Pause gehen; trotz Rückstand gewinnen K: Trainingsrückstand Saison e, -, -s/-en A: aktuelle/ kommende/ laufende/ neue/ vergangene Saison S: Ende/ Spiel/ Spieltag/ Verwarnung der Saison V + Subjekt: Saison endet/ startet ([+modale Bestimmung]) Schiedsrichter r, -s, A: guter/ heutiger Schiedsrichter S: Entscheidung/ Pfiff des Schiedsrichters; Schiedsrichter der Ansetzung/ Begegnung/ Partie V + Subjekt: Schiedsrichter entscheidet/ kommt/ pfeift/ zückt die Karte V + Objekt: bei Schiedsrichter bitten/ kein Gehör finden; sich bei Schiedsrichter beschweren K: Videoschiedsrichter; Schiedsrichtergespann/ -team schießen h./ i. A: alleine/ links/ rechts schießen V + Subjekt: Keeper/ Spieler/ Stürmer/ Torschütze schießt [+modale Bestimmung] V + Objekt: Ball/ Freistoß/ Kugel/ Tor schießen; aus der Drehung/ (halblinker/ -rechter) Position schießen Schuss r, -es, -ü-e A: abgefälschter/ einziger/ flacher/ halbhoher/ harter/ platzierter/ satter/ schöner/ strammer/ wuchtiger/ zentraler Schuss S: Schuss des Spielers V + Subjekt: Schuss fliegt/ geht/ landet/ rauscht/ segelt/ zischt ([+modale Bestimmung] / [+Richtungsbestimmung]); Schuss verfehlt (Kasten/ Tor) V + Objekt: einen Schuss abwehren/ blocken/ entschärfen/ fälschen/ halten/ lenken/ parieren/ setzen/ wehren; beim Schuss im Abseits stehen; zum Schuss kommen K: Direkt-/ Distanz-/ Fehl-/ Flach-/ Links-/ Nach-/ Rechts-/ Schräg-/ Torschuss Seite e, -, -en A: linke/ rechte Seite S: Seite der Gastgeber/ Gäste/ Hausherren K: Abwehr-/ Defensiv-/ Innen-/ Offensiv-/ Gegenseite
216
Petra Oboňová
Sieg r, -(e)s, -e A: deutlicher/ einziger/ erkämpfter/ heutiger/ hoher/ überzeugender/ verdienter/ wichtiger Sieg S: Sieg der Saison V + Objekt: Sieg brauchen/ (nach Hause) bringen/ einfahren/ feiern/ holen; sich Sieg verdienen/ wünschen; mit einem Sieg vom Platz gehen/ gleichziehen/ springen/ vorbeiziehen/ vorrücken; ohne Sieg bleiben/ stehen; über einen Sieg erkämpfen K: Auftakt-/ Auswärts-/ Heim-/ Pflichtspiel-/ Pokal-/ Saisonsieg Situation e, -, -en A: aktuelle/ aussichtslose/ ähnliche/ brenzlige/ gefährliche/ gute/ komfortable/ kuriose/ neue/ personelle/ prekäre/ schwierige/ sportliche/ vergleichbare Situation V + Objekt: Situation bereinigen/ entschärfen/ erkennen/ klären/ lösen/ nutzen/ sehen/ umgehen/ überstehen K: Abschluss-/ Freistoß-/ Konter-/ Standard-/ Umschaltsituation; [+Nummer]-gegen-[+Nummer]Situation Spiel s, -(e)s, -e A: ausgeglichenes/ gefährliches/ heutiges/ letztes/ siegloses Spiel S: Spiel der Hausherren/ des Jahres V + Subjekt: Spiel geht weiter/ läuft/ plätschert [+modale Bestimmung] V + Objekt: Spiel gewinnen/ sehen/ verlieren; ins Spiel kommen K: Abschieds-/ Aufbau-/ Auswärts-/ Bundesliga-/ Defensiv-/ Hand-/ Heim-/ Hin-/ Kombinations-/ Offensiv-/ Pflicht-/ Pokal-/ Rück-/ Saison-/ Top-/ Umschaltspiel; Spielabschnitt/ -aufbau/ -gerät/ -tag/ -zeit spielen h. A: links/ rechts/ vorne/ weiterspielen V + Objekt: ohne Bedrängnis spielen; K: weiterspielen. Spieler r, -s, A: andere/ elf/ frische/ gute/ neue Spieler S: Spieler des Jahres/ des Jahrgangs/ der Runde/ der Saison/ des Spieltages V + Subjekt: Spieler betreten den Rasen/ kommen/ laufen/ stehen bereit V + Objekt: Spieler bringen/ schicken; an Spieler hängen; mit 10/ weniger Spieler spielen; über Spieler schlagen K: Abwehr-/ Gegen-/ Mittelfeld-/ Nationalspieler; Startelf-Spieler Spieltag r, -(e)s, -e A: kommender/ letzter/ nächster/ vergangener/ vorletzter Spieltag S: Abschluss/ Auftakt/ Begegnung des Spieltags/ Spieltag der Bundesliga/ Saison K: Bundesligaspieltag Startelf e, -, -en A: folgende/ gleich/ neue Startelf S: Wechsel in Startelf V + Objekt: Startelf ins Rennen schicken/ sehen/ übernehmen/ verändern; dieser Startelf vertrauen; mit dieser Startelf beginnen
Deutsche Fußballsprache in Live-Kommentaren
217
Strafraum r, -s, -ä-e A: eigener/ gegnerischer Strafraum S: Richtung Strafraum; Strafraum der Gastgeber/ Gäste/ Hausherren K: Gästestrafraum; Strafraumeck/ -grenze Stürmer r, -s, A: echter/ eingewechselter Stürmer S: Kopfball des Stürmers V + Subjekt: Stürmer bleibt/ kommt/ läuft/ schießt/ steht ([+modale Bestimmung] / [+Richtungsbestimmung]) K: Mittel-/ National-/ Stoßstürmer; Rekord-Stürmer Szene e, -, -n A: gefährliche/ gute/ kniffelige/ offensive/ spielerische/ strittige Szene V + Objekt: Szene bereinigen/ überprüfen; in Szene setzen K: Elfmeter-/ Fan-/ Offensiv-/ Torraumszene; Elfer-Szene; Hand-Szene Team s, -s, -s A: aktiveres/ anderes/ besseres/ dominanteres/ einziges/ gefährlicheres/ spielbestimmendes/ überlegendes Team S: Aufeinandertreffen/ Aufstellung/ Beginn/ Duell/ Fan beider Teams; Bilanz/ Spiel/ Unterschiede zwischen beiden Teams; Team der Liga V + Subjekt: Team betritt das Feld/ kassiert/ neutralisiert sich/ spielt/ startet (mit folgender Aufstellung) / steht bereit/ trennt sich/ wechselt/ wirkt [+modale Bestimmung]; V + Objekt: Team feuern/ führen/ sehen/ stellen/ unterstützen/ verändern/ verlieren; K: Auswärts-/ Heimteam; Bundesliga-Team; Top-Team; Teamkollege/ -leistung/ -verbund Tempo s, -s, -s/-i A: aktuelles/ enorm hohes/ nötiges/ volles Tempo S: Start mit/ ohne (viel) Tempo; Tempo erster/ letzter Minuten V + Subjekt: das Tempo fehlt jemandem V + Objekt: Tempo anziehen/ aufnehmen/ bringen/ halten/ machen/ nehmen/ verschärfen; sich für mehr Tempo sorgen; ohne Tempo spielen K: Spieltempo Tor s, -es, -e A: eigenes/ gegnerisches/ leeres Tor S: Tor der Gastgeber/ der Gäste/ des Gegners/ der Hausherren/ des Jahres/ des Tages; Richtung Tor V + Subjekt: Tor fällt/ gelingt/ kommt; Tor steht V + Objekt: Tor einschieben/ erzielen/ kassieren/ schießen; Tor verfehlen/ verpassen; neben/ vor dem Tor stehen; über das Tor fliegen/ köpfen; sich von Tor halten; sich zu Tor nähern K: Eigen-/ Gegen-/ Saison-/ Siegtor; Torchance/ -gefahr/ -jäger/ -schuss/ -schütze; Nicht-Tor; Toraus Torschütze r, -en, -en A: alter/ bester/ einziger Torschütze V + Subjekt: Torschütze sitzt auf der Ersatzbank / verlässt das Feld V + Objekt: einen Torschützen ersetzen K: Torschützenliste
218
Petra Oboňová
Trainer r, -s, A: junger/ neuer/ scheidender Trainer S: Trainer der Mannschaft/ der Spieler V + Subjekt: Trainer bleibt/ verzichtet (auf Veränderung/ Wechsel) / warnt jemanden/ wechselt jemanden V + Objekt: für Trainer kämpfen; mit Trainer agieren/ jubeln; unter dem Trainer (besser/ erfolgreich/ hervorragend) performen/ sein K: Chef-/ Gästetrainer; Co-Trainer; Trainerbank/ -stuhl Treffer r, -s, A: einziger/ entscheidender/ erster/ dritter/ glücklicher/ goldener/ letzter/ herausgespielter/ schöner/ sehenswerter/ weiteren/ zweiter Treffer S: (Heim-)Spiel/ zweite Hälfte ohne Treffer; Treffer der Partie/ des Spiels/ des Tages V + Subjekt: Treffer fällt/ fehlt/ gelingt/ liegt V + Objekt: dem Treffer die Anerkennung verweigern; Treffer erzielen/ leiten/ verdienen/ verhindern; dank eines Treffers führen; ohne Treffer bleiben; über Treffer diskutieren/ jubeln K: Anschluss-/ Ausgleichs-/ Freistoß-/ Führungs-/ Gegen-/ Saison-/ Siegtreffer; Alu-Treffer; BundesligaTreffer; Last-Minute-Treffer Versuch r, -(e)s, -e A: abgefälschter/ erster/ flacher/ guter/ nächster/ schwieriger/ wuchtiger/ zentraler Versuch S: Versuch einer Flanke V + Subjekt: Versuch fliegt/ klatscht/ landet/ streicht/ verfehlt/ zischt ([+modale Bestimmung] / [+Richtungsbestimmung]) V + Objekt: Versuch abgeben/ blocken/ entschärfen/ fangen/ halten/ kratzen/ lenken/ platzieren/ setzen/ stoppen/ wehren; beim Versuch bleiben; mit Versuch kommen/ (keine) Probleme haben K: Abschluss-/ Angriffs-/ Direkt-/ Flanken-/ Klärungs-/ Konter-/ Pass-/ Schussversuch Wechsel r, -s, A: letzter/ nächster/ offensiver/ personeller Wechsel S: (letzter) Wechsel der Gäste/ der Partie/ des Spiels V + Subjekt: Wechsel erfolgt/ folgt (gleich/ jetzt) V + Objekt: einen Wechsel bereiten/ nehmen/ vornehmen/ ziehen; ohne (personelle) Wechsel weitergehen K: Seiten-/ Spielerwechsel; Wechselkontingent Winkel r, -s, A: linker/ rechter/ spitzer Winkel S: Richtung Winkel V + Objekt: Winkel treffen/ verfehlen K: Torwinkel Woche e, -, -n A: entscheidende/ kommende/ letzte/ nächste/ vergangene Woche S: Abschluss der Woche Zeit e, -, -en A: ganze/ geraume/ gute/ kurze/ lange/ langsame/ nötige S: Frage/ Zeichen der Zeit; eine Menge Zeit V + Subjekt: Zeit bleibt/ läuft/ rennt K: Halb-/ Nachspiel-/ Spielzeit
Deutsche Fußballsprache in Live-Kommentaren
219
Zentrum s, -s, -en S: Zentrum der (eigenen/ gegnerischen) Hälfte V + Objekt: durchs Zentrum (Ball/ Kugel/ Leder) führen/ marschieren/ Tempo nehmen; im Zentrum kämpfen K: Abwehr-/ Angriffs-/ Fünfer-/ Mittelfeld-/ Offensiv-/ Strafraum-/ Sturm-/ Torzentrum Zieler r, -s, Ø A: reagierender Zieler S: Chance der Zieler; Richtung Zieler V + Subjekt: Zieler bleibt/ kommt/ lenkt/ wehrt ([+modale Bestimmung] / [+Richtungsbestimmung]) V + Objekt: Zieler parieren; über Zieler hinwegfliegen/ lupfen Zweikampf r, -(e)s, -ä-e A: aggressiver/ erfolgreicher/ gewonnener/ harmloser/ harter/ intensiver/ wichtiger Zweikampf S: [+Nummer] Prozent der Zweikämpfe V + Objekt: Zweikampf führen/ gewinnen/ verlieren K: Luftzweikampf; Zweikampfquote Zähler r, -s, A: erster/ wichtiger Zähler V + Subjekt: Zähler fehlen/ liegen V + Objekt: Zähler betragen/ brauchen/ entfernen/ holen/ sammeln
2.2.4 Vergleich der ausgewählten Lexeme mit ihren Kollokatoren im vorliegenden Glossar aus den Live-Kommentaren und anderen Glossarien In der Tab. 1 werden aus Platzgründen die 50 häufigsten Lexemen in unserem Korpus angeführt. Zu den Lexemen wird die Anzahl der Kollokatoren im Glossar zugeordnet und mit anderen Quellen verglichen. Als Ausgangsbasis wird das Kollokationenwörterbuch für den Alltag (2014) von A. Häcki Buhofer et al. ausgewählt. Wir haben nach denjenigen Kollokationen gesucht, die im Zusammenhang mit dem Fußball stehen, also die Anzahl in der Tabelle stellt nicht die Anzahl aller Kollokationen dar, die im Wörterbuch stehen. Gleiche Vorgehensweise haben wir auch bei der Web-Seite Kicktionary4 ausgewählt. Kicktionary ist ein mehrsprachiges Online-Wörterbuch der Fußballsprache. Es enthält ca. 2000 Lexeme der Fußballsprache. Nach Anklicken der jeweiligen Lexeme bekommt man die Definition der Lexeme, Beispielsätze, die semantischen Relationen und Frame-Elemente (vgl. Kicktionary, online)5. Neben der alphabetischen Anordnung können verschiedene Themenbereiche wie z. B. Schüsse, Pässe, Tore ausgewählt werden, die die bestimmte Anzahl der lexikalischen Einheiten und Frames beinhalten. Für unsere Untersuchung haben wir nach den Lexemen
4 Kicktionary online. 2020. Im Internet verfügbar unter: kicktionary.de. 15.06.2020. 5 Kicktionary online. 2020. Im Internet verfügbar unter: kicktionary.de. 15.06.2020.
220
Petra Oboňová
Tab. 1: Ausgewählte Lexeme im Glossar und in den Wörterbüchern. Nr.
Lexem
das vorliegende Glossar
Kollokationenwörterbuch
kicktionary
.
Abschluss
x
x
.
Ball
.
Begegnung
x
.
Beginn
x
.
Chance
.
Duell
x
.
Durchgang
x
.
Ecke
x
.
Ende
x
.
Flanke
x
.
Foul
x
.
Freistoß
x
.
Fuß
.
Gast
.
Gastgeber
x
.
Gegner
x
.
gewinnen
.
Halbzeit
x
.
Hausherr
x
x
.
Hälfte
.
Hereingabe
x
.
Karte
x
.
Kasten
.
Kugel
.
Leder
.
Mannschaft
.
Minute
x
.
Niederlage
221
Deutsche Fußballsprache in Live-Kommentaren
Tab. 1 (fortgesetzt) Nr.
Lexem
das vorliegende Glossar
Kollokationenwörterbuch
kicktionary
.
Partie
x
.
Pass
.
Pause
.
Pfosten
x
.
Platz
.
Position
x
x
.
Punkt
x
.
Richtung
x
.
Saison
x
.
Schuss
.
Seite
x
.
Spiel
.
spielen
.
Strafraum
x
.
Team
.
Tor
.
Trainer
x
.
Wechsel
.
Woche
x
.
Zeit
x
.
Zentrum
x
.
Zweikampf
x
aus der alphabetischen Liste gesucht und die Kollokationen in den Beispielsätzen analysiert. Die Ergebnisse sind in der Tab. 1 zu sehen. Die Unterschiede in der Anzahl der Kollokationen in den Wörterbüchern sind offenbar. Bei jedem Lexem steht die Anzahl der Kollokationen im vorliegenden Glossar im Vergleich zum Kollokationenwörterbuch für den Alltag (Häcki Buhofer et al., 2014) und zum Online-Wörterbuch der Fußballsprache – kicktionary.de. Bei den Lexemen, die sich in den Wörterbüchern nicht befinden, steht x. Bei dem Lexem Kasten steht 0 aus dem Grund, dass dieses Lexem zwar im Wörterbuch angeführt ist,
222
Petra Oboňová
aber in der Bedeutung Schrank und Kiste. Die Kollokationen der Fußballsprache befinden sich im Wörterbuch zu diesem Lexem nicht. Bei den Lexemen wie Chance, Ende, Mannschaft, Spiel oder spielen gibt es im Wörterbuch mehr Kollokationen als im vorliegenden Glossar. Der Grund dafür ist, dass das Wörterbuch auch die Kollokationen der Fußballsprache aus den anderen Textsorten enthält, z. B. aus den Fußballberichterstattungen oder aus den Konferenzen nach den Spielen. Deshalb stehen im Wörterbuch auch die Kollokationen, die in den Live-Kommentaren nur selten oder gar nicht auftreten und das Kriterium der Frequenz nicht erfüllen. Auch wenn das Wörterbuch bei mehreren Lexemen größere Anzahl an Kollokationen umfasst, muss man die Kollokationen der Fußballsprache nach den Bedeutungen der Substantive oder Verben zwischen allen Kollokationen, also auch Kollokationen des Alltags suchen. Sie werden weder alphabetisch noch themenorientiert geordnet. Wie schon erwähnt, enthält Kicktionary die einzelnen Lexeme der Fußballsprache entweder alphabetisch oder themenorientiert geordnet, was jedem Benutzer ermöglicht, bei der Suche der Lexeme die individuellen Anforderungen zu erfüllen. Man muss erläutern, dass Kicktionary kein Kollokationenwörterbuch ist, sondern ein mehrsprachiges Wörterbuch mit den einzelnen Lexemen im Deutschen, Englischen und Französischen. Deshalb bekommt man nach dem Anklicken der Lexeme keine Kollokationen, sondern nur die Beispielsätze, in denen auch die Kollokationen auftreten. Das vorliegende Glossar hat den Vorteil, dass es nur die Kollokationen der Fußballsprache in den Live-Kommentaren beinhaltet, was aber nicht bedeutet, dass diese Kollokationen in anderen Textsorten nicht verwendet werden. Wie unsere Analyse gezeigt hat, werden in den Live-Kommentaren auch solche Kollokationen verwendet, die in den Wörterbüchern nicht eingeführt werden, deshalb ist es nötig, auch diese Textsorte zu untersuchen und die Sprache der Live-Kommentare zu analysieren.
3 Schlussfolgerungen In der empirischen Analyse gehe ich von den theoretischen Ausführungen aus, nach denen die Kollokationen als „typische, spezifische und charakteristische Kombinationen von Wörtern“ (Hausmann 1985: 118) betrachtet werden. Jede Kollokation besteht aus einer Basis und einem Kollokator. Im Glossar sind Basen fettgedruckt und unter diesen stehen ihre Kollokatoren. Im vorliegenden Glossar sind die Kollokationen der deutschen Fußballsprache zu finden, die in den Live-Kommentaren benutzt werden. Es handelt sich um alle Live-Kommentare der deutschen Bundesliga in der Saison 2018/2019.
Deutsche Fußballsprache in Live-Kommentaren
223
Das Kollokationenwörterbuch und Kicktionary enthalten unter anderem auch die Kollokationen der Fußballsprache, jedoch muss man nach den Kollokationen gezielt suchen. Deshalb ist das vorliegende Glossar eine Hilfe für die an Fußball Interessierten und besonders für diejenigen, die sich für Live-Kommentare interessieren.
Literatur Monografien und Aufsätze Burger, Harald (1984) (Hrsg.): Sprache der Massenmedien. Berlin/New York: Walter de Gruyter. Burger, Harald (1998) (Hrsg.): Phraseologie: Eine Einführung am Beispiel des Deutschen. Berlin: Erich Schmidt Verlag. Burkhardt, Armin (2006) (Hrsg.): Wörterbuch der Fußballsprache. Göttingen: Verlag Die Werkstatt. Chovanec, Jan (2009): ‘Call Doc Singh!’: Textual Structure and Coherence in Live Text Commentaries. In: Dontcheva-Navratilova, Olga/Povolná, Renata (Hrsg.): Coherence and Cohesion in Spoken and Written Discourse. Newcastle upon Tyne: Cambridge Scholars Publishing, 124–137. Dankert, Harald (1969) (Hrsg.): Sportsprache und Kommunikation. Untersuchungen zur Struktur der Fußballsprache und zum Stil der Sportberichterstattung. Tübingen: Tübinger Vereinigung für Volkskunde. Dimter, Matthias (1981) (Hrsg.): Textklassenkonzepte heutiger Alltagssprache. Tübingen: Max Niemeyer Verlag. Ďurčo, Peter (2010): Einsatz von Sketch Engine im Korpus/Vorteile und Mängel. In: Ptashnyk, Stefaniya/Hallsteinsdóttir, Erla/Bubenhofer, Noah (Hrsg.): Korpora, Web und Datenbanken. Balmannsweiler: Schneider Verlag Hohengehren, 119–131. Ďurčo, Peter (2016) (Hrsg.): Kollokationsforschung und Kollokationsdidaktik. Wien: LIT Verlag. Firth, John Rupert (1968): A synopsis of linguistic theory. In: Palmer, Frank Robert (Hrsg.): Selected Papers of J. R. Firth (1952–59). London: Longmans, 168–205. Fleischer, Wolfgang (1997) (Hrsg.): Phraseologie der deutschen Gegenwartssprache. Tübingen: Max Niemeyer Verlag. Frielingsdorf, Niklas (2009): Fußballsprache – Eine linguistische Untersuchung der aktuellen Presseberichterstattung. Masteru – parbeit. Düsseldorf: Heinrich-Heine-Universität. Hausmann, Franz Josef (1985): Kollokationen im deutschen Wörterbuch. Ein Beitrag zur Theorie des lexikographischen Beispiels. In: Bergenholtz, Henning/Mugdan, Joachim (Hrsg.): Lexikographie und Grammatik. Tübingen: Max Niemeyer Verlag, 118–129. Hausmann, Franz Josef (2004): Was sind eigentlich Kollokationen? In: Steyer, Kathrin (Hrsg.): Wortverbindungen – mehr oder weniger fest. Berlin/New York: Walter de Gruyter, 309–334. Häcki Buhofer, Annelies, et al. (2014) (Hrsg.): Feste Wortverbindungen des Deutschen – Kollokationenwörterbuch für den Alltag. Tübingen: Narr Francke Attempto Verlag GmbH + Co. KG. Heinemann, Wolfgang (2007): TextsorTaten. Zur Diskussion um Basisklassen des Kommunizierens. Rückschau und Ausblick. In: Adamzik, Kirsten (Hrsg.): Textsorten – Reflexionen und Analysen. Tübingen: Stauffenburg Verlag Brigitte Narr GmbH, 9–29. Jürgens, Frank (1997): Syntaktische Variation in der Sportberichterstattung. Unter besonderer Berücksichtigung der Hörfunk- und der Fernsehreportage. In: Schlobinski, Peter (Hrsg.): Syntax des gesprochenen Deutsch. Opladen: Westdeutscher Verlag GmbH, 209–225. Röthig, Peter (1992) (Hrsg.): Sportwissenschaftliches Lexikon. Schorndorf: Hofmann Verlag.
224
Petra Oboňová
Seelbach, Dieter (2008): Lernwörterbuch der Fußballsprache. Hamburg: Helmut Buske Verlag. Sierks, Martin (2012): Sprachwandel. Eine beispielhafte Analyse der Fußballsprache. Bachelorarbeit. Flensburg: Europa-Universität Flensburg. Simmen, Florian (2010) (Hrsg.): Langenscheidt UEFA Praxiswörterbuch Fußball: Englisch-DeutschFranzösisch. Berlin/München: Langenscheidt Fachverlag. Taborek, Janusz (2012): Mehrsprachigkeit im Fußball und mehrsprachige Wörterbücher der Fußballterminologie aus deutsch-polnischer Sicht. In: Taborek, Janusz/Tworek, Artur/ Zieliński, Lech (Hrsg): Sprache und Fußball im Blickpunkt linguistischer Forschung. Hamburg: Dr. Kovač Verlag, 125–139. Tworek, Artur (2000): Język sportu – próba definicji (analiza języka polskiego i niemieckiego). In: Szpila, Grzegorz (Hrsg.): Zbiór referatów z konferencji ’Język trzeciego tysiaclecia‘ Kraków, 2–4 marca 2000. Kraków: Krakowskie Tow. Popularyzowania Wiedzy o Komunikacji Językowej „Tertium“, 331–340. Tworek, Artur (2012): Einige Bemerkungen zum Begriff ‚Sportsprache‘ aus der polnisch-deutschen Perspektive. In: Taborek, Janusz/Tworek, Artur/Zieliński, Lech (Hrsg): Sprache und Fußball im Blickpunkt linguistischer Forschung. Hamburg: Dr. Kovač Verlag, 141–151. Wróbel, Aleksandra (2015): Vznik a vývoj športovej lexiky v oblasti telocviku a cvičenia v Nemecku v 19. Storočí – Výskum slovnej zásoby. Dissertation. Tyrnau: Universität der Hl. Kyrill und Method in Trnava.
Internetquellen Duden. Kollokation [Unter: ; letzter Zugriff: 12.07.2019]. Sketch Engine. [Unter: ; letzter Zugriff: 10.07.2019]. Sportportal. [Unter: ; letzter Zugriff: 25.05.2019]. Kicktionary. [Unter: ; letzter Zugriff: 15.06.2020].
Milka Enčeva, Vida Jesenšek
Zur Geschichte der Kolloquiumsreihe zur Lexikographie und Wörterbuchforschung in Südost- und Osteuropa (2000–2018). Begründet von H. E. Wiegand und P. Petkov Abstract: The colloquia on lexicography and dictionary research represent a series of biennial international events that have been held at various universities in Southeast and Eastern Europe since 2000 and are primarily organized by the German studies institutes. The article reports on the beginning and the development of the events, presents the subject matter dealt with on theory, practice and research into lexicography and draws attention to the problems discussed. The developmental tendencies that have characterized (Germanistic) lexicography and dictionary research in the last 20 years and at the same time deficits and the associated demands on lexicographical theory and practice can be traced from the content of held colloquia. Keywords: lexicography, dictionary research, Southeast and Eastern Europe, Herbert Ernst Wiegand, Pavel Petkov Schlagwörter: Lexikographie, Wörterbuchforschung, Südosteuropa und Osteuropa, Herbert Ernst Wiegand, Pavel Petkov
1 Einleitung Im Oktober 2018 fand an der Adam-Mickiewicz-Universität in Posen (Polen) bereits das 10. Lexikographische Kolloquium zur Lexikographie und Wörterbuchforschung statt. Das Jubiläumskolloquium folgte einer Reihe biennaler Veranstaltungen, die seit 2000 an verschiedenen Universitäten in Südost- und Osteuropa durchgeführt und vorrangig von den Germanistik-Instituten organisiert worden sind (Sofia, Varna, Bratislava, Szeged, Maribor). Das 10. Jubiläumskolloquium gibt Anlass zur Analyse und Reflexion. So will der vorliegende Beitrag über den Anfang und die Entwicklung der Veranstaltung kurz berichten, die jeweils behandelte Thematik zur Theorie, Praxis und Erforschung der Lexikographie darlegen und auf die diskutierte Problematik aufmerksam machen. An der inhaltlichen Ausprägung einzelner Kolloquien lassen sich
Milka Enčeva, Universität Maribor, [email protected] Vida Jesensek, Universität Maribor, [email protected] https://doi.org/10.1515/9783110716955-011
226
Milka Enčeva, Vida Jesenšek
deutlich Entwicklungstendenzen nachvollziehen, welche die (germanistische) Lexikographie und Wörterbuchforschung in den letzten 20 Jahren kennzeichnet haben und zugleich Defizite und damit verbundene Anforderungen an die lexikographische Theorie und Praxis erkennen. Nicht zuletzt sind die zur Tradition gewordenen 10 lexikographische Kolloquien in Südost- und Osteuropa ein Beweis dafür, dass die lang verbreitete Meinung, „die Lexikographie sei wenig mehr als eine Praxis für fleißige Philologen“ (Wiegand 1981: 3), seit einiger Zeit nicht mehr gilt. Einführend wird das seit den 70er Jahren des 20. Jahrhunderts wachsende Interesse an der Lexikographie sowie die Idee zur Durchführung von Kolloquien in Südost- und Osteuropa kurz behandelt. Sodann stehen im Fokus der Ausführungen einzelne lexikographische Kolloquien, chronologisch verschiedenen Phasen ihrer Entwicklung zugeordnet. Anschließend wird das im Jahr 2016 in Maribor organisierte 9. Kolloquim näher dargelegt, denn durch sein Rahmenthema – Wörterbuchstrukturen zwischen Theorie und Praxis kann es als eine Art Zusammenfassung aller bisherigen Kolloquiumsthemen betrachtet werden.
2 Von der Idee und Entwicklung der Kolloquienreihe zur Lexikographie und Wörterbuchforschung in Südost- und Osteuropa 2.1 Das wachsende Interesse an der Lexikographie im letzten Quartal des 20. Jahrhunderts Zum wachsenden Interesse an der Lexikographie und ihren Produkten wurde in den 80er Jahren Folgendes festgehalten: Das Interesse an Wörterbüchern lässt sich an deren ständig wachsenden Verkaufszahlen ablesen und folglich an der Tatsache, dass sie zu den häufigst verkauften Büchern gehören. Ihr hoher Gebrauchswert besteht darin, dass sie im Beruf und im privaten Alltag unentbehrlich geworden sind, wenn wir die nötigen linguistischen und kulturell sowie sozial bedingten sprachlichen Informationen finden wollen und/oder müssen.1
Dazu wurden die Wörterbücher in aller Regel öffentlich (vorrangig in Zeitungen und Zeitschriften) präsentiert und ihre Qualität kritisch diskutiert. Seit Mitte der 70er Jahre erfuhr die Lexikographie auch politische Förderung; so z. B. in der Schlußakte der Konferenz für Sicherheit und Zusammenarbeit in Europa (Helsinki 1975), wonach sie zu den Aufgaben von hoher gesellschaftlicher Bedeutung zähle.
1 So im Werbeprospekt des Bibliografischen Instituts 1985/I, zit. nach Schaeder (1987: 20).
Zur Geschichte der Kolloquiumsreihe zur Lexikographie und Wörterbuchforschung
227
Nach dem Fall des Eisernen Vorhangs und der Öffnung der Grenzen kam es europaund weltweit zu intensiven politischen und wirtschaftlichen Beziehungen, was die Lexikographie wieder verstärkt in den Fokus des öffentlichen Interesses rückte. In den 70er Jahren wuchs zugleich das linguistische Interesse an der Lexikographie an: Wörterbücher wurden Gegenstand wissenschaftlicher Untersuchungen und man bemühte sich um eine theoretisch-empirische Fundierung der lexikographischen Praxis. Davon zeugen zahlreiche Veröffentlichungen zu vielfältigen lexikographiebezogenen Themen in linguistischen Publikationen verschiedenster Art. Die Gründung von EURALEX, der wissenschaftlichen Gesellschaft für Lexikographie (Lexikographie, engl. European Association for Lexicography in 1983) kann als ein bedeutsamer Schritt in der Entwicklung der modernen Lexikographie angesehen werden. Es folgten die Herausgabe und Etablierung einer Zeitschrift und einer Buchreihe, zweier spezialisierter Diskussionsplattformen für Theoretiker und Praktiker im Bereich der Lexikographie: die internationale Buchreihe Lexicographica. Series Maior, die 1984 gegründet wurde, und die 1985 eingerichtete Fachzeitschrift Internationales Jahrbuch für Lexikographie (Lexicographica. Internationales Jahrbuch für Lexikographie).2 Immer noch spielt für die Entwicklung der theoretischen und praktischen Lexikographie eine äußerst bedeutende Rolle das umfangreiche enzyklopädische Werk in drei Bänden mit dem selbsterklärenden Titel Wörterbücher/ Dictionaries/Dictionnaires, herausgegeben von F. J. Hausmann, O. Reichmann, H. E. Wiegand und L. Zgusta (1989–1991). Daraufhin folgten zahlreiche wissenschaftliche und Fachveranstaltungen zur theoretischen und praktischen Lexikographie, die hier nicht alle erwähnt werden können. Es seien jedoch zwei Veranstaltungsreihen genannt, die für die Idee zur Einrichtung des Kolloquiums in Südost- und Osteuropa eine wichtige Rolle gespielt haben: Kopenhagener Kolloquien über Lexikographie in den 70er und 80er Jahren, wodurch die Universität Kopenhagen zum Zentrum der internationalen wissenschaftlichen Diskussion im Bereich der ein- und zweisprachigen Lexikographie in Europa jener Zeit wurde und Lexikographische Kolloquien in Heidelberg zwischen 1983 und 1996, zu denen fortgeschrittene Studierende, Hochschullehrkräfte der Universitäten in Heidelberg, Mannheim und Darmstadt, Lexikographen aus Deutschland und anderen Ländern eingeladen wurden. Vorträge, die in vier Bänden unter dem Titel Wörterbücher in der Diskussion veröffentlicht wurden (hrsg. von H. E. Wiegand, 1989–2000), behandeln Themen zu den vier grundlegenden Teilgebieten der Wörterbuchforschung: zur systematischen und historischen Wörterbuchforschung, zur Wörterbuchkritik sowie zur Wörterbuchbenutzungsforschung.
2 Beide wurden anfangs vom Max Niemeyer Verlag verantwortet, gegenwärtig erscheinen sie beim Walter de Gruyter Verlag.
228
Milka Enčeva, Vida Jesenšek
2.2 Lexikographische Kolloquien in Südost- und Osteuropa Im Jahr 1984 begann die Erarbeitung eines großen bulgarisch-deutschen Wörterbuchs. Am internationalen lexikographischen Projekt beteiligt waren der Lehrstuhl für Germanistik an der St. Kliment-Ohridski-Universität in Sofia unter der Leitung von Pavel Petkov und das Institut für Slawistik an der Humboldt-Universität zu Berlin unter der Leitung von Karl Gutschmidt. Nach langjähriger Arbeit wurde das Große Bulgarisch-deutsche Wörterbuch 1999 fertiggestellt und 2001 in Sofia herausgegeben. Konzipiert wurde es als aktives Wörterbuch für bulgarische Muttersprachler, einsetzbar bei der Produktion und Übersetzung deutscher Texte sowie beim Deutschlernen, gleicherweise geeignet ist es aber auch für deutsche Muttersprachler als passives Wörterbuch bei der Rezeption bulgarischer Texte und beim Erlernen des Bulgarischen. Durch die Arbeit am Wörterbuch, an der die meisten Linguisten des Lehrstuhls für Germanistik an der St. Kliment-Ohridski-Universität in Sofia beteiligt waren, erhöhte sich das Interesse an der lexikographischen Praxis und der Theorie der Wörterbuchforschung in Bulgarien enorm. In den späten 80er Jahren war Pavel Petkov, der bulgarische Projektleiter, korrespondierendes Mitglied des Wissenschaftlichen Rates des IDS in Mannheim und trat bei dieser Gelegenheit in Kontakt mit Herbert Ernst Wiegand. Die Bekanntschaft führte schnell zu vertieften Diskussionen über lexikographische Themen. So ist es auch zur Idee gekommen, nach dem Vorbild der Kophenhagener Kolloquien vergleichbare periodische Veranstaltungen in Bulgarien (Sofia) zu organisieren. 1999 haben sich die Deutsche Forschungsgemeinschaft und die Hanns-Seidel-Stiftung bereit erklärt, das Kolloquium an der Sofioter Universität St. Kliment Ohridski finanziell zu unterstützen und so hat seine Geburtstagsstunde geschlagen. Die beiden Mitbegründer, H. E. Wiegand und P. Petkov, wollten eine bienall stattfindende internationale Fachveranstaltung in die Wege leiten, um die praktische Wörterbucherstellung und Wörterbuchforschung in Südost- und Osteuropa zu fördern und Kontakt mit der (vorrangig) germanistischen Lexikographie und Wörterbuchforschung zu gewährleisten.
3 Kolloquien zwischen 2000 und 2004 Die ersten drei Kolloquien fanden in Bulgarien statt: 2000 und 2002 an der St. Kliment-Ohridski-Universität in Sofia und 2004 in Varna, organisiert allerdings von der Konstantin-Preslavski-Universität Shumen. Die drei Veranstaltungen weisen mehrere gemeinsame Züge auf; neben der intensiven Behandlung der zweisprachigen Lexikographie (mit Deutsch) ist die Absicht und der Wunsch der Mitbegründer zu betonen, die Kolloquien mit einer begrenzten Zahl der gezielt eingeladenen Teilnehmer durchzuführen, damit der Fokus auf Diskussionen und Erfahrungsaustausch gelegt werden konnte. Am 1. Kolloquium zur Wörterbuchforschung (Sofia, 2000) waren somit zehn
Zur Geschichte der Kolloquiumsreihe zur Lexikographie und Wörterbuchforschung
229
Teilnehmer beteiligt; neben H. E. Wiegand aus Deutschland kamen alle anderen aus dem Gastgeberland Bulgarien. Auch an den weiteren zwei Kolloquien gab es wenig Teilnehmer aus dem Ausland: Am 2. Kolloquium mit dem Rahmentitel Kontrastive Lexikologie und zweisprachige Lexikographie (Sofia, 2002) gab es fünf ausländische und acht bulgarische Teilnehmer, am 3. Kolloquium zum Thema Zweisprachige Lexikographie und Deutsch als Fremdsprache (Varna, 2004) kamen vier aus dem Ausland und 13 aus Bulgarien. Für das erste Kolloquium wurde absichtlich ein breites Thema festgelegt, damit einzelne Teilbereiche der Lexikographie zur Diskussion gestellt werden konnten (vgl. Igla u. a. 2001: V). Die Thematik der darauffolgenden Kolloquien war jeweils doppelt ausgerichtet, wodurch die enge Beziehung zwischen der zweisprachigen Lexikographie und der kontrastiven Lexikologie (2002) sowie zwischen der zweisprachigen Lexikographie und dem Fachbereich Deutsch als Fremdsprache (2004) diskutiert werden konnte.
3.1 Das 1. Lexikographische Kolloquium (Sofia, 2000) Die Veranstaltung fand zwischen dem 7. und dem 8. Juli 2000 am Institut Germanikum3 in Sofia statt. In einem Plenarvortrag (Sprachkontaktwörterbücher: Typen, Funktionen, Strukturen) ging H. E. Wiegand auf wichtige metalexikographische Begriffe ein: Wörterbuchfunktionen, Textverbundstrukturen, Mikrostrukturen von Wörterbuchartikeln wurden expliziert und auf die Untersuchung der Sprachkontaktwörterbücher angewendet. In weiteren metalexikographisch und methodologisch ausgerichteten Beiträgen kamen verschiedenartige thematische Schwerpunkte zur Sprache: lexikographische Erfassung von zwischensprachlichen Äquivalenzbeziehungen (Petkov), pragmatische Angaben in zweisprachigen Lernerwörterbüchern (Drumeva), textuelle Präsentation etymologischer Duplizität in etymologischen Wörterbüchern (Paraschkewow), Angaben zu syntaktischen Konstruktionen in zweisprachigen Wörterbüchern (Baschewa), Polysemie und Homonymie im Wörterbuch der falschen Freunde (Dentschewa), zweisprachige Fachwörterbücher mit Bulgarisch (Politov), die Erfassung der Fußball-Lexik in allgemeinsprachlichen Wörterbüchern (Stolinov), zweisprachige Lexikographie des Romani in deutscher Sprache (Igla). Es wird deutlich, dass Das 1. Internationale Kolloquium zur Wörterbuchforschung eine beträchtliche Themenvielfalt aufweist, dass die Mehrheit der Beiträge sich jedoch auf zweisprachige Wörterbücher konzentrierte. Alle Beiträge wurden 2001 in der Sondernummer der Zeitschrift Germanistische Linguistik 161–162 (Theoretische und praktische Probleme der Lexikographie, Hg. B. Igla, P. Petkov, H. E. Wiegand) veröffentlicht.
3 Germanikum war zu jener Zeit das Institut für deutsche Geistes- und Sozialwissenschaften und funktionierte im Rahmen der St. Kliment-Ohridski-Universität in Sofia.
230
Milka Enčeva, Vida Jesenšek
3.2 Das 2. Lexikographische Kolloquium (Sofia, 2002) Das 2. Lexikographische Kolloqium zum Thema Kontrastive Lexikologie und zweisprachige Lexikographie wurde nochmalig von der St. Kliment-Ohridski-Universität in Sofia organisiert. Der Plenarredner H. E. Wiegand (Äquivalentpräsentation und Wörterbuchfunktionen in zweisprachigen Printwörterbüchern. Mit einem Seitenblick auf die so genannte „moderne lexikographische Funktionslehre“) ging vom Begriff der Wörterbuchfunktionen aus und besprach den Einfluss von vier primären Wörterbuchfunktionen (Rezeption, Textproduktion, Her- und Hinübersetzung) auf die lexikographische Äquivalenzpräsentation. Petkov stellte Möglichkeiten zur Erfassung der zielsprachigen Äquivalente in zweisprachigen Wörterbüchern zur Diskussion, Gouws setzte sich mit Funktionalität von Mikrostrukturen in zweisprachigen Wörterbüchern eng verwandter Sprachen auseinander. In Anbetracht der Erstellung eines viersprachigen deutsch-slowenisch-slowakisch-ungarischen phraseologischen Lernerwörterbuchs stellte Jesenšek potentielle Wörterbuchbenutzer und deren Bedürfnisse in den Fokus. In den weiteren Beiträgen kamen verschiedene Aspekte der lexikographischen Erfassung von Sprachdaten zur Sprache, so die historische pragmatische Markierung (Drumeva), die Grammatik (Grozeva), etymologische Markierung von Germanismen in bulgarischen Wörterbüchern (Paraschkewow), deutsche Lehnwörter in der bulgarischen Folklore (Kotscheva-Lefedjieva), Partikeln in der zweisprachigen Lexikographie (Wolski), Homonymie/Polysemie in zweisprachigen Wörterbüchern (Enčeva), terminologischer Wortschatz Bulgarisch-Deutsch (Politov; Stolinov). Die gewählte Thematik wurde vorrangig, d. h. mit Ausnahme der ausländischen Kolloquiumsteilnehmer an Beispielen für das Sprachenpaar Deutsch und Bulgarisch besprochen. Die Beiträge erschienen 2005 in der Sondernummer der Zeitschrift Germanistische Linguistik 179 (Kontrastive Lexikologie und zweisprachige Lexikographie, Hg. B. Igla, P. Petkov, H. E. Wiegand).
3.3 Das 3. Lexikographische Kolloquium (Varna, 2004) Das 3. Lexikographische Kolloquium zum Thema Die Zweisprachige Lexikographie und Deutsch als Fremdsprache fand in Varna statt und wurde von der KonstantinPreslavski-Universität Schumen organisiert. Den Plenarvortrag mit dem Titel Die Wörterbücher zur Sprach- und Kommunikationswissenschaft (WSK) und ihre Benutzungsmöglichkeiten im Fach Deutsch als Fremdsprache hielt, wie nun schon üblich, H. E. Wiegand, in dem er das große fachlexikographische Projekt vorstellte, in dessen Rahmen die Wörterbuchserie Wörterbücher zur Sprach- und Kommunikationswissenschaft (WSK) erarbeitet wurde. Dadurch entwickelte Wiegand den Typ eines fachlichen Lernwörterbuchs und betonte die Rolle der Benutzungsmöglichkeiten und Benutzerbedürfnisse bei der Festlegung von Wörterbuchfunktionen. Es folgten metalexikographisch-methodologisch ausgerichtete Beiträge, in denen Folgendes
Zur Geschichte der Kolloquiumsreihe zur Lexikographie und Wörterbuchforschung
231
thematisiert wurde: Möglichkeiten einer mikrostrukturellen Erweiterung der Makrostruktur in zweisprachigen Wörterbüchern (Petkov), Konzept zur Entwicklung eines zweisprachigen Wörterbuchs als Datenbank (Gouws), methodologische Fragen der Phrasem-Selektion in der lernorientierten Phraseographie (Jesenšek), kulturspezifische Dimensionen zweisprachiger Wörterbücher (Ivanova), anvisierte Benutzergruppen für die deutsch-bulgarische Lexikographie (Paraschkewow; Drumeva), Strukturformeln in Lernerwörterbüchern mit Deutsch und Bulgarisch (Dentscheva). – In Anlehnung an die bilinguale Lexikographie wurden darüber hinaus kontrastiv-lexikologische und translatorisch ausgerichtete Themen behandelt, so der Wortschatz des Komischen (Dimova), Bilder des Schönen im deutschen und bulgarischen Volksmund (Dimitrova) und Äquivalentfindung für Kulturspezifika in Fachwörterbüchern (Kileva-Stamenova). Auch für das 3. Lexikographische Kolloquium gilt, dass in den meisten Beiträgen die (traditionelle) zweisprachige Lexikographie für das Sprachenpaar Deutsch und Bulgarisch thematisiert wurde, an einigen Ausführungen waren aber auch Entwicklungstendenzen der damaligen Lexikographie erkennbar, nämlich die Begrifflichkeit einer Datenbank als empirische Basis für die Erstellung von Wörterbüchern und ebenso eine stärkere Hinwendung zum Wörterbuchbenutzer. Die Beiträge erschienen 2006 in der Sondernummer der Zeitschrift Germanistische Linguistik 184–185 (Zweisprachige Lexikographie und Deutsch als Fremdsprache, Hg. A. Dimova, V. Jesenšek, P. Petkov).
4 Die Lexikographischen Kolloquien zwischen 2006 und 2010 Im Zeitraum von 2006 bis 2010 wurden Kolloquien außerhalb Bulgariens organisiert und damit verbunden ist die Anzahl der Teilnehmer wesentlich gestiegen: 2006 gab es 27 Teilnehmer, 2008 waren es 16 und 2010 nahmen 28 Vortragende an der Veranstaltung teil. Betrachtet man den Teilnehmeranteil aus dem Nichtgastgeberland, so kann man von einer starken Internationalisierung des Kolloquiums sprechen. Die Veranstaltung fand jedes Mal in einem anderen Land in Südost- oder Osteuropa statt.
4.1 Das 4. Lexikographische Kolloquium (Maribor, 2006) Das lexikographische Kolloquium an der Universität Maribor kann mit seiner Rahmenthematik (Wörterbuch und Übersetzer) als Fortsetzung internationaler Veranstaltungen zur Lexikographie und Übersetzung (1983 Exeter, 1987 Innsbruck, 2002 Hong Kong) angesehen werden. Im Plenarvortrag referierte H. E. Wiegand die Forschungslage im Bereich der Wörterbuchbenutzung beim Übersetzen und stellte die
232
Milka Enčeva, Vida Jesenšek
von ihm entwickelte handlungstheoretisch fundierte Theorie der Wörterbuchbenutzung (1998) und die Methodologie der empirischen Forschung in diesem Bereich dar. Auf der Grundlage der Wiegand’schen Methodologie präsentierte Enčeva die Erstellung der Wörterbuchbenutzungsprofile von Studierenden. Mehrere Beiträge waren der Fachlexikographie und ihrer Rolle bei der Übersetzung gewidmet: Schierholz berichtete über die Konzeption der Wörterbuchserie zur Sprach- und Kommunikationswissenschaft (WSK) und ging auf Probleme der Äquivalentfindung und Übersetzbarkeit von Fachtermini ein; Andree und Grünbichler stellten das an der Karl-Franzens-Universität in Graz entwickelte Fachgebärdenlexikon vor; Gruntar Jermol setzte sich mit der isolierten Behandlung von Rechtstermini in Wörterbüchern mit Deutsch und Slowenisch auseinander; Kileva Stamenova betrachtete kritisch und mit Bezug auf die Übersetzung ausgewählte Rechtswörterbücher mit Deutsch und Bulgarisch. Diskutiert wurden weiterhin methodisch-methodologische Fragen der korpusbasierten Datenermittlung und -präsentation in der lexikographischen Praxis, vgl. Ďurčo zu Möglichkeiten der Vernetzung von lexikographischen und korpuseigenen Informationen zu Sprichwörtern und Jesenšek zur lexikographischen Erfassung von Phrasemen im ausgewählten großen deutsch-slowenischen allgemeinen Wörterbuch. In weiteren Beiträgen thematisierte man Kollokationen (Hollós, Gabrovšek), valenzorientierte Fragestellungen an die Lexikographie (Djordjević, Hrustić, Krevs Birk, Uzony), zweisprachige allgemeine Wörterbücher (Gouws, Paraschkewow, Memić, Lipavic Oštir), die Erstellung und Nutzung von Korpora und Paralleltext-Datenbanken (Željko, Arhar, Nikolić-Hoyt), kulturspezifische Wörterbuchinformationen (Šabec, Heusinger, Kučiš/Mikić) und die Wörterbuchbenutzung beim Übersetzerstudium (Dentscheva, M. Vrbinc, A. Vrbinc). Als thematische Bereicherung und Themenausweitung dieses Kolloquiums kann die Hinwendung zum Einsatz von Korpora und zur Erstellung von Datenbanken in der lexikographischen Forschung und Praxis angesehen werden. Die Beiträge erschienen 2008 in der Sondernummer der Zeitschrift Germanistische Linguistik 195–196 (Wörterbuch und Übersetzung, Hg. V. Jesenšek, A. Lipavic Oštir).
4.2 Das 5. Lexikographische Kolloquium (Bratislava, 2008) Das 5. Lexikographische Kolloquium wurde dem Thema Feste Wortverbindungen und Lexikographie gewidmet und fand 2008 in Bratislava statt; die Internationalisieung und Themenerweiterung des Kolloquiums setzten sich fort. Behandelt und diskutiert wurden nicht nur die Problematik der vielfältigen Phraseologie in der zweisprachigen Lexikographie mit Deutsch, sondern gleichermaßen auch die lexikographische Erfassung von festen Wortverbindungen in der einsprachigen Lexikographie des Deutschen, Slowakischen, Afrikaans und Baseldeutschen.
Zur Geschichte der Kolloquiumsreihe zur Lexikographie und Wörterbuchforschung
233
Mit der makro- und mikrostrukturellen Präsentation von Phrasemen in allgemeinen einsprachigen Wörterbüchern setzte sich einführend H. E. Wiegand auseinander; unterbreitet und begründet wurden praktisch-lexikographische Lösungen grundlegender Fragen der lexikographischen Erfassung von Mehrwortlexemen verschiedener Art. Gouws befasste sich mit der Präsentation von festen Wortverbindungen in allgemeinen zweisprachigen Wörterbüchern; die Abgrenzung der Kollokationen von anderen festen Wortverbindungen stand im Fokus der Beiträge von Hamzlíčková und Hollós, Petkova-Kessanlis befasste sich mit fachsprachlichen Kollokationen im linguistischen Diskurs. Dem zwischensprachlichen Vergleich von Kollokationen und deren lexikographischen Präsentation in zweisprachigen Wörterbüchern gewidmet waren die Beiträge von Banášová und Homolová (Deutsch, Slowakisch), Baschewa (Deutsch, Bulgarisch), Dobrovol´skij und Šarandin (Deutsch, Russisch), M. Vrbinc und A. Vrbinc (Englisch, Slowenisch). Des Weiteren wurden korpusbasierte Verfahren zur Ermittlung und Auswertung sprachlicher Daten diskutiert: Bei Quasthoff und Schmidt kamen Verfahren der korpusbasierten Identifikation von Phrasemen zur Sprache, anhand empirischer Daten aus dem Tschechischen Nationalkorpus befasste sich Čermák mit Kollokationsstrukturen im Tschechischen; Ďurčo setzte sich mit statistischen Methoden zur Extraktion von sprachlichen Korpusdaten am Beispiel des Slowakischen Nationalkorpus auseinander; zusammen mit Majchráková stellte er die Datenquelle zur Erstellung des ersten elektronischen Wörterbuchs slowakischer Kollokationen und die Verfahren zu deren Auswertung vor. Schließlich berichtete Häcki Buhofer über die empirische Erfassung von Kollokationen für das Wörterbuch des Baseldeutschen. Die Thematik des 5. Kolloquiums spiegelt deutlich die Entwicklung der digitalen Lexikographie und korpusempirischen Erfassung lexikographierelevanter Sprachdaten wider und zeugt dadurch von der Aktualität und Zeitgebundenheit der Veranstaltung. Die meisten Beiträge erschienen in der Reihe Lexicographica. Series maior (2010) unter dem Titel Feste Wortverbindungen und Lexikographie in der Herausgeberschaft von P. Ďurčo.
4.3 Das 6. Lexikographische Kolloquium (Maribor, 2010) Gastgeber des 6. Lexikographischen Kolloquiums mit dem Titel Lexikographie der Fachsprachen. Print- und digitale Formate, Fachwörterbücher, Datenbanken war zum zweiten Mal die Abteilung für Germanistik an der Philosophischen Fakultät der Universität Maribor. Thematisiert wurden Theorien, Methoden und Ergebnisse der Forschung zur Lexikographie der Fachsprachen und Terminographie, für die nach wie vor gilt, dass noch vieles unerforscht ist und dass die fachlexikohraphische und ter-
234
Milka Enčeva, Vida Jesenšek
minographische Praxis nicht selten von den theoriegeleiteten Diskussionen der gegenwärtigen Wörterbuchforschung weit entfernt bleibt. Die breit angelegte Rahmenthematik lässt sich vier Themenschwerpunkten zuordnen. Zu formalen, methodologischen, sozialen und funktionalen Aspekten der Fachlexikographie referierte zunächst der Plenarredner H. E. Wiegand; anhand des Wörterbuchs zur Lexikographie und Wörterbuchforschung und vor dem Hintergrund der Wörterbuchbenutzung wurden Fragen der Distribution und der textuellen Präsentation vom Fachwissen in einem fachlichen Lern- und Konsultationswörterbuch besprochen. Sodann diskutierten Gruntar Jermol die lexikographische Datendistribution in juristischen Fachlexika, Gouws die Notwendigkeit der Etablierung einer Wörterbuchkultur im fachlexikographischen Bereich, Beguš die lexikographische Behandlung fremder Termini in einem touristischen Fachlexikon mit Slowenisch, Tokarz und Warchał die Entstehung lexikaler Hybride in slawischen Fachsprachen. Zum zweiten Themenschwerpunkt dieses Kolloquiums zählten Beiträge zu Problembereichen und Perspektiven der computergestützten Fachlexikographie und Terminographie: Bratanić und Ostroški Anić präsentierten die kroatische terminologische Datenbank namens STRUNA, Ďurčo besprach die phraseologische Terminologie in der Slowakischen terminologischen Datenbank, Schierholz fokussierte sich auf die Valenz des Subtantivs und ihre lexikographische Präsentation, Costa stellte ein portugiesisches Forschungsprojekt im Fachbereich Verwaltung vor, Koletnik, Benko und Zorko thematisierten die slowenische dialektale Fachlexikographie, Heid sprach über die computergestützte Erarbeitung von Rohmaterial für juristische Fachwörterbücher und Željko problematisiserte das aktuelle Angebot an terminologischen Quellen in übersetzerischen Zusammenhängen. Es folgten einige kritisch-analytische Auswertungen ausgewählter Fachwörterbücher, so A. Vrbinc, M. Verbinc, Chłopek, Kida und Będkowska-Kopczyk. – Schließlich wurden ausgewählte fachlexikographische und terminographische Produkte auch in Bezug auf Lernprozesse und Übersetzung thematisiert: Schierholz besprach den damals neuen internationalen Studiengang EMLex (Europäischer Master für Lexikographie), Enčeva und Plos präsentierten Ergebnisse einer Untersuchung der Gewohnheiten von Studierenden bei der Wörterbuchbenutzung, Dentschewa und Aleksova besprachen die Rolle der grammatischen Terminologie in der germanistischen Hochschulbildung, Kučiš diskutierte den Einsatz von sprachtechnologischen Ressourcen in Übersetzungsprozessen, im Beitrag von Ivanova ging es um die Relation Student (Benutzer) – Fachwörterbuch, die in der gängigen fachlexikographischen Praxis viel zu wenig berücksichtigt wird. Das Kolloquium wurde abgeschlossen mit dem Beitrag von Jesenšek, die anhand der Situation in Slowenien eine Art Statement zum Stand der Fachlexikographie darstellte. Die meisten Kolloquiumsbeiträge sind in der Reihe Lexicographica. Series maior (2013) unter dem Titel Specialised Lexicography in der Herausgeberschaft von V. Jesenšek erschienen.
Zur Geschichte der Kolloquiumsreihe zur Lexikographie und Wörterbuchforschung
235
5 Die Lexikographischen Kolloquien zwischen 2012 und 2018 Am 7. Kolloquium zum Thema Print- und E-Wörterbücher im Vergleich: Konvergenzen, Divergenzen, Probleme, Perspektiven (2012) in Sofia nahmen 19 Teilnehmer aus sechs Ländern teil, am 8. Kolloquium zum Thema Lernerwörterbücher (2014) in Szeged 18 Teilnehmer aus neun Ländern und am 10. Kolloquium zum Thema Korpora in der Lexikographie – Stand und Perspektiven (2018) in Posen gab es 13 Teilnehmer aus neun Ländern. Mit bis zu 20 Beteiligten wird die Teilnehmerzahl wieder niedriger gehalten, damit, wie am Anfang beabsichtigt, intensivere Diskussionen ermöglicht wurden. Den Rahmenthemen einzelner Veranstaltungen ist das gestiegene Interesse an der E-Lexikographie deutlich abzulesen.
5.1 Das 7. Lexikographische Kolloquium (Sofia, 2012) Nach acht Jahren kam das Lexikographische Kolloquium wieder nach Bulgarien zurück und wurde erneut vom Lehrstuhl für Germanistik an der St. Kliment-OhridskiUniversität organisiert. Die Rahmenthematik (Print- und E-Wörterbücher im Vergleich: Konvergenzen, Divergenzen, Probleme, Perspektiven) trug einer intensiven Entwicklung von Informationstechnologien und deren Einsatz in der Lexikographie Rechnung. Ziel des Kolloquiums war es festzustellen, ob und bis zu welchem Grad bei der Erstellung elektronischer Wörterbücher von den Möglichkeiten neuer Technologien Gebrauch gemacht wird bzw. inwieweit sie immer noch in den lexikographischen Traditionen der Printwörterbücher gefangen bleiben. Den Plenarvortrag hielt A. Storrer (Internet-Lexikographie: Produkte – Prozesse – Perspektiven); nach einer übersichtlichen Darstellung der Internet-Lexikographie in Deutschland ging sie auf den Einfluss digitaler Medien auf die lexikographischen Produkte und Prozesse ein. Der zweite Plenarvortrag von H. Lobin zum Thema Kulturtechniken im medialen Wandel konnte als Fortsetzung der Diskussion zum tiefgreifenden Wandel der Lexikographie infolge der Digitalisierung und die Ausweitung des Letzteren auf die kommunikativen Kulturpraktiken des Lesens und Schreibens betrachtet werden. Es wurde gezeigt, wie sich veränderte kulturelle Praktiken auf Kommunikationsbereiche wie Wissenschaft und Verlagswesen auswirken. Der Vergleich von Print- und E-Wörterbüchern stand im Fokus weiterer Beiträge: Spillner machte eine kurze Bestandaufnahme allgemein- und fachsprachlicher polyglotter Printwörterbücher und wies auf Möglichkeiten ihrer Digitalisierung hin; Jesenšek stellte das Datenbasis-Konzept für elektronische phraseologische Lernerwörterbücher vor; Enčeva verglich das PONS Print- mit dem PONS Online-Wörterbuch für das Sprachenpaar Deutsch und Slowenisch und überprüfte die mediengerechte Präsentation lexikographischer Daten; auch Rentel erstellte einen Vergleich
236
Milka Enčeva, Vida Jesenšek
zwischen der Print- und elektronischen Version eines zweisprachigen Wörterbuchs Italienisch-Deutsch und ging näher auf die strukturelle Gestaltung ein. Im Beitrag von Taborek ging es vergleichsweise um die Frage, ob die Möglichkeiten der digitalen Medien bei der Erstellung von E-Wörterbüchern bis dahin genügend Berücksichtigung gefunden haben; ähnlich konzipiert wurden Beiträge von Hollós, Kispál und Petkova-Kessanlis, in denen es um digitale lexikographische Präsentation von Kollokationen, Sprichwörtern oder Phrasemen ging. Dem Vergleich lexikographischer Methoden bei der Erstellung von Print-, elektronischen und korpusbasierten Valenzwörterbüchern bulgarischer Verben widmete sich Osenova, wogegen Stamenov Möglichkeiten für die Kodierung und Präsentation emotionaler Bedeutungsanteile in der zweisprachigen elektronischen Lexikographie erörterte. Darüber hinaus wurden Optionen für die Anwendung von E-Wörterbüchern beim Fremdsprachenlernen und/oder im Germanistikstudium diskutiert: Baschewa besprach einen möglichen Einsatz des digitalen Valenzwörterbuchs E-VALBU (IDS Mannheim) im Germanistikstudium, A. Vrbinc zeigte, wie durch einsprachige englische CD-ROMLernerwörterbücher zusätzliche enzyklopädische und sprachliche Informationen angeboten werden können, Laskova, Velkova, Burova und Stoyanov stellten eine im Studium einsetzbare elektronische terminologische Datenbank zur bulgarischen und deutschen Grammatik vor. Man sieht: Das 7. Kolloquium konzentrierte sich auf den Vergleich und auf die Vorteile der aufkommenden elektronischen Lexikographie. Leider wurden Beiträge in der Form einer Sammelpublikation nicht herausgegeben. Über das 7. Kolloquium ist der Bericht von Mikaela Petkova-Kessanlis in Lexicographica. Internationales Jahrbuch für Lexikographie Vol. 29 (2013) erschienen.
5.2 Das 8. Lexikographische Kolloquium (Szeged, 2014) Zum ersten Mal in Ungarn fand 2014 das Kolloquium zum Thema Lernerwörterbücher in Szeged statt; organisiert wurde es vom Lehrstuhl für Germanistik am Institut für Germanistik der Universität Szeged in Zusammenarbeit mit der Ungarischen Akademie der Wissenschaften. Zur Diskussion standen einsprachige und zweisprachige, allgemeine und spezielle, Print- und elektronische Lernerwörterbücher. In seinem Vortrag ging der Plenarrvortragende Prószéky der Frage nach, wie die Suche in Lernerwörterbüchern mithilfe von elektronischen Werkzeugen effizienter gemacht werden könnte; Uzonyi stellte die Vorteilhaftigkeit der durch die Bilingualisierung einsprachiger Lernerwörterbücher entstandenen Lexika zur Diskussion; Pódör setzte sich mit theoretischen Problemen der Präsentation von grammatischen Angaben in einsprachigen englischen Lernerwörterbüchern auseinander; aus der Benutzerperspektive befasste sich Gouws mit einsprachigen Lernerwörter-
Zur Geschichte der Kolloquiumsreihe zur Lexikographie und Wörterbuchforschung
237
büchern und betonte den Status der Muttersprache potentieller Benutzer bei ihrer Erarbeitung. Mehrere Beiträge wurden (erneut) der Ermittlung und Präsentation von Kollokationen bzw. festen Wortverbindungen in Lernerwörterbüchern gewidmet: Hollós stellte das korpus- und datenbasierte deutsch-ungarische syntagmatische Spezialwörterbuch für DaF namens KolleX vor, Reder erörtert die Frage der Effektivität von Lernerwörterbüchern bei der korrekten Verwendung von Kollokationen; Ďurčo legte Selektionskriterien für die Erstellung eines zweisprachigen Lernerwörterbuchs der Kollokationen fest; Bergerová untersuchte analytisch die Erfassung von festen Wortverbindungen in Lernerwörterbüchern mit Tschechisch und Deutsch; Enčeva präsentierte das Konzept zur Erstellung eines zweisprachigen polyfunktionalen Online-Lernerwörterbuchs, während Petkova-Kessenlis der Frage nachging, ob Fachwörterbücher (OnlineWörterbücher und Glossare zur Linguistik) als Lernerwörterbücher eingesetzt werden können. Die Wörterbuchbenutzung war im Fokus des Beitrags von Kispál: er wies auf Möglichkeiten hin, die sich bei der Benutzung von Wörterbuchnetzen durch Fremdsprachenlerner ergeben; Möhrs zeigte zudem, wie anhand der korpusbasiert erarbeiteten Angaben Wortschatzübungen für den landeskundlichen und den allgemeinen Fremdsprachenunterricht entwickelt werden können. Weitere Beiträge waren thematisch weit gefächert: Jesenšek befasste sich mit Qualitätsmerkmalen parömiographischer Beispiele; Tölpel behandelte Zugriffsmöglichkeiten außerhalb der alphabetischen Makrostruktur im Online-Wörterbuch der deutschen Gegenwartssprache elexiko; Olexová besprach verbale Wortpaare im Deutschen und ihre slowakischen Äquivalente; Bielińska stellte ein Lernerwörterbuch für Polnisch als Fremdsprache, Pajzs das Ungarische Nationalkorpus und Taborek das Konzept eines mehrsprachigen Fachwörterbuchs der Fußballsprache Polnisch-Russisch-EnglischDeutsch vor. Das 8. Kolloquium griff zahlreiche Fragen der Lernlexikographie auf, die allerdings im Wesentlichen nach wie vor unbeantwortet bleiben. Auch muss man mit Bedauern feststellen, dass zu diesem Kolloquium keine Sammelpublikation vorliegt. In der Germanistischen Schriftenreihe Aussiger Beiträge (2015) wurde der Bericht von H. Bergerová über das 8. Kolloquium veröffentlicht.
5.3 Das 9. Lexikographische Kolloquium (Maribor 2016) In der Organisation der Abteilung für Germanistik an der Philosophischen Fakultät der Universität Maribor fand das 9. Kolloquium 2016 in Maribor statt. Die Veranstaltung wurde dem 80. Jubiläum von Prof. Dr. Dr. h. c. mult. Herbert Ernst Wiegand gewidmet. Wiegand, auch Mitbegründer und Ehrengast des Kolloquiums, ist für seine umfangreiche wissenschaftliche Leistung zur Theorie der Wörterbuchstrukturen bekannt und in diesem Zusammenhang wurden als Rahmenthema des Kollo-
238
Milka Enčeva, Vida Jesenšek
quiums Wörterbuchstrukturen gewählt (Wörterbuchstrukturen zwischen Theorie und Praxis). Trotz der Vielfalt klassischer Wörterbücher und einer ständig steigenden Zahl digitaler bzw. internetbasierter lexikographischer Produkte bleiben manche Aspekte der Wörterbuchstrukturen nach wie vor weniger geklärt, was noch insbesondere an der Internetlexikographie sichtbar ist. Das Kolloquium widmete sich somit der Thematik, die für die Entwicklung und Erstellung moderner lexikographischer Produkte weiterhin wichtig ist: strukturelle Aspekte und eventuell notwendige Revision bzw. Ergänzung ihrer Theorie, Computeransatz, Professionalisierung lexikographischer Praxis, Konzepte der Lexikographenausbildung und die gesellschaftliche Verantwortung für die lexikographische Theorie und Praxis wurden kritisch unter die Lupe genommen. Wie der Titel des ersten Plenarvortrags ankündigte (Grundlagen und ausgewählte Grundbegriffe der Theorie der Wörterbuchform in der akademischen Lehre. Eine Serie von Einblicken), gab H. E. Wiegand Einblicke in die grundlegende Begrifflichkeit, die in seiner Theorie der Wörterbuchform als zentral gelten und für die er annimmt, dass sie das absolute Minimum sind, das in der akademischen Lehre zu behandeln wäre. Im zweiten Plenarvortrag widmete sich Gouws den lexikographischen Zugriffstrukturen in der elektronischen bzw. Internetlexikographie und betrachtete einige Möglichkeiten, diese an das neue Medium praktisch und theoretisch anzupassen. – In weiteren Kolloquiumsbeiträgen wurden einzelne strukturelle Aspekte der Internetlexikographie erörtert (Jesenšek, Bielińska, Enčeva, Taborek, Kispál, Petkova-Kessanlis, A. Vrbinc); erneut aufgegriffen wurden Kollokationen (Hollós) und andere phraseologische Wortverbindungen samt ihrer nach wie vor mangelnden lexikographischen Erfassung (Jakop, Stantcheva, M. Vrbinc); thematisiert wurde die vielfältige Praxis etymologischer Wörterbücher (Snoj). Der Computereinsatz eröffnet in der Lexikographie neue methodisch-methodologische Aspekte der empirischen Sprachdatenermittlung: Ďurčo thematisierte neue sprachtechnologische Werkzeuge und dadurch gewonnene Daten, die ein verändertes Licht auf die traditionellen Fragen der (bilingualen) Lexikographie werfen; Štavbar präsentiert das Konzept zur Erarbeitung, Systematisierung und lexikographischen Bearbeitung der slowenischen lexikographischen Terminologie, etwa in Form eines elektronischen Wörterbuchs. Man sieht, das Programm des 9. Kolloquiums stand in engster Verbindung mit der gesamten lexikographietheoretischen Leistung des Jubilars und stellte zugleich eine Art inhaltliche Bilanz vorheriger Veranstaltungen dar, die er zusammen mit P. Petkov initiiert hatte. Zu betonen ist, dass in mehreren Beiträgen die Notwendigkeit einer höheren Professionalisierung der lexikographischen Praxis zur Sprache kam. Die meisten Beiträge findet man im Sammelband Wörterbuchstrukturen zwischen Theorie und Praxis, hg. von V. Jesenšek und M. Enčeva und erschienen 2018 in der Reihe Lexicographica. Series Maior.
Zur Geschichte der Kolloquiumsreihe zur Lexikographie und Wörterbuchforschung
239
6 Fazit Die Geschichte der Kolloquien zur Lexikographie und Wörterbuchfoschung in Südost- und Osteuropa zeigt, dass ihr Hauptziel sich mit den Jahren hauptsächlich nicht verändert hat: Dieses bestand von Anfang an darin, Brücken zwischen der germanistischen metalexikographischen Forschung und den vergleichbaren Bereichen in den Ländern Ost- und Südosteuropas (Bulgarien, Slowenien, Slowakei, Ungarn, Polen) zu schlagen; angestrebt wurden Austausch von Wissen und Förderung der Zusammenarbeit auf dem kulturell und gesellschaftlich äußerst bedeutenden Gebiet der theoretischen und praktischen Lexikographie. Rege Diskussionen, gemeinsame Suche nach Antworten auf aktuelle lexikographische Fragen und freundliche gegenseitige Unterstützung bei der Beschäftigung mit Lexikographie waren Kennzeichen aller bisherigen Kolloquien, so auch des 10. Jubiläumskolloquiums, das in diesem Band präsentiert wird. Man würde sich wünschen, dass die Kolloquiumsreihe auch weiterhin einen Beitrag zur Entwicklung der wissenschaftlichen Disziplin Lexikographie leisten wird und dass die Ergebnisse entsprechend wahrgenommen werden – vor allem von den Verlagen und Geldgebern. Hierzu sei auf die neueste Resolution des EURALEXKongresses hingewiesen, die 2016 verabschiedet wurde. Darin heißt es u. a., dass die Erforschung der Wörter und ihre lexikographische Präsentation zu einer prioritären Aufgabe unserer immer mehr mehrsprachigen Gesellschaft werden sollte. Verlage, Forschungsinstitutionen, Universitäten werden aufgefordert, den Wörtern die zentrale Rolle in den Sprachen und Kulturen zuzuweisen, Regierungen wird nahegelegt, die Erarbeitung von qualitätsvollen Wörterbüchern finanziell sicherzustellen, denn unsere mehrsprachige Welt brauche neue Typen von Wörterbüchern, und Letztere brauchen Unterstützung und Anerkennung. Um die Anerkennung ging es auch beim 9. und 10. Kolloquium in Maribor und Posen: um die Anerkennung eines Wissenschaftlers und Lehrers, der bekannt war für seine eiserne Arbeitsdisziplin, für hohe Anforderungen an seine Studenten, Doktoranden und Mitarbeiter und nicht zuletzt an sich selbst, für heftige, jedoch immer argumentierte Kritik fachlich unzulänglichen Wirkens, wohl aber auch für sein reges Interesse am normalen alltäglichen Leben, so etwa am Schifahren, am Tanzen, an guten Weinen. Es mag sein, dass man heute denkt, Wörterbücher brauchen wir eigentlich nicht mehr – Googeln löst alle Probleme, die man mit der Sprache und mit dem Inhalt haben kann. Es mag sein, dass man glaubt, die Wörterbuchschreibung braucht keine professionellen Lexikographen mit fundierten Sprach- und Sachkenntnissen mehr – in der heutigen Zeit entstehen Wörterbücher quasi automatisch mithilfe von Computern, Sprachkorpora und kollaborativ arbeitenden Sprachliebhabern. Es mag aber auch sein, dass doch noch viele Menschen, darunter Fachleute mit linguistischen, speziellen lexikographischen, computerlinguistischen und informatikbezogenen Kenntnissen, daran glauben, dass gute Wörterbücher verschiedenster Art (und auch wenn sie modernere Namen tragen, wie etwa lexikalische
240
Milka Enčeva, Vida Jesenšek
Ressourcen oder lexikalische Informationssysteme) lediglich im professionellen Rahmen und in interdisziplinären Zusammenhängen realisierbar sind und dass die Lexikographie weiterhin einen kulturell wichtigen Forschungs- und akademischen Bereich darstellt. Die lexikographischen Kolloquien in Südost- und Osteuropa tragen wesentlich dazu bei und es ist zu hoffen, dass ihre Tradition weiter gepflegt wird.
Literatur Bergerová, Hana (2015): VIII. Kolloquium zur Lexikographie und Wörterbuchforschung „Lernerwörterbücher“ in Szeged, 17.–19. Oktober 2014. In: Aussiger Beiträge 9 (Hg. Hana Bergerová, Georg Schuppener, Petra Szatmári). Wien: Praesens Verlag, 299–300. Dimova, Ana/Jesenšek, Vida/Petkov, Pavel (2006) (Hrsg.): Zweisprachige Lexikographie und Deutsch als Fremdsprache = Germanistische Linguistik 184–185. Ďurčo, Peter (2010) (Hrsg.): Feste Wortverbindungen und Lexikographie. Kolloquium zur Lexikographie und Wörterbuchforschung. Berlin/New York: de Gruyter. Dziurewicz, Elżbieta (2019): Bericht über das 10. Kolloquium zur Lexikographie und Wörterbuchforschung, Poznań 19–20.10.2018. In: Glottodidactica XLVI/1, 271–273. Helsinki 1975 = Schlußakte der Konferenz über Sicherheit und Zusammenarbeit in Europa (KSZE) in Helsinki, 1. August 1975. https://www.1000dokumente.de/pdf/dok_0024_ksz_de.pdf. Igla, Birgit/Petkov, Pavel/Wiegand, Herbert E. (2001) (Hrsg.): Theoretische und praktische Probleme der Lexikographie = Germanistische Linguistik 161–162. Igla, Birgit/Petkov, Pavel/Wiegand, Herbert E. (2005) (Hrsg.): Kontrastive Lexikologie und zweisprachige Lexikographie = Germanistische Linguistik 179. Jesenšek, Vida (2013) (Hrsg.): Specialised Lexicography. Print and Digital, Specialised Dictionaries, Databases. Berlin/Boston: de Gruyter. Jesenšek, Vida/Enčeva, Milka (2018) (Hrsg.): Wörterbuchstrukturen zwischen Theorie und Praxis. Berlin/Boston: de Gruyter. Jesenšek, Vida/Lipavic Oštir, Alja (2008) (Hrsg.): Wörterbuch und Übersetzung = Germanistische Linguistik 195–196. Petkova-Kessanlis, Mikaela (2013): Print- und E-Wörterbücher im Vergleich: Konvergenzen, Divergenzen, Probleme, Perspektiven. In: Lexicographica. Internationales Jahrbuch für Lexikographie 29, 332–336. Schaeder, Burkhard (1987): Germanistische Lexikographie. Tübingen:Max Niemeyer Verlag. Taborek, Janusz (2015): Conference report from the 8th “Kolloquium zur Lexikographie und Wörterbuchforschung” (Szeged, 17–19.10.2014). In: Lexicographica. International Annual for Lexicography 31/1, 349–352. Wiegand, Herbert E. (1981): Vorwort. In: Wiegand Herbert E. (Hrsg.): Studien zur neuhochdeutschen Lexikographie I. Hildesheim/New York: Olms (Germanistische Linguistik 3–4/79).