605 53 4MB
German Pages 543 [544] Year 2015
Handbuch Wort und Wortschatz HSW 3
Handbücher Sprachwissen
Herausgegeben von Ekkehard Felder und Andreas Gardt
Band 3
Handbuch Wort und Wortschatz Herausgegeben von Ulrike Haß und Petra Storjohann
ISBN 978-3-11-029570-2 e-ISBN [PDF] 978-3-11-029601-3 e-ISBN [EPUB] 978-3-11-039517-4 Library of Congress Cataloging-in-Publication Data A CIP catalog record for this book has been applied for at the Library of Congress. Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbiblio grafie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2015 Walter de Gruyter GmbH, Berlin/Boston Typesetting: fidus Publikations-Service GmbH, Nördlingen Printing and binding: CPI books GmbH, Leck ♾ Printed on acid-free paper Printed in Germany www.degruyter.com
Inhaltsverzeichnis Ulrike Haß/Petra Storjohann Das Wort und der Wortschatz. Einleitung in den Band
VII
I Wortschätze Ulrich Schnörch 1. Wortschatz
3
Kerstin Leimbrink 2. Wortschatzerwerb
27
Torsten Siever 3. Das Wort in der Netzkommunikation
II
53
Wörter und ihre Umgebungen
Derya Gür-Şeker 4. Das Wort im Diskurs
77
Ulrich Schmitz 5. Das Wort in der Sehfläche
102
Volker Harm 6. Das Wort und die Kreativität der Literatur Kirsten Adamzik 7. Das Wort im Text
152
Wolfgang Imo 8. Das Wort im Satz
175
129
Cyril Belica/Rainer Perkuhn Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische 9. Muster 201 Ken Farø Feste Wortgruppen/Phraseologie II: Phraseme 10.
226
VI
Inhaltsverzeichnis
Petra Storjohann 11. Sinnrelationale Wortschatzstrukturen: Synonymie und Antonymie im Sprachgebrauch 248 Carita Paradis 12. Meanings of words: Theory and application
III
274
Das einzelne Wort
Lothar Lemnitzer/Kay-Michael Würzner 13. Das Wort in der Sprachtechnologie Christine Römer 14. Die Elemente des Worts
297
320
Claudia M. Riehl 15. Besondere Wörter I: Lehnwörter, Neu‑Wörter Thorsten Roelcke 16. Besondere Wörter II: Fachwörter, Termini
344
371
Melani Schröter 17. Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung 394 Nanna Fuhrhop/Franziska Buchmann 18. Das Wort in der (Recht-)Schreibung Ruth Maria Mell 19. Das Wort in der Sprachkritik Oliver Pfefferkorn 20. Das Wort und seine Geschichte Ulrike Haß 21. Das Wort in der Lexikografie Sachregister
517
413
439
464
492
Ulrike Haß/Petra Storjohann
Das Wort und der Wortschatz. Einleitung in den Band Sich den Untersuchungsgegenständen Wort und Wortschatz präzise zu nähern, ist äußerst schwierig. Allein die definitorischen Kategorien sind in den meisten sprachwissenschaftlichen Disziplinen oder unter verschiedenen Betrachtungsweisen nicht genügend präzisierbar. So lässt sich der Begriff des Wortes und auch des Wortschatzes kaum einheitlich definieren bzw. einheitlich fassen. Dieser Eindruck scheint sich sogar trotz oder gerade wegen heutiger, empirisch ausgerichteter Analysemethoden noch zusätzlich verstärkt zu haben. Das Resultat sind aber weniger divergierende Ansichten, als vielmehr äußerst facettenreiche Betrachtungsmöglichkeiten und dynamische Auffassungen eines sprachlichen Phänomens, das in vielerlei Hinsicht das Interesse von Forscherinnen und Forschern sowie Sprachteilhabern und Sprachteilhaberinnen weckt. Das vorliegende Handbuch vermittelt einige ausgewählte Untersuchungsperspektiven auf die Phänomene Wort und Wortschatz. Die einzelnen Beiträge ordnen die Gegenstände in einen jeweils spezifischen Zusammenhang ein und fokussieren dabei auf sprachliche Kontexte, interdisziplinäre Zusammenhänge, methodische Herangehensweisen unter dem Blickwinkel der linguistischen Theorie oder der angewandten Linguistik. Das Konzept des Wortes und des Wortschatzes erhält daher in jedem Beitrag eine eigene Bedeutung und Funktion. In Summe kommt dadurch ein komplexes Verständnis von Wort und Wortschatz zum Ausdruck, das Vielfalt und Interdisziplinarität statt Einschränkung und singuläre Ausrichtung zulässt. Ungeachtet der individuellen Sicht spiegeln die einzelnen Beiträge wider, dass Wörter faszinieren. Sie sind sprachliche Einheiten, die mit Bild, mit Ton oder Text koalieren. Sie werden in öffentlichen Diskursen gezielt genutzt und interpretiert. Ihre Bedeutung wird kreativ ausgehandelt, evoziert und dokumentiert. Sie werden in ihrer Schreibung oder Verwendung als richtig oder falsch bewertet, kommen selten oder oft vor. Wörter sind neu oder alt, sterben aus oder kommen hinzu, sind uns fremd, terminologisch oder schwer in andere Sprachen übertragbar. Sie verändern sich sowohl in der Form als auch in Gebrauchsweisen. Aber was sie auch gerade sind, vor allem tauchen sie nie isoliert auf. Wörter sind auf das Engste mit anderen Wörtern in komplexen Netzwerken verbunden. Wir kommunizieren in Dialogen, schreiben kleinere oder größere Texte, hören Gespräche, merken uns neu erlernte Wörter besser durch Assoziationen und Kontexte. In der Betrachtung all dieser Erscheinungsformen kommen wir wohl der Klärung des Konzeptes Wortschatz näher als über die Aufschlüsselung feinster struktureller Bestandteile. Wortschatz ist eine Menge hochdifferenzierter, heterogener, mentaler, linguistischer, kommunikativ-diskursiver, visueller, natürlichsprachlicher und sprachtechnologischer Einheiten, die auf unterschiedlichste Weise
VIII
Ulrike Haß/Petra Storjohann
stark miteinander vernetzt sind und variabel zusammenspielen. Um dem Charakter der Vernetztheit und des Zusammenspiels der Bestandteile gerecht zu werden, bricht das vorliegende Handbuch mit der Tradition, das Wort ausgehend von seinen zerlegbaren Komponenten bis hin zu Wörtern als größeren lexikalischen Einheiten und auf verschiedenen lexikologischen Ebenen zu betrachten. Stattdessen wagen wir hier die Dekonstruktion eines vielschichtigen Phänomens in drei Aspekte: Wortschätze – Wörter und ihre Umgebung – Das einzelne Wort. Damit wird uns ermöglicht, Wortschatz als eine zentrale Spracheinheit mit seinen unterschiedlichen Ausprägungen und verschiedenartigen Beziehungen weniger einzugrenzen und einen umfassenderen, zielgerichteten, individuelleren, wenn auch nicht erschöpfenden, Blick auf den Gegenstand zu werfen. Der Aspekt der Wortzentriertheit soll betont werden, aber nicht Ausgangspunkt dieses Handbuches sein. Die Beiträge dieses Bandes werden in drei thematischen Blöcken angeordnet. I Wortschätze: Zunächst wird dargelegt, wie komplex die Beschäftigung mit Wortschatz im Allgemeinen ist und wie differenziert und dynamisch Kriterien zur Bestimmung eines Wortschatzes angelegt sein müssen, ungeachtet dessen, ob man den Wortschatz einer Sprache ermitteln möchte oder sich eine Vorstellung davon machen möchte, was das individuelle mentale Lexikon einer Person(engruppe) ausmacht (Ulrich Schnörch). Gerade Analysen des mentalen Lexikons geben Aufschlüsse über Möglichkeiten und Grenzen bei der Speicherung und beim Verarbeiten von lexikalischen Einheiten, Semantisierungsprozessen und bei der Herstellung von strukturiertem und vernetztem Wortschatz- und Weltwissen. Daher wird auch dem Thema des individuellen, muttersprachlichen Spracherwerbs Gewicht gegeben (Kerstin Leimbrink). Des Weiteren wird die Frage geklärt: Kann man Wörter eindeutig einer bestimmten Varietät zuordnen und etwa Standardwortschatz und Wortschatz des Internets voneinander abgrenzen? Dazu wird eruiert, welche Merkmale unterschiedliche Wortschätze aufweisen sollten und wie einzelne Varietäten generell beurteilt werden. Es wird diskutiert, wie hoch der Anteil lexikalischer Diversität in verschiedenen Kommunikationsformen sein muss, um einen Wortschatz als Varietät einzustufen (Torsten Siever). II Wörter und ihre Umgebung: Im zweiten Teil befinden sich Beiträge, die Wörter in spezifisch kontextuellem Zusammenhang bzw. in ihren Funktionen thematisieren. So wird beispielsweise beleuchtet, wie das Wort im Diskurs erschlossen und wie das Wort als diskurslinguistische Einheit interpretiert wird (Derya Gür-Şeker). Eine zunehmende Rolle spielt auch das Wort in seiner Funktion, Bild und Text zu semantischen Einheiten zu integrieren. Wörter werden heute sehr häufig als Schriftzeichen visuell erfassbarer, optisch und semantisch verknüpfter Kommunikation genutzt. Daher wird (von Ulrich Schmitz) auch dargelegt, warum Wörter nicht nur in sprachlichen Kontexten semantisch beteiligt sind, sondern mit visuellen Elementen in Nachbarschaft treten und dabei eine komplexe strukturierte Bedeutungseinheit bilden. Die Konstitution textspezifischer Wortbedeutung, die textuelle Vernetzung mithilfe lexikalischsemantischer Relationen sind aber auch Merkmale kreativer, literarischer Sprache.
Das Wort und der Wortschatz. Einleitung in den Band
IX
Diese ist dadurch gekennzeichnet, dass einerseits manifestierte Wortverbindungen aufgebrochen werden und andererseits eine Reihe literarisch-konventionalisierter Kennwörter sichtbar werden. Was aber sind die Wörter, Wortverbindungen und Wortrelationen, die in der modernen Lyrik auftauchen? Die Beantwortung dieser Frage stellt eine große Herausforderung dar (Volker Harm). Dass das Wort als Einheit sehr verschiedener Abstraktionsebenen verstanden werden kann, wird besonders in Bezug zum Text als sprachlicher Handlung deutlich (Kirsten Adamzik). Auf den Ebenen von gesprochenen und geschriebenen Äußerungen wird der Zusammenhang von Wörtern und Wortbedeutung beschrieben. Erneut wird gezeigt, wie problematisch es ist, vor allem seit der Verfügbarkeit authentischen Datenmaterials und der Möglichkeit, Sprache empirisch auszuwerten, vermeintlich eindeutige Kategorien wie Wort und Satz näher zu bestimmen. Im Fokus steht daher, welche konkrete Rolle das einzelne Wort in der Interaktion spielt (Wolfgang Imo). Dass in Äußerungen die Wahl der Wörter von der Wahl anderer Wörter abhängt, macht dennoch deutlich, dass es bei der Kombination sprachlicher Einheiten Regeln und Präferenzen situativer Angemessenheit gibt. Daten des Sprachgebrauchs sind daher unerlässlich für die Analyse, Interpretation und linguistische Modellierung bestimmter Phänomene. Darunter fällt vor allem auch die Rolle der Kollokationen als emergentes Phänomen (Cyril Belica/Rainer Perkuhn). Der Versuch, Kollokationen und andere Mehrwortverbindungen zu kategorisieren und terminologisch präzise zu verorten, zeigt dabei zahlreiche Schwierigkeiten. Trotz dieser Probleme sind Kenntnisse über Entstehung und Wandel von Wortverbindungen sowie die Möglichkeiten der Übersetzung, des Lernens und Lesens von festen Wortgruppen relevante Bereiche aus angewandter Perspektive (Ken Farø). Neben den syntagmatischen Verbindungen bindet das Handbuch auch lexikalisch-semantische Sinnrelationen ein, die aber losgelöst von herkömmlichen strukturalistischen Modellen betrachtet werden. Unterschiedliche empirische Studien widerlegen starre Trennungen zwischen Syntagmatik und Paradigmatik und plädieren für eine gebrauchsorientierte Analyse und Beschreibung (Petra Storjohann). Neben zahlreichen individuellen Phänomenbereichen und konkreten disziplinären Ausrichtungen wollen wir nicht auf eine theoretische Erklärung verzichten. Daher wird ein jüngeres, kognitives Semantikmodell vorgestellt, das sich mit den Faktoren der kontextuellen Bedeutungskonstituierung im Sprachgebrauch auseinandersetzt. Die skizzierte Theorie ist außerdem in der Lage, konzeptuelle Strukturen, Aspekte von Wissen, Wahrnehmung und konventionalisierter Kommunikation einzubinden sowie dynamische und kontextuell variable Faktoren der Bedeutungsbildung zu berücksichtigen (Carita Paradis). III Das einzelne Wort: Die Beiträge, die das individuelle Wort als sprachliche Einheit stärker fokussieren, werden im dritten Block zusammengefasst. Empirische Forschung kommt nicht mehr ohne umfangreiche Korpusdaten aus. Daher wird dieser Gruppe ein Thema vorangestellt, das sich mit der Problematik des Konzeptes Wort in der Sprachtechnologie beschäftigt und das Wort mithilfe der Kategorien Token, Type und Lemma präzisiert (Lothar Lemnitzer/Kay-Michael Würzner) setzt. Eine weitere
X
Ulrike Haß/Petra Storjohann
Diskussion zur Typisierung und Segmentierung lexikalischer Einheiten wird mit Blick auf die Interpretation und Bildung komplex gebildeter Wörter vorgenommen. Hier stehen Fragen des Wortbildungswandels, der Wortbildungen im Sprachgebrauch und im Spracherwerb im Fokus (Christine Römer). Wir alle haben eine Vorstellung darüber, dass im Alltag oder in der spezifischen kommunikativen Praxis neben standardsprachlichen lexikalischen Ausdrücken und Wortverbindungen auch verschiedenartige ‚besondere Wörter‘ genutzt werden. Exemplarisch werden in diesem Handbuch drei Arten ‚besonderer‘ Wörter behandelt. Aus der Perspektive der Sprachkontaktforschung fallen Lehn- und Neu-Wörter unter diese Rubrik (Claudia Riehl), aus der Sicht der Fachsprachen gehören Fachwörter und Termini dazu (Thorsten Roelcke) und zuletzt müssen auch Schlagwörter einbezogen werden, insofern sie eine besondere Rolle in der öffentlich-politischen Auseinandersetzung spielen (Melani Schröter). Je nach Schwerpunkt informieren die einzelnen Darlegungen über Lehn- und Anpassungsprozesse übernommener Wörter, über Fragen von Sprachnormen und Fremdwortpurismus oder über Konventionen und Definitionen. Aber es gibt auch Ausführungen zu den Eigenschaften sowie zu methodischen Analyse- und Dokumentationsmöglichkeiten der hier behandelten Klassen ‚besonderer Wörter‘. Wörter kommen sowohl in der gesprochensprachlichen als auch in der schriftlichen Kommunikation vor. Die Entwicklungen in der Schriftforschung, die das Wort, formal gesehen, als graphematisches Element und als Graphemkette zwischen Spatien betrachtet, werden in einem eigenen Beitrag behandelt. Sprachvergleichende Überlegungen demonstrieren dabei besonders, wie sich das graphematische Wort und die Wortzeichen im Deutschen und in anderen Sprachen verhalten (Nanna Furhop/Franziska Buchmann). Andere Auseinandersetzungen mit der lexikalischen Einheit Wort zeigen, wie sich unser Denken und unsere Wahrnehmung in vorgeprägten Schlüsselwörtern vollziehen. Das gilt vor allem für den Bereich der Sprachkritik. Der wortbezogenen Sprachkritik, die das Verhältnis von Wort und Sachkritik aufzeigt, wird in diesem Handbuch besonderes Augenmerk gewidmet (Ruth Maria Mell). Welche Umstände generell zur Veränderung von Wörtern führen, sei es ausdrucksseitig oder semantisch oder auch beides, zeigt ein Beitrag zum Wort- und Bedeutungswandel. Wortgeschichtliche Erscheinungen und Wandelprozesse werden charakterisiert und in ihrer Vielfalt skizziert (Oliver Pfefferkorn). Den Abschluss des Handbuches bildet die Auseinandersetzung mit dem schwierigen Verhältnis vermeintlich ‚isolierter‘ Wort auflistung und statischer Dokumentation in Wörterbüchern auf der einen Seite und dem Wissen um die Dynamik der Wörter andererseits. Lexikografische Methoden und die inhaltliche Gestaltung der Wörterbücher bestimmen darüber, ob Nachschlagende ein Bewusstsein für flexiblen Wortgebrauch, komplexe Wortschatzvernetzungen und diverse Eigenschaften sprachlicher Strukturen entwickeln können (Ulrike Haß). Trotz unterschiedlichster Perspektiven auf das Phänomen ‚Wort‘ und diverser disziplinärer Ausrichtungen eint alle Beiträge die empirisch ausgerichtete, also gebrauchsorientierte und damit deskriptive Sicht auf ihren jeweiligen Untersu-
Das Wort und der Wortschatz. Einleitung in den Band
XI
chungsgegenstand. Korpuslinguistische wie auch kognitive Perspektiven sind vorherrschend. Kein Beitrag des Handbuches beschäftigt sich ausschließlich mit den methodologischen Möglichkeiten heutiger Wortschatzforschung und den Vor- und Nachteilen einzelner Ansätze und Analyseverfahren. Methodologische Aspekte werden stets integrativ und mit Bezug auf das jeweilige Thema eines Beitrags mitbehandelt. Und obwohl der Großteil der Beiträge sich auf Perspektiven und Analyseresultate der germanistischen Sprachwissenschaft bezieht, bieten diese dennoch genügend Raum, Erkenntnisse auf andere Sprachen zu übertragen, zu abstrahieren und zu generalisieren. Alle Beiträge diskutieren und erläutern ihr Thema anhand anschaulicher Beispiele, die auch für Sprachinteressierte außerhalb der Linguistik verständlich und nachvollziehbar sind. Wo möglich, wurden sprachvergleichende Aspekte ergänzt, um Idiosynkrasien sprachlicher Elemente und Strukturen zu aufzuzeigen. Anhand authentischer Sprachbeispiele und typologischer Vergleiche werden unseres Erachtens die Übereinstimmungen und Kontroversen verschiedener Ansätze, die Vor- und Nachteile bestimmter Kriterien und Herangehensweisen, aber auch die Schwierigkeiten definitorischer Abgrenzungsversuche besonders deutlich. Dennoch muss auch in diesem Band die Auswahl an Themen und Herangehensweisen notwendigerweise beschränkt bleiben. Für viele weitere Bereiche, die sich mit Wörtern und Wortschatz beschäftigen, entstehen eigenständige Handbücher in der Reihe „Handbücher Sprachwissen“, wie etwa zu Wortschatzausprägungen in der Religion, in Naturwissenschaften, in der Wirtschaft oder in sozialen Gruppen. Aber wir hoffen, dass die Beiträge dieses Handbuchs einen kleinen Einblick in die existierende Bandbreite vermitteln und ihre Leserschaft für dynamische und variable Sichten auf das Wort und den Wortschatz zu sensibilisieren vermögen. Es wird oft ein Gegensatz angenommen zwischen der sprachwissenschaftlichen Perspektive auf das Wort und der alltäglichen Wortwahrnehmung der Sprachverwender. Tatsächlich zeigen die Beiträge dieses Bands eindrücklich, dass sich der sicher geglaubte Begriff des Worts aufzulösen beginnt, sobald der Blick über den Tellerrand einer geschriebenen Einzelsprache (hier des Deutschen) hinausgeht und gesprochene Sprache sowie Variation und Wandel mitberücksichtigt werden. Die Folge dieses erweiterten linguistischen Horizonts ist terminologische Ausdifferenzierung und damit eine scheinbare Vergrößerung der Kluft zwischen Experten- und Sprechersicht auf das Wort. Paradoxerweise geschieht aber zugleich auch eine Annäherung der Perspektiven, denn die wachsende Bedeutung der durch empirische Sprachdaten ermöglichten Evidenz schließt die Sprachpraxis zunehmend ein. Und zur Sprachpraxis gehören jene als ‚besonders‘ wahrgenommenen Wörter (Fremdwörter, Fachwörter, Internet-Wörter, diskriminierende Wörter usw.). Eine evidenzbasierte Linguistik hat die Wortreflexion durch Sprecher als einen der für Dynamik sorgenden Faktoren ernst zu nehmen. Leserinnen und Leser, die das Handbuch eben wegen der genannten ‚besonderen‘ Wörter zur Hand nehmen, werden ihrerseits merken, dass die Dinge beim Wort so einfach nicht liegen, wie sie vielleicht gedacht haben. Die Tradition von Begriffen
XII
Ulrike Haß/Petra Storjohann
wie Fremdwort oder Fachwort hat auch Mythen entstehen lassen, die einer genaueren Betrachtung nicht standhalten. Die Grenzen zwischen Wörtern und Wortschätzen, zwischen fremd und eigen, zwischen fachlich und nichtfachlich sowie zwischen diskriminierend und neutral sind fließend, und die Frage nach dem Wie und Warum ist weitaus spannender als die willkürliche Grenzziehung. Wir Herausgeberinnen hoffen, dass mit dem Band allen am Wort Interessierten, ob linguistisch oder nicht-linguistisch vorgeprägt, erhellende Einblicke in die Wechselwirkungen zwischen tradierten Vorstellungen und dem beobachtbaren ‚prallen Leben‘ der Wörter geboten werden. Wir danken Annkathrin Sonder für die Einrichtung des Manuskripts und die Erstellung des Registers. Bei allen Autorinnen und Autoren bedanken wir uns sehr dafür, dass sie sich so bereitwillig auf unsere Kommentare zu ihren Manuskripten eingelassen haben und damit eine für uns fruchtbare Diskussion ermöglichten. Essen und Mannheim, im März 2015
I Wortschätze
Ulrich Schnörch
1. Wortschatz Abstract: Die Beschäftigung mit ‚dem Wortschatz‘ ist insofern komplex, als man sich zunächst einer riesigen Menge von Wörtern gegenübersieht. Hilfreich ist es, grundsätzlich zwischen dem Wortschatz einer Sprache und dem Wortschatz einer bestimmten Person(engruppe) zu unterscheiden. Egal, welche Wörtermenge man weiter einkreisen möchte, die Annäherungsschritte sind grundsätzlich die gleichen: sammeln – segmentieren – klassifizieren – interpretieren – ordnen/vernetzen. In dem Beitrag wird für einen dynamischen, prozessualen Wortschatzbegriff plädiert: Die Reflexion über acht Leitfragen soll es Fachleuten wie Laien ermöglichen, das Konzept Wortschatz für ihre Zwecke zu präzisieren: – Wie lässt sich ein Wortschatz ermitteln? – Woraus kann ein Wortschatz bestehen? – Welche Arten von Wortschätzen gibt es? – Auf welcher Textbasis werden Wortschätze erhoben? – Welche Fachdisziplinen widmen sich der Untersuchung von Wortschätzen? – Wie ist ein Wortschatz in sich strukturiert? – Wo (bzw. wie) wird Wortschatz gespeichert? – Wie lassen sich ein Wortschatz und dessen Einheiten adäquat beschreiben? 1 Wortschatz – eine Annäherung in Bildern 2 Acht Leitfragen für die Konstruktion von Wortschätzen 3 Fazit: Ein dynamischer Wortschatzbegriff 4 Literatur
1 Eine Annäherung in Bildern Was ist ‚der Wortschatz‘? Sehr viele ‚Wörter‘! Was ist ein ‚Wort‘? Eine Folge von Buchstaben (‚Zeichen‘), die in einem geschriebenen (bzw. transkribierten gesprochenen) Text durch Leerzeichen von anderen Buchstaben- bzw. Zeichenfolgen getrennt ist. Wörter findet man auch als fettgedruckte Zeichenfolge in Summe und meist in alphabetischer Reihung angeordnet sowie mit allerlei sprachlichen (mitunter auch enzyklopädischen) Informationen versehen in einem Wörterbuch. Ist Wortschatz, oft auch Lexik, Vokabular genannt, also das, was an Wörtern in geschriebenen Texten versammelt, bzw. in einem Wörterbuch gesammelt und geordnet ist? Grundsätzlich ja, aber ganz so einfach ist es nicht. Begeben wir uns auf Spurensuche bzw. Schatzsuche, denn ein Wortschatz ließe sich auch ganz einfach als ‚Schatz bestehend aus Wörtern‘ umschreiben, löst man das Kompositum auf. Das Bild vom Schatz ist durchaus tref-
4
Ulrich Schnörch
fend: Als Kollektivum umfasst er per se eine Menge unterschiedlicher und grundsätzlich unendlich vieler Elemente, die in ihrer Gesamtheit als wertvoll empfunden werden. Jeder Mensch trachtet danach, ihn bereits als Kind zu empfangen, um in die Kommunikationsgemeinschaft aufgenommen zu werden. Dass dieser Wert nicht nur sprachlich definiert, sondern auch als Kulturgut verstanden und identitätsstiftend empfunden wird, wird u. a. dann offenkundig, wenn der Wort-Schatz von den Mitgliedern einer Sprachgemeinschaft als bedroht empfunden wird. Man erinnere sich etwa an die Debatten in Deutschland, inwieweit sog. Fremdwörter den Wortschatz, mithin den Sprachgebrauch beeinflussen oder daran, wie der Wortschatz immer wieder in der öffentlichen Diskussion gegen orthografische Neuerungen im Zuge von Rechtschreibreformen verteidigt wurde. Das an sich trockene Thema ‚Wortschatz‘ wird plötzlich höchst emotional (und häufig fachlich nicht sehr neutral bzw. angemessen) behandelt. Hierzu scheint es hilfreich, sich dem Phänomen Wortschatz etwas sachlicher, nüchterner zu nähern. Neben das bereits der Bildung Wort-Schatz inhärente Bild gesellen sich weitere, mit denen aus der Sicht unterschiedlicher Disziplinen versucht wurde, dieses höchst abstrakte und nicht minder komplexe Phänomen zu visualisieren: In der (Sprach-) Philosophie wurden häufig Analogien bzw. Bilder bemüht, Humboldt etwa findet für die Sprache den Vergleich mit einem „Gewebe“, „Geflecht“, „Netz“ (vgl. Di Cesare 1996, 283). Aber auch die Sprachwissenschaft bewegt sich immer wieder auf metaphorischem Gelände, so schreibt Coseriu (Coseriu 1976, 23): „Der Wortschatz ist kein Mosaik, sondern eher ein kompliziertes mehrstöckiges Gebäude mit vielen […] Räumen“. Dieses Bild von Coseriu hat (u.a in puncto Mehrdimensionalität) durch die Forschungen der vergangenen knapp vierzig Jahre eher an Schärfe gewonnen denn verloren. Allerdings wird das Gebäude nie fertig: Ständig wird irgendwo umgebaut, laufend kommen weitere Stockwerke, Anbauten und Räume hinzu, die ihrerseits wieder der ständigen Veränderung unterliegen – insofern stelle man sich vielleicht weniger strenge Bauhausarchitektur als einen Hundertwasserentwurf vor. Diese auf Dynamik angelegte Architektur wird nicht mehr nur zweidimensional auf Papier dokumentiert, sondern längst dreidimensional, elektronisch, die Veränderlichkeit besser berücksichtigend. Solche Bilder helfen gewiss, den (abstrakten) Gegenstand fassbarer zu machen, aber Gebäude (als auch die vorgestellten Bilder davon) bedürfen der Schlüssel, um hineinzugelangen. Im Folgenden sollen solche Schlüssel auch gefunden, Räume aufgesperrt und ein Blick hineingeworfen werden. In einem derart großen, verschachtelten Gebäude wie dem Wortschatz ist es wichtig, den Schlüssel zu einem geeigneten Eingang zu suchen, um nach dem Betreten nicht sofort die Orientierung zu verlieren. Dazu soll ein (vermeintlich) kleiner Raum als Entree in die sprachwissenschaftliche Welt dienen, der einen überschaubaren Wortschatzausschnitt enthält: den zentralen Wortschatz des Deutschen. Dieser Raum bietet einige Vorteile: Er ist bezüglich seiner Einrichtungsgegenstände relativ überschaubar und konstant, in ihm lassen sich
Wortschatz
5
exemplarisch eine ganze Reihe zentraler Aspekte veranschaulichen, und als Kernbereich bietet er ausreichend Anknüpfungsmöglichkeiten, hält quasi Schlüssel bereit, um Türen in benachbarte und entferntere Areale zu öffnen. An die Stelle der Schlüssel sollen jedoch acht Leitfragen treten, deren Erörterung gleichzeitig ein Plädoyer für die Umsetzung eines dynamischen Wortschatzbegriffs sein soll.
2 Acht Leitfragen für die Konstruktion von Wortschätzen Wer über ‚den Wortschatz ‘ spricht, kann dies also sehr bildreich tun. Als thematischer Einstieg bietet sich das auch an, allerdings ist es nicht nötig, Bilder überzustrapazieren, zumal man auf diese ‚Visualisierungshilfe‘ eigentlich nicht angewiesen ist: In der Tat sind wir ja tagtäglich vom Wortschatz umgeben, hören, lesen, sprechen, schreiben ihn. Konkret fassbar wird er entsprechend in Texten‚ Gesprächen, E-Mails, Blogs usw., gesammelt und aufbereitet wird er z. B. in Korpora und Wörterbüchern. Verlassen wir also jene Bilder und nähern uns dem Wortschatz zunächst aus Sicht jener Menschen, die Wörterbücher schreiben, kritisieren und nutzen, mit der Frage: Welcher Wortschatz wird beschrieben? Diese Frage impliziert, dass es nicht nur den Wortschatz einer Sprache (‚der deutsche, englische Wortschatz‘), sondern auch Wortschätze von Personen (Schriftsteller/-innen), Gruppen (Fremdsprachenlernende) usw. gibt. Insofern lässt sich die Fragestellung sowohl quantitativ als auch qualitativ auffassen. Entsprechend gibt es Wörterbücher von einigen Dutzend Seiten (z. B. didaktisch ausgerichtete sog. Grundwortschätze) bis hin zu Wörterbüchern von zahlreichen Bänden mit tausenden von Seiten (vgl. das Deutsche Wörterbuch der Brüder Grimm), es gibt Wörterbücher, die sich dem allgemeinen oder einem gruppen- bzw. fachsprachlichen Wortschatz widmen, solche, die historische Wortschätze beschreiben und andere, die gegenwartssprachliche oder einzig neueste Wörter (Neologismen) buchen, es gibt Wörterbücher, die Wortgeschichten erzählen und solche, die grammatische und semantische Informationen bieten, man findet die (Stich-) Wörter entweder, weil sie initialalphabetisch, rückläufig oder nach Sachgruppen sortiert sind usw., usw. Die Aufzählung ließe sich beinahe beliebig fortsetzen (vgl. Haß in diesem Band). Die auf quantitativen und/oder qualitativen Kriterien beruhende Vielfalt der Wörterbuchtypen bzw. Wörterbücher spiegelt die Nutzungssituationen und damit indirekt auch die Komplexität des Wortschatzes wieder sowie die Vielfalt seiner Gliederungs- und Zugangsmöglichkeiten. Es scheint also ratsam, sich dem Phänomen nachfolgend zunächst am Beispiel einer exemplarischen Teilmenge zu nähern, dem Kernbereich des Wortschatzes, der sich als relativ allgemein, verbindlich und stabil erwiesen hat. Man kann hier wieder verschiedene Blickrichtungen auswählen, unter anderem die Perspektive der Lexikologie, der Lexikografie, der Kognitionswissenschaft, der Psychologie, der Computer-
6
Ulrich Schnörch
technologie, der Korpuslinguistik und des Fremdsprachenunterrichts. Diese Perspektiven können unterschieden und fokussiert werden, auch wenn sie sich in der Praxis häufig wechselseitig beeinflussen. Wählt man die lexikografische Brille, so ließe sich sagen, der Wortschatz materialisiert sich in Wörterbüchern – doch wie gelangt er eigentlich dorthin? Die Heterogenität der ‚Erscheinungsformen‘ (= Wörterbucharten) legt nahe, dass das Ziel nicht sein kann ‚den Wortschatz‘ (mithin ‚das Wörterbuch‘) zu definieren, abzugrenzen und zu beschreiben. Stattdessen sollte es gelingen, eine Grundlage zu schaffen, auf der es möglich ist, einen funktionalen, relationalen und dynamischen Wortschatzbegriff aufzubauen, der es – je nach Ausrichtung – ermöglicht, flexibel weiterentwickelt und angewandt zu werden. Egal ob man sich als Linguist, Literaturwissenschaftler, Psychologe, Soziologe, Arzt usw. dem Wortschatz nähert, folgende acht Leitfragen gibt es zu bedenken, wenn man sich mit diesem Thema befasst: 1. Wie lässt sich ein Wortschatz ermitteln? 2. Woraus kann ein Wortschatz bestehen (was ist die Zähleinheit)? 3. Welche Arten von Wortschätzen gibt es? 4. Auf welcher Textbasis werden Wortschätze erhoben? 5. Welche Fachdisziplinen widmen sich der Untersuchung von Wortschätzen? 6. Wie ist ein Wortschatz in sich strukturiert? 7. Wo (bzw. wie) wird Wortschatz gespeichert? 8. Wie lassen sich ein Wortschatz und dessen Einheiten adäquat beschreiben? Diese Leitfragen können in der Praxis nicht streng linear abgearbeitet werden, sie stehen vielmehr in einem engen wechselseitigen Abhängigkeitsverhältnis zueinander: Die Wortschatzermittlung ist eng gekoppelt an die Definition der Zähleinheit (Was zählt als Wort?). Dieses Vorgehen sollte wiederum fachdisziplinär (z. B. lexikografisch, korpuslinguistisch) verankert werden. Dabei werden auch Kriterien der Strukturierung und Ordnung reflektiert, die ihrerseits in Wechselwirkung zum Beschreibungsmodell (im Wörterbuch, mentalen Lexikon) sowie zum Medium der Datenspeicherung (Papier, Festplatte, Gehirn) stehen. Die Abfolge besitzt also überwiegend gliederungstechnische Funktion. Die Erörterung der Fragen soll selbstredend primär den Wortschatz als ganzheitliche Menge im Fokus haben, dabei wird er jedoch aus wechselnden Perspektiven betrachtet, um so das Spektrum der disziplinären, methodischen usw. Herangehensweisen anzudeuten. Die erste Leitfrage beschäftigt sich mit der Strategie: Wie lässt sich ein Wortschatz ermitteln? Gründe, die indifferente, nahezu unüberschaubare Menge ‚Wortschatz‘ einzugrenzen und somit erst zu erfassen, gibt es viele, ein sehr spezieller war Auslöser für eine frühe Wortschatzermittlung: Ende des 19. Jahrhunderts erschien die erste sprachstatistisch erhobene Frequenzerhebung des Deutschen: Das ‚Häufigkeitswörterbuch der deutschen Sprache‘ von Friedrich Wilhelm Kaeding (1897–98),
Wortschatz
7
dessen Frequenzangaben auf einem Corpus geschriebener deutscher Sprache aus dem 19. Jahrhundert mit fast 11 Millionen laufenden Wörtern basieren. Dieses Unternehmen sollte in erster Linie Grundlagen für eine Verbesserung und Rationalisierung der Stenographie liefern und listete nur die Wortformen [d. h. einzelne Flexionsformen, U.Sch.] auf (Schumacher 1978, 41).
Frequenzerhebungen stellen eine Möglichkeit dar, den Untersuchungsgegenstand einzugrenzen. Dazu benötigt man eine (geeignete) Sammlung geschriebener und/ oder gesprochener Texte (Korpus), definiert, was man als ‚Wort‘ veranschlagen möchte, und zählt das Korpus dann entsprechend aus. Mit dieser (Frequenz-) Methode konnte und kann man sich einem lexikalischen Kernbereich nähern: um das stenografische System ökonomisch gestalten zu können, viel später, um Aussagen über geschriebene Zeitungsprache (vgl. Rosengren 1972–77) bzw. gesprochene Sprache (vgl. Ruoff 1981) zu machen und vor noch gar nicht so langer Zeit, um einen Lernerwortschatz empirisch fundieren zu können (vgl. Jones/Tschirner 2006 und Tschirner 2005). Das statistische Auswertungsinstrumentarium wurde dabei ständig verfeinert, so kommt es natürlich nicht nur auf die reine Frequenz eines Wortes an, sondern beispielsweise auch auf dessen zeitliche und textbezogene Streuung, also über welchen Zeitraum hinweg ein Wort in wie vielen unterschiedlichen Texten vorkommt (vgl. zu angewandten sprachstatistischen Parametern z. B. Rosengren 1972–77, Bd. 1, XXVff.); auch die Zähleinheiten (flektierte Wortformen, z. B. liest, las, gelesen, Grundformen, z. B. lesen) wurden variiert, um die Aussagefähigkeit der entsprechend generierten Wortformen- bzw. Grundformenlisten zu erhöhen und somit die Interpretationsmöglichkeiten der Erhebungen zu steigern. Es schien ein probates Mittel gefunden, ‚den Wortschatz‘ beinahe naturwissenschaftlich sauber zu erfassen. Was methodisch in der linguistischen Grundlagenforschung überzeugt, muss jedoch nicht automatisch 1:1 auf andere Bereiche übertragbar sein. Aus Sicht der Sprachdidaktik (und damit einer Perspektive, die fast jede(r) Sprachenlernende nachvollziehen kann) stellt sich das Problem der Wortschatzselektion (vgl. Haß in diesem Band) als ein sehr zentrales dar, denn: Im Gegensatz zu den weitestgehend geschlossenen Systemen der Lautung, der Morphologie und in bestimmtem Maße auch der Syntax, wird die Lexik als einzige Komponente angesehen, die durch Auswahl quantitativ reduzierbar ist. Auf der anderen Seite entscheidet gerade diese Wahl der Wörter, worüber wir überhaupt sprechen (können); der Wortschatz bildet insofern die materiale bzw. instrumentale Grundlage der Kommunikation (vgl. Kaufmann 1968, 11 f.). Sind die häufigsten auch die wichtigsten Wörter einer Sprache? Pauschal lässt sich darauf keine Antwort geben. Textdeckungstests scheinen diese These zu stützen: „8 % gemeinsamer Wörter decken […] 90 % aller Wortvorkommen ab. Die Ursache hierfür ist, dass es sich dabei größtenteils um inhaltsarme Wörter (Funktionswörter wie dass, die, in, nach, so, und, weil handelt“ (Klein 2013, 38). Für das Verständnis von Texten bzw. Sätzen sind derartige Statistiken allerdings relativ nichtssagend, da sich die Bedeutung eines Satzes oder Textes nicht einfach durch simple Addition
8
Ulrich Schnörch
der Einzelwörter ermitteln lässt; die häufigsten Wörter sind so gesehen gewiss nicht die wichtigsten. Aus lexikografischer Perspektive kam eine Nutzungs- bzw. Log-FileStudie in jüngster Zeit zu dem Schluss: „Dictionary users do look up frequent words“ (Koplenig/Meyer/Müller-Spitzer 2014, 248). Dabei handelt es sich allerdings nicht um die oben erwähnten 8 % der häufigsten Funktionswörter, sondern um hochfrequente Autosemantika. Gerade der ständige Gebrauch scheint im Wortschatz zu feinen ‚Abrieberscheinungen‘ bzw. ‚gefühlten Normabweichungen‘ zu führen, welche das Nachschlagebedürfnis fördern und gleichzeitig die Notwendigkeit möglichst aktueller lexikografischer Beschreibung erhöhen: In dieser Situation werden zuverlässige Auskünfte vom Wörterbuch verlangt, das daher die Beschreibung dieses nicht nur hochfrequenten sondern auch hochdynamischen Wortschatzausschnitts nicht vernachlässigen kann – obgleich es natürlich sehr schwierig ist, aktuelle und jüngste Sprachwandelprozesse zu beschreiben. Die häufigsten Wörter stellen beschreibungstechnisch also eine wichtige Herausforderung dar. Die Geschichte der sog. Grundwortschatzforschung schließlich beantwortet die Frage nach der Wichtigkeit der häufigsten Wörter insofern mit ‚nein‘ als sie weitere Selektionskriterien erarbeitet und angewendet hat (vgl. dazu Kühn 1979, Krohn 1992, Schnörch 2002, Haderlein 2007). Ausgehend von der Frage, welchen Wortschatz Deutschlernende in welchen Situationen benötigen, wurden beispielsweise für das ‚Zertifikat Deutsch als Fremdsprache‘ Wortinventare nach entsprechend pragmatisch bzw. kommunikativ begründeten Auswahlverfahren zusammengestellt. Peter Kühn erkannte, zu welch paradoxer Situation dieses Vorgehen führte: Durch die pragmatische Grundwortschatzbestimmung kann die Wortauswahl zwar kommunikativ begründet, jedoch nicht quantitativ bestimmt und beschränkt werden. Dabei war die Begrenzung des Wortschatzes für das Erlernen einer Sprache gerade Ausgangspunkt und Legitimation für die Erstellung von Grundwortschätzen. Der Grundwortschatz wird somit zur lexikographischen Fiktion (Kühn 1984, 253).
Das Hinzufügen von sprachimmanenten Kriterien erleichtert die didaktisch begründete Wortschatzauswahl nicht, im Gegenteil. Wer vermag schon wirklich nachvollziehbar Aspekte wie das Wortbildungs- bzw. idiomatische Potenzial, die stilistische Neutralität, die Grundbegrifflichkeit oder die semantische Expansionsfähigkeit (vgl. Kühn 1979, 25 ff.) operationalisierbar auf eine größere Wortschatzvorauswahl anzuwenden. So vielfältig die Methoden, so vielfältig sind auch die Bezeichnungen für den Kernbereich einer Sprache: ‚Grundwortschatz‘, ‚Kernwortschatz‘, ‚Grundvokabular‘, ‚Allgemeinwortschatz‘, ‚Häufigkeitsliste‘, ‚Mindestwortschatz‘, ‚Alltagswortschatz‘, ‚Standardvokabular‘, ‚Minimalwortschatz‘, ‚Grunddeutsch‘, ‚Gebrauchswortschatz‘, ‚Bedarfswortschatz‘ „sind alles Bezeichnungen für einen systematisch reduzierten Wortschatz einer Sprache, die die unterschiedlichen Erkenntnisinteressen an diesem Objektbereich widerspiegeln“ (Kühn 1979, 23). Vergleicht man derartige Wortschatzmengen und bildet Schnittmengen (vgl. Krohn 1992; Schnörch 2002), so führt das zu einem interessanten Ergebnis:
Wortschatz
9
Im Zentrum (also allen Vergleichswortschätzen gemeinsam) stehen die Synsemantika als relativ geschlossene und weitgehend grammatisch definierbare Wortklasse, um sie schließt sich eine relativ offene Menge themenunspezifischer Autosemantika, also Wörter (v. a. Substantiven, Verben, Adjektive), deren (proto-)typische Verwendung nicht auf ein textspezifisches Thema/eine Situation festgelegt werden kann. Daran schließt sich die Menge der themenspezifischen Autosemantika an, also Wörter, deren Verwendung mit einem bestimmten Thema oder Gebrauchsrahmen (Frame) assoziiert werden. Dieser Befund untermauert empirisch, was terminologisch bereits Jahre vorher zu fassen versucht wurde. Der häufigste Wortschatz umfaßt die lexikalischen Einheiten [Wörter, U. Sch.], die mit großer Regelmäßigkeit in nahezu allen Texten einer Sprache oder einer ihrer Subsprachen wiederkehren. […] Der Grundwortschatz ist aus linguistischer Sicht sehr unterschiedlich definiert worden […] Gemeinsam ist all diesen Definitionen die Vorstellung von einem relativ beständigen, in der Sprachgemeinschaft weitverbreiteten, produktiven lexikalischen Zentrum, an das sich periphere, weniger beständige, im Geltungsbereich eingeschränkte, sekundär abgeleitete Wortschätze, z. B. Fachwortschätze, anlagern.[…] Ein lexikalisches Minimum ist die Menge lexikalischer Einheiten, die zur Lösung bestimmter Kommunikationsaufgaben unbedingt erforderlich ist. (Hoffmann 1984, 225, Hervorhebungen: U. Sch.).
Tendenzen für eine derartige Unterscheidung können im Kern auch mit Lernzielvorgaben korrelieren (wenngleich diese sich immer wieder ändern, vgl. aktuell dazu die Deutschprüfungen, die beim Goethe-Institut im Rahmen des ‚Gemeinsamen europäischen Referenzrahmens für Sprachen (GER) [http://www.goethe.de/z/50/ commeuro/] abgelegt werden können, unter http://www.goethe.de/lrn/prj/pba/bes/ deindex.htm). Wenn man aus sprachdidaktischer Sicht die Unterscheidung zwischen einem produktivem (aktivem), rezeptivem (passivem) und potentiellem, d. h. eigentlich unbekanntem aber erschließbarem Wortschatz nachvollzieht, läßt sich zusammenfassend eine dreifache Aufgabenstellung ableiten: Erstens muß ein Teil des Wortschatzbestandes einer Sprache so gelernt werden, daß er in mündlichen bzw. schriftlichen Texten erkannt und verstanden wird; zweitens muß ein kleinerer Teil des Wortschatzes so angeeignet werden, daß er zur Generierung mündlicher und/oder schriftlicher Äußerungen verwendet werden kann; und schließlich müssen drittens der produktive und der rezeptive Wortschatz sowie weitere Sprachkenntnisse, metasprachliche eingeschlossen, so erworben werden, daß ein möglichst großer Zuwachs an potentiellem Wortschatzbesitz erreicht werden kann (Löschmann 1993, 32 f.).
Eine simple Antwort auf die eingangs gestellte Frage nach dem WIE der Wortschatzselektion lässt sich also selbst in Bezug auf einen vermeintlich überschaubaren Bereich wie dem ‚lexikalischen Zentrum einer Sprache‘ nicht finden – im Gegenteil: Das Spektrum der entwickelten methodischen Ansätze zeigt, dass es unterschiedliche Zugangsmöglichkeiten gibt, die auch zu (mehr oder minder) unterschiedlichen Ergebnissen führen können. Um das lexikalische Zentrum zu ermitteln, ist es daher unabdingbar, den engeren Zweck der Wortschatzauswahl zu begründen (z. B. sprach-
10
Ulrich Schnörch
didaktisch) und transparent zu machen; erst wenn man definiert hat, was das lexikalische Zentrum auch funktional zu einem zentralen Wortschatzbereich macht (z. B. die Kommunikationsfähigkeit), lässt sich sinnvoll eine geeignete Methode wählen. Abgesehen von den linguistischen Problemen bei der Ermittlung beispielsweise eines didaktisch motivierten Wortschatzminimums (‚Grundwortschatz‘) bleibt dann noch die Frage, wie man das Ergebnis den Lernern und Lernerinnen präsentiert. Die Bandbreite ist relativ groß, was hier nur angedeutet werden kann, so lassen sich etwa muttersprachliche und fremdsprachliche Grundwortschätze unterscheiden, letztere können einsprachig oder zweisprachig konzipiert werden, die einsprachigen kann man alphabetisch oder systematisch anordnen und sich schließlich für ein Wörterbuch (mit Worterklärungen) oder eine bloße Wortliste entscheiden (vgl. auch Kühn 1981, 176). Die zweite Leitfrage ist die nach der Zähleinheit: Woraus kann ein Wortschatz bestehen? Bereits das Skizzieren der verschiedenen Herangehensweisen bei der Auswahlprozedur geriet reichlich komplex. Dabei wurde die Frage nach der Zähleinheit noch ausgeklammert bzw. stillschweigend vorausgesetzt, dass – alltagssprachlich verstanden – einzig ‚Wörter‘ in Frage kämen. Besteht der Wortschatz also nur aus ‚Wörtern‘ – und was ist überhaupt ein ‚Wort‘ im Deutschen (bei polysynthetischen Sprachen wie dem Grönländischen wäre man mit weiteren Schwierigkeiten konfrontiert (vgl. dazu auch Hass/Storjohann 2015 sowie Imo im vorliegenden Band))? Für die sprachwissenschaftlich äußerst schwierige Definition von ‚Wort‘ sind phonetisch-phonologische, graphische, morphologische, syntaktische, semantische und pragmatische Kriterien zu berücksichtigen. In der Literatur hat man sich auf mindestens folgenden Merkmale (mithin den Definitionsbestandteilen) eines typischen Wortes geeinigt: – – – – –
„seine Isolierbarkeit in Rede und Schrift, seinen selbstständigen Bedeutungscharakter, seine Morphemstruktur, seine Fähigkeit, Phrasenkern [= die grammatischen Eigenschaften einer Phrase bestimmende Wortform, U. Sch.] sein zu können, und seinen kommunikativen Charakter, etwas darzustellen und/oder Gefühle auszudrücken und/oder eine Intention zu transportieren“ (Römer/Matzke 2010, S 18; vgl. auch Perkuhn u. a. 2012, 26; Reichmann 1976, 4 f.).
Aus der ‚Einzelwortperspektive‘ heraus betrachtet ist das ‚Wort‘ also ein höchst komplexes Gebilde. Fokussiert man nicht mehr das Wort (oder gar darunter liegende Ebenen), sondern wählt einen übergeordneten Blickwinkel, so weisen Perkuhn u. a. darauf hin, dass auch derartige Definitionsansätze noch nicht ausreichen, „um z. B. die Frage zu beantworten, aus wie vielen Wörtern ein Satz besteht […] Eine schöne Rose ist eine schöne Rose, zwei Rosen sind noch schöner. Wie viele Wörter der Satz enthält, hängt davon ab,
Wortschatz
– – –
11
„ob jede Zeichenkette separat gezählt wird […], ob gleiche Zeichenketten nur einmal gezählt werden […], ob auf eine abstraktere Einheit Bezug genommen wird“ (Perkuhn u. a. 2012, 27).
Die unterschiedlichen Zählweisen entsprechen der terminologischen Unterscheidung zwischen Token – Type – Lexem/Lemma/Grundform und führen entsprechend zu drei Ergebnissen: Token: 12 Eine, schöne, Rose, ist, eine, schöne, Rose, zwei, Rosen, sind, noch, schöner Type: 10 Eine, schöne (2x), Rose (2x), ist, eine, zwei, Rosen, sind, noch, schöner Lexem [bzw. Grundform, U. Sch.]: 6 ein (Eine, eine) schön (2x schöne, schöner), Rose (2x Rose, Rosen) sein (ist, sind) zwei, noch“ (Perkuhn u. a. 2012, 28, leicht abgewandelt).
Für die maschinelle Erhebung von Wortschätzen auf der Basis von Textsammlungen ist eine solche Unterscheidung Voraussetzung. Für das computergestützte Segmentieren und Klassifizieren mit dem Ziel einen Wortschatz(bereich) zu ermitteln, müssen die Bezugsgrößen definiert und operationalisierbar sein. (Quantitative) Aussagen sind nur sinnvoll, wenn man das ‚Gezählte‘ möglichst genau definiert; die Interpretation unterschiedlich erfasster Zählmengen kann natürlich auch aufschlussreiche Ergebnisse bringen, z. B. wenn man das Verhältnis von type und token in einem Text ermittelt (den TTR-Wert), um Rückschlüsse auf dessen lexikalische Vielfalt zu ziehen (vgl. Perkuhn u. a. 2012, 86). Geht man einen Schritt weiter in Richtung Wörterbuch, ist die Bezugseinheit für die Repräsentation des Wortschatzes i. d. R. das Lexem (das Stichwort, das Lemma), also die Grundform (der Infinitiv beim Verb, der Nominativ Singular beim Nomen, der Positiv beim Adjektiv), unter der die types bzw. tokens im Zuge der sog. Lemmatisierung subsumiert werden (vgl. Lemmatisierer 1994). Rein formseitig, also auf die Zeichenkette bezogen, ist dies in vielen Fällen (auch automatisiert) kein schwieriges Unterfangen. Kompliziert wird die Lemmatisierung jedoch v. a. durch die Einbeziehung der Inhaltsseite: am offenkundigsten wird dies, wenn man bedenkt, dass eine ‚Bedeutung‘ (im Text) nicht automatisch durch ein Wort repräsentiert wird, was am Beispiel von diskontinuierlichen Elementen (z. B. nahm … auf, legte … ab) und besonders von Mehrworteinheiten wie Phraseologismen angedeutet werden kann: „Ihr besonderer Charakter als feste Wortverbindung ergibt sich vor allem aus ihrer (semantischen) Idiomatizität und ihrer (semantisch-syntaktischen) Stabilität. Damit zusammen hängt ihre Speicherung (Lexikalisierung) als lexikalische Einheit, die bei der Textgestaltung reproduziert wird“ (Fleischer 1997, 307; vgl. auch Schippan 1992, 47 ff.; Dobrovol’skij/Piirainen 2009). Vordergründig besteht der Wortschatz also aus Wörtern, die sich segmentieren, subsumieren, klassifizieren, zählen usw. lassen. Versteht man die Teilelemente des Wortschatzes als Einheit aus Form und Inhalt, so müssen auch Mehrworteinheiten (z. B. Fragen stellen, ins Rollen kommen, seine Schäfchen ins Trockene bringen) als
12
Ulrich Schnörch
Bestandteil des Wortschatzes gezählt werden. Deren Berücksichtigung stellt die computergestützte Wortschatzerhebung vor erhebliche Probleme. Das Segmentieren und Klassifizieren von Wortschatzbestandteilen ist kein Selbstzweck: Die Definition der Zähl- bzw. Bezugseinheit (wie schon die Wahl der geeigneten Auswahlstrategie) hängt maßgeblich davon ab, was man mit der Summe der ermittelten Wörter bezweckt (Frequenzuntersuchungen, Wörterbucherstellung usw.). Insofern wirkt sich der Gebrauchszweck auf die Gewichtung möglicher syntaktischer, morphologischer, semantischer, sozio-pragmatischer usw. Definitionskriterien aus. Dieses Kriterienbündel wiederum steckt den Interpretationsrahmen in Bezug auf die ermittelte Wortschatzmenge ab. Die dritte Leitfrage reflektiert die Art des Wortschatzes: Welche Arten von Wortschätzen gibt es? Es empfiehlt sich, die Methodik und Bezugsgröße auf das Forschungs- oder Erkenntnisinteresse der Wortschatzanalyse abzustimmen. Nun ist es an der Zeit, den Untersuchungsgegenstand selbst in Augenschein zu nehmen, also die Frage zu erörtern, welchen Wortschatz(bereich) man erheben und untersuchen möchte. Man tut zunächst gut daran, sich zu erinnern, dass die Bezeichnung Wortschatz ein Kollektivum ist; zu diesem Oberbegriff lassen sich Teilmengen bestimmen, die auf der Basis einer zentralen Eigenschaft der Sprache bzw. des Wortschatzes begründbar sind: Die Sprache ist eine funktionale Erscheinung, die u. a. der Kommunikation zwischen Menschen dient. Da die Menschen gesellschaftlich abhängige Wesen sind, die in unterschiedliche Gruppen der Gesellschaft eingebunden sind, an verschiedenen Orten und zu verschiedenen Zeiten leben, ist auch die Sprache davon abhängig. […] Dies reflektiert sich im Wortschatz dahingehend, dass sich dieser in Teilwortschätze gliedert (Römer/Matzke 2010, 79).
Geht man vom Konstrukt des Wortschatzes im Rahmen einer Nationalsprache in ihrer Standard- bzw. Normvariante aus, etwa der neuhochdeutschen Schriftsprache, so lassen sich neben einem großen, den meisten Sprachteilnehmern gemeinsamen Wortschatz eine Reihe davon signifikant abweichender Teilmengen (Teilwortschätze bzw. Varietäten) beschreiben. Für diese Subklassifizierung kann eine Reihe von Fragen zum Ausgangspunkt genommen werden, nämlich WANN (Zeit), WO (Raum) und WOZU (Funktion) der Wortschatz gebraucht wurde/wird, und WER (Person soziale/Dimension) den Wortschatz verwendet(e) (vgl. Elsen, 2013; König 2011; Löffler 1994; Römer/Matzke 2010; Schippan 1992). Zeit: Neben dem gegenwartssprachlichen Wortschatzelementen wären unter diesem Aspekt veraltete Wörter (Archaismen, Historismen, z. B. Minne, harren) aber auch aktuellst in den Sprachgebrauch übernommene Wörter (Neologismen, z. B. Frutarier, liken) zu sammeln. Zeit fließt kontinuierlich, Abschnitte werden stets künstlich festgelegt. Folglich müssen zu Untersuchungszwecken auch im zeitlichen Sprachkontinuum quasi baumscheibenartige Einschnitte vorgenommen werden: Dann kann man einen einzelnen Jahresring analysieren: Dieser synchrone Ansatz konzentriert sich auf die (isolierte)
Wortschatz
13
Untersuchung eines aktuellen oder bereits vergangenen (vgl. Gloning 2003) Stadiums der Wortschatzentwicklung. Demgegenüber werden unter diachronem Betrachtungswinkel mehrere Jahresringe verglichen, also der Fokus auf die Entwicklungsgeschichte (im Rahmen der Sprachgeschichte) als Ganzes gelegt. Raum: In Relation zu anderen Nationalsprachen lassen sich beispielsweise Fremdwörter (Teenager) und Lehnwörter (Pfeffer) sowie Internationalismen (Chef) bestimmen; Im Rahmen nationaler Standardvarietäten ist es möglich, gegenüber dem Deutschen Austriazismen (Paradeiser – Tomate) und Helvetismen (Gipfeli – Hörnchen) zu klassifizieren; Unter regionalem Aspekt können Wortschätze u. a. hinsichtlich des Merkmals dialektal / mundartlich (vgl. König 2011, 139 ff.) klassifiziert werden. Personen (‚soziale Geprägtheit‘): Unter dem Gesichtspunkt Lebensalter und/ oder Geschlecht der Kommunizierenden lassen sich bezüglich der Lexik Lebensaltersprachen unterscheiden, z. B. Kindersprache, Schüler-/Jugendsprache, Erwachsenensprache und Seniorensprache sowie Frauen- und Männersprache. In Bezug auf bestimmte Gruppen von Sprechern bzw. Sprecherinnen in Verbindung mit bestimmten (zweckgebundenen) Regularitäten ihres Zusammenkommens können Fachsprachen (z. B. der Medizin, der Angler) als Subsysteme mit z. T. terminologisierten Wortschätzen beschrieben werden. Diese ‚sozialen Varietäten‘ sind freilich keine autonomen Sprachsysteme (‚die Frauen- oder Männersprache‘ gibt es nicht!), sie besitzen vielmehr eine (große) Schnittmenge mit der standardsprachlichen Lexik und einen kleinere Teilmenge an (personen-) spezifisch gebrauchtem Wortschatz. Die lexikalischen Charakteristika, welche den stark vereinfachten und ausschnitthaft dargestellten Kategorisierungsansatz begründen, werden i. d. R. flankiert von weiteren grammatischen und pragmatischen Spezifika. Ob die Äußerungen schriftlich oder mündlich sowie monologisch oder dialogisch erfolg(t)en hat natürlich auch Auswirkungen auf den gewählten Wortschatz. Die vierte Leitfrage wendet sich nochmals der Strategie zu: Auf welcher Textbasis werden Wortschätze erhoben? Die eben skizzierten Arten von Wortschätzen sind funktional kommunikativ begründet. So trivial, gar redundant dieser Aspekt in Bezug auf den Wortschatz erscheinen mag, wirklich Rechnung tragen konnte und kann man ihm nur, wenn man auch die Sprachverwendung zur Grundlage der Wortschatzanalyse und -beschreibung macht. Insofern ist nun eine zweite Leitfrage zur Strategie an der Reihe. Als empirischer, methodisch eigenständiger Ansatz ist dies in großem Rahmen erst durch den Einsatz des Computers möglich geworden. Nun lassen sich massenhaft Texte (‚Wortschatzmassendaten‘) in digitaler Form zu Korpora zusammenfassen und maschinell auswerten (wobei der Fokus im Folgenden auf den Bereich der geschriebenen Sprache gerichtet wird). Dieser Aufgabe widmet sich die Korpuslinguistik: „Korpuslinguistik untersucht Sprache im Gebrauch“ (Perkuhn u. a. 2012, 15), ein
14
Ulrich Schnörch
Ansatz, dessen Umsetzung völlig neue Blicke auf den Wortschatz, seine Analyse und Beschreibung ermöglicht. Materielle Voraussetzung ist die Korpusakquise (hier gilt es u. a. das Copy Right und allerlei Prinzipien der Korpuszusammenstellung zu beachten, vgl. Perkuhn u. a. 2012, 45 ff.; Lemnitzer/Zinsmeister 2010, 40 ff.). Ein Ergebnis könnte aussehen wie das riesige Deutsche Referenz Korpus des IDS (DeReKo). Die Auswahl- und Beschreibungsbasis für Wörter und Wortschätze ist damit immer materiell fassbar und transparent, allerdings sollte man sich auch stets dessen bewusst sein, dass man nicht ‚den‘ Wortschatz, sondern immer nur den Wortschatzausschnitt erfasst, der im Korpus repräsentiert ist. Um die sprachlichen Massendaten überhaupt noch handhaben zu können, bedarf es geeigneter Korpusrecherchetools (z. B. Cosmas II), mit denen es möglich ist, nach Zeichenketten (‚Wörtern‘, Wortkombinationen usw.) zu suchen. Auf dieser Basis wiederum lassen sich weiterführende Methoden und Verfahren anwenden, etwa selbsterklärend ‚Statistische Kollokationsanalyse und -clustering‘ (Belica 1995) benannt, mit deren Hilfe systematisch signifikante Mitspieler/Kollokatoren eines Wortes ermittelt, gereiht und mit syntagmatischen Mustern versehen werden können. Dies ist ein gutes Beispiel für strukturentdeckende Verfahren, und darum geht es der Korpuslinguistik, um ihre Entwicklung, aber auch um ihre Anwendung auf sehr große Sammlungen authentischer Sprachgebrauchsdaten – mit dem Anliegen, realen sprachlichen Phänomenen nachzuspüren. Und dabei sollte das Bestreben, sich ohne Vorannahmen nur am puren Sprachgebrauch zu orientieren […] erkennbar sein (Perkuhn u. a. 2012, 21).
Verfahrenstechnisch wird dieser Ansatz als corpus-driven bezeichnet, d. h. möglichst ohne Vorannahmen Abfragen an ein Korpus zu richten: „Daten dienen nicht dazu, erst im Nachhinein Thesen oder Theorien zu bestätigen oder zu widerlegen. Sie stellen vielmehr den Ausgangspunkt dar, von dem aus Thesen abgeleitet und Theorien aufgestellt werden“ (ebd., 20). Aus den wenigen Andeutungen geht hervor, dass hier – salopp ausgedrückt – nicht nur Zeichenketten gezählt werden, sondern Analyseergebnisse vielfältigster Art erzielt werden, die ggf. auch semantische Fragestellungen selbst beantworten oder diese zu beantworten helfen. Beim sog. corpus-based-Verfahren wird die Datenbasis im Nachhinein, quasi als Belegsammlung zur Stützung kompetenzgestützt bzw. intuitiv gewonnener Hypothesen genutzt. In der vordigitalen Welt bildeten Karteikarten und -kästen das grundlegende Handwerkszeug für die (corpus-based) Untersuchung von Wortschätzen, mithin für das Erstellen von Wörterbüchern. Simon Winchester (1998) beschreibt in seinem (Sach-) Roman ‚Der Mann, der die Wörter liebte‘, wie eine Vielzahl von Menschen Wörter (und Belege) für das ‚Oxford English Dictionary‘ sammelten und so den englischen Wortschatz für ein Wörterbuch in Gemeinschaftsarbeit zusammentrugen. Eine vergleichbare Arbeitsweise ermöglicht heutzutage das Internet, sodass Wörterbücher im kollektiven Prozess erarbeitet werden (vgl. z. B. Wiktionary).
Wortschatz
15
Heute können Stichwortlisten auf der Basis umfangreicher Korpora erstellt werden – und das ist eine einfache Antwort auf die vierte Leitfrage: Für elexiko, das Online-Wörterbuch des IDS, wurde der zu beschreibende Wortschatz gleich bei Projektbeginn ermittelt: Die Liste umfasst ca. 300.000 Einheiten (= Stichwörter/Lemmata), die mit einer bestimmten Mindestfrequenz und -textstreuung im elexiko-Korpus (vgl. Storjohann 2005) belegt sind, damit den Kriterien der Stabilität und Gebräuchlichkeit (Usualität) Rechnung getragen wird (vgl. Schnörch 2005). Aktuellere lemma- bzw. type-ausgerichtete (Häufigkeits-) Zusammenstellungen in Verbindung mit der jeweiligen Produktdokumentationen hat der Forschungsbereich Korpuslinguistik am Institut für Deutsche Sprache unter der Überschrift ‚DeReWo – Korpusbasierte Grundform- bzw. Wortformenlisten‘ zum Download versammelt (vgl. DeReWo). Derartige Methoden können möglicherweise auch einmal helfen, die Probleme der Zählbarkeit von Wörtern zu konkretisieren und letztlich die Frage zu beantworten, wie groß der deutsche Wortschatz insgesamt ist. Bisherige Erhebungen legen häufig Stichwortzählungen bzw. -hochrechnungen in Wörterbüchern zugrunde: Das Deutsche Wörterbuch von Jacob und Wilhelm Grimm (1852–1960) wird auf ca. 350.000 Stichwörter geschätzt. […] Zum Vergleich: Das berühmte Oxford English Dictionary, wie das Grimmsche [sic!]ein historisches Wörterbuch, aber auf sehr aktuellem Stand, weist derzeit etwa 620.000 Stichwörter auf (siehe www.oed.com, 1.9.2013); der Grand Robert (zuletzt gedruckt 2001) beschreibt für das Französische nach eigenen Angaben 100.000 Stichwörter mit insgesamt 350.00 Bedeutungen (Klein 2013, 18 f.).
Relativiert werden die derartige Zählungen wiederum dadurch, dass allgemeinsprachige Wörterbücher kaum fachsprachliche Wortschätze (wie z. B. den der Chemie) enthalten. Zählt man diese nämlich dazu, kann man ohne Übertreibung zu folgenden Fazit kommen: „Demnach scheint gesichert zu sein, dass der Umfang des deutschen Wortschatzes zwischen 70.000 und mehr als zehn Millionen Wörtern liegt“ (Klein 2013, 19). Neben der Größe des Wortschatzes einer Sprache interessiert natürlich auch der Umfang des Wortschatzes einzelner, durchschnittlicher Erwachsener. Dabei muss man sich weitgehend auf Beobachtungen gestützte Schätzungen verlassen – es sei denn, man will die Frage: „Wie viele Wörter hat der Mensch?“ beantworten und startet einen Selbstversuch wie der Journalist Dieter E. Zimmer (1990) es getan hat: Im Zuge seiner Textproduktion am Computer erweiterte er stetig die Rechtschreibprüfung um nicht implementierte Wörter, bis schließlich eine Größenordnung von ca. 50.000 Wörter erreicht war (vgl. Zimmer 1990, 83). Allgemein veranschlagt man den aktiven (beim Sprechen bzw. Schreiben produktiv verwendeten) Wortschatz auf ca. 6.–10.000 Wörter. Der passive (rezeptiv beim Hören/Lesen verstandene) Wortschatz wird auf 16.–100.000 Wörter geschätzt. Bei prominenten Sprachverwendern wie Schriftstellern lassen sich deren Werke auszählen, so benutzte Goethe ca. 80.000 Wörter (vgl. Haß-Zumkehr 2001, 381 ff.; allgemein auch Klein 2013; König 2011,
16
Ulrich Schnörch
114 f.; Miller 1995, 159 ff.). Derartige Zahlen sind fraglos interessant, mehr als sehr vage Näherungswerte sind es freilich nicht: Streng genommen können wir […] niemals sagen, welchen Umfang ‚der Wortschatz einer Sprache‘ tatsächlich hat. Wir können lediglich sagen, wie viele Wörter in Korpora einer bestimmten Zusammensetzung verwendet werden und wie sich dies im Laufe der Zeit ändert (Klein 2013, 21).
Die rein quantitative Aussage, dass der Untersuchungsgegenstand eine sehr umfangreiche Materialmenge bereithält, stützt sich bislang auf überwiegend formseitig ausgerichtete Erhebungen. Wenn man aber den Reichtum der deutschen Sprache nicht daran bemisst, welche Wörter zur Verfügung stehen, sondern daran, welche Bedeutungen man mit diesen Wörtern ausdrücken kann, […] so muss man von weitaus höheren Zahlen ausgehen (Klein 2013, 28).
Um qualitativ fundierte Aussagen aus Wortschatzerhebungen abzuleiten, ist es stets ratsam, jene Parameter zu berücksichtigen, die bislang schon angesprochen wurden: Was wird als Zähleinheit festgelegt? Auf welcher Textbasis wird gezählt? Wie wird gezählt? Der Schwerpunkt der bisherigen Leitfragen war der Wortschatz selbst, in der nächsten, der fünften geht es um die Perspektive auf den Untersuchungsgegenstand: Welche Fachdisziplinen widmen sich der Untersuchung von Wortschätzen? Das Thema Wortschatz behandeln heißt, sich nicht vor Perspektivwechseln zu scheuen; dies ist bereits einige Male geschehen, um jedoch der Gefahr des Schwindels vorzubeugen, soll an dieser Stelle nur eine Auswahl an Disziplinen versammelt werden, bei denen der Wortschatz zum Forschungsgegenstand gehört. Die längste Tradition bei der Beschäftigung mit der Sprache im Allgemeinen und Wörtern bzw. dem Wortschatz im Besonderen besitzt gewiss die Philosophie (oder Sprachtheorie), wobei das Erkenntnisinteresse immer wieder von sehr elementaren Fragen zu Ursprung, Wesen und Funktionsweise entfacht wird. Bislang erwähnt wurde auch die Fremdsprachendidaktik mit ihrer zentralen Aufgabe, Wortschatz- und andere sprachliche bzw. kulturelle Bereiche auszuwählen, aufzubereiten und zu vermitteln. Eingangs kam bereits die Lexikografie, genauer die Grundwortschatzlexikografie zur Sprache, später wird der Blick noch auf die allgemeine elektronische Lexikografie gelenkt werden (vgl. allgemein: Haß-Zumkehr 2001; Herbst/Klotz 2003). Die „Korpuslinguistik als Methodologie (und nicht als Werkzeugkasten)“ (Perkuhn u. a. 2012, 19) entwickelt(e) u. a. für die Erforschung des Wortschatzes völlig neue Zugänge, indem sie den Sprachgebrauch selbst, wie er sich in Korpora manifestiert, möglichst ohne Vorannahmen analysiert. Im Wechselspiel mit der Lexikografie eröffnet diese Herangehensweise völlig neue Perspektiven (vgl. Sinclair 1987 u. 1991).
Wortschatz
17
Darüber hinaus beschäftigt sich eine Vielzahl von Disziplinen mit dem Wortschatz bzw. mit Teilwortschätzen, z. B. die Grammatik, die Textlinguistik, die Diskurslinguistik und die Stilistik: Hinsichtlich des Gebrauchs lässt sich beispielsweise vulgärer Wortschatz (Fick) und gehobener (Beischlaf) durch entsprechende Kennzeichnung auch in Wörterbüchern markieren. Von Seiten der Naturwissenschaften untersuchen Zweige der Psychologie und der Kognitionswissenschaften ausführlich Sprache und Wortschatz, etwa unter den Aspekten Erlernen (Mutter-, Fremdsprache), Speichern, Verarbeiten (Produktion, Rezeption), Sprachfehler(therapie). Hinter diesen Ansätzen scheint mehr oder minder deutlich das Interesse an der Struktur des mentalen Lexikons (vgl. Aitchison 1997) durch. Der Untersuchungsgegenstand ist also ein gänzlich anderer als bei den bislang skizzierten geisteswissenschaftlich motivierten Ansätzen. Es ist wichtig an dieser Stelle darauf hinzuweisen, dass diese unterschiedlichen Herangehensweisen und Erkenntnisinteressen auch zu methodologisch unterschiedlichen Ausprägungen geführt haben: Auf der geisteswissenschaftlich geprägten Seite dominieren empirische, korpuslinguistische Verfahren, auf der naturwissenschaftlich geprägten experimentelle Methoden (vgl. dazu Gonzalez-Marquez/Mittelbert/Coulson/Spivey 2007; Litosseliti 2011). Ob und inwieweit die beiden meist noch getrennt angewandten Verfahren sinnvoll kombiniert werden können, wird zu sehen sein. Da Sprache soziale Praxis ist, Sprachgebrauch, der Wortschatz ein menschliches Alltagsphänomen, ließe sich die Aufzählung von Bereichen, die sich mit Sprache/ Wortschatz (wissenschaftlich) auseinandersetzen, beinahe beliebig fortsetzen. Hier soll im Folgenden noch kurz auf jene Wissenschaft eingegangen werden, die die Erforschung des Wortschatzes als ihre Kernaufgabe sieht, die Lexikologie. Als linguistische bzw. sprachwissenschaftliche Disziplin sieht die Lexikologie ihren Gegenstand im Inventar lexikalischer Zeichen (Morphemen, Wörtern und festen Wortgruppen), im Aufbau des Wortschatzes und im Regelsystem, das Wortgebrauch und -verstehen bestimmt. Sie untersucht und beschreibt den Wortbestand einer Sprache, seine Schichtung und Struktur, Bildung, Bedeutung und Funktionen seiner Elemente. Sie ist die Theorie des lexikalischen Teilsystems, des Lexikons (Schippan 1992, 1; vgl. auch: Reichmann 1976; Lutzeier 1995, 2002; Wanzeck 2010).
Betrachtet man den so umrissenen Untersuchungsgegenstand etwas genauer, offenbart sich ein äußerst vielschichtiger Beschäftigungsbereich, denn: Das Lexikon steht mit anderen Teilsystemen in Wechselbeziehungen und wirkt im sprachlichen Handeln mit ihnen zusammen. Lexikoneinheiten stellen […] kein statisches Inventar dar, unser lexikalisches Wissen umschließt neben stationärem auch prozedurales Wissen, Regelkenntnisse der Variation, Veränderung und Anwendung der Lexikoneinheiten. Daher wollen wir als Gegenstand der Lexikologie den Wortschatz und seine Einheiten als Medium, Voraussetzung und Resultat sprachlicher Tätigkeit verstehen (Schippan 1992, 4).
18
Ulrich Schnörch
Will die Lexikologie einer derart umfassenden Aufgabe nachkommen ohne dabei den Überblick zu verlieren, so muss sie einen methodischen Kniff anwenden: „Die Lexikologie kann ihr Objekt in seiner Komplexität nur betrachten, wenn sie diese Eigenschaften zunächst isoliert“ (Schippan 1992, 4); freilich sollte dabei stets das übergeordnete Ziel von Etappe zu Etappe nicht aus den Augen verloren werden: „Die Lexikologie untersucht das lexikalische Teilsystem als gesellschaftlich determiniertes Inventar lexikalischer Zeichen, die Normen und Regeln seines Aufbaus und der Verwendung in der kommunikativen Tätigkeit; die Wechselbeziehungen mit anderen Teilsystemen“. Diese Vorgehensweise lässt sich mit gewissen Einschränkungen auf nahezu jede Art der Wortschatzbetrachtung anwenden: Beim Fokussieren von Detailfragen sollte man das Ganze nicht aus den Augen verlieren (und umgekehrt). Die sechste Leitfrage wendet sich Gliederungsgesichtspunkten zu: Wie ist ein Wortschatz in sich strukturiert? Viele mehr oder minder einzelwortspezifischen Fragestellungen der Lexikologie (z. B. das Wort als sprachliches Zeichen, Einzelheiten der Wortbildung) bleiben hier natürlich außen vor. Der Blick auf Details ist immer wieder vonnöten, sollte den Blick aufs Ganze jedoch nicht verstellen. Der Wortschatz setzt sich aus unterschiedlichen Wörtern (sprachlichen Zeichen) zusammen und er ist dynamisch, d. h. im Laufe der Zeit ständigen Veränderungen unterworfen. Was den lexikalischen Bestand betrifft, so kann dieser entweder durch Übernahmen aus anderen Sprachsystemen (Stichwort ‚Fremdwörter‘) oder durch Mittel der Wortbildung erweitert werden; konzentriert man sich auf diese Möglichkeit der Wortschatzerweiterung, so lassen sich Wortfamilien zusammenstellen, die bestimmte Wortschatzbereiche binnenstrukturieren (vgl. Augst/Müller 2009 sowie Römer in diesem Band). Eine lexikologische Fragestellung lässt sich aus zwei Perspektiven betrachten: „Fragt die Onomasiologie danach, wie Objekte bezeichnet werden, so kehrt die Semasiologie in gewissem Sinne die Sehweise um und fragt, was ein Lexem, ein Wort, bedeutet“ (Schippan 1992, 38). So interessant die semasiologische Perspektive als auch sprachhistorische Untersuchungen nicht nur für Wörter, sondern auch für (Teil-) Wortschätze sind, unter dem Gesichtspunkt der Wortschatzorganisation standen seitens der Lexikologie lexisch-semantische Beziehungen im System im Fokus (vgl. Schippan 1992, 196 ff.). In strukturalistischer Tradition fasste man klassischerweise unter dem Kriterium der Kombinierbarkeit syntagmatische Relationen zusammen und unter dem Kriterium der Austauschbarkeit paradigmatische Relationen; letztere unterschied man weiter in hierarchische Beziehungen (Hyperonymie – Hyponymie), Beziehungen des Gegensatzes (Antonymie, Konversonymie usw.) und Beziehungen der Ähnlichkeit (Synonymie). Die Frage nach der Strukturierung des Wortschatzes ist sicher eine der schwierigsten. Die traditionelle Lexikologie hat eine reichhaltige und oft beschriebene Terminologie samt gern diskutierten und immer wieder modifizierten Modellen entwickelt,
Wortschatz
19
man denke in diesem Zusammenhang nur an das Begriffspaar syntagmatische vs. paradigmatische Relationen (vgl. Storjohann in diesem Band). Neuere Forschungen zeigen jedoch, dass ihnen viel theoretische Konstruiertheit anhaftet, wenn man das Konzept der Sinnrelationen mit einem eher am Sprachgebrauch orientierten Ansatz überprüft (vgl. Storjohann in diesem Band). In der siebten Leitfrage sollen Gesichtspunkte des Speicher(ns) erörtert werden: Wo (bzw. wie) wird Wortschatz gespeichert? Die Disziplinen, die sich mit dem Wortschatz beschäftigen, fragen nicht nur nach seinen Bestandteilen und den Eigenschaften dieser Einheiten, nach dem Umfang (= Quantität) des Wortschatzes, sondern auch nach (inhärenten) Ordnungs-, Strukturierungsmöglichkeiten, die gleichermaßen Ziel und Voraussetzung sind im Umgang mit derartig umfangreichen Datenmengen. Traditionelle onomasiologische Felder sind komplexe, bezüglich der Vernetzung häufig zwischen hoch assoziativ und äußerst konstruiert zusammengestellte Gebilde. In Wörterbüchern erfasst sind sie – historisch gewachsen (vgl. Roget’s Thesaurus, Wehrle-Eggers) – mit ontologischen Implikationen verknüpft, also mit dem Anspruch, die begriffliche Ordnung der Welt in der Ordnung des Wortschatzes widerzuspiegeln. Vom Ansatz her stehen sie auch daher in krassem Gegensatz zu gedruckten semasiologischen Wörterbüchern, deren initialalphabetische Ordnung einzig der Forderung nach Nutzbarkeit nachkommt: Wie sollte man sonst das gesuchte Wort finden, die Angaben zu dessen Orthografie, Aussprache, Bedeutung usw.? Rezeptive und produktive Zugriffsprozeduren auf den (sprachlichen) Wissensspeicher im menschlichen Hirn funktionieren anders, und das versuchen die Kognitionswissenschaften zu entschlüsseln. Speicherungsmodelle des Wortschatzes hängen also in beträchtlichem Maße vom Medium, dessen Kapazitäten und Funktionalitäten ab. Zusammengefasst und stark vereinfacht lassen sich die Unterschiede zweier, lange Zeit geradezu antipodischer Wortschatzspeicher(modelle) wie folgt zusammenfassen: Das mentale Lexikon unterscheidet sich grundlegend von den Buchlexika in folgender Hinsicht: Das mentale Lexikon ist nicht alphabetisch geordnet, aber gut organisiert. Letzteres zeigt sich daran, dass Sprecher/innen in Millisekunden Wörter erkennen. […]. Das mentale Lexikon ist nicht begrenzt, sondern vielmehr ständig erweiterbar. Es umfasst qualitativ viel mehr als alle Buchlexika. Das mentale Lexikon ist deshalb nicht statisch, sondern dynamisch (Römer/Matzke 2010, 76)
Da der mentale Speicher offenkundig bestens funktioniert, wäre eine Annäherung von Wortschatzbeschreibungsmodellen eigentlich wünschenswert und mit der technischen Voraussetzung des Computers konnte der Weg in Richtung Dynamik und Vernetztheit auch eingeschlagen werden. Als achte und abschließende Leitfrage soll die nach der (makrostrukturellen) Darstellbarkeit gestellt werden: Wie lassen sich ein Wortschatz und dessen Einheiten adäquat beschreiben?
20
Ulrich Schnörch
Konzepte wie Wissensrahmen (sog. frames, z. B. der ‚Restaurantbesuch‘ mit allen assoziierten Bezeichnungen für Gegenstände, Handlungen, Eigenschaften) und Szenen (sog. scenes, die weniger komplex und oft kulturspezifisch sind, z. B. der ‚Bezahlvorgang‘) waren erste Schritte, die sich auch die Lexikografie für die Beschreibung des Wortschatzes nutzbar zu machen versuchte (vgl. FrameNet). Doch bereits bei der Umsetzung solcher, noch relativ überschaubarer Modelle zeigte das gedruckte Medium schnell seine Grenzen auf. Die elektronische Lexikografie mit ihrem Darstellungspotenzial scheint hingegen ein probates Mittel, um den Abstand zwischen Modellen des mentalen Lexikons und ‚lexikografischen‘/maschinellen Wortschatzspeichern zu verkürzen. Dieses Medium gilt es folglich in all seinen Möglichkeiten zu nutzen. Methodisch sollte für die Lexikografie der Sprachgebrauch, wie er sich in Korpora (er)fassen lässt, ausschlaggebend sein und als Datenbasis für die Wortschatzanalyse herangezogen werden. Dies kann sinnvollerweise nur dann geschehen, wenn sich die Lexikografie in der Korpuslinguistik einen Verbündeten sucht. Seitens der Technik in elektronischen Wörter-‚büchern‘ sollten sich die vielfältigen, vielschichtig vernetzten Daten und Wechselbeziehungen innerhalb des Wortschatzes und seiner Einheiten in ihrer Mehrdimensionalität adäquat visualisieren lassen. Die zweifellos verbesserten Rahmenbedingungen stellen logischerweise auch die Lexikografen und Lexikografinnen vor neue Herausforderungen: Sie bestehen neben ‚handwerklichen Fähigkeiten‘ u. a. darin, viel stärker die ‚neue‘, gebrauchsorientierte Sicht auf den Wortschatz in all seiner Dynamik und Vernetztheit zu erfassen und zu beschreiben; ihre zentrale Aufgabe im lexikografischen Prozess ist und bleibt es, die Qualität der Daten sicherzustellen, beispielsweise durch die redaktionelle Interpretation bzw. Prüfung – nicht zuletzt, um dem entscheidenden Nutzungsanspruch eines Wörterbuchs Rechnung zu tragen: die Zuverlässigkeit. Die konkrete Umsetzung einer solchen Konzeption zur Wortschatzbeschreibung ist z. B. elexiko, das elektronisch-lexikografische, korpusbasierte Wortschatzsystem, das seit ca. 2000 am Institut für Deutsche Sprache in Mannheim konsequent auf das elektronische Medium hin entwickelt wurde (vgl. http://www.elexiko.de sowie Haß 2005; Klosa 2001; Müller-Spitzer 2007). Dieses Beispiel, aber auch andere elektronische, lexikografische Konzepte (vgl. das Digitale Wörterbuch der Deutschen Sprache (DWDS)), zeigen, dass auch die Möglichkeiten der visuellen Präsentation die Wortschatzbeschreibung geradezu revolutionier(t)en (vgl. Haß in diesem Band). Das Zusammenspiel aus technischen Grundlagen, Methoden und Verfahren und menschlichem Know-How trägt viel dazu bei, das Bild vom Wortschatz transparenter zu machen und seine Beschreibung präzisieren und visualisieren zu können – eine Entwicklung, die auch für Nutzerinnen und Nutzer ein großes Informationspotential böte – sofern sie gewillt sind, das Angebot anzunehmen, ihr (Nachschlage-) Verhalten zu anzupassen.
Wortschatz
21
3 Fazit: Ein dynamischer Wortschatzbegriff „Licht aus, Spot an!“ hieß es in den Siebzigerjahren des zwanzigsten Jahrhunderts in einer TV-Musiksendung, und für kurze Zeit standen nur diejenigen im Scheinwerferlicht, auf die es beim nächsten Song ankam. Der Spot wurde von unterschiedlichsten Seiten auf einige Facetten des ‚Wortschatzes‘ gelenkt, um einerseits den Umfang, die Vielfältigkeit, Vernetztheit und Dynamik des Phänomens anzudeuten, andererseits auf die sich daraus ergebende Notwendigkeit aufmerksam zu machen, dass es unerlässlich ist, sich bei der konkreten Beschäftigung einen klaren fachdisziplinären und methodischen Rahmen abzustecken. Der wiederum wird idealiter von einem möglichst konkreten Erkenntnissinteresse festgelegt. Das Entscheidende dabei ist, sein Vorgehen stets auch für Dritte offenzulegen, zu dokumentieren und damit nachvollziehbar zu machen. Einfach ist die Beschäftigung mit dem Wortschatz (einer Sprache, einer Person usw.) nur insofern, als die Grundarbeitsschritte immer die gleichen sind: sammeln – segmentieren – klassifizieren – interpretieren – ordnen/vernetzen. Es kommt nur darauf an, die richtigen Schwerpunkte zu setzen. Ganz in diesem Sinne und da das Thema Wortschatz ohnehin nicht abschließend behandelt werden kann, soll nochmals die Brille des Lexikografen bzw. der Lexikografin aufgesetzt werden, um einige Ausblicke zu ermöglichen. Der Computer und die Verfahren der Korpuslinguistik revolutionier(t)en den Arbeitsplatz aller Menschen, die den Wortschatz deskriptiv lexikografisch beschreiben. „To do the job well, we need to feel confident that our reliance on intuition and subjective judgments is kept to a minimum“ (Rundell 2012, 2). Als besonders fruchtbar in diesem Punkt erwies sich für die moderne Lexikografie die methodologische und methodische Zusammenarbeit mit der Korpuslinguistik: Heute stehen (der Lexikografie) gewaltige Korpora zur Verfügung (vgl. DeReKo). Der Zugriff auf derartige sprachliche Massendaten ist selbstredend nur noch mit geeigneten Methoden und Verfahren möglich, welche die Korpuslinguistik in immer differenzierter Weise erforscht und entwickelt, zum Beispiel: – ein Lemmatisierer, um die Stichwörter/Lemmata/Grundformen für ein Wörterbuch aus den Korpora zu generieren (vgl. Lemmatisierer 1994, Schnörch 2005) – Methoden zur Messung der lexikalischen Vielfalt von Texten, z. B. der sog. TTRWert (type token ratio, vgl. Perkuhn u. a. 2012, 86) – Verfahren und Methoden der statistischen Kookkurrenzanalyse (vgl. Belica 1995) – Methoden der semantischen Gruppierung von Kollokatoren nach semantisch syntaktischen Rollen (vgl. Sketch Engine) – Verfahren, die Ähnlichkeit bzw. Verschiedenheit zweier lexikalischer Ausdrücke in sog. Self-Organising Feature Maps (SOMs) zu visualisieren, indem einer zweidimensionalen Gitterstruktur weitere Wörter aufgrund der Gleichheit bzw. Unterschiedlichkeit ihrer Kollokationsprofile gruppiert werden (vgl. Vachková/ Belica 2009)
22
Ulrich Schnörch
– diskursanalytisch motivierte Verfahren zur Ermittlung der ‚keyness‘: Durch Vergleich von Korpora mit unterschiedlicher thematisch Ausrichtung („aboutness“, Bondi 2010, 7), soll der Status von Wortschatzeinheiten (Wörter, Phrasen), untersucht werden, inwieweit sie als Schlüsselwörter (‚keywords‘) fungieren (und umgekehrt Diskurse thematisch determinieren): „A keyword list therefore gives a measure of saliency, whereas a simple word list only provides frequency. (Baker 2006, 125, vgl. auch Bondi/Scott (Hg.) 2010). In gewisser Weise greift dieser Ansatz auch das Konzept der themenspezifischen Autosemantika (o.) wieder auf und verfeinert bzw. operationalisiert es. War die Erarbeitung der eingangs erwähnten Frequenzwörterbücher (seinerzeit nicht nur aus technischer, sondern generell auch aus linguistischer Sicht) schon kompliziert genug, so dürfte zu erahnen sein, dass die skizzierten Verfahren und Methoden in jeder Beziehung deutlich elaborierter sind (v. a. indem sie die Semantik, also die inhaltliche Seite des Wortschatzes, explizit berücksichtigen). Im Zuge des lexikografischen Prozesses ist daher die Mensch-Maschine-Schnittstelle längst zur Variable geworden: Die vieljährige Erfahrung in einem lexikografischen Team zeigt(e), dass die computergestützten Methoden und Verfahren der Wortschatzanalyse und -beschreibung dem Forschungsgegenstand wohl selten angemessener waren. Es zeigte sich aber auch, dass (vielleicht gerade deswegen) die Lexikografen bzw. Lexikografinnen als letzte redaktionelle Instanz in (Zweifels-) Fällen nicht zu ersetzen sind, zumal die primäre Nutzungssituation eines Wörterbuchs nach wie vor die zuverlässige Entscheidungshilfe in Zweifelsfällen darstellt. Der Wortschatz einer Sprache ist also kein beliebiges Sammelsurium, „Wortschatz ist mehr als ‚viele Wörter‘“ (Haß-Zumkehr 2000). Gleichzeitig wirkt die eingangs hergestellte Analogie des Untersuchungsgegenstandes zu jenen streng planvollen, konstruierten Bildern eines Gewebes oder besser Gebäudes nicht (mehr) ganz angemessen. „Der Wortschatz ist der Teil einer Sprache, der sich am schnellsten verändert“ (König 2011, 113). Vielleicht muss man sich (auch deshalb) nicht von außen, sondern von innen nähern: Die Strukturen der Sprache kommen nicht erst dadurch zustande, dass die Gesetzmäßigkeiten durch unseren Geist er-funden werden. Das Systemhafte steckt vielmehr in der Sprache selbst, es tritt emergent aus ihr hervor, so dass es von unserem Geist quasi nur noch ge-funden werden muss (Perkuhn u. a. 2012, 13).
Diese These lässt sich an einem Beispiel illustrieren, wenn man fragt, was Korpusdaten in puncto Wortschatz eigentlich aussagen können. Beschränkt man sich dabei auf die Kollokatoren dieses Suchworts und gruppiert sie nach satzsemantischen Rollen (z. B. Handlung, Agens usw.), so kann eine Antwort in folgender Abbildung angedeutet werden. Bei der Darstellung handelt es sich gewissermaßen um eine Momentaufnahme mittels der interaktiven, dynamischen (!) Visualisierungskompo-
Wortschatz
23
nente des Werkzeugs VICOMTE (IDS Mannheim), die auf der Basis der Kookkurrenzdatenbank CCDB des IDS erzeugt wurde. Das hier lediglich statisch darstellbare Bild kann in der Softwareversion durch die Mouse-over-Funktion animiert und verändert werden: Ausgeblendete Partnerwörter können angezeigt, Überlappungen eingeblendet und die Anordnung als Ganzes verändert werden (Die Grafik wurde von Rainer Perkuhn erzeugt, vgl. dazu http://www.ids-mannheim.de/kl/projekte/methoden/ka.html; vgl. auch den Wortartikel Wortschatz in elexiko). Dem dynamischen Wortschatzkonzept wird so ein dynamisches Analyse- bzw. Visualisierungswerkzeug zur Seite gestellt – im Gegensatz zur statischen Darstellungsweise in Wörterbüchern (vgl. z. B. den Wortartikel Wortschatz in elexiko). Ausdrücke Begriff Vokabeln Fremdwörter Vierjähriger
Achtjähriger
… … … … … … …
…
…
… … … … … … … …
…
Was wird in Zusammenhang mit „Wortschatz“ thematisiert? … … … …
LE ‘eines Menschen‘
LE ‘eines Menschen/ einer Sprache‘ Wortschatz
Was macht in Bezug auf ein Wortschatz?
Was macht ein Wortschatz?
LE ‘einer Sprache‘
… … …
…
Wie ist Wortschatz?
Wer hat einen Wortschatz?
…
……
Was gehört zum Wortschatz?
Politiker Walser Goethe
… … …
…
umfassen wachsen schrumpfen sprudeln
Was hat ein Wortschatz? Umweltdiskussion Gegenwartssprache Sprache Alltag
Abb. 1: Das Suchwort Wortschatz und seine nach satzsemantischen Rollen gruppierten Kollokatoren (‚Momentaufnahme‘ mittels der interaktiven, dynamischen Visualisierungskomponente des Werkzeugs VICOMTE, für den Druck leicht modifiziert)
Die in unterschiedlichen Disziplinen gewonnenen Modelle und Vorstellungen vom Wortschatz nähern sich folglich einander an, was nur konsequent ist, wenn als kleinster (und zugleich größter) gemeinsamer Nenner die Orientierung am Gebrauch des Wortschatzes (im Korpus) als Ausgangspunkt fungiert und weitgehend vorannahmefreie (corpus-driven) Analysemethoden eingesetzt werden, auf denen dann die fort-
24
Ulrich Schnörch
schreitende Untersuchung und Beschreibung aufgebaut wird. Die Untersuchung des Wortschatzes ist seit jeher eine multidisziplinäre Aufgabe – sie könnte zunehmend zu einer interdisziplinären im methodologischen Sinne werden; besonders verlockend bei dieser Perspektive wäre die Erweiterung des Blickwinkels durch eine stärkere Verzahnung geisteswissenschafltich-korpuslinguistischer mit kognitionswissenschaftlich-experimentellen Strategien. In den Geisteswissenschaften kann die Empirie als Schlüssel zur angemessenen Beschäftigung mit ‚dem Wortschatz‘ aufgefasst werden. Besitzt man ihn, dann lassen sich unterschiedliche Schlösser zum Forschungsgegenstand öffnen – egal, welche Tür man dabei benutzen möchte: Grammatik, Korpuslinguistik, Lexikografie, Lexikologie, Texlinguistik usw.
4 Literatur Aitchison, Jean (1997): Wörter im Kopf. Eine Einführung in das mentale Lexikon. Tübingen (Konzepte der Sprach- und Literaturwissenschaft, 56). Augst, Gerhard/Karin Müller (2009): Wortfamilienwörterbuch der deutschen Gegenwartssprache: Studienausgabe. Tübingen. Baker, Paul (2004): Querying keywords: Questions of difference, frequency, and sense in keywords analysis. In: Journal of English Linguistics 2004/32, 346–359. Baker, Paul (2006): Using Corpora in Discourse Analysis. London. Belica, Cyril (1995): Statistische Kollokationsanalyse und -clustering. Korpuslinguistische Analysemethode. Mannheim. (http://corpora.ids-mannheim.de/) Bondi, Marina/Mike Scott (Hg.) (2010): Keyness in Text. Amsterdam/Philadelphia. Bondi, Marina (210): Perspectives on keywords and keyness. In: Bondi/Scott (Hg.), 1–18. Coseriu, Eugenio (1976): Die funktionelle Betrachtung des Wortschatzes. In: Hugo Moser u. a. (Hg.): Probleme der Lexikologie und Lexikographie. Düsseldorf (Sprache der Gegenwart. Schriften des Instituts für deutsche Sprache 39. Jahrbuch 1975 des Instituts für deutsche Sprache), 7–25. COSMAS II. Corpus Search, Management and Analysis System: http://www.ids-mannheim.de/ cosmas2/uebersicht.html . Cruse, David Alan u. a. (Hg.) (2002/2005): Lexikologie/Lexicology. Ein internationales Handbuch zur Natur und Struktur von Wörtern und Wortschätzen. Berlin/New York (HSK: Handbücher zur Sprach und Kommunikationswissenschaft, 2 Teilbände: 21,1/21,2). DeReKo: Deutsches Referenz Korpus: http://www.ids-mannheim.de/kl/. DeReWo: Korpusbasierte Grund-/Wortformenlisten: http://www.ids-mannheim.de/kl/projekte/ methoden/derewo.html . Grimm, Jacob/Wilhelm Grimm: Deutsches Wörterbuch (1854–1971). 33. Bde. Leipzig/Stuttgart. Nachdruck. Bearb. v. Theodor Koch u. a. München 1999. Di Cesare, Donatella (1996): Wilhelm von Humboldt. In: Tilman Borsche (Hg.): Klassiker der Sprachphilosophie. Von Platon bis Noam Chomsky. München, 275–289. Dobrovol’skij, Dmitrij/Elisabeth Piirainen (2009): Zur Theorie der Phraseologie. Tübingen. DWDS Digitales Wörterbuch der Deutschen Sprache: http://www.dwdde/. elexiko: www.elexiko.de/oder www.owid.de. . Elsen, Hilke (2013): Wortschatzanalyse. Tübingen/Basel. Gloning, Thomas (2003): Organisation und Entwicklung historischer Wortschätze. Tübingen. Fleischer, Wolfgang (21997): Phraseologie der deutschen Gegenwartssprache. Tübingen.
Wortschatz
25
FrameNet: https://framenet.icsi.berkeley.edu/fndrupal/. GER: Gemeinsamer europäischer Referenzrahmen für Sprachen: http://www.goethe.de/z/50/ commeuro/. Goethe-Institut: Deutschprüfungen im Rahmen des Gemeinsamen europäischen Referenzrahmens für Sprachen (GER): http://www.goethe.de/lrn/prj/pba/bes/deindex.html . Gloning, Thomas (2013): Organisation und Entwicklung historischer Wortschätze. Lexikologische Konzeption und exemplarische Untersuchungen zum deutschen Wortschatz um 1600. Tübingen. Gonzalez-Marquez, Monica u. a. (Hg.) (2007): Methods in Cognitive Linguistics. Amsterdam/ Philadelphia. Haderlein, Veronika (2007): Das Konzept zentraler Wortschätze: Bestandsaufnahme, theoretischmethodische Weiterführung und praktische Untersuchung. (http://edoc.ub.uni-muenchen. de/8066/1/Haderlein_Veronika.pdf ). Haß-Zumkehr, Ulrike (2000): Wortschatz ist mehr als „viele Wörter“. Die Aufgaben der Abteilung Lexik des IDS. In: Sprachreport 16/2, 2–7. Haß-Zumkehr, Ulrike (2001): Deutsche Wörterbücher. Berlin/New York. Haß, Ulrike (Hg.) (2005): Grundfragen der elektronischen Lexikographie. elexiko – das OnlineInformationssystem zum deutschen Wortschatz. Berlin/New York (Schriften des Instituts für Deutsche Sprache, 12). Haß, Ulrike/Petra Storjohann (2015): Wort und Wortschatz. In: Ekkehard Felder/Andreas Gardt (Hg.), Handbuch Sprache und Wissen (HSW-Band 1). Berlin/Boston, 143–166. Herbst, Thomas/Michael Klotz (2003): Lexikografie. Paderborn u. a. Hoffmann, Lothar (1984): Fachwortschatz – Grundwortschatz – Minimum. In: Deutsch als Fremdsprache 21, 224–228. Jones, Randall L./Erwin Tschirner (2006): A Frequency Dictionary of German. London/New York. Kaeding, Friedrich Wilhelm (1897–98): Häufigkeitswörterbuch der deutschen Sprache. 2 Bde. Steglitz. Kaufmann, Gerhard (1968): Die Erarbeitung eines Grundwortschatzes Deutsch für das Fach Deutsch als Fremdsprache. In: Deutschunterricht für Ausländer 18, 7–20. Klein, Wolfgang (2013): Von Reichtum und Armut des deutschen Wortschatze In: Deutsche Akademie für Sprache und Dichtung (Hg.): Reichtum und Armut der deutschen Sprache. Darmstadt, 15–55. Klosa, Annette (Hg.) (2011): elexiko. Erfahrungsberichte aus der lexikografischen Praxis eines Internetwörterbuchs. Tübingen. König, Werner (2011): dtv-Atlas Deutsche Sprache. 17. Aufl. München. Koplenig, Alexander/Peter Meyer/Carolin Müller-Spitzer (2014): Dictionary users do look up frequent words. A log file analysis. In: Carolin Müller-Spitzer (Hg.): Using Online Dictionaries. Berlin/ Boston, 229–249. Krohn, Dieter (1992): Grundwortschätze und Auswahlkriterien. Göteborg (Acta Universitatis Gothoburgensis. Göteborger Germanistische Forschungen, 34). Kühn, Peter (1979): Der Grundwortschatz. Bestimmung und Systematisierung. Tübingen (Reihe Germanistische Linguistik 17). Kühn, Peter (1981): Notwendigkeit, Verwendung und Gebrauchswert von Grundwortschatzbüchern. In: Zeitschrift für germanistische Linguistik 9, 164–179. Kühn, Peter (1984): Primär- und sekundärsprachliche Grundwortschatzlexikographie: Probleme, Ergebnisse, Perspektiven. In: Herbert Ernst Wiegand (Hg.): Studien zur neuhochdeutschen Lexikographie V. Hildesheim u. a. (Germanistische Linguistik, 3–6/84), 239–306. Lemmatisierer (1994): (http://www.ids-mannheim.de/kt/dokumente/glemmrep.pdf ). Litosseliti, Lia (Hg.) (2011): Research Methods in Linguistics. 2. Aufl. London/New York. Löffler, Heinrich (1994). Germanistische Soziolinguistik. 2. Aufl. Regensburg/Münster.
26
Ulrich Schnörch
Löschmann, Martin (1993): Effiziente Wortschatzarbeit. Alte und neue Wege. (Deutsch als Fremdsprache in der Diskussion, 1). Frankfurt a. M. u. a. Lutzeier, Peter Rolf (1995): Lexikologie. Tübingen. Lutzeier, Peter Rolf (2002): Der Status der Lexikologie als linguistische Disziplin. In: Alan D. Cruse u. a. (Hg.), 1–14. Miller, George A. (1995): Wörter. Streifzüge durch die Psycholinguistik. Frankfurt. Müller-Spitzer, Carolin (2007): Der lexikografische Prozess: Konzeption für die Modellierung der Datenbasis. Tübingen. Perkuhn, Rainer/Holger Keibel/Marc Kupietz (2012): Korpuslinguistik. Paderborn (UTB: Linguistik für Bachelor). Reichmann, Oskar (1976): Germanistische Lexikologie. 2. Aufl. Stuttgart. Römer, Christine/Brigitte Matzke (2010): Der deutsche Wortschatz. Struktur, Regeln und Merkmale. Tübingen. Rosengren, Inger (1972–1977): Ein Frequenzwörterbuch der deutschen Zeitungssprache. Die Welt. Süddeutsche Zeitung, 2 Bde. Lund. Rundell, Michael (2012): ʹIt works in practice but will it work in theory?ʹ The uneasy relationship between lexicography and matters theoretical. In: Ruth Vathfedt/Julie Matilde Torjusen (Hg.): Proceedings of the 15th EURALEX International Congress. Oslo, 47–92. Euralex, European Association for Lexicography: http://www.euralex.org/proceedings-toc/ euralex_2012/. Ruoff, Arno (1981): Häufigkeitswörterbuch der gesprochenen Sprache: alphabetisch, rückläufig alphabetisch und nach Häufigkeit geordnet. Tübingen (Idiomatica, 8). Schippan, Thea (1983): Lexikologie. In: Wolfgang Fleischer (Hg.): Kleine Enzyklopädie Deutsche Sprache. Leipzig, 273–307. Schippan, Thea (1992): Lexikologe der deutschen Gegenwartssprache. Tübingen. Schnörch, Ulrich (2002): Der zentrale Wortschatz des Deutschen. Strategien zu seiner Ermittlung, Analyse und lexikografischen Aufarbeitung. Tübingen. Schnörch, Ulrich (2005): Die Stichwortliste. In: Ulrike Haß (Hg.), 71–90. Schumacher, Helmut (1978): Grundwortschatzsammlungen des Deutschen. Zu Hilfsmitteln der Didaktik des Deutschen als Fremdsprache. In: Jahrbuch Deutsch als Fremdsprache 4, 41–55. Sinclair, John (1987): An Account of the COBUILD Project in Lexical Computing. London. Sinclair, John (1991): Corpus, Concordance, Collocation. Oxford. Sketch, Engine: (http://www.sketchengine.co.uk/?page=Website/SketchEngine ). Storjohann, Petra (2005): Das elexiko-Korpus. In: Ulrike Haß (Hg.), 55–70. Tschirner, Erwin (2005): Korpora, Häufigkeitslisten, Wortschatzerwerb. In: Antje Heine/Mathilde Hennig/Erwin Tschirner (Hg.): Deutsch als Fremdsprache – Konturen und Perspektiven eines Fach München, 133–149. Vachková, Marie/Cyril Belica (2009): Self-organizing lexical feature map. Semiotic interpretation and possible application in lexicography. In: Interdisciplinary Journal for Germanic Linguistics and Semiotic Analysis 13/2, 223–260. Wehrle, Hugo/Hans Eggers (1967): Deutscher Wortschatz. Ein Wegweiser zum treffenden Wort. 13. Aufl. Stuttgart. Wiktionary, das freie Wörterbuch: http://de.wiktionary.org/wiki/Wiktionary:Hauptseite . Winchester, Simon (1998): Der Mann, der die Wörter liebte. München. Wortschatzlexikon, Wortschatzportal: http://wortschatz.uni-leipzig.de/. Zertifikat Deutsch als Fremdsprache = Deutscher Volkshochschul-Verband/Goethe-Institut (Hg.) (1992): Das Zertifikat Deutsch als Fremdsprache. 2. Aufl. Bonn u. a. Zimmer, Dieter E. (1990): Wie viele Wörter hat der Mensch? In: Der Sprachdienst 34, 80–84.
Kerstin Leimbrink
2. Wortschatzerwerb Abstract: Der Wortschatzerwerb ist ein individueller und komplexer lebenslanger Prozess, der häufig mehrsprachig ist. Dieser Beitrag thematisiert entscheidende Erwerbsprozesse des Erst- und Zweitspracherwerbs vom Kleinkindalter bis zur Sekundarstufe unter Einbezug aktueller Forschungsergebnisse. Zunächst werden die Speicherung lexikalischen Wissens als Mentales Lexikon, wichtige Wortschatz erwerbstheorien, Möglichkeiten und Grenzen von Messungen sowie Faktoren, die den Wortschatzerwerb beeinflussen, dargestellt. Ausgehend von der vorsprachlichen Ausrichtung auf intonatorische Merkmale der Sprache erfolgt der Erwerb von Wortarten, Bedeutungen und Begriffen im Kleinkind- und Vorschulalter. Der schulische Wortschatzerwerb findet in den einzelnen Unterrichtsfächern statt. Im Folgenden wird für jede Erwerbsstufe der Einfluss von Schriftsprache und Lesefähigkeit dargestellt. Möglichkeiten funktionaler Wortschatzarbeit im Rahmen eines integrativen Unterrichts, der die Bereiche Wortschatz, Grammatik und Textkompetenz verbindet, werden für die (Vor-)schule diskutiert. 1 Wortschatzerwerb im Überblick 2 Wortschatzerwerb im Kleinkindalter 3 Wortschatzerwerb im Vorschulalter 4 Wortschatzerwerb in der Schule 5 Zusammenfassung 6 Literatur
1 Wortschatzerwerb im Überblick Fülle und Differenziertheit des Wortschatzes sind es, in denen sich die geistige und kulturelle Entwicklung einer Gemeinschaft spiegelt und die umgekehrt diese Entwicklung tragen (Klein 2013, 3).
Der Wortschatz und dessen vielfältige Kombinationsmöglichkeiten zeigen den lexikalischen Ausdrucksreichtum einer Sprache an. Beides entwickelt sich ständig weiter; neues Wissen wird im Wortschatz fundiert. Man unterscheidet zwischen einem kollektiven und einem individuellen Wortschatz einer Sprache. Da es schwierig ist, den Umfang des Wortschatzes einer Sprache zu beziffern – Wörterbücher weisen ein „stark verengtes Bild vom tatsächlichen Wortschatz und damit vom lexikalischen Ausdrucksreichtum einer Sprache“ auf (Klein 2013, 5) – differieren die verfügbaren Zahlen stark. Laut Duden-Universalwörterbuch liegt der kollektive Wortschatz
28
Kerstin Leimbrink
bei 150 000 Lexemen, nach dem Grimmschen Wörterbuch bei mehr als 500 000 Lexemen. Rechnet man die einzelnen Fachsprachen hinzu, kommt man auf mehrere Millionen Lexeme (Ulrich 2011, 33). Während der individuelle Mitteilungswortschatz eines Erwachsenen mit 10 000–20 000 Lexemen angegeben wird, ist der individuelle Verstehenswortschatz mit 40 000–100 000 Lexemen weitaus größer (Glück 2005, 31; Meibauer/Rothweiler 1999, 9) (vgl. Schnörch in diesem Band). Kinder mit deutscher Herkunftssprache aus bildungsnahen Familien erwerben vom Kindergartenalter bis zur Einschulung einen Mitteilungswortschatz von ca. 5000 Wörtern und einen Verstehenswortschatz von ca. 14 000 Wörtern. Mit ca. 15 Jahren hat ein Jugendlicher den Wortschatz eines Erwachsenen erreicht (Günther 2002). Für Lerner des Deutschen als Zweitsprache (DaZ) und insbesondere als Fremdsprache (DaF) kommt dem Wortschatzerwerb eine besondere Bedeutung zu, denn Fehler in der Lexik beeinträchtigen im Gegensatz zu Aussprache- oder Grammatikfehlern viel stärker die Verständigung (Köster 2001, 887). Studien zum kindlichen Wortschatzerwerb bezogen sich in den letzten 30 Jahren vorrangig auf die ersten Lebensjahre (Meibauer/Rothweiler 1999; Kauschke 2000; Clark 2003; Szagun 2013; s. Überblick bei Günther 2002, 169) und waren in der Regel auf Kinder mit englischer oder deutscher Herkunftssprache beschränkt. Für andere Erstsprachen wie z. B. Türkisch oder Russisch und/oder Schüler und Schülerinnen aus bildungsfernen Milieus fehlen vergleichbare Daten. Untersuchungen zum Wortschatzerwerb im Schulalter berücksichtigten vorrangig das Grundschulalter sowie 9. und 10. Klassen (Augst 1984; Pregel/Rickheit 1987; Willenberg 2008). In den letzten Jahren wurde vom Bildungsministerium in einigen Bundesländern der sog. Grundwortschatz (ca. 700 Wörter) für die ersten Schuljahre verbindlich eingeführt, um sprachliches Basiswissen von Grundschülern aufzubauen und zu verbessern. Er soll für das gegenwärtige Deutsch angeben, wie viele Wörter bekannt sein müssen, um – je nach Textsorte – mit möglichst geringem Lernaufwand zu einem möglichst hohen Textverständnis zu gelangen. Die Grundwortschatzliste dient in erster Linie als Basis für den Rechtschreibunterricht und soll bei Schreib- und Leseübungen sowie beim Hörverständnis eingesetzt werden. Der Grundwortschatz ist jedoch nur eine „didaktisch motivierte Auswahl aus dem lexikalischen System einer Sprache“ (Krohn 1992, 125). Die Grenzen erkennt man z. B. bei der Beurteilung eines Schülertextes. Hier muss die Lehrkraft neben der angemessenen Verwendung des textsortenspezifischen Wortschatzes auch sprachlich-stilistische Merkmale, orthographische und grammatische Korrektheit und die Selbständigkeit der Textproduktion kommentieren. Grundwortschatzsammlungen allein können also keine lexikalischen Probleme lösen, da erst die jeweilige situationsabhängige Verwendung und die Kombination mit anderen Ausdrücken einen angemessenen kommunikativen Gebrauch möglich machen.
Wortschatzerwerb
29
1.1 Mentales Lexikon Wie wird der Wortschatz eines Individuums gespeichert? Jeder Mensch verfügt – abhängig von individuellen sozialen Variablen – durchschnittlich über 50 000 lexikalische Einheiten. Eine lexikalische Einheit repräsentiert das damit bezeichnete Konzept, Informationen über Verwendungsbedingungen und Wortbedeutung sowie relevante syntaktische, lautliche und graphematische Eigenschaften. Lutzeier bezeichnet den Wortschatz eines Menschen als „mentale Speicherung von Wörtern beim Individuum, also der Wortschatz bezogen auf ein Individuum“ (1995, 3). Lexikalisches Wissen ist als mentales Lexikon im Langzeitgedächtnis netzwerkartig gruppiert, wobei lexikalische Einheiten nach folgenden Ordnungsprinzipen gespeichert werden: Sachfelder (enzyklopädisch), handlungsbezogene Frames und Scripts (lebensweltlich), Kollokationsfelder (usuell), Wortfelder, Wortfamilien (grammatisch), Bewertungsnetze (konnotativ), Assoziationsnetze (individuell) (Kühn 2007, 159). Im mentalen Lexikon sind „Bedeutung und Wortart wahrscheinlich keine separaten Bestandteile, die erst mit einander verknüpft werden müssen, sondern eine Einheit“ (Aitchison 1997, 128). Nach Aitchison enthält jedes Lemma sowohl sprachspezifische, semantische und syntaktische Informationen und bildet eine Art Mittler zwischen konzeptueller und phonologischer Ebene. Diese grundlegende Gliederung des mentalen Lexikons in einen lautlichen Bereich (Lexemebene) und einen nicht-lautlichen Bereich (Lemmaebene) gilt als gesichert (vgl. z. B. das Tip-of-the-Tongue-Phänomen) (Dietrich/Grommes/Weissenborn 2003, 892 ff.) (zu abweichenden Vorstellungen über das Mentale Lexikon siehe z. B. Paradis in diesem Band). Das Wort ist in der Erwerbsforschung vor allem etwas Kognitives (es gibt allerdings deutliche Schnittstellen zur Syntax, wohingegen die Graphie weniger relevant ist). Im Bereich der Zweitsprachenforschung ist man sich einig, dass sich das mentale Lexikon von Mehrsprachigen strukturell nicht von dem eines Muttersprachlers unterscheidet. Das Lernen von zweitsprachlichem Wortschatz wird vielmehr als ein Prozess der Übergeneralisierung bzw. Ausdifferenzierung be-zeichnet (Wolff 2000, 16 f.). Neue Wörter werden immer mit Rückgriff auf das vorhandene Welt- und Sprachwissen verarbeitet. Bei Deutsch als Fremdsprache-Lernern (DaF) ist nachgewiesen worden, dass bei der Modellierung eines neuronalen bilingualen Lexikons Erstsprache und Fremdsprache(n) interagieren, jedoch in separaten Netzwerken gespeichert sind (anders als beim Deutsch als Zweitsprache-Erwerb (DaZ) in den ersten drei Lebensjahren). Da in der westlichen Welt Fremdsprachen häufig in jugendlichem Alter gesteuert erworben werden, versucht man in der neueren Zweit- und Fremdsprachendidaktik begünstigende Faktoren des ungesteuerten Erwerbs auf den gesteuerten Erwerb zu übertragen. In der Schule verhilft insbesondere das (mehrsprachige) Lernen von Wortfeldern zu einem semantisch und syntaktisch vernetzten Lexikon.
30
Kerstin Leimbrink
1.2 Wortschatzerwerbstheorien Zu den wichtigsten Wortschatzerwerbstheorien zählen die Differenzhypothese, die Semantische Merkmalshypothese und die Funktionale Kernhypothese. Die Differenzhypothese wurde Ende der 60er Jahre des 20. Jh. dem amerikanischen Soziolinguisten Labov als kritische Reaktion auf die Defizithypothese von Bernstein (1976) zugeschrieben, wonach der Sprachgebrauch der Mitglieder der sozialen Unterschicht defizitär sei. Labov plädiert dafür, dass nicht bestimmte Sprachgebrauchsformen als normativer Maßstab genommen werden, sondern dass vielmehr das kommunikative Funktionieren und die spezifische Leistung einer Sprachform beschrieben werden soll. Dahinter steht die Auffassung, dass jede Sprachform an ihren jeweiligen Funktionsbereich angepasst ist (vgl. Labov 1969). Neuland (1976) führte zum Nachweis der Differenzhypothese mehrere Wortschatztests durch. Probanden im Alter von 5–6 Jahren wurden verschiedene Substantive, Verben und Adjektive genannt. Die Untersuchung bestätigte, dass sich in den Bedeutungsspektren der einzelnen Begriffe klassenspezifische Sprachunterschiede als Abbild der jeweiligen sozialen Realität widerspiegeln. Demnach gibt es im produktiven Wortschatz schichtenspezifische Repertoires. Die Semantische Merkmalshypothese, die vor allem von Clark (1973, 1983) geprägt ist, geht von dem lexikalisch-semantischen System einer Einzelsprache und seiner Struktur aus. Dabei konstituiert sich die Bedeutung eines Wortes aus einem Bündel semantischer Merkmale. Wörter werden als konventionell relativ fest gefügte Ausdrücke mit umgrenzten merkmalsanalytisch beschreibbaren Bedeutungen angesehen. Allgemeine Merkmale werden vor spezifischen erworben. Der Wortschatzerwerb wird in semantischer Hinsicht verstanden als der Erwerb von distinktiven semantischen Merkmalen, die mit der ausdrucksseitigen Trägerstruktur verknüpft sind. Kinder lernen zunächst reduzierte Bedeutungen, Teilmengen von Bedeutungsmerkmalen. Die Funktionale Kernhypothese, von Nelson 1974 veröffentlicht, ist das Gegenmodell zur Semantischen Merkmalshypothese. Angenommen wird eine symbolische Repräsentation im mentalen Lexikon des Lerners. Das Wissen um ein Objekt liegt in seiner Funktion. Der Erwerb erfolgt über eine schrittweise Spezialisierung der Wortbedeutungen durch Ausbau der distinktiven Merkmale und der lexikalisch-semantischen Struktur des Wortschatzes. Dies geschieht in Näherung an die konventionelle Ordnung in der Standard- bzw. Erwachsenensprache. Wörter werden als unscharf umrissene Gebilde verstanden. Nelson unterscheidet dabei zwischen semantischem Wissen (die Bedeutung, die Erwachsenen einer Äußerung zuschreiben) und Funk tionswissen (die funktionalen Konzepte der Kinder, die durch Handlungen und Ereignisse erworben werden und empirisch nachweisbar sind).
Wortschatzerwerb
31
1.3 Wortschatzerwerb messen Es gibt für das Deutsche wenig umfassende Untersuchungen zu lexikalisch-semantischen Kompetenzen, zum Umfang des mentalen Lexikons von Schüler und Schülerinnen und deren Auswirkungen auf sprachliches Lernen (Kleinbub 2011). Zahlenwerte sind oftmals Schätzungen, die auf relativ kleinen Stichproben basieren. Dagegen kamen experimentelle Methoden v. a. bei Tests zum Spracherwerb bzw. zu Sprachstörungen häufiger zum Einsatz. Bei diesen Tests spielen Wörter und Wortschatz allerdings nur eine untergeordnete Rolle (vgl. Albert/Marx 2010). Experimentelle Methoden wurden im Rahmen der lexikalischen Semantik genutzt, um die konzeptuelle Strukturierung, die Organisationsprinzipien sowie die mentale Repräsentation von Sprache zu erforschen und auf dieser Basis die Arten der Wissensrepräsentation im mentalen Lexikon zu erfassen. Um eine Einschätzung sprachlicher Fähigkeiten geben zu können, sollten jedoch neben dem Wortschatz weitere Indikatoren wie Syntax, Morphologie und Pragmatik hinzukommen und auch die Herkunftssprachen der Lerner einbezogen werden. Eine größere internationale Studie zum Wortschatz der 9. Jahrgangsstufe in Deutschland ist die DESI-Studie (Deutsch Englisch Schülerleistungen International) (DESI-Konsortium 2008). Ziel dieser Untersuchung war es, den Leistungsstand von Schüler und Schülerinnen zu messen und Erklärungsansätze für Unterschiede und damit Grundlagen für Interventionsmaßnahmen zu erarbeiten. Überprüft wurden die produktive und rezeptive Wortschatzbeherrschung. Als Itemtypen wurden isolierte Wortbedeutungen, Wörter und Redensarten in Sätzen und Kontexten sowie das Zuordnen von Sachfeldern anhand von Bildern gewählt. Das Untersuchungsmodell folgt einem Häufigkeitsansatz und unterscheidet drei Niveaus: Niveau A (häufig vorkommende Einträge im Grundwortschatz basierend auf dem Langenscheidt Grundwortschatz), Niveau B (häufigere Konkreta und Abstrakta, die nicht zum Grundwortschatz gehören) und Niveau C (seltenere Fach- und Fremdwörter sowie übertragene Redensarten, die zum Wissensgebiet von Neuntklässlern gehören können). Die Studie offenbarte, dass mehr als ein Drittel der getesteten Schüler und Schülerinnen häufig vorkommende Einträge des Grundwortschatzes nicht beherrschen (Kleinbub 2011, 504). Zusammenhänge offenbarten sich zwischen individuellem Wortschatzerwerb, besuchter Schulform, kulturellen Ressourcen der Familie, der Verwendung des Deutschen als Umgangssprache sowie zwischen Wortschatzerwerb und Erstsprache. Für Interventionsmaßnahmen richtungsweisend war zudem die hohe Korrelation der Wortschatzbeherrschung mit anderen Bereichen des Deutschunterrichts (Lesen, Sprachbewusstheit, Argumentation). Steinhoff schätzt die Ergebnisse der DESI-Studie als problematisch ein, da die sprachliche Handlungsfähigkeit und die Sprachbewusstheit der Schüler und Schülerinnen nicht hinreichend geprüft wurden. Für diagnostische Zwecke und zur Förderung schlägt er Modelle vor, bei denen der Wortschatz nicht vom Sprachhandeln entkoppelt wird (2013, 17), die vielmehr vom
32
Kerstin Leimbrink
Handlungscharakter des Wortes ausgehen, wobei Abgrenzungskriterien pragmatisch motiviert sind (s. dazu Kap. 4). Augst (1984) hat den aktiven Wortschatz von zehn Kindern kurz vor Schuleintritt untersucht und in einem Wörterbuch geordnet. Der Wortschatz wurde nach dem Sachwörterbuch von Wehrle/Eggers (1967) in 1000 Sachfelder aufgeteilt, die zu größeren Gruppen hierarchisch zusammengefasst sind. Die fachwissenschaftlichen Fragestellungen der Untersuchung bezogen sich auf Quantität, Wortschatzfelder, Wortstrukturen (z. B. Ableitungen, Zusammensetzungen) sowie Zusammenhänge zwischen Wortschatz und kognitiver und emotionaler Entwicklung. Daraus wurden didaktisch-methodische Fragen bezogen auf den schulischen Wortschatz abgeleitet: Auf welchen Wortschatz kann die Schule aufbauen? Wie sollte der Grundwortschatz aussehen? Augst versteht Wörter zum einen als Oberflächenphänomene der Parole/ Performanz, die im mentalen Lexikon gespeichert sind, zum anderen als solche, die im Augenblick der Rede syntaktisch durch Wortbildungsregeln erzeugt werden (sog. Augenblickskomposita oder -ableitungen wie z. B. schlum-pfen) (vgl. Römer in diesem Band). Augsts Studien zufolge liegt der aktive Wortschatz pro Kind im Durchschnitt bei 3900 Wörtern. Damit ist der Wortschatzumfang ungefähr doppelt so hoch wie die in der älteren Forschung durchschnittlich angegebenen Zahlen, vor allem die Steigerungsrate vom aktiv gebrauchten zum passiv verstandenen Wortschatz. Augst folgert, dass der aktive und auch der passive Wortschatz der Kinder heute allgemein größer sind als in der ersten Hälfte des letzten Jahrhunderts. Um Entwicklungsfortschritte beim Wortschatz- und Grammatikerwerb mündlicher Äußerungen und schriftsprachlicher Kenntnisse von Schüler und Schülerinnen besser erkennen und vergleichen zu können, hat Grießhaber (2009) sechs sog. Profilstufen entwickelt (s. Tab. 1). Mit den einzelnen Stufen korrelieren Entwicklungen beim Wortschatz sowie spezifische grammatische Bereiche (z. B. Flexion, Genus, Determination, Verbkomplexe, Tempus). Eine Profilstufe ist nach Grießhaber mit wenigstens drei einschlägigen Vorkommen erreicht. Das Profil eines Schülertextes oder einer mündlichen Äußerungsfolge kennzeichnet sich durch die höchste erreichte Profilstufe.
Wortschatzerwerb
33
Tab. 1: Profilstufen und Merkmale der Lernersprache, angelehnt an Grießhaber (2009, 129 ff.) Wortschatzentwicklung
Grammatikentwicklung
0. Wortschatzlücken
bruchstückhafte Äußerungen, Flexionsprobleme, ohne finites Verb
1. nicht hinreichender Wortschatz
Genus problematisch, finites Verb in einfachen Äußerungen
2. Grundwortschatz
Genus nicht gefestigt, Nominalgruppen mit Determinativ, Separierung finiter und infiniter Verbteile
3. Grundwortschatz
Mittel der Verknüpfung (z. B. durch Anaphern, Deiktika), Subjekt nach finitem Verb nach vorangestellten Adverbialen
4. entwickelter Wortschatz
komplexe Sätze, Anaphern, Abtönungspartikeln, Nebensätze mit finitem Verb in Endstellung
5. entwickelter Wortschatz
strukturell ausgebaute Sätze: Insertion eines Nebensatzes
6. entwickelter Wortschatz
strukturell ausgebaute Sätze: Insertion eines erweiterten Partizipialattributs
1.4 Faktoren, die den Wortschatzerwerb beeinflussen Zunächst unterscheidet man zwischen inneren und äußeren Faktoren. Zu den inneren Faktoren zählen das Alter und spezifische Kognitions- und Lernprozesse (z. B. kognitives Lernen vs. reflexives Lernen, Handmotorik). Zu den äußeren Faktoren zählen der sprachliche und nicht-sprachliche Input bzw. das (mehr-) sprachige Umfeld. Nach Ergebnissen von Menyuk/Liebergott/Schulz (1995) kann das Alter, in dem Kinder die wichtigen Meilensteine der Lexikonentwicklung erreichen, ein Indikator für spätere Sprachentwicklungsprobleme sein. Die kognitive Entwicklung spielt deshalb eine wichtige Rolle, da beim Wortschatzerwerb deklaratives Wissen angeeignet und die Kategorienbildung forciert wird. Gopnik/Choi (1995) konnten für die zweite Hälfte des zweiten Lebensjahres signifikante Zusammenhänge zwischen kognitiven und lexikalischen Entwicklungsschritten belegen. Nach ihren Ergebnissen zeichnen sich englisch sprechende Kinder im Vergleich zu koreanisch sprechenden Kindern durch ein früh expandierendes und differenziertes Vokabular an Nomen sowie eine frühere Bewältigung von Kategorisierungsaufgaben aus. Koreanische Kinder erweitern dagegen früher ihr Verbvokabular und schneiden in kognitiven Aufgaben zum Zweck-Mittel-Verständnis besser ab. Gefolgert wird daraus, dass Besonderheiten des einzelsprachspezifischen lexikalischen Inputs und daraus resultierend des kindlichen Lexikonerwerbs kognitive Interessen des Kindes lenken und damit den Zeitpunkt und die Reihenfolge des Erreichens korrespondierender kognitiver Entwicklungsschritte beeinflussen. Schaut man in diesem Kontext auf Lernprozesse in der Schule, ist dort das kognitive Lernen die klassische Lernform; das Wissen über
34
Kerstin Leimbrink
kommunikationsexterne Gegenstände wird weitestgehend konfrontativ vermittelt. Nach Hoffmann sollte Wissen jedoch nicht als etwas Fertiges transportiert, sondern durch mediales Lernen verankert werden, damit es von den Schüler und Schülerinnen produktiv genutzt werden kann. Geeignet sind Formen reflexiven Sprachlernens, dazu gehört die vertiefte, auf den inneren Dialog einer Person angewiesene Erweiterung von Erkenntnissen über einen in seiner Oberflächenstruktur bekannten Gegenstand, die sich eigener Erkenntnistätigkeit und ihrer Bedingungen versichert (Hoffmann 2013, 13).
Zu den äußeren Faktoren Input und Umfeld s. Kap. 2–5.
2 Wortschatzerwerb im Kleinkindalter Der Spracherwerb beginnt bereits in den ersten Lebensmonaten, wenn Bezugspersonen versuchen, eine erste Verständigung mit dem Kind über intonatorische Merkmale der Sprache herzustellen. Der Lexikonerwerb erfolgt dann interaktiv über die gemeinsame Aufmerksamkeitszuwendung von Erwachsenem und Kind auf einen Gegenstand, den die Bezugsperson dann benennt. Die Phase der Protowörter, wortähnliche Lauteinheiten mit zuordnenbarer fester Bedeutung in sich wiederholenden Kontexten, geht dem auf die Einzelsprache ausgerichteten Wortschatzerwerb voraus. Protowörter werden von der Umgebung verstanden und oft aufgegriffen, erst wiederholt, dann erweitert. Zunehmend werden die Protowörter den Wörtern der Muttersprache ähnlich. Den stärksten Einflussfaktor auf den Spracherwerb in den ersten vier Lebensjahren stellen Eltern-Kind-Interaktionen dar (Fernald/Weisleder 2011). In vielen Studien konnte gezeigt werden, dass entwickelte Sprechfähigkeiten in den ersten Lebensjahren für den weiteren Spracherwerb sehr bedeutsam sind. Bezogen auf den Wortschatzerwerb bedeutet dies: Unterschreitet der Umfang des produktiven Wortschatzes am Ende des zweiten Lebensjahres eine bestimmte Grenze, so gilt dies als Risikofaktor für den weiteren Spracherwerb (Szagun 2008). Ein Mindestumfang von 50 bis ca. 200 Wörtern wird benötigt, damit Zwei- und Drei-Wort-Sätze sinnvoll gebildet werden können und somit die syntaktisch-grammatikalische Entwicklung einsetzen kann. Hier konnte für den Altersbereich 16 bis 30 Monate ein starker Zusammenhang zwischen dem verfügbaren Wortschatz und der durchschnittlichen Äußerungslänge nachgewiesen werden (Bates/Goodman, 1999). Ein Kind muss also eine bestimme Masse (kritische Masse) an Vokabular hören, damit der Grammatikerwerb in Gang kommt, unabhängig von der zu erwerbenden Sprache. Befunde zeigen auch, dass Kinder, die im Alter von zwei Jahren bereits mehr Wörter schnell(er) erkennen, diesen Vorsprung im Alter von acht Jahren weiter ausgebaut haben (Marchman/Fernald 2008). Diese Prozesse der Worterkennung (häufige Ableitungsmorpheme und ihre
Wortschatzerwerb
35
syntaktische Funktion) und der Wortschatzumfang beeinflussen dann im Schulalter das flüssige Lesen. Können Kinder flüssig lesen, kann der Übergang zum Lernen durch das Lesen von Texten erfolgen. Das Kleinkindalter ist die Phase der nicht staatlich institutionalisierten Betreuung und Bildung und ist grundsätzlich gekennzeichnet durch wenig formalisierte Sprachförderung. Kinder sind in diesem Alter sozial und metakognitiv noch nicht in der Lage, einem strukturierten Unterricht zu folgen, sondern lernen Wörter in alltäglichen Situationen und Gesprächen mit ihren Bezugspersonen oder in Kontakt mit anderen Kleinkindern in vorschulischen Einrichtungen. Das wichtigste Merkmal dieses ungesteuerten Spracherwerbs ist informelles Lernen in der Dyade. Das erste Lebensjahr ist grundsätzlich geprägt von einem ungesteuerten rezeptiven Wortschatzerwerb. Dabei ist das Kleinkind zunächst „völlig an den buchstäblichen Ausdruck des von ihm angeeigneten Sinngehalts gebunden“ (Wygotski 1993, 120 ff.). Erste produktive Wortäußerungen entstehen gegen Ende des ersten Lebensjahres. Der Unterschied zwischen produktiv und rezeptiv beherrschten Wörtern ist in diesem Alter besonders groß: Während ein Kind mit ca. eineinhalb Jahren einen produktiven Wortschatz von ca. 18 Wörtern hat, beläuft sich sein Wortverstehen auf bis zu 100–200 Wörter (Clark 2003). Zu Beginn des Sprechens, wenn das Kind nur über einen sehr geringen Wortschatz verfügt, agiert es vornehmlich im Wahrnehmungsraum, in dem sprachliche Äußerungen durch Gesten wie Zeigen und Greifen unterstützt werden können. Mit zunehmendem produktivem Wortschatz nimmt die Einführung von Gesten stetig ab. Wortschatz- und Bedeutungserwerb sowie Begriffsbildung sind eng miteinander verwoben. Kleinkinder haben bereits nach ein- bis zweimaligem Hören eines Wortes eine Vorstellung von seiner Bedeutung (fast mapping). Erste Bedeutungsrepräsentationen werden nach und nach vervollständigt und ausdifferenziert. Nach Goldfield/Reznick (1996) liegt dem Wortschatzanstieg im zweiten Lebensjahr eine sprachspezifische Einsicht in die Benennbarkeit aller Dinge und in den Systemcharakter von Sprache zugrunde. Ein rapider Wortschatzzuwachs führt dazu, dass alle Entitäten in der Umgebung benannt werden können. Das Kind abstrahiert das allgemeine Prinzip, dass für jede Referenzklasse ein Wort steht, mit dem diese bezeichnet werden kann. In ihrer inhaltlichen Verwendung fallen die ersten 50 Wörter meist unter die Kategorien Personen, Essen, Körperteile, Kleidung, Tiere, Fahrzeuge, Spielzeuge, Haushaltsgegenstände, routinierte Handlungen oder Aktivitäten (Clark 1979). Mit dem Erreichen der 50-Wort-Schwelle wächst das produktive Lexikon um mindestens 12 neue Wörter pro Monat an. Im Alter von 1;5 bis 2;0 Jahren spricht man in diesem Zusammenhang von einem Vokabelspurt. Jedoch tritt dieser nicht bei allen Kindern auf (vgl. Clark 2003), ist also nicht zwingend notwendig für eine ‚normale’ Lexikonaneignung. Clark nimmt an, dass schon Kinder mit zwei Jahren in der Lage sind, einen Gegenstand bzw. einen Sachverhalt aus unterschiedlichen lexikalischen Perspektiven zu betrachten. Fehler in der Produktion zeigen sich im zweiten Lebensjahr oftmals bei der Genusmarkierung. Bei der Bildung des Plurals und des Partizip
36
Kerstin Leimbrink
Perfekt sowie bei der Kasusmarkierung im Akkusativ und Dativ treten Unsicherheiten häufig auch noch im Vorschulalter und später noch auf (Szagun 2013). Kauschke (2000) hat Ergebnisse einer empirischen Studie zum frühen Wortschatzerwerb für das Alter von 1–3 Jahren vorgelegt. Tabelle 2 gibt einen Überblick über die Gesamtzahl der gesprochenen Wörter (Token), die durchschnittliche Anzahl und die Streuung der verschiedenen (Types) sowie der insgesamt geäußerten Wörter. Deutlich werden das Auftauchen der ersten Wörter mit 13 Monaten, das deutliche Wortschatzwachstum von 15 bis 21 Monaten und die lexikalische Weiterentwicklung im Alter bis 36 Monate. Types und Token entwickeln sich im untersuchten Zeitraum nahezu proportional. Das bedeutet, dass Kinder, die viel sprechen, auch mehr unterschiedliche Wörter produzieren und über ein vielfältigeres Lexikon verfügen. Tab. 2: Wortschatzerwerb im Deutschen im Alter von 1–3 Jahren (Kauschke 2000, 118) Zeitpunkt
13 Mo
15 Mo
21 Mo
36 Mo
Gesamtzahl Types
82
187
649
2522
mean Types
2.56
5.84
20.28
78.81
range Types
0–10
0–16
0–54
10–138
SD Types
2.18
3.8
12.17
31.79
Gesamtzahl Token
302
556
1846
6411
mean Token
9.44
17.38
57.69
200.34
range Token
0–52
0–58
0–140
18–485
SD Token
10.66
12.89
36.00
104.18
Type-Token-Ratio
0.44
0.40
0.38
0.42
Nach Kauschke (2000) wird zunächst ein Alltagswortschatz erworben, Personen und Gegenstände der unmittelbaren Umgebung werden benannt. Clark (1970) konnte zeigen, dass semantisch zusammenhängende Wörter vor anderen erworben werden. Kinder ordnen demnach Wörter nach semantischen Feldern. Dabei gilt das Prinzip des Kontrastes: Jede Änderung der Form ist gleichzeitig eine Bedeutungsänderung. Clark (1970) teilt die Assoziationsverfahren nach zugrundeliegenden Regeln in paradigmatische (1–4) (vgl. Storjohann in diesem Band) und syntagmatische (5–6) (vgl. Belica/Perkun und Farø in diesem Band) ein: 1. Regel des minimalen Kontrastes: long – short, good – bad, 2. Regel der Tendenz von der Markiertheit zur Unmarkiertheit: better – good, dogs – dog, 3. Regel der Tilgung und Hinzufügung von Merkmalen (Super- und Subordination): apple – fruit, fruit – apple, 4. Regel der Erhaltung der Wortart, 5. Regel der Realisierung ausgewählter Merkmale: girl, child, man, 6. Regel der Vervollständigung fester Verbindungen: cottage – cheese.
Wortschatzerwerb
37
2.1 Der Erwerb von Wortarten In den ersten Lebensjahren dominiert der Zuwachs an Substantiven. Die hohe Präsenz von Substantiven ist entwicklungstheoretisch und erfahrungsabhängig begründet: Die ersten Substantive stammen aus dem Bereich der Konkreta der unmittelbaren Umgebung (Personen, Tiere, Fahrzeuge etc.). Substantive bilden ca. 65 % des gesamten Wortschatzes im Deutschen, sind demnach auch im Input, den das Kind hört, die frequentesten. Der Erwerb von Verben wächst langsamer, aber stetig an. Der Verbwortschatz geschieht onomasiologisch in Form der Ausdifferenzierung lexikalischer Felder. Die ersten Verben gehören zu den GAP-Verben (General All Purposes-Verben) wie machen oder tun. Voraussetzung für die Verfügbarkeit von Verben ist die Entwicklung einer raumbezogenen Zeitvorstellung. Dazu gehört zunächst die Bewusstheit der Objektpermanenz, später dann die Ausbildung allgemeiner Handlungsbegriffe. Während Substantive von Beginn an zielgerichtet verwendet werden und nur gelegentlich Merkmalsübertragungen festzustellen sind (z. B. Polizei für etwas, das grün ist) (Jeuk 2003), treten Überdehnungen im Bereich der Verben häufiger auf. Kostyuk (2005) kann mit zunehmender Beherrschung der Zweitsprache den vermehrten Gebrauch von Präfixverben, zunächst am häufigsten mit dem Verbstamm mach- feststellen. Sie formuliert im Bereich der Verbentwicklung eine qualitative Stufung, nach der bei ihren Probanden zunächst objektgerichtete Verben dominieren und mit zunehmendem Alter auch nicht-objektgerichtete Verben hinzukommen. Verben zum Ausdruck innerer Empfindungen werden später erworben. Kostyuk stellt bei den drei von ihr untersuchten Kindern mit Erstsprache Russisch fest, dass zunächst Bewegungsverben, dann Handlungsverben und schließlich weitere Verbformen erworben werden. Sie weist darauf hin, dass die Reihenfolge der Aneignung vom Input abhängig ist, da Regelwissen in Abhängigkeit von Häufigkeit und der Eindeutigkeit der notwendigen Informationen im Input aufgebaut wird. Im Alter von 3 Jahren verfügt das Kind über einen Verbwortschatz, der quantitativ mindestens genauso groß ist wie der der Substantive. Nach Jeuk (2003) eignet sich allein die Zunahme der Verben als Indikator für Aussagen über den Sprachstand, da bei allen anderen Wortklassen zu starke individuelle Unterschiede auszumachen sind. Adjektive stellen die letzte referenzsemantische Wortart im Erwerb dar, da sie aufgrund ihrer präzisierenden, perspektivierenden Funktion für das Kind zunächst weniger bedeutsam sind. Karasu (1995) kann bei Adjektiven einen starken, teilweise auch sprunghaften Anstieg feststellen. Er formuliert drei Stufen der Wortschatzentwicklung: Zunächst dominieren Nomina, dann nimmt der Anteil der Verben zu, bis schließlich der Wortschatz für qualitative Beurteilungen durch Adjektive erworben ist. Karasu nennt neben der Zunahme von Verben auch Adjektive und Adverbien als Indikatoren für einen fortgeschrittenen Wortschatzerwerb. Für das Deutsche finden sich nach Szagun (2013) bereits im zweiten Lebensjahr Artikel – früher als in anderen
38
Kerstin Leimbrink
Sprachen –, da diese auch pronominal verwendet werden können, und Präpositionen. Im dritten Lebensjahr folgen erste Pronomen. Zu der Frage, welche Wortarten im Kleinkindalter zu welchem Zeitpunkt des Lexikonerwerbs vertreten sind, führten Bates et al. (1994) eine Querschnittsstudie mittels Vokabularchecklisten durch. Während der Wortschatz im untersuchten Alterszeitraum von 1;4 bis 2;6 konstant anwächst, verändert sich die Proportion der Wortarten mit der Gesamtgröße. Jede Wortart wächst in einer bestimmten Phase an und erfüllt eine bestimmte Funktion. Jeuk (2003) beobachtet bei den von ihm untersuchten Kindergartenkindern mit der Erstsprache Türkisch, dass der prozentuale Anteil der Wortarten über den Untersuchungszeitraum von elf Monaten konstant bleibt (Substantive ca. 30 %, Verben ca. 20 %, Adjektive ca. 7 %, Lokative ca. 10 % und Pronomen ca. 15 %). Behrens (2005) zeigt den Zusammenhang von Rezeption und Produktion des kindlichen Wortschatzes. Die Verteilung der Wortarten ist im Sprachangebot von Erwachsenen zu zwei- bis fünfjährigen Kindern sehr homogen. Erwachsene nutzen stabile und hochfrequente Sprachproduktionsmuster und Kinder passen sich in den ersten Lebensjahren fast vollständig an die Verteilung des Inputs an. Behrens (2009) weist nach, dass bspw. der Erwerb der Kategorie Verb und damit der Eigenschaften von Verben (z. B. Projektion der Argumentstruktur, d. h. Art und Anzahl der Objekte) kein einheitlicher Prozess ist, da es sowohl sprachspezifische Unterschiede in der Zahl und Funktion von Verben als auch Kontraste innerhalb einer Sprache zwischen semantisch sehr spezifischen Verben gibt. Kinder präferieren also nicht von Anfang an eine bestimmte Argumentstruktur, sondern hören diese Verben in zahlreichen Verwendungskontexten und abstrahieren die Gemeinsamkeiten im Laufe ihrer Entwicklung. Folglich hängt die Gebrauchshäufigkeit von Wortarten stark vom Einfluss der Sprachumgebung ab.
2.2 Der Erwerb von Bedeutungen und Begriffen Vom ersten Gebrauch eines Wortes und seinen nachfolgenden Verwendungen bis zur Vollendung des zweiten Lebensjahres entstehen erhebliche Bedeutungsänderungen. Dazu müssen sprachlich relevante Einheiten (Morpheme und Wörter) im Input identifiziert werden, bevor semantisch-konzeptuelle mit lautlichen Repräsentationen verbunden werden und so ein Bedeutungsaufbau entstehen kann. Das Kind sucht dabei nach regelhaften Beziehungen zwischen unterschiedlichen linguistischen und nichtsprachlichen Beziehungen (z. B. Beziehungen zwischen prosodischer, lexikalischer und syntaktischer Struktur). Grenzen sprachlicher Einheiten werden erkannt, Phoneme besser unterschieden. Bis Kinder einen produktiven Wortschatz von ca. 100 Wörtern erreichen, treten häufig Überdehnungen auf (Clark 2003), was darauf hindeutet, dass Kinder zunächst nur Teilmengen von Merkmalsmengen erlernen. Überdehnungen basieren u. a. auf
Wortschatzerwerb
39
Gemeinsamkeiten der Kategorien Bewegung, Geräusch, Form und Textur. Nach Wygotski (1934/2002) geschieht dies um das zweite Lebensjahr herum häufig in Form von Komplexen. Die Begriffsentwicklung vollzieht sich von merkmalsärmeren Bedeutungen des Allgemeinen hin zu den Merkmalsanreicherungen des Besonderen. Der Einfluss erster literarischer und literaler Erfahrungen ist dabei sehr groß (Polz 2011, 367 f.). Im Alter bis zu drei Jahren erfolgt dann der Aufbau von Begriffsordnungen mit Ober- und Unterbegriffen. Neue Oberbegriffe lösen mit der Zeit Protowörter und -begriffe ab. Ein bewusster Umgang mit Ober- und Unterbegriffen ist jedoch erst im Vor- und Grundschulalter zu erwarten (Menyuk 2000). Kostyuk (2005) ermittelt die Reihenfolge des Erwerbs von Wortbedeutungen von Probanden in der Erstsprache Russisch und stellt fest, dass diese zwar abhängig von der Erwerbssituation ist, jedoch dem Erwerb des Deutschen als Erstsprache ähnelt. Zunächst werden die Handlungsfelder der unmittelbaren Umgebung semantisch besetzt (z. B. Essen, Kleidung, Körper, Spielsachen und Tiere). Abstrakta kommen später hinzu. Beim Ausdruck innerer Zustände geht die Versprachlichung der physiologischen Wahrnehmung der Versprachlichung kognitiver Vorgänge voran. Ausdrücke für Sinnestätigkeiten oder geistige Prozesse (wie z. B. denken, sagen, glauben) werden zunächst egozentrisch, später auch für die inneren Zustände anderer Personen verwendet. Rehbein (1984) untersucht die Erklärungsfähigkeit von türkischen Kindern mit der Zweitsprache Deutsch. Er beobachtet, dass insbesondere die Wortbedeutungen abstrakter Begriffe wie z. B. Arbeit, Freund oder Krieg bei türkischen Kindern häufig in beiden Sprachen unvollständig sind, was bei monolingualen Vergleichsgruppen nicht der Fall ist. Die daraus resultierende mangelnde Erklärungsfähigkeit dieser Kinder führt er jedoch nicht allein auf fehlendes Konzeptwissen zurück, sondern begründet dies mit einem unzureichenden Wortschatzerwerb.
3 Wortschatzerwerb im Vorschulalter In diesem Alter verläuft der Wortschatzerwerb in der Regel institutionell, d. h. der Erwerb ist bei dem Besuch einer vorschulischen Einrichtung gesteuert. Ein wichtiger Einflussfaktor für die Wortschatzentwicklung ist die Ausgangssituation des Sprachlerners. Internationalen Studien zufolge verbessert der Besuch einer vorschulischen Institution die Wortschatzentwicklung gegenüber der rein innerfamilialen Betreuung unabhängig von der Erstsprache (NICHD Early Child Care Research Network 2000). DaZ-Kinder mit Vorschulbesuch weisen in der Regel eine in beiden Sprachen ähnlich verlaufende Wortschatzentwicklung auf, in der die Zweitsprache Deutsch an den Lernprogress der Erstsprache gekoppelt ist. Außerdem findet bei ihnen eine Verschiebung zur Zweitsprache deutlich früher statt als bei Kindern ohne Vorschulbzw. Kindergartenbesuch. Kinder mit ausschließlich familiärer Vorschulerziehung
40
Kerstin Leimbrink
konzentrieren sich dagegen mit Beginn der Grundschule stärker auf die Aneignung der Zweitsprache, da sie vor der Einschulung vorwiegend mit der Erstsprache in Kontakt waren und ihr Niveau im Deutschen den Anforderungen der Schule anpassen müssen. Es kommt bei ihnen zu einer Vernachlässigung der Erstsprache, aber nicht zu deren Aufgabe (vgl. Ehlich/Bredel/Reich 2008). Schwierigkeiten im Erwerb von Vorschulkindern gründen häufig auf mangelndem phonologischen Bewusstsein, das vor allem in der Zweitsprache kaum ausgebildet ist. Defizite lassen sich zudem in verschiedenen grammatischen Bereichen (Übergeneralisierungen bei Pluralbildung, Partizip-Perfekt-Formen, Kasusgebrauch und Verwendung von Präpositionen). DaZLerner fügen für unbekannte Wörter häufig unbewusst Wörter aus ihrer Erstsprache ein oder verwenden statt eines Wortes bestimmte gestische und mimische Formen. Förderung: Für einen erfolgreichen Spracherwerb und die Verbesserung der Sprachkompetenzen bei drei- bis sechsjährigen Kindern sind nach Kiziak/Kreuter/ Klingholz (2012) drei Voraussetzungen von besonderer Bedeutung: ein möglichst früher und ausreichend langer Besuch einer Kindertagesstätte, zahlreiche, vielfältige Anregungen sowie häufige Sprechgelegenheiten im Alltag und gut qualifiziertes Personal. Wortschatzförderung steht im engen Zusammenhang mit der Förderung mündlicher Fähigkeiten und der Förderung von Literalität, womit bereits im Vorschulalter begonnen werden kann. Bei Mehrsprachigen kommt die Förderung der Erstsprache durch dieser Sprache mächtige Betreuer und Betreuerinnen hinzu. Ohne einen ausreichenden Wortschatz können die darauf aufbauenden Fähigkeiten (Literalität, Grammatik, Pragmatik/Kommunikation etc.) nicht erfolgreich erworben werden. Die Phase vor Eintritt in die Schrift wird auch als präliterale Phase bezeichnet. Hier bauen Kinder erste Konzepte von Lesen und Schreiben als Tätigkeiten auf, erkennen verschiedene symbolische Repräsentationen. Obwohl Lesen und Schreiben noch nicht systematisch unterrichtet werden, können Kinder mit grundlegenden kulturellen Praktiken vertraut gemacht werden. Auch kognitive Aspekte von literalen Handlungen können eingeführt werden (z. B. durch das Modellieren von Schreibhandlungen durch die Lehrpersonen). Diese kann bspw. vor einer Kindergruppe laut darüber nachdenken, was zu bedenken ist, wenn ein Text – wie z. B. ein Einkaufszettel – verfasst werden soll. Auf diese Art werden Vorschüler mit Grundfragen der konzeptionellen Schriftlichkeit vertraut gemacht. Auch die Förderung mündlicher Sprachfähigkeiten kann im Rahmen des Kindergartenalltags erfolgen. Große Bedeutung kommt dabei der Qualität der sprachlichen Anregung zu (Beller/Merkens/Preissing 2007). In einer Kindertagesstätte geben Erzieher und Erzieherinnen sprachliche Anregungen, initiieren vielfältige in den Alltag integrierte Sprechgelegenheiten, können auch Angebote in der Erstsprache machen. Ein basales Mittel sind dabei offene, sprachlich anregende Fragen zum gerade laufenden Geschehen wie auch gezielt hergestellte Sprechsituationen, in denen die sprachliche Kommunikation im Mittelpunkt steht, wie es bspw. bei Vorlesesituationen oder beim dialogischen Betrachten von Büchern der Fall ist. Dies hat insbesondere dann
Wortschatzerwerb
41
starke Wirkungen hinsichtlich Wortschatz, Bedeutungserwerb und allgemeiner kognitiver Entwicklung, wenn die Bilderbetrachtung mit einem kognitiv herausforderndem und analysierendem Gespräch verbunden wird. Fest steht, dass Kinder viele Wörter über das Lesen und Schreiben lernen können, wenn sie diese Handlungen im Kontakt mit kompetenteren Personen (älteren Kindern oder Lehrpersonen) erfahren. Bei all diesen Maßnahmen ist der Einbezug der Eltern in den Förderprozess besonders für Kinder mit verzögerter Sprachentwicklung und für Kinder aus sozial unterprivilegierten Familien bedeutsam. Ekinci (2011) gibt Anregungen für eine (institutionell durch Elternarbeit angeregte) funktionale Wortschatzförderung zu Hause: gemeinsames Erstellen von Spielplänen als Wochen- und/oder Monatspläne für das Kind (Memory, Puzzle, Kartenspiel), Auswahl geeigneter Spielmaterialen zur Sprachförderung sowie das gemeinsame Betrachten und Lesen mehrsprachiger Bilder- und Kinderbücher in der Familiensprache.
4 Wortschatzerwerb in der Schule Der Wortschatzerwerb in der Schule verläuft gesteuert. Kennzeichen eines gesteuerten Spracherwerbs ist institutionelles Lernen mit systematischem Unterricht in Grammatik und Wortschatz, in dem das sprachliche Regelsystem bewusst gemacht und korrigiert wird. Schulischer Wortschatzerwerb ist durch einen theoretischen Zugang in den einzelnen Unterrichtsfächern geprägt. Fachwissen und Wortschatzerwerb bedingen sich in jedem einzelnen Fach (s. Diskurs zur Bildungs- und Schulsprache bei Vollmer/Thürmann 2010). Schulbezogene Sprache zeichnet sich in Abgrenzung zu alltagsbezogener Sprache durch einen spezifischen Wortschatz aus, der der höheren Situationsentbundenheit geschuldet ist. Im Unterricht erfolgt eine Hinwendung zu schriftsprachlich geprägten Sprachhandlungsweisen. Die Auseinandersetzung mit den Themen und Gegenständen im Unterricht sowie die Vermittlung von fachspezifischen Begriffen, Konzepten und Kategorien erfolgen sowohl schriftlich als auch mündlich im Medium einer textgeprägten Sprache. In der Schule zeigt sich nach Steinhoff ein „Wortschatzmarathon“ (2013, 15). Schüler und Schülerinnen müssen sowohl mündlich wie schriftlich einiges über das Wort wissen, um Wörter korrekt verstehen und produzieren zu können. Steinhoff bezeichnet das Wort auch als „Schaltstelle sprachlichen Wissens“ (2013, 13). Dazu gehört phonetisch-phonologisches, graphematisch-orthografisches, morphologisches, syntaktisches, semantisches sowie pragmatisches Wissen. Jedes Wort lässt sich nach formalen Eigenschaften (Lautstruktur, Akzentstelle und Schreibung, Mengen von Formen), Funktionalität (Grundbedeutung und Gebrauchsweisen) und Kombinierbarkeit bzw. den möglichen kombinatorischen Bedeutungen beschreiben (Hoffmann 2013, 35 f.).
42
Kerstin Leimbrink
4.1 Wortschatzerwerb in der Grundschule Nach Wygotski (1993) ist ein Schulkind im Gegensatz zum Kleinkind bei der Wiedergabe eines komplizierten Sinngehalts weitgehend unabhängig vom verbalen Ausdruck, in dem es einen Inhalt aufgenommen hat. Im Grundschulalter entstehen Begriffssysteme, Beziehungen zwischen Gegenständen und Erscheinungen in Form von Über-, Unter- und Nebenordnungen von Begriffsklassen. Sensorische Begriffe werden dabei sicherer beherrscht als kategoriale. Das Wissen über Wesensmerkmale von Begriffen bedeutet auch, dass die Fähigkeit zu hierarchischen Textstrukturen mit der Grundschulzeit zunimmt (Polz 2011, 380). Je abstrakter und kategorialer ein Begriff ist, desto höher die Notwendigkeit der begriffsadäquaten Vermittlung. Erst in dem Maße wie Sprache sich von der realen Verwendungssituation ablöst, ist dem Kind die Bildung von Bedeutungen, d. h. auch der Aufbau von Wort- und Bedeutungsfeldern, möglich. Dieser Prozess beginnt bereits im Kleinkindalter (Clark 2003) und manifestiert sich um das 7. Lebensjahr, wenn das Kind verstärkt Konzepte zu Wortund Bedeutungsfeldern verknüpft (Augst/Bauer/Stein 1977). Spätestens mit dem Schuleintritt werden der Schriftspracherwerb, die Entwicklung der Lesefähigkeit und die Erfahrung sprachlicher Normierung (besonders) für Kinder mit schriftfernem Hintergrund relevant. Während bei Eintritt in die Grundschule der Umfang des Wortschatzes, die Verknüpfung der lexikalischen Einheiten und die Zugriffssicherheit höchst unterschiedlich ist (Polz 2011, 366), werden Schüler und Schülerinnen in jedem Schuljahr beim Lesen von Schulbüchern mit ca. 2000 neuen Wörtern konfrontiert (Apeltauer 2010, 10). Aufgrund der Differenz zwischen einzelnen Schüler und Schülerinnen kommt es zu einem Ungleichgewicht der Lernchancen: Wortschatzstarke Lerner können leichter Unterrichtsgespräche, Fachlektüre und Aufgabenstellungen bearbeiten, während wortschatzschwache Kinder – häufig solche mit nichtdeutscher Herkunft – dabei Probleme haben. Der in den IGLU- und PISA-Studien gefundene Rückstand der Schüler und Schülerinnen mit Migrationshintergrund beim Leseverstehen in der Zweitsprache hängt mit einem deutlich geringeren Umfang des Lexikons zusammen. Schaut man auf die Lehrpläne für die Primarstufe, gibt es nur wenige Bundesländer, die einen verbindlichen Grundwortschatz festlegen (Bsp. Bayern: 700 Wörter). Es wird zwar Sprache betrachten und reflektieren bzw. Sprache untersuchen gefordert, vorrangig werden dazu aber grammatische und orthographische Schwerpunkte gesetzt, die in den Sprachbüchern häufig durch bloßes Abschreiben eingelöst werden. Gerade im Unterrichtsbereich Reflexion über Sprache können Schüler und Schülerinnen für den Umgang mit dem entsprechenden Wortschatz sensibilisiert werden. Auch die Bereiche Schreiben und Lesen hängen eng mit dem Wortschatzerwerb zusammen. Über die Schriftsprache wird der Wortschatz erweitert, übertragene Bedeutungen werden erkannt, der Wortschatz der Kinder entwickelt sich individuell, auch in Abhängigkeit von eigenen Leseinteressen. Der Sprachbesitz muss neu geordnet werden. Dazu gehören Phonembewusstsein, die Fähigkeit der Segmentierung von
Wortschatzerwerb
43
Wörtern in Sprachlaute sowie das Erkennen der Phonem-Graphem-Korrespondenz, der Silbenstruktur und die Aneignung orthographischer Prinzipien (Polz 2011). Damit erfolgt ein besonderer kognitiver Schub, der mit veränderter Denktätigkeit, Veränderung des semantischen Zugriffs und der Struktur des mentalen Lexikons verknüpft ist. Einen Text zu produzieren ist eine komplexe Handlungseinheit, die Planungs-, Formulierungs- und Revisionskomponenten enthält. Mit der Schriftsprache bildet sich ein reicher Wortschatz aus. Unbestritten ist, dass der Schriftspracherwerb auch einen Einfluss auf die Entwicklung der Sprachbewusstheit hat. Unter Sprachbewusstheit versteht Andresen (1985) die systematische, kontrollierte Verfügbarkeit sprachlicher Einheiten/Merkmale. Für Hoffmann ist elementare Sprachbewusstheit das Wissen um Wörter und ihren Gebrauch, ihre Abgrenzbarkeit, die Möglichkeit über Wörter zu sprechen, mit ihnen zu spielen, sie anders auszusprechen, ihre Schriftform zu betrachten (2013, 13). Schaut man auf die Entwicklung der Lesefähigkeit, ist der Einfluss des Lesens auf die Wortschatzerweiterung und die Wortschatzvertiefung sehr groß. Intensives Lesen erweitert den Wortschatzumfang und die Prozesse der Worterkennung, was wiederum das flüssige Lesen verbessert. Lesefähigkeit wird häufig in der Schule gefördert, wohingegen Wortschatzförderung zu kurz kommt. Im Gegensatz zu den Fremdsprachen erfolgt im Deutschunterricht eine systematische Wortschatzarbeit jedoch eher selten, da man annimmt, jeder Schüler verfüge über genügend Grundwortschatz und Gelegenheit und Kenntnisse, diesen zu erweitern (Hecht 2013, S. 2).
Zum Erst- und Zweitspracherwerb von Grundschulkindern gibt es zahlreiche Arbeiten zum türkischen Wortschatzerwerb (Verhoeven/Boeschoten 1986; Karasu 1995). Diese Studien weisen nach, dass sich das Lexikon bilingual türkischer Kinder zwar insgesamt erweitert, sie jedoch im Vergleich zu ihren monolingualen Peers zu jedem Zeitpunkt ihrer Entwicklung über einen geringeren Wortschatz verfügen (Verhoeven/ Boeschoten 1986). Nach Karasu (1995) herrscht bei den niedrigeren Jahrgängen der Grundschule eine Dominanz des türkischen Wortschatzes vor, die in den folgenden Schuljahren durch eine Dominanz des deutschen Wortschatzes abgelöst wird. Häufig sind jedoch Wörter und Wortverbindungen im Fachunterricht unbekannt und werden nicht verstanden. Bleiben geeignete Fördermaßnahmen aus, verläuft der Wortschatz erwerb für Schüler und Schülerinnen mit Deutsch als Zweitsprache deutlich langsamer als bei Erstsprachenlernern (Apeltauer 2008, 243). In diesen Bereichen entstehen häufig Fehler (Tab. 3):
44
Kerstin Leimbrink
Tab. 3: Häufige Fehler bei DaZ-Lernern Wörter
Wortverbindungen
– Fremdwörter, Abstrakta, Fachbegriffe, Abkürzungen – Ober- und Unterbegriffe, Homonyme – Komposita – Verben mit komplexen Bedeutungsstrukturen – substantivierte Infinitive – Partizipialkonstruktionen – fachlich relevante Prä-/Suffixe – Partikeln
– Nominalisierungen – Funktionsverbgefüge – Stellung mehrteiliger Verbparadigmen in Hypotaxe und Parataxe
Förderung: Man unterscheidet bei der Förderung des Wortschatzes zwischen Wortschatzerweiterung und Wortschatzvertiefung. Wortschatzvertiefung zielt ab auf die Verfeinerung des Bedeutungsprofils bereits erworbener Sprachzeichen. Ziel von Wortschatzförderung ist die „zunehmende Wortschatzerweiterung und -vertiefung, was mit der Vermittlung von Sprachwissen, der Herausbildung von Fähigkeiten und Fertigkeiten und der Sensibilisierung für produktiven und rezeptiven Sprachgebrauch einhergeht“ (Polz 2011, 364). Nach Köster gibt es keinen allgemeinverbindlichen Wortschatz, vielmehr steht die Lernerorientierung (Brauchbarkeit, Verstehbarkeit, Lernbarkeit) im Vordergrund (Köster 2001, 889). Positiv für den Wortschatzerwerb ist alles, was die Beziehung zwischen Lernern, Wörtern und Bedeutungen stärken kann. Bei der Erstsemantisierung (um die Bedeutung von Wörtern zu erfassen, werden Wörtern z. B. durch Paraphrasen umschrieben) haben sich Erklärungsverfahren seitens der Lehrkraft als positiv erwiesen, die sowohl nichtsprachliche als auch sprachliche Verfahren (ein- und zweisprachig) einbeziehen. Für die Wortschatzförderung im Vorschul- und Grundschulalter schlägt Hoffmann mediales Lernen als Königsweg der Vermittlung von Zweitsprachen vor. „Kinder bedürfen gezielt weiterer Förderung, damit Begrifflichkeit und Wortschatz aufgebaut und komplexere, literale Sprachformen erworben werden“ (2013, 12). Geeignet sind Formen gemeinsamen Erzählens, Beschreibens, Nennens und Zeigens in Sprachspielen, die Basisfähigkeiten ansprechen und Grundkenntnisse der Vermittlungssprache Deutsch sichern sollen, dabei aber den Einbezug anderer Sprachen zulassen. Ein Erwerbsgerüst kann zunächst aus festen Formen (Liedern, Reimen, Rätseln, Witzen, Rateformen, Sprachspielen etc.) bestehen. Daran sollte sich Eigentätigkeit anschließen. Möglichkeiten der funktionalen Wortschatzarbeit sind Verfahren der Text-, Bewegungs-, Kultur- und Musikorientierung, die durchgängig mehrsprachig und kulturbezogen sind (Ekinci-Kocks 2011, 86). Nach Karasu (1995) bieten sich besonders die Domänen Schule und Tiere an. Daneben scheint die Domäne Freizeit mit Peers ebenfalls geeignet. Wird die Erstsprache als Lernhilfe in die Wortschatzvermittlung miteinbezogen, kann eine lexikalische Einheit vielfältiger im mentalen
Wortschatzerwerb
45
Lexikon vernetzt werden und damit besser abgerufen werden. Sprachen zu vergleichen fördert auch die Distanz zur eigenen Sprache. Bei den Lehrkräften setzt diese gezielte Förderung sprachliches Strukturwissen in mehreren Sprachen voraus. In der Grundschule bedeutet systematische Wortschatzarbeit, dass sowohl sprachsystematische Erkenntnisse als auch verstärkt kognitive und kommunikative Aspekte einbezogen werden, die kontextuell, situativ, in Sinnzusammenhängen eingebettet und möglichst textorientiert sind. Dazu sind vielfältige, anspruchsvolle Texte hilfreich, über die der rezeptive Wortschatz erweitert und vertieft wird. Schulische Wortschatzarbeit betrifft nicht nur Lexeme, sondern insbesondere Kollokationen und Konstruktionen, denen für das sprachliche Handeln eine hohe Bedeutung zukommt (vgl. Perkuhn/Belica in diesem Band). Über Kollokationen und Routineformeln finden Schüler und Schülerinnen auch Zugang zu komplexeren Redewendungen, ein wichtiger Indikator für die Beherrschung einer Sprache.
4.2 Wortschatzerwerb in der Sekundarstufe In den Standards für das Fach Deutsch (KMK) finden sich für die Sekundarstufe kaum explizite Bezüge zum Wortschatzerwerb. Der Wortschatzerwerb wird häufig als abgeschlossen angesehen und im Unterricht vernachlässigt. Im Fachunterricht verfügen aber viele Lerner nur über einen sehr begrenzten (Fach-)Wortschatz, suchen nach (Fach-)begriffen, haben Schwierigkeiten mit dem Lesen von Fachtexten und vermischen Alltags- und Fachsprache (Leisen 2013, 10). In der Sekundarstufe II wird zudem erwartet, dass Schüler und Schülerinnen „Wortschatz, Satzbau und poetische/stilistische/rhetorische Mittel eines Textes auf ihre Funktion und Wirkung hin beschreiben und untersuchen“ können (EPA 2002, 14). Dieser Zusammenhang zwischen Wortschatzerwerb und der Entwicklung grammatischer Fähigkeiten konnte in Studien nachgewiesen werden. Biehl bestätigt bei den von ihr untersuchten türkisch-deutschen Schülern des 7. Schuljahrs hohe positive Korrelationen zwischen den Ergebnissen eines Tests zum passiven Wortschatz und eines Tests zum Satzverständnis im Deutschen (1987, 88 ff.). Positive, wenn auch weniger stark ausgeprägte Korrelationen bestehen auch zwischen der Gesamtzahl verschiedener Wörter in den mündlichen Äußerungen und der durchschnittlichen Äußerungslänge (die man als eine Annäherung an syntaktische Komplexität sehen kann). Jeuk (2003) folgert daraus, dass eine quantitative Zunahme des Wortschatzes auch mit der Zunahme syntaktischer Kompetenzen korrespondiert. Förderung: Für die Sekundarstufe I wird in den Bildungsstandards ein integrativer Unterricht gefordert, der auf ein vernetztes Lernen verschiedenster Kompetenzen abzielt. Steinhoff (2009) entwickelt ein Modell zur integrierten Wortschatzarbeit (Abb. 1). Ziel ist es, Schüler und Schülerinnen sowohl abstrakte Gesprächs- als auch Textstrukturen und -funktionen konkret am Wort bzw. an Wortkombinationen vor
46
Kerstin Leimbrink
Augen zu führen und Wörter und Mehrwortausdrücke, die Schlüsselstellen des jeweiligen Erwerbsprozesses betreffen, erarbeiten zu lassen (Steinhoff 2013, 18). Sprache und Sprachgebrauch untersuchen
Wortschatz Sprechen und Zuhören
Schreiben
Lesen – mit Texten und Medien umgehen
Abb. 1: Integriertes Kompetenzmodell (Steinhoff 2009, 24)
Besonders im Bereich Sprache und Sprachgebrauch untersuchen zeigt sich in der Sekundarstufe die Bedeutung des Wortschatzerwerbs. Äußerungen und Texte müssen in vielfältigen authentischen Verwendungszusammenhängen reflektiert und bewusst gestaltet werden. Auf diese Weise entwickeln sich Ausdrucksalternativen. Der Wortschatz wird erweitert, bislang implizites Sprachwissen kommt zur bewussten Anwendung. Dazu eignen sich Wortfelduntersuchungen und auch das Thema Wortbildung. Feilke (2009) stellt für diesen Unterrichtsbereich den Zusammenhang von Wortschatzerwerb, Grammatik und Textkompetenz heraus. Er zeigt, dass es sinnvoll ist, Grammatik ausgehend vom Wort anstatt von grammatischen Regeln zu bearbeiten. So können Schüler und Schülerinnen z. B. lernen, dass Zeitlichkeit in Texten nicht nur mithilfe der Tempusformen, sondern auch mit lexikalischen Mitteln zum Ausdruck gebracht wird. Der funktionale Bezug sollte dabei immer den Kontext bilden. Die Funktionen von Wörtern, Wortarten und Sätzen werden untersucht und für das Sprechen, Schreiben und die Textuntersuchung und -produktion genutzt. Damit bleibt die Beschäftigung mit Grammatik nicht leere Formbetrachtung. Zu empfehlen sind auch Fördermaßnahmen im Bereich des Schreibens und Lesens. Für den Bereich Schreiben ist die Sekundarstufe I eine wichtige Phase zur Entwicklung basaler Schreibkompetenzen wie Beschreiben, Erklären, Instruieren und Argumentieren. Schreib- und Wortschatzentwicklung gehen Hand in Hand. So wird der Schreibprozess immer von Formulierungsüberlegungen begleitet. Schüler und Schülerinnen, die bspw. das Wort plötzlich und Wörter zur Inszenierung der Redewiedergabe bzw. Figurenrede angemessen verwenden können, haben damit lexikalische Werkzeuge zur Hand, um Spannung aufzubauen und einen „Planbruch“ (Quasthoff 1980, 27) zu realisieren. Schülern und Schülerinnen, die Positionierungsausdrücke wie ich finde und die ja/zwar…, aber beherrschen, stehen sprachliche Mittel zur Verfügung, mit denen sie in Argumentationen ihre Meinung explizieren, Gegenargumente
Wortschatzerwerb
47
und eigene Argumente aufeinander beziehen und gewichten können (Steinhoff 2013, 21). Ein verbreitetes Konzept zur Wortschatzförderung, das einem text-(-sorten) fundiertem Ansatz verpflichtet ist, ist der Wortschatzdidaktische Dreischritt nach Kühn (2010, 67). Er besteht aus den drei Phasen Semantisierung, Vernetzung und Reaktivierung: – Semantisierung (Rezeption): Die Schüler und Schülerinnen entdecken für sie neue lexikalische Einheiten in geeigneten sprachlichen Handlungskontexten (Gesprächen, Texten). – Vernetzung (Reflexion): Die Schüler und Schülerinnen sammeln, ordnen, variieren, ergänzen und untersuchen die lexikalischen Einheiten funktionsbezogen. – Reaktivierung (Produktion): Die Schüler und Schülerinnen verwenden neue lexikalische Einheiten eigenständig, kontextbezogen und adressatenorientiert in mündlichen und schriftlichen Produktionsaufgaben. Weitere Arbeitsformen, die den Wortschatzerwerb in der Sekundarstufe I und II unterstützen, sind die produktive Bearbeitung von Formulierungen in Dialogen und Texten, Sprachvergleiche (auch bezogen auf Dialekt, Alltagssprache, Standardsprache; Routineformeln in verschiedenen Sprachen und ihre wörtliche Bedeutung im Deutschen etc.) sowie traditionelle Wortschatzarbeit mit Wortfeldern, verschiedenen Formen der Flexion, Ober- und Unterbegriffen (vgl. Oomen-Welke/Bremerich-Vos 2014).
5 Zusammenfassung Die folgende Tabelle 4 fasst die wichtigsten Errungenschaften des Wortschatzerwerbs vom Kleinkind- bis zum Schulalter mit Blick auf wesentliche Merkmale der jeweiligen Sprachlernprozesse zusammen.
48
Kerstin Leimbrink
Tab. 4: Die Bedeutung des Wortschatzerwerbs von der frühen Kindheit bis zum späten Schulalter Wortschatzerwerb
Sprachlernprozess
Kleinkindalter (0–3 Jahre) – Aufbau des Lexikons in starker Abhängigkeit vom Sprachumfeld – Lexikonerwerb interaktiv über gemeinsame Aufmerksamkeitszuwendung – Wortschatzspurt – schnelle Zunahme des Wortverstehens und des produktiven Wortschatzes – zunächst Erwerb eines Alltagswortschatzes: Personen und Gegenstände der unmittelbaren Umgebung; semantisch zusammenhängende Wörter – schneller Zuwachs von Substantiven, späterer, langsamerer Zuwachs von Verben und Adjektiven – starker Zusammenhang zwischen verfügbarem Wortschatz und durchschnittlicher Äußerungslänge
– ungesteuert, nicht staatlich institutionalisierte Betreuung und Bildung – informelles Lernen in der Dyade – zunächst Orientierung an der prosodischen Struktur der Umgebungssprache/n – Erkennen von Regelhaftigkeiten im Input – Protowörter werden Wörtern der Muttersprache angeglichen – Agieren im Wahrnehmungsraum – erste Vorstellung von Wortkonzepten
Vorschulalter (3–6 Jahre) – Wortschatzerweiterung durch alltägliche Gespräche mit Peers und Erwachsenen – Wortschatzerweiterung durch dialogisches Betrachten von Büchern in Verbindung mit kognitiv herausforderndem und analysierendem Gespräch – Verarbeitung neuer Wörter mit Rückgriff auf vorhandenes Welt- und Sprachwissen – erste Erfahrungen mit Schriftsprache
– überwiegend gesteuert, in der Regel institutionell – Förderung mündlicher Ausdrucksfähigkeiten durch sprachliche Anregungen und vielfältige Sprechgelegenheiten – Aufbau erster Konzepte von Lesen und Schreiben als Tätigkeiten – Vertrautmachen mit kulturellen Praktiken des Lesens und Schreibens
Grundschulalter – institutionsbedingte Wortschatzzunahme durch fächerspezifischen Wortschatz – Prozesse der Worterkennung und Wortschatzumfang beeinflussen flüssiges Lesen (= Beginn des Lernens durch Texte) – ausreichender Wortschatz ist Voraussetzung für aufbauende Fähigkeiten (Literalität, Grammatik, Pragmatik/Kommunikation) – schulbezogener Wortschatz beinhaltet höhere Situationsentbundenheit – Wortschatzerwerb ermöglicht Aneignung von Fachwissen
– gesteuert, institutionell – theoretischer Zugang in den Unterrichtsfächern – Grundlagen für die an Schriftsprache orientierte Unterrichtssprache – Ausprägung der Schriftsprache und der Lesefähigkeit – Lesefähigkeit beeinflusst Wortschatzerweiterung und- vertiefung – Schriftsprache bildet aus, erweitert und individualisiert Wortschatz – Entwicklung von fachsprachlichen Formen und textgeprägter Sprache
Wortschatzerwerb
49
Tab. 4: (fortgesetzt) Wortschatzerwerb
Sprachlernprozess
Sekundarstufe – Erwerb von (Fach-)Wortschatz und Fachbegriffen durch Fachtexte – Unterscheidung Alltags- und Fachsprache – Wortschatzerweiterung durch Erarbeitung vielfältiger Ausdrucksalternativen, Textanalyse, Textproduktion und Sprachvergleiche (auch Dialekt, Alltagssprache, Standardsprache)
– gesteuert, institutionell – starker Zusammenhang von Wortschatzerwerb, Grammatik, Textkompetenz und Schreibentwicklung
DaZ-/DaF-Lerner – domänenspezifischer Wortschatzerwerb – abhängig vom sprachlichem Umfeld zunächst in der einen oder anderen Sprache besser ausgeprägt – bei Vorschulbesuch ähnlich verlaufende Wortschatzentwicklung in Erst- und Zweitsprache
– durch Einbeziehung der Erstsprache können lexikalische Einheiten der Zweitsprache besser abgegrenzt und vernetzt werden – bei DaF-Lernern Modellierung eines neuronalen bilingualen Lexikons bei Speicherung in separaten Netzwerken
6 Literatur Aitchison, Jean (1997): Wörter im Kopf. Eine Einführung in das mentale Lexikon. Tübingen (Konzepte der Sprach- und Literaturwissenschaft, 56). Andresen, Helga (1985): Schriftspracherwerb und die Entstehung von Sprachbewusstheit. Opladen. Apeltauer, Ernst (2010): Wortschatz- und Bedeutungsvermittlung durch Anbahnen von Literalität. Flensburg (Flensburger Papiere, 53). Apeltauer, Ernst (2008): Wortschatzentwicklung und Wortschatzerwerb. In: Bernt Ahrenholz/ Ingelore Oomen-Welke (Hg.): Deutsch als Zweitsprache. Hohengehren (Deutschunterricht in Theorie und Praxis, 9), 239–251. Augst, Gerhard (1984): Der aktive Wortschatz der Schulanfänger. Erste Ergebnisse eines Forschungsprojekts. In: Wirkendes Wort 34/2. Frankfurt a. M., 88–101. Barrett, Martyn D./Margaret Harris/Joan Chasin (1991): Early lexical development and maternal speech: a comparison of children’s initial and subsequent uses of words. In: Journal of Child Language 18, 21–40. Bates, Elizabeth u. a. (1994): Developmental and stylistic variation in the composition of early vocabulary. In: Journal of Child Language 21/1, 85–124. Bates, Elizabeth/Judith Goodman (1999): On the emergence of grammar from the lexicon. In: Brian MacWhinney (Hg.): The Emergence of Language. Mahwah, New Jersey, 29–79. Behrens, Heike (2009): Konstruktionen im Spracherwerb. In: Zeitschrift für germanistische Linguistik 37/3, 427–444. Behrens, Heike (2005): Wortarten-Erwerb durch Induktion. In: Clemens Knobloch/Bernhard Schaeder (Hg.): Wortarten und Grammatikalisierung: Perspektiven in System und Erwerb. Berlin, 177–197.
50
Kerstin Leimbrink
Beller, Kuno/Hans Merkens/Christa Preissing (2007): Erzieherqualifizierung zur Erhöhung des sprachlichen Anregungsniveaus in Tageseinrichungen für Kinder – eine Interventionsstudie. Berlin. Bernstein, Basil (1976): Studien zur sprachlichen Sozialisation. Düsseldorf. Bredel, Ursula (2008): Literale Basisqualifikationen I und II. In: Konrad Ehlich/Ursula Bredel/Hans Reich (Hg.), 137–162. Clark, Eve V. (2003): First Language Acquisition. Cambridge. Clark, Eve V. (1979): The Ontogenesis of Meaning. Essen. Clark, Eve V. (1970): How young children describe events in time. In: Giovanni B. Flores d’Arcais/ Willem J. M. Levelt (Hg.): Advances in Psycholinguistics. Amsterdam, 275–284. DESI-Konsortium (Hg.) (2008): Unterricht und Kompetenzerwerb in Deutsch und Englisch. Ergebnisse der DESI-Studie. Weinheim/Basel. Dietrich, Rainer/Patrick Grommes/Jürgen Weissenborn (2003): Psycholinguistik. Ein internationales Handbuch. Berlin/New York (Handbücher zur Sprach- und Kommunikationswissenschaft (HSK), 24), 892–909. Ehlich, Konrad/Ursula Bredel/Hans Reich (Hg.) (2008): Referenzrahmen zur altersspezifischen Sprachaneignung. Berlin (BMBF-Reihe Bildungsforschung, 29/2). Ekinci-Kocks, Yüksel (2011): Funktionaler Wortschatz für Kinder mit Deutsch als Zweitsprache: Wortschatzvermittlung in Elternhaus, Kindergarten. Hohengehren. Feilke, Helmuth (2009): Wörter und Wendungen: kennen, lernen, können. In: Praxis Deutsch 36, 4–13. Fernald, Anne/Adriana Weisleder (2011): Early language experience is vital to developing fluency in understanding. In: Susan B. Neuman/David K. Dickinson (Hg.): Handbook of Early Literacy Research. Bd. 3. New York/London, 3–19. Glück, Christian W. (2005): Kindliche Wortfindungsstörungen. Ein Bericht des aktuellen Erkenntnisstandes zu Grundlagen, Diagnostik und Therapie. 3. Auflage. Frankfurt a. M. u. a. Goldfield, Beverly A./Steven J. Reznick (1996): Measuring the vocabulary spurt: a reply to Mervis & Bertrand. In: Journal of Child Language 17, 171–183. Gopnik, Alison/Soonja Choi (1995): Names, relational words and cognitive development in English and Korean speakers. In: Michael Tomasello/William Merriman (Hg.): Beyond Names of Things: Young children’s Acquisition of Verbs. Hillsdale (New Jersey), 63–80. Grießhaber, Wilhelm (2009): L2-Kenntnisse und Literalität in frühen Lernertexten. In: Bernt Ahrenholz (Hg.): Empirische Befunde zur DaZ-Erwerb und zur Sprachförderung. Freiburg, 115–135. Günther, Klaus-B. (2002): Probleme der Diagnostik lexikalisch-semantischer Strukturen. In: Manfred Grohnfeldt (Hg.): Störungen der Semantik. 2. Aufl. Berlin (Handbuch der Sprachtherapie, 3), 167–195. Hecht, Pavla (2013): Wortschatzarbeit im Deutschunterricht der Unterstufe. Norderstedt. Hoffmann, Ludger (2013): Deutsche Grammatik. Grundlagen für Lehrerausbildung, Schule, Deutsch als Zweitsprache und Deutsch als Fremdsprache. Berlin. Jeuk, Stefan (2003): Erste Schritte in der Zweitsprache Deutsch. Freiburg. Karasu, Ibrahim (1995): Bilinguale Wortschatzentwicklung türkischer Migrantenkinder vom Vor- bis ins Grundschulalter in der Bundesrepublik Deutschland. Frankfurt a. M. Kauschke, Christina (2000): Der Erwerb des frühkindlichen Lexikons: Eine empirische Studie zur Entwicklung des Wortschatzes im Deutschen. Tübingen. Kiziak, Tanja/Vera Kreuter/Rainer Klingholz (2012): Dem Nachwuchs eine Sprache geben. Was frühkindliche Sprachförderung leisten kann. Berlin.
Wortschatzerwerb
51
Klein, Wolfgang (2013): Von Reichtum und Armut des deutschen Wortschatzes. In: Deutsche Akademie für Sprache und Dichtung und Union der deutschen Akademien der Wissenschaften (Hg.): Reichtum und Armut der deutschen Sprache. Berlin, 15–56. Kleinbub, Iris (2011): Empirische Forschungsansätze im Bereich Wortschatzkompetenz. In: Inge Pohl/Winfried Ulrich (Hg.): Wortschatzarbeit. Baltmannsweiler (Deutschunterricht in Theorie und Praxis, 7), 503–506. Köster, Lutz (2001): Wortschatzvermittlung. In: Gerhard Helbig u. a. (Hg.): Deutsch als Fremdsprache. Bd. 2. Berlin/New York, 887–893. Kostyuk, Natalia (2005): Der Zweitspracherwerb beim Kind. Eine Studie am Beispiel des Erwerbs des Deutschen durch drei russische Kinder. Hamburg. Krohn, Dieter (1992): Grundwortschätze und Auswahlkriterien: metalexikographische und fremdsprachendidaktische Studien zur Struktur und Funktion deutscher Grundwortschätze. Göteborg. Kühn, Peter (2010): Sprache untersuchen und erforschen. Grammatik und Wortschatzarbeit neu gedacht. Berlin. Kühn, Peter (2007): Rezeptive und Produktive Wortschatzkompetenzen. In: Heiner Willenberg (Hg.): Kompetenzhandbuch für den Deutschunterricht. Baltmannsweiler, 159–167. Kulturministerkonferenz der Länder (2002): Einheitliche Prüfungsanforderungen in der Abiturprüfung Deutsch (EPA). Beschluss vom 01.12.1989. (http://www.kmk.org/dokumentation/ veroeffentlichungen-beschluesse/bildung-schule/allgemeine-bildung.html ‹15.9.2014›). Labov, William (1969): The Study of Nonstandard English. National Council of Teachers of English. Washington DC. Leisen, Josef (2013): Sprachsensibler Fachunterricht und Sprachförderung im Fachunterricht – ein Weg der Ausbildungsvorbereitung. In: Christian Efing (Hg.): Ausbildungsvorbereitung im Deutschunterricht der Sekundarstufe I. Die sprachlich-kommunikativen Facetten von „Ausbildungsfähigkeit“. Frankfurt a. M., 343–368. Lutzeier, Peter Rolf (1995): Lexikologie. Tübingen. Marchman, Virginia A./Anne Fernald (2008): Speed of word recognition and vocabulary knowledge in infancy predict cognitive and language outcomes in later childhood. In: Development Science 11, 9–16. Meibauer, Jörg/Monika Rothweiler (Hg.) (1999): Das Lexikon im Spracherwerb. Tübingen. Menyuk, Paula (2000): Wichtige Aspekte der lexikalischen und semantischen Entwicklung. In: Hannelore Grimm (Hg.): Sprachentwicklung. Enzyklopädie der Psychologie, C, III, 171–190. Göttingen. Menyuk, Paula/Jaqueline W.Liebergott/Martin C. Schulz (1995): Early Language Development in Full Term and Premature Infants. Hillsdale. Neuland, Eva (1976): Sozio-ökonomische Differenzen im Sprachverhalten von Vorschulkindern. In: Deutsche Sprache 1, 51–72. Wiederabdruck in: Wilhelm Brinkmann (Hg.): Erziehung – Schule – Gesellschaft. Bad Heilbrunn, 1980, 62–79. NICHD Early Child Care Research Network (2000): The relation of child care to cognitive and language development. In: Child Development 71/4, 960–980. Oomen-Welke, Ingelore/Albert Bremerich-Vos (2014): Sprache und Sprachgebrauch untersuchen. In: Michael Becker-Mrotzek u. a. (Hg.): Bildungsstandards aktuell: Deutsch in der Sekundarstufe II. Braunschweig. Polz, Marianne (2011): Wortschatzarbeit in verschiedenen Schulstufen: Grundschule, Sek. I, Sek II. In: Inge Pohl/Winfried Ulrich (Hg.): Wortschatzarbeit. Baltmannsweiler (Deutschunterricht in Theorie und Praxis, 7), 363–399. Pregel, Dietrich/Gert Rickheit (1987): Der Wortschatz im Grundschulalter: Häufigkeitswörterbuch zum verbalen, substantivischen und adjektivischen Wortgebrauch. Hildesheim.
52
Kerstin Leimbrink
Quasthoff, Uta M. (1980): Erzählen in Gesprächen. Tübingen. Rehbein, Jochen (1984): Beschreiben, Berichten und Erzählen, In: Konrad Ehlich (Hg.): Erzählen in der Schule. Tübingen, 67–124. Steinhoff, Torsten (2013): Wortschatz – im Zentrum von Sprachgebrauch und Kompetenzförderung. In: Steffen Gailberger/Frauke Wietzke (Hg.): Handbuch Kompetenzorientierter Deutschunterricht. Weinheim/Basel, 12–29. Steinhoff, Torsten (2009): Wortschatz – eine Schaltstelle für den schulischen Spracherwerb? Siegen (Siegener Papiere zur Aneignung sprachlicher Strukturformen, 17), 1–66 Szagun, Gisela (2013): Sprachentwicklung beim Kind. Ein Lehrbuch. 4. Aufl. Weinheim. Szagun, Gisela (2008): Spracherwerb beim Kind: Was ist normal, was nicht? In: Kinder- und Jugendarzt 39, 6–8. Ulrich, Winfried (2011): Das Verhältnis von allgemeiner Sprachkompetenz und Wortschatzkompetenz. In: Inge Pohl/Winfried Ulrich, W. (Hg.): Wortschatzarbeit. Baltmannsweiler, 127–132. Verhoeven Ludo/Boeschoten, Hendrik (1986): First language acquisition in a second language environment. In: Applied Psycholinguistics 7, 241–255. Vollmer, Helmut J./Eike Thürmann (2010): Zur Sprachlichkeit des Fachlernens: Modellierung eines Referenzrahmens für Deutsch als Zweitsprache. In: Bernt Ahrenholz (Hg.): Fachunterricht und Deutsch als Zweitsprache. 2. Aufl. Tübingen, 107–132. Wehrle, Hugo/Hans Eggers (1967): Deutscher Wortschatz. Stuttgart. Willenberg, Heiner (2008): Wortschatz Deutsch. In: DESl-Konsortium (Hg.): Unterricht und Kompetenzerwerb in Deutsch und Englisch. Ergebnisse der DESI-Studie. Weinheim, 72–80. Wolff, Dieter (2000): Wortschatzarbeit im Fremdsprachenunterricht: Eine kognitivistische konstruktivistische Perspektive. In: Peter Kühn (Hg.): Wortschatzarbeit in der Diskussion. Hildesheim, 99–124. Wygotski, Lev S. (1993): The Collected Works of L. S. Vygotsky. Volume 2: The Fundamentals of Defectology. New York. Wygotski, Lev S. (1934/2002): Denken und Sprechen. Weinheim/Basel.
Torsten Siever
3. Das Wort in der Netzkommunikation Abstract: Die Wörter der deutschen Sprache können unterteilt werden in Lexeme, die der Standardsprache angehören und in Lexeme, die typisch sind für bestimmte Varietäten, d. h. beispielsweise für Fachsprachen, Dialekte oder Soziolekte. Im vorliegenden Beitrag geht es um den Wortschatz des Internets, womit zweierlei gemeint ist, nämlich sowohl der Wortschatz, mit welchem über das, als auch der, mit dem im Internet kommuniziert wird. Im Vordergrund steht in diesem Beitrag letzterer: Exemplarisch werden verschiedene Merkmale einer Wortschatzverwendung an mehreren digitalen Kommunikationsformen nachvollziehbar analysiert. Dieser Analyse vorangestellt sind die theoretische Betrachtung von Varietetätenwortschätzen und die methodische Ermittlung von spezifischen Wortschätzen, wobei aufgezeigt wird, wo die Probleme einer grundlegenden Herangehensweise liegen. In empirischen Analysen zeigen sich beim Wortschatzvergleich ebenso Unterschiede wie Gemeinsamkeiten. Inwiefern die Annahme von Subvarietäten gerechtfertigt ist, muss zwar offen bleiben, doch erscheint eine solche vor dem Hintergrund einer breiten lexikalischen Basis als wenig gerechtfertigt. 1 Vorbemerkungen 2 Wortschätze und Varietäten 3 Methodische Herausforderungen 4 Messung von Varietätenwortschätzen 5 Fazit 6 Literatur
1 Vorbemerkungen Der digitalen Kommunikation, insbesondere der privaten im Internet und der mobilen, werden vor allem seit 1996 (Bechar-Israeli 1996, Haase u. a. 1997) besondere Merkmale zugeschrieben. Zu den auffälligsten Phänomenen sind zahlreiche Arbeiten entstanden (zu Smileys etwa Püschel 2013, zu Inflektiven wie *seufz* und *lach* Teuber 1998, Schlobinski 2001, Henn-Memmesheimer/Eggers 2010, zu Nicknames Bechar-Israeli 1996 etc.). Dem Wortschatz – und damit sei auf eine lexikalische Spezifik ebenso verwiesen wie auf lexikalische Diversität und Polarität – ist hingegen bislang nur wenig Aufmerksamkeit gewidmet worden. Grundlage für die nur rudimentär vorhandenen Aussagen zum ‚Internet-Wortschatz‘ bilden die oftmals relativ kleinen Zusammenstellungen von Kommunikaten oder qualitative Analysen (Androutsopoulos 2010), in denen unter anderem ‚auffäl-
54
Torsten Siever
lige‘ Lexik herausgefiltert worden ist (Haase u. a. 1997, Runkehl u. a. 1998, Moraldo 2009 etc.), oder es standen Phänomene wie Mehrsprachigkeit/Code-Switching (Androutsopoulos 2007) bzw. Dialektgebrauch (Siebenhaar 2006, Müller 2011) im Vordergrund. Besonders Chats sind vielfach untersucht worden, da sie die auffälligsten Merkmale, oder besser: die stärksten Abweichungen von der geschriebenen Standardsprache aufwiesen. Inzwischen steht vor dem Hintergrund zahlreicher und unterschiedlich verwendeter digitaler (Internet)-Kommunikationsformen fest, dass Aussagen über die ‚Sprache des Internets‘ inklusive der verwendeten Lexik nur differenziert erfolgen können: Eine internetspezifische Sprachvarietät (unter Varietät versteht man eine bestimmte Ausprägung einer Sprache, die z. B. durch regionale, soziale, situative Faktoren beeinflusst wird, beispielsweise die medizinische Fachsprache) existiert ebenso wenig wie eine einheitliche alters- oder berufsspezifische. Dennoch weist die Gesamtheit der Sprachhandlungen im Internet einen Wortschatz auf, der in genau dieser Zusammensetzung in anderen Kommunikationsformen nicht vertreten ist. Dies ist weder neu noch überraschend, sondern den unterschiedlichen Entitäten und Handlungen geschuldet und entspricht dem Wortschatz anderer Bereiche wie dem der Medizin (CT, Hämatom, Fraktur) oder dem des Sports (Handicap, Peloton und generell Kriegsmetaphorik wie kämpferisch, Verteidigung, s. etwa Schlobinski 2011). Doch selbst im Bereich des Sports kann weder von einer homogenen Varietät noch von einer uniformen Lexik gesprochen werden, da Sportarten unterschiedliche Gerätschaften, Ziele, Aktivität und Strategien verfolgen und von unterschiedlichen Menschen betrieben werden (Einzel- vs. Mannschaftssportarten, Leichtathletik vs. Radsport vs. Fußball vs. Golf etc.). Statistisch signifikante lexikalische Einheiten lassen sich dennoch isolieren. Eine erste Herangehensweise an die Wortschätze von Varietäten kann in der Sichtung des deutschen Wortschatzes nach Sachgruppen (Dornseiff 2004) bestehen. In Bezug auf die Sachgruppe Internet (19.18) werden dort ausschließlich solche Lexeme aufgeführt, die auf die Technologie, Software, Kommunikationsformen und äußerst grundlegende Handlungen im Internet referieren (ibid., 157) – im Dornseiff ausschließlich Lexik genannt, mit der mit Dürscheid (2004, 143) über das Internet kommuniziert wird, also auf Objekte und Handlungen rund um das Internet referiert wird („Terminologie“ also, s. dazu Roelcke in diesem Band), z. B.: Datenautobahn · Web · WWW · Hyperlink · Hypertext · Internetbrowser · Internetportal · Internetseite · Suchbegriff · Suchmaschinen · URL-Adresse · Web-TV · Webbrowser · Webcam · Website · Retrieval · Firewall · Internetprotokoll · Internetserver · Multiplexer · Netzknoten · Onlineanbieter · Werbebanner · E-Mail · Mailbox · Internetzeitalter · Webtransaktion · chatten · einloggen · surfen (gekürzt aus Dornseiff 2004, 157)
Über ein Drittel der insgesamt 148 Lemmata weist dabei die Wortbildungskonstituente Internet auf (54), 18 sind durch online modifiziert, 12 durch Web. Als netzspezifische morphologische Basen dienen lediglich Banking, Browser, Community, Highway, Link, Mail, Master, Portal, Provider, Retrieval, Server, Shop/Shopping/Shopper, Site,
Das Wort in der Netzkommunikation
55
Surfer, User; hinzu kommen das Simplex chatten und das Derivat einloggen sowie die spezifischen Reduktionsformen Cam, URL, Mail und das gebundene E- für ‚electronic/ elektronisch‘. Überraschend ist lediglich das Lexem Multiplexer, das als einziges rein fachsprachlich, also von Standardsprechern kaum passiv verstanden oder gar aktiv verwendet werden dürfte; im Kernkorpus des Digitalen Wörterbuchs der deutschen Sprache (DWDS) ist es denn auch – anders als viermalig Retrieval – nicht gelistet (nur das Multiplex als Kinoformat). Über den Wortschatz, der im Internet verwendet wird, gibt das Wörterbuch von Dornseiff keinerlei Auskunft. Lediglich einloggen, chatten und surfen können hierzu mittelbar gezählt werden. Es fehlen aber belegte Ausdrücke wie Nerd, LOL, AFK, DM etc. – um nur einige nicht-terminologische Wörter zu nennen. Ein großer Teil der Sprachkritik richtete und richtet sich aber gegen die Terminologie, also den fachsprachlichen Wortschatz, der auf Objekte und Handlungen rund um das Internet referiert (vgl. auch Jansen 2005, 156 f.), mitunter unscharf getrennt und geäußert als Kritik an der Sprachkompetenz resp. am Sprachgebrauch innerhalb der Kommunikationsformen im Netz. Die zentrale Frage in Bezug auf den im Internet verwendeten Wortschatz ist also, ob dieser signifikant von anderen Varietätenwortschätzen abweicht und ob er in diesem Fall ‚schlechter‘ oder reduzierter ist. Ergebnisse hierzu werden in Abschnitt 4 dargestellt, auf methodische Herausforderungen wird in Abschnitt 3 eingegangen. Im sich anschließenden Abschnitt 2 werden notwendige Definitionen und Einordnungen vorangestellt.
2 Wortschätze und Varietäten Was ein Wortschatz ist und woraus er besteht, darüber wurde bereits in den Vorbemerkungen eine erste Vorstellung vermittelt (vgl. auch Schnörch in diesem Band). Um eine Definition nachzureichen: Der Wortschatz kann als die Menge aller Wörter einer Einzelsprache zu einem spezifischen Zeitpunkt beschrieben werden. Unberücksichtigt bleiben bei einer solchen Definition der individuelle (idiolektale) Wortschatz, der zwischen wenigen Tausend und mehreren Zehntausend Wörtern liegen kann (vgl. Knipf-Komlósi u. a. (1997, 207) und Best (2006, 15)), ebenso wie all diejenigen Wörter, die keinen eindeutigen Status in der Einzelsprache besitzen (Wörter anderer Sprachen), okkasionelle Wortbildungsprodukte (Autosaugmaschine), veraltete (assentieren ‚zustimmen‘), feminine Derivate (Clownin) etc. Varietätenwortschätze sind spezifische (in mind. einem Fall zu unterscheidende) Wortschätze von Varietäten (als Sprachsysteme; s. Ammon 1995, 64). Solche Varietäten lassen sich hinsichtlich verschiedener Kriterien einordnen. Veith (2002, 27) klassifiziert die „Kommunikationstypen“ hinsichtlich außersprachlicher Faktoren
56
Torsten Siever
(Varietät), Objekten/Aktivitäten (Fachsprache), der sozialen Bindung (Sondersprache) und Situation (mit spezieller Lexik als Jargon, ohne spezielle Lexik als Register bezeichnet; vgl. auch Löffler 1994). Die genannten Fachbegriffe werden im vorliegenden Beitrag nicht weiter ausgeführt, da die Arbeit mit dem Varietätenbegriff hinreichend ist. Üblich ist die Aufteilung des Varietätenraumes nach Coseriu (2007) mindestens in diaphasisch (situativ geprägt), diastratisch (soziokulturell) und diatopisch (regional). Alle Ausprägungen spielen bei Sprachhandlungen im Internet inklusive der spezifischen Wortschätze eine Rolle: Ko- und Kontext des Individuums während der Textproduktion, seine regionale Herkunft (Dialektlexik) und seine Sozialisation (Elternhaus, Schule, Freundeskreis). In der eingangs vorgenommenen Wortschatzdefinition wurde der Aspekt der Zeit als Kriterium genannt. Wortschätze unterliegen im temporalen Verlauf, also in Bezug auf sprachliche Wandelprozesse, relativ starken Veränderungen und viel weitreichenderen als etwa die Grammatiken; Kasus oder Flexive sind stabiler und kognitiv viel tiefer verankert als lexikalische Einheiten. Einzelne Wörter hingegen lassen sich vergleichsweise leicht einem Wortschatz hinzufügen, in ihrer Bedeutung ändern oder aufgeben (vgl. Pfefferkorn in diesem Band). Die Wortschatzerweiterung oder -veränderung kann von ‚außen‘ (Integration von Fremdwörtern) oder ‚innen‘ (Bedeutungswandel) kommen (vgl. Riehl in diesem Band). Für den vorliegenden Beitrag ist insbesondere die Wortschatzerweiterung von ‚außen‘ und hier wiederum der Bereich der Anglizismen relevant. Entwicklung des Genitivs von Internet 100% 80% 60%
Internets
40%
Internet
0%
1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
20%
Abb. 1: Grad der Integration von Internet im zeitlichen Verlauf am Bsp. des Gen. Sg. Quelle: http://dwds.de/?qu=%22 %40des+Internet%22 (ZEIT-Korpus 1994–2013), bereinigt um Eigenenamen wie Internet Explorer, Internet Archive etc.
Am Anglizismus Internet lässt sich exemplarisch anhand des ZEIT-Korpus des DWDS zeigen, dass dieser Integrationsprozess zeitlich aufwändig sein kann und durch das Erscheinen eines Wörterbuchs wie des DUDENs (2013) oder hinsichtlich der orthogra-
Das Wort in der Netzkommunikation
57
fischen Integration natürlich durch eine Rechtschreibreform stark beeinflusst wird (Abbildung 1). Der Begriff der inneren Entlehnung wird nicht nur für die semantische Integration fremder Wörter verwendet, sondern auch für die Übernahme von lexikalischen Einheiten aus Varietäten derselben Sprache, sei es aus Dialekten, Soziolekten, Fachsprachen oder andere Subklassen (vgl. Abbildung 2).
...
total, toll Werbesprache
Jugendsprache
DNS
Fachsprache (Chemie) in n
t l e h nu ng
Pressesprache
En
PC, Malware
Fachsprache (Medizin)
Standardsprache
in n
DE
Karzinom, Grippe
?Fachsprache (IT)
Sportsprache
ere Entlehnung
Abseits, Halbzeit (half-time) ...
Schwellwertverfahren, Multiplex, Raytracing
ere
äuß
e re E ntle
ng h nu
EN
Abb. 2: Einzelsprache, Gemeinsprache, Varietäten und Schnittmengen (schematisch; IT-Fachsprache weist bspw. viele weitere Schnittmengen auf)
Hieraus lässt sich folgern, dass k(aum )eine Varietät tatsächlich isoliert und eindeutig abzugrenzen ist. Die Werbesprache mag ihre besondere Funktion haben, statistisch auffällig viele Superlative wie auch Komparative ohne Komparation, und doch deckt sie sich größtenteils mit der Gemeinsprache (von Headlines und Slogans abgesehen). Sie bedient sich nicht nur des Standardwortschatzes, sondern auch desjenigen von Fachsprachen (Drehmoment, Antioxidantien), wenn auch teilweise (bewusst) falsch. Die Ursachen für die Übernahme von Wörtern, aber auch für die der Aussprache, der syntaktischen Verwendung und der Morphologie sind vielfältig. Von eminenter Bedeutung ist natürlich die Relevanz der jeweiligen Gegenstandsbereiche, etwa im Bereich der verschiedenen Fachsprachen; die lebenserhaltende Medizin berührt die Sprachgemeinschaft (zurzeit) mehr als die lebensbereichernde Chemie oder lebenserklärende Physik. Die neuen Technologien, vor allem die Informationstechnologie
58
Torsten Siever
(IT), formen – beruflich wie privat – die Mediengesellschaft dermaßen, dass sie ohne entsprechende Aufnahme der grundlegenden Terminologie gar nicht mehr handlungsfähig wäre. Wichter (1998, 1177) schätzte schon 1998 den IT-Wortschatz auf rund 25 000 Wörter. Grundlage für die Schnittmengen ist der Sprachkontakt, sei er direkt (Gespräche mit Ärzten, Migranten, ausländischen Arbeitnehmern) oder indirekt (medial oder medienvermittelt). Da die Gesellschaft heute in räumlich-politischer Hinsicht offener denn je ist und Menschen unterschiedlichster Herkunft, Berufe und Varietäten in Kontakt treten, unterliegt auch der Wortschatz stärkeren Veränderungen als in weniger international geprägten Gesellschaften (und auch das grammatische System, s. die Szenarien in Stickel 2013). Geht man von der Internationalisierung und Egalisierung des Wortschatzes aus, hat dies auch Auswirkungen auf den Varietätenbegriff. Je schwächer regionale und natürlich auch soziokulturelle Grenzen ausfallen, desto schwieriger ist es, eine Varietät anzusetzen.
3 Methodische Herausforderungen Um Aussagen über den Wortschatz einer Sprache oder Varietät wie der des ‘Internets’ treffen zu können, bedarf es aussagekräftiger realer Sprachdaten, also eines repräsentativen Korpus. Korpora der deutschen Sprache sind zahlreich, solche der digitalen Kommunikation im Internet hingegen rar, zumindest im korpuslinguistischen Verständnis (umfangreich, repräsentativ). Die Ausnahme bilden vereinzelte Kollektionen, die überwiegend auf gecrawlte, d. h. mit einem Programm automatisch abgespeicherte Webseiten zurückgehen (vgl. auch Lemnitzer 2010, 71), etwa die der Wikipedia. Zu nennen sind hier einige Teilkorpora des Projekts Deutscher Wortschatz der Universität Leipzig, die auf den Korpusseiten einsehbar und herunterladbar sind (http://corpora.informatik.uni-leipzig.de/download.html). Neben den Daten aus der deutschsprachigen Wikipedia (2007, 2010) findet sich auch ein Crawl aus dem Jahr 2002 (sowie weitere in anderen Sprachen). Ein Deutsches Referenzkorpus zur internetbasierten Kommunikation (DeRiK) ist angekündigt (Beißwenger u. a. 2013). Das Digitale Wörterbuch der deutschen Sprache (DWDS) der Berlin-Brandenburgischen Akademie der Wissenschaften oder das Deutsche Referenzkorpus (DeReKo) des IDS Mannheim in Kooperation mit den Universitäten Stuttgart und Tübingen eignen sich vor allem als Referenzkorpora der geschriebenen Sprache, weil sie einen repräsentativen Querschnitt geschriebener standardsprachlicher Texte enthalten. Da sie allerdings standardsprachlich sind, stellen sie nicht unbedingt eine Vergleichsbasis für private digitale Kommunikation dar. Auch wenn diese ebenfalls schriftlich realisiert ist, zeichnet sie sich oft durch Dialogizität und Nähesprachlichkeit aus. Daneben existieren Korpora der gesprochenen Sprache (u. a. beim IDS, DWDS). Sprachlich sind die dort zu findenden Transkripte konzeptionell ebenfalls in Richtung Nähesprachlich-
Das Wort in der Netzkommunikation
59
keit zu verorten, doch sind die Kommunikate ursprünglich nicht graphisch realisiert, sondern phonisch (vgl. Koch/Oesterreicher 1994, Dürscheid 2006). Diesem Dilemma der fehlenden Vergleichsbasis ist korpuslinguistisch kaum zu begegnen – es hat aber gerade deshalb die Faszination in der Sprachwissenschaft für den Gegenstand Internetkommunikation ausgelöst. Besteht wie im vorliegenden Beitrag das Ziel in der Beschreibung von Merkmalen einer Varietät (oder gar in der Isolierung einer Varietät), so kann dies nur empirisch zielführend sein. Im Folgenden werden verschiedene Herausforderungen im Bereich der Methodik skizziert, einerseits in Bezug auf Varietätenwortschätze allgemein, andererseits jedoch auch spezifisch in Bezug auf Varietätenwortschätze im Internet. Der Sprachgebrauch von Jugendlichen und die Sprache der Anzeigenwerbung sind zwei Beispiele für häufig(er) untersuchte Kommunikation, an der deshalb zwei grundsätzliche empirische Voraussetzungen aufgezeigt werden sollen. Bei der einen lassen sich die Sprachhandelnden eingrenzen, man definiert sie als die Gesamtheit aller Jugendlichen, beispielsweise als Personen zwischen 12 und 19 Jahren. Bei der anderen sind die zu untersuchenden Sprachhandlungen bestimmbar, etwa durch alle mündlichen und schriftlichen Sprachhandlungen, die für werbliche Anzeigen typisch sind. Wer allerdings personell dieser Gruppe zuzuordnen ist, wer also die Sprachproduzenten sind, ist weitaus schwieriger zu bestimmen als bei der ersten. Geht man von Varietäten aus, so ist die eine Varietät also durch die Handelnden gerahmt, die andere durch die Produkte; bei der einen besteht die Schwierigkeit in der Auswahl der Sprachhandlungen, bei der anderen in der Berücksichtigung der Handelnden. In der Regel stellen sich nicht nur diese beiden Probleme, sondern weitere mehr. Setzt man beispielsweise ein Konstrukt wie „Internetsprache“ oder „Netspeak“ (Crystal 2001) als Varietät an, so war man im Jahr 2013 mit einer im Vergleich zu Jugendlichen erheblich heterogeneren Gruppe konfrontiert. Sie bildet eine Gruppe, die einen Internetzugang hat; in Deutschland sind dies immerhin 80,2 Prozent aller Haushalte (s. http://www.mediensprache.net/994). Zudem unterliegt die Gruppe immer noch starken Änderungen: In der Vergangenheit waren es eher wohlhabende männliche Nutzer, in der Zukunft werden es tendenziell alle Einwohner Deutschlands (eben auch Jugendliche) sein. Neben den Sprachhandelnden sind aber auch die Sprachhandlungen nicht unproblematisch zu bestimmen: Schon bei Jugendlichen ist eine repräsentative Zusammenstellung nicht trivial (konkrete beobachtbare Gespräche, Fanzines, Statusmeldungen), doch welches sind die Sprachhandlungen der Gruppe der Internetnutzenden? Facebook und YouTube dürften unstrittig sein, doch sind Webchats noch üblich, gehören mobile Apps dazu sowie Kommunikation, die durch smarte Geräte wie Fernseher oder Wearables vermittelt wird? Und schließlich ist die Frage wichtig, wie sich mittels geeigneter Verfahren (Randomisierung) eine repräsentative Stichprobe dieser Kommunikation erstellen lässt. Wie lassen sich die Kommunikationsformen angemessen erfassen und wie ist die Fusion von „semiotischen Ressourcen“ (Androutsopoulos 2010, 433) inklusive der hybriden, multimodalen und intertextuellen bzw. intersemiotischen Bestandteile zu behandeln? Solche
60
Torsten Siever
Fragen stellen sich insbesondere bei der Analyse von Kommunikaten von SocialNetworking- (Facebook, LinkedIn) und Social-Sharing-Plattformen (YouTube, Flickr) und im Hinblick auf die Synthese unterschiedlicher Datentypen und Datenquellen im Rahmen von API-basierten Webanwendungen (sueddeutsche.de, migipedia.ch). Kommentare in solchen Social-Web-Plattformen mögen den initialen Sprachbestandteilen geringfügig angepasst sein (Alignment), doch handelt es sich bei ihnen trotzdem um idiolektale Handlungen mit unterschiedlichem Stil, Einstellungen, Bewertungen etc., die sich zudem funktional und damit ebenfalls sprachlich mitunter gravierend von der initialen Handlung unterscheiden (können). Zudem liegen auf einem Großteil der Webseiten – von Social-Networking-Seiten abgesehen – keine Daten über die Textproduzenten vor, sodass ein Abgleich mit der Grundgesamtheit aussichtslos erscheint; im besten Fall gibt es einen Nutzer- oder Realnamen, der in der Regel jedoch kaum mehr als auf das Geschlecht und allenfalls das Alter schließen lässt (z. B. SchönER1983). Ein weiteres Problem besteht darin, dass sich zwar dank des sogenannten Social Webs jeder Internetnutzer an der Kommunikation und Textproduktion beteiligen kann, doch entspricht dieses theoretische Prinzip keinesfalls der Realität (vgl. Busemann/Gscheidle 2011). Vielmehr zeigt sich in verschiedenen Kommunikations(platt-)formen, dass die aktiven Nutzenden lediglich einen geringen Prozentsatz ausmachen. Für die meisten Social-Web-Plattformen gilt die 90:9:1-Regel: 90 % der Nutzenden sind sogenannte Lurker, welche lediglich Inhalte rezipieren und niemals eigene produzieren, 9 % der Nutzenden tragen ab und zu Inhalte bei und lediglich 1 % der Nutzenden (sogenannte Heavy User) ist für die Mehrzahl aller Inhalte verantwortlich (vgl. Griesbaum 2013: 567). Dies entspricht der sogenannten Long-Tail-Verteilung, die empirisch für Kommentare in der Fotocommunity Flickr belegt werden konnte. In Studien, die auf großen Datenbasen beruhen (so genannte Big-Data-Studien), muss deshalb transparent gemacht werden, über welche Grundgesamtheit man Aussagen trifft: Analysiert man sämtliche Inhalte einer Plattform, so können zwar Spezifika einer bestimmten Community herausgearbeitet werden. Solche Ergebnisse enthalten allerdings aufgrund der 90:9:1-Regel idiolektale Eigenheiten von Heavy Usern. Soll eine Aussage über den Sprachgebrauch aller aktiven Nutzenden einer Community getroffen werden, müssen bei der Korpuszusammenstellung entsprechend von allen Nutzenden gleich viele Kommunikate berücksichtigt werden. Nach der Erhebung eines solchen Korpus muss es für die Analyse mit Metadaten versehen werden. Hier treten bei der digitalen privaten Kommunikation insbesondere im Bereich der Lemmatisierung (und des automatischen Taggings, s. u.) von Wortformen erhebliche Schwierigkeiten auf, da sich diese Kommunikation unter anderem durch (lexikalische) Kreativität, Toleranz gegenüber Rechtschreibfehlern und lautnahe Graphie (inkl. Mundartschreibung) auszeichnet: Nacht wird alternativ homophon N8 geschrieben, freu alternativ froi (oder reduziert f) und Zürich in der Schweiz Züri und schauen natürlich luege etc. Doch nicht einmal alle lexikalischen Varianten regionaler Standardvarietäten sind in den zugrunde liegenden Wörterbüchern erfasst. In der Folge der Fehl- bzw. Nichterkennung lexikalischer Einheiten kann also
Das Wort in der Netzkommunikation
61
der Lemmatisierer nicht korrekt arbeiten, was zu Fehlern bei der Wortschatzeinschätzung führt – Fehler addieren sich. Vorschläge, wie die Lemmatisierung konkret verbessert werden kann, finden sich bei Würzner/Lemnitzer (in diesem Band). Liegt das Interesse nicht im „Varietätenraum“ Internet, sondern darin, ein ‚sprachliches Mittel‘ der im Internet zu findenden verbalen Kommunikation zu analysieren, so ist man mit dem DECOW-Korpus (Schäfer/Bildhauer 2012) gut beraten. Repräsentativ ist dies vermutlich nicht, aber bislang liegen keine Daten über den Anteil an der nicht öffentlich zugänglichen Kommunikation vor. Um also eine Aussage darüber treffen zu können, ob die Kommunikation im Internet über lexikalische Spezifika verfügt und ob folglich eine Internetvarietät existiert, müssen einerseits auch nicht öffentlich zugängliche Kommunikate in die Analysekorpora aufgenommen werden, andererseits müssen Teilkorpora nach den einzelnen Kommunikationsformen gebildet und separat im Hinblick auf Gemeinsamkeiten und Unterschiede ausgewertet werden. Im Folgenden wird auf eine eigene empirische Untersuchung zurückgegriffen, für die ein Korpusmix verwendet wurde, bestehend aus SMS-Mitteilungen als frühe digital übermittelte Kommunikate, Chats, Tweets, Kommentaren auf der Fotocommunity Flickr, Kommentaren zur massenmedialen Berichterstattung, einer Newsgroup (de. etc.sprache.deutsch) sowie Wikipedia-Artikel und Newsticker als Vergleichsbasis. Im Abschnitt 4 soll nun überprüft werden, ob die Annahme korrekt ist, dass sich kein (nennenswerter) spezifischer Wortschatz im Internet findet. Zudem wird erläutert, wie diese Frage empirisch beantwortet werden kann. Die Ergebnisse, die hier präsentiert werden, basieren auf einer empirischen Studie.
4 Messung von Varietätenwortschätzen Die Bestimmung eines Wortschatzes ist seit langem wissenschaftliche Absicht und Praxis. So kann beispielsweise etwas über die Sprachkompetenz eines Sprechers (in lexikalischer Hinsicht) ausgesagt oder überprüft werden, ob in bestimmten situativen Kontexten, in Domänen wie Wissenschaft, Wirtschaft oder Filmkultur, bei bestimmten Textsorten oder Gruppen wie jungen oder alten Menschen ein spezifischer Wortschatz verwendet wird. Um über diese Fragen etwas aussagen zu können, muss nicht nur überlegt werden, wie ein Wortschatz „messbar“ ist, sondern auch, welche statistischen Mittel herangezogen werden müssen, um signifikante Unterschiede zu anderen Wortschätzen aufzudecken. Wie lässt sich also ein Wortschatz bestimmen? Früher wurde der Wortschatz einer Person durch Auszählung der verwendeten (unterschiedlichen) Lexeme gemessen. Dies ist grundsätzlich kein schlechtes Maß unter der Bedingung, dass auch der Wortumfang eines Kommunikats berücksichtigt wird, denn zehn verschiedene Lexeme in einer SMS-Mitteilung zu verwenden ist eine andere Leistung als zehn Lexeme in einem Brief oder gar Roman. Knipf-Komlósi u. a. (2006, 15) geben an, dass für das Lesen von
62
Torsten Siever
„intellektuellen Tageszeitungen […] etwa 5 000 Wörter“ benötigt werden. Dahingegen könne man die digitalen Kommunikationsformen, namentlich die „Chat- und SMSKommunikation, […] mit etwa 100–200 Wörtern“ (ibid.) rezipieren. Die Autorinnen belegen ihre Aussage allerdings nicht und es bleibt offen, wie diese Zahlen ermittelt wurden, ob beispielsweise eine vom Umfang her vergleichbare Datenbasis verwendet wurde. Dass die Zahlen eher nicht stimmen dürften, zeigt sich am kleinen Hannoverschen SMS-Korpus, welches 20 742 Wortformen umfasst und weit mehr als tausend Lexeme enthält, die mehr als einmal verwendet werden. Schwieriger als die Messung des Wortschatzes einer einzelnen Person ist die Untersuchung spezifischer Domänen und Gruppen, in denen ein signifikanter (also von Vergleichsgrößen abweichender) Wortschatz verwendet werden könnte.
4.1 „Internetsprache“ – Internetwortschatz? Niemand würde ernsthaft behaupten, dass Telefongespräche einen homogenen Wortschatz aufwiesen. Natürlich bedienen sich Telefonierende erlernter Scripts, indem sie die Einleitung und Beendigung des Telefonats gesprächstypisch aufbauen. Dennoch gestaltet sich der Sprachgebrauch inkl. Wortschatz in Abhängigkeit der Telefonierenden, womit ein Gespräch zwischen Mitgliedern eines Tennisvereins und dem zwischen Chemikern lexikalische Unterschiede aufweisen dürften (Aufschlag, Oxidation). Noch abwegiger wäre es, einen homogenen Wortschatz der Internetkommunikation anzusetzen. Die Universalität der Computer ermöglicht im Gegensatz zum Telegraphen, Fernschreiber, Telefax, Fernseher eine praktisch unbegrenzte Vielfalt der Interaktion, die unterschiedlich genutzt werden dürfte (Foren etwa intensiv zur Fachkommunikation). Traditionelle Kommunikationsgeräte resp. Kommunikationsformen sind ohnehin bereits überwiegend im Computer aufgegangen. Dieser Vielfalt ungeachtet existieren (mit gutem Recht) Wörterbücher oder Lexika zum Internetwortschatz, die sich in drei Kategorien einteilen lassen, d. h. über drei Phänomene Auskunft geben: (i) Terminologische Lexeme inkl. Eigennamen (Computer, Browser, Facebook), (ii) Abkürzungen und Kurzwörter (AFK, thx, LOL), und (iii) Emoticons (Smileys) – mitunter nur verzierenderweise mit ASCII-Art (z. B. @>--->--für Rose oder < für Fisch) angereichert, denn „lesbar“ sind viele Zeichenkombinationen durch ihre Ähnlichkeitsbeziehung zum realen Objekt. Allein an den beiden letzten Listen mit lexikalischen Einheiten zum „Internetslang“ oder „Computerjargon“ ist ablesbar, dass es mit dem internetspezifischen Wortschatz nicht weit her sein kann. Mit einem solchen Verständnis stellten auch Kleinanzeigen mit mehr oder minder festgelegten Kurzformen (EBK, Ü/F, HP, ABS, NR, VB für Einbauküche (Immobilien), Übernachtung mit Frühstück (Reisen), Antiblockiersystem (Auto), Nichtraucher (Kontakt) und Verhandlungsbasis (Verkauf)) eine Spezial- oder Sondersprache dar, weil jeweils zwei Dutzend domänenspezifische Kurzformen aufgelistet werden (können). Streng genommen müsste hier zwischen Abkürzungen und Kurzwörtern
Das Wort in der Netzkommunikation
63
unterschieden werden, denn Abkürzungen werden nur grafisch realisiert (Ü/F), nicht aber phonisch (*[ˌyːˈɛf]), weshalb ihnen ein lexikalischer Status abgesprochen werden muss. Eine Vielzahl der oft beschriebenen Spezifika digitaler Nähekommunikation geht auf eine reduzierte und/oder normabweichende Schreibung zurück, die den Wortschatz nicht berührt. So gehen sowohl als auch auf das Lexem stehen zurück und die Varianten Fe.Wo., Fe/Wo, Fe’wo, Ferienwhg., FeWhg., Fewo, FeWohnung, FW können dem Lexem Ferienwohnung sowie W.-e., W.ende, WE, Wo.Ende, Woend dem Lexem Wochenende zugeordnet werden (Beispiele aus Siever 2011, 332). Dies gilt auch für den gesamten Bereich der lautnahen Graphie, ob sie nun auf phonetische/phonologische Prozesse (nich), Emulation (suuuuuper), Kreativität resp. freie Laut-Buchstaben-Zuordnung (froi) oder Unkenntnis (Leipniz) zurückzuführen ist. Vielfach ist nicht entscheidbar, welcher Kategorie die Schreibabweichungen zuzuordnen sind.
4.2 Lexikalische Diversität Neben der Lexikongröße ist vor allem die lexikalische Vielfalt ein wichtiges Maß für Wortschätze. Diese lexikalische Diversität ist für den Produzenten aufwändiger, da der Wortschatz aktiv verfügbar sein und ‚durchsucht‘ werden muss, doch werden beim Rezipienten Unaufmerksamkeit, Monotonie und andere negative Aspekte vermieden, sofern die Lexeme zumindest passiv verfügbar sind, also verstanden werden. Unter lexikalischer Diversität wird also ein vielfältiger, umfangreicher Wortschatz verstanden, der unter bestimmten situativen und Hörerbedingungen positive Auswirkungen auf die Kommunikation haben kann. Wenn Knipf-Komlósi u. a. (2006, 15) bei Textoder WhatsApp-Chats von einem Inhaltswortschatzumfang von 100–200 Wörtern ausgehen, dann wäre dies eine Folge des Bedarfs an Ökonomie und Entlastung auf Seite der Produzenten. Wie schon angemerkt, kann von einem solch geringen Umfang nicht ausgegangen werden, doch selbstverständlich ist die lexikalische Diversität nicht nur von individuellen, sondern auch von situativen (Tastatur, Bildschirmgröße, Maximalumfang) und sozialen Bedingungen (Gruppenverhalten) abhängig. Um die lexikalische Diversität zu messen, muss auf umfangreiche Korpora zurückgegriffen werden, da nur so auch die nur selten oder singulär verwendeten Lexeme erfasst werden. Altmann u. a. (2002, 17) vergleichen denn auch Wortschatzstichproben mit der „Bemühung, das Funktionieren des menschlichen Körpers nur aus Gewebestichproben entziffern zu wollen“. Im Bereich der Lexik der Internetkommunikation blieb es in Ermangelung an umfangreichen Korpora bislang bei Stichproben. Big-Data-Studien stellen folglich in diesem Bereich ein Forschungsdesiderat dar. Es existieren mehrere Verfahren, um die lexikalische Diversität zu berechnen. Bei allen Berechnungsmethoden geht es darum, die Relation zwischen den einzelnen Tokens in Bezug auf die Gesamtzahl der Wörter eines Textes zu bestimmen (soge-
64
Torsten Siever
nannte Type-Token-Relation, TTR). Je geringer dieser Wert ausfällt, desto größer ist die lexikalische Vielfalt im Verhältnis zum Textumfang. Der Wert ist allerdings abhängig von der Gesamtgröße des Korpus, sprich die Tokenzahl (die Korpusgröße) müsste eigentlich zusätzlich berücksichtigt werden, wie dies auch beim Measure of Textual Lexical Diversity (MTLD, vgl. McCarthy/Jarvis 2010) geschieht. Tab. 1: Lexikalische Diversität: TTR und MTLD Tokens
Types
TTR
MTLD
SMS-Mitteilungen
21082
4144
0,2
213.4
Tweets
7291
3019
0,41
359.6
Kommentare (Flickr)
7734
2468
0,32
218.07
Kommentare (News)
42307
8699
0,21
197.53
Wikipedia-Artikel
8704
3939
0,45
341.91
Newsticker
2335
1336
0,57
599.91
In Tabelle 1 ist zu sehen, wie es um die lexikalische Diversität in verschiedenen digitalen Kommunikationsformen steht. Was sagen diese Maßzahlen aus? Der TTR-Wert ist als Quotient einfach zu interpretieren: Er liegt zwischen 0 und 1; je näher der Wert bei Null liegt, desto größer also ist die lexikalische Diversität. 0,2 bedeutet, dass ein Verhältnis von 1 zu 5 besteht, d. h. jeder Type wird im Mittel fünfmal verwendet. Der die Korpusgröße eliminierende MTLD-Wert ist weniger transparent, doch für Vergleiche besser geeignet. Werden etwa die Wikipedia-Artikel als Referenzkorpus betrachtet, liegen die Werte der Newstickermeldungen erheblich darüber, SMS-Mitteilungen und Kommentare deutlich darunter. Auch hier gilt natürlich: je höher der Wert, desto geringer die lexikalische Diversität. Die Aussagekraft der ermittelten Werte ist leicht getrübt, und zwar nicht nur durch die fehlerhafte Rechtschreibung, sondern auch durch die Verwendung von (mitunter nicht-konventionalisierten) Abkürzungen wie i für ich. Wichtiger allerdings ist bei der Interpretation der Werte die Berücksichtigung der Zeichenbegrenzung und (zum Erhebungszeitpunkt noch) kleinen Tastaturen, denn beide Bedingungen veranlassen die Textproduzenten zu einer reduktiven Syntax – oft als Telegrammstil bezeichnet. Wenngleich der Vergleich nicht wirklich gerechtfertigt ist (vgl. Siever 2011), werden beispielsweise Personalpronomina der 1. Person (auch im Plural) getilgt, ebenso Funktionswörter wie Artikel und Präpositionen wie beim Kiezdeutsch (vgl. Wiese 2012). Da gerade die geschlossene Klasse der Funktionswörter einen geringen Umfang aufweist, aber dennoch häufig verwendet wird, erklärt dies den niedrigen und damit ‚stilistisch guten‘ Wert bei den SMS-Mitteilungen. Die Type-Werte sind im Übrigen nicht nur für die Berechnung der Maßzahlen notwendig, sondern bieten einen Einblick in den Wortschatzumfang, den eine Kom-
Das Wort in der Netzkommunikation
65
munikationsform typischerweise aufweist. Die zurückhaltende Formulierung ist der Tatsache geschuldet, dass eine Korpusgröße von 2 335 Tokens für Aussagen über Wortschatzgrößen nicht angemessen ist, sondern methodisch eher auf den besagten ‚Gewebestichproben‘ beruht. Trotzdem wird deutlich, dass negative Aussagen über den Wortschatz von SMS-Mitteilungen ebenso ungerechtfertigt sind wie allzu positive über Tweets.
4.3 Signifikanter Wortschatz Anders als bei Umfang und Diversität des Wortschatzes geht es bei der Signifikanz analyse um konkrete Wörter resp. ihre Bedeutungen. Die Frage ist, ob sich eine digitale Kommunikationsform oder vielleicht sogar die Gesamtheit aller digitalen Sprachhandlungen durch eine spezifische Lexik auszeichnet, also ob ein Varietätenwortschatz der digitalen Kommunikation besteht. Für die Berechnung stehen verschiedene statistische Testverfahren zur Verfügung. Ziel solcher Tests ist die Ermittlung von Werten, die eine Aussage darüber treffen, ob eine beobachtete Häufigkeit ‚zufällig‘ ist oder nicht, d. h. ob das Auftreten eines Wortes in Korpus A häufiger (oder seltener) vorkommt als dasselbe Wort in Korpus B. Falls es nicht zufällig ist, wäre das Auftreten signifikant und damit für das Korpus – oder eine Varietät – typisch. Tab. 2: Signifikanztestergebnis auf Basis der Log-Likelihood-Funktion (inkl. Stoppwörtern) Wortform
Occ. C1
% rel C1
Occ. C2
% rel C2
LL/G2
ich
141
1,94
0
0
221,11
der
96
1,32
319
3,69
90,67
wurde
3
0,04
78
0,9
74,17
ja
41
0,56
0
0
64,3
jetzt
41
0,56
0
0
64,3
des
12
0,17
91
1,05
55,66
die
127
1,75
315
3,64
53,15
mir
32
0,44
0
0
50,18
;)
31
0,43
0
0
48,61
mal
43
0,59
4
0,05
44,95
Tabelle 2 zeigt die zehn Wortformen mit den höchsten Signifikanzwerten für das Twitter-Korpus (C1) im Vergleich mit dem Referenzkorpus der Wikipedia-Artikel (C2). Der mit Abstand signifikanteste Unterschied zwischen den Wikipedia-Artikeln und den
66
Torsten Siever
Tweets besteht in der Wortform ich. Dies verwundert kaum, da Microblogs funktional zur Meinungs- und Handlungsäußerung genutzt werden und hierfür persondeiktische Ausdrücke gebraucht werden (auch temporaldeiktische wie jetzt, morgen, heute, eben, später, gleich, grad und gerade, Ränge 5, 30, 54, 76, 83, 91, 102, 153). Allerdings werden Pronomen neben Artikeln, Präpositionen oder Konjunktionen im Regelfall als sog. Stoppwörter nicht beachtet, da sie semantisch (nahezu) leer sind – es sei denn, sie stellen wie im Fall des Kiezdeutschen eine wichtige Komponente dar. Interessant ist der Unterschied in jedem Fall. Das gilt auch für die Verteilung von aber (signifikant für Twitter) und jedoch (Wikipedia), die vermutlich stilistisch und reduktionsbedingt ist.Außerhalb der Stoppwörter sind nennenswert belegt: ;) (9), :) (11), RT (13), Twitter (22), :-) (25), Sonne (35), alles (40), :d (46), ;-) (47), gute (48), will (51), & (55), danke (56), leider, schön, Wochenende, Bitte/bitte, Abend, Blog, nix, oh, super, zusammen, €, +, geh, nochmal, ok, paar, richtig, via, Video, wirklich, mehr, Jahre, muss, Geschichte, Jahrhundert, ^^, echt, finde, Internet, langsam, vielleicht, wach, Web, Wetter, 2006, bekannt, Schulen, Spieler, geht
Fasst man nahestehende Wortformen zusammen, ergibt sich eine entscheidende Differenz: die Smileys. Belegt sind die Klassiker ;-), :-) und :D sowie das asiatische ^^. Daneben stehen naheliegende Fachtermini wie RT (für Retweet), Twitter, Blog, Internet und Web. Nicht einmal domänenspezifische Abkürzungen wie PM für Pressemitteilung haben es in die Liste signifikanter Wortformen geschafft. Wenig überraschend sind hingegen die Tokens hab, is, ne, also reduzierte Formen, die auf den genannten Mündlichkeitstransfer hinweisen (vgl. dazu auch Imo in diesem Band). In die Nähe lassen sich auch echt und oh als Partikel einerseits, grad und ok als umgangssprachliche Lexik andererseits rücken. Hingegen deuten und wie auch sowie auf komplexe Sätze oder Aufzählungen hin, die wiederum für die Wikipedia-Artikel signifikant sind. Einzig überraschend ist das stilistisch höhere via, das allerdings hochgradig konventionalisiert ist ([…] via @user). Im Ergebnis zeigen sich zwar Unterschiede, die auf Stilistik und explizit auf Sprache am Nähe- (Twitter) und Distanzpol (Wikipedia) hinweisen, allerdings keine Abweichungen, die die Annahme eines varietätenspezifischen Wortschatzes rechtfertigen würden – von den Smileys als metasprachlichen Elementen abgesehen. Für die anderen Kommunikationsformen gilt grundsätzlich nichts anderes: Abweichungen sind gering und in den wenigen, belegten Fällen der Funktion und/ oder den Inhalten geschuldet. So sind bei den Kommentaren der Flickr-Community folgende Types (gruppiert und lemmatisiert) sehr, so, wirklich, richtig, (wunder)schön, klasse, gut, super, toll, herrlich, interessant, perfekt, wunderbar, beeindruckend, fantastisch, stimmungsvoll, besser, wow, Aufnahme, Foto, Bild, Perspektive, Blick, Blickwinkel, Komposition, Idee, Bildaufbau, Szene, Licht, Schatten, Kontrast, Farbe(n), s/w, Stimmung, Wetter, Motiv, Landschaft, Winter(landschaft/aufnahme/bild), Sonne, Schnee, :-), ;-), :-D gefällt, wünsche, mag, liebe, LG, danke/Dank, mehrere Eigennamen etc.
Das Wort in der Netzkommunikation
67
signifikant belegt, doch ist keinerlei Überraschung dabei. Die Funktion des Kommentierens und Bewertens gibt sich mit zahlreichen Adjektiven und intensivierenden Wörtern erwartungskonform, das Bewertete wird zudem häufig benannt. Entsprechend sind N-Gramme (Einheit aus N Elementen – in diesem Fall Wortformen – in einem Text) belegt, etwa die Bigramme schöne Aufnahme (20 % der Fälle mit schöne), tolle Perspektive (21 % mit Perspektive) oder sehr schön (66 % mit sehr). Auch zahlreiche fachsprachliche Lexeme (Motiv, Kontrast, Perspektive etc.) sind signifikant häufiger vertreten als bei den Wikipedia-Artikeln. Als eher direkte, persönliche Kommunikationsform zeigen sich auch hier wieder die Smileys :-), ;‑) und :-D sowie iteriert :-))) und wow als Mündlichkeit kennzeichnende Interjektion. Einzig mit LG (Liebe Grüße) ist neben den Smileys eine Reduktionsform signifikant belegt, die für digitale Kommunikation als typisch gilt. Bei SMS-Mitteilungen sind es vor allem liebe, hi, hallo, na, hey, moin, ciao, gruß, grüße, Spaß, morgen, heute, jetzt, Abend, lieb (45 % hab dich [auch/so/…] lieb) und ja, ok, klar, die zwar statistisch auffallen, nicht jedoch lexikalisch. Allerdings sind mehr (Pseudo-)Anglizismen (Handy, sorry, hi, Party, Training, Mail, cool) und Reduktionsformen belegt: +/&/u. für und, o für oder, h für Uhr, i für ich, Mi/Fr für Wochentage, d. für die bestimmten Artikelformen, SMS, HDL/HDGDL, LG, cu, g für grins sowie weitere Einzelgraphen als Namenskürzel. Hinzu kommen wiederum Smileys. Eine signifikant unterrepräsentierte Reduktionsform ist bzw. Bei Leserkommentaren redaktioneller Angebote (meta.ard.de) bildet wiederum ich die signifikanteste Wortform, nachfolgend absteigend wenn, so, mehr, Menschen, schon, aber (wiederum im Gegensatz zu jedoch bei der Wikipedia), denn, alles, jetzt, hier, EU, USA, D, Irak, Ukraine, Demokratie, Euro, Polizisten, Problem, Statistik, wirklich, natürlich, sicher, r/Recht, richtig, vielleicht, eigentlich, eben, leider, immer, einfach, wohl, nur, auch, da, weil, ob, wo, also, klar, egal, anders, gar, besser, eher, frage, sagen, will, muss, sollte, müssen, wissen, nichts, kein(e), Geld, Leute, darf, usw.
Auffallend viele Lexeme dienen der Argumentation und Widerlegung von Äußerungen, was nicht überraschend ist. Auch Adverbien wie natürlich, wirklich, eigentlich dienen der Unterstreichung oder dem Widerspruch. Als N-Gramme kommen beim Verb fragen vor allem ich frage mich/frage ich mich/ich mich frage (38 %) vor. Beim Substantiv nimmt die (wichtige/entscheidende/…) Frage ist etc. in einem Fünftel aller Fälle die wichtigste Verbindung ein. Interessant ist die geringe Zahl an signifikanten Abkürzungen (ausschließlich D und usw.) und Kurzwörtern (EU, USA) sowie das Fehlen von Smileys, was ggf. den ernsten Themen und/oder dem Alter der Kommentierenden geschuldet sein könnte. Bei den Newsgroups hingegen sind Smileys, der zwinkernde und ^^, signifikant vertreten, erwartungskonform auch wieder Wörter, die der Begrüßung und Verabschiedung dienen (Gruß, Ciao). Als Substantive treten noch Hütte, Frauen, Leute, Menschen, Text hervor, einige Eigennamen sowie generell die schon bei den Leserkommentaren genannten Wörter zur Argumentation.
68
Torsten Siever
Abschließend bleibt festzuhalten, dass die Annahme einer Internet-Varietät – zumindest lexikalisch – schwer zu halten ist.
4.4 Einstellungslexik Lexeme mit positiver oder negativer Konnotation oder Einstellungsbedeutung lassen sich nur schwerlich einer Varietät zuschreiben, denn grundsätzlich ist nicht zu erwarten, dass in SMS-Mitteilungen eine eher positive, bejahende und überschwängliche Lexik gebraucht wird, in Chats hingegen nur negative. Unmittelbar von einem solchen Mittelwert auf eine Varietät zu schließen, wäre natürlich ein Fehler. Vielmehr dürften die Themen und letztlich die Funktion, die einer Kommunikationsform oder Textsorte zukommt, Ausschlag für die entsprechende Lexik geben; transparent ist dies etwa am Beispiel der Textsorte Todesanzeige. Allerdings ist zu erwarten, dass SMS-Mitteilungen aufgrund ihres persönlichen Charakters – für Werbung und Unternehmenskommunikation wird der Service praktisch nicht genutzt – eine stärkere polare Ausprägung aufweisen als beispielsweise Kommentare im (Social) Web. Innerhalb der Kommentare wiederum dürften sich ebenfalls Unterschiede ergeben – nicht nur je nach Thema, sondern auch je nach Plattform (die ein Thema vorgeben mag). Der Bereich der Analyse von Sprachdaten hinsichtlich ihrer positiv oder negativ wertenden (subjektiven) ebenso wie ihrer objektiven Darstellung wird als „Opinion mining“ (OM) bezeichnet. Ermittelt wird dies maschinell mithilfe der korpusbezogenen Erkennung von positiv oder negativ konnotierten Lexemen, die in einem Wörterbuch hinterlegt und hinsichtlich ihres Maßes eingeordnet sind. Solche maschinenlesbaren oder gar zur eigenen Verarbeitung implementierbaren Daten, die ein „Polaritätsgewicht“ ausweisen, sind – wie Wörterbücher im Allgemeinen – rar. Das Projekt Deutscher Wortschatz der Universität Leipzig bietet Aussagen über die Konnotation bzw. „Polarität“ in Form von Maßzahlen in Form einer maschinenlesbaren Textdatei unter dem Namen SentiWS (SentimentWortschatz) inklusive der flektierten und bei Adjektiven komparierten Wortformen. Das Problem bei den automatisch ermittelten Werten für Sentimentlexik ist die mangelnde Interpretation, und zwar vor allem Ironie und Metaphern. Während in Metaphern verwendete emotionsbehaftete Lexeme allerdings im Regelfall die Gesamtbedeutung der Phrase nicht ändern (die Abgründe des Daseins), ist dies bei Ironie hingegen der Fall (Die Politiker finden ja mal wieder perfekte Worte für die Misere). Beim Twitter-Korpus etwa werden auf Basis von SentiWS 488 Wortformen erkannt, die grundsätzlich eine subjektiv-wertende Bedeutung aufweisen können. Allerdings gehen 33 Treffer auf homographe und 31 auf homonyme Lexeme zurück (verraten: ‚aussagen‘ – ‚petzen‘; als intensivierende Partikel: richtig [hübsch], ‚sehr‘ – ‚wahr‘). Auch negierende (war heute nicht so gut; kein schlechter tipp) oder optative und fiktionale Sätze sind mit 11 bzw. 14 Belegen stark vertreten (hoffe auf mehr relevanz; beifall verdient gehabt hätte). Metaphern spielen eine sehr geringe Rolle: In freier Journalist
69
Das Wort in der Netzkommunikation
ist frei in der Bedeutung ‚ohne Festanstellung‘ zu interpretieren. Die für alle Treffer berechnete mittlere Polarität von 0,0506 ist angesichts von 126 ungültigen Werten wenig aussagekräftig; der Wert dürfte erheblich niedriger ausfallen, was auch eher der ‚kritischen Kontrollfunktion‘ von Tweets entsprechen würde. Wäre das Korpus zuvor morphosyntaktisch getaggt worden, hätte dies nur in wenigen Fällen zu einer Disambiguierung beigetragen: Beispielsweise wäre in es muss rein… nur überlegen ob ma net extra n modul für schreibt die Wortform überlegen nicht als Adjektiv, sondern korrekt als verbales Partizip Präsens oder Infinitivform interpretiert und somit von der Berechnung ausgenommen worden. Allerdings betrifft dies nur sehr wenige Fälle. Zudem sinken die Erkennungsraten von Part-ofspeech-Taggern bei orthografisch fehlerreichen, syntaktisch reduzierten und nah am Pol der Mündlichkeit verorteten Sprachhandlungen. Anders als bei der Fehlerquote in Höhe von rund 25 Prozent bei Tweets ist die Erkennung bei Flickr-Kommentaren erheblich besser, da hier Schreibung, Ironie, Negation etc. weitestgehend fehlen. Die Funktion der Kommentierung liegt kaum in der kritischen Auseinandersetzung mit den bereitgestellten Fotos, sondern hauptsächlich in deren Würdigung. Aus diesem Grund gibt es zwar auch einige wenige Homographen wie macht/Macht (VB/SBST). 0,6 0,4 0,2 0 -0,2 -0,4 -0,6
1
2
3
4
5
6
Abb. 3: Sentimentlexik für die Newsgroups (1),Tweets (2), SMS-Mitteilungen (3), Flickr-Kommentare (4), News-Kommentare (5) und Wikipedia-Artikel (6)
In der Summe ist trotz aller methodischen Schwierigkeiten anzunehmen, dass die besagten Erkennungsprobleme außerhalb von Tweets nur in geringem Umfang auftreten. Grundsätzlich sind die Werte also als Richtwerte aussagekräftig, insbesondere wenn sie zur Interpretation herangezogen werden. In Abbildung 3 finden sich die
70
Torsten Siever
zentralen Korpora im Vergleich in Form von Boxplot-Diagrammen. Hierbei liegen 50 Prozent der Werte in der gefüllten Box, an deren Größe die Streuung der Werte abgelesen werden kann; die durchgezogenen Linien (Whisker) zeigen die Extremwerte an, die gestrichelte Linie den Median.
5 Fazit Varietäten wie Dialekte oder Soziolekte können spezifische sprachliche Merkmale aufweisen, wie beispielsweise das Fehlen des Präteritums im Schweizerdeutschen oder die Artikelreduktion beim Kiezdeutschen zeigen. Auch hinsichtlich der Wortschätze kann es signifikante Unterschiede geben, etwa durch lexikalische Varianten. Von einem spezifischen Wortschatz im Internet kann allerdings kaum ausgegangen werden – die Unterschiede mit hohen Wahrscheinlichkeiten eines nicht-zufälligen Auftretens sind zu gering und in der Regel thematisch oder funktional bedingt. Einzig die Smileys treten in einigen Kommunikationsformen (Tweets, Flickr-Kommentaren) signifikant in Erscheinung. Die Unterschiede liegen eher im Detail, etwa bei den stilistischen Varianten jedoch, die bei Wikipedia-Artikeln gebraucht werden, und aber bei den anderen dialogorientierten. Dieses Ergebnis zeigt sich auch bei der Untersuchung von Sentimentlexik: Während Wikipedia-Artikel nur wenig wertende Lexeme (5,7 %) aufweisen, finden sich solche in Tweets (29 %) und Flickr-Kommentaren (15,7 %) vergleichsweise häufig. Hinsichtlich der lexikalischen Diversität weisen Tickernews und Tweets die „schlechtesten“ Werte (mit der geringsten Vielfalt) auf, Kommentare zu redaktionellen Beiträgen und solche in der Flickr-Community die „besseren“ Werte. Allerdings dürften Rechtschreibfehler für die niedrigen Diversitätswerte (auch bei der SMS-Kommunikation) mitverantwortlich sein, die Tilgung von Funktionswörtern für die höheren Diversitätswerte – hier wäre ein Vergleich ohne Stoppwörter sinnvoll. In jedem Fall kann die Aussage, dass „SMS-Kommunikation […] mit etwa 100–200 Wörtern“ (Knipf-Komlósi u. a. 2006, 15) problemlos rezipiert werden kann, bestritten werden. Festzuhalten bleibt, dass es erwartungsgemäß spezifische Lexeme gibt, die signifikant nur in der einen oder anderen Kommunikationsform vertreten sind, doch ist der Kernwortschatz derjenige, der durchweg zentral herangezogen wird. Funktionsverbgefüge kommen eher in fachsprachlichen Kontexten vor, weil mit Verbzweit-Stellung (Hauptsatzwortstellung) in privaten, aber eben so gut wie nicht in Chats. Solche syntaktischen Gegebenheiten würde man hinzuziehen, um einem Sprachgebrauch eine Varietät zuzuweisen. Der Wortschatz allein rechtfertigt jedenfalls kaum die Annahme einer Varietät, was jedoch die zentrale Frage aufwirft: Wie viele abweichende Einzel-
Das Wort in der Netzkommunikation
71
fälle müssen vorliegen, um die Existenz zweier Varietäten zu rechtfertigen, und gibt es hinreichende Kriterien? Und wie viele müssen es in Bezug auf den Wortschatz sein? Gemäß der Ergebnisse kann grundsätzlich schwer von einer (einheitlichen) Varietät im Internet gesprochen werden, also kein „Internetwortschatz“, kein „Netspeak“ und kein „Netzjargon“; ein signifikanter Gebrauch einzelner Lexeme innerhalb bestimmter Kommunikationsformen konnte festgestellt werden, allerdings in einem sehr geringen Umfang. Dieses Ergebnis stimmt mit weiteren Erkenntnissen der Medienlinguistik oder auch „Internetlinguistik“ (Crystal 2011; Marx/Weidacher 2014) überein, denn zahlreiche Phänomene, die als neu und „typisch“ galten, wurden inzwischen widerlegt oder stark relativiert, etwa die Mündlichkeitsmerkmale oder Inflektive. Zuletzt hat Siever (2014) auch Kurzformen wie thx und cu als bekannte Mittel zur Reduktion im CB-Funk der 50er Jahre das Alleinstellungsmerkmal internetspezifischen Sprachgebrauchs abgesprochen. Damit bleibt mit Bieswanger (2013) nur noch der Smiley übrig – wenngleich dieser aus semiotisch-funktionalen Gründen nicht ohne weiteres zum Wortschatz zu zählen ist. Tatsächlich ist der Smiley jedoch (in einigen, nicht allen Kommunikationsformen) statistisch signifikant vertreten. Zudem ist bei allen bekannten Variablen der Einwand durchaus gerechtfertigt, dass die Zusammenstellung der Phänomene durch die Sprachverwendenden spezifisch ist, auch wenn es sich im Fall der Mündlichkeit in Briefen zum Teil um Rechtschreibschwächen handelt, da fehlende Rechtschreibkompetenz naturgemäß durch Lautschreibung ersetzt wird. Aber auch solche Variablen betreffen wiederum nicht mehr den Wortschatz, denn wie die Lexeme einer Sprache geschrieben oder ausgesprochen werden, hat auf die Gestalt oder den Wert eines Wortschatzes keinen Einfluss – der konkrete Wortschatzgebrauch ist nur einer von vielen Bestandteilen einer gegebenen Varietät.
6 Literatur Altmann, Gabriel u. a. (2002): Einführung in die quantitative Lexikologie. Göttingen (Göttinger Linguistische Abhandlungen, 5). Ammon, Ulrich (1995): Die deutsche Sprache in Deutschland, Österreich und der Schweiz. Das Problem der nationalen Varietäten. Berlin/New York. Androutsopoulos, Jannis K. (2007): Language choice and code switching in German-based diasporic web forums. In: Brenda Danet/Susan C. Herring (Hg.): The Multilingual Internet – Language, Culture and Communication Online. Oxford, 340–361. Androutsopoulos, Jannis K. (2010): Multimodal – intertextuell – hetero-glossisch: Sprach-Gestalten in ‚Web 2.0‘-Umgebungen. In: Arnulf Deppermann/Angelika Linke (Hg.): Sprache intermedial. Stimme und Schrift, Bild und Ton. Berlin u. a., 419–446. Bechar-Israeli, Haya (1996): From To . Nicknames, play, and identity on internet relay chat. In: Journal of Computer-Mediated Communication 1 (2) (online). .
72
Torsten Siever
Beißwenger, Michael u. a.(2013): DeRiK: A German reference corpus of computer-mediated communication. In: Literary and Linguistic Computing 28 (4), 531–537. . Best, Karl-Heinz (2006): Quantitative Linguistik. Eine Annäherung. 3. Aufl. Göttingen (Göttinger Linguistische Abhandlungen, 3). Bieswanger, Markus (2013): Micro-linguistic structural features of computer-mediated communication. In: Susan C. Herring/Dieter Stein/Tuija Virtanen (Hg.): Pragmatics of ComputerMediated Communication. Berlin/Boston, 463‒485. Busemann, Katrin/Christoph Gscheidle (2011): Web 2.0: Aktive Mitwirkung verbleibt auf niedrigem Niveau. In: Media Perspektiven 7/8, 1–3. Coseriu, Eugenio (2007): Sprachkompetenz. Grundzüge der Theorie des Sprechens. 2. Aufl. Tübingen. Crystal, David (2001): Language and the Internet. Cambridge. Crystal, David (2011): Internet Linguistics. A Student Guide. New York. Das Digitale Wörterbuch der deutschen Sprache (DWDS) . Dornseiff, Franz (2004): Der deutsche Wortschatz nach Sachgruppen. Mit einer lexikographischhistorischen Einführung und einer ausgewählten Bibliographie zur Lexikographie und Onomasiologie von Herbert Ernst Wiegand. 8. völlig neu bearb. u. m. einem alphabet. Zugriffsreg. vers. Aufl. Berlin. Duden (2013): Die deutsche Rechtschreibung. Das umfassende Standardwerk auf der Grundlage der aktuellen amtlichen Regeln. 26. Aufl. Berlin (Der Duden in 12 Bänden, 1). Dürscheid, Christa (2004): Netzsprache – ein neuer Mythos. In: Michael Beißwenger/Ludger Hoffmann/Angelika Storrer (Hg.): Internetbasierte Kommunikation. Duisburg (Osnabrücker Beiträge zur Sprachtheorie, 68), 141–157. Dürscheid, Christa (2006): Einführung in die Schriftlinguistik. Grundlagen und Theorien. 3. Aufl. Göttingen (Studienbücher zur Linguistik, 3). Griesbaum, Joachim (2013): Social Web. In: Rainer Kuhlen/Wolfgang Semar/Dietmar Strauch (Hg.): Grundlagen der praktischen Information und Dokumentation. Handbuch zur Einführung in die Informationswissenschaft und -praxis. 6., völlig neu gefasste Aufl., 562–574. Haase, Martin u. a. (1997): Internetkommunikation und Sprachwandel. In: Rüdiger Weingarten (Hg.): Sprachwandel durch Computer. Opladen, 51–85. Hannoversches SMS-Korpus: . Henn-Memmesheimer, Beate/Ernst Eggers (2010): Inszenierung, Etablierung und Auflösung: Karriere einer grammatischen Konstruktion im Chat zwischen 2000 und 2010. In: Networx 57. Hannover/Mannheim. . Jansen, Silke (2005): Sprachliches Lehngut im world wide web. Neologismen in der französischen und spanischen Internetterminologie. Tübingen. Knipf-Komlósi, Elisabeth/Roberta V. Rada/Csilla Bernáth (2006): Aspekte des Wortschatzes. Ausgewählte Fragen zu Wortschatz und Stil. Budapest. . Koch, Peter/Wulf Oesterreicher (1994): Schriftlichkeit und Sprache. In: Hartmut Günther/Otto Ludwig (Hg.): Schrift und Schriftlichkeit. Ein interdisziplinäres Handbuch internationaler Forschung. Berlin/New York, 587–604. Lemnitzer, Lothar (2010): Neologismenlexikographie und das Internet. In: Lexicographica 25, 65–78. Löffler, Heinrich (1994): Germanistische Soziolinguistik. 2. Aufl. Berlin (Grundlagen der Linguistik, 28). Marx, Konstanze/Georg Weidacher (2014): Internetlinguistik. Ein Lehr- und Arbeitsbuch. Tübingen.
Das Wort in der Netzkommunikation
73
McCarthy, Philip M./Scott Jarvis (2010): MTLD, vocd-D, and HD-D. A validation study of sophisticated approaches to lexical diversity assessment. In: Behavior Research Methods, 42 (2), 381–392. Moraldo, Sandro M. (Hg.) (2009): Internet.kom. Neue Sprach- und Kommunikationsformen im WorldWideWeb. Bd. 1: Kommunikationsplattformen. Rom. Müller, Christina M. (2011): Dialektverschriftung im Spannungsfeld zwischen standardnah und lautnah. Eine korpuslinguistische Untersuchung der Rubrik Dein SMS in der Aargauer Zeitung. In: Helen Christen/Franz Patocka/Evelyn Ziegler (Hg.): Struktur, Gebrauch und Wahrnehmung von Dialekt. Beiträge zum 3. Kongress der Internationalen Gesellschaft für Dialektologie des Deutschen (IGDD), Zürich, 7.–9. September 2009. Wien, 155–178. Püschel, Melanie (2013): Emotionen im Web. Die Verwendung von Emoticons, Interjektionen und emotiven Akronymen in schriftbasierten Webforen für Hörgeschädigte. Stuttgart (Kultur – Kommunikation – Kooperation, 15). Runkehl, Jens/Peter Schlobinski/Torsten Siever (1998): Sprache und Kommunikation im Internet. Überblick und Analysen. Opladen. Schäfer, Roland/Felix Bildhauer (2012): Building large corpora from the web using a new efficient tool chain. In: Nicoletta Calzolari u. a. (Hg.): Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC’12). Istanbul, 486–493. Korpora unter . Schlobinski, Peter (2001): *knuddel – zurueckknuddel – dich ganzdollknuddel*. Inflektive und Inflektivkonstruktionen im Deutschen. In: Zeitschrift für germanistische Linguistik 29 (2), 192–218. Schlobinski, Peter (2011): Geht raus und sprecht Fußball! Kleines Wörterbuch der Fußballsprache. 2. Aufl. Mannheim u. a. Siebenhaar, Beat (2006): Das sprachliche Normenverständnis in mundartlichen Chaträumen der Schweiz. In: Jannis K. Androutsopoulos u. a. (Hg.): Neuere Entwicklungen in der linguistischen Internetforschung. Hildesheim (Germanistische Linguistik, 186/87), 45–67. Siever, Torsten (2011): Texte i. d. Enge. Sprachökonomische Reduktion in stark raumbegrenzten Textsorten. Frankfurt a. M. u. a. (Sprache – Medien – Innovationen, 1). Siever, Torsten (2014): Digitale Welt: Kommunikative Folgen und Folgen der Kommunikation. In: Alexa Mathias/Jens Runkehl/Torsten Siever (Hg.): Sprachen? Vielfalt! Sprache und Kommunikation in der Gesellschaft und den Medien. Eine Online-Festschrift zum Jubiläum von Peter Schlobinski (Networx, 64), 197‒234. Stickel, Gerhard (2013): Sprachentwicklung – Sprachkultur – Sprachkritik: Erwägungen zum heutigen und künftigen Deutsch. In: Zeitschrift der Germanisten Rumäniens 2 (44), 9–34. Teuber, Oliver (1998): fasel beschreib erwähn – Der Inflektiv als Wortform des Deutschen. In: Germanistische Linguistik 141/142, 7–26. Veith, Alexander H. (2002): Soziolinguistik. Ein Arbeitsbuch. Tübingen. Wichter, Sigurd (1998): Technische Fachsprachen im Bereich der Informatik. In: Lothar Hoffmann/ Hartwig Kalverkämper/Herbert Ernst Wiegand (Hg.): Fachsprachen. Ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft. Berlin u. a., 1173–1182. Wiese, Heike (2012): Kiezdeutsch. Ein neuer Dialekt entsteht. 2. Aufl. München. [s. a.: http://www. kiezdeutsch.de/, 14.01.2015].
II Wörter und ihre Umgebungen
Derya Gür-Şeker
4. Das Wort im Diskurs Abstract: Der Beitrag befasst sich mit zwei zentralen Fragestellungen, die in den nächsten Abschnitten vertieft und geklärt werden. Erstens stellt sich die Frage, wie das Wort aus diskurslinguistischer Sicht untersucht werden kann bzw. welche Ansätze es gibt, die Wörter im Diskurs methodisch erschließ- und untersuchbar machen? Die zweite Frage widmet sich dem Wort als konkrete diskurslinguistische Untersuchungseinheit, bei der zentrale Ansätze in den Fokus rücken. Es geht vereinfacht also darum, was mit dem Wort im Diskurs passiert, welche Rückschlüsse es ermöglicht und welche weiteren Aspekte es für Diskursforschende so interessant macht. Diesen Fragen will der Beitrag nachgehen und kritisch beleuchten. 1 Einführung 2 Diskurslinguistische Perspektiven auf das Wort 3 Methodische Aspekte korpuslinguistischer Analysen 4 Mögliche Untersuchungsgegenstände und Ansätze 5 Fazit 6 Literatur
1 Einführung In einer Sprachgemeinschaft wird ständig über bestimmte Themen diskutiert, öffentlich und privat. Wir alle sprechen ständig über das Wetter, die Politik oder führen gesellschaftsrelevante Debatten. Dabei kristallisieren sich unterschiedliche Meinungen, Perspektiven und Wissensstände heraus, Gegner und Befürworter einer Sache werden sichtbar und bestimmte Aspekte einer Diskussion wandeln sich je nach Situation und Teilnehmer. Deutlich wird dies z. B. wenn man sich Diskussionen zur Globalisierung, zur Wirtschaftskrise oder zu Bankreformen in den Medien anschaut. Aber auch Debatten um Schulreformen oder der Vereinbarkeit von Familie und Beruf sind Diskussionen, die mal mehr oder weniger aktuell und brisant sind und mit jedem gesellschaftlichen Wandel neue Aspekte und Positionen annehmen. Komplexe Themengegenstände wie diese linguistisch zu untersuchen, ist u. a. Aufgabe der linguistischen Diskursanalyse. Die Diskusanalyse als Forschungsprogramm zielt, gelegentlich mit aufklärerischem Duktus, auf die semantische Tiefenstruktur vorzugsweise schriftlicher Texte, die in ihrem Zusammenspiel einen individuellen Diskurs bilden (Gardt 2007, 40).
78
Derya Gür-Şeker
Das Ziel einer linguistischen Diskursanalyse ist somit nicht nur die Beschreibung der Inhalte einzelner Diskurse, sondern vor allem geht es um die Bestimmung und das Aufzeigen semantischer Voraussetzungen und diskurssemantischer Grundfiguren, die durch regelhafte und rekurrente Sprachphänomene, Metaphern, Denkfiguren oder Mentalitäten geprägt werden (vgl. Gardt 2007, 33). Ziel ist es, „hinter die semantische Oberfläche von Texten zu blicken“ (Gardt 2007, 33) und Möglichkeitsbedingungen für das Entstehen von Aussagen und Regelhaftigkeiten zu erschließen. Das Wort gilt hierbei meist als zentraler Ankerpunkt, um ausgehend davon bestimmte Themen, die beispielsweise medial verbreitet werden, diskurslinguistisch zu beschreiben und zu analysieren. Die Gründe für die zentrale Stellung des Wortes können einerseits in der Mediensprache bzw. des öffentlich(-politischen) Sprachgebrauchs liegen, wobei Medien oder mediale Akteurinnen und Akteure ein Thema anhand zentraler Wörter adressatenorientiert und meist Aufmerksamkeit erregend in die weite (Medien-)Welt katapultieren zu beabsichtigen. Andererseits fußen linguistische Diskursanalysen im Zeitalter technologischer Entwicklungen größtenteils nicht mehr auf Papierquellen – man denke an ein Bücherregal als Korpus, in dessen Fächern unterschiedliche Zeitungen eines Jahrgangs archiviert werden –, sondern diese können mittlerweile digital in Form von Online-Artikeln oder anderen Online-Formaten im Internet heruntergeladen werden, sodass Forschende ‚lediglich‘ digitalisierte Texte auswählen und sammeln müssen, um diese dann unter Rückgriff auf ein Textanalyseprogramm mittels quantitativer und qualitativer Analyseverfahren auszuwerten. Damit wird das Wort zum notwendigen Untersuchungselement aus rein korpusmethodischen Gründen, da sowohl Analyseprogramme als auch Internetrecherchen nur über gezielte Suchworteingaben funktionieren – jedoch nur zunächst. Denn ist der Ankerpunkt einmal gesetzt, können Forschende sich Schritt für Schritt in die weite Welt des Diskurses bzw. des Wortes im Diskurs hineintasten, denn das Wort taucht im Diskurs nicht alleine auf, sondern hängt mit anderen Wörtern zusammen, die wiederum Affinitäten zu weiteren Wörtern aufweisen, Bedeutungen, Wirklichkeiten und kollektives Wissen umreißen, prägen, vermitteln, die allesamt diskurslinguistisch erschließbar sind. In Abschnitt 2 dieses Beitrags sollen zunächst unterschiedliche Perspektiven auf das Wort, die die diskurslinguistische Analyse des Wortes grundlegend mitbestimmen, vorgestellt werden. Abschnitt 3 nimmt softwaregestützte Verfahren in den Blick, die bei der diskurslinguistischen Untersuchung des Wortes eine zentrale Rolle spielen. Vor diesem Hintergrund lassen sich die im 4. Abschnitt ausgewählten Untersuchungsperspektiven auf Diskurs-Schlüsselwörter, Sprachgebrauchsmuster und Frames begründen.
Das Wort im Diskurs
79
2 Diskurslinguistische Perspektiven auf das Wort Bevor diskurslinguistische Perspektiven auf das Wort näher erörtert werden können, gilt es, den Terminus Diskurs zu erläutern. Diesbezüglich ist festzuhalten, dass es nicht nur innerhalb der fächerübergreifenden Diskursforschung im Allgemeinen, sondern im Speziellen auch innerhalb der Linguistik verschiedene Diskursdefinitionen gibt. In der Diskurslinguistik hat sich trotz unterschiedlicher Begriffsverwendungen Busse/ Teuberts (1994) Diskursdefinition bewährt, auf die viele Arbeiten fußen (ausführliche Übersichten finden sich u. a. bei Spitzmüller/Warnke 2011). Busse/Teubert (1994, 14) verstehen u. a. inspiriert von der französischen diskursanalytischen Diskussion (Arbeiten Michel Foucaults (1966, 1969, 1971) und Michel Pêcheuxs (1975, 1983)) [u]nter Diskurs […] im forschungspraktischen Sinn virtuelle Textkorpora, deren Zusammensetzung durch im weitesten Sinne inhaltliche (bzw. semantische) Kriterien bestimmt wird. Zu einem Diskurs gehören alle Texte, die – sich mit einem als Forschungsgegenstand gewählten Gegenstand, Thema, Wissenskomplex oder Konzept befassen, untereinander semantische Beziehungen aufweisen und/oder in einem gemeinsamen Aussage-, Kommunikations-, Funktions- oder Zweckzusammenhang stehen, – den als Forschungsprogramm vorgegebenen Eingrenzungen in Hinblick auf Zeitraum/Zeitschnitte, Areal, Gesellschaftsausschnitte, Kommunikationsbereich, Texttypik und andere Parameter genügen, – und durch explizite oder implizite (text- oder kontextsemantisch erschließbare) Verweisungen aufeinander Bezug nehmen bzw. einen intertextuellen Zusammenhang bilden (Busse/ Teubert 1994, 14).
Diskurse werden hier also mit Textkorpora gleichgesetzt, die mittels inhaltlichsemantischer Aufbau- bzw. Selektionskriterien zusammengestellt werden. Die in diese (mittlerweile meist digitale) Textsammlung aufgenommenen Texte beziehen sich wiederum alle auf ein für die Untersuchung bestimmtes Thema und sind folglich durch intertextuelle Verweiszusammenhänge, die implizit oder explizit sind, untereinander verknüpft. Die Diskursdefinition Busse/Teuberts (1994) hat sich innerhalb der Diskurslinguistik als fruchtbar erwiesen, wobei je nach Forschungsinteresse auch graduelle Änderungen vorgenommen wurden, z. B. der Fokus auf Aussagen-Einheiten bei Jung (1996) oder Erweiterungen auf onlinespezifische Aspekte (vgl. Meier 2008; Fraas/Meier/Pentzold 2013). Zusammenfassend kann somit hinsichtlich dieser theoretisch und methodisch notwendigen Erweiterung im Zeitalter der Online-Kommunikation konstatiert werden, dass sich Diskurse durch ein globales Thema auszeichnen, das durch thematisch zusammengehörige Aussagen bzw. Wissenssegmente konstituiert wird. Diese Aussagen bzw. Wissenssegmente sind über zu erstellende Text- bzw. Datensammlungen, sogenannte Korpora, erschließbar. Das diesem Beitrag zugrunde liegende Diskursverständnis setzt im Gegensatz zu Busse/Teuberts Definition Diskurs nicht einfach mit Texten gleich, sondern erkennt auch nicht-sprachliche Symbolformen wie Bilder, Videos oder weitere hypertextuelle Phänomene als Teil eines Diskur-
80
Derya Gür-Şeker
ses an, weil diese einen Beitrag zur Bedeutungskonstituierung leisten und semantisches Potenzial besitzen, d. h., dass beispielsweise über den Einsatz von Bildern Bedeutungen, Einstellungen und Perspektiven auf Diskurse vermittelt werden, die wiederum auf Diskursteilnehmende, aber auch auf den Diskursverlauf wirken können (siehe hierzu ausführlicher Kress/van Leeuwen 2001; Meier 2008). Ist zu Beginn einer Untersuchung das Diskursverständnis geklärt, stellt sich die Frage, warum überhaupt Wörter und nicht andere Sprachebenen in den Fokus einer Diskursanalyse rücken sollen? Bezogen auf die Lexik, die in diskurslinguistischen Arbeiten den Ausgangspunkt der Analyse bilden kann, ist insbesondere deren Gebrauch im Diskurs und die daraus resultierende diskursive Bedeutungskonstitution von Interesse (siehe dazu Storjohann 2007; Teubert 2006; Stötzel/Wengeler u. a. 1995). So verdeutlicht beispielsweise Teubert (2006) in Bezug auf die Wortbedeutung und ihre Konstituierung im Diskurs: „Was also sprachliche Zeichen, Wörter, Fügungen, Textsegmente, ja ganze Texte bedeuten, erfahren wir aus dem Diskurs“. D. h., dass die Bedeutung eines Wortes nur durch die Analyse konkreter Verwendungskontexte im Diskurs zu erschließen und zu erklären ist. Wörter können somit nur vor dem Hintergrund des Diskurses eine Bedeutung konstituieren (siehe hierzu auch Busse 1987, 15). Das Heranziehen (großer) digitaler Textsammlungen und der damit verbundene korpuslinguistische Zugang bietet folglich ein vorläufig am besten geeignetes Instrumentarium für Diskursanalysen (vgl. Busse/Teubert 1994; Fraas 1996; Niehr/Böke 2004, Mautner 2008). Vor diesem Hintergrund ist im Sinne Niehr/Bökes (2004) auch zu verdeutlichen, dass über die diskursanalytische Wortanalyse, die als „Indikatoren und Faktoren sozial- und bewusstseinsgeschichtlicher Veränderungen“ verstanden werden, Rückschlüsse auf „Wahrnehmung und Einstellung der Sprachgemeinschaft gegenüber dem Bezeichneten“ (Niehr/Böke 2004, 328) zu ermitteln sind. Über Wörter und deren Kontexte kann also nicht nur gesellschaftlich kulturelles Wissen rekonstruiert, sondern gleichzeitig auch aufgezeigt werden, wie über Sprache gesellschaftliche Wirklichkeit konstruiert wird. Im Fokus einer Diskursanalyse können unterschiedliche lexikalische Einheiten wie Schlüsselwörter (siehe Schröter in diesem Band), Zwei- oder Mehrworteinheiten (siehe Belica/Perkuhn in diesem Band) stehen, die wiederum durch die Erschließung von Wissensrahmen (Frames) näher bestimmt werden können und in den nächsten Abschnitten Gegenstand der Betrachtung sind. Im nächsten Abschnitt wird dargestellt, wie Wörter im Diskurs anhand von Korpora systematisch und softwaregestützt erschlossen werden können.
3 Methodische Aspekte korpuslinguistischer Analysen Korpuslinguistische Zugänge sind für eine wortorientierte Diskursanalyse deswegen von Bedeutung, weil diese auf Korpora fußen, die authentisches Sprachma-
Das Wort im Diskurs
81
terial bündeln (vgl. McEnery/Wilson 1996, 1) und damit den Sprachgebrauch zu analysieren ermöglichen. Mittlerweile existiert weltweit eine Vielzahl unterschiedlicher öffentlich, kostenlos oder kostenpflichtig zugänglicher Korpora, die Millionen von Texten, Wörtern und Sätzen enthalten (siehe hierzu Gür-Şeker 2014). Zugleich ist das Wort als Untersuchungseinheit einer diskurslinguistischen Analyse nur ein Phänomen unter Vielen (z. B. Topoi oder Metaphern). Neben der Vielzahl existierender Analyseansätze, wie ein Diskursphänomen untersucht werden kann, gibt es im Kontext der Untersuchungseinheit Wort wiederum diverse Analysekategorien von der Einwort- bis Mehrworteinheit, vom Schlagwort bis zu Okkasionalismen (siehe u. a. Spitzmüller/Warnke 2011, 201). Diese der zunächst intratextuellen Ebene zugeordneten Untersuchungseinheiten, die sich in einzelnen Texten ausmachen lassen, werden im Rahmen von Diskursanalysen transtextuell, d. h. über den Einzeltext hinausgehend untersucht (vgl. ebd.). Um Diskursphänomene, die alle Texte bzw. eine Vielzahl von Texten gemein haben, systematisch bestimmen zu können, haben sich auch in der Diskurslinguistik mittlerweile softwaregestützte Verfahren etabliert. In diesem Kontext hat sich beispielsweise in der englischen Critical Discourse Analysis ein eigener Zweig, die sogenannten CADS (corpus-assisted critical discourse studies) als Abgrenzung zur Qualitativen Diskursanalyse entwickelt (vgl. Partington 2004; Partington/Duguid/Taylor 2013; Taylor 2013). In den folgenden Abschnitten wird zunächst dargestellt, wie diskursrelevante Wörter und Wortverbindungen, also die lexikalische Sprachebene, softwaregestützt analysiert werden können. Methodisch soll aufgezeigt werden, dass linguistische Diskursanalysen unter Rückgriff auf Softwareprogramme und Textsammlungen sowohl quantitative (z. B. statistische Verfahren zur Erfassung von Salienz und Distribution oder frequenzbasierte Korpusauswertung) als auch qualitative Methoden (der Blick in den Einzeltext) heranziehen können bzw. müssen, um Diskurse annähernd exhaustiv zu erschließen. Lexikalische Analysekategorien sind in verschiedenen diskurslinguistischen Arbeiten mit unterschiedlichen Zugängen (z. B. kognitionsorientiert bei Busse 2008; Ziem 2008) und unter Betrachtung verschiedener Analysekategorien (z. B. Schlüsselwörter oder Ad-hoc-Bildungen) analysiert worden. Eingeräumt werden muss, dass bei der korpuslinguistischen Analyse zahlreiche sprachliche Phänomene besser zu erschließen sind als andere (vgl. Bubenhofer 2009). Diskursanalysen, die sich auf Korpora als Datenbasis stützen und Analyseprogramme bei der Datenauswertung nutzen, sind immer wieder mit den Grenzen der Analyse konfrontiert. Bubenhofer kommt zu dem Schluss, dass die maschinelle Analyse von Korpusdaten (also induktiv) nur dann zufriedenstellend funktioniert, „wenn stark musterhafte Phänomene, die sich auf der Textoberfläche festmachen lassen, analysiert werden“ (Bubenhofer 2009, 91). Musterhafte sprachliche Strukturen auf der Textoberfläche (z. B. typische Wortkombinationen) sind somit wichtige Ansatzpunkte für die (korpus-)linguistische Diskursanalyse. Eine nur auf der Textoberfläche sprachliche Phänomene suchende (korpus-)linguistische Diskursanalyse kann aber die eingangs dargestellten
82
Derya Gür-Şeker
Ziele der Diskursanalyse keineswegs zufriedenstellend erreichen. Bubenhofer macht die Schwächen des korpuslinguistischen Zugangs (hier verstanden als induktiver Zugang, auch ‚corpus-driven‘) explizit bei sprachlichen Phänomenen aus, die nicht oder wie bei Metaphern nur zum Teil auf der Textoberfläche liegen (vgl. Bubenhofer 2009, 91f). Die Textoberfläche wird demzufolge zwar zum Ausgangspunkt diskurslinguistischer Ansätze, die jedoch, je nach Untersuchungsziel, ggf. ergänzend deduktive Methoden anwenden sollte. In diesem Abschnitt wird dargestellt, wie unterschiedliche Softwarefunktionen bei der diskursiven Analyse von Wörtern oder Wortverbindungen eingesetzt werden können. Die Analyse des Sprachgebrauchs auf lexikalischer Ebene kann mittels Software und digitaler Textsammlungen systematischer strukturiert und umgesetzt werden. Zu unterscheiden sind folgende fünf Aspekte der Korpusarbeit, die sich an Softwarefunktionen orientiert und in den folgenden Abschnitten mittels konkreter Analysebeispiele des sicherheitspolitischen EU-Reformdiskurses beschrieben wird: –
– – –
–
Der Einsatz der unterschiedlichen Analysewerkzeuge richtet sich nach dem Untersuchungsziel- bzw. -gegenstand. Möchte man etwa das Aufkommen und Verschwinden lexikalischer Phänomene innerhalb eines Diskurses ermitteln, werden i. d. R. Frequenzanalysen genutzt. Für die Ermittlung signifikanter syntagmatischer Strukturen (siehe Belica/Perkuhn in diesem Band) kann u. a. die sogenannte Clusteranalyse herangezogen werden. Zur näheren kontextuellen Betrachtung bestimmter Strukturen kann eine in unterschiedlicher Hinsicht angeordnete Konkordanzenübersicht hilfreich sein. Um Affinitäten zu kontextuell benachbarten Wörtern untersuchen zu können und Usualitäten im gemeinsamen lexikalischen Vorkommen (Kookkurrenz) ermitteln zu können, wird i. d. R. die sogenannte Kollokations- bzw. Kookkurrenzanalyse herangezogen. Einzelne Diskurse weisen sehr unterschiedlich relevante Schlüsselwörter auf. Um diese (im Vergleich zum Allgemeingebrauch außerhalb des Diskurses) erfassen zu können, gibt es heute Verfahren zur Ermittlung der Keyness, der Schlüsselworthaftigkeit. Diese werden nachfolgend näher erläutert.
3.1 Frequenzanalyse Im Rahmen von Diskursanalysen gibt es unterschiedliche Gründe für die frequentive Erschließung von Wörtern. Zunächst ermöglicht die Frequenzanalyse, das Vorkommen oder Nicht-Vorkommen des Suchwortes im Zeitverlauf diachron und synchron zu erschließen. Zur Veranschaulichung unterschiedlicher Softwarefunktionen wird der Themenkomplex Sicherheit exemplarisch herangezogen und auch am Beispiel des EU-Reformdiskurses veranschaulicht. Als Beispiel für die systematische Erfassung von Frequenzen im Zeitverlauf (Jahrzehnte) sei an dieser Stelle zunächst der Wortverlauf des Suchwortes Sicherheit (1900er-1990er Jahre) im DWDS-Kernkorpus visualisiert angeführt:
Das Wort im Diskurs
83
Wortverlauf für „Sicherheit“ im DWDS-Kernkorpus Belletristik
Zeitung
Gebrauchsliteratur
Wissenschaft
3000
2000
1000
0
1900er
1910er
1920er
1930er
1940er
1950er
1960er
1970er
1980er
1990er
Abb. 1: Wortverlauf der Suchworteingabe ‚Sicherheit‘ im DWDS-Kernkorpus (www.dwds.de )
Dieser visualisierte Wortverlauf (siehe auch 3.4) zeigt zunächst die Verwendung des Suchwortes ‚Sicherheit‘ im Zeitverlauf in unterschiedlichen Korpustexten – es lässt sich ohne den Einbezug vorliegender Kontexte nur erahnen bzw. auf Grundlage von Weltwissen erschließen, warum das Lexem zu bestimmten Zeiten signifikant häufiger oder geringer Verwendung findet. Das (Nicht-)Vorkommen, die Häufigkeit und Verteilung eines Wortes innerhalb eines Korpus muss also interpretiert werden – hierfür müssen natürlich entsprechende Kontexte eingesehen und erschlossen werden. Verlaufsanalysen können auch thematische Veränderungen innerhalb eines Diskurses zeigen und eignen sich für kontrastive Arbeiten, die Diskurse sprach- und länderübergreifend untersuchen (siehe Gür-Şeker 2012; Storjohann/Schröter 2013). Wichtig ist aber auch die Grundannahme, dass Wörter als Indikatoren für Einstellungen der Diskursakteure gewertet werden können, denn u. a. Stubbs (1996, 107) verdeutlicht, dass „[n]o terms are neutral. Choice of words expresses an ideological position“. Das durch Frequenzanalyse im Korpus ermittelte beispielsweise signifikant häufig vorkommende Wort kann dann schließlich unter Einbezug kontextueller Aspekte sowie Kollokatoren hinsichtlich eines möglichen Bedeutungswandels untersucht werden (vgl. Busse/Teubert 1994). Mittels Frequenzanalysen und dem häufiger oder seltener Vorkommen bzw. Nicht-Vorkommen spezifischer lexikalischer Elemente können ferner auch für öffentlich-politische Diskussionen typische Eigenschaften wie der von Klein (1989) beschriebene ‚Kampf um Wörter‘ diskursanalytisch erschlossen werden. Ziel ist es [beim Kampf um Wörter; dgş], mit den eigenen Wortprägungen und Bedeutungsspezifizierungen die darin steckenden Deutungen und Prioritäten bei den Adressaten durchzusetzen oder zu bestärken. (Klein 1989, 17)
84
Derya Gür-Şeker
Innerhalb von öffentlich-politischen Diskursen gibt es laut Klein (1989) konkurrierende Bezeichnungen für den ‚selben‘ Sachverhalt, die von öffentlichen Personen bewusst verwendet werden. Bei einer Bezeichnungskonkurrenz für einen Sachverhalt liegen mindestens zwei Bezeichnungen vor (vgl. Klein 1989, 17). Beispielsweise macht Klein (2010) eine Bezeichnungskonkurrenz für die Reform der Krankenversicherung in Deutschland aus. Danach bezeichnen die FDP und ihre Anhängerinnen und Anhänger ihr politisches Konzept als Gesundheitspauschale und erhofften sich, dass der Begriff Gesundheit positive Vorstellungen hervorruft, während die Gegner von Kopfpauschale sprechen und dabei auf die assoziative Nähe zu Negativbegriffen wie Kopfgeld, Kopfsteuer, Kopfjäger und Ähnliches setzen“ (Klein 2010, 12; Hervorhebungen i. O.).
Für die Ausdrücke liegt nach Klein somit eine Bezeichnungskonkurrenz vor, die mit Blick auf die Intention der Sprachteilhaberinnen und Sprachteilhaber spezifische Deutungen seitens der Adressatinnen und Adressaten verstärken sollen (siehe auch Schröter in diesem Band). Ein weiteres Beispiel für Bezeichnungskonkurrenz kann im Kontext des EU-Reformdiskurses ausgemacht werden. So ist es ein Unterschied, ob beispielsweise der ‚Staatenverbund‘ Europäische Union, der auch sicherheitspolitische Ziele verfolgt, als Friedensmacht oder Militärmacht bezeichnet wird (vgl. Gür-Şeker 2012, 152ff). Diese Einblicke in die beiden Reform-Diskurse zeigen, dass in spezifischen Diskursen spezifische Wörter vorkommen, die nicht neutral verwendet werden (siehe auch Stubbs 1996, 107), sondern immer auch (Akteurs-)Einstellungen vermitteln. Die Frequenzanalyse kann somit nicht nur im Diskurs vorkommende Einstellungen, sondern gleichzeitig auch bestehende Konfliktlinien im Zeitverlauf bestimmen.
3.2 Clusteranalyse Zur systematischen Bestimmung von Zwei-, Drei- oder Mehrworteinheiten umfassen die meisten Textanalyseprogramme mittlerweile die Funktion ‚Cluster‘. ‚Cluster‘, auch bezeichnet als sogenannte ‚Klumpen‘, sind Ausdrücke, die überzufällig oft gemeinsam auftreten. Sie können einerseits herangezogen werden, um Sprachgebrauchsmuster und darauf aufbauend Diskursgebrauchsmuster im Untersuchungsmaterial systematisch zu bestimmen (siehe dazu 4.2). Andererseits kann die Clusteranalyse erste Diskursmerkmale oder aber auch vorkommende Einstellungen im Diskurs überblicksartig auflisten, die dann bei der Kontextanalyse näher in den Blick genommen werden können (siehe Abbildung 2, z. B. Diskursmerkmale/Einstellungen aufgezeigt durch die Kollokatoren künftig, neu, geplant oder gegen des Suchwortes ‚EU-Verfassung‘). Partington/Duguid/Taylor (2013, 19) verdeutlichen diesbezüglich:
Das Wort im Diskurs
85
In discourse terms, they reveal typical ways of saying things and therefore typical author/speaker messages […]. The study of clusters can […] tell us a great deal about how speakers and writers go about the construction of particular kinds of discourse.
Je nach Analyseprogramm und seinen Einstellmöglichkeiten bestehen Cluster aus unmittelbar benachbarten Wörtern oder auch aus diskontinuierlichen Syntagmen. Wie Dreiworteinheiten im Rahmen eines speziellen Diskurses (hier der sicherheitspolitische EU-Reformdiskurs) erfasst und visualisiert werden können, zeigt die nachfolgende Abbildung am Beispiel des Suchwortes ‚EU-Verfassung‘ im deutschsprachigen DEUVAS-Korpus auf (siehe Abbildung 2). Das DEUVAS-Korpus wurde zur Analyse des deutschsprachigen Diskurses über die EU-Verfassung mit Fokus auf die Verteidigungs-, Außen- und Sicherheitspolitik aufgebaut und enthält 466 Medientexte, die im Zeitraum 2001 bis 2007 veröffentlicht wurden (siehe Gür-Şeker 2012, 82ff). N
Cluster
Freq.
Length
1
ÜBER DIE EU-VERFASSUNG
31
3
2
IN DER EU-VERFASSUNG
18
3
3
FÜR DIE EU-VERFASSUNG
15
3
4
DIE EU-VERFASSUNG IN
11
3
5
FÜR EINE EU-VERFASSUNG
10
3
6
REFERENDUM ÜBER DIE
8
3
7
ENTWURF DER EU-VERFASSUNG
8
3
8
UM DIE EU-VERFASSUNG
8
3
9
DER KÜNFTIGEN EU-VERFASSUNG
8
3
10
DIE GEPLANTE EU-VERFASSUNG
8
3
11
DIE EU-VERFASSUNG DIE
8
3
12
DIE KÜNFTIGE EU-VERFASSUNG
8
3
13
MIT DER EU-VERFASSUNG
7
3
14
IST DIE EU-VERFASSUNG
7
3
15
DIE NEUE EU-VERFASSUNG
7
3
Abb. 2: Clusteranalyse des Suchwortes ‚EU-Verfassung‘ im deutschsprachigen DEUVAS-Korpus mittels Analysetool ‚WordSmith‘
Warum und wie Diskursforschende überhaupt Zwei- oder Mehrworteinheiten analysieren sollten, wird im Abschnitt 4 näher erörtert. Nachfolgend geht es um die Ziele der Konkordanzanalyse.
86
Derya Gür-Şeker
3.3 Konkordanzanalyse Die Kontexte eines Suchwortes werden in der Fachliteratur entweder als ‚Konkordanz‘ (engl. ‚concordance‘) oder ‚key word in context‘ (kurz: KWIC) bezeichnet. In Analyseprogrammen oder Recherchesystemen werden die Kontexte in Form von KWIC-Zeilen (engl. ‚concordance lines‘) aufgeführt und ermöglichen damit die Sichtung und Interpretation einzelner Kontexte eines bestimmen Suchwortes, die, je zugrunde gelegten Kriterien, synoptisch dargestellt ist. Während das Heranziehen von Frequenzlisten eine quantitative Methode darstellt, verbindet die Konkordanzanalyse quantitative und eher qualitative Analysemethoden (vgl. Baker 2007, 71 u. 89), die daher die Kompetenz der Forschenden stärker ein- und herausfordern. A concordance analysis is one of the more qualitative forms of analysis associated with corpus linguistics. While concordance programs allow researchers to sort and therefore view the data in a variety of different ways, it is still the responsibility of the analyst to recognize linguistic patterns and also to explain why they exist. (Baker 2007, 89)
Die eigentliche Herausforderung bei der Konkordanzanalyse stellt die Untersuchung, also das Sortieren, die Interpretation, die Kategorisierung und das Erschließen diskursiver Phänomene mittels Konkordanzergebnissen dar. In Bezug auf die systematische Auswertung von Kontexten und diskursiv vorliegende Konzepte verdeutlicht Fraas (2005, 254): Wenn Kontextdaten systematisch ausgewertet werden, können empirisch gesicherte Aussagen über Interpretationen diskursiv zentraler Konzepte getroffen werden, was Rückschlüsse auf die verbale Konstruktion von Wirklichkeit und – bei diachroner Betrachtung – über Veränderungen dieser Wirklichkeitskonstruktionen zulässt.
Die Kontextanalyse wird somit zum zentralen Ansatz, wenn es beispielsweise um die Erschließung von Wortbedeutungen, Metaphern oder Wissensrahmen geht, bei der auch ergänzende bzw. darauf aufbauende Kollokationsanalysen eine wichtige Rolle spielen (siehe 3.4). Durch Konkordanzanalysen können aber auch Einstellungen, Sprecherbewertungen und weitere sprachliche Merkmale bzw. Regularitäten (z. B. Sprachgebrauchsmuster) entdeckt und erschlossen werden. Ein Beispiel, wie Sprecherinnen und Sprecher die EU-Verfassung bewerten, kann über eine Konkordanzanalyse der Suche ‚Verfassung ist‘ erschlossen werden (siehe Abbildung 3).
Das Wort im Diskurs
87
Abb. 3: Konkordanzanalyse der Suche ‚Verfassung ist‘ mittels ‚WordSmith‘
Die Konkordanzanalyse von ‚Verfassung ist‘ zeigt, dass es unterschiedliche Positionen in Bezug auf die inhaltliche Konzeption, den Nutzen und die Folgen des Reformwerkes gibt. In der Deutschen Welle Online vom 27.5.2005 lassen sich durch die Suchwortkombination gezielt Positionen der Kritiker herausarbeiten wie: Die Europäische Verfassung ist undemokratisch [Kritiker ist u. a. Gerd Müller, CSU], Die Europäische Verfassung ist kriegstreiberisch [Kritiker sind ATTAC und Friedensorganisationen], Die Europäische Verfassung ist neoliberal und antisozial [Kritiker sind Gewerkschaften, Globalisierungskritiker und ATTAC] (Deutsche Welle, 27.5.2005).
Positive Stimmen finden sich u. a. in der Süddeutschen Zeitung vom 25.6.2004 – dort heißt es in einem Interview mit dem damaligen deutschen Außenminister Joschka Fischer beispielsweise: Diese Verfassung ist eine große Leistung aller beteiligten 28 Staaten […].
Oder den ehemaligen Bundeskanzler Gerhard Schröder zitierend: Die EU-Verfassung ist ein guter Rahmen (Spiegel Online, 13.9.2004).
Ohne auf alle Zeilen der Konkordanzanalyse einzugehen, zeigt bereits dieser kurze Ausflug in die Kontexte, wie viel Potenzial hinter dieser Funktion steckt. Nicht ungenannt sollte an dieser Stelle bleiben, dass die Konkordanzanalyse Segen, aber auch Fluch zugleich sein kann, da bei großen Korpora eine Kontextvielfalt nicht nur viel Untersuchungszeit einfordert, sondern auch das Bündeln bzw. Gruppieren der Analyseergebnisse und schließlich Interpretationsleistungen erfordert. Bereits über die mit der Konkordanzanalyse verbundene überblicksartige Auflistung der Kontexte eines
88
Derya Gür-Şeker
Suchwortes sowie Volltexte können Forschende auch auf andere sprachliche Phänomene wie z. B. häufig vorkommende Kollokatoren eines Suchwortes stoßen.
3.4 Kollokationsanalyse Kollokationen (auch ‚Kookkurrenzen ‘ oder ‚Partnerwörter/Nachbarwörter des Suchwortes‘) sind zwei oder mehrere beliebige Wörter, die in einem Korpus statistisch signifikant gemeinsam auftreten (vgl. Belica/Perkuhn in diesem Band). Bubenhofer beschreibt die Kollokationsanalyse als [e]ine klassische Möglichkeit, typische Kontexte von bestimmten Lexemen systematisch auszuwerten […]. Mit statistischen Mitteln werden Frequenzen ausgewertet, mit denen Lexeme in der definierten Umgebung eines spezifischen Lexems erscheinen. Resultat ist eine Liste von Kollokationen, die signifikant häufig zusammen mit dem definierten Lexem auftreten […]. (Bubenhofer 2013, 112 ff.).
Softwaregestützte Kollokationsanalysen ermöglichen es, die im authentischen Sprachmaterial vorliegenden Assoziationen zwischen den einzelnen Wörtern zu erfassen, und tragen somit auch zur Erschließung von Wortbedeutungen im Diskurs bei. Nach Storjohann (2007, 576) seien Kollokationen bestimmter diskursrelevanter Suchwörter „sprachliche Indikatoren für soziale Argumentationen und Thematisierungen, mentalitätsbezogene Sprechereinstellungen sowie zeitgeschichtliche gesellschaftliche Bewertungen“ und ermöglichten Rückschlüsse auf „semantischpragmatische“ und „diskursiv-thematische Aspekte“. Dass durch Kollokationsanalysen Sprechereinstellungen oder gesellschaftliche Bewertungen bestimmt werden können, kann exemplarisch am Lexem Verfassung und seinen Kompositabildungen im EU-Reformdiskurs aufgezeigt werden: Werden die 608 Kollokatoren der Suchworteingabe *Verfassung* erschlossen, geht es um Ablehnung (20), Verfassungsgegner (18), Kritik (11), Widerstand (5), Gegner (5), wobei die negative Haltung gegenüber der neuen EU-Verfassung (18) auch mittels Kollokatoren wie gegen (45), ablehnen (10) oder Ablehnung (20) ausgedrückt wird. Dagegen werden positive Haltungen lexikalisch durch Nomen wie Befürworter (6), Anhänger (5) oder Kompositabildungen wie Verfassungsbefürworter (5) vermittelt; diese bleiben jedoch eindeutig in der Minderheit. Einstellungen gegenüber der Verfassung spiegeln sich somit überwiegend in negativ konnotierten lexikalischen Mitteln wider. (Gür-Şeker 2012, 126)
Durch die quantitative Erfassung der Kollokatoren sind somit nicht nur Rückschlüsse auf Einstellungen oder gesellschaftliche Bewertungen möglich, sondern erschließbar sind auch eher verbreitete und weniger vertretene Meinungen und Themenschwerpunkte im Diskurs. Mittlerweile ist die Kollokationsanalyse in fast allen Analyseprogrammen eine Standardfunktion. Den im Diskurs vorkommenden typischen Sprachgebrauch
Das Wort im Diskurs
89
können Forschende auf Grundlage der Kollokationsergebnisse auch eigenständig visualisieren. Baker (2007, 116 f.) bezeichnet die durch Forschende anhand der Analyseergebnisse erstellte Visualisierung als „collocational networks“ und beschreibt deren Ziel wie folgt: By plotting links between collocates in this way, either in a table or a chart, we can start to see closer links between words which point at different types of discourses. (Baker 2007, 116)
Die Visualisierung der Analyseergebnisse hilft somit auch, die Datenmenge visuell so zu bündeln, dass Zusammenhänge und Affinitäten eher ersichtlich werden, als dies beispielsweise mittels Auflistung in Ergebnistabellen der Fall wäre (siehe Wortwolke in Abbildung 4).
Abb. 4: Schlagwörter im Text+Berg-Korpus (www.deutschestextarchiv.de/files/ Bubenhofer_TextBergDiachron.pdf, 15 )
3.5 Keyness Die Software-Funktion keyness – auch übersetzbar als Schlüsselworthaftigkeit – erfasst zentrale Lexeme innerhalb eines Korpus meist im Vergleich zu einem Referenz- oder Vergleichskorpus. Scott (2014) definiert keyness folgendermaßen: A word which is positively key occurs more often than would be expected by chance in comparison with the reference corpus. A word which is negatively key occurs less often than would be expected by chance in comparison with the reference corpus.
Diese Funktion ist somit nicht mit der Eingabe von Suchwörtern z. B. zur Erfassung von Frequenzen eines Wortes innerhalb der Textsammlung zu verwechseln, denn
90
Derya Gür-Şeker
durch keyness können die innerhalb eines Textkorpus vorkommenden Wörter im Verhältnis zu einem Referenzkorpus oder Teilkorpus gesetzt werden. In CORPUS LINGUISTICS, keyness is the relative frequency of a particular linguistic item in one text or corpus when compared against another text or corpus via statistical tests of significance […]. Many tests of keyness are carried out on single words, deriving a list of KEYWORDS. (Baker/ Ellece 2011, 66; Hervorhebungen i. O.)
Ziel der Nutzung der Keyness-Funktion ist es, aufgebaute Textsammlungen mit einem Referenz- oder Vergleichskorpus zu kontrastieren und dadurch zentrale Lexeme innerhalb des Untersuchungskorpus im Vergleich zu ermitteln (siehe dazu Baker 2005, 2007). Beispielsweise zeigt Baker (2007, 121ff) in seiner Einführung in die Verwendung von Korpora in der Diskursanalyse mittels Keyness-Analyse zum Thema pro und contra Jagd, wie Politiker, die Jagdgegner sind, im Vergleich zu den Befürwortern Wörter wie strong, toughen, weakness verwenden, die semantisch der Kategorie ‚Härte‘ (engl. ‚toughness‘) zuzuordnen sind, um ihre Gegner als ‚schwach‘ darzustellen. Während Befürworter eher Wörter verwenden, die semantisch dem Bereich ‚sinnvoll‘ (z. B. Wörter wie reasonable oder rational) angehören, um ihre Position als ‚gesunden Menschenverstand‘ (engl. common sense) darzulegen, um die Position der Gegner damit als ‚unlogisch‘ zu markieren (vgl. Baker/Ellece 2011, 66). Über die Keyness-Funktion lassen sich somit auch Diskurspositionen im Vergleich herausarbeiten. Insbesondere für Untersuchungen, die auf großen Korpora basieren, ist die Keyness-Funktion ein wichtiges Instrumentarium, um erste dominierende oder auch unterrepräsentierte sprachliche Merkmale bzw. Phänomene eines Untersuchungsgegenstandes zu ermitteln und darauf aufbauend weitere Analysen durchzuführen.
4 Mögliche Untersuchungsgegenstände und Ansätze In diesem Abschnitt werden exemplarisch unterschiedliche Zugänge auf das Wort im Diskurs gewählt. Zunächst rückt das (Diskurs-)Schlüsselwort als Untersuchungsobjekt in den Vordergrund, dabei werden auch in der Forschungsliteratur vorkommende Abgrenzungsversuche zum Schlagwort thematisiert. Dann geht es um Sprachgebrauchsmuster, die sich um Diskurs-Schlüsselwörter bilden (können). Abschließend werden frameanalytische Perspektiven auf das Wort im Diskurs vorgestellt.
Das Wort im Diskurs
91
4.1 Das Diskurs-Schlüsselwort Für das Schlüsselwort als (diskurslinguistisches) Untersuchungsobjekt ist zu Beginn festzuhalten, dass es in der linguistischen Forschungsliteratur unterschiedliche Grundannahmen darüber gibt, was unter einem Schlüsselwort zu verstehen ist. Es gibt also keine einheitliche Begriffsdefinition – dies gilt auch für das sogenannte Schlagwort (siehe dazu auch Schröter in diesem Band). So verdeutlicht beispielsweise Niehr (2014, 347 f.) in Bezug auf das Schlüsselwort, dass „[n]och weniger als beim Terminus Schlagwort […] sich eine einheitliche Begriffsverwendung ab[zeichne].“ Dennoch sind beide Entitäten explizit benannte Untersuchungsobjekte, z. B. im Rahmen von Überblicksartikeln bzw. Einführungen in die Diskursanalyse (siehe u. a. Gardt 2007, 28 oder Spitzmüller/Warnke 2011, 201), in Untersuchungen wie z. B. im Sammelband ‚Kontroverse Begriffe‘ (1995) um die ‚Düsseldorfer Schule‘ oder in Aufsätzen wie Teubert (2010), um nur einige an dieser Stelle zu nennen. Dezidierte Abhandlungen zum Schlüsselwort finden sich u. a. bei Hermanns (1994), Liebert (1994) oder Böke (1996) mit diskursanalytischer Perspektivierung. Nachfolgend sollen verschiedene Versuche, die bemüht sind, das linguistische Konzept des Schlüsselworts zu definieren, vorgestellt werden, um schließlich eine mögliche Definition des Diskurs-Schlüsselworts bestimmen zu können. In Lieberts Abhandlung zum „analytischen Konzept ‚Schlüsselwort ‘ in der linguistischen Tradition“ (1994) heißt es zur Abgrenzung von Schlag- und Schlüsselwörtern wie folgt: „Sind Schlagwörter Wörter, mit denen eine Auseinandersetzung geführt wird, so sind Schlüsselwörter Wörter, um die sich die Auseinandersetzung dreht“ (Liebert 1994, 4; Hervorhebungen i. O.). Auch dieser Abgrenzungsversuch kann durchaus als vereinfachend eingestuft werden und ist umstritten (vgl. Niehr 2014, 348). Girnth definiert ‚Schlüsselwort ‘, auch bezeichnet als ‚Symbolwort‘ (‚key symbols‘ oder ‚Leitvokabeln‘) wie folgt: Symbolwörter haben die Funktion, die komplexe Wirklichkeit, vereinfachend, man könnte auch sagen verdichtend, darzustellen [z. B. Freiheit, Demokratie, Menschenrechte; dgş]. In der öffentlich-politischen Kommunikation sind sie auf Grund ihrer Reduktionsleistung leicht verfügbar und besitzen eine starke emotionale Anziehungskraft auf die Adressaten […]. Ihre Semantik ermöglicht Rückschlüsse auf das Denken und Handeln einer Sprachgemeinschaft. Ein Symbolwort kann entweder als einzelnes Wort oder als Wortgruppe (Recht auf Selbstbestimmung) auftreten. (Girnth 2002, 52; Hervorhebung i. O.)
Girnth rückt somit die Reduktionsleistung und die Adressatenperspektive des Schlüsselworts in den Vordergrund. Nach Niehr (2014, 347; Hervorhebung i. O.) ist zunächst „der Terminus keyword aus der quantitativen Korpuslinguistik vom allgemeinen Konzept des Schlüsselworts [zu unterscheiden]“. Niehr (2014, 347) beschreibt Bezug nehmend auf Klein (2010) und Böke (1996) hierbei auch eine „neue Auffassung von Schlüsselwörtern“, die die
92
Derya Gür-Şeker
„Schlüssel-Metaphorik“ aufgriffen und Schlüsselwörter als solche Entitäten verstehen, „die BeobachterInnen helfen, einen Diskurs zu ‚erschließen‘“. Trotz unterschiedlicher Grundverständnisse, was unter einem Schlüsselwort zu verstehen ist, ist in Bezug auf korpusbasierte Diskursanalysen grundlegend festzuhalten, dass die Bedeutung eines Schlüsselwortes „vom Kontext des Kommunikationsprozesses[, also vom Diskurs; dgş] abhängig [ist]“ (Liebert 1994, 4). Und letztlich geht es, wenn wir von einer softwaregestützten Diskursanalyse ausgehen, die auf digitale Textsammlungen basiert, um Wörter, die über Suchworteingaben erschlossen und mittels vorausgehend beschriebener Funktionen und unterschiedlicher Ansätze systematisch analysiert werden (können). Hierbei können sich einige Wörter quantitativ stärker, andere hingegen geringer heraus kristallisieren und beispielsweise durch Kontrastierungen mit Vergleichskorpora Diskursrelevanz gewinnen. Daher wird an dieser Stelle auch mit Blick auf die Vielzahl unterschiedlicher Gebrauchsverwendungen des Terminus Schlüsselwort konstatiert, dass das Diskurs-Schlüsselwort, um die sich die Untersuchung schlussendlich ‚dreht‘ bzw. ‚drehen kann‘, als wichtiger erster Ankerpunkt der Untersuchung einzustufen ist, von dem weitere DiskursErkenntnisse erschlossen werden und dessen Grundverständnis im Rahmen diskurslinguistischer Untersuchunen immer auch explizit definiert werden muss und je nach Untersuchungsziel entsprechend unterschiedlich ausgerichtet sein kann. Über das ‚Drehen‘ um einen Diskursstrang ‚eröffnet‘ sich den Forschenden schließlich der Diskurs und kann sich darüber mit unterschiedlichen Verfahren (siehe 3.1 bis 3.5) ‚erschließen‘ lassen.
4.2 Sprachgebrauchsmuster Wörter können im Diskurs signifikant häufig mit anderen Wörtern in Verbindung stehen und dadurch rekurrente Muster bzw. Wortverbindungen, sogenannte Sprachgebrauchsmuster, bilden. Sprachgebrauchsmuster können hierbei entweder thematisch gefüllt (z. B. Kampf gegen den Terror) oder thematisch unabhängig sein (z. B. einerseits … andererseits) (vgl. Bubenhofer 2009, 6; siehe auch Bubenhofer 2008). Nach Bubenhofer (2009) spiegelt sich musterhafter Sprachgebrauch in Wortverbindungen [wider], die typisch für bestimmte Textmengen, also allgemeiner: Sprachausschnitte, sind. Diese Wortverbindungen üben eine Art Vorbildfunktion zur Produktion weiterer Wortverbindungen aus. Als Resultat ist dann ein musterhafter Sprachgebrauch in diesem Sprachausschnitt sichtbar. Wie das Eingangsbeispiel gezeigt hat [Kollokatoren zu Tisch; dgş], kann musterhafter Sprachgebrauch statistisch operationalisiert werden. Es sollte also möglich sein, in einer großen Textmenge mit maschinellen Verfahren ‚Cluster‘ von typischem Sprachgebrauch zu extrahieren. (Bubenhofer 2009, 5)
Ziel des korpuslinguistischen Ansatzes nach Bubenhofer (2009) ist es, induktiv (theoriearm) und somit ‚corpus-driven‘ (von den Daten inspiriert) Textkorpora zu erfor-
Das Wort im Diskurs
93
schen und musterhafte Strukturen, die auf der Textoberfläche liegen, zu erschließen. Diskurse sollen mittels korpuslinguistischer Methoden analysiert werden, um dem Grundverständnis, wonach Diskurse sich durch Regelmäßigkeiten auszeichnen, gerecht zu werden. Nach Bubenhofer (2009) ist musterhafter Sprachgebrauch folglich ein zentraler Indikator für Diskurse, der zur Identifizierung von Diskursen zu untersuchen ist (vgl. Bubenhofer 2009, 309). Damit geht Bubenhofer in seinen Analysen anders als die begriffsgeschichtliche Tradition der Diskursanalyse (vgl. Busse/ Hermanns/Teubert 1994) nicht vom Wort aus, sondern legt den Fokus auf Wortverbindungen, die zum zentralen Untersuchungsgegenstand einer korpuslinguistischen Diskursanalyse werden, welche sich durch quantitative Analysemethoden auszeichnet (vgl. Bubenhofer 2009, 309). Je nach Untersuchung, der natürlich auch ein spezielles themengebundenes Korpus zugrunde liegen kann, sind unter typischen Sprachgebrauchsmustern nicht Wortgruppen zu verstehen, die typischerweise auch in anderen Diskursen Verwendung finden können, also typisch für den Sprachgebrauch auch ‚außerhalb‘ eines bestimmten Diskurses sind. Der individuellen Analyse geht es meist um die im jeweiligen vorliegenden Untersuchungskorpus rekurrent vorkommenden typischen Wortgruppen, die im Diskurskorpus erschließbar sind. Natürlich sind dann bestimmte thematisch gefüllte Sprachgebrauchsmuster wie Kampf gegen X auch in andere Diskurse übertragbar bzw. rekurrieren auf spezifische Diskurse wie den Finanz-Diskurs (Kampf gegen die Heuschrecken) usw. D. h. im Gegensatz zu Bubenhofer muss die Erschließung von Sprachgebrauchsmustern im themengebundenen Untersuchungskorpus nicht durch den systematischen Abgleich des Untersuchungskorpus mit anderen Vergleichs- bzw. Referenzkorpora (vgl. Bubenhofer 2008, 417) erfolgen, um diese dann nach Bubenhofer (2009) als sogenannte ‚typische Sprachgebrauchsmuster‘ einstufen zu können. Natürlich können dann in einem weiteren Schritt der themengebundenen Analyse durchaus Vergleichskorpora herangezogen werden, um anhand ermittelter Frequenzen die gesellschaftliche Verbreitung eines im Untersuchungskorpus erschlossenen Sprachgebrauchsmusters zu ermitteln. Um thematische Stränge eines Diskurses zu erkennen, können die ermittelten Sprachgebrauchsmuster in einem weiterführenden Untersuchungsschritt auch textübergreifend gebündelt und gruppiert werden – bezeichnet als sogenannte Diskursgebrauchsmuster. In Anlehnung an Mahlbergs (2007, 193) Konzept der ‚local textual functions‘ verstehen Storjohann/ Schröter (2013, 194) unter Diskursgebrauchsmustern „keine typische einzelne syntagmatische Konstruktion im strikten korpuslinguistischen Sinn oder ein Sprachgebrauchsmuster im Sinne Bubenhofers (2009), sondern eine eher thematisch-diskursiv orientierte textübergreifende Verwendungsweise, die regelhaft im Korpus in verschiedenen Quellen belegt ist und sich aufgrund einer Ansammlung von verschiedenen lexikalischen Indikatoren und deren relevanten Kontexten herausbildet […]“. Um beispielsweise die Bedeutung von Wirtschaftskrise/financial crisis zu bestimmen, erschließen Storjohann/Schröter (2013, 195ff) insgesamt zehn Diskursgebrauchsmuster, ihre jeweiligen Kollokatoren sowie die dazugehörigen Kontexte. Sie ermitteln mit
94
Derya Gür-Şeker
diesem Ansatz beispielsweise das Diskursgebrauchsmuster ‚Konsequenzen der Krise‘ mit den Kollokatoren Auswirkungen, Folgen, Kurzarbeit, soziale Unruhen usw., die die Konsequenzen der Krise bezeichnen. Diese gebündelten Diskursgebrauchsmuster, die den Diskurs besser auffächern und sich auf „das Verhältnis eines Schlagwortes zu seinen Kontexten im Text und in seiner Funktion der Textbedeutung [konzentrieren]“ (Storjohann/Schröter 2013, 195), erweitern folglich Bubenhofers Ansatz der Sprachgebrauchsmuster (siehe hierzu ausführlicher Mahlberg 2007; Storjohann/Schröter 2013).
4.3 Wörter, Diskurs und Frames Bei der Analyse von Diskursen wird auch auf die Frame-Analyse (engl. frame analysis) zurückgegriffen. In unterschiedlichen Forschungsdisziplinen wie den Kognitionsoder Sozialwissenschaften und auch der Linguistik werden Frames, ebenso bezeichnet als sogenannte Wissensrahmen oder Schemata, seit Jahrzehnten u. a. inspiriert von der Künstlichen-Intelligenz-Forschung „zur Beschreibung von Wissensordnungen und deren Rolle in Verstehens- und Interpretationsprozessen herangezogen“ (Fraas 2013, 260; Hervorhebungen dgş). Die Vielzahl der Beschäftigungen mit Frames innerhalb unterschiedlicher Forschungstraditionen hat zur Folge, dass sowohl seine [des Frame-Konzepts] begriffliche Klärung als auch sein analytischer Einsatz in empirischen Studien an die jeweils aktuellen Erkenntnisinteressen der unterschiedlichen Forschungsrichtungen gebunden [sind], was eine integrative Sicht der unterschiedlichen Ansätze erschwert. (Fraas 2013, 261)
Ohne an dieser Stelle einen historischen Überblick zur Entstehung des Frame-Gedankens bzw. der Frame-Theorie und zentraler Vertreterinnen und Vertreter wie des Linguisten Charles J. Fillmore oder des Kognitionswissenschaftlers Marvin Minsky geben zu können, soll auf Arbeiten von Busse (2012) oder Ziem (2008) verwiesen werden, die ausführliche Forschungsüberblicke enthalten. ‚Frames‘ als Untersuchungsgegenstände werden vor allem in diskursanalytischen Arbeiten mit kognitiver Ausrichtung (vgl. Fraas 1996; Konerding 1993; Wrede 2013; Ziem 2008) als „grundlegende Ordnungsstruktur von semantischem Wissen sowie [als] […] analytisches Werkzeug zur Untersuchung ebendieser Strukturen“ (Ziem 2014, 154) verstanden. In diesem Zusammenhang hat sich innerhalb der Linguistik auch die sogenannte Frame-Semantik als ein wichtiger Ansatz herausgebildet, der die semantische Erforschung diskursiven Wissens und insbesondere Prozesse lexikalischer Bedeutungskonstitution in den Fokus rückt (siehe dazu Busse 2009, 80 ff. oder ausführlicher Busse 2012).
Das Wort im Diskurs
95
Die Frame-Semantik ist heutzutage ein Forschungsgebiet – präziser müsste man eigentlich sagen: eine Ansammlung von verschiedenen Forschungsansätzen, (Teil-)Theorien, Modellen und Projekten –, das im Schnittfeld mehrerer benachbarter Disziplinen liegt. (Busse 2012, 23)
Im Kompendium zur Frame-Semantik beschreibt Busse (2012, 106) Frames folgendermaßen: Frames […] sind so etwas wie Alltags-Theorien, die bestimmte Sektoren des Wissens in festen begrifflichen Strukturen ‚bündeln‘. Gelegentlich können die verstehensrelevanten Frames ein ziemliches Ausmaß annehmen, d. h., sehr viel an Wissen voraussetzen oder integrieren, das für das Verstehen eines Wortes notwendig ist […].
Doch wie können Frames diskursanalytisch vor allem mit Blick auf Korpora als Datengrundlage erschlossen werden? Hierbei spielen zunächst Variablen, über die Frames strukturiert werden, und im Englischen als ‚slots‘ und ‚fillers‘ bezeichnet werden eine wichtige Rolle. So erläutert Fraas (2000, 41; Hervorhebungen i. O.) diese wie folgt: [Frames] […] stellen komplexe Strukturen aus sogenannten Slots und Fillers dar. Slots stehen für Variablen, die mit Erfahrungswerten verbunden sind. In Vertextungs- bzw. Verstehensprozessen werden diese Variablen mit konkreten Werten, den Fillers, besetzt. Auf diese Weise geben Frames eine Struktur für Wissensausschnitte vor, die in konkreten Sprachverwendungssituationen kontextuell aufgefüllt wird. Sie modellieren quasi das Kontextualisierungspotential von Wissensbereichen, die an lexikalische Einheiten gebunden sind und im Falle der konkreten Vertextung von Sprecher und Hörer aktiviert werden können.
Wie diese komplexen Strukturen im Diskurs erfasst werden können, zeigt Fraas (1996) in der Untersuchung „Gebrauchswandel und Bedeutungsvarianz in Textnetzen“ über den Einsatz „computergestützt gespeicherte und recherchierbare[r] Korpora des Instituts für deutsche Sprache“ (Fraas 1996, 5) sowie Kollokationsanalysen, die die Vertextungen der Konzepte IDENTITÄT und DEUTSCHE im Diskurs zur deutschen Einheit erschließen helfen. Exemplarisch für das Wort ‚Sicherheit‘ im sicherheitspolitischen EU-Reformdiskurs (siehe Gür-Şeker 2012) können dessen Slots und im Diskurs vorkommende Kollokationen als Filler wie folgt skizziert werden: – – – – –
Sicherheit wovor (Substantive): neue Bedrohungen, Abwehr von Gefahren, Terror, Terrorismus, Terroristen; Sicherheit für wen (Personen, Staaten): (EU-)Bürger, Bevölkerung, Menschen, Staaten (z. B. bezogen auf Deutschland: uns, unsere Sicherheit); Sicherheit wofür (Substantive): Sicherheit ihres Gebiets (EU), der Grenzen, Stabilität, Wohlstand, Frieden, um Kriege zu vermeiden, Freiheit, Erhaltung von freiheitlicher Lebensweise; Welche Art von Sicherheit (Adjektive): innere, äußere, europäische, gemeinsame, soziale, militärische, geteilte, mangelnde, große; Was wird mit Sicherheit gemacht (Verben): für Sicherheit wird gesorgt, Sicherheit wird verlangt, ausgebaut, geschaffen, empfunden, um Sicherheit wird sich gekümmert.
96
Derya Gür-Şeker
Ebenfalls den Sicherheitsdiskurs betreffend konzentriert sich Wrede (2013) hingegen u. a. auf die Analyse der Frame-Struktur des Ausdrucks 11. September. Unter Einbezug verschiedener Korpora, Kontext- und Kollokationsanalysen kommt die Untersuchung für den Ausdruck 11. September zu dem Schluss, dass [sich] der Frame ab 2001 als stark durch den Diskurs um die Ereignisse geprägt dar[stellt]: die Frame-Leerstellen vervielfachen sich; durch die usuelle Kotextualisierung des Ausdrucks in inhaltlichen Dimensionen um folgeschwere Taten, Orte, Akteure, Betroffene, Auswirkungen und Reaktionen erwirbt 11. September semantische Komplexität […] (Wrede 2013, 340; Hervorhebung i. O.).
Die vorausgehenden Untersuchungen nutzen Korpora, Kontext- und im Speziellen Kollokationsanalysen, um Frames spezieller Wörter im Diskurs systematisch zu erschließen. Dennoch sind auch große Herausforderungen und Grenzen der FrameSemantik in Bezug auf den diskursanalytischen Zugang auszumachen. Die Einbindung von Wissensrahmen in diskursanalytische Arbeiten funktioniert nur sehr eingeschränkt, weil davon ausgegangen wird, dass es funktioniert Korpusdaten in ein vorhandenes Schema zu ‚pressen‘, also corpus-based voranzugehen. Arbeitet man allerdings corpus-driven, also theoriearm und von den Daten ‚inspiriert‘, dann ist festzustellen, dass die zum Teil vorhandenen Wissensrahmen extrem lückenhaft sind. Letzteres lässt sich jedoch nur bei einer gründlichen Diskursanalyse erschließen. So verdeutlicht Ziem (2005, 9) in Bezug auf die Grenzen dieses Ansatzes: Je höher der Abstraktionsgrad der analysierten Frame-Strukturen, d. h. insbesondere ihrer integralen Default-Werte ist, desto schwerer ist es, sie frame-analytisch zu ermitteln. Denn DefaultWerte können nur indirekt, nämlich über prototypentheoretische empirische Untersuchungen identifiziert werden. Gehören sie aber so fundamental zum historischen Selbstverständnis einer Sprachgemeinschaft, dass sie kaum eigens thematisiert werden, ist natürlich auch ihre empirisch-quantitative Erfassung schwierig.
Spitzmüller/Warnke (2011, 94 f.) konstatieren zur Rolle korpustechnischer Verfahren im Rahmen frame-basierter Diskursanalysen: Das korpustechnische Verfahren, welches Fraas (1996) zur Ermittlung von diskursivem Wissen eingeführt hat, nämlich die computergestützte Berechnung von Mustern, wie sie Kookkurrenzen darstellen, wurden von ihren Nachfolgern hingegen nicht konsequent aufgegriffen. Weiterhin werden Frames eher durch interpretative Analyse als durch Musterberechnungen ermittelt. Gerade hier liegt aber eine weiteres viel versprechendes Potenzial diskurslinguistischen Arbeitens: Der so genannte korpusgenerierte (>corpus-drivencorpus-basedpolitischen Semantik Verb, die im Deutschen auf sehr wenige Ausnahmen beschränkt ist (vgl. Fleischer/Barz 2012, 87–90), und im Syntagma den keuchen Tod liegt sogar eine Konversion Verb > Adjektiv vor. Festzuhalten ist, dass hier nicht nur geläufige morphologische Muster mit neuartigen, bisher nicht lexikalisierten Bildungen (Okkasionalismen) gefüllt werden (wie Steger 2000, 361 f. etwa auch für Rilke und Celan gezeigt hat), sondern dass die Wortbildungsmuster selbst in Frage gestellt und aufgeweicht werden.
5 Wortbedeutungen 5.1 Wortbedeutung und Textsinn Ein Gedicht wird mit der Erwartung gelesen, dass die Wörter nicht bloß in ihren gewöhnlichen Bedeutungen auftreten, sondern dass eine über die konventionellen Bedeutungsbezüge hinausgehende semantische Dimension existiert. Diese Dimension wird als eigentlicher Gehalt des Gedichts verstanden, als mehr oder weniger verborgene Bedeutungsebene, deren Erschließung bestimmte Interpretationsverfahren erfordert. Den einzelnen Wörtern eines Gedichts ist daher neben ihrer usuellen lexikalischen Bedeutung unter Umständen ein je eigener, nur für den jeweiligen Textzusammenhang gültiger Sinn zuzusprechen, der potenziell in eine enge Relation zum Sinn des gesamten Gedichtes gesetzt werden kann. Dass die in einem poetischen Text auftretenden Wörter eine von der Alltagskommunikation abweichende Bedeutung besitzen können, hat bereits die antike Rhetorik in der Opposition von verbum proprium und verbum translatum zu fassen gesucht (vgl. dazu und zum Folgenden Lausberg 1990, 46; Plett 1991, 70). In der Rhetorik wird dabei von dem Prinzip des Wortersatzes ausgegangen: An die Stelle einer eigentlichen, konventionellen Bezeichnung für einen Referenten (ein substituendum) tritt eine uneigentliche, okkasionelle und originelle Bezeichnung (ein substituens). Das schließt auch ein, dass das substituendum prinzipiell wieder ‚rückübersetzt‘ werden kann: In dem Bild Er war ein Turm in der Schlacht ersetzt Turm schlicht den eigentlichen Ausdruck unerschütterlicher Kämpfer (Beispiel Plett ebd.). Dass das Wort Turm in der betreffenden Wendung eine andere Bedeutung erhält, ist nur ein Nebeneffekt dieses Wortersatzes. Für die Rhetorik ist somit der Gedanke des ornatus, der Ausschmückung eines Inhalts maßgeblich, der im Prinzip auch durch eigentlichen, schmucklosen Wortgebrauch wiedergegeben werden kann. Dieses Konzept stößt jedoch in der Poesie (mindestens in der seit dem Sturm und Drang) an seine Grenzen. So kann man für die
142
Volker Harm
Wörter eines Gedichts, die erkennbar einen anderen als den alltäglichen Sinn tragen, oftmals keine eindeutige Rückübersetzung herstellen, und kaum ein Dichter wird sein Gedicht als ausgeschmückte Version eines Prosatextes verfasst haben, in dem eigentlich schon alles gesagt ist, nur nicht so schön. Das Zustandekommen des Gedichtsinns und damit auch des Sinns der Wörter in einem Gedicht ist wesentlich komplexer. Wie diese Sinnkonstitution vonstattengeht, soll an einem Beispiel gezeigt werden, das auf den ersten Blick recht einfach wirkt, nämlich anhand von Heines Ein Fichtenbaum steht einsam: (9)
Ein Fichtenbaum steht einsam Im Norden auf kahler Höh’. Ihn schläfert; mit weißer Decke Umhüllen ihn Eis und Schnee.
Er träumt von einer Palme, Die, fern im Morgenland, Einsam und schweigend trauert Auf brennender Felsenwand. (Heine 1/1, 164)
Dass hier uneigentlicher Sprachgebrauch vorliegt, macht spätestens die dritte Zeile der ersten Strophe deutlich: Von einem Fichtenbaum kann man normalerweise nicht sagen, dass ihn schläfert. Auch Prädikationen wie träumt oder trauert in der zweiten Strophe sind auf die Subjekte Fichtenbaum und Palme bezogen. Damit ist auf den ersten Blick eine für die nicht-poetische Kommunikation gültige Selektionsrestriktion verletzt, derzufolge Subjekte, die kein Bewusstsein haben, nicht mit Verben für psychische Zustände kombinierbar sind. Streng genommen läge hier somit ein Verstoß gegen die Grice’sche Kommunikationsmaxime der Wahrhaftigkeit vor („Sage nur Dinge, die du für wahr hältst“). Da wir aber aufgrund kultureller Prägung wissen, dass es sich hier um einen poetischen Text handelt, sind wir bereit, nach einer ‚höheren‘ Wahrheit zu suchen, obwohl träumende oder trauernde Bäume eigentlich ein Ding der Unmöglichkeit sind. Insofern sind die Grice’schen Maximen durchaus nicht außer Kraft gesetzt, wie Saße (1980) meinte. Wir nehmen als Leser nur besondere Bedingungen für deren Geltung an und retten den Wahrhaftigkeitsanspruch dadurch, dass wir nach einer anderen Interpretation als der wörtlichen suchen. Setzen wir also trotz dieser Verstöße weiterhin voraus, dass der Text sinnvoll ist und eine wahrhaftige Aussage enthält, so werden wir den Gegensatz zwischen Fichtenbaum und Palme auf der einen und den Verben schläfern, träumen, trauern auf der anderen Seite am ehesten so auflösen, dass wir hier eine Metapher, genauer gesagt eine Personifikation, annehmen: Fichtenbaum und Palme stehen allegorisch für empfindungsfähige Menschen. Diese Gleichsetzung wird durch eine Reihe von Annahmen gestützt: (1.) Auch in der Alltagssprache werden Menschen mit Pflanzen verglichen (Das Kind gedeiht prächtig, Sie war bereits verblüht, Sie steht wie eine Eiche). (2.) Speziell in der Lyrik werden Menschen häufig mit Pflanzen, besonders allerdings mit
Das Wort und die Kreativität der Literatur
143
Blumen, verglichen (Heines Du bist wie eine Blume, Goethes Sah ein Knab ein Röslein stehn). (3.) Bei diesen Gleichsetzungen geht es ferner meist nicht um beliebige Personen, sondern um Liebende. (4.) Wenn das Gedicht nicht für sich, sondern in seinem ursprünglichen zyklischen Kontext (Lyrisches Intermezzo im Buch der Lieder) gelesen wird, lässt dies keinen anderen Schluss zu, als dass hier eine Liebesproblematik verhandelt wird.
5.2 Framesemantische Ansätze Dass den Wörtern Fichtenbaum und Palme der Sinn ‚unglücklich Liebender bzw. Liebende‘ zukommt, dass das Gedicht als eine Allegorie auf zwei Liebende, die nicht zueinander finden können, zu lesen ist (zur Interpretation weiter Gesse-Harm 2006, 450), speist sich letztlich daraus, dass hier zwei Wissensbestände systematisch miteinander verschränkt und überblendet werden: zum einen der Wissensbestand über Bäume und zum anderen unser Wissen über (unglückliche) Liebe. Solche Wissensbestände werden in den Kognitionswissenschaften und der neueren Linguistik als ‚Frames‘ bezeichnet: Frames sind komplexe kognitive Einheiten, die stereotypes Wissen über Gegenstände und Sachverhalte enthalten und die den Interpretationshintergrund für einzelne Konzepte bilden (zu Frames und ihrer Anwendung in der Textanalyse s. Gardt 2012, 74–78). Den beiden hier involvierten Frames kommt eine spezifische Rolle zu: Baum ist der sog. Bildspender, d. h. die konzeptuelle Domäne, der ein Großteil des Wortschatzes in diesem Gedicht entnommen ist, und (unglückliche) Liebe der Bildempfänger, d. h. die Domäne, auf die hin der Wortschatz des Spender-Frames interpretiert wird (zum Gegensatz ‚Bildspender‘ vs. ‚Bildempfänger‘ bzw. ‚source domain‘ vs. ‚target domain‘ grundlegend Weinrich 1963 bzw. Lakoff/Johnson 1980; vgl. auch Peil 2005). Der Spenderframe Baum dient dazu, bestimmte Aspekte des Zielframes Liebe sichtbar zu machen. Dazu werden einzelne Ausschnitte aus unserem Wissen über Bäume aktiviert: (1.) Ein Baum gehört in eine bestimmte Klimazone. (2.) Ein Baum bedarf bestimmter klimatischer Bedingungen, um gedeihen zu können, die (3.) typischerweise an einem bestimmten Standort gegeben sind. Wenn mit den hier genannten Wissensbeständen Grundbedingungen für das Gedeihen von Bäumen angegeben sind, dann macht das Gedicht klar, in welcher Weise diese Bedingungen hier realisiert sind: Die jeweiligen Klimazonen sind maximal entgegengesetzt (Norden vs. Morgenland), die klimatischen Bedingungen sind in beiden Fällen extrem (Kälte vs. Hitze), und die Standorte stimmen zwar überein (auf kahler Höh’, auf brennender Felsenwand), sind aber komplementär in ihrer Unwirtlichkeit. Die Projektion dieser aufgerufenen Frameausschnitte auf den Zielframe Liebe lässt unterschiedliche Hypothesen zu: Die Liebenden sind unglücklich, sie leben räumlich getrennt, ihre soziale Umgebung, auch wenn sie vergleichbar ist, ist ihnen jeweils fremd, ja feindlich – man imaginiert unwillkürlich eine Romeo-und-Julia-
144
Volker Harm
Situation. Wichtig für die Interpretation des Gedichtes ist auch ein sog. Default, d. h. eine Standardannahme über Bäume und Pflanzen allgemein, nämlich dass sie einen festen Standort haben. Aus der Übertragung auf den Bildempfänger ergibt sich die tragische Implikation, dass die Trennung des Paares unabänderlich ist, ja dass eine Verbindung ausschließlich in der Phantasie, im Traum möglich ist. Mit dem Moment des Festgebanntseins an den jeweiligen Lebensort ist zudem auch ein Bildelement des Spenderbereichs gegeben, das besonders deutlich mit dem Empfängerbereich kontrastiert: Menschen können ihren Standort verändern, Bäume nicht. Insofern setzt sich die Überblendung der Frames Baum und Liebe zweier Menschen über einen wesentlichen Aspekt des Empfänger-Frames hinweg, obwohl man eigentlich eine größtmögliche Parallelität und damit eine Stimmigkeit des Bildes erwarten sollte. Der Vergleich zwischen Menschen und Bäumen ist daher als besonders pointiert zu bewerten und stellt letztlich wohl eine der ironischen Überspitzungen dar, für die Heinrich Heine berühmt ist (zu den tragikomischen Aspekten des Gedichtes s. Gesse-Harm 2006, 449 f.). Welche der oben genannten Hypothesen plausibel ist, ob es neben den erwähnten Übertragungen noch weitere Projektionen aus dem Spenderframe auf den Empfängerframe gibt, steht nicht von vornherein fest, sondern muss jeweils ausgehandelt werden. Das heißt nicht, dass es beliebig viele Interpretationsmöglichkeiten gäbe: Die Grenze zwischen den möglichen und unmöglichen Interpretationen wird hier durch die Grenzen der beiden involvierten Frames abgesteckt. Für die Ermittlung der Bedeutung der Wörter Fichtenbaum und Palme sowie der sich darauf beziehenden Prädikationen liefert, so lässt sich festhalten, die Framesemantik einen brauchbaren Ansatz.
5.3 „Blended spaces“ – der Ansatz von Fauconnier/Turner (1998) Das systematische Zusammenspiel von Bildspender und Bildempfänger, das sowohl für den Sinn des gesamten Gedichtes als auch für die Interpretation der Einzelwörter konstitutiv ist, lässt sich auch gut mit Hilfe des von Fauconnier/Turner (1998) entwickelten Modells der „blended spaces“ veranschaulichen. Während das im Kern noch recht traditionell gehaltene kognitivistische Metaphernkonzept von Lakoff/Johnson (1980) Metaphern als Projektion eines Bildspenders auf einen Bildempfänger auffasst, beschreibt das Blending-Modell Metaphern als Ergebnisse einer konzeptuellen Integration, an der vier ‚mentale Räume‘ beteiligt sind: Zwei ‚input spaces‘, die im Wesentlichen den herkömmlichen Konzepten ‚Bildspender‘ und Bildempfänger‘ (bzw. ‚target domain‘ und ‚source domain‘ im Modell von Lakoff/Johnson) entsprechen, ein ‚generic space‘, der die verbindenden Merkmale der beiden Inputs enthält (und letztlich als das tertium comparationis der rhetorischen Metaphernanalyse ein alter Bekannter ist, vgl. Lausberg 1990, 46), sowie schließlich der ‚blended space‘. Dieser enthält einige, jedoch nicht alle Elemente der beiden Inputs, d. h. mindestens
Das Wort und die Kreativität der Literatur
145
die im ‚generic space‘ vorhandenen. Der Gedanke, dass nicht alle Aspekte der jeweiligen Domänen in die Metapher einfließen, ist übrigens in dem ‚Prinzip des überquellenden Details‘ der klassischen Rhetorik ebenfalls bereits vorgeprägt (vgl. Lausberg 1990, 133 und Peil 2002, 768). Der ‚blended space‘ verfügt insofern aber über eine gewisse Autonomie, als er auch neue Informationselemente enthalten kann, die sich aus eigenständigen Weiterentwicklungen der Input-Information ergeben – der ‚blend‘ ist also mehr als die Summe seiner Inputs (vgl. Abb. 1). Generic Space
Input (Source)
Input (Target)
Blend Abb. 1: Das Modell der ‚blended spaces‘ (Fauconnier/Turner 1998, 272)
Versucht man das Modell für die Analyse dieses Gedichtes fruchtbar zu machen, so wären die Frames unglücklich Liebende und Bäume als die beiden ‚input spaces‘ anzusehen, die durch eine Menge von gemeinsamen Merkmalen (‚generic space‘) miteinander verbunden sind (z. B. dadurch, dass es sich in beiden Fällen um Lebewesen handelt). Man könnte dann verschiedene Querverbindungen postulieren, etwa zwischen den radikal verschiedenen Lebensverhältnissen der Bäume und der Unvereinbarkeit der Liebenden, zwischen der räumlichen Trennung und der Hoffnungslosigkeit der Liebe, zwischen den unwirtlichen klimatischen Verhältnissen und den Leiden der Liebenden. Diese Gemeinsamkeiten werden in dem vierten mentalen Raum, dem ‚blend‘, abgebildet und ggf. um sich daraus ergebende Implikationen –
146
Volker Harm
sog. ‚emergente‘ Bedeutungsaspekte – erweitert, die in den beiden Inputs nicht vorhanden waren. Das Modell der blended spaces lässt zahlreiche Fragen offen: Ist tatsächlich von zwei mehr oder weniger gleichberechtigten Inputs auszugehen oder kommt den beiden involvierten Domänen nicht doch eine grundsätzlich verschiedene Rolle bei der Genese einer Metapher zu? Ist der generische Raum tatsächlich einfach so gegeben, wie Fauconnier/Turner suggerieren, oder stellt er nicht ebenfalls ein mentales Kon strukt dar, das von den Querverbindungen zwischen den ‚input spaces‘ nicht zu unterscheiden ist? Ist es mehr oder weniger beliebig, welche Komponenten des Frames in einem ‚blended space‘ integriert werden, wie in dem Modell offenbar vorausgesetzt wird? Und schließlich: Wie erklärt sich die Emergenz neuer Bedeutungskomponenten im ‚blended space‘, die bei Fauconnier/Turner auf bloßem Zufall zu beruhen scheint? Einer der Vorteile des Modells besteht aber, neben seiner Anschaulichkeit, in der Betonung des kreativen Moments der Metaphernbildung, eines gewissen Überschusses, der sich in den emergenten Bedeutungen des ‚blended space‘ niederschlägt. Dass z. B. der Liebende von einem realen oder imaginierten Wesen in der Ferne träumt und von diesem nur träumen, es aber nicht erreichen kann, dass die Palme möglicherweise auch nur die Sehnsuchtsprojektion eines Leidenden darstellt, ist für sich genommen in keinem der Input-Räume enthalten, sondern ergibt sich als ein Drittes erst aus deren Verbindung.
6 „Beziehungszauber“: Lexikalische Vernetzungen Eine systematische, das gesamte Gedicht durchziehende Überblendung zweier Bildbereiche findet sich auch in dem folgenden Gedicht, das zudem wegen seiner expliziten Sprachreflexion in unserem Zusammenhang besonders interessant ist, nämlich in Stefan Georges spätem Gedicht das wort. (10) Wunder von ferne oder traum Bracht ich an meines landes saum Und harrte bis die graue norn Den namen fand in ihrem born – Drauf konnt ichs greifen dicht und stark Nun blüht und glänzt es durch die mark … Einst langt ich an nach guter fahrt Mit einem kleinod reich und zart Sie suchte lang und gab mir kund: „So schläft hier nichts auf tiefem grund“ Worauf es meiner hand entrann Und nie mein land den schatz gewann … So lernt ich traurig den verzicht: Kein ding sei wo das wort gebricht. (George 9, 134)
Das Wort und die Kreativität der Literatur
147
Dieser Text zeigt ein weiteres lexikalisches Charakteristikum vieler poetischer Texte, nämlich ein engmaschiges, über das gesamte Gedicht ausgespanntes Netz von lexikalischen Relationen (dazu vgl. Storjohann in diesem Band). Dieses Netz wird von zahlreichen synonymischen und antonymischen Wortpaaren und zum Teil auch Wortgrupppen gebildet: (11) wunder – traum (Z. 1) dicht und stark (Z. 5) – rein und zart (Z. 8) fand (Z. 4) – suchte (Z. 9) kleinod (Z. 8) – schatz (Z. 12) land (Z. 2) – mark (Z. 6) greifen (Z. 5) – entrann (Z. 12) – gewann (Z. 13) in ihrem born (Z. 4) – auf tiefem grund (Z. 10) namen (Z. 4) – wort (Z. 14)
Nicht nur Reim, Rhythmus und Erzählstruktur vermitteln in diesem Fall den Eindruck einer starken Durchgestaltung des Textes, sondern auch der lexikalische Beziehungsreichtum, der entfaltet wird. Dieser bewirkt, dass das Gedicht als Ganzheit ins Bewusstsein tritt, in der alle Teile miteinander verwoben sind. Dieser „Beziehungszauber“ – um ein eigentlich auf Richard Wagners Leitmotivtechnik gemünztes Wort von Thomas Mann aufzugreifen – basiert letzten Endes darauf, dass Elemente, die in einem Ähnlichkeits- oder Gegensatzverhältnis und damit in einer paradigmatischen Relation stehen, in eine syntagmatische Relation gebracht werden: Beziehungen im Wortschatz werden zu Beziehungen im Text. Dieses Verfahren lässt unmittelbar an Jakobsons Bestimmung der poetischen Funktion als Projektion des Äquivalenzprinzips von der Achse der Selektion auf die der Kombination denken (s. o. Abschnitt 2); ‚Äquivalenz‘ meint hier übrigens nicht ‚Übereinstimmung‘, sondern ist als Oberbegriff zu ‚Ähnlichkeit‘ und ‚Unähnlichkeit‘ zu verstehen (Jakobson 1960/1979, 94). Die Projektion von Äquivalenz hatte Jakobson freilich fast ausschließlich auf die klanglichen Eigenschaften des poetischen Textes, also auf Rhythmus, Reim und Alliteration, bezogen. Wie der Beispieltext zeigt, gilt dieses Prinzip auch für die Lexik. Lexikalische Netze, wie sie im zitierten George-Gedicht, aber ansatzweise auch in den oben genannten Beispieltexten von Heine zu greifen waren, sind sicherlich in zahlreichen Gedichten anzutreffen, sie sind aber selbstverständlich kein notwendiges Merkmal poetischer Sprache – genau so wenig wie Versmaß oder Reim. Wenn man auf die zeitgenössische Lyrik blickt, die über weite Strecken ohne Endreim und festes Metrum auskommt, stellt sich allerdings der Eindruck ein, dass die Rolle dieses lexikalischen Beziehungsreichtums mit dem Wegfall der traditionellen Gestaltungsmittel eher noch an Bedeutung gewinnt. Dies möge der letzte Beispieltext illustrieren, Enzensbergers Gedicht Konjunktur:
148
Volker Harm
(12)
Ihr glaubt zu essen aber das ist kein Fleisch womit sie Euch füttern, das ist Köder, das schmeckt süß (Vielleicht vergessen die Angler die Schnur, vielleicht haben sie ein Gelübde getan, in Zukunft zu fasten?)
Der Haken schmeckt nicht nach Biscuit er schmeckt nach Blut er reißt euch aus der lauen Brühe: wie kalt ist die Luft an der Beresina! (Enzensberger in: Atlas der neuen Poesie 133)
7 Ausblick Wenn es sich bereits für die Lyrik der klassisch-romantischen Epoche als schwierig erwiesen hat, verallgemeinerbare Hypothesen zu bilden, so gilt dies für die noch formenreichere Lyrik ab ca. 1900 umso mehr. Die Frage, was kennzeichnend für den Wortschatz der modernen Lyrik sein könnte, ist nahezu unmöglich zu beantworten. Kein Wort, sei es umgangs- oder wissenschaftssprachlich, sei es Archaismus oder Neologismus, Fremdwort oder Dialektwort, ist prinzipiell aus dem lexikalischen Fundus der modernen Lyrik ausgeschlossen – anything goes. Selbst die Forderung, dass Gedichte überhaupt aus Wörtern bestehen müssen, ist mit dem Aufkommen der Lautdichtung – man denke an Kurt Schwitters’ Ursonate oder Hugo Balls DadaGedichte – hinfällig geworden. Damit stellt sich allerdings auch die eingangs erörterte theoretische Frage neu, wie sich Lyrik von Gebrauchs- oder Alltagssprache im Hinblick auf ihren Wortschatz abgrenzen lässt – wenn man sie überhaupt noch abgrenzen will und nicht grundsätzlich die „Entkunstung der Kunst“ propagiert (dazu Betten 2007, 3015). Vor allem die strukturalistische Definition der poetischen Funktion, die primär auf Vers und Reim zielte, muss vor dem Hintergrund der umwälzenden Entwicklungen in der modernen Poesie auf den ersten Blick als obsolet erscheinen. Nun hatte aber bereits Jakobson hinter der Projektion des Äquivalenzprinzips auf die Achse der Verkettung, die seiner Auffassung nach das Poetische definiert, ein anderes, wesentlich einfacheres Prinzip am Werk gesehen. Er formuliert dieses Prinzip so, dass die poetische Funktion schlicht „das Augenmerk auf die Spürbarkeit der Zeichen“ legt (1960/1979, 92 f.) – die Äquivalenzprojektion ist letztlich nur das Mittel, mit dem diese „Spürbarkeit der Zeichen“ hervorgebracht wird. Damit ließe sich zumindest ein nicht unerheblicher Teil der modernen Lyrik mit der strukturalistischen Funktionslehre versöhnen; denn dass hier die sprachlichen Zeichen selbst, nicht das, worauf sie referieren, im Vordergrund stehen, ergibt sich schon aus der weite Teile der modernen Lyrik kennzeich-
Das Wort und die Kreativität der Literatur
149
nenden Hermetik, die es dem Leser erschwert oder unmöglich macht, vom Zeichen unmittelbar auf ein Denotat zu schließen. Jakobsons Bestimmung der poetischen Funktion erweist sich aber auch deshalb als immer noch tragfähig, weil die „Ablösung der Sprachzeichen von den Dingen“ (Schmitz-Emans 1997, 177), die als Signum der literarischen Moderne gilt, letztlich bereits im Wesen der poetischen Funktion selbst angelegt ist: „Indem sie das Augenmerk auf die Spürbarkeit der Zeichen richtet, vertieft diese Funktion die fundamentale Dichotomie der Zeichen und Objekte“, so lautet das vollständige Zitat (Jakobson 1960/1979, 92 f.). Die Sprachkrise der modernen Dichtung ist aus dieser Sicht also nichts anderes als die Zuspitzung eines Verhältnisses, das der poetischen Funktion selbst immanent ist. Die unbegrenzte Fülle der lexikalischen Ausdrucksmöglichkeiten, die der Lyrik unserer Tage zu Gebote steht, lässt allerdings auch noch eine andere Sichtweise auf die Poesie und ihr Verhältnis zur Alltagssprache wieder aktuell erscheinen, nämlich die in der jüngeren Theoriediskussion fast vergessene Position Herders und Schlegels (s. o. Abschnitt 2). In der Tat erscheint die zeitgenössische Lyrik gegenüber der Gebrauchssprache heute als das umfassendere System, als die Seinsweise der Sprache, die in der Lage ist, alle anderen sprachlichen Seinsweisen in sich aufzunehmen. Die Radikalität dieser theoretischen Position ist der sprachlichen Radikalität der zeitgenössischen Poesie jedenfalls nicht unangemessen.
8 Literatur 8.1 Nachweis der zitierten Gedichte Benn, Gottfried (1986–2003): Sämtliche Werke. In Verbindung mit Ilse Benn hg. von Gerhard Schuster. Bd. 1–7. Stuttgart. Dehmel, Richard (1918): Gesammelte Werke in drei Bänden. Berlin. George, Stefan (1927–1934): Gesamt-Ausgabe der Werke, endgültige Fassung. Bd. 1–18. Berlin. Goethe, Johann Wolfgang von (1887–1919): Goethes Werke. Hg. im Auftrage der Großherzogin Sophie von Sachsen. Bd. 1–147. Köln/Weimar. Heine, Heinrich (1975): Historisch-kritische Gesamtausgabe der Werke. In Verbindung mit dem Heinrich-Heine-Institut hg. von Manfred Windfuhr im Auftrag der Landeshauptstadt Düsseldorf. Bd. 1: Buch der Lieder. Hamburg. Hölderlin, Friedrich (1951): Sämtliche Werke, hg. von Friedrich Beißner (Stuttgarter Ausgabe). Bd. 2: Gedichte, Teil 1: Text. Nachdruck. Stuttgart 1970. Sartorius, Joachim (Hg.) (1996): Atlas der neuen Poesie. Reinbek bei Hamburg. Trakl, Georg (1974): Das dichterische Werk. Aufgrund der historisch-kritischen Ausgabe von Walter Killy und Hans Szklenar. München.
150
Volker Harm
8.2 Forschungsliteratur Adorno, Theodor W. (1973): Wörter aus der Fremde. In: Ders.: Noten zur Literatur. Frankfurt a. M., 216–232. Betten, Anne (2004): Deutsche Sprachgeschichte und Literaturgeschichte. In: Werner Besch u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung, 2. vollst. neu bearb. und erw. Auflage. 3. Teilband. Berlin/New York, 3002–3017. Bierwisch, Manfred (1965): Linguistik und Poetik. In: Helmut Kreuzer/Rul Gunzenhäuser (Hg.): Mathematik und Dichtung. München, 49–65. Bierwisch, Manfred (2008): Linguistik, Poetik, Ästhetik. In: Zeitschrift für Literaturwissenschaft und Linguistik 38, 33–55. 1 DWB = Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm. Bd. 1–16. Leipzig 1854–1960. Quellenverzeichnis: Leipzig 1971. 2 DWB = Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm. Neubearbeitung. Hg. von der Berlin-Brandenburgischen Akademie der Wissenschaften (vormals Akademie der Wissenschaften der DDR) und der Akademie der Wissenschaften zu Göttingen. Bd. 1 ff. Leipzig 1960 ff. Fauconnier, Gilles/Mark Turner (1998): Conceptual integration networks. In: Cognitive Science 22, 133–187. Fleischer, Wolfgang/Irmhild Barz (2012): Wortbildung der deutschen Gegenwartssprache. 4. Aufl. Berlin/Boston. Gardt, Andreas (2012): Textsemantik. Methoden der Bedeutungserschließung. In: Jochen A. Bär/ Marcus Müller (Hg.): Geschichte der Sprache – Sprache der Geschichte. Probleme und Perspektiven der historischen Sprachwissenschaft des Deutschen. Oskar Reichmann zum 75. Geburtstag. Berlin, 61–82. Gesse-Harm, Sonja (2006): Zwischen Ironie und Sentiment. Heinrich Heine im Kunstlied des 19. Jahrhunderts. Stuttgart. Grice, H. Paul (1975/1993): Logik und Konversation. In: Georg Meggle (Hg.): Handlung, Kommunikation, Bedeutung. Frankfurt a. M., 243–265. GWb = Goethe-Wörterbuch. Hg. von der Berlin-Brandenburgischen Akademie der Wissenschaften, der Akademie der Wissenschaften in Göttingen und der Heidelberger Akademie der Wissenschaften. Bd. 1 ff. Stuttgart, Berlin, Köln 1966 ff. Hamburger, Käte (1968): Die Logik der Dichtung. 2. Aufl. Stuttgart. Harm, Volker (2015): Einführung in die Lexikologie. Darmstadt. Henne, Helmut (2010): Sprachliche Spur der Moderne in Gedichten um 1900: Nietzsche, Holz, George, Rilke, Morgenstern. Berlin/New York. Jakobson, Roman (1960/1979): Linguistik und Poetik. In: Elmar Holenstein und Tarcisius Schelbert (Hg.) : Poetik. Ausgewählte Aufsätze 1921–1971. Frankfurt a. M., 83–121. Jakobson, Roman/Claude Lévi-Strauss (1960/1972): ‚Les Chats‘ von Charles Baudelaire. In: Heinz Blumensath (Hg.): Strukturalismus in der Literaturwissenschaft. Köln, 184–201. Jannidis, Fotis (2010): Methoden der computergestützten Textanalyse. In: Vera Nünning/Ansgar Nünning (Hg.): Methoden der literatur- und kulturwissenschaftlichen Textanalyse. Stuttgart, 109–132. Kümmerling-Meibauer, Bettina/Jörg Meibauer (2007): Linguistik und Literatur. In: Markus Steinbach u. a. (Hg.): Schnittstellen der germanistischen Linguistik. Stuttgart, 257–290. Lakoff, George/Mark Johnson (1980): Metaphors we live by Chicago. Lausberg, Heinrich (1990): Handbuch der literarischen Rhetorik. Eine Grundlegung der Literaturwissenschaft. Stuttgart.
Das Wort und die Kreativität der Literatur
151
Mukařovský, Jan (1938/1967): Die poetische Benennung und die ästhetische Funktion der Sprache. In: Jan Mukařovský (Hg.): Kapitel aus der Poetik. Frankfurt a. M., 44–54. Paul/Betz = Deutsches Wörterbuch von Hermann Paul. 5., völlig neubearb. und erw. Aufl. von Werner Betz. Tübingen 1966. Peil, Dietmar (2002): Bildfelder in historischer Perspektive. In: Alan D. Cruse u. a. (Hg.): Lexikologie. Ein internationales Handbuch zur Natur und Struktur von Wörtern und Wortschatz. Berlin/New York. Teilbd. 1, 764–771. Plett, Heinrich F. (1991): Einführung in die rhetorische Textanalyse. Hamburg. Saße, Günter (1980): Literatursprache. In: Hans Peter Althaus/Helmut Henne/Herbert Ernst Wiegand (Hg.): Lexikon der germanistischen Linguistik, 2. Aufl. Tübingen, 698–709. Tuldava, Juhan (2005): Stylistics, author identification. In: Reinhard Köhler/Gabriel Altmann/ Rajmund G. Piotrowski (Hg.): Quantitative Linguistik, ein internationales Handbuch. Berlin/New York, 368–187. Schlaefer, Michael (2009): Lexikologie und Lexikographie. Eine Einführung am Beispiel deutscher Wörterbücher. 2. Aufl. Berlin. Schmitt, Rüdiger (1967): Dichtung und Dichtersprache in indogermanischer Zeit. Wiesbaden. Schmitz-Emans, Monika (1997): Die Sprache der modernen Dichtung. München. Staiger, Emil (1971): Grundbegriffe der Poetik. München. Steger, Hugo (2000): Funktionale Sprachvarietäten und Semantik. In: Annelies Häcki Buhofer (Hg.): Vom Umgang mit sprachlicher Variation. Soziolinguistik, Dialektologie, Methoden und Wissenschaftsgeschichte. Festschrift für Heinrich Löffler zum 60. Geburtstag. Tübingen/Basel, 355–366. Weinrich, Harald (1963): Semantik der kühnen Metapher. In: Deutsche Vierteljahrsschrift 37, 325–344. Werlen, Ivar (1989): Sprache, Mensch und Welt. Geschichte und Bedeutung des Prinzips der sprachlichen Relativität. Darmstadt.
Kirsten Adamzik
7. Das Wort im Text Abstract: Der Beitrag setzt an zwei konkurrierenden Sichtweisen auf den Text an: Die Textgrammatik wählt einen Ebenen-spezifischen Zugang und fasst den Text als die höchste Ebene der linguistischen Beschreibung. Als nächstniedrige wird der Satz angesetzt; die Kernfrage lautet, wie Sätze zu Texten verkettet werden. Dabei wird zwei Wortarten, den Pronomina und Konjunktionen, eine besondere Bedeutung zugewiesen, da sie die zentralen Kohäsionsmittel darstellen. In anderer Perspektive stellen Texte Vorkommen realer Sprachverwendung dar, entsprechen also dem Saussureʼschen Konzept von Parole bzw. etischen (gegenüber emischen) Einheiten, die nicht in Bezug auf den Umfang spezifiziert sind. Beide Herangehensweisen arbeiten auf der Wortebene mit dem Konzept Wortform, verstehen darunter jedoch Einheiten unterschiedlicher Abstraktionsebenen. Diesen Abstraktionsebenen (auf den hierarchischen Rängen Wort-Satz-Text) ist der zweite Abschnitt gewidmet. Im dritten geht es darum, verschiedene (einander nicht ausschließende) Perspektiven auf Wörter im Text vorzustellen. Sie unterscheiden sich v. a. darin, ob sie Texte als Folgen, Netze oder Mengen von Wörtern behandeln. 1 Zur Einführung: Das Wort im Text – das Wort als Text 2 Abstraktionsebenen 3 Texte als Folgen, Netze und Mengen von Wörtern 4 Schlussbemerkung 5 Literatur
1 Zur Einführung: Das Wort im Text – das Wort als Text Wie viele andere linguistische Grundbegriffe sind Wort und Text bekanntlich vieldeutig. Überdies gibt es Verwendungsweisen von Wort, in denen dieser Ausdruck in etwa gleichbedeutend zu Text verwendet wird. Daran haben Haß/Storjohann (2015, 2.1) erinnert. Am prominentesten ist Wort für eine komplexe Sinneinheit wohl im religiösen Bereich: das Wort Gottes. Besonders bemerkenswert ist dabei, dass in der christlichen Tradition Wort nicht als einzelsprachspezifische Größe verstanden wird, sondern in der Mission ‚das‘ Wort Gottes in möglichst vielen Sprachen verbreitet werden soll und, um ihm möglichst nahe zu kommen bzw. zu bleiben, auch innerhalb einer Sprache immer wieder neu übersetzt wird. Dem soll eine andere Verwendungsweise an die Seite gestellt werden, die zwar ebenfalls auf eine Ganzheit bezogen ist, aber ansonsten ganz im Gegensatz zur ersten
Das Wort im Text
153
eine einmalig aktualisierte und situierte Größe betrifft. Gemeint ist die Routineformel aus der Presse Es gilt das gesprochene Wort. Wort bezeichnet hier den tatsächlich geäußerten Rede-Text als Einzelereignis des Sprachgebrauchs. Ihm wird der Vorrang gegenüber einem vorab verfügbaren und veröffentlichten Redemanuskript zugesprochen, von dem der Redner gegebenenfalls abweicht. Hier ist nicht nur der exakte Wortlaut relevant, sondern möglicherweise auch (korrigierte oder nicht korrigierte) Versprecher sowie parasprachliche und nichtsprachliche Elemente wie Tonfall, Mimik, Körperhaltung usw. Als einschlägiges Beispiel für die Bedeutung dieser Faktoren unabhängig vom Wortlaut sei an die verunglückte Gedenkrede Philipp Jenningers vom 10.11.1988 erinnert (vgl. Girnth 1993). Vom Wort als Text kann aber auch noch in anderem Sinne gesprochen werden, wenn nämlich eine abgeschlossene Äußerung nur aus einem Wort besteht. Solche Vorkommnisse des Sprachgebrauchs finden sich zuhauf etwa auf Verkehrsschildern. Auf Wegweisern steht oft ein Name, bei den meisten anderen Verkehrszeichen kommt zu einem Appellativum meist ein ikonisches Zeichen hinzu oder ein solches tritt überhaupt allein auf. Die visuelle Gestaltung ist auf jeden Fall von herausragender Bedeutung, sie ist Bestandteil der amtlich festgelegten Zeichen. Den sprachlich gefassten Inhalt sowie die Regeln zur Platzierung der Schilder kann man im Katalog der Verkehrszeichen (Bestandteil der Straßenverkehrsordnung) nachlesen, und es wird vorausgesetzt, dass alle Verkehrsteilnehmer (mit Führerschein) die Zeichen kennen. Die Frage, ob man auch solche Artefakte unter einen linguistischen Textbegriff fassen soll, ist nun eine, an der sich die Geister scheiden (vgl. dazu ausführlicher Adamzik 2004: Kap. 2. bzw. Schmitz in diesem Band). Genauer gesagt stehen sich zwei Sichtweisen auf Text bzw. Sprache auch in der Textlinguistik von Beginn an gegenüber: Die eine ist orientiert an hierarchischen Ebenen in dem Sinne, dass sich die Einheiten einer Ebene aus denen der jeweils tiefer gelegenen zusammensetzen. Dabei wird das Wort auf ziemlich niedriger, der Text auf ziemlich hoher oder sogar höchster Stufe angesiedelt. Die andere geht von der Gegenüberstellung von Sprachsystem und Sprachverwendung aus, der Saussureʼschen Dichotomie langue – parole, die einen der französischen Ausdrücke mit den Lesarten ‚Wort‘ und ‚Text‘ in der Bedeutung ‚Sprachgebrauch‘ bzw. ‚aktualisierte Sprache‘ terminologisiert hat. Grob gesehen, geht es im einen Fall darum, auf Sprachliches bezogene Regeln für die Verbindung von Sätzen zu Texten zu formulieren, im anderen darum, authentische Produkte kommunikativer Zeichenverwendung in ihrer situativen Einbettung zu untersuchen. In der unmittelbaren Nebeneinanderstellung im Syntagma Das Wort im Text ist natürlich die Ebenen-spezifische Lesart von Wort aktualisiert, zumal man auf der Systemebene eigentlich nicht von Wörtern, sondern von Lexemen spricht. Das heißt aber nichts anderes, als dass auf den einzelnen Ebenen der Gegensatz zwischen abstrakt und konkret jeweils wiederkehrt. Lexeme sind abstrakte Einheiten, denen man verschiedene Lesarten zuschreibt und die – sofern sie zu den flektierbaren bzw. allgemeiner: veränderbaren Wortarten gehören – eine Menge von Wortformen umfassen.
154
Kirsten Adamzik
Im Text als aktualisierter Sprache erscheinen (veränderbare) Wörter dagegen in einer bestimmten Wortform, sie sind also grammatisch spezifiziert. Tatsächlich ist es relativ üblich, den Gegensatz abstrakt vs. konkret bzw. Langue vs. Parole bzw. der sog. emischen (vgl. phonemisch) vs. etischen (vgl. phonetisch) Betrachtung auf der Wortebene als Lexem (lexikalisches Wort oder auch Wörterbuchwort, z. B. leben) gegenüber Wortform (z. B. lebst, lebte, gelebt etc.) zu fassen (vgl. z. B. Glück 2010, 768). Die Wortformen sind aber selbst emische Einheiten, deren Menge (außer bei Verben) zudem sehr überschaubar ist: Bei Substantiven sind es nur zwei bis vier Einheiten und bei unveränderlichen Wörtern ist die Rede von Wortformen in diesem Sinne ganz unangebracht. Etische Einheiten bezeichnet man daher besser als Textwörter oder Tokens, denn beim Wort im Text geht es u. a. darum, wie oft ein Text dieselbe Wortform (als Type) enthält. Die Entgegenstellung Lexem vs. Wortform ergibt sich aus der Sichtweise, die an Ebenen orientiert ist und diesen auch sprachwissenschaftliche Subdisziplinen zuordnet: Lexeme gehören zum Gegenstandsbereich der Lexikologie, der Untersuchung des Wortschatzes. Hier stehen Autosemantika ganz im Vordergrund, so dass manche gar geneigt sind, Bedeutung und die zugehörige Disziplin, Semantik, auf ‚lexikalische Bedeutung‘ zu verengen (vgl. Busse 2009). Der Semantik wird in derselben Perspektive dann die Grammatik gegenübergestellt. In deren Teildisziplin Morphologie fällt die Bildung von Wortformen, während der große Bereich der Syntax für die Regeln zur Bildung von Phrasen und Sätzen zuständig ist. Entsprechend dieser Aufgabenteilung braucht sich dann die Textlinguistik als auf die höchste Ebene spezialisiert nur noch um die Regeln zur Verknüpfung der nächstniederen Einheiten zu kümmern. Als solche betrachtet man Sätze, denn Teiltexte (Kapitel, Titel, Abschnitte), aber auch nicht satzförmig gestaltete Elemente (Schemata, Listen, Tabellen usw.) gehören traditionell nicht zum Beschreibungsobjekt der Grammatik. Aus diesem Zusammenhang erklärt sich der Topos, für die ‚traditionelle Grammatik‘ (tatsächlich betrifft das die strukturalistische) stelle der Satz die oberste Beschreibungsebene dar und diese Annahme würde mit der neuen Disziplin der Textlinguistik überwunden. Dem steht von Anfang an gegenüber die Auffassung, dass Text „in der Realität verwendete Sprache ist“, „das eigentliche, d. h. originäre sprachliche Zeichen“ (Hartmann 1968/1978, 100), während die Elemente des Sprachsystems und die Verbindungsregeln nur „eine Abstraktion aus der Sprachrealität“ (ebd., 99) darstellen und damit den Status von linguistischen Konstrukten haben. In dieser Tradition hat Scherner (1984) auch die Formel Sprache als Text geprägt. Am schärfsten kommt der Gegensatz zur traditionellen Sicht in der These zum Ausdruck, es gäbe gar keine ‚Sprache hinter dem Sprechen‘, hinter dem Text (vgl. Krämer/König 2002). Dabei werden die Langue und die in ihr angesetzten Elemente wie z. B. Lexeme nicht nur als eine bloße Abstraktion aufgefasst, sondern geradezu als Schimäre. Es versteht sich, dass man auf der Grundlage dieser zwei Sichtweisen zu ganz unterschiedlichen Aufgabenstellungen für die (Text-)Linguistik kommt und auch
Das Wort im Text
155
Unterschiedliches über das Wort im Text zu sagen ist. Im Folgenden werden beide Sichtweisen parallel berücksichtigt.
2 Abstraktionsebenen 2.1 Wortform vs. Lexem Wir setzen zunächst noch einmal an der einfachen Gegenüberstellung von Textwörtern/Wortformen gegenüber abstrakten Systemeinheiten/Lexemen an. Dass man sich in Ebenen- und System-orientierten Ansätzen damit begnügt, erklärt sich daraus, dass konkrete Einzeltexte für diese Sichtweise überhaupt ohne Interesse sind – es geht eben nur um die Regeln zur Textbildung. Die Produkte des Sprachgebrauchs gelten nur als Instantiierungen solcher Regeln. Die Angemessenheit dieser Sichtweise wird nun praktisch problematisiert durch die Korpuslinguistik, und zwar in ihrer Ausprägung als Methodologie und nicht als technisches Hilfsmittel für herkömmliche Ansätze (vgl. zu diesem Unterschied Perkuhn u. a. 2012, 18 ff.). Ihr geht es ebenfalls um ‚in der Realität verwendete Sprache‘, und zwar durchaus in erklärtem Gegensatz zu empiriefernem Arbeiten. Die Sprachwirklichkeit erscheint dabei allerdings v. a. als eine Masse von authentischen Äußerungen, die in Großkorpora wie dem Deutschen Referenzkorpus (DeReKo) gesammelt werden. Diese Korpora setzen sich zwar aus Texten zusammen, die Daten können allerdings „wegen ihrer schieren Masse mit dem Intellekt nicht einmal gesichtet werden“ (Köhler 2005, 5). D. h. die Einzeltexte gehen im Großkorpus gewissermaßen auf und verlieren ihren Status als integrale Einheiten oder gar als ‚Einzelereignisse (relativ) abgeschlossener kommunikativer Äußerungen in ihrer situativen Einbettung‘, für die sich die oben angesprochene Sprachgebrauchslinguistik interessiert. Großkorpora sind nicht Sammlungen von Texten, in denen man liest, sondern in denen man sucht. Für unseren Zusammenhang ist nun wichtig, dass die Korpuslinguistik prominent mit den Termini Type und Token operiert. Tokens sind das Maß für den Umfang von Korpora (DeReKo umfasst z. B. derzeit 24 Milliarden Wörter). Statt sie auch als Textwörter zu bezeichnen, wäre es eigentlich angemessener, von Korpuswörtern zu sprechen und Textwörter für die Gesamtheit der zu einem Text gehörenden Tokens zu reservieren. In diesem Sinne gebraucht man den Ausdruck ja auch, wenn man die lexikalische Diversität von Einzeltexten mit der Type-Token-Ratio erfasst. Gewichtiger als diese terminologische Frage ist aber die unterschiedliche Verwendung des Ausdrucks Wortform. In der Lexikologie und Morphologie handelt es sich, wie bereits gesagt, um die einem Lexem bereits zugeordneten Wortformen, also um Konkretisierungen einer abstrakteren Einheit. In der Korpuslinguistik ist dagegen die Blickrichtung umgekehrt: Unter Wortformen versteht man hier einen Type, dem
156
Kirsten Adamzik
identische Tokens zugerechnet werden (vgl. Lemnitzer/Würzner in diesem Band). Konkret sind es rein formale Einheiten, nämlich identische Buchstabenfolgen, ganz unabhängig von ihrer Bedeutung. Offenbar ist aber auch innerhalb der Korpuslinguistik die Terminologie nicht ganz klar. Perkuhn u. a. (2012, 27) bezeichnen die von der Bedeutung abstrahierende Lesart als ‚eher übliche Verwendungsweise‘. Neben dieser „wird die Bezeichnung Type aber auch manchmal eingesetzt, um auf abstraktere Einheiten Bezug zu nehmen, wie etwa ein Lexem oder Lemma“. Daraus resultierende verschiedene Zählungen erläutern sie an dem Satz Eine schöne Rose ist eine schöne Rose, zwei Rosen sind noch schöner (vgl. Abb. 1).
Token:
12
Type1:
10
Lexem-Type2:
6
Eine, schöne, Rose, ist, eine, schöne, Rose, zwei, Rosen, sind, noch, schöner Eine, schöne (2x), Rose (2x), ist, eine, zwei, Rosen, sind, noch, schöner ein (Eine, eine), schön (2x schöne, schöner), Rose (2x Rose, Rosen), sein (ist, sind), zwei, noch
Abb. 1: „Unterschiedliche Wortzählungen“ (aus Perkuhn u. a. 2012, 27)
Es handelt sich um ein recht einfaches Beispiel, in dem keine Homonyme vorkommen. Bemerkenswert ist, dass die beiden Vorkommen des unbestimmten Artikels, die sich nur durch Groß-/Kleinschreibung unterscheiden, in der ersten Type-Zählung als verschiedene Types behandelt werden. Selbstverständlich lässt sich auch eine weitere Zählung denken, die diesen Unterschied neutralisiert, wenn er nur auf die Satzgrenze zurückgeht. Auch nennen die Autoren die Lexem- oder Lemma-Ebene ja eigentlich nur als Beispiel. Dass sie gerade diese Ebene wählen, hängt natürlich damit zusammen, dass nach eben dieser die meisten Benutzer suchen, weswegen es auch das automatische Werkzeug der Lemmatisierer gibt. Theoretisch fällt die bei der Lemmatisierung erzeugte Wortformenliste mit der aus der Lexikologie/Morphologie extensional zusammen (praktisch ist das häufig nicht der Fall, weil der automatischen Lemmatisierung – wie auch der Tokenisierung – doch (noch enge) Grenzen gesetzt sind). Diese Annäherung der beiden Sichtweisen auf Wortformen ist jedoch recht trügerisch, und es ist m. E. empfehlenswert, die völlig abstrakten Ausdrücke Type und Token nicht mit irgendwelchen Sprachebenen zu vermischen. Sie sind auf die verschiedensten Einheiten anwendbar, also auch auf eine tiefere (Morpheme, Phoneme) oder eine noch höhere Ebene. Die Wortebene ist zwar für die Korpuslinguistik gewissermaßen der ‚natürliche‘ Zugang, aber grundsätzlich steht es den Analysierenden frei, welche Größen sie untersuchen wollen. Dies sei am Beispiel Sein Lieblingsspruch ist „Sein oder Nichtsein …“ demonstriert. Dieser Satz enthält 44 Druckzeichen. Das Word-Programm rechnet die drei Punkte als nur eine Einheit und kommt also auf 42 Zeichen – eigentlich könnte/sollte
Das Wort im Text
157
man auch die Anführungszeichen als ein diskontinuierliches Zeichen zählen. Bei 39 Druckzeichen handelt es sich um Buchstaben. Diese kann man nun sowohl Graphemen als auch Phonographemen als Types zuordnen. So kommt in dem Satz der Buchstabe viermal vor; er repräsentiert dabei immer einen Bestandteil eines Digraphen, dreimal für einen (denselben) Diphthong und einmal für einen Langvokal. Die folgende Tabelle (Abb. 2) soll weitere Ebenen verdeutlichen (wobei es auf die genaue Anzahl und Benennung der Stufen nicht ankommt). Sie betrifft das erste Wort des Beispielsatzes und setzt also als Type erster Stufe die Buchstabenfolge an, die zweimal als Wort und einmal als Bestandteil eines Wortes vorkommt. Es ist nun gar nicht so einfach (bzw. letzten Endes arbiträr), auf welcher Stufe man für das erste Vorkommen den Type im Sinne des Lexems oder Lemmas ansetzt: Possessivum oder Possessivum der 3. Ps./der 3. Ps. Sg./der 3. Ps. Sg. Mask. oder der 3. Ps. Sg. Mask./ Neutrum? Im Wörterbuch finden sich die Grundformen alphabetisch verstreut, es gibt also (z. B. im Duden Universalwörterbuch) Einträge für die Possessivvariante von mein, unser, dein, ihr (3 Subeinträge), sein (Subeinträge für zwei Genera) usw. In Grammatiken sind alle Formen tabellarisch – in der Regel neben den entsprechenden Personalpronomina – angeordnet. Die vom Genus des Bezugsnomens abhängigen Wortformen werden in der Regel nur an einem Possessivum demonstriert (Akkusativ: meinen Freund vs. mein Kind), da sie überall gleich sind. Funktionswort vs. Inhaltswort Wortklassen/ Wortarten
flektierbar vs. unflektierbar Artikelwort vs. … Possessivpronomen vs. … 1. vs. 2. vs. 3. Person
grammatisch spezifizierte Wortformen
Singular vs. Plural Mask. oder Neutr. vs. Fem. Nom. vs. Akk. vs. Dat. vs. Gen.
Graphemfolge
reguläre Schreibvarianten
sein, Sein, SEIN
nicht reguläre Varianten
SEin, sEin, sain, …
konkrete Materialisierungen
Platzierung, Schriftart, -größe etc.
Abb. 2: Typen von Wortformen
Die Frage, welchen Types man die Possessiva in Textanalysen zuordnet, ist von der Lemmatisierung eigentlich nicht betroffen, d. h. es gibt sehr verschiedene sinnvolle Gruppierungen. Ich beschränke mich auf zwei Beispiele: Man kann etwa die Pronomina der 3. Person – gegenüber denen der 1. und 2. – zusammenfassen. Das ist textsor-
158
Kirsten Adamzik
tensensitiv, und zwar gleichgültig, ob es sich um Personal- oder Possessivpronomina handelt. Für eine andere Fragestellung ist relevant, wie viele maskuline – gegenüber femininen – Personenbezeichnungen vorkommen, wobei man sogar davon absehen kann, ob es sich um Pronomina, Namen oder Appellativa handelt. Im oberen Kasten der Abbildung befinden sich Typen von Types, die als übereinzelsprachliche Kategorien infrage kommen. Elementar ist die Unterscheidung von Syn- und Autosemantika, und ihre durchschnittliche relative Menge in einem Text ist abhängig vom Sprachtyp. Für das Deutsche (gegenüber z. B. dem Englischen) ist weiter etwa charakteristisch, dass es in Texten/Korpora sehr viele flektierte Funktionswörter gibt. Als übereinzelsprachliche Types kommen aber auch Inhaltselemente infrage, in unserem Beispiel betrifft das v. a. die hier nur unvollständig aktualisierte Textstelle von Shakespeare mit zwei weiteren Vorkommen von . Anders als deutsche Infinitive umfassen englische zwei Wörter und nicht eins, und in der englischen Fassung ist zudem tatsächlich zweimal der Infinitiv realisiert: To be, (or not) to be …, während dieser in der deutschen Beispielversion als substantivierte Form erscheint. Man könnte allerdings auch schreiben Sein oder nicht sein, ferner Sein oder Nicht-Sein. Im mittleren Kasten geht es um die spezifische grammatische Bedeutung der Wortform im Sinne der Ausprägung eines Lexems. Diese ist es, die man zum Verstehen des Textes braucht und die zu erkennen den automatisierten Analysetechniken (noch) ziemliche Probleme bereitet, besonders natürlich, wenn die Form wie in diesem Fall homonym zu einem höchstfrequenten Verb ist. Gibt man etwa in Cosmas II (Portal für die Korpusrecherche in den schriftsprachlichen Textkorpora des IDS, Archiv der geschriebenen Sprache, alle öffentlichen Korpora; Abfrage 24.6.2014) die Lemmaabfrage ‚&sein‘ ein, erscheinen nicht weniger als 177 Wortformen. Es ist aber nicht erkennbar, wie viele Lemmata dabei im Spiel sind. Zur Wortform bin gehören z. B. auch Tokens, die nichts mit dem Verb oder seiner Nominalisierung zu tun haben, u. a. Osama Bin Laden oder BiN Bank in Niederuzwil. Der untere Kasten verdeutlicht zunächst Folgendes: Auch wenn man von Wortformen als Textwörtern spricht, hat man in der Regel eine abstrakte Einheit, eine Buchstabenfolge, vor Augen. Von typografischen Eigenschaften der Zeichen wird üblicherweise abstrahiert. Schriftgröße, Font oder andere Auszeichnungen werden in den meisten Korpora normalerweise nicht mit erfasst, obwohl die Auswertung dieser Eigenschaften für manche Fragestellung sicher aufschlussreich wäre. (Perkuhn u. a. 2012, 30)
Von den Einzelvorkommen der Wortformen wird auch insofern abstrahiert, als die Texte digitalisiert sind und also in virtueller Form vorliegen. Abgesehen davon, dass man damit von der Materialität absieht, ist auch die Vorkommenshäufigkeit ganz auf das Korpuskonstrukt bezogen. In diesem hat jeder Text das gleiche Gewicht. Für die Sprachwirklichkeit ist es aber keineswegs irrelevant, in wie vielen materiellen Ein-
Das Wort im Text
159
zelexemplaren die Zeichen(ketten) vorliegen bzw. wie häufig Sprachteilhaber damit konfrontiert sind. Bei Alltagsgesprächen ist die Zahl der Rezipienten extrem gering, bei Zeitungstexten dagegen sehr hoch (vgl. dazu auch ebd., 74 f.).
2.2 Performanz, Kompetenz und Norm Der konsequente Bezug auf die Sprachrealität bringt nun mit sich, dass Korpora (Performanz-)Fehler enthalten. Denn in der Sprachrealität kommen selbstverständlich auch viele Ausdrücke vor, die den Regeln – irgendeiner Ebene – nicht entsprechen. Im Umgang mit solchen Erscheinungen scheiden sich die Geister besonders stark. Holzschnittartig gegenübergestellt betrachten die einen die Performanz (im abwertenden Sinne des Wortes) als für die Rekonstruktion der Sprachkompetenz irrelevant und lassen sich gleich gar nicht auf die Sprachwirklichkeit ein bzw. scheiden unerwünschte Korpusbelege aus der Betrachtung aus. Den anderen ist überhaupt die Vorstellung suspekt, in authentischen Sprachdaten Fehler ausmachen zu wollen. Sie wenden sich damit gegen die normative Komponente, die kompetenzorientierten Ansätzen eingeschrieben ist: Denn diese suchen nach Regeln, und zwar nach den Regeln, aufgrund derer – gleichgültig auf welcher Ebene – grammatisch korrekte (Folgen von) Sprachzeichen gebildet werden. Perkuhn u. a. (2012, 71) ist nun sicher zuzustimmen, wenn sie feststellen, es sei gar „nicht so leicht, zwischen (angeblichen) Fehlern und neu aufkommenden Varianten einer Schreibweise oder Formulierung zu unterscheiden“. Dennoch scheint es mir wichtig, nicht aus dem Auge zu verlieren, dass Fehler unbestreitbar einen Bestandteil der Sprachrealität bilden. Am wenigsten wird man dem wohl widersprechen, wenn es um Fehler geht, die überhaupt erst durch die Texttechnologie entstehen. Es braucht nicht weiter ausgeführt zu werden, wie schwierig die Umsetzung eines Textbilds in eine computerlesbare Textdatei ist und dass auch bei aufwendiger Nachbearbeitung automatischer Texterkennung (OCR: Optical Character Recognition) und mithin auch in (Groß-)Korpora Fehler bestehen bleiben. Beim gewöhnlichen Schreiben mit dem Computer korrigieren Programme nicht nur menschliche Fehler, sondern produzieren auch eigene, z. B. automatisch gesetzte Majuskeln nach Punkten oder abweichende Worttrennungen. Der zweite Zusammenhang, in dem Fehler als selbstverständliche Phänomene des Sprachgebrauchs behandelt werden (müssen), sind die Fälle, wo Sprachteilhaber selbst Korrekturen vornehmen. Bei Lernertexten (die natürlich auch Falschkorrekturen enthalten können) stellen Fehler und Selbstkorrekturen als solche einen Forschungsgegenstand dar. In der Gesprächslinguistik gehören Selbst- und Fremdkorrekturen zu den besonders beachteten Phänomenen. In welchem Ausmaß Texte Fehler enthalten, hängt natürlich stark von den einbezogenen Textsorten ab. Besonders viele darf man erwarten, wenn es sich um nicht redigierte Schriftäußerungen handelt. Um dies am obigen Beispiel zu verdeutlichen:
160
Kirsten Adamzik
Die Abfrage zu ‚&sein‘ liefert für die Wortform u. a. 12 Tokens der Variante . In einem Fall handelt es sich um ein sprachspielerisches Mittel, das über die Grenzen von zwei Wörtern hinweg ein drittes Wort sichtbar macht: „Laut PisA BIn ich blöd, aber…“ lautete das Motto der Abiturienten des Kurpfalz-Gymnasiums (M02/JUL.48882 Mannheimer Morgen, 01.07.2002). Alle anderen Belege stammen aus den Diskussionsseiten zu Wikipedia-Artikeln, eine der wenigen Textsorten aus dem DeReKo-Korpus, die offensichtlich (meist) nicht an der Schriftnorm orientiert sind. Es ist hier m. E. unproblematisch, von eindeutigen Fehlschreibungen auszugehen, zumal bei Tokens innerhalb von Absätzen, die Großschreibung nur am Satzanfang praktizieren. Denn dass nach einem Großbuchstaben versehentlich ein zweiter gesetzt wird, ist so häufig, dass Textverarbeitungsprogramme auch dafür gleich eine automatische Korrektur anbieten. Majuskeln innerhalb von Wörtern werden aber nicht nur im ersten -Beispiel als bedeutungstragendes Ausdrucksmittel eingesetzt, sondern kommen bekanntlich vielfach so vor, u. a. für geschlechtergerechte Formen wie LeserInnen, aber auch in anderen Zusammenhängen wie bei Firmen- und Produktnamen (BahnCard) oder in älteren Texten, so schrieb man früher einmal GOtt der HErr.
2.3 Emische Einheiten oberhalb der lexikalischen Ebene Auf der Ebene solcher Schreibvarianten sowie der von Wortformen im morphologischen Sinn bis hin zu überlieferten Sätzen wie Sprichwörtern oder dem ShakespeareZitat ist es recht einfach, einen Type oder eine emische Einheit anzusetzen, die beliebig oft und auch in einem Text mehrfach aktualisiert werden kann. Auch Konstruktionen (im Sinne der Konstruktionsgrammatik) sind immerhin (teilweise) lexikalisch gefüllt und können unter Rückgriff auf Signifiant-Varianten aufgesucht werden. Es ist aber kein Zufall, dass die strukturalistischen Terminipaare nach dem Vorbild von Phon/Phonem gewöhnlich spätestens auf der Ebene Lex/Lexem enden (wobei Lex bereits ein sehr ungewöhnlicher Ausdruck ist). Denn auf den höheren Ebenen hat man es mit ganz abstrakten Einheiten wie Nominalphrasen, Subjekten, Nebensätzen usw. zu tun, die lexikalisch nicht spezifiziert sind, über deren Signifiants man also nichts aussagen kann. Das ändert freilich nichts daran, dass man auch solche Kategorien als Types definieren und einen Text etwa auf Vorkommen von Adverbialbestimmungen, Fragesätzen oder Genitivattributen absuchen kann; Satzbaupläne stellen sogar globale Muster dar, die man noch ganz gut mit emischen Einheiten niedrigerer Ebenen parallelisieren kann. Insofern ist es schon erstaunlich, dass ausgerechnet auf der höchsten Ebene das Gegensatzpaar etisch-emisch wiederkehrt und auch der Ausdruck Textem geprägt wurde. Das hat damit zu tun, dass sich die Textlinguistik, besonders in der textgrammatischen Ausprägung, durch eine starke Normorientierung auszeichnet und, dem Vorbild der Satzgrammatik folgend, eben nach den Regeln suchte, entsprechend
Das Wort im Text
161
denen Sätze zu wohlgeformten Texten verkettet werden. Es gilt aber auch für viele Beiträge, die sich dem kommunikativ-pragmatischen Ansatz der Textlinguistik verpflichtet fühlen (vgl. z. B. Brinker 2010, 39 f. oder Heinemann/Heinemann 2002, 64–68 und 134 ff.). Als eine besondere Spielart davon darf man die Bemühungen aus der Angewandten Textlinguistik verstehen, die die Textoptimierung (vgl. Antos u. a. 2011) als ein wesentliches Arbeitsfeld begreifen. Denn damit unterstellen sie ja zugleich, dass die in der sprachlichen Wirklichkeit vorkommenden Texte eben nicht alle optimal sind, sondern teilweise massiv gegen Regeln und Normen verstoßen. Es gibt verschiedene Varianten der Idee, auf der Textebene abstraktere Einheiten anzusetzen und/oder normative Setzungen vorzunehmen. Diese sind in der Literatur ausführlich behandelt und werden daher hier eher summarisch abgehandelt. Die Rede von emischen und etischen Texten stammt von Roland Harweg (1968), der sich ganz auf die Kohäsionsmittel konzentriert und dazu eine neue Definition von Pronomina vorgeschlagen hat (vgl. dazu weiter Abschnitt 3.1). Etische Texte entsprechen der Sprachwirklichkeit, es sind Texte, wie sie eben vorkommen, mit all ihren Unvollkommenheiten und Fehlern. Emische sind dagegen solche, die den Wohlgeformtheitsbedingungen folgen. Dies entspricht m. E. nur sehr ungefähr dem Gegensatz Token – Type auf den niedrigeren Ebenen. BIn oder bringte kommen in der Sprachwirklichkeit vor und lassen sich auch problemlos den entsprechenden Lexemen zuordnen. Sie widersprechen bloß orthografischen bzw. morphologischen Regeln – ohne i. Ü. dadurch ihre Verstehbarkeit oder kommunikative Funktionalität einzubüßen. Während das Begriffspaar emischer/etischer Text in der weiteren Diskussion keine besondere Rolle gespielt hat, erfreut sich eine verwandte ‚Begriffs‘schöpfung bis auf den heutigen Tag großer Beliebtheit (vgl. z. B. Schubert 2012, 20 ff.; Averintseva-Klisch 2013, 4 ff.). Gemeint ist der Ausdruck Nicht-Text, der auf eine unglückliche Formulierung von Beaugrande/Dressler (1981, 3) zurückgeht. Diese ist gewissermaßen ein Erbe aus dem textgrammatischen Ansatz: Da Sätze nicht beliebig aufeinander folgen können, scheint es möglich und nötig, nach Kriterien für Textualität zu suchen, so dass die Frage zentral wird, was genau eine Folge von Sätzen zu einem Text macht. Allerdings betrachten Beaugrande/Dressler Kommunikativität als entscheidendes Merkmal für Textualität, gehen also nicht von der Idee aus, dass in Texten Produkte der Satzgrammatik hintereinandergeschaltet werden, sondern wählen als Oberbegriff/genus proximum kommunikative Okkurrenz. Darunter darf man wohl Tokens von (realen) Kommunikationsversuchen verstehen. Inwiefern sich nun aus der Sicht einer beschreibenden Wissenschaft an solche realen Sprachvorkommen bestimmte Anforderungen stellen lassen, muss ebenso rätselhaft bleiben wie die Aussage, „nichtkommunikative Texte [würden] als Nicht-Texte behandelt“ (ebd.; vgl. dazu genauer Adamzik 2004, Kap. 3.1.). Ebenso einhellig wie die Bezugnahme auf die Textualitätskriterien von Beaugrande/Dressler ist in der späteren Literatur daher der Einwand, es handle sich gar nicht um notwendige Texteigenschaften. Dabei bezieht man sich allerdings selten auf die entsprechende Klarstellung von Beaugrande selbst:
162
Kirsten Adamzik
Since the appearance of the Introduction to Text Linguistics in 1981, which used these principles [of textuality – cohesion, coherence, intentionality, acceptability, informativity, situationality, and intertextuality] as its framework, we need to emphasize that they designate the major modes of connectedness and not (as some studies assumed) the linguistic features of text-artifacts nor the borderline between ,textsʻ versus ,non-textsʻ (Beaugrande 1997, I. 52).
Die Prinzipien oder Dimensionen sollen also v. a. die Komplexität des Beschreibungsgegenstandes deutlich machen und eignen sich als eine Art Checkliste für die Analyse (deswegen sind sie auch so prominent geblieben), es ist aber – entgegen dem ersten Anschein – ganz unangebracht, Beaugrande/Dressler eine normative Haltung zu unterstellen. Aus ihrem Werk hat ein weiteres Element die Diskussion stark beeinflusst, das ist das Prinzip der Intertextualität. Beaugrande/Dressler konzentrieren sich stark auf die sog. allgemeine Intertextualität, die „für die Entwicklung von TEXTSORTEN als Klassen von Texten mit typischen Mustern von Eigenschaften verantwortlich“ (1981, 13) ist. Diese Vorstellung hat weite Verbreitung gefunden und so begreift man Text sorten tatsächlich am häufigsten als (die) abstrakte Einheit auf der Textebene. Besonders viel zitiert wird die Formulierung von Brinker (Brinker 2010, 120) „Der konkrete Text erscheint immer als Exemplar einer bestimmten Textsorte“, die die Auswahl aus einer vorgegebenen Menge von globalen Mustern geradezu als normalen Schritt bei der Textproduktion denken lässt. Die Textsorte wäre danach als Type, ein dazugehöriger Einzeltext als Token aufzufassen. Ein Problem besteht darin, dass man von Textsorten auf sehr verschiedenen Ebenen spricht und häufig terminologisch noch abstraktere Ebenen wie Textklasse, -typ, -art usw. daneben stellt. Besonders gut mit dem Paar Lexem – Wortform parallelisieren lassen sich Textsorten auf extrem niedriger Abstraktionsebene bzw. mit extrem ausgeprägter Standardisierung. Hier handelt es sich eigentlich schon um Einzeltexte. Das Bestellformular einer Firma, der Reisepass eines bestimmten Landes oder der Kontoauszug einer bestimmten Bank z. B. stehen als Vordrucke oder in digitaler Form für den Gebrauch zur Verfügung. Es sind potenzielle oder virtuelle Einheiten, die erst in ihrer ausgefüllten bzw. ergänzten Version, also als situativ spezifizierte, ihre kommunikative Funktion erfüllen. Bei der Rezeption schaut man dann überhaupt nur auf die jeweils variierenden Teile, jedenfalls sofern man mit der Vorlage vertraut ist. Den allgemeineren Kategorien Formular oder Ausweispapier würden dagegen auf der Wortebene eher Klassen wie Wortfeld, -art, -familie, Wortbildungstyp und dergl. entsprechen. Ganz besonders schlecht passt die Vorstellung, Texte stellten Aktualisierungen vorgegebener Muster dar, auf solche Textsorten, die kaum irgendwelche Vermutungen darüber erlauben, was an Textwörtern vorkommt. Dazu gehören natürlich besonders literarische. Die Skala zwischen den beiden Extrempolen ist extrem breit. Auf die Frage, welches Vokabular bei Texten erwartbar ist und wie es sich strukturieren lässt, komme ich im Abschnitt 3.2 zurück.
Das Wort im Text
163
Hier muss es noch um den Versuch gehen, das Paar etisch-emisch ausdrücklich auf höhere Ebenen anzuwenden: Vom Morphem zum Textem. Dies ist der Titel einer recht heterogenen Sammlung von Aufsätzen von Walter A. Koch (1969), in dem Erläuterungen zum Ausdruck Textem allerdings keine besondere Rolle spielen. Koch hat ein systematisches Begriffsnetz geprägt, u. a. mit Logem (ungefähr äquivalent zu Wort) und Syntaktem (ungefähr äquivalent zu Satz). Bei den höherstufigen emischen Einheiten meint Koch hier extrem abstrakte Strukturen (Subjekt + Prädikat für das Syntaktem und Topik, Thema und Komment für das Textem). Daher ist auch die Parallele zu den Morphemen einer Sprache eigentlich nicht angemessen. In einem anderen Zusammenhang hat Koch (1971) den Ausdruck Textem jedoch auf eine sehr viel weniger abstrakte Einheit, eigentlich einen Einzeltext, angewandt und dabei auch den Ausdruck Allotext benutzt. Es geht ihm dabei um oral tradierte Texte wie z. B. Volksmärchen. Es sind dieselben Texte, die immer wieder reaktualisiert werden, allerdings in mehr oder weniger stark variierender Gestalt. So könnte man auch verschiedene Inszenierungen eines Theaterstücks als Allotexte bezeichnen, die sich in den einzelnen Aufführungen als Tokens realisieren. Wie auf der Wortebene lassen sich also unterschiedliche Abstraktionsebenen unterscheiden, und zwar durchaus abhängig vom Einzeltext und dem Überlieferungswert, den Gesellschaften diesem zugeschrieben haben: Von Theaterstücken wie Hamlet gibt es eine unüberschaubare Menge von Inszenierungen, (mitgeschnittenen) Aufführungen und Verfilmungen. Dasselbe gilt natürlich für gedruckte Fassungen, bei denen die Auflagenhöhe Aufschluss über die Anzahl der Tokens einer Ausgabe (das wäre ein schriftlicher Allotext) gibt. Für die Literaturwissenschaft bzw. Philosophie, Religions-, Rechtswissenschaft usw., die sich mit lange überlieferten Texten befassen, sind solche Fragen der Überlieferungs- und Rezeptionsgeschichte zentral. In der Textlinguistik spielen sie gegenüber der abstrakten Kategorie Textsorte – in diesem Fall würde man Hamlet als ‚Exemplar‘ einer Tragödie bezeichnen – fast keine Rolle. Das ist erstaunlich angesichts des neuen Interesses für Oberfläche, Performanz, Materialität und Visualität (vgl. z. B. Holly 2013), aber auch mit Blick auf die Mediengeschichte. Denn an der Drucktechnik ist ja so entscheidend – und für die an Handschriften Gewöhnten überraschend –, dass dadurch erstmals sehr viele identische Exemplare einer Vorlage erstellt werden konnten. Die einzelnen Endprodukte, die Bücher als Tokens, sind natürlich materiell nicht identisch, das ist nur das Druckbild, das im traditionellen Druck auf der physischen Bleiform beruht. Setzt man nun denselben Text in größeren Lettern, verändert sich das Druckbild, insbesondere die Verteilung der Wörter auf die Seiten. Es können aber exakt die gleichen Folgen von Druckzeichen entstehen. Heutzutage bedarf es nur eines Mausklicks, um solche Effekte zu erzielen. Wenn ich diese Elementaria hervorhebe, so deswegen, weil die Frage nach dem Wort im Text angesichts der hohen Aufmerksamkeit, die multimediale Erzeugnisse moderner Technologie auf sich ziehen, mitunter etwas in den Hintergrund gerät und
164
Kirsten Adamzik
die Annahme, Texte bestünden letzten Endes aus Wörtern, heute leicht geradezu naiv erscheint. Die Erinnerung an lang überlieferte und in den unterschiedlichsten Versionen existierende Texte zeigt indes, dass es gar nicht möglich ist, ein für alle Mal zu bestimmen, was denn die Identität eines Textes ausmacht, sondern dass es auch hier verschiedene Abstraktionsebenen gibt. Sollte man nun für eine davon den Ausdruck Textem benutzen? Die Begriffsschöpfungen Kochs haben sich nicht durchgesetzt (wenngleich Bußmann (2008) immer noch den Eintrag Textem führt) und es ist höchst fraglich, welcher Ebene Textem genau entsprechen sollte. Ich halte es daher für sinnvoller, von virtuellen Einheiten auf der Textebene (virtuellen Texten) zu sprechen (vgl. Adamzik 2008) und die jeweils gemeinte Abstraktion explizit zu kennzeichnen. Eine für die Linguistik und speziell diesen Artikel besonders relevante Ebene ist zweifellos der Text als Wortlaut, bei dem es sich in jedem Fall um eine abstrakte Einheit handelt, da derselbe Wortlaut medial und materiell in unendlicher Variation re-aktualisiert werden kann. Bei den oral überlieferten Texten, für die Koch Textem benutzt hatte, spielt der Wortlaut dagegen schon deswegen eine höchst untergeordnete Rolle, weil es sich um (potenziell) übereinzelsprachliche Einheiten handelt.
3 Texte als Folgen, Netze und Mengen von Wörtern 3.1 Kohäsionsmittel Betrachtet man einen Text als funktionale Ganzheit, so sind selbstverständlich sämtliche seiner Eigenschaften, mithin auch alle Wörter relevant. Aufgrund der Tradition, Texte als verkettete Sätze aufzufassen, hat jedoch eine Sichtweise auf Wörter im Text eine große Bedeutung erlangt, die nur einem Teil von ihnen einen besonders bedeutsamen Status einräumt, nämlich den sog. Kohäsionsmitteln. Diese zerfallen zunächst in zwei große Untergruppen: phorische/textdeiktische Elemente auf der einen (z. B. Im Keller ist eine Maus. Sie hat die Schuhe angeknabbert.) und (Satz-)Konnektoren (Denn Käse gabʼs da nicht.) auf der anderen Seite. Prototyp für beide sind Funktionswörter, nämlich Pronomina für die erste und Konjunktionen für die zweite Gruppe. Beide kommen allerdings auch innerhalb von (komplexen) Sätzen vor, sie sind also nicht für die Textebene spezifisch. Insofern ist es schon bemerkenswert, dass es völlig unkontrovers scheint, Textgrammatik als Analyse transphrastischer Phänomene zu begreifen. Zugrunde liegt eine orthografische ‚Definition‘ von Satz. Diese ist noch viel problematischer als die orthografische Definition von Wort. Denn wo man in einer Folge von (potenziell) eigenständigen Sätzen, also Hauptsätzen, Komma, Punkt oder Semikolon setzt, ist nicht einmal durch die Interpunktionsregeln normiert. Der durch die Zeichensetzung grafisch als Einheit markierte Satz ist ein Phänomen der Parole par excellence. In der Sprachwirklichkeit nehmen sich die Schrei-
Das Wort im Text
165
benden zudem alle Freiheiten und notieren auch Nebensätze, einzelne Konnektoren sowie „Sinneinheiten in Satzfragmenten als Schreibsätze“ (Duden 2009, 1062). Text optimierungen bestehen oft gerade darin, die mehr oder weniger willkürlich gesetzten Satzgrenzen abzuändern und z. B. einen sehr komplexen Satz in eine Folge von weniger komplexen oder einfachen Sätzen zu verwandeln. Mitunter reichen dafür Veränderungen der Interpunktion. Im Deutschen wird nun nicht einmal terminologisch konsequent zwischen dieser Einheit (engl. sentence, frz. phrase, dt. mitunter Ganz- oder Gesamtsatz) und einer grammatisch definierten Struktur unterschieden. Diese besteht laut Duden (2009, 763) „aus einem Prädikat mit finitem Verb und allen zugehörigen Satzgliedern“ (clause bzw. proposition). Das ist aber nur die kleinste Struktur; sie kann als Element einer komplexeren Einheit (Teilsatz) auftreten oder als eigenständige Einheit (Einfachsatz) – wenn es sich nämlich um eine Hauptsatzstruktur handelt und man danach ein Satzschlusszeichen setzt. Dem versucht der Duden durch eine zusätzliche Definition von Satz Rechnung zu tragen: „die größte Einheit, die man mit den Regeln der Syntax erzeugen kann“ (ebd., 764). Eine solche Einheit ist aber empirisch leer, da Einbettungsstrukturen bekanntlich rekursiv sind und man daher jedem komplexen Satz einen weiteren Teilsatz hinzufügen kann. Ebenso ist es – jedenfalls im Deutschen – theoretisch möglich, unendlich lange Wörter zu erzeugen. Wo Einheiten tatsächlich zu Ende sind, entscheidet sich allein in aktualisierter Sprache, nämlich daran, wo Schreibende im Text ein Spatium bzw. Satzschlusszeichen gesetzt haben. Rein normativ ist entsprechend die Bestimmung aus dem Textkapitel der DudenGrammatik: Der Punkt „markiert den Schluss eines Satzes oder einer kurzen Reihung von Sätzen“ (ebd., 1062). Selbst wenn man eine stark normative Definition von Satz zugrunde legt, ist man schon innerhalb der Satzsyntax mit dem fließenden Übergang zwischen (komplexem) Satz und Text konfrontiert. Das kommt sehr gut in der folgenden Bestimmung zum Ausdruck: Kohäsion liegt vor, wenn grammatisches Wissen verwendet wird, um einen Zusammenhang herzustellen. Das grammatische Wissen umfasst die Verwendungsregeln der grammatischen Funktionswörter und -zeichen des Deutschen […]. Ihre Paradigmen sind in geschlossenen Klassen organisiert. Sie bilden zusammen mit den Inhaltswörtern grammatisch wohlgeformte vollständige Aussagen. Als typische wohlgeformte vollständige Aussage gilt der Satz, in den alle Funktionswörter und -zeichen syntaktisch eingebunden sind. Von vielen Grammatiken werden sie deshalb nur aus der Perspektive des Satzes beschrieben. Kohäsionszeichen entfalten ihre eigentliche Funktion aber oft erst auf der Ebene des Textes […]. Dann liegt nicht nur Satzkohäsion, sondern auch Textkohäsion vor. (ebd.)
Der letzte Satz ist recht erstaunlich, weil er – ganz gegen die textgrammatische Tradition – zu unterstellen scheint, Textkohäsion sei etwas anderes als das, was sich aus dem kohäsiven Zusammenhalt von Sätzen ergibt. In der Sprachwirklichkeit kommen allerdings Sätze ebenso wie Wörter sowieso nur als Bestandteile von Texten vor. Dass
166
Kirsten Adamzik
man selten wie von Textwörtern auch von Textsätzen spricht, erklärt sich daraus, dass es auf Satzebene eben keine parallele emische Einheit gibt. Die ‚zugrundeliegende‘ Struktur ist entweder wie Kochs Syntaktem eine grammatisch abstrakte Konstruktion oder eine semantisch abstrakte Proposition. Auf diese Einheit deutet der Gebrauch des Ausdrucks Aussage in dem Zitat hin. Semantisch ist ein Text ein Komplex von Aussagen. Zwischen den Elementen beider Abstraktionsebenen, also der satzgrammatischen und der satzsemantischen, gibt es nun bekanntlich keine Eins-zu-Eins-Entsprechung, sondern allenfalls prototypische Pendants. Um nur das Wesentlichste zu nennen (genauer vgl. Polenz 1988, 1.5.): Eine Aussage besteht aus einer Prädikation (prototypisch realisiert durch Verben) mit ihren Bezugsstellen/Argumenten (prototypisch: Substantive), und für die Verknüpfung zwischen Aussagen gibt es Relationsausdrücke (prototypisch: Konjunktionen). Unter der Perspektive des Wortes im Text fragt sich nun, ob man über Wörter im Text etwas grundsätzlich Anderes sagen kann oder muss als über Wörter im Satz und wie man Kohäsionsmittel gruppiert. Die Gegenüberstellung von Funktions- und Inhaltswörtern betont den Gegensatz von Grammatik einerseits und Lexik/Semantik andererseits und damit auch den Gegensatz zwischen Kohäsion und Kohärenz. Da Inhalts- und Funktionswörter im Text aber engstens ineinandergreifen, halten manche die Unterscheidung von Kohäsion und Kohärenz überhaupt für unnötig bzw. nicht sauber durchführbar (so z. B. Brinker 2010, 17). Brinker spricht daher statt von Kohäsion von grammatischer Kohärenz. Ganz im Zentrum steht bei ihm und auch sonst traditionell das Prinzip der Wiederaufnahme. Damit ist die Verwendung referenzidentischer Ausdrücke gemeint, deren Prototyp eben das Pronomen ist. Am striktesten hat Roland Harweg die pronominale Wiederaufnahme von Vorgängerausdrücken zu dem wesentlichsten Mittel der Textkonstitution erklärt. Seine berühmte Definition von Text lautet: „ein durch ununterbrochene pronominale Verkettung konstituiertes Nacheinander sprachlicher Einheiten“ (1979, 148; Hervorhebung im Original gesperrt). Den Ausdruck sprachliche Einheiten, die verkettet werden, bezieht Harweg auf Sätze. Mit Pronomina sind natürlich nicht die traditionell so bezeichneten Funktionswörter gemeint, sondern alle (komplexen) Ausdrücke, die zur Wiederaufnahme geeignet sind, insbesondere Nominalgruppen mit definitem Artikel. Eine Maus kann also ‚pronominal‘ sowohl durch sie wie durch die Maus oder das kleine Tier wiederaufgenommen werden. Es sind somit (auch) komplexe Einheiten aus Funktions- + Inhaltswort/-wörtern, die die Kohärenz sichern. Harwegs Definition ist schon früh als unangemessen zurückgewiesen worden, denn tatsächlich erweisen sich die wenigsten Texte als in seinem Sinne ununterbrochen verkettet. Sein Ansatz scheint daher eigentlich nur noch von wissenschaftsgeschichtlichem Interesse zu sein. Gleichwohl sind zwei seiner Grundideen auch heute noch sehr weit verbreitet. Erstens nämlich, dass es bei den Wörtern im Text um solche zwischen nebeneinander stehenden Sätzen geht, und zweitens, dass die zentrale Fragestellung eine referenzsemantische ist.
Das Wort im Text
167
Da die grammatische Kohärenz, also der Gebrauch von Pronomina und Artikeln, einigermaßen trivial ist, stellt man bei der Erläuterung der Kohäsionsmittel bevorzugt Wörter bzw. komplexe Ausdrücke zusammen, die (potenziell) referenzidentisch sind oder wenigstens zum selben Sachbereich gehören, die also die thematische Kohärenz sichern. Dies führt zu teilweise sehr umfangreichen Listen semantischer Relationen wie Synonymie, Antonymie, Hyperonymie und vielem anderen mehr. Dabei ist von vornherein klar, dass solche Listen nicht exhaustiv sein können, u. a. weil sich die thematische Zusammengehörigkeit teilweise nur aus dem situativen Kontext ergibt. Häufig (aber nicht immer) werden den referenziellen Ausdrücken dann als zweite Großgruppe von Kohäsionsmitteln die Konnektoren an die Seite gestellt, für die man ebenfalls umfangreiche Listen erstellen kann. Anders als Pronomina haben Konnektoren noch eine relativ starke, wenn auch sehr abstrakte Eigenbedeutung und stehen damit auf der Grenze zu den Inhaltswörtern. Es ist daher üblich, sie nach semantischen Gruppen zu präsentieren, und so verfährt auch der Duden. Wegen der strikten Trennung von Kohäsion und Kohärenz spart der Duden (wie viele andere Darstellungen) allerdings die Inhaltswörter aus. Dass man z. B. kausale Relationen auch durch Grund, Bedingung, Folge, verursachen, bewirken, mit sich bringen usw. explizieren kann, bleibt unberücksichtigt. Ferner spielt auch die Frage keine Rolle, ob es sich um satzinterne oder satzübergreifende Konnektoren handelt. Die Darstellung ist sogar geeignet, den fließenden Übergang zwischen Satz und Text hervorzuheben: Nebensatzeinleitende Konjunktionen gehören definitionsgemäß zu den satzinternen Konnektoren. Sie werden in Tabellen zusammen mit den koordinierenden Konjunktionen sowie Ausdrücken einiger weiterer Wortarten präsentiert. Darunter auch Präpositionen, die in den meisten anderen Listen nicht als potenzielle Satzkonnektoren erscheinen. Von den Präpositionalphrasen, „die alternativ zu Sätzen, Infinitiv- oder Partizipialkonstruktionen umgeformt werden können“ – z. B. Wegen hoher Verluste … – heißt es: „sie schaffen also Text im Satz“ (ebd., 1072). Mit Text ist hier offenbar ‚Aussagenverknüpfung‘ gemeint. Im Sinne dieser Argumentation könnte man auch einen ‚Text im Wort schaffen‘, z. B. unter Rückgriff auf die legendäre Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz-Erfindung. Es bedarf keiner Funktionswörter, um solche Verknüpfungen herzustellen; man könnte z. B. auch schreiben: Hohe Verluste veranlassten/führten zu … Die Aussagenverknüpfung kommt durch die Prädikation zustande, die in Verlust semantisch enthalten ist. Ein Aussagenkomplex ist eine abstrakte semantische Struktur, deren Elemente in verschiedenster Weise auf grammatische Größen wie Satzglieder, Attribute, Teiloder Gesamtsätze verteilt werden können. Den Aussagenkomplex kann man nun auch überhaupt möglichst weitgehend ent-linearisieren und ent-sprachlichen. Das geschieht, wenn der Textinhalt als Liste von Propositionen oder auch als Baumstruktur notiert wird. Beaugrande/Dressler (1981, 105 ff.) haben u. a. ein Konzeptnetz als Darstellungsform gewählt. Dabei bleiben von den Textwörtern nur die Inhaltswörter (in ihrer Grundform) erhalten. Für die Relationen benutzen sie Konzeptbezeich-
168
Kirsten Adamzik
nungen wie at ‚Eigenschaft‘, lo ‚Lokalisierung‘, qu ‚Quantifizierung‘, st ‚Zustand‘, ca ‚Ursache‘ usw. Der Satz A great black and yellow V-2 rocket 46 feet long stood in a New Mexico desert sieht dann so aus: yellow
V–2
black
great
at
empty
at
at
sp
qu
it
feet
qu
46
New Mexico
at
lo st
rocket
st
long
qu ÷ su
stand
weigh
qu
lo {in}
tons
desert
qu
five
Abb. 3: Konzeptnetz als Darstellungsform (aus Beaugrande/Dressler 1981, 105)
Die semantischen Beziehungen sind so explizit markiert. Vom Oberflächentext und dem Wortlaut sind wir freilich damit maximal entfernt.
3.2 Rekurrenzen und Rekurrenzbrüche Man kann allerdings auch von allem außer dem Wortlaut abstrahieren, d. h. nicht nur von nichtsprachlichen Elementen und der grafisch indizierten Makrostruktur absehen, sondern auch davon, dass die Wörter normalerweise Elemente von Sätzen sind. In dieser Perspektive setzen wir die Grundannahme, Texte bestünden aus linear angeordneten Sätzen, einmal außer Kraft und betrachten Texte als Gewebe aus Wörtern. Ferner nehmen wir von der normativ begründeten Erwartung an Kohärenz Abstand, die der bevorzugten Suche nach satzverknüpfenden Kohäsionsmitteln zugrunde liegt. Das ist schon deswegen nötig, weil man andernfalls über Texte, die die Normalerwartung nicht erfüllen und aktuellen Rezipienten (auf den ersten Blick) tatsächlich als inkohärent erscheinen, nichts anderes sagen kann, als dass sie nicht wohlgeformt seien oder gar als Nicht-Texte qualifiziert werden müssten. Aber auch bei durchaus gewöhnlichen Texten eröffnet eigentlich erst das Absehen von lokalen Verknüpfungen die Möglichkeit, textspezifische Strukturen zu entdecken. Bei textspezifischen Strukturen, die nicht zugleich satzverknüpfend sind, handelt es sich natürlich um solche, die über große Distanzen, d. h. weit voneinander entfernte Sätze hinweg operieren, die also die Verteilung der Wörter im Gesamttext betreffen. Wenn etwa in einem Text mit 3000 Wörtern ein Wort/Lexem/lexikalisches Morphem genau dreimal vorkommt, und zwar unter den ersten und letzten zehn Einheiten sowie an der 1500. Stelle, so ist damit natürlich eine auffällige Struktur gegeben, die mit der Verknüpfung benachbarter Sätze nicht das Mindeste zu tun hat.
Das Wort im Text
169
Umgekehrt konstituieren Elemente, die in jedem Satz vorkommen – das könnte z. B. das Tempusmorphem ‚Präteritum‘ sein – keine spezifischen Strukturen, es ist einfach das nicht Auffallende, immer Gleiche. Das trägt zwar zur Kohäsion bei, gibt sozusagen den Grundton vor, ist aber minimal informativ, sofern man nicht in dieser Textsorte ein anderes Grundtempus erwartet. Dass Tempora passagenweise auftreten, lässt dagegen eine Struktur von Einheiten mittlerer Ebene erkennen. So wechseln in einer Erzählung mit eingelagerter direkter Rede typischerweise sowohl Tempus (Präteritum vs. Präsens) als auch Pronomina (3. vs. 1./2.). Auch Rahmen- und Binnenerzählung oder Erzählstränge mit unterschiedlichen Protagonisten usw. lassen sich an der Unterbrechung von Ketten mit referenzidentischen Ausdrücken erkennen. Rekurrenz bezeichnet ein ganz abstraktes Phänomen, es lässt sich auf beliebige Einheiten anwenden. Deshalb findet man bei der Suche nach irgendwelchen Rekurrenzen u. a. auch dasselbe wieder, was die übliche Analyse erbringt, nämlich referenzidentische Ausdrücke, identische oder verschiedene Wortformen desselben Lexems, semantisch verwandte Ausdrücke usw. Die offene Suche nach Rekurrenzen und Rekurrenzbrüchen privilegiert aber nicht die referenzsemantische Sicht, die die Untersuchung von Wiederaufnahmerelationen deutlich dominiert. Sie kann z. B. auch die nicht-denotativen Merkmale von Wörtern fokussieren, also Ausdrücke gruppieren, die für bestimmte Stilschichten, Regionen oder sonstige Varietäten charakteristisch sind. Dabei finden auch grammatische Rekurrenzen ihren natürlichen Platz, während die Berücksichtigung von Tempus und Modus neben Proformen und Konnektoren in den meisten Listen etwas aus dem Rahmen fällt (anders z. B. bei Hausendorf/Kesselheim 2008, Kap. 5). Bei diesen Verbalkategorien handelt es sich ja nur um einen Untertyp grammatischer Rekurrenz. Es kommen aber auch alle anderen Einheiten als potenziell rekurrente und damit strukturstiftende infrage. Das gilt auch für die Konnektoren: Sie dienen nicht nur der Verbindung nahe beieinander stehender Aussagen, sondern bilden selbst Elemente, die in bestimmter Weise über den Gesamttext verteilt sind: temporale in Erzählpassagen, kausale in argumentativen usw. Selbst rekurrente Fehler können diese Funktion haben. Gezielt eingesetzt werden sie z. B., um die Sprechweise einer bestimmten Person innerhalb eines Erzähltextes zu kennzeichnen. Einer besonderen Rezipientenperspektive entspricht es, aus Fehlern Rückschlüsse auf den Sprachentwicklungsstand des Schreibers zu ziehen. Welche Bedeutung rein formale Rekurrenzen unter- oder oberhalb der Wortebene haben (können), also Alliterationen, Reime, rhythmische Strukturen usw., hat Jakobson (1960/1979) mit seinem Konzept der poetischen Funktion deutlich gemacht, die er wohlgemerkt nicht auf literarische Texte beschränkt. Aus der Sicht gewöhnlicher Sprachteilhaber müssen diese Ausführungen völlig banal erscheinen, denn sie zeichnen nur nach, wie man sich Texten normalerweise nähert. Das geschieht natürlich nicht – und zwar umso weniger, je umfangreicher die Texte sind – in aszendenter Richtung, also Bottom-up. Texte haben eine Makrostruk-
170
Kirsten Adamzik
tur und werden zunächst weder als Folgen von Wörtern noch als solche von Sätzen wahrgenommen, sondern als in sich gegliederte Ganzheiten mit diversen Zwischen ebenen. In diesen sucht man nicht nach lokaler Kohäsion, eine solche setzt man vielmehr voraus. Suchen muss man erst, wenn die Kohäsionserwartung sich nicht bestätigt oder wenn man eine Analyse anstrebt, um Strukturen aufzudecken, die sich beim einfach verstehenden Lesen nicht unmittelbar erschließen. Hier kommen auch spezifisch linguistische Fragestellungen zum Zuge, die die quantitative Verteilung diverser Phänomene in der Sprachwirklichkeit untersuchen. Dabei ist es üblich, das Wortmaterial aus Texten nicht mehr daraufhin zu untersuchen, an welchen Stellen sich bestimmte Ausdrücke befinden. Vielmehr wandelt man es in eine Menge um, die sich nach verschiedenen Kriterien sortieren und auszählen lässt. Neben der Aufteilung in Funktions- vs. Inhaltswörter ist es z. B. sehr üblich, das Wortmaterial differenzierter auf den Anteil einzelner Wortarten auszuwerten. Für Fragen, die die Textverständlichkeit betreffen, sind Wortlänge, Frequenz(schicht) und Herkunft (z. B. Entlehnungen aus dem Griechisch-Lateinischen bzw. auf dieser Basis gebildete Internationalismen) von besonderer Bedeutung. Überhaupt stellen Wortbildungstypen ein sehr aufschlussreiches Kriterium beim Text(sorten)vergleich dar. Bei der Charakterisierung von Wörtern im Text ist natürlich auch von besonderem Interesse, inwieweit es sich um lexikalisierte Ausdrücke gegenüber ad hoc gebildeten handelt. Letzten Endes sind alle Aspekte, unter denen man Wörter überhaupt betrachten kann, für die Beschreibung des Wortmaterials in Texten (potenziell) relevant. Das heißt zugleich, dass man bei einer konkreten Analyse unmöglich alles berücksichtigen kann. Wenn es nicht eine spezifische Fragestellung ist, die über die Auswahl der Analysekriterien entscheidet, sondern man sich den Texten sozusagen unvoreingenommen nähert, wird man sich – wie jeder normale Sprachteilhaber – bevorzugt dem zuwenden, was irgendwie auffällig ist. Dies setzt natürlich eine bestimmte Erwartungshaltung voraus, die sich aus der intuitiven Kenntnis (oder dem sprachwissenschaftlich gestützten Wissen) darüber speist, was normal, unauffällig, unmarkiert ist. Damit kommt ein eher selten systematisch berücksichtigtes Kriterium zur Einteilung von Wörtern im Text in den Blick, die Erwartbarkeit: Mit welchen Wörtern kann man in einem Text rechnen und worauf gründet sich diese Erwartung, weswegen erscheinen genau diese Wörter im Text? Es lassen sich hier mehrere Faktoren unterscheiden. Zu nennen ist zunächst die Einzelsprachspezifik, weil sie einen besonders großen Teil des Wortmaterials ‚erklärt‘. In deutschen Texten wird etwa die Hälfte des Wortmaterials einfach deswegen gewählt, weil man einen deutschen Text schreibt. Es handelt sich dabei natürlich in erster Linie um die Funktionswörter. Diese sind zwar notwendig, um Aussagen(komplexe) explizit auszuformulieren, für den Inhalt sind sie jedoch gerade nicht besonders relevant (vgl. weiter 3.3). Dass man ihnen eine besonders große Bedeutung für die Kohäsion zuschreibt, ergibt sich aus der aszendenten ‚Frosch-Perspektive‘, die das Vorwissen der Rezipienten und ihre Erwartungen nahezu systematisch ausblendet und (implizit) eine
Das Wort im Text
171
sorgfältige Ganzlektüre als Normalrezeption unterstellt. Mit einer solchen darf man aber bekanntlich nicht immer rechnen. Wenn man z. B. einen Briefträger den Hund beißen lässt (vgl. Rickheit/Strohner 1999, 274), ist die Chance sehr groß, dass Rezipienten gegen die grammatischen Signale ein Normalvorkommnis rekonstruieren. In der Textlinguistik ist es allerdings inzwischen nicht nur sehr üblich, auch die Topdown-Strategie zu berücksichtigen, diese steht mit der Frame-Semantik mittlerweile sogar deutlich im Vordergrund (vgl. Busse 2009). Nun haben Rezipienten eine sehr unterschiedliche Kenntnis von Wissensrahmen, weswegen man auch schlecht etwas Allgemeines über die Verständlichkeit von Texten oder Rezeptionswege aussagen kann. Zwei Wissensbereiche lassen sich allerdings mindestens analytisch deutlich unterscheiden. Das ist einerseits die Vertrautheit mit dem Thema/Sachbereich, andererseits die Erfahrung, die Rezipienten schon mit Textsorten in bestimmten Kommunikationsbereichen bzw. Varietäten gesammelt haben. Der wesentliche Teil der Inhaltswörter ist sicher themenbedingt. Dies passt auch gut zu der Annahme, dass die Wiederaufnahmerelationen in erster Linie die thematische Kohärenz betreffen. Viele, besonders institutionell gebundene Textsorten enthalten aber auch spezifische Standardformulierungen, die für damit Vertraute höchstens minimalen Informationswert haben, für Außenstehende oder Novizen aber eine Barriere darstellen können, die sie gar nicht erst zum inhaltlich Wesentlichen vorstoßen lässt. Im wissenschaftlichen Kontext nennt man dies oft die allgemeine oder alltägliche Wissenschaftssprache (vgl. Graefen/Moll 2011), die vom Fach und Gegenstand gerade (weitgehend) unabhängig ist. Generell kann man hier von textsortenspezifischen Anteilen sprechen, die weit über Einzelwörter oder spezifische Syntagmen hinaus ganze Textpassagen als vorformulierte Versatzstücke umfassen können. Manche Texte enthalten nur Wörter aus diesen drei Bereichen – Funktionswörter und ‚Allerweltswortschatz‘, themen- sowie textsortenspezifisches Vokabular. Bei anderen verbleibt ein mehr oder weniger großer Rest an unvorhersehbarem Wortmaterial.
3.3 Makrostrukturelle Positionierungen Wenn man Texte auf den Wortlaut reduziert oder sie gar in Mengen von Wörtern umwandelt, eliminiert man alles, was in der Sprachwirklichkeit dazu dient, die unterschiedliche Wichtigkeit verschiedener Wörter im Text zu markieren. Die Wörter auf ihre Wichtigkeit und ihren Stellenwert im Textganzen einschätzen zu können, entspricht einer wesentlichen Aufgabe beim Erwerb und der Vermittlung von Textkompetenz. Auf den Wortlaut werden Texte daher auch in didaktischen Zusammenhängen reduziert. Die Aufgabe besteht dann darin, Schlüsselwörter herauszusuchen, Titel für Abschnitte zu finden u. ä.
172
Kirsten Adamzik
Dadurch sollen die Lernenden genau das rekonstruieren, was in authentischen Texten als Sehflächen (vgl. Schmitz in diesem Band) bereits materialisiert ist. Zu den elementaren Mitteln, die globale Inhaltsstruktur eines Textes erkennbar werden zu lassen, gehören eben Titel und Zwischentitel. Besonders bei Sachtexten platziert man hier die thematisch besonders wichtigen Wörter. Bei sehr langen Texten, insbesondere Büchern, wird die Gesamtstruktur dann im Inhaltsverzeichnis ‚kopiert‘, so dass man einen Überblick über Teilthemen schon vor Augen hat. Weitere typografische Mittel zur Verdeutlichung von Globalstrukturen sind Kopfzeilen und Marginalien. Innerhalb von Teiltexten, die die Gestalt von Fließtexten haben – diese nimmt man tatsächlich als Folgen von Sätzen und Wörtern wahr – können die zentralen Wörter durch Sperrung, Fettdruck, farbliche Auszeichnung usw. hervorgehoben werden. Ist das nicht der Fall, fügen Rezipienten charakteristischerweise solche Auszeichnungen selbst hinzu, jedenfalls ist es das, was man in der Lesedidaktik empfiehlt. Betrachtet man die Wörter im Text, die an solchen ausgezeichneten Stellen stehen oder formal ausgezeichnet sind, ist man besonders nahe an dem, was in theoretischen Arbeiten meist als analytisches Instrument bzw. Ergebnis davon präsentiert wird: Besondere Aufmerksamkeit haben die Makroregeln und Makrostrukturen von van Dijk (1980) gefunden, die die Linearität der Zeichen und ein striktes Bottom-upPrinzip voraussetzen. Zu der Kritik daran (vgl. besonders Vater 2001, 67 ff.) gehörte, dass solche Regeln das Vorwissen vernachlässigen und nicht erklären können, wieso Rezipienten z. B. Textwörter erinnern, die gar nicht im Text vorgekommen waren. Das Vorwissen begreift man inzwischen als in Schemata oder Frames organisiert (vgl. Paradis in diesem Band). Die Modellierungen kognitiver Frames enthalten aber auch die zentralen Wörter, die etwa in explikativen Texten zu einem Sachbereich bereits an der Oberfläche erscheinen, und zwar zunächst (in Bezug auf den gewöhnlichen Rezeptionsweg) an den genannten makrostrukturellen Gliederungsmitteln. Schließlich sind solche Texte ja dazu gedacht, Rezipienten zu erlauben, einen entsprechenden Wissensrahmen aufzubauen, sofern der ihre noch sehr unvollständig ist. Selbstverständlich sind auch Zusammenfassungen um die Schlüsselbegriffe herum organisiert und wissenschaftlichen Texten werden heute von vornherein Keywords beigegeben. Großes Gewicht wird solcherart herausgehobenen Wörtern auch bei den Texten eingeräumt, die bekanntermaßen nur sehr selektiv gelesen werden, also bei Medientexten. Hier spricht man von Textdesign (vgl. grundlegend Bucher 1996), das nicht nur das Zusammenspiel von bildlichen Elementen und Fließtextpassagen, sondern insbesondere sog. nicht-lineare Texte betrifft: Infografiken, Schemata, Tabellen usw. Diese spielen inzwischen auch in Lehrtexten eine sehr große Rolle, so dass man häufig keine Fließtexte, sondern Cluster aus formal und funktional spezifizierten Bausteinen vor sich hat. Zu solchen Bausteinen gehören auch Kästchen, die die zu lernenden Begriffe erklären. Besonderes Gewicht haben auch Übersichten über begriffliche Zusammenhänge. Dies führt zu konzeptuellen Netzen als Ergebnissen gewöhnlichen Sprachgebrauchs.
Das Wort im Text
173
4 Schlussbemerkung Mit den zuletzt erwähnten expliziten Definitionen innerhalb eines Textes haben wir zumindest noch eine Fragestellung erwähnt, die in diesem Beitrag aus Platzgründen ganz ausgeklammert wurde: Lexeme treten in Texten nicht nur in bestimmten Wortformen auf, sondern können, wie man gemeinhin sagt, auch verschiedene Lesarten aktualisieren. Lesarten als im System vorgegebene Bedeutungsvarianten sind selbstverständlich Konstrukte; die Bedeutung eines Ausdrucks ergibt sich letzten Endes immer nur aus dem Kontext (in allen Bedeutungen dieses Begriffs). In Texte eingelagerte metakommunikative Erläuterungen bilden dabei einen Untersuchungsbereich für sich. Weitgehend ausgeklammert wurde auch die Frage nach mündlicher gegenüber schriftlicher Sprachverwendung. Diese ist Gegenstand eines Beitrags in einem anderen Handbuch dieser Reihe (Adamzik, ersch.).
5 Literatur Adamzik, Kirsten (2004): Textlinguistik. Eine einführende Darstellung. Tübingen. Adamzik, Kirsten (2008): Der virtuelle Text oder: Die Rolle der Sprachgemeinschaft für die Herstellung von Textualität. In: Zeitschrift für Germanistische Linguistik 36, 355‒380. Adamzik, Kirsten (ersch.): Was ist ein Text? In: Karin Birkner/Nina Janich (Hg.): Text und Gespräch. Berlin/Boston (Handbuch Sprache und Wissen, 5). Antos, Gerd/Ursula Hasler/Daniel Perrin (2011): Textoptimierung. In: Stephan Habscheid (Hg.): Textsorten, Handlungsmuster, Oberflächen. Typologien der Kommunikation. Berlin/Boston, 638–658. Averintseva-Klisch, Maria (2013): Textkohärenz. Heidelberg. Beaugrande, Robert de (1997): New Foundations for a Science of Text and Discourse. Cognition, Communication, and the Freedom of Access to Knowledge and Society. Norwood (New Jersey). Beaugrande, Robert-Alain de/Wolfgang Ulrich Dressler (1981): Einführung in die Textlinguistik. Tübingen. Brinker, Klaus (11985, 72010): Linguistische Textanalyse. Eine Einführung in Grundbegriffe und Methoden. Berlin. Bucher, Hans-Jürgen (1996): Textdesign Zaubermittel der Verständlichkeit? Die Tageszeitung auf dem Weg zum interaktiven Medium. In: Ernest W. B. Hess-Lüttich/Werner Holly/Ulrich Püschel (Hg.): Textstrukturen im Medienwandel. Frankfurt a. M. u. a., 31–59. Busse, Dietrich (2009): Semantik. Paderborn. Bußmann, Hadumod (Hg.) (2008): Lexikon der Sprachwissenschaft. 4. Aufl. Stuttgart. COSMAS II: Corpus Search, Management and Analysis System. http://www.ids-mannheim.de/ cosmas2/. Deutsches Referenzkorpus DeReKo: Institut für Deutsche Sprache: Deutsches Referenzkorpus/ Archiv der Korpora geschriebener Gegenwartssprache. Mannheim. http://www1.ids-mannheim. de/kl/projekte/korpora/. Dijk, Teun A. van (1980): Textwissenschaft. Eine interdisziplinäre Einführung. Tübingen. Duden (2009): Die Grammatik. Unentbehrlich für richtiges Deutsch. 8. Aufl. Mannheim u. a.
174
Kirsten Adamzik
Girnth, Heiko (1993): Einstellung und Einstellungsbekundung in der politischen Rede. Eine sprachwissenschaftliche Untersuchung der Rede Philipp Jenningers vom 10. November 1988. Frankfurt a. M. u. a. Glück, Helmut (Hg.) (2010): Metzler Lexikon Sprache. 4. Aufl. Stuttgart. Graefen, Gabriele/Melanie Moll (2011): Wissenschaftssprache Deutsch: Lesen – verstehen – schreiben. Ein Lehr- und Arbeitsbuch. Frankfurt a. M. u. a. Hartmann, Peter (1968/1978): Textlinguistik als linguistische Aufgabe. In: Siegfried J. Schmidt (Hg.): Konkrete Dichtung, Konkrete Kunst. Karlsruhe 1968, 62–77; wieder in: Wolfgang Dressler (Hg.): Textlinguistik. Darmstadt 1978, 93–105. Harweg, Roland (1968, 21979): Pronomina und Textkonstitution. München. Haß, Ulrike/Petra Storjohann (2015): Wort und Wortschatz. In: Ekkehard Felder/Andreas Gardt (Hg.): Handbuch Sprache und Wissen, Band 1. Berlin/Boston, S. 147–166. Hausendorf, Heiko/Wolfgang Kesselheim (2008): Textlinguistik fürs Examen. Göttingen. Heinemann, Margot/Wolfgang Heinemann (2002): Grundlagen der Textlinguistik. Interaktion – Text – Diskurs. Tübingen. Holly, Werner (Hg.) (2013): Textualität – Visualität. Berlin (Themenheft der Zeitschrift für germanistische Linguistik, 41, 1). Jakobson, Roman (1960/1979): Linguistik und Poetik. In: Ders.: Ausgewählte Aufsätze 1921–1971. Frankfurt a. M., 83–121. Koch, Walter A. (1969): Vom Morphem zum Textem. Aufsätze zur strukturellen Sprach- und Literaturwissenschaft. Hildesheim. Koch, Walter A. (1971): Recurrent units in written and oral texts. In: Linguistics 73, 62–89. Köhler, Reinhard (2005): Korpuslinguistik. Zu wissenschaftstheoretischen Grundlagen und methodologischen Perspektiven. In: LDV-Forum 20/2, 1–16. Krämer, Sybille/Ekkehard König (Hg.) (2002): Gibt es eine Sprache hinter dem Sprechen? Frankfurt a. M. Perkuhn Rainer/Holger Keibel/Marc Kupietz (2012): Korpuslinguistik. Paderborn. Polenz, Peter von (1988): Deutsche Satzsemantik. Grundbegriffe des Zwischen-den-Zeilen-Lesens. 2. Aufl. Berlin/New York. Rickheit, Gert/Hans Strohner (1999): Textverarbeitung: Von der Proposition zur Situation. In: Angela D. Friederici (Hg.): Sprachrezeption. Göttingen u. a., 271–306. Scherner, Maximilian (1984): Sprache als Text. Ansätze zu einer sprachwissenschaftlich begründeten Theorie des Textverstehens. Forschungsgeschichte – Problemstellung – Beschreibung. Tübingen. Schubert, Christoph (2012): Englische Textlinguistik. Eine Einführung. 2. Aufl. Berlin. Vater, Heinz (2001): Einführung in die Textlinguistik. Struktur und Verstehen von Texten. München.
Wolfgang Imo
8. Das Wort im Satz
Abstract: In dem Beitrag geht es darum, den Zusammenhang von Wörtern und Wortbedeutungen mit Äußerungen und Äußerungsbedeutungen unter einer empirischen Perspektive näher zu beleuchten. Der Fokus liegt dabei auf interaktionalen Sprachdaten, d. h. auf gesprochener und geschriebener Sprache, die nicht monologisch, sondern dialogisch eingesetzt wird. Der Grund für diese Auswahl liegt darin, dass sich bei diesen Daten die Probleme des Wortkonzepts – und, damit zusammenhängend, der Konzepte der Wortbedeutung bzw. Wortfunktion – in besonderem Maße zeigen und offene Forschungsfragen daran illustriert werden können. 1 Wort? Satz? Wort im Satz? 2 Wörter und ihre Stellungen in Äußerungen 3 Fazit 4 Literatur
1 Wort? Satz? Wort im Satz? Was als Titel zunächst sehr klar und einfach erscheint – die Beschreibung der Funktion und Distribution von Wörtern in Sätzen – erweist sich, wenn man versucht, der Untersuchung klare Definitionen von Wörtern und Sätzen zu Grunde zu legen, als ausgesprochen kompliziert. Gerade diese beiden grundlegenden Einheiten der Linguistik, das Wort und der Satz, sind nämlich aus wissenschaftlicher Perspektive notorisch schwer zu bestimmen. Dies ist insofern ein seltsamer Befund, als beide Einheiten aus einer intuitiven Sprecherperspektive relativ unproblematisch erscheinen: „Obwohl Sprecher ein intuitives Verständnis davon besitzen, was in ihrer jeweiligen Mutterspr. ein W. als Basiseinheit des Wortschatzes ist, tut sich die Lexikologie schwer, diese Grundeinheit klar und allgemein zu definieren“ (Glück 2000, 792; vgl. auch Haß/Storjohann 2015). Am Einfachsten erscheint noch eine rein formale und auf die normierte Schriftlichkeit bezogene Definition, bei der die Einheit des Schriftbildes, wie Ágel/Kehrein feststellen, als „ein[e] Art (meist) latente[s] Metakriterium“ herangezogen wird. In dieser Auffassung ist ein Wort das, was durch Spatien vonei nander getrennt wird: „Es ist wohl unbestreitbar, dass unser vorwissenschaftliches Verständnis von ‚Wort‘ […] zumindest zum Teil auf den spatia basiert.“ (Ágel/Kehrein 2002, 4) Dies erklärt auch die Tatsache, dass im Alltag der Wortbegriff tatsächlich recht unproblematisch ist, wie Ágel (2005, 95) treffend schildert:
176
Wolfgang Imo
Will man die ‚Arten von etwas‘ – etwa die Pilzarten, Wortarten oder Satzarten – bestimmen, will man Pilze, Wörter oder Sätze klassifizieren, ja sogar die Klassifikation zum Bestandteil einer Theorie machen, müsste man ja vorher auch das Klassificandum (Pilz, Wortart, Satz) bestimmen können. Zumindest wäre es schön, wenn wir theoretisch so weit wären […]. In der Praxis dagegen ist die Sache bekanntlich weitestgehend unproblematisch: Man geht Pilze sammeln, ohne bestimmen zu können, was Pilze sind, und man liest Bücher mit dem Untertitel ‚Das Wort‘ und ‚der Satz‘, ohne zu wissen, was ein Wort und was ein Satz ist.
Durch das Lesen- und Schreibenlernen wurde ein primär orthographisch basiertes Wortkonzept erworben und dient nun meist als generelle konzeptionelle Grundlage für die Wortbestimmung. Aus wissenschaftlicher Sicht ist eine Wortdefinition auf dieser Basis allerdings problematisch. Herbermann (1981, 77) bemängelt die Tatsache, dass in Wortbildungstheorien der Wortbegriff meist „mehr oder weniger unreflektiert, im ‚normalsprachlichen‘ oder schulgrammatischen Sinne verwendet wird“ und konstatiert, dass die „meisten traditionellen ‚Wort‘-Definitionskriterien […] als weitgehend, wenn nicht absolut willkürliche Kriterien anzusehen“ seien (Herbermann 1981, 127; vgl. auch Wurzel 2000, der von einem „grammatiktheoretisch irrelevanten orthographischen Wortbegriff“ spricht). Gerade das oberflächlich einfachste, das orthographische Kriterium ist dabei besonders problematisch, da in der Orthographie schon allein deshalb mehr oder weniger willkürlich Setzungen vorgeschlagen werden müssen, als viele Fälle nicht zweifelsfrei zu lösen sind. Dies führt dazu, dass mal von zwei Wörtern und mal von einem ausgegangen wird. Zudem können darüber hinaus entweder parallele Formen existieren (z. B. Staub saugen/staubsaugen) oder zwei Varianten, bei denen einmal eine Zwei-Wort-Struktur vorliegt, wie bei den Imperativen (Hört zu! oder Komm mit!; vgl. Glück 2000, 297), und ein anderes Mal eine Ein-Wort-Struktur, wie bei den deontischen Infinitiven (z. B. Zuhören! oder Mitkommen!; vgl. Deppermann 2006). In ähnlicher Argumentation klassifiziert Eisenberg (2005, 23; vgl. auch Wurzel 2000, 31) kennenlernen eindeutig als Kompositum und Sprechen lernen als Syntagma, stellt aber für arbeiten lassen und baden gehen fest, dass diese Ausdrücke „auf je spezifische Weise dazwischen“ stehen, also sowohl als Wörter als auch als Syntagmen analysiert werden können: „Man ist hier mit der ganzen Breite der überhaupt denkbaren grammatischen Analysemöglichkeiten konfrontiert.“ (vgl. auch Haß/Storjohann 2015) Da die Orthographie einerseits zwar durchaus auf linguistisch begründeten Vorschriften bezüglich der Schreibung von Wörtern basiert, andererseits aber stets Kompromisse enthält, die u. a. auch Phasen des Sprachwandels sowie rein soziale Faktoren wie die Gewohnheit der Schreibenden betreffen, ist eine orthographiebasierte Wortdefinition aus wissenschaftlicher Sicht wenig erhellend. Der Grund, warum häufig dennoch solche orthographiebasierten Wortdefinitionen zu finden sind, ist, dass alle anderen Wortdefinitionen (semantische, funktionale, formale) bestenfalls Teilbereiche erfassen können, aber nicht zu einer eindeutigen und vollständigen Definition führen (vgl. die Diskussion in Glück 2000, 792–793 sowie Wurzel 2000).
Das Wort im Satz
177
Meist müssen Wortdefinitionen relativ vage bleiben, wie beispielsweise bei Krámský (1969, 67): The word is the smallest independent unit of language referring to a certain extralinguistic reality or to a relation of such realities and characterized by certain formal features (acoustic, morphemic) either actually (as an independent component of the context) or potentially (as a unit of a lexical plan).
Die Wörter certain und potentially verweisen in dem Zitat allerdings darauf, dass eine solche Definition in der konkreten empirischen Anwendung Probleme bereiten wird. Alternativ gelangt man zu einer Bestimmung von Wörtern, indem man die Last der Definition verlagert. Wenn beispielsweise Grewendorf/Hamm/Sternefeld (1991, 254) Wörter als „komplexe sprachliche Zeichen, die aus kleineren Einheiten (den Morphemen) aufgebaut sind und die ihrerseits Bestandteile noch größerer Zeichenkomplexe (z. B. Sätze, Phrasen) sein können“ definieren, so heißt dies letztendlich, dass man eine eindeutige Morphem- und eine eindeutige Satzdefinition benötigt. Wörter werden dann daraus abgeleitet. Morpheme lassen sich immerhin einigermaßen klar definieren, was damit zusammenhängt, dass es sich – anders als bei dem Satz und dem Wort – um einen rein wissenschaftlichen und nicht um einen sowohl wissenschaftlichen als auch alltagssprachlichen Begriff handelt: Ein Morphem ist die kleinste, in ihren verschiedenen Vorkommen als formal einheitlich identifizierbare Folge von Segmenten, der (wenigstens) eine als einheitlich identifizierbare außerphonologische Eigenschaft zugeordnet ist. (Grewendorf/Hamm/Sternefeld 1991, 255, in Anlehnung an Wurzel 1984, 38)
Dennoch bleiben auch hier viele Fragen offen, wobei die „als einheitlich identifizierbare außerphonologische Eigenschaft“ sicherlich eines der größten Probleme darstellt, ein Problem, das unter anderem auch direkt mit der semantischen bzw. funktionalen Wortdefinition zusammenhängt. Nimmt man als Abgrenzung der Wörter nach ‚unten‘ den Morphembegriff, so ergibt sich eine zweite Abgrenzung nach ‚oben‘ zum Satzbegriff. Dieser ist allerdings anders als der des Morphems nur mit großen Mühen und immer jeweils nur theoriegebunden definierbar. So findet sich bei Glück (2000, 595) unter dem Eintrag Satz die Information, dass dies ein in „seinen Bedeutungen schillernder Begriffsname“ sei, „der bald unmittelbar beobachtbare natürlichssprachl. Ausdrücke bezeichnet, bald Gegenstände einer syntakt. oder semant. Beschreibung“. Es ist nur möglich, innerhalb bestimmter linguistischer Theorien und Ansätze (Feldermodell, Strukturalismus, Generativismus etc.) konkretere Definitionen zu liefern, die jedoch dadurch zu einer Definitionsvielfalt ohne Konsens führen: „Allein schon auf dieser meist unkontrolliert waltenden Vielfalt gründen sich bis heute – verständlicherweise fruchtlose – Debatten über die rechte ‚Definition‘ des Satzes“ (Glück 2000, 595).
178
Wolfgang Imo
Ein Versuch, eine konsensfähige Definition zu erstellen, findet sich beispiels weise bei Zifonun et al. (1997, 91–92): Sätze sind übergreifende Konstruktionsformen, die mindestens aus einem finiten Verb und dessen […] notwendigen Komplementen bestehen. In Vollsätzen konvergieren die Bestimmungsstücke für kommunikative Minimaleinheiten und Sätze.
Eine solche Definition ist allerdings sehr grob und muss viele Fragen offen lassen. Die Probleme potenzieren sich darüber hinaus noch, wenn man nicht normorientierte Schriftlichkeit untersucht, sondern Sprache-in-Interaktion, wie sie einerseits in gesprochensprachlichen, informellen Interaktionen vorkommt und andererseits in informeller Schriftlichkeit beispielsweise im Chat (Beißwenger 2007) oder der SMS-Kommunikation (Günthner 2011, 2012, Imo i. V.). Dort ist die Verwendung des Konzepts des Satzes als Analysekategorie umstritten (vgl. hierzu ausführlich Imo 2013), wie schon in der oben zitierten Satzdefinition bei Zifonun et al. angedeutet wird: Statt von Sätzen ist es in Sprache-in-Interaktion sinnvoller, einen alternativen Begriff zu verwenden. Zifonun et al. (1997, 91) schlagen vor, diese Muster „kommunikative Minimaleinheiten“ zu nennen, die sie als „die kleinsten sprachlichen Einheiten, mit denen sprachliche Handlungen vollzogen werden können“, definieren. Kommunikative Minimaleinheiten „verfügen über ein illokutives Potential und einen propositionalen Gehalt“ und weisen in gesprochener Sprache „eine terminale Intonationskontur auf – es sei denn, sie werden mit weiteren kommunikativen Minimaleinheiten koordinativ verknüpft“. Hier zeigt es sich, dass eine trennscharfe Definition kaum möglich ist, denn die „kleinsten sprachlichen Einheiten, mit denen sprachliche Handlungen vollzogen werden können“, können im Endeffekt auch Morpheme sein (wenn z. B. jemand, um eine andere Person zu korrigieren, die das Wort unkaputtbar verwendet, lediglich den Kern des Wortes ersetzt und mit zerstör antwortet. In der (fiktiven) Abfolge A: Das ist unkaputtbar. B: zerstör. A: Ja, weiß ich doch. wäre der Ausdruck zerstör eine kommunikative Minimaleinheit, die die Reparaturhandlung vollzieht. Durch solche Phänomene wird es sehr schwierig, die Aufgabe, zu beschreiben, wie „das Wort im Satz“ operiert, zufriedenstellend zu bewältigen. In der Folge soll nun ausschließlich auf die Frage fokussiert werden, welche Rolle das Wort in Sätzen (bzw. „kommunikativen Minimaleinheiten“, „turn constructional units“ oder „Äußerungen“) spielt, die in informeller, nicht redigierter, interaktionaler Sprachverwendung vorkommen. Konkret soll auf gesprochene Sprache und SMS-Kommunikation abgehoben werden. Diese Fokussierung liegt darin begründet, dass eine Untersuchung von Wörtern in Sätzen in standardorientierter Schriftlichkeit immer zu bedenken hat, dass für die Schreibung von Wörtern feste Regeln vorliegen, die von den Schreibenden erlernt und zudem heutzutage von Korrekturprogrammen oder auch durch ein Lektorat korrigiert wurden. Das Schreiben von Wörtern setzt also immer einen bereits zuvor erworbenen und im Schreiben angewandten Wortbegriff voraus.
Das Wort im Satz
179
Um zu erfahren, welchen Stellenwert das Wort tatsächlich im Alltag für die Sprechenden und Schreibenden hat, ist es jedoch von Vorteil, wenn die Rolle solcher Normsetzungsinstanzen und Normkontrollinstanzen so gering wie möglich gehalten wird. In ungeplanter, schnell produzierter und nicht redigierter Sprache in Interaktionen ist dies der Fall. Die Wahl von SMS-Nachrichten sowie gesprochener Sprache ist darin begründet, dass für beide Arten der Kommunikation Datenbanken vorliegen, die linguistische Audio Datenbank (lAuDa) in Münster und eine SMS-Datenbank in Essen. Exemplarisch sollen anhand der dort vorliegenden Daten folgende Fragen beantwortet werden: 1. Welchen Stellenwert hat die Einheit Wort in Ansätzen, die sich mit interaktionaler, informeller Sprache befassen und wie können Wörter in der gesprochenen Sprache identifiziert werden? 2. Welche Auffälligkeiten sind festzustellen bei der Verwendung von Wörtern in der informellen schriftlichen Interaktion, beispielsweise in der SMS-Kommunikation? Inwieweit spielen dort mediale Gegebenheiten, wie die Tatsache, dass das Schriftsystem verwendet werden muss, eine Rolle für das Wortkonzept? 3. Wie interagieren einzelne Wörter mit größeren syntaktischen Konstruktionen, welche syntaktischen Strukturen hängen in welcher Art und Weise von der Wahl bestimmter Wörter ab, welchen Beitrag leisten Wörter zur Erzeugung einer gesamten Gestalt? Wie hängen Wörter mit der Durchführung bestimmter Aktivitäten zusammen? Wo liegen die Grenzen zwischen Wörtern und Phrasen? Wie entstehen neue Wörter aus phrasalen Einheiten? 4. Wie ist mit im Kontext der computervermittelten Kommunikation neu entstandenen bzw. dort besonders verbreiteten Formen wie Emoticons (z. B. :-)) oder Inflektiven (z. B. *grins*) umzugehen?
2 Wörter und ihre Stellung in Äußerungen 2.1 Das Wort in der gesprochenen Sprache Es ist eine lange bekannte und bis heute noch gültige Tatsache, dass die Feststellung der „acoustic identity of the word“, also die exakte Bestimmung von Wortgrenzen im kontinuierlichen Lautstrom gesprochener Sprache, „one of the most crucial problems of linguistics“ (Krámský 1969, 29) darstellt (vgl. Haß/Storjohann 2015). Häufig lassen sich darüber hinaus nicht nur die Wortgrenzen nicht eindeutig bestimmen, zuweilen stellt sich auch die Frage, ob manche Einheiten eher als Wörter oder als Klitika aufzufassen sind. Diese ambige Stellung von Wörtern in der gesprochenen Sprache lässt sich sehr gut an den Transkriptionskonventionen ablesen, wie sie von Selting et al. (2009) im Gesprächsanalytischen Transkriptionssystem (GAT) festgelegt wurden. Ein grundlegendes Problem bei Wörtern im gesprochenen Deutsch ist ja, dass sie – anders als in der Schriftsprache, in der per Konvention Wörter durch Spatien getrennt werden – nicht prosodisch (z. B. durch Pausen, Tonhöhensprünge
180
Wolfgang Imo
o. ä.) voneinander abgesetzt werden. Stattdessen liegt ein mehr oder weniger kontinuierlicher Lautstrom vor, der erst in der Verschriftung wieder in durch Spatien getrennte Wörter zerlegt wird, obwohl diese Schreibung nicht notwendigerweise der prosodischen Realisierung entspricht. Für die mit GAT erstellten Transkripte wurde aber festgelegt, dass dort nicht der Lautstrom selbst möglichst originalgetreu wiedergegeben werden soll, sondern dass sie der Anforderung der leichten Lesbarkeit und Zugänglichkeit genügen müssen. Daher erfolgt die Transkription lediglich „in literarischer Umschrift und orientiert sich an der Orthographie, d. h. einer genormten Umsetzung der Lautsegmente in die Schrift“ (Selting u. a. 2009, 360). Zudem ist ein weiterer Bezug zur Schreibnorm darin zu erkennen, dass Tilgungen von Lauten so erfasst werden, „dass die ursprüngliche Form des Wortes erkennbar bleibt“, d. h. es kann also beispielsweise sin statt sind oder achtnachzig statt achtundachtzig geschrieben werden (Selting et al. 2009, 360). Für die Frage des Status von Wörtern in der gesprochenen Sprache ist vor allem der Prozess der Klitisierung, d. h. der phonologischen Anbindung von Wörtern, von Bedeutung, da dort direkt das Konzept Wort betroffen ist. So wird in den GAT-Konventionen festgelegt, dass „das klitisierte Wort seinen eigenständigen Status“ (Selting et al. 2009, 361) verliere. Dies ist allerdings ein gradueller Prozess, was sich in einer Serie von Transkriptionskonventionen niederschlägt: Je nach Stärke der prosodischen Integration sowie der mit der Klitisierung einhergehenden Tilgungs- oder Assimilierungsphänomene kann beispielsweise die Form so n (so ein) (i) so n, (ii) so_n oder (iii) son geschrieben werden. Vor allem die Option, mittels eines Unterstrichs die Klitisierung anzuzeigen, verweist auf einen ambigen Status des angehängten Wortes, das zwischen Autonomie und Integration schwankt. Gerade bei Kombinationen aus Präposition und Artikel ist diese Unsicherheit im Wortstatus gut zu erkennen. Selting et al. (2009, 362) geben dabei als Alternativen beispielsweise für mit dem die Schreibweisen mim und mi_m und für in einen die Varianten innen und in_nen an: Je nach Einschätzung der Stärke der prosodischen Integration auf der einen Seite und der (mehr oder weniger spekulativen) Annahme bezüglich des Ausmaßes eines Grammatikalisierungsfortschrittes lässt sich in solchen Fällen in der Tat entweder für eine bereits erfolgte, nur noch nicht schriftsprachlich normierte Univerbierung (in Analogie zu am, im, um etc.), oder für einen offenen, andauernden Prozess plädieren, in dem die Eigenständigkeit von Präposition und Artikel noch gewahrt ist. Im Folgenden soll am Beispiel des Vergewisserungssignals ne diskutiert werden, welchen Status das Wort in der Gesprächsanalyse/Interaktionalen Linguistik hat bzw. wie die Wahl des Transkriptionssystems Einfluss auf die Wahrnehmung der Kategorie Wort ausübt. Der folgende Ausschnitt stammt aus einer Reality-Show im Fernsehen. Die Sprecherin S leitet mit „bin ich mal geFLOgen_ne“ in Z. 103 eine Geschichte ein, deren Pointe sie dann in Z. 125 liefert:
Das Wort im Satz
181
Beispiel 1: Geschichte “Cleaner” 103 S → bin ich mal geFLOgen_ne, (.) 104 (äh) ähm; (.) 105 nach ENGland? 106 komm ja dann immer die CLEAner. 107 → weißte die sÄUberer die AUFräumen_ne- .hhhhhh 108 → das waren SCHWARze_ne, .hh 109 → die 112 → ne, 113 .hh u:nd .h DER so114
116 → ne117 DER so, (.) 118
119 WEIßte120 .h ICH so (.) hhh121 vOll STOLZ122 ich so HA- ((öffnet den Mund)) 123 haha 124 DER so125 .h and NOW go dEEper;
Insgesamt sechs Mal findet sich in dem kurzen Ausschnitt das Vergewisserungssignal ne, das im gegebenen Kontext, mit Hagemann (2009, 171) gesprochen, als Bestandteil der „Gesprächspraktik ‚Konsens indizieren‘“ zum Einsatz kommt, die immer dann von Bedeutung ist, „wenn es gilt, inhaltsbezogene Interaktionsaufgaben (wie z. B. das Herstellen, Absichern oder Erweitern einer gemeinsamen Wissensbasis) oder formbezogene Interaktionsaufgaben (z. B. das Erkennbarmachen der Ränder oder der Anordnungsstruktur einer größeren interaktiven Einheit) zu lösen“ (Hagemann 2009, 171). Beide Aufgabenbereiche sind hier vorhanden: Zum einen geht es vor allem zu Beginn der Geschichte darum, die relevanten Hintergrundinformationen zu liefern, um den Rahmen aufzubauen, der das Verständnis der Geschichte und ihrer Pointe sichert: So die Information, dass es sich um eine Geschichte handelt, die im Kontext eines Fluges passierte (Z. 103) oder die Erläuterung, was die Sprecherin mit „CLEAner“ (Z. 106) meint. Zum anderen zeigt sich auch der Einsatz von Vergewisserungssignalen als formale, strukturierende Mittel, mit denen eine Portionierung der Narration geleistet werden kann (Z. 108, 109, 112, 116). Auffällig ist bei den letzten drei Fällen von „ne“, dass sie im Kontext des inszenierten Redewechsels vorkommen, und zwar am Ende entweder eines erläuternden Handlungsschrittes (Z. 109 „die kommen REIN_ne“) oder von angeführter Rede (Z. 111–112 „Open your MOU::TH. ne,“ und Z. 115–116 „so much GOLD- ne-“) und einer darauf folgenden redeeinleitenden Floskel (Z. 110 „der EIne“; Z. 113 „u:nd .h DER so“; Z. 117 „DER so“) (vgl. Golato 2000 zum Gebrauch der
182
Wolfgang Imo
Floskel und ich so/und er so im Deutschen). Mittels ne werden somit den Zuhörern und Zuhörerinnen Kontextualisierungshinweise geliefert, die ihnen beim Verfolgen der Geschichte helfen. Betrachtet man die prosodische Realisierung von ne, so zeigt sich, dass sowohl unmittelbar an die Äußerungen angebundene Varianten auftauchen (Z. 103, 107, 108, 109) als auch solche, die deutlich prosodisch abgesetzt in einer eigenen Intonationsphrase realisiert werden (Z. 112 und 116). Exemplarisch sollen nun eine angebundene sowie eine abgesetzte Variante von ne diskutiert werden. Eine Analyse der Äußerung „bin ich mal geFLOgen_ne“ mit Hilfe der Software PRAAT (http://www.fon.hum.uva.nl/praat), mit der Lautstärke- und Tonhöhenverläufe angezeigt werden können, ergibt folgende Darstellung: 0.821687753
500
1.28809589
Pitch (Hz)
400
300
200
75 bin
ich
mal
0
ge
FLO
Time (s)
gen
ne 1.288
Abb. 1: PRAAT-Darstellung 1
Die untere Linie stellt den Tonhöhenverlauf dar, die obere Linie den Lautstärkeverlauf. Im vorliegenden Fall scheinen die Grenzen der meisten Wörter sowohl in Bezug auf den Tonhöhenverlauf als auch den Lautstärkenverlauf relativ gut markiert, wie die Abschnitte nach den ersten drei Wörtern „bin“, „ich“ und „mal“ suggerieren. Es muss jedoch angemerkt werden, dass eine klare Trennung in der Realität nicht möglich ist: Bei dem Wort „ich“ beispielsweise ist keine Tonhöhenlinie zu finden, was darauf verweist, dass kein Konsonant in diesem Abschnitt vorkommt, sondern nur der Frikativ, der als Rauschen keine Tonhöhe aufweist. Das bedeutet, dass das „i“ von „ich“ entweder verschluckt wurde („bin_ch“) oder dass evtl. der winzige ‚Aufwärtshaken‘ der Tonhöhenkurve am Ende von „bin“ den Vokal von „ich“ in Andeutungen enthält. Ob es sich so verhält, war auch bei genauem Hinhören nicht festzustellen:
Das Wort im Satz
183
Trotz der scheinbaren Trennungen zwischen den Wörtern entsteht beim Hören der Eindruck eines kontinuierlichen Lautflusses, der auch zwischen „mal“ und „ge“ aufrechterhalten wird, da beispielsweise zwischen dem „l“ von „mal“ und dem „g“ von „geFLOgen“ die Zunge erst die Position wechseln muss und daher eine Pause entsteht, die allerdings in genau der gleichen Weise innerhalb eines Wortes wie Alge entstehen würde. Fiehler (2000, 27) verweist auf diesen Umstand, wenn er kritisiert, dass durch die Schriftfixierung der Linguistik auf der „Ebene von Buchstabe und Wort“ die „Vorstellung diskreter Laute und Wörter zum Tragen“ komme, die „den Verhältnissen im Mündlichen allerdings wenig gerecht“ werde. Während also bei näherem Hinsehen sich selbst scheinbar klare Wortgrenzen im Lautstrom der Äußerungsproduktion auflösen, wird dieser kontinuierliche Charakter der Äußerungsproduktion bei der Verbindung von „geFLOgen“ und „ne“ auch optisch deutlich: Es ist äußerst schwierig, die exakte Grenze zwischen dem Verb und dem Vergewisserungssignal zu bestimmen. Als Indikator kann die leichte Absenkung in der Lautstärke an Punkt 0.821687753 gewertet werden, wobei einerseits aber die Tonhöhenkurve mit dieser Absenkung keine klare Korrelation aufweist und andererseits die Darstellung der Silbengrenze zwischen „FLO“ und „gen“ kurz zuvor eine ähnliche Struktur hat. Das Vergewisserungssignal erscheint somit prosodisch wie ein Teil des Verbs. Vergleicht man die PRAAT-Darstellung des ersten „ne“ (Z. 103) mit der des fünften (Z. 112), so ist dagegen eine eindeutige prosodische Desintegration des „ne“ im Vergleich zu den Umgebungsäußerungen zu sehen:
Pitch (Hz)
500
oh::::; 0
0
Abb. 2: PRAAT-Darstellung 2
Open your MOU::TH.
Time (s)
ne,
.hh
u:nd
.h 4.505
184
Wolfgang Imo
Anders als in dem zuvor diskutierten Beispiel kann man hier einen deutlichen Tonhöhensprung am Anfang des „ne“ erkennen, sowohl die (untere) Intonationskurve als auch die (obere) Intensitätskurve liefern deutliche Grenzsignale, und durch das Einatmen nach dem „ne“ wird zusätzlich ein Abstand zwischen „ne“ und dem nächsten Wort erzeugt. Das Wort ne scheint also bezüglich der prosodischen Realisierung sehr flexibel zu sein, und es stellt sich die Frage, wie man mit diesem Befund umzugehen hat. Die Diskussion der Daten hat gezeigt, dass das Gesprächsanalytische Transkriptionssystem klar von einer schriftsprachlich orientierten Wortkonzeption ausgeht, was damit zu tun hat, dass einerseits die Lesbarkeit der Transkripte gewährleistet und andererseits auch die Recherche nach bestimmten Wortformen in einmal in Datenbanken eingepflegten Transkripten ermöglicht werden soll. Eine Gefahr ist natürlich, dass dadurch unbewusst das schriftsprachliche Wortkonzept in die Analyse gesprochener Sprache transportiert wird und der Blick für mögliche Prozesse von Univerbierungen oder Klitisierungen verloren gehen kann. Etwas Abhilfe schaffen dabei allerdings die Konventionen, klitisierte Wörter entweder zusammenzuschreiben oder mittels des Unterstrichs _ zu signalisieren, dass die Wörter zwar als autonom angesehen werden, aber prosodisch eng miteinander verbunden realisiert werden. Stellt man nun die Frage, ob ne ein Wort ist, ergeben sich aus der gesprächsanalytischen Perspektive folgende Befunde: Auf der einen Seite könnte man mit den Kriterien der Weglassbarkeit, Austauschbarkeit und Koppelung von Ausdrucks- und Inhalts-/Formseite operieren. Für alle der angebunden realisierten Vergewisserungssignale gilt, dass sie (i) weggelassen werden können, (ii) durch alternative Formen wie nicht (wahr), weißte, oder etc. ersetzt werden können und (iii) aus der Verbindung der Form ne mit der Funktion, das „Herstellen, Absichern oder Erweitern einer gemeinsamen Wissensbasis“ zu gewährleisten und/oder die „Anordnungsstruktur einer größeren interaktiven Einheit“ offen zu legen (Hagemann 2009, 171), aufgebaut sind. Diese Kriterien führen dazu, dass man ne als Wort klassifizieren kann. Auf der anderen Seite könnte man der prosodischen Realisierung einen höheren Stellenwert zuschreiben und die Frage stellen, ob die bei ne besonders deutlich wahrnehmbare Tendenz zur Integration möglicherweise mit einem besonderen Einheitenstatus zusammenhängen könnte, ob also eventuell der Begriff des tag, wie er im Englischen (tag question/question tag) eingebürgert ist, auf einen Suffix-ähnlichen Status anstelle eines Wortstatus von ne hinweisen könnte. Um diese Frage zu klären, wäre es allerdings notwendig, ein umfangreiches Korpus darauf hin zu untersuchen, ob sich funktionale Ausdifferenzierungen zwischen dem klitisierten ne und dem in einer eigenen Intonationsphrase geäußerten feststellen lassen: Im vorliegenden Transkriptausschnitt findet sich ersteres stets nach beschreibenden/erklärenden Äußerungen, während letzteres nach Redeanführungen verwendet wird. Ob diese Beobachtung tatsächlich generalisierbar ist, müsste erst durch eine solche Korpusanalyse geklärt werden. Solange dies nicht der Fall ist, scheint es ratsam, in Transkripten verstärkt Klitisierungen und Verschleifungen zu notieren, um die Aufmerksamkeit auf solche
Das Wort im Satz
185
Phänomene zu lenken, die einer genaueren Untersuchung bedürfen. Nur so ist es möglich, der Anforderung der Konversationsanalyse bzw. Interaktionalen Linguistik gerecht zu werden, so wenig wie möglich auf Vorannahmen zu setzen und stattdessen möglichst aus den Daten heraus die Beschreibungskategorien zu entwickeln (vgl. Ono/Thompson 1995, 215). Für Abschnitt 2.1, der das Wort in der gesprochenen Sprache behandelt, lässt sich somit sagen, dass noch aussteht, den genauen Wortstatus zu klären. Zu sehr scheint bislang durch die Transkriptionskonventionen die normierte schriftsprachliche Wortdefinition unhinterfragt Eingang in das Beschreibungs- und Konzeptinventar der Konversationsanalyse bzw. Interaktionalen Linguistik zu finden.
2.2 Das Wort in der informellen, interaktionalen Schriftlichkeit Weitaus einfacher als in der gesprochenen Sprache ist die Aufgabe, in der geschriebenen Sprache Wörter zu identifizieren. Dies gilt auch für die informelle geschriebene Sprache, wie zum Beispiel in der privaten SMS-Kommunikation. Hier kann – gerade in Bezug auf die Frage, was ein Wort ist und wie damit in Alltagsinteraktionen umgegangen wird – der Einfluss des Mediums (bzw., mit Koch/Oesterreicher 1985 gesprochen, der medialen Schriftlichkeit) nicht ignoriert werden. Konzeptionelle und mediale Mündlichkeit/Schriftlichkeit interagieren gerade in der informellen Schriftlichkeit auf komplexe Art und Weise, worauf Ágel (2005, 102) hinweist: 1. Medialität und Konzeptualität können nicht mit einem und/oder erledigt werden. Ihre Bezüge zur Wortproblematik müssten zuerst getrennt untersucht, dann aufeinander bezogen werden; 2. Das Beziehungsgefüge von Mündlichkeit und Schriftlichkeit ist ständigem Wandel unterzogen. Die Folgen für die Wortproblematik […] müssten bedacht werden.
In Bezug auf die informelle Schreibung beispielsweise in der SMS-Kommunikation heißt das, dass die Tatsache eine Rolle spielt, dass die in der Schule durch den Schriftspracherwerb erworbenen Schreibkonventionen (Wörter werden durch Spatien getrennt) im Normalfall übernommen werden: „Anders als im Gesprochenen, wo die Isolierung der Wortform ein erhebliches Problem darstellt, finden wir sie im Geschriebenen als Buchstabenfolge zwischen Spatien. Grenzfälle gibt es natürlich“ (Eisenberg 2004, 301). In der Tat ist die Identifizierung von Wörtern auch in der SMSKommunikation weitgehend unproblematisch. Es lassen sich aber einige kreative Abweichungen in der informellen Schriftlichkeit feststellen. Gerade für Fragen der Grammatikalisierung – Grammatikalisierung ist hier in einem sehr weiten Sinn als die Herausbildung neuer sprachlicher Normen zu verstehen, egal auf welcher linguistischen Beschreibungsebene diese angesiedelt sind – erweisen sich diese Abweichungen als potentiell relevant. Mediale Schriftlichkeit und konzeptionelle Mündlichkeit stehen hier in der Tat in einem komplexen Verhältnis zueinander.
186
Wolfgang Imo
Wie sehr die normschriftsprachlichen Konventionen sich auch in der informellen Schriftlichkeit durchsetzen, zeigt der folgende SMS-Dialog #1163. Alle SMS-Beispiele stammen aus der vom Verfasser dieses Beitrags in Essen aufgebauten SMS-Datenbank (http://www.uni-due.de/~hg0263/SMSDB). Diese Datenbank enthält Kurznachrichtendialoge per SMS oder SMS-ähnlichen Diensten wie WhatsApp vor allem zwischen Studierenden und deren Freunden, Familienmitgliedern oder Arbeitgebern. Die Nummern beziehen sich auf die Nummern, die die Dialoge in der Datenbank erhalten haben. Die SMS-Dialoge sind so angeordnet, dass in der linken Seite jeweils die Nachrichten von Schreiber(in) A, in der rechten Spalte die Nachrichten von Schreiber(in) B angeordnet sind. Im folgenden Dialog verwendet Schreiberin B (Nachricht 2) konsequent die Zusammenschreibung. Es wurden hier nur die ersten beiden Nachrichten abgedruckt, insgesamt umfasst der Austausch acht Nachrichten, wobei Schreiberin B stets auf Spatien verzichtet. Alle ihre Nachrichten bestehen also jeweils aus einer einzigen, zusammenhängenden Zeichenkette ohne Spatien (die Umbrüche in der SMS sind hier nur der drucktechnischen Darstellung geschuldet und kommen in der SMS nicht vor): Beispiel 2: SMS-Dialog #1163 Hallo NAMElein. Geht es dir gut? Ich habe seit meiner Geburtstags-Sms gar nichts mehr von dir gehört... Ich bin seit vorgestern wieder in Deutschland. Alles Liebe Nachricht #1 – 10.07.2011 – 12:08 WieSchönLiebes.IchHabNAMEAmMittwochGetroffenUnd SieHatMirGesagtDassDuDieNächstenTageWiederkommst.Ich HabMichNurNochNichtGemeldetWeilIchNichtWussteWann Genau.WollteMorgenDeineElternAnrufenUndFragen.Aber DannHatSichDasJaErledigt:)SchönDassDuWiederHierBist:) Endlich.IchHoffeDuFreustDichAuch...UndDerAbschiedWar NichtZuSchwer.KönnenWirUnsDieWocheTreffen?OderBist DuInORT?DuMusstMirSooooVielErzählen...IchBinSo Neugierig!SchönDassDuWiederDaBist.HabDichVermisst!!! Nachricht #2 – 10.07.2011 – 18:45
Es ist nicht ganz klar, warum B diese Schreibweise verwendet. Es könnte sich sowohl um eine Methode handeln, Zeichen zu sparen (obwohl die Schreiberin auch bei kurzen SMS-Nachrichten diese Schreibweise beibehält) als auch um einen persönlichen kreativen Schreibstil. Auffällig ist aber, dass trotz der Tatsache, dass die Wörter ähnlich wie in der gesprochenen Sprache in einem kontinuierlichen ‚Buchstabenstrom‘ erscheinen, durch die konsequente Großschreibung aller Wörter die Wortgrenzen ebenso klar markiert werden als wenn Spatien verwendet würden. Mit den Konventionen normorientierter Schriftlichkeit wird hier also zwar gespielt, sie werden aber nicht aufgegeben. Einzig bei der Schreibung von „Soooo“ in der vorletzten Zeile findet sich der Einfluss konzeptioneller Mündlichkeit, wenn im Sinne einer „emulierten Prosodie“ (Haase et al. 1997, 68) die Dehnung und somit Betonung
Das Wort im Satz
187
der Gradpartikel durch Buchstabeniteration markiert wird. Auch die Emoticons sowie der Einsatz von iterierten orthographischen Zeichen („!!!“) sind typisch für informelle Schriftlichkeit. Im Folgenden soll nun auf solche Fälle eingegangen werden, in denen eine Veränderung von einzelnen Wörtern vorliegt, die der speziellen Konstellation einer medialen Schriftlichkeit, aber konzeptionellen Mündlichkeit, wie sie in der E-Mail-, SMSoder Chatkommunikation entstanden ist, geschuldet ist. Im folgenden SMS-Dialog zwischen zwei 24 Jahre alten Studentinnen finden sich eine Reihe typischer Formen der computervermittelten informellen Schriftlichkeit, bei denen sich die Frage stellt, inwieweit diese Formen als eigenständige Wörter aufzufassen sind: Beispiel 3: SMS-Dialog #1115 Hey, wollte dir vorschlagen Mittwoch abend zu mir zu kommen?! Juli ist dann da, wollten kochen u tv schauen, dann Vllt noch party B-) rufen dich mi mal an! Glg! T! Nachricht #1 – 26.04.2010 – 12:44:05 Super, das klingt toll – dann haben wir jetzt n date ;-) Freu mich, bis mi! Glg! Nachricht #2 – 26.04.2010 – 13:50:05
Als mögliche Untersuchungskandidaten sind dabei die Kurzformen „u“ für und, „Vllt“ für vielleicht, „mi“ für Mittwoch und „Glg“ für ganz liebe Grüße anzusehen. Dabei lässt sich allerdings für die ersten beiden Formen und möglicherweise auch für die Abkürzung von Wochentagen sagen, dass diese wenige Probleme bei der Beschreibung bereiten, da sie einfach als parallele Kurzformen zu ihrer jeweils zugehörigen Langform beschrieben werden können. Die Form „Glg“ dagegen ist bereits so stark routiniert, dass man sie als eigenständige Struktur beschreiben könnte. Allerdings spricht gegen die Annahme von „Glg“ als ein eigenes Wort die Tatsache, dass die interne Erweiterbarkeit (vgl. Wurzel 2000, 36) und Flexibilität weiter gegeben bleibt. So findet sich in den Daten die kürzere Form „lg“ (liebe Grüße) noch häufiger und – auch wenn es in den Daten in der SMS-Datenbank dafür bislang keinen Beleg gibt – ist zudem die Erweiterbarkeit gegeben, so dass auch Formen wie gglg (ganz ganz liebe Grüße) möglich sind. In einem Posting in dem Forum „gutefrage“ (http://www.gutefrage.net/frage/gglg; Abruf am 27.8.2013) fragt beispielsweise eine Nutzerin nach der Bedeutung von „gglg“, von dem sie schreibt, dass sie es in letzter Zeit immer häufiger lese. Wurzel (2000, 41) verwendet für die oben genannten Strukturen den Begriff „morphologisches Semiwort“. Darunter versteht er ein „Wort mit partiellen Phraseneigenschaften“, wozu beispielsweise Rad fahren gehört. In Anlehnung an Wurzel könnte man die hochgradig routinierten Formen, die in der informellen Schriftlichkeit vorkommen (neben glg und lg wären da beispielsweise auch hd/hab dich lieb, hdgdl/hab dich ganz doll lieb oder die aus dem Englischen entlehnten Formen imo/in my opinion oder lol/laughing out loudly zu nennen), als solche einerseits wie Wörter wirkende
188
Wolfgang Imo
aber andererseits prinzipiell intern erweiterbare (vgl. z. B. imho/in my humble opinion) Einheiten und daher als Semiwörter und nicht als Wörter klassifizieren. Neben Abkürzungen und neu entstehenden Kurzwörtern findet sich in SMSDialog #1115 auch eine Struktur, die den Charakter eines neu entstehenden Musters im Bereich der deutschen Lexik und Grammatik aufweist: Die Kurzform des unbestimmten Artikels: n/ne/nen etc. Bei diesen Formen stellt sich die Frage, ob sie tatsächlich ähnlich wie „u“ oder „vllt“ aus dem oben zitierten SMS-Dialog zu behandeln sind, nämlich als funktionsgleiche Kurzformen zu den parallelen Langformen ein/eine/einen etc., oder ob hier nicht ein zweiter unbestimmter Artikel mit neuen Funktionen entsteht. In letzterem Fall wären dann n und ein als zwei unterschiedlichen Wörtern zugehörig zu interpretieren. In jedem Fall kann für diese neuen Formen gesagt werden, dass sie typisch für mündliches Umgangsdeutsch sind, d. h. die Reduktion beispielsweise von ein auf n kann durch phonologische Prozesse erklärt werden (vgl. Ziegler 2012, 297–298). Ebenfalls kann festgehalten werden, dass es sich dabei um eine relativ aktuelle Sprachwandeltendenz handelt. Anhand einer diachronen Analyse von gesprochensprachlichen Daten aus dem Zeitraum zwischen 1960 und 2005 konnte Ziegler (2013, 288) zeigen, dass die Kurzformen des unbestimmten Artikels nicht nur zunehmen, sondern in den aktuellen Daten die gesprochene Normalform darstellen: “The main finding is that the use of the short forms [nən] and [n] has increased progressively over time and that they have come to dominate in current ‘colloquial standard German’” (Ziegler 2013, 288). Während für die gesprochene Sprache ganz gut die These aufrechterhalten werden kann, dass die Kurzformen funktionsgleich zu den Langformen des unbestimmten Artikels sind und lediglich durch phonologische Prozesse zustande kommen, tritt bei der Verwendung der Kurzformen in der Schriftlichkeit aber eine neue Qualität hinzu: Phonologische Prozesse kommen als unmittelbare Erklärung für die Reduktionsformen nicht in Frage, sondern nur als mittelbare, denn die Verwendung der Kurzformen kann als „ein Spiegel ihrer zunehmenden Verwendungshäufigkeit in der Mündlichkeit“ (Ziegler 2012, 296) interpretiert werden. Genau deshalb haben die Kurzformen aber nun eine deutlich wahrnehmbare Qualität als Indikatoren bzw. Kontextualisierungshinweise für konzeptionelle Mündlichkeit, weshalb Ziegler (2012, 295) beispielsweise bei der Form nen von einem „Mündlichkeitsmarker par excellence“ spricht, der vor allem in der computervermittelten Kommunikation als Kontextualisierungshinweis für Informalität eingesetzt wird. Es zeigt sich, „dass sich der Gebrauch der erweiterten Kurzform längst in der computervermittelten Kommunikation etabliert hat und in solchen Kontexten verwendet wird, in denen eine informelle Schriftlichkeit intendiert wird“ (Ziegler 2012, 296). Auch im vorliegenden Fall lässt sich diese zusätzliche Qualität, die dafür spricht, die Kurzformen als Instantiierungen eines eigenständigen „informellen Indefinitartikels“ aufzufassen, gut zeigen: Schreiberin B bestätigt die Verabredung zum Kochen, zum Fernsehen und zur Party mit „dann haben wir jetzt n date ;-)“. Der Ausdruck „date“ – bei dem trotz zunehmenden Gebrauchs als neutrale Bezeichnung für Termin oder Treffen immer noch die
Das Wort im Satz
189
Assoziationen mit Rendezvous sehr stark sind – wird sowohl durch die Artikelform „n“ als auch durch das zwinkernde Emoticon „;-)“ als informell und nähesprachlich kontextualisiert. Somit wird – im Sinne von Deppermann/Schmitts (2008) Konzept der Verstehensdokumentationen – durch den Artikel „n“ eine Verstehensanleitung in Richtung Treffen (anstelle von Rendezvous) ‚mitgeliefert‘, die Missverständnisse im Voraus verhindern kann. Die Tatsache, dass eine in der informellen Mündlichkeit entstandene Form in die Schriftlichkeit übertragen wird, führt also schon alleine wegen des Wechsels des Mediums dazu, dass zusätzliche Funktionen – hier der eines „Mündlichkeitsmarkers“ (Ziegler 2012) bzw. mit einer Bezeichnung von Ágel (2005, 106) eines „tertiären Nähewortes“ – zu dieser Form hinzutreten können. Die eingangs erwähnte Position Ágels (2005), dass mit dem Spannungsfeld aus konzeptioneller/medialer Mündlichkeit/Schriftlichkeit vorsichtig umgegangen werden muss, lässt sich anhand des hier diskutierten Beispiels eindrucksvoll stützen.
2.3 Die Funktion von Wörtern im Kontext von Äußerungen Da es sich bei der Frage nach der Funktion von einzelnen Wörtern im Kontext des Aufbaus von Äußerungsbedeutungen bzw. gar der Bedeutung von ganzen Texten oder Gesprächen um ein extrem komplexes und umfangreiches Thema handelt, soll hier nur auf einen kleinen Bereich fokussiert werden, der speziell die interaktionale Sprachverwendung betrifft. Anhand von Wörtern (bzw. zuweilen auch Phrasen), die äußerungsinitial stehen und primär pragmatische, diskursorganisierende Funktionen haben (Diskursmarker), sollen folgende Fragen beantwortet werden: 1. Welche Funktionen haben solche Wörter am initialen Satzrand genau? Lassen sich Lexikalisierungs- bzw. Pragmatikalisierungstendenzen nachweisen? 2. Kann man in Bezug auf Diskursmarker überhaupt von ‚Wörtern‘ sprechen, bzw. wie geht man damit um, dass beispielsweise auch bestimmte Phrasen in genau der gleichen Weise eingesetzt werden können wie einzelne Wörter? Die Funktionsähnlichkeit von manchen Wörtern und Phrasen lässt sich beispielsweise anhand der Diskursmarker nur und ich mein illustrieren: „Nur: Gestern hatte ich das noch nicht gewusst.“ / „Ich mein: Gestern hatte ich das noch nicht gewusst.“
Es soll im Folgenden gezeigt werden, dass man mit traditionell schriftsprachlich orientierten Konzepten der Wortbedeutung oder Wortfunktion Probleme bekommt, da sich in manchen Fällen – wie bei den hier als Beispiel herangezogenen Diskursmarkern – erst in einer komplexen, durch Kontextfaktoren bedingten Äußerungssituation die Relation zwischen Wort- und Satzbedeutung erschließen lässt. Ein großes Problem, das sich bei der Beschreibung der hier angesprochenen Wörter/Phrasen stellt, liegt an dem Mangel an geeigneten Termini für spezifisch inter-
190
Wolfgang Imo
aktionale Kategorien. Wie Fiehler (2000, 25) feststellt, sind die meisten Kategorien „der Analyse und Beschreibung von geschriebener Sprache“ angepasst: Diese schriftsprachlich orientierten Analyse- und Beschreibungskategorien sind zudem das einzige voll entwickelte Kategoriensystem. Ein Kategoriensystem, das in ähnlicher Weise funktional auf die gesprochene Sprache zugeschnitten wäre, existiert im Moment nur in Ansätzen.
Das führt dazu, dass es in der Forschung bislang keine Einigkeit darüber gibt, wie man beispielsweise mit der Gruppe von Wörtern bzw. kurzen Phrasen umgehen soll, die (i) äußerungsinitial, (ii) parenthetisch in Äußerungen eingebettet und (iii) äußerungsfinal vorkommen können und auf der pragmatischen Ebene operieren, also den Hörerinnen und Hörer Verstehensanweisungen beispielsweise bezüglich der Wahrscheinlichkeit einer Aussage, ihrer Beziehung zu Vorgängeräußerungen o. ä. geben. Da die parenthetisch eingebetteten Fälle vergleichsweise selten sind, bietet es sich an, auf die „Konstruktionen am Satzrand“ (Selting 1994) zu fokussieren. Selting zeigt, dass die Satzränder in interaktional eingesetzter Sprache systematisch dazu verwendet werden, dort gesprächs- und interaktionsorganisierende, pragmatische Einheiten zu platzieren (Selting 1994, 316). Manche dieser Satzrandphänomene sind auch schriftsprachlich etabliert (etwa Links- und Rechtsversetzungen), andere dagegen sind typisch für (informelle) Mündlichkeit und weisen deutlich weniger syntaktische Bezüge zu dem jeweiligen Umgebungssyntagma auf. Ein Vorschlag, wie man mit letzteren Einheiten umgehen könnte, wurde von Barden/Elstermann/Fiehler (2001) gemacht. Die Autoren schlagen als Bezeichnung für diese Einheiten den Begriff „Operator“ vor und nennen die komplette Struktur, bestehend aus einer solchen pragmatischen Operator-Einheit – die sowohl äußerungsinitial als auch parenthetisch eingebettet oder äußerungsfinal vorkommen kann – und ihrer Bezugsäußerung(en) „Operator-Skopus-Struktur“. Da diese Bezeichnung durch die Bearbeitung der aktuellen Auflagen der Dudengrammatik durch Reinhard Fiehler dort Eingang gefunden hat, werde ich mich in der folgenden auf die Darstellung der Operator-SkopusStrukturen in der Dudengrammatik stützen. Funktional gibt ein Operator „dem Hörer eine Verstehensanleitung oder -anweisung, wie der Äußerungsteil in seinem Skopus aufzunehmen ist“ (Duden 2009, 1201). Als besonderer Vorteil wird bei dem Terminus „Operator-Skopus-Struktur“ gerade die Tatsache hervorgehoben, dass sowohl die formale Seite der Operatoren sehr weit gefasst wird als auch das, was im Skopus steht und damit zugleich nicht nur auf eine Wortarten-ähnliche Klasse an Operatoren abgehoben wird, sondern auf die Tatsache, dass diese Operatoren nur als komplexe Syntagmen (bzw. Konstruktionen) zusammen mit dem jeweiligen Skopus funktionieren. Mit anderen Worten, es werden „Ausdrucksklassen und Konstruktionen unter einem gemeinsamen Dach zusammen“ betrachtet, „die bisher separat behandelt wurden.“ Es handelt sich dabei um „Einzellexeme“, „kurze formelhafte Wendungen im Vor-Vorfeld“, „‚Subjunktionen‘, denen eine Verbzweitstellung folgt“, „bestimmte Matrixsätze“ und „performative Formeln“ (Duden 2009, 1213). Operatoren sind nach
Das Wort im Satz
191
dieser Auffassung „kurze, häufig auch formelhafte Ausdrücke“ (Duden 2009, 1202) wie z. B. „Kurz und gut: Es ist einfach nicht zu schaffen.“ oder „Ehrlich gesagt: Ich habe keine Lust.“). Die Grenzen sind bei dem Operatoren-Modell allerdings so weit gesteckt, dass selbst regulär gebildete Matrixsätze, denen ein abhängiger Hauptsatz folgt („ich verspreche morgen bekommst du deinen rucksack zurück“; Duden 2009, 1201), als Operatoren bezeichnet werden, was zu einer begrifflichen Unschärfe führt: Die Operator-Skopus-Strukturen sind daher eher als sehr offenes syntaktisches Konstruktionsmuster zu sehen, bei dem eine pragmatisch verwendete Einheit wie kurz und gut, ehrlich gesagt oder ich verspreche eine Verstehensanweisung bezogen auf den Rest der Äußerung gibt, also z. B. ob es sich um eine Zusammenfassung, eine potentiell heikle Aussage oder einen Sprechakt wie ein Versprechen handelt. Im Sinne einer Wortklassendefinition ist das Operator-Skopus-Konzept daher nicht zu gebrauchen. Etwas enger gefasst und stärker auf die Ausdrucksklasse fokussiert ist der verwandte Begriff der Diskursmarker. In einigen grundlegenden Arbeiten haben Gohl/ Günthner (1999) und Günthner (1999a, b, 2000, 2008) das Konzept der Diskursmarker für das Deutsche entwickelt. Dabei werden unter Diskursmarkern nach Gohl/Günthner (1999, 59 f.) „optionale, d. h. grammatisch und semantisch nicht-obligatorische Elemente, die Sprecher benutzen können, um ihren Diskurs zu organisieren“ verstanden, die „in Initialposition, oft außerhalb der syntaktischen Struktur eines Satzes bzw. nur lose damit verbunden“ stehen. Damit geht eine „Skopusausweitung“ einher, denn ein Diskursmarker kann „sich auf eine größere Einheit als den Satz“ beziehen, also beispielsweise auch auf eine ganze Sequenz oder eine folgende Erzählung. Im Vergleich zu den Wörtern/Phrasen, aus denen Diskursmarker ‚rekrutiert‘ wurden, lässt sich eine „reduzierter semantischer Gehalt“ feststellen. Formal betrachtet sind Diskursmarker „kurze, meist einsilbige Einheiten“, die „eher gesprochen- als geschriebensprachlich“ auftreten. Typische Diskursmarker sind beispielsweise die Konjunktionen weil und obwohl im Vor-Vorfeld vor Hauptsätzen (Obwohl: Ich habe heute gar keine Zeit). Der Grund dafür, dass Diskursmarker in einem Beitrag über die Probleme, Wörter im Kontext von Äußerungen in interaktionaler Sprache zu beschreiben, auftauchen, liegt auf der Hand: Diskursmarker sind (i) durch ihre semantische Reduktion, (ii) durch die Tatsache, dass sie nicht nur aus Wörtern, sondern auch aus Phrasen bestehen können und (iii) auf Grund ihres weiten Skopus und ihrer pragmatischen Funktionen besonders schwer zu beschreiben. Im Folgenden soll nun anhand einiger Diskursmarker deren Formen- und Funktionsspektrum diskutiert werden. Die im Folgenden angeführten Beispiele stammen aus Imo (2012). Anhand des Wortes nur kann gut gezeigt werden, wie sich die Aspekte von Funktion und Bedeutung von nur alleine durch die Veränderung der syntaktischen Position und der plausibel als Skopus identifizierbaren Einheiten verändern – und somit auch der Beitrag verändert wird, den nur zur gesamten Äußerungs- bzw. Gesprächsbedeutung leistet. Im ersten Beispiel, das aus einer Unterhaltung im Rahmen einer Reality-Show stammt, in der sich die Teilnehmer darüber unterhalten,
192
Wolfgang Imo
dass der Fernsehsender eine Präferenz für blonde Frauen als Teilnehmerinnen an dem Reality-Format habe, wird nur als Gradpartikel eingesetzt. Im zweiten Beispiel aus einer Radio-Anrufsendung über Beziehungsprobleme (M = Moderator, A = Anruferin) wird nur im Vorfeld eines Satzes als Adverb eingesetzt Beispiel 4: Realityshow 1246 A is ja o:ch ähem; (1.0) 1247 die zwe:te DUNkelhaarige erst hier drin oder? 1248 B → nur BLON[de ka]men hier rein; 1249 C [oder?] 1250 ja NU::R, 1251 der hat schon ne BLONdenphobie. Beispiel 5: Radio-Phone-in 214 M da hast du was SEHR rIchtiges gesagt, 215 ich mein, 216 M ihr habt bEIde dann ja schon einen einen einen schOck erLEBT; 217 A JA:;= 218 M =und auch die beGRENZTheit des lEbens (-) schon erAhnt; 219 [was man vielleicht in;] 220 A → [nUr sind (--) ] BEIde reaktionen so; 221 also äh mal kommt das von IHM aus, 222 also (wenn er) (-) wenn er GUT drauf ist oder so; 223 dann SAGT er natÜrlich so224 Ach quatsch da steht nix im wEge sonst sO mal jemanden KENnenzulernen,
Im ersten Beispiel ist über den Kontext die Funktion von „nur“ (Z. 1248) als Gradpartikel unschwer zu erkennen. Zwar scheint die Aussage, dass ausschließlich Blonde bei der Show teilnehmen konnten, hyperbolisch – A hat in Z. 1247 ja erwähnt, dass bereits zwei „DUNkelhaarige“ teilgenommen hatten –, die Interpretation als Gradpartikel wird aber durch die Reaktion von C gestützt, der emphatisch mit „ja NU::R“ (Z. 1250) die gefühlte Beschränkung auf blonde Kandidaten bekräftigt. Die Bedeutung als Gradpartikel erhält nur hier einerseits durch die Position direkt vor einem Bezugswort („BLONde“; Z. 1248) sowie durch die prosodische Realisierung mit der Betonung auf dem nominalisierten Adjektiv und die direkte prosodische Anbindung an das Bezugswort und andererseits durch den aufgespannten Kontext, der eine (hyperbolische) Gradpartikelverwendung plausibel macht. Im zweiten Beispiel wird nur als Konjunktionaladverb eingesetzt, das hier eine adversative Funktion hat. Die Sprecherin schließt damit an die Aussage des Moderators an und führt in der Folge aus, dass das Wissen um die Tatsache, dass beide einen Schock erlebt haben, ihr nicht dabei hilft, die von ihr als unangebracht wahrgenommenen Reaktionen ihres Freundes verstehen zu können. Es wird somit durch nur ein direkter, propositionaler Kontrast aufgebaut im Sinne von „Es ist zwar richtig, dass
Das Wort im Satz
193
wir beide einen Schock hatten, ABER X“. Maßgeblich für die Interpretation von nur als Adversativadverb ist dessen Position im Vorfeld der Äußerung aus Z. 220. In den folgenden beiden Transkriptausschnitten, die beide aus einer psychologischen Radio-Beratungssendung stammen (Beraterin B, Anruferin A), wird dagegen nur als Diskursmarker eingesetzt: Beispiel 6: psychologische Beratungssendung 204 B es ist so: OFT so dass äh (.) hhhh so:: s- .h schwIErigkeiten zwischen menschen (.) geblIEben sind. 205 und dann STIRBT einer; 206 und dann wirds fUrchtbar SCHWER. 207 (1.0) 208 A [mhm,] 209 B [.hhh] weil des nich (.) .h AUFgeräumt worden is sozusagen. 210 → .hh nu:r- (.) 211 zu DER zeit; 212 wo die mutter noch geLEBT hat; 213 (1.0) 214 B da war das für sIE vielleicht gAr nich so: drIngend DRAN, (.) 215 das AUFzuräumen. Beispiel 7: psychologische Beratungssendung 227 A NEI:N; 228 des nehm ich mir NICHT übel. 229 (0.5) 230 B na DANN wärs ja eigentlich mÖglich231 A → naJA aber nur i mein mich belAstet des (dass) die (.) frAU mich jetzt damIt. 232 (.) ha? 233 (0.5) 234 A weil i mein ich hätte SICHerlich (.) manches Anders gemacht, 235 (1.0) 236 aber-
In Beispiel 6 fasst die Beraterin die von der Anruferin geschilderte Situation interpretierend zusammen, um auf dieser Basis einen Rat formulieren zu können. Schon auf formaler Ebene ist auffällig, dass das „nu:r“ aus Z. 210 nicht nur prosodisch deutlich abgesetzt von der Folgeäußerung realisiert wird und durch die Dehnung weitaus salienter ist als die beiden Fälle von nur in den Beispielen 4 und 5 und dass es zudem im Vor-Vorfeld der Folgeäußerung und nicht im Vorfeld realisiert wird. Damit einher geht entsprechend auch ein ‚Verlust‘ der Bedeutung/Funktion als adversatives Adverb, das auf propositionaler Ebene Kontraste markiert. Es ergibt hier wenig Sinn, die Äußerung im Sinne von Es wird zwar furchtbar schwer, wenn das nicht aufgeräumt worden ist, ABER X rekonstruieren zu wollen. Beide Aussagen stehen nicht in einem direkten adversativen Verhältnis. Was die Beraterin hier macht, ist vielmehr, durch nur – und
194
Wolfgang Imo
dessen adversative Restbedeutung – ein neues Argument in ihrer rekonstruierenden Darstellung der Probleme der Anruferin einzuführen: Sie wechselt von der allgemeinen Darstellung der Probleme, die durch den plötzlichen Tod eines nahestehenden Menschen ausgelöst werden können, zu der Diskussion der konkreten und zeitlich früheren Beziehung der Anruferin zu ihrer Mutter. An dieser Stelle setzt sie dann in der Folge an, um ihren Rat zu formulieren. Das „nu:r“ in Z. 210 operiert somit eindeutig nicht nur auf einem deutlich weiteren Skopus – es verweist auf die komplette folgende Reformulierung des Problems der Anruferin mit ihrer Mutter –, sondern hat auch gesprächssteuernde Funktionen. Es liefert der Anruferin einen Kontextualisierungshinweis, der ihr dabei hilft, den Sprung von der allgemeinen Darstellung des Sachverhalts zu der konkreten Problembearbeitung nachzuvollziehen. Beispiel 7 illustriert die Tatsache, dass Diskursmarker sehr ‚kombinationsfreudig‘ sind: Die Anruferin quittiert den von der Beraterin angedeuteten unproblematischen Rat („na DANN wärs ja eigentlich mÖglich“; Z. 230) mit einer Reihe von Signalen: Zunächst mit dem Skepsis signalisierenden Responsiv „naJA“, dann mit der Konjunktion (die hier auch als Diskursmarker gewertet werden könnte) „aber“ und schließlich mit den beiden Diskursmarkern „nur“ und „i mein“ (Z. 231). Der Einsatz dieser Diskursmarker wird verständlich, wenn man den Kontext des Gesprächs kennt: Der Grund für den Anruf war, dass die Anruferin wissen wollte, wie sie es verhindern könne, dass ihre bereits etwas ‚senile‘ Tante den Tod der Mutter der Anruferin (also der Schwester der Tante) verleugnet. Die Tante fragt die Anruferin ständig, wie es ihrer Schwester geht und versteht nicht, dass diese gestorben ist. Die Anruferin fühlt sich davon stark belastet. Der Rat der Beraterin vor Einsatz des vorliegenden Transkriptausschnittes bestand darin, dass die Anruferin mit dem Tod ihrer Mutter selbst ins Reine kommen müsste, denn sobald das der Fall sei, würde es ihr nichts mehr ausmachen, wenn ihre Tante sie ständig nach ihrer Mutter fragen würde. Die Beraterin stellt die These auf, dass die Anruferin nur deshalb von dem Verleugnen des Todes belastet werde, da sie es sich übel nehme, ihr Verhältnis mit ihrer Mutter nicht vor deren Tod geklärt zu haben. Dies wird von der Anruferin vehement zurückgewiesen (Z. 227–228), woraufhin die Beraterin suggeriert, dass es ihr dann ja möglich sein müsse, das Verleugnen des Todes zu akzeptieren (Z. 230). An dieser Stelle wechselt die Anruferin von dem aktuellen, von der Beraterin initiierten Thema Reden über die Mutter zu ihrem eigentlichen Grund des Anrufs, nämlich Reden über die Tante. Dieser Wechsel wird durch das themenbeendigende „naJA“ rückblickend markiert. Vorausblickend wird dann durch „aber“ und „nur“ eine adversative Handlung angekündigt, die, wie sich zeigt, nicht propositional auf den Vorgängerhandlungen aufbaut, sondern die den Handlungsstrang wie komme ich mit meiner Mutter ins Reine verlässt und zu dem Handlungsstrang wie bringe ich meine Tante dazu, den Tod der Mutter nicht mehr zu verleugnen wechselt. Der Diskursmarker ich mein markiert dabei zusätzlich einen Handlungsbruch (vgl. Günthner/Imo 2003 und Imo 2007, 190–198 zu den Funktionen des Diskursmarkers ich mein(e)). Auffällig ist dabei, dass die Anruferin kurz darauf die Rückkehr zu der von der Beraterin präferierten Handlung, das Reden
Das Wort im Satz
195
über das Verhältnis zu der Mutter, wieder durch zwei Diskursmarker einleitet: „weil“ und „i mein“. Die gesprächssteuernde Wirkung der Diskursmarker konnte an diesen Beispielen gut gezeigt werden, ebenso die Tatsache, dass Diskursmarker nicht auf propositionaler Ebene wirken. Die Frage nach dem Beitrag von Wörtern zur Bedeutung von Äußerungen muss so beantwortet werden, dass prosodische oder orthographische – Redder (2009, 520) spricht von der graphisch markierten „Doppelpunkt-Verwendung“ solcher Konnektoren – und distributionelle (Vor-Vorfeld) Merkmale dazu führen, dass eine interaktionale statt einer propositional verknüpfenden Funktion aktiviert wird. Für die Bestimmung der Wortbedeutung bzw. der Interaktion von Wort- und Satzbedeutung heißt das, dass es schwierig wird, mit traditionell schriftsprachlich geprägten Konzepten von Wortbedeutung und Wortfunktion zu operieren, da Bedeutung und Funktion in einem äußerst komplexen Zusammenspiel aus ko- und kontextuellen Merkmalen entstehen. Bleibt noch die Frage nach dem Umgang mit dem Befund, dass nicht nur Wörter im engeren Sinne (nur, weil, aber, obwohl, wobei etc.), sondern auch kurze verfestigte Phrasen (ich mein(e), ich glaub(e), ich sag mal so etc.) als Diskursmarker eingesetzt werden können. Diese phrasalen Einheiten verhalten sich ganz ähnlich wie die ‚echten‘ Wörter, was unter anderem daran liegt, dass in der Verwendung als Diskursmarker die Flektierbarkeit nicht mehr gegeben ist: Es gibt nur den Diskursmarker ich mein(e), nicht aber du meinst, wir meinen, er meint o. ä. Sobald eine andere Form als die der 1. Person Singular Präsens verwendet wird, kann es sich nicht mehr um einen Diskursmarker handeln. Der Verlust der Flexionsfähigkeit ist also ein Indiz für die Herausbildung einer ‚wortähnlichen‘ Einheit. Ein zweiter Aspekt, der für eine ‚Worthaftigkeit‘ der Phrasen spricht, liegt in der phonologischen Reduktion begründet: Typischerweise wird nicht nur der Schwa-Laut (mein, glaub, sag etc.) getilgt, es zeigt sich auch eine Verschmelzung der Wörter ineinander, so das phonologisch ein einziges Wort entsteht. Wenn man diese Fälle in GAT ohne phonetische Umschrift transkribieren wollte, müsste man sie als chmein, chglaub, chsamaso statt als ich mein, ich glaub, ich sag mal so umschreiben (vgl. ausführlich Imo 2007 sowie Imo 2012 zur Diskussion des Status phrasaler Diskursmarker). Da phonologische Reduktion, wie Bybee/Scheibman (1999) anhand der Diskussion der Reduktionsformen von don’t im Englischen zeigen, als Indikator für die Herausbildung eigenständiger Formen gewertet werden kann, ergibt sich ein zusätzliches Argument für die Behandlung dieser phrasalen Diskursmarker als Wörter. Wurzel (2000) versucht das Problem, das in ähnlicher Weise auch bei unterbrechbaren Substantivkomposita entsteht, dadurch zu umgehen, dass er den bereits in Abschnitt 3.2 kurz diskutierten Begriff des „Semiwortes“ einführt: „Grammatische Einheiten mit partiellen Worteigenschaften erscheinen als Semiwörter“. (Wurzel 2000, 36) Dabei gelten für Wurzel Komposita mit schwacher Kohärenz, also solche, bei denen eine Unterbrechbarkeit potentiell möglich ist, als Semiwörter (Wurzel 2000, 38). Beispiele wären nach Wurzel (2000, 41) entweder Wörter mit partiellen Phraseneigenschaften, die er als „morphologische Semiwörter“
196
Wolfgang Imo
einstuft – wie Langeweile, da dort beim Genitiv auch das Determinativum flektiert wird (der Langenweile) oder Rad fahren – und Phrasen mit partiellen Worteigenschaften, d. h. mit unterschiedlich starker Verbindung wie bei grüner Kloß, wo die Wortbestandteile invariabel sind (?roter Kloß). Die oben genannten Diskursmarker könnten also mit Wurzel als Phrasen mit partiellen Worteigenschaften aufgefasst werden, die allerdings weitaus stärker als grüner Kloß bereits Worteigenschaften haben. Dass eine mögliche Entwicklung tatsächlich in der Entstehung neuer, eigenständiger Wörter resultieren könnte, zeigt der Fall des im Süddeutschen gebräuchlichen Vergewisserungssignals gell, das aus der Bekräftigungsfloskel es gelte oder es möge gelten entstanden ist und in der heutigen Form unbestreitbar Wortstatus hat (vgl. Auer/Günthner 2000, Lehmann 2005, 23 sowie Ágel 2005, 118, der betont, dass die Eingliedrigkeit wie bei gell? im Vergleich zur Zweigliedrigkeit wie bei nicht wahr? oder weißdu? (sic!) nicht relevant sei, was zähle, sei vielmehr die Verwendung mit gleichen Umgebungen mit ähnlichen pragmatischen Funktionen).
2.4 Ist das ein Wort oder kann das weg? Der Status von Emoticons wie :-), :-( oder :-* Der letzte Aspekt, der hier noch angesprochen werden muss, betrifft eine neue Entwicklung, die durch die computervermittelte informelle Kommunikation entstanden ist. Es hat sich eingebürgert, mit Hilfe von Emoticons wie :-), :-( oder :-* teilweise ganze Aktivitäten zu kodieren – im Falle von :-* beispielsweise einen Kuss – oder, wie bei dem häufigsten aller Emoticons, dem ‚Smiley‘ :-), entweder ein Lächeln/Grinsen (Aktivität) oder auch ‚nur‘ unspezifisch Nähe anzuzeigen (vgl. ausführlich Imo i. E. zur Funktion von :-) in der SMS-Kommunikation). Ganz ähnlich wie Interjektionen sind diese Emoticons schwer zu klassifizieren: Sie haben ein sehr weites, extrem kontextabhängiges Funktionsspektrum und werden nicht dazu verwendet, Phrasen oder Sätze aufzubauen, d. h. sie behalten ihren autonomen Status. Zifonun et al. (1997, 62) plädieren in ihrer Diskussion von Interjektionen daher dafür, diese nicht als Wortarten zu behandeln, sondern als „Interaktive Einheiten“: „Im Unterschied zu Wortarten sind INTERAKTIVE EINHEITEN dadurch gekennzeichnet, dass ihre Elemente als selbständige Einheiten der Interaktion fungieren und nicht zum Aufbau von Sätzen oder kommunikativen Minimaleinheiten beitragen.“ Besondere Bedeutung bekommt die Debatte darüber, welchen Status solche „Interaktiven Einheiten“ haben, gerade im Kontext der Entstehung der Emoticons und anderer neuer Schreibungen, die in der computervermittelten Kommunikation) verwendet werden. Das liegt daran, dass traditionelle schriftsprachliche Korpora in letzter Zeit um interaktionale Schriftkorpora aus der computervermittelten Kommunikation erweitert werden. Dabei stellt sich dann die Frage, wie beispielsweise Emoticons annotiert werden sollen. Beißwenger et al. (2012, 52) diskutieren dieses Problem aus der Perspektive der Versuche, im Rahmen der Text Encoding Initiative (TEI) ein Annotationsschema zu entwickeln. Ihr
Das Wort im Satz
197
Vorschlag besteht darin, auch Emoticons genau wie Interjektionen als „Interaction Signs“ bzw. als „Interaktive Einheiten“ aufzufassen. Auf diese Weise wird das Inventar der „Interaktiven Einheiten“ aus Zifonun et al (1997, 62), das ursprünglich primär aus Interjektionen (ach, oho, tja, äh, gell, hm, oh, pst, aua etc.) sowie aus Responsiven (ja, okay, nein etc.) bestand, deutlich erweitert: Neben den Interjektionen und Responsiven tauchen nämlich in der computervermittelten Kommunikation zusätzlich Emoticons (:-), :-D, m_m etc.), „interaction words“ (grins, freu, lach, lol, rofl etc.), „interaction templates“ (☺, ☹ etc.) und „addressing terms“ (@zora:…, an bilbo21 etc.) auf (Beißwenger et al. 2012, 52). Für alle diese Einheiten scheint es in der Tat angebracht, einen eigenständigen Begriff zu entwickeln, da sie nicht dazu verwendet werden können, zu Phrasen oder Sätzen kombiniert zu werden, sondern einen autonomen Status haben (Imo i. E. zeigt, dass das Emoticon :-) beispielsweise fast immer äußerungsfinal, selten äußerungsinitial und nie äußerungsmedial eingesetzt wird). Da die Forschung zu Emoticons und ähnlichen Einheiten aber noch ganz am Anfang steht, kann bislang noch nicht gesagt werden, in welche Richtung sich deren Beschreibung terminologisch entwickeln wird. Über deren Wortstatus werden daher weitere Untersuchungen zu entscheiden haben.
3 Fazit Wie die Diskussion in den vorigen Abschnitten gezeigt hat, sind nicht nur schon lange bestehende Fragen der Wort- und Wortartendefinition weiter ungelöst. Durch die Arbeit mit authentischem Datenmaterial kommen vielmehr noch weitere offene Fragen hinzu. Gerade die Tatsache, dass in der computervermittelten Kommunikation informelle Schriftlichkeit in großem Maße sichtbar wird und diese informelle Schriftlichkeit zunehmend Eingang in wissenschaftliche Korpora findet, hat Auswirkungen auf Ansätze der Wortbeschreibung, wie beispielsweise durch das Erfordernis, mit Emoticons, Inflektiven und ähnlichen Einheiten umgehen zu müssen. Hier gilt, wie Haß-Zumkehr (2002, 51) es formuliert, dass ein Korpus die Analysierenden schnell „mit der beträchtlichen Differenz zwischen der Wirklichkeit der einzelsprachlichen Wortbildung und den überlieferungsbedingten Vorstellungen von ‚Grund-‘ bzw. ‚Normal-‘Formen“ konfrontiert. Offen bleibt dann, wie mit dieser Differenz umgegangen werden soll: Entweder man fügt den bestehenden Definitionskriterien für Wörter und Wortarten neue hinzu, oder man versucht, neue Kategorien (wie die oben diskutierten „Interaktiven Einheiten“ von Zifonun et al. 1997) zu entwickeln. Mit der Auffassung, man könne das Inventar des Deutschen mit einem minimalen Kategorienset erfassen, kommt man nicht weiter, denn die „ursprünglich mit den Ausdrucksstufen WORT und SYNTAGMA verbundene Annahme, man könne mit wenigen Kategorien die Ausdrücke einer Sprache vollständig erfassen und dabei auf ökonomische Weise viele ihrer Details festhalten“, scheitert, so Jacobs (2011, 363) „an der Differenziert-
198
Wolfgang Imo
heit der Daten“. Im konkreten Einzelfall und in qualitativen Analysen lassen sich die vorliegenden Daten stets deuten, die Funktion der Einheiten ist im Kontext klar. Ob es auch möglich ist, ein exhaustives Inventar an eindeutig bestimmbaren abstrakten Kategorien und Typen aufzustellen, ist – gerade auch wenn man die Sprachentwicklung betrachtet – zweifelhaft. Was gemacht werden kann, ist, auf die existierenden Phänomene zu verweisen und zu versuchen, diese zu gruppieren und kritisch zu ordnen, wie es der vorliegende Beitrag versucht.
4 Literatur Ágel, Vilmos (2005): Wort-Arten aus Nähe und Distanz. In: Clemens Knobloch/Burkhard Schaeder (Hg.): Wortarten und Grammatikalisierung. Berlin, 95–129. Ágel, Vilmos/Roland Kehrein (2002): Das Wort – Sprech- und/oder Schreibzeichen? In: Vilmos Ágel u. a. (Hg.): Das Wort: Seine strukturelle und kulturelle Dimension. Tübingen, 3–28. Auer, Peter/Susanne Günthner (2004): Die Entstehung von Diskursmarkern im Deutschen – ein Fall von Grammatikalisierung? In: Torsten Leuschner/Tanja Mortelsmans (Hg.): Grammatikalisierung im Deutschen. Berlin, 335–362. Barden, Birgit/Mechthild Elstermann/Reinhard Fiehler (2001): Operator-Skopus-Strukturen in gesprochener Sprache. In: Frank Liedtke/Franz Hundsnurscher (Hg.): Pragmatische Syntax. Tübingen, 197–232. Beißwenger, Michael (2007): Sprachhandlungskoordination in der Chat-Kommunikation. Berlin. Beißwenger, Michael u. a. (2012): A TEI Schema for the representation of computer-mediated communication. In: Journal of the Text Encoding Initiative 3. http://jtei.revues.org/476 . Bybee, Joan/Joanne Scheibman (1999): The effect of usage on degrees of constituency: The reduction of don’t in English. In: Linguistics 37, 575–596. Deppermann, Arnulf (2006): Deontische Infinitivkonstruktionen: Syntax, Semantik, Pragmatik und interaktionale Verwendung. In: Susanne Günthner/Wolfgang Imo (Hg.): Konstruktionen in der Interaktion. Berlin, 239–262. Deppermann, Arnulf/Reinhold Schmitt (2008): Verstehensdokumentationen: Zur Phänomenologie von Verstehen in der Interaktion. In: Deutsche Sprache 36, 220–245. Duden (2009): Die Grammatik. 8. Aufl. Mannheim. Eisenberg, Peter (2004): Grundriss der deutschen Grammatik: Der Satz. Stuttgart. Eisenberg, Peter (2005): Das Verb als Wortkategorie des Deutschen. Zum Verhältnis von synthetischen und analytischen Formen. In: Clemens Knobloch/Burkhard Schaeder (Hg.): Wortarten und Grammatikalisierung. Berlin, 21–41. Fiehler, Reinhard (2000): Über zwei Probleme bei der Untersuchung gesprochener Sprache. In: Sprache und Literatur 31, 23–42. Glück, Helmut (2000): Metzler Lexikon Sprache. Stuttgart. Gohl, Christine/Susanne Günthner (1999): Grammatikalisierung von weil als Diskursmarker in der gesprochenen Sprache. In: Zeitschrift für Sprachwissenschaft 18, 39–75. Golato, Andrea (2000): Und ich so / und er so (and I’m like / and he’s like): An innovative German quotative for reporting on embodied actions. In: Journal of Pragmatics 32, 29–54. Grewendorf, Günther/Fritz Hamm/Wolfgang Sternefeld (1991): Sprachliches Wissen. Frankfurt a. M. Günthner, Susanne (1999a): Wenn-Sätze im Vor-Vorfeld: Ihre Formen und Funktionen in der gesprochenen Sprache. In: Deutsche Sprache 3, 209–235.
Das Wort im Satz
199
Günthner, Susanne (1999b): Entwickelt sich der Konzessivkonnektor obwohl zum Diskursmarker? Grammatikalisierungstendenzen im gesprochenen Deutsch. In: Linguistische Berichte 180, 409–446. Günthner, Susanne (2000): Grammatik im Gespräch: Zur Verwendung von ‘wobei’ im gesprochenen Deutsch. In: Sprache und Literatur 85, 57–74. Günthner, Susanne (2008): ‚weil – es ist zu spät‘. Geht die Nebensatzstellung im Deutschen verloren? In: Markus Denkler u. a. (Hg.): Frischwärts und Unkaputtbar. Sprachverfall oder Sprachwandel im Deutschen? Münster, 103–128. Günthner, Susanne (2011): Zur Dialogizität von SMS-Nachrichten – eine interaktionale Perspektive auf die SMS-Kommunikation. In: Networx 60, 1–37. Günthner, Susanne (2012): ‚Lupf meinen Slumpf‘ – die interaktive Organisation von SMS-Dialogen. In: Christian Meier/Ruth Ayaß (Hg.): Sozialität in Slow Motion. Theoretische und empirische Perspektiven. Wiesbaden, 353–374. Günthner, Susanne/Wolfgang Imo (2003): Die Reanalyse von Matrixsätzen als Diskursmarker: ich mein-Konstruktionen im gesprochenen Deutsch. In: Magdalena Orosz/Andreas Herzog (Hg.): Jahrbuch der ungarischen Germanistik. Budapest, 181–216. Haase, Martin u. a. (1997): Internetkommunikation und Sprachwandel. In: Rüdiger Weingarten (Hg.): Sprachwandel durch Computer. Opladen, 51–85. Hagemann, Jörg (2009): Tag questions als Evidenzmarker. Formulierungsdynamik, sequentielle Struktur und Funktionen redezuginterner tags. In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 10, 145–176. Haß-Zumkehr, Ulrike (2002): Das Wort in der Korpuslinguistik. In: Vilmos Ágel u. a. (Hg.): Das Wort: Seine strukturelle und kulturelle Dimension. Tübingen, 45–70. Haß, Ulrike/Petra Storjohann (2015): Wort und Wortschatz. In: Ekkehard Felder/Andreas Gardt (Hg.): Handbuch Sprache und Wissen (HSW-Band 1). Berlin/Bosten, 147–166. Herbermann, Clemens-Peter (1981): Wort, Basis, Lexem und die Grenze zwischen Lexikon und Grammatik. München. Imo, Wolfgang (2007): Construction Grammar und Gesprochene-Sprache-Forschung: Konstruktionen mit zehn matrixsatzfähigen Verben im gesprochenen Deutsch. Tübingen. Imo, Wolfgang (2012): Wortart Diskursmarker? In: Björn Rothstein (Hg.): Nicht-flektierende Wortarten. Berlin, 48–88. Imo, Wolfgang (2013): Sprache-in-Interaktion: Analysemethoden und Untersuchungsfelder. Berlin. Imo, Wolfgang (i. E.): Vom ikonischen über einen indexikalischen zu einem symbolischen Ausdruck? Eine konstruktionsgrammatische Analyse des Emoticons :-). In: Jörg Bücker/Susanne Günthner/Wolfgang Imo (Hg.): Konstruktionsgrammatik V. Tübingen. Jacobs, Joachim (2011): Grammatik ohne Wörter? In: Stefan Engelberg/Anke Holler/Kristel Proost (Hg.): Sprachliches Wissen zwischen Lexikon und Grammatik. Berlin, 345–372. Koch, Peter/Wulf Oesterreicher (1985): Sprache der Nähe – Sprache der Distanz. In: Romanistisches Jahrbuch 36, 15–43. Krámský, Jiří (1969): The Word as a Linguistic Unit. The Hague. Lehmann, Christian (2005): Wortarten und Grammatikalisierung. In: Clemens Knobloch/Burkhard Schaeder (Hg.): Wortarten und Grammatikalisierung. Berlin, 1–20. Ono, Tsuyoshi/Sandra A. Thompson (1995): What can conversation tell us about syntax? In: Philip W. Davis (Hg.): Descriptive and Theoretical Modes in the Alternative Linguistics. Amsterdam, 213–271. Redder, Angelika (2009): Konjunktor. In: Ludger Hoffmann (Hg.): Handbuch der deutschen Wortarten. Berlin, 483–524.
200
Wolfgang Imo
Selting, Margret (1994): Konstruktionen am Satzrand als interaktive Ressource in natürlichen Gesprächen. In: Brigitta Haftka (Hg.): Was determiniert Wortstellungsvariation? Opladen, 299–318. Selting, Margret u. a. (2009): Gesprächsanalytisches Transkriptionssystem 2 (GAT 2). In: Gesprächsforschung – Online-Zeitschrift zur verbalen Interaktion 10, 353–402. Wurzel, Wolfgang Ulrich (1984): Morphologische Natürlichkeit. Berlin. Wurzel, Wolfgang Ulrich (2000): Was ist ein Wort? In: Nanna Fuhrhop u. a. (Hg.): Deutsche Grammatik in Theorie und Praxis. Tübingen, 29–42. Ziegler, Evelyn (2012): Merkel hat ‘nen Neuen: Die Kurzform nen – ein Mündlichkeitsmarker par excellence. In: Britt-Marie Schuster/Doris Tophinke (Hg.): Andersschreiben: Formen, Funktionen, Traditionen. Berlin, 295–315. Ziegler, Evelyn (2013): The case of [nən]: A current change in colloquial German. In: Peter Auer/Javier Caro Reina/Göz Kaufmann (Hg.): Language Variation – European Perspectives IV. Amsterdam, 281–294. Zifonun, Gisela u. a. (1997): Grammatik der deutschen Sprache. Berlin.
Cyril Belica/Rainer Perkuhn
9. Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster Abstract: In vielen Theorien zur Sprachproduktion spielt die Einheit Wort eine zentrale Rolle: Bei der Planung einer Äußerung werden vorsprachliche Konzepte angenommen, die jedes für sich einer lexikalischen Komponente für eine geeignete Wortwahl übergeben werden. Eine syntaktische Komponente sorgt für eine angemessene Formulierung. Kollokationen als Wortverbindungen bringen den zusätzlichen Einfluss mit ein, dass Wörter vielfach gemeinsam in präferierten Kombinationen gewählt werden. Dieser fällt aber nur dann auf, wenn das Ergebnis nicht das sonst Erwartbare ist – das allerdings von verschiedenen Faktoren (z. B. der situativen Angemessenheit) abhängig ist. Ein Kollokationsbegriff, der auf Abweichungen aufbaut, trägt nur im Vergleich zu einem nicht pauschal definierbaren Standard. Wenn sich Kollokationen aber im Kern auf Gebrauchspräferenzen zurückführen lassen, sind sie empirisch zugänglich. Kollokationen zeigen sich ermergent im Sprachgebrauch und lassen sich in Korpora aufspüren. Eine Einordnung bezüglich Auffälligkeiten (etwa zur Übersetzungsäquivalenz oder zur Idiomatik) ist jeweils eine perspektiven-bezogene Interpretation des allgemeinen Konzepts. 1 Das Phänomen „Kollokation“ 2 Kollokation sprachtheoretisch 3 Kollokation in angewandt-linguistischen Fachdisziplinen 4 Kollokation als emergentes Phänomen und seine korpuslinguistische Modellierung 5 Literatur
1 Das Phänomen „Kollokation“ Dieser Beitrag handelt von einem Phänomen, dessen Wirkung in verschiedenen linguistischen Bereichen als „Kollokation“ beschrieben wird. Der Einfachheit halber wollen wir die Bezeichnung auch für das Phänomen beibehalten, da wir zeigen werden, dass sich die beschriebenen Manifestationen als aus dem Phänomen abgeleitet erklären lassen. So ähnlich, wie die Schwerkraft ständig auf alle Objekte auf der Erde wirkt, sie aber nur dadurch erfahrbar ist, wenn etwas herunterfällt, so ähnlich wirkt das Phänomen allgegenwärtig auf sprachliche Objekte – es fällt aber eben nur dann auf, wenn andere Erklärungsansätze für das Zustandekommen sprachlicher Formulierungen an ihre Grenzen stoßen.
202
Cyril Belica/Rainer Perkuhn
1.1 Kollokativität bei der Sprachproduktion Wenn wir eine sprachliche Äußerung verfertigen, wirkt sich die Wahl eines bestimmten Wortes auf die Wahl anderer Wörter aus. Dieses Wirken soll aber nicht im Sinne eines sequentiellen Sprachproduktionsprozesses gedeutet werden; alternativ hätten wir auch festhalten können, dass eine Wortkombination quasi gleichzeitig gemeinsam ausgewählt wird. Unabhängig davon, wie wir uns ein Sprachproduktionsmodell genau vorstellen, ist zu vermuten, dass die Inhaltsseite – das, was wir sagen wollen – abschnitts- oder ausschnittsweise Konturen annimmt. Die Objekte auf dieser Ebene kann man sich sicher unterschiedlich granular-atomar vorstellen. Idealerweise finden sich dazu Wörter, die aufgrund ihrer Bedeutung und anderer Eigenschaften geeignet sind, diese Objekte sprachlich auszudrücken. Selbstverständlich kommen dabei auch morphologische und syntaktische Mittel zum Einsatz, um die Einordnung der Objekte in die Gesamtproposition anzuzeigen. Davon werden wir aber im Folgenden abstrahieren. Wenn wir jetzt dahingehend idealisieren, dass wir ein Inhaltsobjekt isolieren können, für das ein passendes Wort gesucht wird, müssen wir zunächst konstatieren, dass der Zusammenhang zwischen Bezeichnetem und Bezeichnendem arbiträr ist. Dem Inhaltlichen haftet nichts an, was auf die Ausdrucksseite schließen ließe, selbst Lautmalerisches variiert von Sprache zu Sprache. Die Beziehung zwischen Inhalt und Wort ist zwar im Wesentlichen aus Willkür geboren, hat sich dann aber im Laufe der Zeit über usuellen Gebrauch konventionell verfestigt. Die Sammlung dieser konventionalisierten Bedeutung-Wort-Beziehungen bauen alle Menschen während des (Erst-) Spracherwerbs auf. In einem modularen Sprachverarbeitungsmodell entspräche diese Sammlung einem mentalen Lexikon, mit dem wir der Einfachheit halber auch hier argumentieren werden – auch wenn es eventuell dazu nur ein virtuelles Pendant verstreut über verschiedene Bereiche im Lexikon-Syntax-Kontinuum gibt. Wenn wir jetzt also annehmen, dass klar ist, worüber wir sprechen wollen, ist damit auch automatisch gegeben, wie wir uns ausdrücken wollen? Können wir in dem Lexikon für das Inhaltsobjekt einen eindeutigen Bezeichner nachschlagen? Objekte haben mitnichten einen „Namen“. Wie Brown (1958) ausgeführt hat, gibt es gemeinhin verschiedene Bezeichner für dasselbe Objekt. Welchen wir davon auswählen, hängt von vielen Faktoren ab, etwa in welchem funktionalen Zusammenhang über das Objekt gesprochen wird. Brown bringt als Beispiel ein Geldstück, das einfach als „Münze“ oder genauer mit seinem Wert bezeichnet werden kann (im Deutschen z. B. „Groschen“). Erstere Bezeichnung wäre angemessen, wenn einem Kind gesagt wird, dass es das Objekt nicht in den Mund stecken soll (was für alle Münzen egal welchen Wertes gleichermaßen gilt). Der Wert der Münze wird in denjenigen Situationen relevant und unterscheidendes Merkmal, wenn es um Bezahlvorgänge geht. Rosch (1978) hat empirische Untersuchungen durchgeführt, wie Probanden Objekte bezeichnen. Ein besonderes Augenmerk legte sie dabei auf Bezeichner, die sich hierarchisch aufeinander beziehen lassen, wie z. B. „Möbelstück – Stuhl – Küchenstuhl“. Sie konnte feststellen, dass zwar alle Bezeichnungen genannt wurden, aber sich eine sehr ein-
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
203
deutige Präferenz für die Bezeichner auf einer mittleren Ebene zeigte, die dadurch als ‚basic level‘ charakterisiert wurde. Es gibt demnach also keine eindeutigen Namen, der sprachliche Usus zeigt aber eine deutliche Tendenz. Da bei diesen Versuchen der Bezeichnungsakt aber in keinen funktionalen Zusammenhang eingebettet war, wäre dieser – wie von Brown schon vorgedacht – als zusätzlicher Parameter für die Präferenzen miteinzubeziehen, etwa um das Enthaltensein in einer Menge („Möbel“) oder das Abgrenzen gegenüber benachbarten Elementen einer Menge („Küchenstuhl“ vs. „Schreibtischstuhl“) zu betonen. Kann man denn schlussfolgern, dass der Bezeichner gerade genauso viele Eigenschaften des Objekts widerspiegeln soll, wie in der Verwendungssituation erforderlich ist? Nach Erkenntnissen anderer Versuchsreihen ist dem sehr wahrscheinlich nicht so: Deutsch/Pechmann (1982) haben (geometrische) Objekte benennen lassen. Aus einer Menge von Objekten, die sich über Form, Farbe und Größe unterschieden, sollte eines benannt werden, sodass es eindeutig identifiziert werden konnte. Hierbei griffen die Versuchspersonen neben dem Form bezeichnenden Substantiv zusätzlich auf Farbe und Größe bezeichnende Adjektive zurück. Fazit der Untersuchungen war, dass nicht nur Minimalspezifikationen (genau die diskriminierenden Attribute), sondern fast ebenso häufig Überspezifikationen (mehr als die diskriminierenden Attribute), gelegentlich sogar Unterspezifikationen geäußert wurden. Man kann die Redundanz und sogar die typische Reihenfolge der Attributnennung auf die Art und Weise zurückführen, wie die Eigenschaften wahrgenommen werden. Dabei geht es in erster Linie aber nicht um das eigene, sondern um das dem Hörer unterstellte Wahrnehmungsvermögen, das optimal eingesetzt werden soll, um das bezeichnete Objekt zu identifizieren. Letztendlich kann man auch hier annehmen, dass sich ein Usus darüber herausgebildet hat, welche Eigenschaften am erfolgreichsten aufgegriffen wurden. Bei der bisherigen Reflektion über die Wortwahl bei der Sprachproduktion haben wir uns auf das einfachste Szenario, ein Objekt benennen zu wollen, konzentriert. Dabei lassen sich zwar gewisse Einflussfaktoren und Mechanismen erahnen; eine Rolle spielen sicher auch die Aussprechbarkeit, die Ökonomie, ästhetisch-stilistische Erwägungen, der Registerbezug oder die Trennschärfe gegenüber anderen Wörtern (z. B. zwo anstelle von zwei). Festzuhalten ist aber, dass zusätzlich zu all diesen die funktionelle Einbettung und damit verbunden der Usus im Gebrauch ‚das letzte Wort‘ hat. Dadurch ist die Wortwahl aber immer noch nicht deterministisch festgelegt, sie wird nur präferentiell gelenkt, gegebenenfalls in Abhängigkeit von weiteren Faktoren. Wenn es nun darum geht, einen komplexeren Sachverhalt (im weitesten Sinne) auszudrücken, für dessen Beschreibung mehrere Wörter nötig sind, kommt zu all diesen Effekten das Phänomen der Kollokation hinzu. So wie Wörter Bedeutungspotentiale haben, könnten wir hier analog formulieren, dass Bedeutungen Wortpotentiale haben. In Abb. 1 haben wir versucht, dies in der oberen Hälfte auszudrücken: Für das Konzept [BUCH] bietet unser mentales Lexikon verschiedene lexikalische Realisierungen, von denen eines in einer neutralen Verwendungssituation präferiert wird,
204
Cyril Belica/Rainer Perkuhn
nämlich das Wort Buch. Die Stärke der Präferenz sei in den Abbildungen durch die Größe der Schrift ausgedrückt. Analog wird für das Konzept [LESEN] das Wort lesen präferiert. In welcher Form diese Wörter tatsächlich realisiert werden (Wortklasse, Morphologie, Syntax) wollen wir an dieser Stelle nicht betrachten. rezipieren
Druckwerk
Buch
Lektüre
lesen
[BUCH]
verschlingen
[LESEN]
rezipieren
Druckwerk
Lektüre
Buch [BUCH]
lesen
verschlingen
[LESEN]
Abb. 1: Wortwahl für zwei Konzepte separat (oben) und kombiniert (unten)
Das Phänomen der Kollokation wirkt nun, wenn die beiden Wörter nicht für die beiden Konzepte separat im Lexikon nachgeschlagen werden, sondern im Zusammenhang, wie im unteren Bereich der Grafik angedeutet. Unabhängig davon, ob es darum geht, dass z. B. jemand ein Buch liest oder ein gelesenes Buch bewertet wird: Wenn die beiden Konzepte gemeinsam angefragt werden, kommt zum Tragen, dass sich bestimmte Wörter mögen. Nicht ganz so absolut wie in der Regel „wer A sagt, muss auch B sagen“ legt die Wahl des einen Wortes die Wahl des anderen Wortes nahe: Wenn das Wort Buch gewählt wird, sollte das Wort lesen (für die gewünschten entsprechenden Bedeutungskomponenten) hinzukommen – und eventuell andersherum. Diese Kombination der beiden Wörter ist die allgemein übliche. Ein Sprecher, der keine besondere zusätzliche Botschaft verpacken möchte, tut gut daran, sich an die Formulierung zu halten. Abweichungen davon sind zwar durchaus möglich, Hörer werden aber versuchen, diese irgendwie zu deuten. In unserem ersten Beispiel war die kollokative Wirkung noch recht unscheinbar, da sie bei der Wortwahl nur die Kandidaten bestätigt und eventuell ein wenig verstärkt hat, die auch aus den separaten Prozessen hervorgegangen wären. Die Begründung für die Kollokation ist im Grunde dieselbe wie für die Kombination der Konzepte selbst. Es liegt in der Natur eines Buches, gelesen zu werden, und es liegt in der Natur des Lesens, dass dafür etwas Geschriebenes/Gedrucktes vorliegt wie etwa ein Buch. Für manche Erklärungsansätze – wie teilweise bei Meľčuk (1998) – ist dieser Gedanke
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
205
bereits der Schlüssel zum Verständnis für das kollokative Verhalten: Ist man erst in der Lage, die ontologischen Relationen zwischen den Objekten z. B. in Form von Frames (Beschreibungen von Entitäten und deren Rollenbeziehungen zueinander) zu modellieren, lassen sich daraus die Kollokationen ableiten. Wir werden später noch einmal auf Bedeutungen und Bedeutungsbeziehungen zurückkommen (siehe auch Storjohann in diesem Band).
waschen
Gebiss Beißerchen
schrubben
putzen
Knabberleiste
[GEBISS]
Beißerchen
[SAUBER MACHEN]
bürsten
Gebiß
Knabberleiste
bürsten
Zähne
Zähne
[GEBISS]
säubern
waschen
putzen
schrubben
säubern
[SAUBER MACHEN]
Abb. 2: Neugewichtung der Präferenzen aufgrund Kollokativität
Zunächst wollen wir aber mit einem anderen Beispiel illustrieren, dass zumindest für die Perspektive der Sprachproduktion diese Erklärung nicht ausreicht. Solange man separat über sein Gebiss und den Vorgang des Saubermachens nachdenkt, hat man unterschiedlich starke Assoziationen zu verschiedenen lexikalischen Realisierungen. Sobald es aber darum geht, ein menschliches, nicht-künstliches Gebiss sauber zu machen, wird mit einer deutlichen Präferenz die Formulierung Zähne putzen realisiert. Diese Besonderheit kann man nun nicht mehr ausschließlich über die Bedeutung erklären, zumindest liefert diese keinen Hinweis darauf, warum in einer Menge bedeutungsmäßig gleichwertiger Kombinationen nicht alle die gleiche Chance haben, realisiert zu werden. Natürlich spielt die Bedeutung eine große Rolle. Durch sie wird eine Menge von Wörtern ins Spiel gebracht. Welches der Wörter aber den Zuschlag bekommt, das lässt sich ebenso wie die arbiträre Zuordnung von Bedeutungen zu Wörtern in allerletzter Instanz nur über den Usus erklären. Die Sprachgemeinschaft hat sich unausgesprochen darüber geeinigt, dass es nicht Zähne waschen, sondern Zähne putzen heißen soll. Die Präferenz für die Variante hat sich einfach aus der Konventionalisierung des Sprachverhaltens heraus ergeben. Da sich das Sprachverhalten im Laufe der Zeit ändern und nur in Bezug auf eine homogene Sprechergemeinschaft
206
Cyril Belica/Rainer Perkuhn
gedeutet werden kann, kann es durchaus Variationen und Abweichungen bei den Präferenzen in verschiedenen Dimensionen geben.
1.2 Kollokativität bei der Sprachrezeption Dass wir über ein Gespür für Kollokationen verfügen, können wir an uns selbst überprüfen. Wenn wir bestimmte Wörter hören, fallen uns assoziativ spontan andere Wörter ein, die sich zu Kollokationen ergänzen. Hören wir bellen, denken wir an Hund. Zu dem Wort schütter fällt uns Haare ein. Einige der Kollokationen können einen sehr eigenen Charakter haben. Viele lassen sich aber auch auf die zugrunde liegende Bedeutungs- oder Rollenbeziehung zurückführen. Auch wenn – wie wir gesehen haben – die konkrete Wortwahl dem eigenwilligen Usus unterworfen ist, in der Beziehung zueinander sagen beide Wörter etwas über die Bedeutung des anderen aus: Ein Buch ist etwas, das gelesen wird, das aber auch von einem Autor geschrieben wurde, das eine Auflage hat usw. Wenn uns jetzt ein unbekanntes Wort begegnet, von dem ebenfalls gesagt wird, dass man darin lesen kann, und dass es von einem Autor geschrieben wurde, können wir vermuten, dass das unbekannte Wort ein Objekt bezeichnet, das einem Buch ähnlich ist. Vermutlich greifen vergleichbare Mechanismen, wenn während des Spracherwerbs unser mentales Lexikon nach und nach ausgebaut wird. In der Fremdsprachendidaktik ist man von der Idee begeistert, diese Prinzipien, wenn möglich sogar in Selbstlernumgebungen, zu simulieren (vgl. Mukherjee 2002, S. 67). Eine Kollokation alleine sagt nur etwas über einen Aspekt des jeweils anderen Wortes aus. Um ein runderes Bild der Gesamtbedeutung, zumindest aber ein paar weitere wesentliche Aspekte der Verwendung des anderen Wortes zu bekommen, können sich mehrere Kollokationen zu einer Charakterisierung eines Wortes ergänzen. Aus bestimmter Sicht könnte man die Menge der relevanten Kollokationen als Beschreibung der Bedeutung eines Wortes auffassen. Wir werden in Kapitel 4 zeigen, wie dies modelliert und empirisch umgesetzt werden kann.
2 Kollokation sprachtheoretisch Modelle kognitiver Sprachtheorien, die mit eigenständigen Modulen für Syntax, Semantik und Lexikon argumentieren, setzen für den Prozess der Äußerungsplanung einen Zustand an, in dem in eine Satzstruktur Wörter eingesetzt werden, die gemäß Wortklasse und Bedeutung im Lexikon nachgeschlagen werden. Wenn also z. B. inhaltlich vorgesehen ist, von einem menschlichen Wesen auszusagen, dass es feste Nahrung zu sich nimmt, würde sich dies als ein Mensch isst realisieren lassen. Wie wir allerdings oben gezeigt haben, ist die Wortwahl für zwei Komponenten nicht grund-
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
207
sätzlich unabhängig voneinander: Sollte es sich bei dem Wesen um ein Tier handeln, würde man für die Aufnahme fester Nahrung gemeinhin das Verb fressen bevorzugen. Derartige Konstellationen lassen sich noch mit einem gewissen Aufwand dahingehend modellieren, dass die lexikalische Realisierung etwa sogenannten Selektionsrestriktionen (kategoriellen Auswahlbeschränkungen) unterliegt: das Wort fressen sollte nur dann gewählt werden, wenn sich die Aussage nicht auf ein menschliches Wesen bezieht. Mit diesem Erklärungsansatz sind wir aber noch bei dem ersten Teil unserer Beschreibung des Phänomens stehengeblieben (vgl. Abb. 1), bei dem sich die gegenseitige Beeinflussung noch über Bedeutungsbeziehungen erklären lässt. Auch strukturalistisch verankerte Konzepte, die als Vorläufer des Begriffs „Kollokation“ betrachtet werden, zeigen an ihrer Bezeichnung (wie Porzigs „wesenhafte Bedeutungsbeziehungen“ (nach Coseriu 1967)) oder an ihrer Beschreibung, dass sie stark semantisch verhaftet sind: Eine lexikalische Solidarität kann […] als inhaltliche Bestimmung eines Wortes durch eine Klasse, ein Archilexem oder ein Lexem definiert werden, und zwar in der Hinsicht, da[ss] eine bestimmte Klasse, ein bestimmtes Archilexem oder ein bestimmtes Lexem im Inhalt des betreffenden Wortes als unterscheidender Zug funktioniert. (Coseriu 1967, 296)
Wie wir im zweiten Teil der Beschreibung des Phänomens gezeigt haben (vgl. Abb. 2), zeichnen sich Kollokationen auch und gerade dadurch aus, dass sich die lexikalischen Realisierungen gegenseitig beeinflussen. Wollte man dies beschreiben, hätten die Selektionsbeschränkungen die Form „wähle an dieser Stelle das Wort putzen, wenn an anderer Stelle das Wort Zähne gewählt wurde“ – oder einfacher: „Wähle die Wörter Zähne und putzen gemeinsam aus, wenn die entsprechende Bedeutung verbalisiert werden soll“. Spätestens damit muss die Rolle, die das Lexikon in einem Sprachmodell übernimmt, aber auch der Aufbau des Lexikons überdacht werden. Auf irgendeine Weise können für entsprechende Bedeutungsinhalte vorgefertigte Formulierungen, manchmal wird von „prefabricated units“ gesprochen, zur Verfügung gestellt werden. Ein derartiges Lexikon (auch wenn dies nur eine virtuelle Fiktion ist) verbindet nicht einzelne (atomare) Bedeutungen mit einzelnen Wörtern, sondern komplexe Bedeutungen mit Wortkombinationen. Ein Apparat, der mit dieser Art von Information umgehen könnte, käme z. B. aus der Familie der Konstruktionsgrammatiken (Goldberg 1995; Croft 2001), die verschiedene Elemente im Lexikon-Syntax-Kontinuum annehmen. Unsere komplexen Lexikoneinträge entsprächen dort lexikalisierten Konstruktionen. Andere Konstruktionstypen sind über abstrakteren Einheiten formuliert wie etwa Wortklassen, z. B. ‚belebt‘ oder ‚Eigenschaftsbezeichnungen‘. Neben der Bedeutungsbeschreibung enthält eine Konstruktion auch Angaben, wie sie syntaktisch realisiert und eingebettet wird. Konstruktionsbasierte Ansätze verfügen über einen gewissen Charme, da sie – auch gerade mit Blick auf den Spracherwerb (Tomasello 2003) – plausibel erklären können, wie aus dem sprachlichen Erleben heraus musterhafte Verbindungen von Wörtern (unsere Kollokationen), eventuell
208
Cyril Belica/Rainer Perkuhn
aber auch Verbindungen von Wörtern mit Wortklassen angeeignet werden können. Für Verbindungen letzteren Typs hat sich mittlerweile der Begriff der Kolligation etabliert (Hoey 2005). Für ein usage-based model der Aneignung von Kollokationen (und einer Variante von Kolligationen), d. h. ein Modell, das davon ausgeht, dass alles benötigte Wissen aus dem Gebrauch heraus vermittelt wird, haben wir in unserem Projekt eine korpuslinguistische Simulation der empirischen Erhebung dieser Muster entworfen, die wir in Kapitel 4 vorstellen.
3 Kollokation in angewandt-linguistischen Fachdisziplinen Die größte Aufmerksamkeit hat der Begriff in der modernen Sprachwissenschaft in anwendungsbezogenen Gebieten erfahren. Da dabei aus verschiedenen Perspektiven vor allem die Wirkung des Phänomens betrachtet wurde, führte dies zu unterschiedlichen Charakterisierungen und Auslegungen, zur Betonung unterschiedlicher Eigenschaften, die dem Begriff zugeschrieben wurden, auch wenn nur spezifische Ausprägungen des Phänomens als relevant erachtet wurden. Zugeschrieben wird die erste moderne Prägung des Begriffs Harold E. Palmer, der in den 1930er Jahren die englische Sprache in Japan unterrichtete. Bei seiner wissenschaftlichen Auseinandersetzung am Institute for Research in English Teaching erfüllte er mit einem sehr umfassenden Bericht ein Desiderat, das in vorhergehenden Diskussionen als wichtig für die Vermittlung der Fremdsprache erachtet wurde: Der Bericht umfasst im Wesentlichen eine systematisierte Auflistung von Formulierungen, die Palmer als collocations einstuft. Das Aufnahmekriterium in die Liste erklärt er aus der Lernperspektive. All these successions of words have one common characteristic, viz. that (for various, different and overlapping reasons) each one of them must or should be learnt, or is best or most conveniently learnt as an integral whole or independent entity, rather than by the process of piecing together their component parts. (Palmer 1933, S. 4)
Bei der Erarbeitung der Liste konnte sich Palmer auf seine große Belesenheit und sein didaktisches Geschick stützen, empirisch (insbesondere nachvollziehbar) fundiert würde man die Zusammenstellung aus heutiger Sicht aber eher nicht bezeichnen. Das deutsche Pendant „Kollokation“ verbindet man mit Arbeiten von F. J. Hausmann, dessen Ausgangspunkt die Untersuchung deutsch-französischer Übersetzungen war. Dabei hat er festgestellt, dass in der Zielsprache häufig nicht die angemessene (da kollokative) Wortverbindung gewählt wird, sondern eine abweichende, somit häufig ungeeignete. Als Konsequenz leitete er daraus die Notwendigkeit ab, auf
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
209
die Besonderheiten dieser Eigenschaften von Wortverbindungen im Fremdsprachenunterricht einzugehen (Hausmann 1984). Als Mehrworteinheiten, die besondere Aufmerksamkeit verdienen, wurden Kollokationen auch im Kontext der Phraseologie, dabei insbesondere zunächst der Idiomatik betrachtet. Kollokationen haftet nun aber gerade nicht die Idiomen eigene, aus rezeptiver Sicht begrenzte Dekomponierbarkeit an, rezeptiv stellen sie keine große Herausforderung dar, sofern die Bedeutungen der Bestandteile bekannt sind (siehe dazu auch Farø in diesem Band). In all diesen Bereichen wurden vor allem bestimmte Ausprägungen des Phänomens Kollokation wahrgenommen und in den Mittelpunkt gerückt. Die Diskussionen drehten sich dann vor allem um die Eigenschaften, die einerseits für die Auffälligkeit sorgen, die andererseits aber auch dafür verantwortlich sind, dass sie in die üblichen Einteilungen und Ordnungen der jeweiligen Domänen nicht so recht hineinpassen. Die Lexikographie war vorrangig auf die Beschreibung einzelner Wörter ausgerichtet gewesen. Auch die Fremdsprachendidaktik und die Übersetzungswissenschaften hatten sich stark an einzelnen Wörtern isoliert orientiert und sich für die Kombinierbarkeit auf grammatische Zusammenhänge berufen. Als gewissermaßen minimale Abweichung dieser Traditionen wurden Kollokationen bei Hausmann dann anfänglich auch nur als zweistellige Relationen eingeführt. Eine angenommene, „natürliche Formulierungsabfolge“ (Hausmann 2007, 218) legt dann nahe, dass es einen dominanten Teil des Gefüges gibt und einen quasi abhängigen. Hausmann nennt diese Basis und Kollokator. Mit der Annahme, dass man sich bei der Sprachproduktion stets zuerst für das Objekt entscheidet, legitimiert er, dass jeweils die Substantive die Basen ausmachen. Entsprechende Adjektive, die Eigenschaften der Objekte ausdrücken, oder Verben, die umschreiben, was mit dem Objekt gemacht wird, sind Kollokatoren. Die Einschränkung, Kollokation sei eine nur zweistellige Relation, wird mittlerweile so nicht mehr vorgenommen. Die Charakterisierung über die Abhängigkeit, insbesondere der Zuordnung zu Wortklassen ist stark überlagert von der Annahme einer Modularisierung und Serialisierbarkeit des Sprachproduktionsprozesses. Sie ist für Substantiv-Adjektiv-Verbindungen durchaus plausibel. Bei den SubstantivVerb-Kombinationen sind die eher überzeugenden Beispiele Funktionsverbgefüge (Versprechen geben anstelle versprechen), bei denen Verben kaum Bedeutung tragen. Bei anderen drückt Hausmanns Frage „was kann man mit X machen?“ nicht wirklich das Interesse eines Nachschlagenden aus, da man das, was man mit X macht, vorher schon in seine Planung der Sprachproduktion einbezogen hat und nur noch ein passendes Wort dafür finden möchte. Die Auswahl aus einer Reihe von Kollokationen ist nur dann möglich, wenn die Bedeutungen der Einzelwörter bekannt ist, sie ist aber auch nur dann relevant, wenn dabei etwas anderes herauskommt, als wenn die Wörter getrennt voneinander für die Einzelbedeutungen gewählt werden. Insofern sind aus dieser Perspektive eher die Fälle von Mehrworterzeugung interessant, wie wir sie in Abbildung 2 gezeigt haben. Diese besonderen Fälle, in denen nicht das Wort gewählt wird, das einem kontextfrei zu einer gegebenen Bedeutung einfällt,
210
Cyril Belica/Rainer Perkuhn
sondern ein abweichendes, müssen explizit im Fremdsprachenunterricht vermittelt und für Übersetzungen berücksichtigt werden. Für die übrigen ‚normalen‘ Fälle ergibt sich diese Notwendigkeit nicht, da die Formulierung bereits über Kenntnis der kontextfreien Wortwahl und syntaktische Fertigkeiten bildbar ist; Wortschatz- und Satzbaukenntnisse sind getrennt voneinander vermittelbar und in der Übersetzung anwendbar. Vermutlich gibt es aber noch wesentlich mehr potentielle Einflussfaktoren auf die Wortwahl als nur die Wahl des anderen Wortes. Die präferierten, auch isoliert gewählten Wörter, wie wir sie in den Abbildungen 1 und 2 vereinfacht illustriert haben, hängen eventuell ab von der Zeit, dem Register oder weiteren Faktoren. Wenn z. B. Unternehmen früher ihre Ziele „über-/vermitteln“ wollten, gab es dafür das Wort vermitteln; heutzutage spricht man von Ziele kommunizieren. In aktueller Unternehmenssprache mag die Verbindung unauffällig komponiert werden können, für die Allgemeinsprache gilt sicher nicht, dass kommunizieren zumal mit dieser Valenz die erste Wahl für ein Vermitteln darstellt. Dass diese Bildung womöglich in Anlehnung an das englische Pendant übernommen wurde, zeigt auch, dass sich die Parallelität zwischen Wortwahlpräferenzstrukturen der verschiedenen Sprachen verschieben kann. ital. franz. engl. schwed. niederl.
lavarsi (waschen) i denti laver (waschen) / brosser (bürsten) les dents brush (bürsten) one’s teeth borsta (bürsten / putzen) tänderna poetsen (putzen) tanden
Abb. 3: Übersetzungen von Zähne putzen mit jeweiligen Entsprechungen
Die Abweichungen zwischen diesen Präferenzen bei verschiedenen Sprachen werden gerne als intuitiv illustrierende Erklärung der Besonderheit von Kollokationen verwendet, wie z. B. das berühmte Beispiel Zähne putzen im Vergleich mit den französischen und englischen Übersetzungen zeigt. Betrachtet man jedoch verschiedene Kontrastsprachen (vgl. Abb. 3), so fällt auf, dass bei manchen die Auffälligkeit des Kollokativen gar nicht so sehr ins Gewicht fällt wie z. B. beim Niederländischen. Insbesondere wenn die Kontrastsprachen noch untereinander verglichen werden, erkennt man neben Übersetzungsentsprechungen Übersetzungsalternativen (ital. oder engl. zu franz.) und Zielsprachenalternativen (schwed. zu dt.). Sicher bewirkt der hohe Grad an Verwandtschaft zwischen den Sprachen eine relativ enge Parallelität der Übersetzungen. Ein Vergleich mit weniger verwandten Sprachen wäre dahingehend aufschlussreich, inwieweit Formulierungen sich aus deren Sicht als systematisch kollokativ auffällig herausstellen. Für unseren Gedankengang reicht aber bereits die Erkenntnis, dass die Besonderheit bestimmter Kollokationen sich nur relativ zu bestimmten Sprachpaaren zeigt.
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
Übersetzungsäquivalent zu
in L2 ungewöhnlicher Wahl
in L2 gewöhnlicher Wahl
in L1 ungewöhnliche Wahl
evtl. unauffällig (obwohl in beiden Sprachen kollokativ)
nur im Kontrast zu L1 und zu L2-Synonymen auffällig (falls schon bekannt)
in L1 gewöhnliche Wahl
für L2 zu lernende Kollokation
unauffällig (in keiner Sprache kollokativ)
211
Abb. 4: Kollokativität relativ zu Übersetzungsäquivalenz
Für einen Begriff einer Kollokation stehen nun verschiedene Versuche einer Charakterisierung im Raum. Eine erste, sehr allgemeine besagt, dass Kollokation für die Präferenz der Wahl mehrerer Wörter in Kombination steht – unabhängig davon, ob die Wahl genauso ausgefallen wäre, wenn die Wörter nicht in Kombination gewählt worden wären. Letztere Abgrenzung wäre für eine Einengung des Begriffs allerdings nur bedingt brauchbar. Auch eine Betrachtung von Übersetzungsabweichungen in diesem Sinne ist kein brauchbares Kriterium, da sowohl die Wortwahlpräferenzen in den jeweiligen Sprachen als auch die Äquivalenzpräferenz bei den jeweiligen Übersetzungen die Auffälligkeit einer Kollokation überlagern können. Für einen Niederländer wäre z. B. das deutsche Zähne putzen keine Kollokation, da sich die Übersetzungen entsprechen. Für einen Engländer ist das französische laver les dents nur dann auffällig in der Übersetzung, wenn diese Formulierung im Vergleich zu brosser les dents die französisch-interne präferierte Wortwahl für den Vorgang ist. Eine vorrangig kon trastsprachliche Motivation des Begriffs Kollokation erfordert eine deutlich andere Handhabung als eine sprachinterne. Entsprechende Dokumentationen müssten sprachpaarspezifisch gestaltet werden und die in diesem Artikel stärker betonten sprachinternen Betrachtungen um Untersuchungen der Kontrastsprache und der Übersetzungsäquivalente ergänzen. Eine sprachinterne Auseinandersetzung mit dem Begriff, insbesondere der Versuch der Charakterisierung der Auffälligkeit muss jedoch einen Umstand hinterfragen, der bei der Diskussion des Themas – so auch in den einleitenden Absätzen dieses Artikels – stark vereinfacht dargestellt wird: Um feststellen zu können, ob sich die Wahl der Wörter in Kombination von der isolierten Wahl unterscheidet, müsste man auch für die isolierte Wahl berücksichtigen, dass viele verschiedene Faktoren darauf Einfluss nehmen. Bereits in der künstlich reduzierten Situation der Objektbenennung ist, wie wir oben angerissen haben, das Ergebnis kaum vorhersagbar. Bei einer komplexeren Sprachproduktion kommen viele weitere Aspekte hinzu. Auch für das Beispiel 1 (vgl. Abb. 1), das wir bisher so dargestellt haben, als ob zwangsläufig die Wörter Buch lesen gewählt werden, sind alternative Formulierungen möglich. In gehobener akademischer Sprache würde man sich eventuell dazu entscheiden, ein Buch oder ein Werk zu rezipieren, umgangssprachlich kann man auch in einem Buch schmökern. Wird noch eine Wertung mit in den Aus-
212
Cyril Belica/Rainer Perkuhn
druck hineingenommen, kann dies dazu führen, dass man ein Buch (oder vielleicht einen (dicken) Schinken) verschlingt. Die These, dass derartige Formulierungen (wie Buch lesen) unauffällige Kollokationen sind oder – da kompositionell bildbar – keine Kollokationen im engeren Sinne sind, bedürfte eines Konzepts von standardsprachlich und/oder standard-situationell. Theoretisch könnten alle Varianten vorhergesagt werden, wenn alle Entstehungsbedingungen in entsprechenden Merkmalsstrukturen erfasst werden könnten. Inwieweit diese Bestrebungen plausibel und tragfähig sind, soll hier nicht diskutiert werden. Zweifel sind allerdings angebracht, da Kollokationen sicher auch aus Fachsprachen, Registern und Genres heraus entstehen und sich zumindest in der Phase des Übergangs in den allgemeinsprachlichen Gebrauch kaum entsprechend klassifizieren lassen. Je nachdem, wie der Begriff Kollokation nun ausgelegt werden soll und ob brauchbare Kriterien zur Verfügung stehen, um ggf. eine entsprechende Einordnung vorzunehmen, stellt es eine Herausforderung dar, die Kandidaten zu erfassen und für eine lexikographische Beschreibung und eine didaktische Verwendung aufzubereiten. Die Diskussionen dazu behandelten bisher die Fragen, ob Kollokationen separat oder in welcher Beziehung sie zu den Einträgen ihrer Elemente dokumentiert werden sollten. Ein eigenes, lexikographisch aufbereitetes Kollokationswörterbuch für die deutsche Sprache wird immer noch als Desiderat gesehen. Solange die Informationen noch in Einwortlemma-Wörterbüchern gebucht werden, wird angestrebt, zumindest die auffälligen Kollokationen in einem eigenen Unterpunkt hervorzuheben. Da aber die Auffälligkeit schwierig zu bewerten ist, ist nicht besonders überraschend, dass auch in der bisherigen Tradition viele Wortartikel bereits kollokationsähnliche Angaben in Form kurzer Formulierungsbeispiele enthalten, allerdings ohne diese besonders zu kennzeichnen oder ihre Auswahl zu legitimieren. Die ausführliche Auseinandersetzung mit der Frage, unter welchem Stichwort eine Kollokation zu buchen ist – und in diesem Zusammenhang zum Teil auch die Frage nach Basis- oder Kollokator-Status – ist wohl dem Anspruch geschuldet, die Information nur einmal angeben zu wollen. In Zeiten, in denen der Umfang eines gedruckten Werkes vorgegeben war, war dies noch plausibel. Heutzutage spricht aber nichts dagegen, eine Kollokation notfalls bei jedem beteiligten Wort anzuführen, zumindest aber eine Nachschlage‑/Recherchemöglichkeit über jedes der beteiligten Wörter anzubieten, die dann zu der Beschreibung verweist. Inwieweit sich neue Wege einer Mehrwortlexikographie abzeichnen, ist noch nicht abzusehen. Als Mehrworteinheiten sind Kollokationen auch in den Fokus der traditionellen Mehrwortforschung geraten. Vielleicht liegt es u. a. an den Wortbildungsmöglichkeiten, die die deutsche Sprache bietet, dass für andere Sprachen wie z. B. für das Englische (mit etwa nominal compounds und phrasal verbs) der Blick schon früher weiter gefasst wurde. Der Schwerpunkt für die Betrachtung deutschsprachiger Kollokationen stellt der Vergleich mit Idiomen dar: Idiome (Sprichwörter, Redewendungen u. Ä.) bedeuten eine Herausforderung für Sprachenlerner nicht nur aus produktiver, sondern vor allem auch aus rezeptiver Sicht – obwohl eventuell alle Bestandteile
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
213
bekannt sind, erschließt sich der Sinn der Mehrworteinheit nicht, da sie als ganzes eine oft übertragene Bedeutung besitzt. Kollokationen hingegen sind rezeptiv transparent; wenn die Bedeutung der Bestandteile bekannt ist, lässt sich daraus die Bedeutung der Phrase konstruieren. Um ungewollt keine ungewöhnlichen Formulierungen zu konstruieren, ist jedoch die Kenntnis des usuellen Zusammenspiels der Wörter erforderlich. Nebenbei bemerkt schadet diese Kenntnis auch nicht, wenn vermeintlich unauffällige Kollokationen gebildet werden. Da Wörter sowieso in üblichen Sinnzusammenhängen vermittelt werden sollten, ist es unerheblich, ob eine (kollokative) Verbindung aufgrund ihrer Bedeutung transparent (vgl. Abb. 1) oder aufgrund eines speziellen Usus nicht unbedingt vorhersagbar (vgl. Abb. 2) gebildet wird. Kollokationen sind Mehrworteinheiten, die sich durch usuellen Gebrauch konventionell verfestigt haben. Auch wenn sie hinsichtlich konkreter Wortformen und Wortstellung gewisse Variationen zulassen, weisen sie in ihrem strukturellen Kern doch eine gewisse Festigkeit auf. Dies haben sie weitestgehend mit den Idiomen gemein. Die (mehr oder minder) hohe Festigkeit erlaubt und begünstigt nun auch bei Kollokationen, dass Teile der Formulierung im übertragenen Sinne gebraucht werden, wie wir bereits an dem Beispiel ein Buch verschlingen gesehen haben. Dabei wird ein Wort metaphorisch verwendet, die gesamte Konstruktion als teilidiomatisch eingeordnet. Selbst wenn dies für mehrere oder sogar alle beteiligten Wörter zutrifft, unterscheidet sich auch eine nahezu vollidiomatische Kollokation von einem echten Idiom darin, dass sie beim Verstehensprozess sinnvoll in ihre Bestandteile zerlegt werden kann. Die Metaphorik kann dann für jeden Bestandteil getrennt aufgelöst werden. Idiome hingegen lassen sich aufgrund der zusätzlichen Übertragung nicht dekompositionell erschließen. In dem Modell der Sprachproduktion finden sich für ein Idiom nicht mehrere Konzepte, für die getrennt oder kombiniert Wörter gewählt werden. Die Aussage wird in ihrer Gesamtheit sowohl konzeptionell als auch lexikalisch auf einen Schlag aktiviert. Dass auch hierbei mit Variationen gespielt werden kann, macht die Einteilung in eine der beiden Gruppen nicht gerade leichter. Aus einer gewissen Sicht sind sowohl Kollokationen als auch Idiome Wortverbindungen, die sich aufgrund einer gewachsenen Usualität verfestigt haben und sich bei der Sprachproduktion nicht – oder zumindest nicht allein – durch die Zusammensetzung der Bedeutungen der Bestandteile motivieren lassen. Wir werden dieses Kriterium weiter ausbauen, wohl wissend, dass wir dabei in Kauf nehmen, dass es keine harten Indikatoren gibt, zwischen den beiden Gruppen zu unterscheiden. Diese Einteilung müssen wir einer individuellen Bewertung überlassen.
Cyril Belica/Rainer Perkuhn
lern-methodisch plausibler Zugang
Wortformen Kookkurrenz syntagmatische Muster empirischer Zugang
Anwendung: Übersetzung Didaktik
Reduktion
Beschreibung: Lexikografie
Abstraktion beobachtbarer Sprachgebrauch: rekurrent/usuell
Emergenz
individuell: kognitiv
kollektiv: konventionell
kompakte Form intuitiver Zugang
Le Pa mm ra a di gm a
214
Wahrnehmung Assoziation Generalisierung introspektiver Zugang
Abb. 5: Der Kollokationsbegriff in verschiedenen Domänen
In Abbildung 5 haben wir versucht, dass Phänomen „Kollokation“ zu der bisherigen Auseinandersetzung mit dem In-Erscheinung-Treten und Deuten des Phänomens in verschiedenen angewandten Disziplinen in Beziehung zu setzen. In den etablierten Domänen etwa der Lexikographie oder der Didaktik hat man sich auf die Aspekte von Kollokationen konzentriert, die im Vergleich zum bereits erreichten Stand der Disziplin eine zusätzliche Herausforderung darstellen (vgl. dazu auch die Darstellungen von Hausmann (2004, 2007); Steyer (2008) und Haß in diesem Band). Über die individuelle Verankerung des Phänomens lässt sich leider bisher noch nicht viel aussagen (vgl. aber Ellis u. a. 2009; Ellis/Frey 2009); die Kraft des Kollektivs haben wir bisher nur an wenigen Stellen andeuten können. Die Ebene, auf der wir weiter argumentieren wollen, ist die des beobachtbaren Sprachgebrauchs.
4 Kollokation als emergentes Phänomen und seine korpuslinguistische Modellierung Wenn wir davon ausgehen, dass Kollokationen Wortverbindungen sind, die sich eventuell nur bis zu einem gewissen Grad über die Bedeutung der beteiligten Wörter und über grammatische Kompositionsprinzipien erklären lassen, so brauchen wir doch eine Erklärung dafür, warum sie trotz vermeintlicher Beliebigkeit doch eine so hohe Festigkeit aufweisen. Die Wahl der Wörter ist nicht so frei, wie sie laut herkömmlichen generativen Theorien sein müsste, sondern geschieht ganzheitlich auf einen Schlag wie etwa bei Idiomen (open choice principle vs. idiom principle, vgl. Sinclair 1991). Trotzdem erscheint es nicht sinnvoll, Kollokationen ausschließlich monolithisch zu behandeln, als ob sie nur ein Element, eine Gestalt, wären. Dagegen spricht, dass sie prinzipiell dekomponierbar sind und beim Verstehensprozess bei Bedarf dekom-
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
215
poniert werden können. Kollokationen stehen nicht im Widerspruch zu einer bedeutungsgemäßen Zusammenfügung, im Gegenteil: Sie bestätigen diese und drücken ergänzend die präferierte kombinierte Wortwahl aus – unabhängig davon, ob diese auffällig ist oder nicht. Sie nur als ganzheitlich zu betrachten, hieße, dass Kollokationen wie [sich die] Zähne putzen, [mit den] Zähne[n] beißen, ausgeschlagene Zähne, gesunde Zähne oder [mit den] Zähne[n] knirschen voneinander unabhängige Entitäten wären, die wir nicht zueinander in Bezug setzen. Es spricht aber viel dafür, dass wir durchaus dazu in der Lage sind. Da wir beim (Erst-)Spracherwerb selten externe Quellen zu Rate ziehen, um die Bedeutung eines Wortes zu klären, lässt sich vermuten, dass es gerade diese Reihen bildenden, präferierten typischen Formulierungen sind, aus denen wir unser Wissen über die Wortbedeutung ableiten. Wie Kollokationen genau charakterisiert werden können und wie wir sie als Muttersprachler erfassen, darüber können wir vorläufig nur spekulieren. Im vorherigen Kapitel haben wir argumentiert, dass die kontrastsprachliche Perspektive weder hinreichende noch notwendige Kriterien liefert. Die binnensprachliche differenzierende Betrachtung müsste viele weitere Faktoren der Sprachproduktionssituation miteinbeziehen und ließe sich trotzdem nur mühsam überprüfbar gestalten. Ein aussichtsreicher Ansatz ist jedoch, Kollokation als emergentes Phänomen zu verstehen. Die Regelmäßigkeit im Sprachgebrauch, sprich: in den sprachlichen Daten, denen wir beim Spracherwerb und auch beim späteren Spracherleben ausgesetzt sind, liefert uns den Hinweis darauf, inwieweit eine Kombination eines Wortes mit anderen Wörtern im Vergleich zu anderen die präferierte, typische Formulierung ist. Die Fügungen, die kollokativ sind, treten uns emergent aus den Daten entgegen (vgl. Hopper 1987). Der Sprachinput, dem ein Individuum ausgesetzt ist, hat vermutlich einen unterschiedlichen Wirkungsgrad in Abhängigkeit davon, in welcher Phase des Spracherwerbs es diesen erlebt hat. Von einer derartigen Modellierung von Sprachdaten, die eine individuelle ontogenetische Sprachentwicklung berücksichtigen, sind wir noch weit entfernt. Bis zu einem gewissen Punkt können wir uns aber mit Sammlungen von Sprachdaten behelfen, die eine Bestandsaufnahme des Sprachgebrauchs vieler Sprecher über einen bestimmten Zeitraum darstellen. Damit gehen wir zwar für eine Simulation des Spracherwerbs zu grob vor, nähern uns aber gleichzeitig eventuell einem überindividuellen Konzept von Kollokation, das in der Sprechergemeinschaft viral wirkt. Die vermeintliche Arbitrarität des Kollokativen ist genauso wie bei einer isolierten Einwortbenennung gedeckelt durch den Wunsch eines Sprechenden, ohne besondere Markierung genau dasselbe auszudrücken wie seine Vorgänger. Die Verbindungen bei der Wahl mehrerer Wörter haben sich durch konventionalisierten Gebrauch usuell verfestigt. Das soll aber nun gerade nicht heißen, dass die Formulierungen papageienhaft nachgeplappert werden. Vielmehr werden wichtige Elemente der Fügung aufgegriffen und eventuell auch mit leichter Variation in neue Aussagen eingebettet (z. B. Ich putze Dir die Zähne. – Putz Dir die Zähne! – Putzt euch die Zähne!).
216
Cyril Belica/Rainer Perkuhn
4.1 Empirische Verankerung von Kollokationen Konventionalisierung in der Sprache ist allerdings ein Prozess, der sich über mehrere Ereignisse hinzieht, und von Verfestigung kann man erst dann sprechen, wenn dies über eine entsprechend hohe Zahl von Ereignissen bestätigt wird. Diese Zahl kann man in Daten des beobachteten Sprachgebrauchs messen. Ein einfacher Ansatz für die Ermittlung von Kollokationen wäre also, in Sammlungen von Sprachdaten, z. B. in sogenannten Korpora, die Wiederholungen von Formulierungen zu zählen. In den korpuslinguistischen Anfängen hat man den Begriff „Formulierung“ zunächst als Wortformensequenz ausgelegt, beginnend mit Zweiwortfolgen, den sogenannten Bigrammen. Diese wurden später zu längeren Folgen (n-Grammen) erweitert und es wurden auch Abstände zwischen den betrachteten Wortformen miteinbezogen, wobei man trotzdem noch lange Zeit an einer positionellen Gebundenheit festgehalten hat. Bei der Betrachtung des Gesamtbestandes aller häufigen Wortfolgen fällt auf, dass der erste Abschnitt dominiert wird von Folgen, die Wörter enthalten, die für sich betrachtet schon sehr häufig sind; meist handelt es sich dabei um sogenannte Funktionswörter (etwa im engl. in the, im dt. in der). Diese Dominanz ist aufgrund der hohen Häufigkeiten der beteiligten Wörter erwartbar und für bestimmte positionelle Relationen als Abbild einer üblichen Wort-(Klassen-)Reihung vollkommen plausibel. Sofern man die Bigramme zu einem bestimmten Wort, vor allem zu einem Inhaltswort, betrachtet, können diese Informationen durchaus hilfreich sein, etwa für die präpositionale Einbettung eines Verbs oder eines Substantivs. Aber auch seltenere Kombinationen können durchaus interessant sein, vor allem für die Fragestellung, welche Fügungen besonders typisch sind – gerade auch im Vergleich verschiedener quasi-synonymer Formulierungsalternativen. Für unser Beispiel hieße das, die typischste Verbindung für den Vorgang des „Zähne-sauber-Machens“ (und „Buch-Lesens“) aufzuspüren. Für die Bewertung der Typikalität wurden und werden verschiedene statistische Maße diskutiert (s. u. a. Dunning 1993). Ihre Eignung lässt sich aber kaum universell einordnen; zu sehr hängt die Plausibilität von der jeweiligen Sprache, Eigenschaften der Datengrundlage, insbesondere ihrer Größe, und der jeweiligen Fragestellung ab. Ansatzweise kann man dieser Herausforderung durch parametrisierbare Verfahren begegnen, wie z. B. durch das Kookkurrenzanalyseverfahren, das am IDS entwickelt wurde (Belica 1995). Dieses Verfahren verzichtet auf möglichst viele Annahmen, die einen Kollokationsbegriff einschränken und die die Analyse von kategoriellen Einschätzungen abhängig macht. Einzig das primär beobachtbare lexikalische Material soll den Ausschlag geben, welche usuellen Wortverbindungen ermittelt werden. Die Operationalisierung der Methode ist in das öffentlich zugängliche Korpusrecherchesystem Cosmas II (Bodmer 2004, IDS 2014b) integriert, um u. a. die Daten des Deutschen Referenzkorpus (Institut für Deutsche Sprache 2014a) analysieren zu können; Ergebnisse von Analysen auf einem reflektiert daraus zusammengestellten Subkorpus sind in der Kookkurrenzdatenbank CCDB (Belica 2007; Keibel/Belica 2007) abge-
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
217
legt, die als Denk- und Experimentierplattform auch weitere Einblicke in methodische Auswertungen des Kookkurrenzverhaltens aufzeigt. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx Zähne putzen xxx xx xxxxxx xxx, xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx Zähne xx putzen xxx xx xxxxx, xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx putzen xxx Zähne xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx, xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx Zähne xxxxx putzen xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx, xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx Zähne xx putzen xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx, xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx Zähne putzen xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx. xxx xxx xx xxxxxx xxx xx xxxxx, xxxx xxxx xx xxxxxx. xxx Zähne xxxx putzen xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx xxx xxx xx xxxxxx xxx xx xxxxx xxxx xxxx xx xxxxxx.
Zähne • putzen
Abb. 6: Emergenz von Kollokation bedingt durch systematische Wiederholung
Das Verfahren verzichtet u. a. auch auf die Annahme einer positionellen Gebundenheit der Elemente einer Kollokation. Diese Einschränkung fällt für die deutsche Sprache aufgrund der freieren Wortstellung wesentlich mehr ins Gewicht als für die englische, für deren Analyse diese Lockerung erst sehr spät in Verfahren umgesetzt wurde (Cheng/Greaves/Warren 2006). Für das Deutsche steht zu vermuten, dass auch Ereignisse mit unterschiedlicher positioneller Realisierung zu der Emergenz von Kollokationen beitragen, wie wir es in Abb. 6 angedeutet haben. Um diese Freiheitsgrade zu berücksichtigen, arbeitet das Verfahren mit Textfenstern, die um eines der Wörter herum definiert werden können. Der Preis dafür ist allerdings, dass bei großen Fenstern das Überschreiten von Satzgrenzen Einfluss auf das Analyseergebnis haben kann. Das genannte Verfahren bietet die Möglichkeit, diesen Einfluss zu kontrollieren. Des Weiteren verstärkt sich der Effekt der häufigen Wörter: Je größer das Textfenster wird, desto stärker steigt die Wahrscheinlichkeit, dass ein häufiges Wort darin beobachtet wird – und dies liegt dann nicht mehr unbedingt an einer lokalen Bindung an das Nachbarwort (wie bei den Bigrammen), sondern das Wort kann rein zufällig über lokale Bindungsgrenzen hinweg in den Textausschnitt gerutscht sein. Da gerade Funktionswörter aufgrund der Phrasen-(binnen-)strukturen und -verkettungen in einem fast vorhersagbaren Rhythmus auftauchen, bietet das Verfahren optional an, diese Klasse von Wörtern aus der Betrachtung herauszunehmen.
218
Cyril Belica/Rainer Perkuhn
Für das Deutsche stellt es eine zusätzliche Herausforderung dar, die empirisch zugängliche Ebene mit der Form, mit der wir Kollokationen benennen, zu verbinden. In den bisherigen Beispielen wurden überwiegend zumindest teilweise kanonische Formen angegeben, wie sie auch bei der lexikographischen Aufbereitung üblich sind. Das Verb erscheint im Infinitiv, das Substantiv in unserem Standardbeispiel aber interessanterweise in einer flektierten Form, dem Plural Zähne. Die in Abb. 6 angedeuteten Formen sehen zwar oberflächlich nach dem Infinitiv aus, könnten, aber genauso gut die synkretischen Formen (1./3. Pers. Plural) sein. Ob der Mensch beim Erwerb des Kombinationswissens diese Formen bereits auseinanderhalten kann oder sich die Differenzierung erst aus diesem ergibt, lässt sich nicht so einfach klären. Zu vermuten ist jedoch, dass ein beim Spracherwerb entwickelter Lemmabegriff einander ähnliche Realisierungen von Fügungen zueinander in Beziehung setzt, indem sie alle auf eine kanonische Grundform bezogen verstanden werden. Neben der genannten Form werden wir sicher Varianten erlebt haben, wie z. B. Putz dir die Zähne! oder Hast du dir die Zähne geputzt?, ebenso auffällige Kombinationen, wie sich mit entsprechenden Daten empirisch überprüfen lässt. Eine Variation auf Seiten des Substantivs findet sich nur bei der speziellen Wendung Zahn um Zahn geputzt. Auch wenn die Ebene der (eventuell flektierten) Wortformen vermutlich den zuverlässigsten Zugang zu beobachtbaren Auffälligkeiten bietet, zeigen auch Analysen zu einem Bezugswortlemma plausible Ergebnisse. Sie lassen sich gewissermaßen über unser parallel erworbenes Lemmatisierungswissen rechtfertigen, führen vor allem aber auch zu kompakteren und somit übersichtlicheren Kollokationsübersichten, die vom Morphologischen zum Inhaltlichen hin abstrahieren – ganz im Sinne einer kognitiven Ökonomie. Die Betrachtung der Umgebungswörter in einem definierbaren Kontextfenster ermöglicht nicht nur positionell ungebunden, Zweiwortfolgen aufzuspüren, sondern auch längere Mehrworteinheiten im Blick zu haben. Dazu bewertet das Verfahren, ob die Häufigkeit eines Wortes in der Umgebung des Bezugswortes oder in dem Kontext einer bereits erkannten kürzeren Mehrwortkombination höher ist als sie laut zufälliger Verteilung sein dürfte. Diese Auswertung wiederholt sich solange, bis bei keiner erkannten Mehrworteinheit Auffälligkeiten mehr zu verzeichnen sind. Je nach Erkenntnisinteresse kann es durchaus schwierig sein, die sinnvollste Größe des Kontextfensters abzuschätzen. Kontexte von acht Wörtern um ein Bezugswort herum (vier davor, vier danach) haben sich vor allem für lexikalisch-lexikographische Untersuchungen des Englischen als sehr ertragreich herausgestellt (Sinclair u. a. 1970 nach Sinclair 1991, 106). Für andere Fragestellungen können auch durchaus größere Kontexte von Interesse sein, wie etwa bei Betrachtungen zur rhetorisch-argumentativen Struktur. Bis auf wenige Ausnahmen, im Deutschen z. B. die Präverbfügungen, ist der Einfluss der unterschwellig lexikalisch-semantisch motivierten Anziehungskraft aber auf einen engeren Kontext begrenzt. Für die Kollokationen im klassischen Hausmann’schen Sinne reichen Betrachtungen der unmittelbaren Umgebung, also nur ein Wort davor bzw. danach. Ein ebenfalls oft genanntes Beispiel ist in dem Zusammenhang die Beziehung zwischen den Wörtern Haar und blond. Aus lexiko-
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
219
graphisch-komprimierend-kanonischer Sicht kommt die Formulierung blondes Haar als Quasi-Nennform leicht über die Lippen, vermutlich gestützt durch das Gefühl, dass tatsächlich verschiedene Formen der beteiligten Paradigmen üblicherweise miteinander genannt werden. Die empirische Überprüfung anhand unserer Korpusdaten belegt, dass mehrere Varianten als (in unserem Sinne) kollokative Wortverbindung erkannt werden: Sowohl blondes Haar als auch blonde Haare sind übliche Formulierungen. Es wäre vollkommen plausibel, die flektierten, attributiv gebrauchten Adjektive auf der Position vor dem Substantiv zu erwarten, den Kontext entsprechend klein zu wählen und aus den ermittelten Kookkurrenzen eine geeignete als Nennform auszuwählen. Bei anderen Beispielen wäre es vielleicht sinnvoller, zwischen mehreren Nennformen zu differenzieren. Die Beschreibung zu der Kollokation Auge und blau sollte vermutlich zwischen dem Singular und dem Plural unterscheiden. Was aber bei dem Beispiel davor noch besonders stark auffällt, ist, dass die flektierten Formen auch und besonders in größeren Kontexten und dabei auch die nicht-flektierte Form auffällig oft zu verzeichnen sind. Es mag bis zu einem gewissen Grad der Zusammensetzung unserer Daten geschuldet sein, aber wir halten es auch sonst für nicht unüblich, dass zur Beschreibung der Haare einer Person neben der Farbe auch andere Attribute wie die Länge eingeschoben werden. Die nicht-flektierte Form erscheint nicht nur im prädikativen Gebrauch, sondern auch in der komplexeren Fügung blond gefärbt(e), die wiederum in Gänze vor dem Substantiv attributiv oder nach dem Substantiv prädikativ Verwendung findet. Für beide Fälle muss man sich eingestehen, dass man doch nicht so recht vorausahnen kann, auf welche Positionen sich die Analyse konzentrieren soll. Das Verfahren zur Kookkurrenzanalyse bietet hierfür die Möglichkeit, zwar einen Kontext zu definieren, aber diesen nur als Maximalwert für alle denkbaren zusammenhängenden Unterabschnitte auslegen zu lassen. Der sogenannte Autofokus bewertet daraufhin alle diese Positionsspannen und liefert die Grenzen des Intervalls mit dem höchsten Auffälligkeitswert als zusätzliche Information des Analyseergebnisses.
220
Cyril Belica/Rainer Perkuhn
Kookkurrenzprofil zu Lemma Haar
Autofokus
LLR
Partnerwörter primär/weitere
Häufigkeit
–1
–1
19942 blonden schulterlangen blauen
–1
–1
19942 blonden schulterlangen
45
–1
–1
19942 blonden blauen
81
–1
–1
19942 blonden
–3
–1
14575 blonde schulterlange
64
–3
–1
14575 blonde blaue
91
–3
–1
14575 blonde
–2
–1
11271
blondes kurzes schulterlanges
–2
–1
11271
blondes kurzes
115
–2
–1
11271
blondes schulterlanges
62
–2
–1
11271
blondes langes
–2
–1
11271
blondes
–4
5
4477
blond gefärbte
–4
5
4477
blond
1
1568
…
1331
… 1
92 780
… 43 507
Abb. 7: Selektierte Kookkurrenzcluster zum Lemma Haar
In Abb. 7 haben wir aus dem Gesamtkookkurrenzverhalten des Lemmas Haar, aus seinem Kookkurrenzprofil, die Angaben zu den Wortformen des Lemmas blond ausgewählt und zusammengestellt: Die flektierten Formen zeigen eine enge linksseitige Bindung, die aber durchaus über die erste benachbarte Position hinausgeht; die unflektierte Form ist jedoch fast über den maximal eingestellten Kontext verteilt. Das, was wir empirisch beobachten und analysieren können, lässt sich nicht so leicht auf etwas abbilden, mit dem wir eine kommunizierbare Kollokation bezeichnen und das wir als Ausgangspunkt seiner Beschreibung verankern können. Aus verschiedenen Gründen gehen wir zwar meistens von einem Lemma als Bezugswort aus, aber nicht in allen Fällen ist auch die Lemmatisierung der Partnerwörter angebracht. In der korpuslinguistischen Modellierung der Kookkurrenzanalyse wird genau genommen auch nicht mit einem echten Lemma bei dieser Option gearbeitet, sondern nur mit einem Ausschnitt aus dem Paradigma: Es werden nur die Wortformen betrachtet und zusammengefasst, die als auffällig erkannt wurden. Je nach Fall kann dies eine einzige Wortform, einige wenige oder sogar tatsächlich das gesamte Paradigma sein. Bei der Angabe innerhalb der Partnerwortaufzählung wird als Nennform auf das Lemma zurückgegriffen. Für den nächsten Gedankenschritt ist diese Form einer aggregierenden Analyse aber ausgeklammert. Ohne die Varianz bei den Partnerwör-
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
221
tern haben wir aber immer noch zwei Quellen, in denen sich die konkreten textuellen Realisierungen, die zu einer Kookkurrenz geführt haben, voneinander unterscheiden können. Zum einen haben wir eventuell unterschiedliche Realisierungen des Bezugswortes, je nachdem, wie die Suchanfrage formuliert wurde. In unserer Gedankenführung sind wir bisher stets von einer Wortform oder einem (echten) Lemma ausgegangen, theoretisch könnten diese Objekte aber auch als fast beliebige Alternativen vorgegeben werden. Zum anderen können die relativen Positionen des Bezugswortes und der Partnerwörter zueinander variieren. Anhand einer rein quantitativen Auswertung der Textfenster eines Kookkurrenzclusters bestimmt das Verfahren das sogenannte syntagmatische Muster. Dies gibt die dominante Ausprägung bezüglich der Form des Bezugsobjektes und der Reihenfolge der auffälligen Wortkombination wieder. Neben dem Anteil dieser Realisierung (von allen Texten des Clusters, vorletzte Spalte in Abb. 8) werden auch weitere Wörter mit in die Auswertung miteinbezogen, die zwar nicht als statistisch auffällig erkannt worden waren, die aber für bestimmte Lücken zwischen den auffälligen Wörtern oft verzeichnet sind. AF
LLR
Partnerw.
Ant.
syntagmatisches Muster
–1
–1
19942 blonden
51 %
den|mit langen blonden […] Haaren und …
–3
–1
14575 blonde
83 %
hat blonde […] Haare und
–2
–1
11271 blondes
99 %
hat blondes […] Haar und
–4
5
4477 blond
41 %
die Haare […] blond gefärbt|färben
Abb. 8: Syntagmatische Muster zu den Primärpartnerclustern aus Abb. 7
In der Originaldarstellung in Cosmas II oder der CCDB werden die auffälligen Wörter blau, die Füllwörter in abgestuften Grautönen entsprechend ihrer Häufigkeit angezeigt. Als zusätzliche Mittel werden die Auslassungspunkte („…“) für eine nicht näher zu spezifizierende Lücke, eckige Klammern für Optionalität und der senkrechte Strich für Alternativen eingesetzt. Neben der Aufzählung der Partnerwörter sind die syntagmatischen Muster eine zweite Art zu versuchen, den Inhalt eines Kookkurrenzclusters zu charakterisieren. Sie stellen einen erneuten Bezug zu den Clustertexten her und verankern den Befund zur empirischen Basis auf eine andere Art und Weise. Der Angabe des prozentualen Anteils kommt dabei eine hohe Bedeutung zu, da sie viel über die Festigkeit und die Abdeckung des Musters mit Blick auf das Kookkurrenzcluster aussagt. Die ersten drei Cluster in unserem Beispiel in Abb. 8 variieren kaum in ihren Anordnungen. Im dritten Cluster dominiert auch die Realisierung des Bezugswortes nahezu eindeutig, sodass 99 % der Texte die gleiche Realisierung der auffälligen Elemente aufweist. Im ersten und zweiten Cluster sorgen alternative Formen des Bezugslemmas (das blonde […] Haar; mit dem blonden […] Haar; die blonden […] Haare) für geringere Zahlen. Im vierten Cluster sorgt zusätzlich die positionelle Varianz (Haar […] blond gefärbt;
222
Cyril Belica/Rainer Perkuhn
blond gefärbtes […] Haar; blond gefärbte […] Haare) für eine stärkere Verteilung der beobachtbaren Realisierungen, somit auch für einen geringeren Anteil der dominanten Form. Welche und wie viele empirische wortformbezogene Kookkurrenzen sich zu einer lexikographisch kanonisierten Nennform einer Kollokation zusammenfassen lassen (und wie sie benannt werden sollte), überlassen wir der qualitativen anwendungsbezogenen Interpretation. Mit der Angabe der Partnerwörter, des Autofokusintervalls, des syntagmatischen Musters und des Anteils der dominanten Realisierung bietet das Verfahren eine Menge Hinweise, inwieweit eine hohe Festigkeit einer Verbindung vorliegt. Je höher die Festigkeit, desto stärker sollte sich eine Nennform an dem syntagmatischen Muster orientieren. Je geringer die Festigkeit, desto mehr Aufwand ist für die Erschließung der Varianz und für eine angemessene Umsetzung in eine Zusammenfassung zu leisten. Die Ermittlung mehrerer nennenswerter, sozusagen kodominanter Muster ist ein noch offenes Desiderat.
4.2 Kollokationsprofile als Wortcharakterisierungen, Profilvergleiche als Wortbeziehungen Um an die Argumentation in der Einleitung anzuknüpfen, ist es hilfreich, Kollokationen in eine abstrakte Szene einzubetten, wie sie in Abb. 9 dargestellt ist. In der minimalistischen Fassung wird für einen zweiteilbaren Bedeutungsgehalt („A+B“, vgl. Abb. 1 „Buch+lesen“ und Abb. 2 „Gebiss+sauber machen“) ein Lexikalisierungsprozess angestoßen, der im hier fokussierten Fall zur Realisierung durch zwei Wörter führt (Pfad ➊). In dieser sprachproduktiven Richtung haben sich viele Debatten um den Punkt gedreht, dass bei der Annahme zweier getrennter Lexikalisierungsprozesse ein eventuell abweichendes Ergebnis zustande kommt, wenn eines der Wörter nicht im Kontext des anderen Wortes realisiert wird. Als Grenzfälle zu diesem allgemeinen Schema sollten wir die Bereiche erwähnen, in denen der Bedeutungsgehalt genau genommen nicht teilbar ist oder sich die Lexikalisierung bei Wortbildungsprozessen bedient. Als unteilbar betrachten wir dabei Inhalte, die eigentlich quasi wie Zitate sprachliche Einheiten darstellen, wie komplexe Eigennamen oder Film- und Buchtitel. Diese Fälle sind hochgradig ritualisiert, sodass die Lexikalisierung einen hohen Anteil an reiner Reproduktion enthält. Auch Idiome im engeren Sinne haben diesen Status. Diese und z. B. auch Funktionsverbgefüge lassen sich auf nur ein einziges Konzept als Ausgangspunkt für den Sprachproduktionsprozess zurückführen. Andersherum erlaubt z. B. die Wortbildung im Deutschen die Verbalisierung von mehreren Konzepten in einer Einheit, etwa in Komposita. Insofern ist nicht überraschend, dass diese Fälle bei Versuchen der Charakterisierung von Kollokationen oder ihrer Abgrenzung zu anderen Bereichen besondere Aufmerksamkeit erfahren. Auch für unseren abschließenden Punkt, der Kollokation in ein umfassenderes
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
223
Forschungsfeld einordnen soll, ist ihr besonderer Status gegebenenfalls separat zu berücksichtigen.
wortA
...
wortB
lex(A)
+ lex(B)
gehalt(A + B)
wortA
?? =
...
wortB|A
lex(A + B)
Kollokation
Warum? – arbiträres Repertoire – systematischer Gebrauch – usuelle Präferenz
Warum? – Bedürfnis – „Bedeutung“
Abb. 9: Kollokation: produktiv eventuell schwierig, rezeptiv aufschlussreich
Unabhängig davon, ob Kollokationen als typische Wortverbindungen mit oder ohne besondere Auffälligkeit gesehen werden, ist wichtig festzuhalten, dass sie nicht ohne Grund systematisch gebraucht werden. Neben den genannten Sonderfällen bringen viele Kollokationen einen inhaltlichen Zusammenhang zum Ausdruck. Das Bedürfnis, die Wörter gemeinsam zu verwenden (Pfad ➋), lässt sich als Teil eines Prozesses sehen, in dem sich im weitesten Sinne die Bedeutungen der beteiligten Wörter gegenseitig konstituieren. Aus dem Gesamtkookkurrenzverhalten lässt sich quasi das Bedeutungspotential eines Wortes erschließen (Perkuhn/Keibel 2009), in gewisser Weise zeigt dies auch, welches Wissen oder welche Ansichten zu bestimmten Begriffen sich in Diskursen niederschlagen (vgl. Abb. 1 im Beitrag Schnörch in diesem Band). Auswertungen des Kookkurrenzverhaltens einzelner Wörter führen zu syntagmatisch-paradigmatischen Mustern. Der Vergleich des Kookkurrenzverhaltens verschiedener Wörter liefert Hinweise auf Sinn- und Sachverwandtschaften oder weitere Parallelen im Gebrauch (vgl. Belica 2011 und auch Storjohann in diesem Band). Diese Verwandtschaftsbeziehungen wiederum lassen sich mit geeigneten Verfahren dergestalt kartieren, dass sich Verwendungsschwerpunkte ausmachen lassen, die etwa als Lesarten im lexikographischen Sinne gedeutet werden können (Vachková/ Belica 2009). Die Mächtigkeit des Forschungsansatzes könnte sogar so weit gedeutet werden, dass mit den zugrundeliegenden Strukturierungsmethoden eine gute Annäherung einer emergenz-basierten Sprachtheorie erreicht wurde.
224
Cyril Belica/Rainer Perkuhn
5 Literatur Belica, Cyril (1995): Statistische Kollokationsanalyse und -clustering. Korpuslinguistische Analysemethode. http://corpora.ids-mannheim.de/. Belica, Cyril (2007): Kookkurrenzdatenbank CCDB – V3. Eine korpuslinguistische Denk- und Experimentierplattform für die Erforschung und theoretische Begründung von systemischstrukturellen Eigenschaften von Kohäsionsrelationen zwischen den Konstituenten des Sprachgebrauchs. http://corpora.ids-mannheim.de/ccdb/. Belica, Cyril (2011): Semantische Nähe als Ähnlichkeit von Kookkurrenzprofilen. In: Andrea Abel/ Renata Zanin (Hg.): Korpora in Lehre und Forschung. Bozen, 155–178. Bodmer Mory, Franck (2014): Mit COSMAS II »in den Weiten der IDS-Korpora unterwegs«. In: Institut für Deutsche Sprache (Hg.): Ansichten und Einsichten. 50 Jahre Institut für Deutsche Sprache. Mannheim, 376–385. Brown, Roger (1958): How shall a thing be called? In: Psychological Review 65, 14–21. Cheng, Winnie/Chris Greaves/Martin Warren (2006): From n-gram to skipgram to concgram. In: International Journal of Corpus Linguistics 11/4, 411–433. Coseriu, Eugenio (1967): Lexikalische Solidaritäten. In: Poetica 1/3, 293–303. Croft, William A. (2001): Radical Construction Grammar: Syntactic Theory in Typological Perspective. Oxford. Deutsch, Werner/Thomas Pechmann (1982): Social interaction and the development of definite descriptions. In: Cognition 11, 159–184. Dunning, Ted (1993): Accurate methods for the statistics of surprise and coincidence. In: Computational Linguistics 19/1, 61–74. Ellis, Nick C./Eric Frey/Isaac Jalkanen (2009): The psycholinguistic reality of collocation and semantic prosody (1): Lexical access. In: Ute Römer/Rainer Schulze (Hg.): Exploring the Lexis-Grammar Interface. Studies in Corpus Linguistics. Amsterdam, 89–114. Ellis, Nick C./Eric Frey (2009): The psycholinguistic reality of collocation and semantic prosody (2): affective priming. In: Roberta Corrigan u. a. (Hg.): Formulaic Language. Typological Studies in Language 83 (2). Amsterdam, 473–497. Goldberg, Adele E. (1995): Constructions: A Construction Grammar Approach to Argument Structure. Chicago. Hausmann, Franz Josef (1984): Wortschatzlernen ist Kollokationslernen. Zum Lehren und Lernen französischer Wortverbindungen. Praxis des neusprachlichen Unterrichts 31, 395–406. Hausmann, Franz Josef (2004): Was sind eigentlich Kollokationen? In: Kathrin Steyer (Hg.): Wortverbindungen – mehr oder weniger fest. Berlin, 309–334. Hausmann, Franz Josef (2007): Die Kollokationen im Rahmen der Phraseologie. Systematische und historische Darstellung. In: Zeitschrift für Anglistik und Amerikanistik 3/55, 217–234. Hoey, Michael (2005): Lexical Priming: A New Theory of Words and Language. London. Hopper, Paul (1987): Emergent grammar. In: Berkeley Linguistics Society 13, 139–157. Institut für Deutsche Sprache (2014a): Deutsches Referenzkorpus/Archiv der Korpora geschriebener Gegenwartssprache 2014-II (Release vom 11.09.2014). Mannheim: Institut für Deutsche Sprache. www.ids-mannheim.de/DeReKo . Institut für Deutsche Sprache (2014b): Cosmas II-Recherchesystem. https://cosmas2.ids-mannheim. de/cosmas2-web/. Keibel, Holger/Cyril Belica (2007): CCDB: A corpus-linguistic research and development workbench. In: Proceedings of the 4th Corpus Linguistics Conference 2007, Birmingham. http://corpus. bham.ac.uk/corplingproceedings07/paper/134_Paper.pdf . Meľčuk, Igor A. (1998): Collocations and lexical functions. In: Anthony P. Cowie (Hg.): Phraseology. Theory, Analysis, and Applications, Oxford, 23–53.
Feste Wortgruppen/Phraseologie I: Kollokationen und syntagmatische Muster
225
Mukherjee, Joybrato (2002): Korpuslinguistik und Englischunterricht: Eine Einführung. Frankfurt a. Main. Palmer, Harold E. (1933): Second Interim Report on English Collocations, Submitted to the Tenth Annual Conference of English Teachers under the Auspices of the Institute for Research in English Teaching. Tokyo. Perkuhn, Rainer/Holger Keibel (2009): A brief tutorial on using collocations for uncovering and contrasting meaning potentials of lexical items. In: Makoto Minegishi/Yuji Kawaguchi (Hg.): Working Papers in Corpus-Based Linguistics and Language Education, No. 3. Tokyo, 77–91. Porzig, Walter (1934): Wesenhafte Bedeutungsbeziehungen. In: Beiträge zur Geschichte der deutschen Sprache und Literatur 58, 70–97. Rosch, Eleanor (1978): Principles of categorization. In: Eleanor Rosch/Barbara B. Lloyd (Hg.): Cognition and Categorization. Hillsdale, 27–48. Sinclair, John (1991): Corpus, Concordance, Collocation. London. Steyer, Kathrin (2008): Kollokationen in deutschen Wörterbüchern und in der deutschen Wörterbuchforschung. In: Ulrich Heid u. a. (Hg.): Lexicographica. 24. Internationales Jahrbuch für Lexikographie. Berlin u. a., 185–208. Tomasello, Michael (2003): Constructing a Language: A Usage-Based Theory of Language Acquisition. Cambridge. Vachková, Marie/Cyril Belica (2009): Self-organizing lexical feature maps. Semiotic interpretation and possible application in lexicography. In: Interdisciplinary Journal for Germanic Linguistics and Semiotic Analysis 13/2, 223–260.
Ken Farø
10. Feste Wortgruppen/Phraseologie II: Phraseme Abstract: In diesem Aufsatz wird eine skizzenhafte Einführung in das Phänomen der festen Mehrwortverbindungen vorgenommen. Der Gegenstand wird definiert, seine Relevanz dargelegt, und wesentliche begrifflich-terminologische Probleme werden diskutiert, darunter die umstrittenen Kernbegriffe Phrasem und Idiom, die oft unsystematisch gehandhabt werden. Dies führt zu einer Diskussion über Phrasemtypen, wonach eine Auswahl der prägnantesten Phraseme vorgestellt und ihre Merkmale und Eigenschaften besprochen werden. Dem folgt eine Besprechung der Entstehung von Phrasemen und von der Phraseologie als Phänomen des Sprachwandels sowie eine Erörterung sprachvergleichender und übersetzerischer Aspekte. Darauf folgt ein Abschnitt über Beschreibungsprobleme, darunter die Rolle der Phraseme in der Lexikographie. Als Nächstes werden semiotisch-rezeptive Probleme und der Komplex aus Ikonizität, Arbitrarität und falschen Freunden in der Phraseologie besprochen. Ein Kapitel über die Phraseologieforschung und entsprechende Desiderata rundet den Beitrag ab. 1 Einleitung: Was sind Phraseme? 2 Zur Typenvielfalt der Phraseologie 3 Zur Entstehung und zum Wandel von Phrasemen 4 Interlingualer Vergleich und Übersetzung von Phrasemen 5 Phraseme im Wörterbuch und im Text 6 Phraseme beim Lernen und Lesen 7 Zur Phraseologieforschung 8 Literaturverzeichnis
1 Einleitung: Was sind Phraseme? Dieser Artikel führt in den komplexeren Teil des Wortschatzes ein, der heute den gemeinsamen Überbegriff Phraseologie trägt. Es handelt sich um Beispiele wie: (a) etwas ist nicht ohne; (b) Heil Hitler!; (c) und wie!; (d) das Fahrrad schieben; (e) das Wunder von Bel Horizonte; (f) Krieg der Sterne; (g) Hinz und Kunz; (h) ab und zu; (i) etwas unter Kontrolle haben; (j) schweres Wasser; (k) last, (but) not least; (l) Wes Brot ich ess, des Lied ich sing; (m) und so weiter
Der Beitrag stellt einen allgemeinen sprachwissenschaftlichen Zugang zum Gegenstand dar. Was fokussiert wird, sind, außer kategorialen, semiotischen und funkti-
Feste Wortgruppen/Phraseologie II: Phraseme
227
onalen Aspekten, syntaktische und pragmatische Gebrauchsbedingungen sowie die Semantik von Phrasemen. Dabei werden sowohl das kommunikative Potenzial als auch die grundlegenden Verständnisbarrieren beleuchtet, die Phraseme für Erstsprachen- und Fremdsprachenlerner darstellen. Ein besonderer Abschnitt beschäftigt sich mit der theoretischen und praktischen Handhabung von Phrasemen in sogenannten angewandten Disziplinen wie Sprachdidaktik, Übersetzungswissenschaft und Lexikographie.
1.1 Zur Relevanz der Phraseologie Die Relevanz der Phraseologie als linguistische Disziplin betrachtet kann u. a. anhand der folgenden Argumente begründet werden: 1. die schiere Zahl der Phraseme in vielen Textsorten (zur Phraseologie in Belletristik, Sachbüchern, audiovisuellen Medien und Werbung s. Burger u. a. 2007, 269–380, sowie Abschnitt 5. im vorliegenden Aufsatz), 2. das Problem der Phraseme als wissenschaftlicher Gegenstand sowohl für die traditionelle Grammatik als auch für die lexikalische Forschung und letztendlich für die Sprachwissenschaft insgesamt (s. u. a. Fleischer 1982), 3. die besonderen rezeptiven und didaktischen Herausforderungen, die Phraseme sowohl für Sprachlerner als auch für Fremdsprachler ausmachen (Hallsteinsdóttir 2001; Farø/Hallsteinsdóttir 2012), 4. die speziellen Probleme, die Phraseme Übersetzern, Grammatikschreibern und Wörterbuchautoren bereiten (Hausmann 1985; Wotjak 2001).
Als Zusatzargument kann die schiere Faszination genannt werden, die für viele Menschen von der Phraseologie ausgeht. Dabei muss festgestellt werden, dass diese Faszination wohl meistens gar nicht der Phraseologie als solcher gilt, sondern dem Phänomen der sprachlichen Ikonographie, also dem Merkmal der Bildhaftigkeit. Bildlich sind zwar viele Phraseme, z. B. das lokaladverbiale Idiom wo sich Fuchs und Hase gute Nacht sagen (‚an einem sehr entfernt gelegenen und damit unattraktiven Ort‘). Doch erstens gilt dieses Merkmal nur für einen kleinen Teil des sehr großen Typeninventars der Phraseologie. Zweitens sind auch manche Einzelwörter bildhaft, vgl. etwa Mitesser (‚eine Unreinheit der Haut‘), Scheiße! (Ausdruck für große Verärgerung) und Kohle (‚Geld‘). Als Definitionsmerkmal der Phraseologie kann die Ikonographie also keineswegs gelten, allenfalls als Kriterium gewisser phraseologischer Unterkategorien (s. Abschnitt 2.2).
1.2 Definition von Phraseologie Um eine Definition des Gegenstands hat sich die Forschung jahrzehntelang bemüht (Fleischer 1982; Burger u. a. 2007). Eine neutrale Definition der Phraseologie muss
228
Ken Farø
so formuliert sein, dass sie alle Typen von Phrasemen abdeckt, die in empirischen Texten vorkommen (s. a. Abschnitt 5). Die Definition, die hier vorgelegt wird, ist eine maximierende, die die ganze Breite der tatsächlich von der Forschung als Phraseme behandelten Wortverbindungen einbezieht. Sie lautet folgendermaßen: Phraseme sind lexikalisierte (spatial) polylexikalische Sprachzeichen. (vgl. Farø 2006, 48–71)
Sprachzeichen sind nach Saussure systematische Gebilde, die aus einem Ausdruck und einem Inhalt bestehen. Spatial polylexikalisch heißt, dass Phraseme aus mehr als einem Wort bestehen, und zwar so, dass zwischen diesen Wörtern mindestens eine Leerstelle steht. Somit gehören komplexe Einzelwörter wie Komposita und andere Wortbildungen nicht zur Phraseologie (s. Fleischer 1992), trotz Vorschläge der Forschung mit „Einwortphrasemen“ zu rechnen (z. B. Delplanque, zitiert nach Burger 2001, 38), und auch wenn sie z. B. auf Grund einer Rechtschreibungsreform aus der phraseologischen Kategorie austreten oder umgekehrt in diese eintreten können (vgl. Levin-Steinmann 2007). Ein Beispiel für das Erstere wäre sodass, das nach der 1998er Orthografiereform nur univerbiert, d. h. zusammengeschrieben werden soll. Umgekehrt ist das vormals z. T. univerbierte radfahren nach der Reform vollständig phraseologisiert worden. Ein anderes Beispiel ist sozusagen, das schon sehr lange als Monolexem (Einzelwort) gehandhabt wird, ohne dass dies in anderen Sprachen eine Selbstverständlichkeit wäre: Sowohl das Englische als auch das Dänische besitzen eine kompositionell völlig konvergente Bildung, ohne dass hier jemand auf den Gedanken käme, das Syntagma zusammenzuschreiben; hier sind die Formen so to speak und så at sige phraseologisch. Dass Phraseme lexikalisiert sind, heißt so viel, dass sie der Sprache angehören. Ad-hoc-Bildungen, d. h. Konstruktionen, die nicht bereits von vielen Sprachbenutzern in systematischer Weise verwendet werden, sind demnach keine Phraseme − ein Beispiel dafür wäre das Phraseologie-verdächtige Das offensichtliche ist schwer zu übersehen (s. Abschnitt 5.), das aber nach Korpus- und Netzrecherchen als eindeutig nicht-lexikalisiert beschrieben werden kann. Die Klasse der Phraseologie wird hier somit rein formal, nicht funktional definiert. Das hängt damit zusammen, dass alle Versuche, Phraseme irgendwelche Sonder- oder typischen Funktionen bzw. -Inhalten zuzuschreiben, gescheitert sind, es sei denn, man engt den Gegenstand (zu) sehr ein. Das liegt wiederum an der extremen Heterogenität des Typeninventars (s. Abschnitt 2.2). Die Phraseologie besitzt keine funktionale Exklusivität, denn viele Phraseme haben auch monolexikalische Synonyme: das Zeitliche segnen hat z. B. in ableben und sterben Einzelwortsynonyme (Piirainen 2002).
Feste Wortgruppen/Phraseologie II: Phraseme
229
1.3 Phraseme als Teil des Sprachinventars Sind Phraseme Wortschatz oder Grammatik, etwas dazwischen oder vielleicht darüber? Diese Frage zu beantworten ist schwieriger, als sie vielleicht klingt. In der Praxis werden Phraseme sowohl in Wörterbüchern als auch in Grammatiken behandelt. So findet man in der App-Version des Duden Universalwörterbuch (2014) u. a. folgende Phraseme: „sowohl: nur in der Verbindung sowohl als/wie [auch]“ und „Verzicht üben (verzichten)“. Beide Phraseme werden aber auch in der Duden Grammatik behandelt, und zwar jeweils als Konjunktion und Funktionsverbgefüge. Das ist keine Inkonsequenz, sondern das sind bloß zwei verschiedene Perspektiven auf den gleichen Gegenstand. Es gibt also offenbar phraseologische Konjunktionen, und Funktionsverbgefüge sind per definitionem Phraseme (s. Abschnitt 2.2). Ein neuerer Zugang zur Diskussion der Lexikon/Grammatik-Unterscheidung schlägt einen sogenannten inventariografischen Zugang vor (Farø 2013), der die Entscheidung zwischen Lexikon und Grammatik in vielen Fällen gar nicht trifft, weil sie oft unlösbar und manchmal auch unwichtig ist. Aus dieser Sicht stellen Phraseme somit sprachliche Ressourcen dar, genau wie Wörter, Affixe, Flexive, Morpheme, grammatische Konstruktionen, Textsorten(konventionen) u. a. m. Alle Phraseme haben, genau wie Wörter, sowohl lexikalische als auch grammatische Eigenschaften.
1.4 Zur Terminologie und Notation der Phraseologie Die Terminologie-Vielfalt der Phraseologieforschung ist legendär: Idiome, Redensarten, Wortverbindungen, Mehrworteinheiten, Wendungen, Ausdrücke, formelhafte Sprache gehören zu denjenigen Bezeichnungen, die am meisten verwendet werden. Formulaic language ist dabei ein verbreiteter Überbegriff der angelsächsischen Forschung (s. Wray 2002). Manchmal sind mit den unterschiedlichen Termini wirklich auch unterschiedliche Gegenstände gemeint. Doch in vielen Fällen handelt es sich um reine Synonymie und z. T. unsystematischen Umgang mit dem Untersuchungsobjekt und seiner Fachsprache. Beispiele für Phraseme werden kursiv gesetzt (aus dem Auge, aus dem Sinn). Inhaltsangaben stehen in einfachen Anführungszeichen (ins Gras beißen: ‚sterben‘). Damit sind die doppelten Anführungszeichen für Zitate („Ich bin ein Berliner“) und für direkte Übersetzungen reserviert. Letzteres ist z. B. bei Phrasemen aus Sprachen relevant, bei denen man die Komposition nicht durchschaut, weil man nicht einmal die isolierte Bedeutung der Komponenten versteht. Das könnte hier der Fall sein: russisch cмoтpи на oбороте! („schau auf die Kehrseite“: ‚bitte wenden!‘), und isländisch vaxa e-m yfir höfuð („jemandem über den Kopf wachsen“: ‚größer werden als jemand‘). Die Komposition spielt in Arbeiten zur vergleichenden Phraseologie eine wichtige Rolle (s. Abschnitt 4.1 f.).
230
Ken Farø
1.5 Weitere phraseologische Begrifflichkeiten Nach Fillmore u. a. (1988) können Phraseme grundsätzlich entweder substanziell oder schematisch sein. Betrachtet man z. B. ab und zu und Man soll den Tag nicht vor dem Abend loben, so sind sie bereits Fertiggepräge: Man muss bei ihnen weder etwas erweitern noch etwas ausfüllen. Man wird ihnen in einem authentischen Text somit immer in dieser Form begegnen. Solche Phraseme, deren Form geschlossen ist, nennt man substanzielle Phraseme. Demgegenüber stehen die schematischen Phraseme, deren Form durch das Vorkommen von auszufüllenden Lücken oder die von zu aktualisierenden nicht-flektierten Wortformen geprägt ist. Z. B. gibt es das Schema [Sbst.] für [Sbst.], das u. a. den Verbindungen Tag für Tag und Schritt für Schritt zugrunde liegt. Mit den schematischen Phrasemen, die in der Forschung auch Phraseoschablonen genannt werden (vgl. Fleischer 1982), nähern wir uns den sogenannten Konstruktionen: Faszination [Sbst.] (z. B. Faszination Wissen/Tiere/Krieg). Phraseoschablonen können sogar vollständig schematisch sein, d. h. ohne jegliches manifestes Element, z. B.: [Sbst.DE-VB] [ARTDEF] [OBJDAT] (z. B. Kampf dem Google; Friede den Hütten, s. Ørsnes/Asmussen 2010, sowie Abschnitt 5.). Die Bestandteile eines Phrasems nennt man seine Komponenten, das ganze Gebilde seine Komposition. Phraseme lassen sich daher kompositionell untersuchen und vergleichen (s. Abschnitt 4.). Bei einigen Phrasemen kann man von zwei Lesarten sprechen, einer phraseologischen oder wörtlichen/literalen (s. Burger 2010). Die literale Lesart fokussiert auf die Wortbedeutungen, während die phraseologische ganzheitlich die etablierte Bedeutung oder Funktion im Auge hat. Den Vorrat einer Sprache an Phrasemen nennt man ihr Phraseolexikon (z. B. Grzybek 2006, 195). Bei manchen Phrasemen kann man kaum von einer Bedeutung sprechen, sondern eher von einer Funktion. Das gilt z. B. bei Routineformeln, s. Abschnitt 2.2.; in dem Fall muss die übliche Inhaltsparaphrase von einer Funktionsangabe ersetzt werden: Wird verwendet, um … auszudrücken; Ausdruck für… Bei wiederum anderen kann beides relevant sein (z. B. bei Sprichwörtern, s. Abschnitt 2.2).
2 Zur Typenvielfalt der Phraseologie 2.1 Klassifikation von Phrasemen Eine systematische Einteilung der Phraseologie in Typen ist zwar möglich und sinnvoll, doch sie kann nicht aufgrund eines gemeinsamen Merkmalrasters ausgeführt werden. Eher muss man sozusagen „Phraseologie-empathisch“ vorgehen und induktiv auf die jeweiligen Phrasem-Arten und ihre Merkmale eingehen. Bei der wissenschaftlichen Klassifikation von Phrasemen lohnt es sich v. a. zu folgenden Fragen Überlegungen, Tests und Untersuchungen zu machen:
Feste Wortgruppen/Phraseologie II: Phraseme
231
Was ist die allgemeine Relevanz der Kategorie? Welche Merkmale haben die Phraseme (obligatorisch vs. fakultativ)? Wie groß ist das Inventar? Wie produktiv ist der Typ, d. h. kommen neue Mitglieder hinzu, und ggf. wie häufig? – Welche kommunikativen oder grammatischen Funktionen weisen die Phraseme auf? – – – –
Diese Elemente sind auch der Leitfaden, wenn ich unten einige der prägnantesten phraseologischen Kategorien bespreche. Ein wichtiges Prinzip ist, dass nicht willkürlich solche Kategorien geschaffen werden sollten, die bereits von einer anderen Kategorie überdacht werden (können). Doch Überschneidungen und Inklusionen sind hier unvermeidbar. Das ist übrigens nicht unbekannt in der Linguistik: Sprache ist nicht Logik, auch wenn manche linguistische Darstellungen diese Idealvorstellung festzuhalten versuchen.
2.2 Phrasemtypen Zunächst die Basis: Der Kernbegriff Phraseologie hat in der Forschung eine enge und eine weite Auslegung: Im engeren Sinn sind Phraseme Mehrwortverbindungen, die eine Bedeutung haben, die nicht aus ihren Komponenten erklärbar ist. Das ist mehr oder weniger auch die traditionelle (strukturelle) Auffassung der Forschung gewesen (Burger u. a. 2007a). Dabei gilt, dass die enge Auslegung der Phraseologie = die weite Auffassung der Idiomatik ist! Das heißt, der Begriffsinhalt der Phraseologie und der Idiomatik überlappen sich, doch nur zu einem gewissen Grad. Da, wo sie sich nicht überschneiden, das ist bei der Idiomatik im engen und der Phraseologie im weiten Sinn: Die Idiomatik im engeren Sinn sind die bildhaften Idiome (seine Hände im Spiel haben, put one‘s foot down). Demgegenüber ist die Phraseologie im weiteren Sinn gerade der Gegenstand dieses Aufsatzes: nämlich jegliche feste Mehrwortverbindung, und zwar ohne Einschränkungen. Diese terminologische Lage sorgt für Verwirrung und Unklarheiten. Ein großes Problem für den Forschungsaustausch ist nämlich die Verbreitung einer negativen Idiomdefinition (also Idiomatik im weiteren Sinn) bei häufig gleichzeitigem engem Fokus auf die ikonographischen Phraseme. Das hat damit zu tun, dass die bildhaften Idiome wie gesagt faszinieren, doch man vergisst dabei oft eine enge Idiomdefinition zu benutzen, die dieses Merkmal dann auch berücksichtigt. Wir nehmen also eine Auswahl der Phrasem-Kategorien unter die Lupe: Kollokationen: Nach Verständnis der Forschung (v. a. Hausmann 1985) sind Kollokationen im engeren Sinn Wortverbindungen, die aus der Zweierstruktur Basis und Kollokator bestehen (siehe auch Belica/Perkuhn in diesem Band). Beispiele sind die Zähne putzen, Geld verdienen, den Rasen mähen, d. h. oft Verbindungen aus einem
232
Ken Farø
Substantiv (Basis) und einem Verb oder einem Adjektiv (Kollokator). Kollokationen werden typisch als das Gegenstück zu Idiomen aufgefasst, weil sie im Gegensatz zu jenen als semantisch transparent gelten. Trotzdem sind Kollokationen in der Fremdsprache prinzipiell unvorhersagbar, und sie unterscheiden sich beim Sprachvergleich kompositionell häufig voneinander: So heißt z. B. die Kollokation das Fahrrad schieben auf Dänisch trække cyklen („ziehen“), englisch (pull the bike), spanisch (arrastre biccicletta), schwedisch (dra cyklen) und russisch (перетащить велосипе́д), d. h. das Gegenteil vom Deutschen. Demgegenüber stehen Französisch (pousser le vélo) und Italienisch (spingiere il bici), die sich wie Deutsch verhalten. Das zeigt, dass auch transparente Kollokationen problematisch sein können. Kollokationen sind für die idiomatische Sprachfertigkeit eine unabdingbare Grundlage. Dabei ist „idiomatisch“ hier irreführend: Es hat nichts mit Idiomen zu tun, sondern mit der Bedeutung ‚natürlich, wie ein Muttersprachler‘. Im weiteren Sinn sind Kollokationen das, „was auf dem gleichen Platz steht“, d. h. eine rein korpuslinguistische Größe, die zwar auch Phraseme umfasst, jedoch auch statistisch signifikante Wortrelationen ohne Inventarrelevanz (s. u. a. Sinclair 1991 und Sailer 2007). Sprichwörter: Bei Sprichwörtern spielen 3 Kriterien eine Rolle: 1. ein syntaktisches, 2. ein semantisches und 3. ein philologisches: 1. Sprichwörter sind fertig ausgebildete Sätze (Wes Brot ich ess, des Lied ich sing). Das gilt zwar auch für einige anderen Phraseme, z. B. Ich bin doch nicht blöd! (Slogan). Doch dann hilft uns das 2. Kriterium weiter: Sprichwörter bilden immer generische Aussagen (Allsätze). Das heißt, ihre Inhalte gelten allen und jederzeit. 3. Bei den Sprichwörtern spielt es keine Rolle, wer der Urheber oder welcher der Ursprungskontext ist. Sie sind ‚anti-enzyklopädisch‘ und stehen somit im gewissen Sinn im Gegensatz zu den Geflügelten Worten (s. u.). Die Tatsache, dass Sprichwörter abgeschlossene Sätze bilden („Mikrotexte“, Fleischer 1982), soll uns nicht davon abhalten, sie als Phrasem-Kategorie zu behandeln. Erstens weil dieses Merkmal nicht unbekannt ist in anderen Teilen der Phraseologie. Zweitens weil die Sprichwörter (für die eine eigene Wissenschaft Parömiologie mit einer eigenen internationalen Zeitschrift existiert, s. u.) in der Phraseologieforschung recht gut aufgehoben sind, was Theorien, Terminologie, Methodologie usw. betrifft. Was erreicht man nun pragmatisch im Diskurs, wenn man Sprichwörter benutzt? Textuntersuchungen haben ergeben, dass sie viele verschiedene Illokutionen (d. h. Inhalte von Sprachhandlungen) ausdrücken können, z. B.: TROST: Morgen ist auch ein Tag, (IT) Anche i pesci del rei hanno spinne („Auch die Fische des Königs haben Gräte“), AKZEPTANZ: (DÄN) Sygdom er hvermands herre: („Krankheit ist jedermanns Herr“), ZURÜCKWEISUNG: (ENG) Pigs may fly!, KRITIK: (NL) De beste stuurlui staan aan wal: „Die besten Steuerleute stehen am Ufer“, ‚Es ist einfach (und ungerecht) eine Praxis zu kritisieren, die man selbst nicht ausübt‘) (s. Kindt 2002).
Bei Sprichwörtern ist Vorsicht geboten, wenn es darum geht, sie in einer Fremdsprache aktiv anzuwenden (Dǔrčo 2001). Nehmen wir das Beispiel Wikiquote: Die knapp
Feste Wortgruppen/Phraseologie II: Phraseme
233
50 dänischen Sprichwörter, die dort am 15.08.14 zu finden waren, waren sämtlich solche, die überhaupt keine Geläufigkeit im heutigen Dänisch haben. Dabei sind Sprichwörter als Kategorie keineswegs ungeläufig geworden. Für das Dänische ist somit mit einem Inventar von etwa 500 im heutigen Sprachgebrauch lebendigen Sprichwörtern zu rechnen (Farø 2003). Geflügelte Worte sind Wörter, Wortgruppen, Sätze oder Kleintexte, die eine präg nante historische, biographische, kulturelle oder politische Verbindung zur Wirklichkeit aufweisen. Nur eine Teilmenge der Geflügelten Worte, wenn auch der weitaus größte Teil, sind phraseologisch. Wenn man die Nominalphrase blühende Landschaften hört oder liest, weiß man idealerweise, dass der Urheber Helmut Kohl war, dass der historische Kontext die Wende ist, und dass außerdem häufig eine gewisse Ironie mitspielt, weil zumindest in den ersten Jahren nach dem Mauerfall eher ab- als aufgebaut wurde. Geflügelte Worte sind also, wie beispielsweise Phraseonyme auch (s. u.), stark in die außersprachliche Welt eingebunden − sie sind enzyklopädisch. Weitere Beispiele sind Blut und Eisen (Bismarck) und Wollt ihr den totalen Krieg? (Goebbels) (zu politisch motivierten Schlagwörtern siehe auch Schröter in diesem Band). Ein nicht unerheblicher Teil der Geflügelten Worte sind sprach- und kulturgebunden, d. h. sie lassen sich nicht oder nur sehr schwer vergleichen und übersetzen. Übrigens ist nicht entscheidend, wer einen Ausdruck „erfindet“ oder das erste Mal äußert. Das macht ihn nicht unbedingt geflügelt. Wichtig ist, mit wem er von der Öffentlichkeit in Verbindung gebracht wird, oder wer oder was ihm zur Prominenz geholfen hat, vgl. z. B. Donalies (2009, 35) zur selbstbewussten Formulierung … und das ist gut so des Berliner Bürgermeisters Klaus Wowereit als Kommentar zu seinem offenen Statement zur eigenen Homosexualität. Wowereit ist zwar nicht der erste Äußerer dieser Formulierung. Doch die Umstände haben den Ausdruck gewissermaßen zu dem „seinen“ gemacht. Xenophraseme: Einige Phraseme stammen aus fremden Sprachen, v. a. Englisch, Französisch, Lateinisch und Italienisch, beispielsweise: in punkto, etwas in petto haben, last (but) not least, mutatis mutandis (‚das Gleiche in anderer Form‘). Nicht selten sind sie im Text kursiviert, teils um ihre Fremdheit zu thematisieren, teils um auf ihre Bildungspotenz hinzuweisen. Damit ist auch ihr stilistisch-rhetorischer Mehrwert angesprochen, zumindest in der Erwachsenensprache. In der Jugendsprache haben die zumeist englischen, neuerdings z. T. aber auch türkischen und arabischen Xenophraseme jedoch die Funktion Coolness sowie auch manchmal kulturelle Identität auszudrücken. Phraseonyme: Eine sehr umfassende Klasse besteht aus solchen Phrasemen, die Namen sind, d. h. die unikale Referenten haben. Namen machen einen bedeutenden Teil der meisten Texte aus, daher ist es nur logisch, dass Phraseonyme auch einen wesentlichen Teil der Phraseme eines Textes stellen. Hier sind z. B. die Phraseonyme von S. 1 der Süddeutschen Zeitung vom 21.7.14 aufgelistet:
234 – –
–
– –
Ken Farø
Produktnamen: Süddeutsche Zeitung, Rheinische Post, Die Welt am Sonntag, Red Bull; Flug MH17 Institutionennamen: das Internationale Komitee des Roten Kreuzes, der Große Preis von Deutschland, FU Berlin, die Europäische Union, die Organisation für Sicherheit und Zusammenarbeit in Europa, die Große Koalition Personennamen: J. Gauck, C. S. Graf von Stauffenberg, B. Zschäpe, N. Rosberg, V. Bottas, L. Hamilton, S. Vettel, F. Hechtner, H. Seehofer, J. Hermann, H. Gröhe, Y. Fahini, A. Dobrindt, W. Schäuble, W. Putin, J. Kerry, A. Merkel, F.-W. Steinmeier, D. Cameron, F. Hollande, A. Borodaj, G. Bohsem, C. Hickmann, M. Szymanski Ortsnamen: Hultschiner Straße Ereignisnamen: Der 20. Juli; Rente mit 63
Doch das sind nur die expliziten Phraseonyme des Textes. Eine Menge der Textelemente sind außerdem implizte Phraseonyme, z. B. RTL: Radio Télévision Luxembourg. Zu den Phraseonymen gehören übrigens auch die phraseologischen Titel. Die meisten Titel künstlerischer oder sonstiger Kreationen sind in der Tat phraseologisch, z. B. Der mit den Wölfen tanzt, Dinner for one (Filmtitel) und Ein bisschen Friede (Songtitel) (s. a. 3.1). Dass Phraseonyme ein Randphänomen der Phraseologie sein sollte (Burger 2001, 35), leuchtet nicht ein, zumindest nicht bei einer formalen Phraseologie-Definition. Funktionsverbgefüge: etwas zu Ende bringen, etwas in Auftrag geben und etwas in Betrieb nehmen sind Beispiele für Funktionsverbgefüge (Duden Grammatik 2009, 418– 25). Sie bestehen immer aus einem deverbalen Substantiv (Ende < enden) und einem desemantisierten, d. h. inhaltlich abgeschwächten Verb (bringen hat hier nicht seine gewöhnliche translokale Funktion, sondern bloß eine, die etwas verursacht). Die FVG gelten häufig als besonders ‚grammatische‘ Phrasem-Kategorie, und sie werden auch in vielen Grammatiken (z. B. in der Duden Grammatik (2009)) behandelt. Das hängt damit zusammen, dass sie eine einigermaßen systematische Reihenbildung aufweisen können: Sie ermöglichen es u. a. eine Handlung in ihren unterschiedlichen Phasen zu fokussieren, nämlich nach den sogenannten Aktionsarten. Vergleicht man sie mit ihrer Vollverbvariante, die oft existiert (beenden, beauftragen), so ist die phraseologische Variante normalerweise stilistisch formaler; von den obigen Beispielen ist in Betrieb nehmen jedoch ohne monolexikalisches Pendant. Paarformeln: Ein verbreiteter Konstruktionstyp ist die Kombination aus zwei Wörtern derselben Wortart um eine Konjunktion, in der Regel und. Dabei ist in der Regel eine systematische semantische Relation zwischen den beiden Wörtern festzustellen, z. B. Antonymie oder Ergänzung (siehe Storjohann in diesem Band): frisch und munter, dick und dünn, Haus und Hof, Gut und Böse, hier und dort, ab und zu, an und ab. Andere Strukturprinzipien sind z. B. Silbenparallelität und Assonanz, wie sie teilweise auch in den obigen Beispielen festzustellen sind. Die Produktivität dieser Kategorie ist begrenzt, d. h. es kommen wenig neue Mitglieder hinzu. Phraseoreduplikationen: Als Teilmenge der Paarformeln sind die Phraseoreduplikationen (= PRED) auffällig: dick und fett, jemandem glauben und vertrauen, sich/etwas drehen und wenden, ganz und gar. Sie sind zwar formal als Paarformeln identifizier-
Feste Wortgruppen/Phraseologie II: Phraseme
235
bar, doch ihre Komposition ist so, dass die Bedeutung der beiden nicht-konjunktionalen Komponenten synonym ist, d. h. im Grunde handelt es sich um eine redundante Struktur. Das ist aber nur ein Oberflächenmerkmal; funktional leisten die PRED eine Intensivierung des Bedeutungsgehalts des ersten Autosemantikons; gleichzeitig ist die Konstruktion oft mit einer markierten Sprechereinstellung verbunden. Vermutlich ist die Kategorie gar nicht oder fast nicht mehr produktiv. Das Inventar an PRED umfasst schätzungsweise 100 bis 200 Mitglieder im Gegenwartsdeutschen. Phraseologische Expletiva: Diese Kategorie teilt das Merkmal Phrasem mit nicht weglassbarem Pronomen ohne anaphorische Vertreterfunktion, das dagegen eine rein formale syntaktische Funktion hat. Es handelt sich meistens um ein neutrales Pronomen wie deutsch es, englisch it, oder französisch il. Die erste große Subkategorie besteht aus den auch in Grammatiken als „Witterungsverben“ behandelten Verben mit es, die nichts als ein formales verbales Element bilden: Es regnet/donnert/taut/ schneit/hagelt/… Versuche, das „es“ wie ein eigentliches Pronomen als Substitution von „Wetter“ aufzufassen, überzeugen kaum. Ein zweiter Subtyp leitet sich von den Sinnesverben ab: Es riecht/lärmt/zieht/…Schließlich gibt es eine große Menge an eher unsystematischen Phrasemen, die das expletive Merkmal teilen: etwas hat es in sich; es mit dem Rücken haben; es gibt X; wie geht es? Phraseotermini: Die Fachsprachen des Deutschen sorgen dafür, dass laufend neue fachliche Phraseme gebildet werden, die fachlichen Referenzbedürfnissen dienen, und die teilweise in die Allgemeinsprache einfließen. Phraseologische Termini sind semantisch sehr präzise und stark enzyklopädisch. Beispiele für allgemeinsprachlich integrierte phraseologische Termini sind Schwarzes Loch (Astronomie), Schweres Wasser und der Absolute Nullpunkt (beide stammen aus der Physik). Weniger integriert sind dagegen die medizinischen irreversibles Koma, vegetative Distonie und bradykarder Rhythmus (diese Beispiele aus Burger 2001). Routineformeln/Pragmatische Phraseme: Die Routineformeln gehören, gemeinsam mit den Kollokationen, zu den kommunikativ wichtigsten Phrasemtypen, die vor allem für Lerner wichtig sind. Es handelt sich um häufig wiederkehrende Basis-Phraseme wie: (a) Bitte sehr!; (b) Herzlichen Glückswunsch!; (c) Grüß Gott!, die die kommunikative Interaktion sichern. Hier wird auch besonders deutlich, dass die Phraseme sich funktional in nichts von den Einzelwörtern unterscheiden, zumindest nicht aus prinzipieller Sicht: (a) lässt sich grundsätzlich, wenn auch nicht exakt bedeutungsgleich durch bitte! ausdrücken, (b) ist mit gratuliere! vergleichbar, während (c) sich nicht prinzipiell von Grüßen wie hallo! oder tschüss! unterscheidet. Damit ist nicht gesagt, dass sie konkret austauschbar sind, nur dass sie als Phraseme in dieser Grundfunktion nicht exklusiv sind. Phraseme mit unikalen Komponenten: Eine Gruppe von Phrasemen ist dadurch gekennzeichnet, dass sie eine lexikalische Komponente enthält, die nur in dieser Wortverbindung vorkommt. Z. B. kommt die unikale Komponente Nimmerwiedersehen fast nur im Phrasem auf Nimmerwiedersehen vor. Das heißt, dass die Wahrscheinlichkeit des gleichzeitigen Vorkommens von auf mit Nimmerwiedersehen annähernd 100 %
236
Ken Farø
beträgt. Testen wir es an einem Korpus: Im Zeit-Teilkorpus des DWDS-Korpus ergibt die Eingabe Nimmerwiedersehen 272 Treffer. Davon sind sämtliche Belege solche mit auf. Das heißt, es scheint auf den ersten Anblick gar kein Wort „Nimmerwiedersehen“ zu geben, sondern nur eine Wortverbindung, die dieses unikale Wort als obligatorisches Element enthält. Wie bei ähnlichen Phänomenen ist dies aber relativierbar. Ein noch größeres Korpus wie z. B. das Deutsche Referenzkorpus des Instituts für Deutsche Sprache enthielt in der Tat (Stand: Oktober 2014) einige nicht-phraseologische Beispiele für den Gebrauch von Nimmerwiedersehen. Nur muss man dazu sagen, dass dies dann offenbar ein untypischer Gebrauch des Substantivs ist.
2.3 Schlusswort zur phraseologischen Typologie Mit diesem Durchgang haben wir zwar keineswegs das Klassifikationspotenzial der Phraseologie erschöpft. Beispielsweise wird in manchen Arbeiten auch mit Mikroformeln (Wirrer 2007) operiert (z. B. der Nase nach), die aus einer einfachen präpositionalen Fügung bestehen. Weitere Typen wären außerdem Kinegramme bzw. Somatismen (z. B. Däumchen drehen, die Stirn runzeln), Slogans, Autorphraseme, komparative Phraseme u. v. m. Wichtig ist, dass die phraseologischen Kategorien Prototyp-Phänomene darstellen. Es gibt, wenn man authentische Texte durchforstet (s. Abschnitt 5.), viele Beispiele, die nicht in die hier aufgestellten Kategorien passen. Einerseits hat die Forschung noch nicht genug Einzelkategorien bereitgestellt, die die große phraseologische Typenvielfalt abdecken. Andererseits haben wir es aber häufig auch mit Kontinuum-Phänomenen zu tun, und nicht wenige Kategorien überschneiden sich. Das ist an sich kein großes Problem, denn Kategorien stellen ohnehin wissenschaftliche Interpretationen dar, nicht die Phänomene selbst. Das soll andererseits nicht zur Gleichgültigkeit gegenüber Kategorien führen, die durchaus ihre Berechtigung haben. Denn ohne ein Bewusstsein über das Typeninventar und ihre spezifischen Funktionen, ist die Gefahr der Fehlinterpretation bzw. inadäquaten Handhabung namentlich im interlingualen Kontext groß. Wikiquote ist ein Beispiel dafür, dass nicht immer sauber zwischen den Kategorien unterschieden wird, wo es durchaus möglich wäre: außen hui und innen pfui und da liegt der Hund begraben sind keine Sprichwörter, wie das Portal behauptet (Stand: 15.08.14). Denn diese festen Sätze sind keine semantischen Allsätze: Der Inhalt ist nicht generisch, sondern er bezieht sich nur auf den aktuellen Referenten oder die Referenzsituation (vgl. Grzybek 2007, 194); darüber hinaus hat er keine Gültigkeit. Der Skopus von Sprichwörtern ist immer universal.
Feste Wortgruppen/Phraseologie II: Phraseme
237
3 Zur Entstehung und zum Wandel von Phrasemen Die Entstehung von neuen Phrasemen nennt man Phraseologisierung. Doch wie entstehen sie tatsächlich? (vgl. Donalies 2009). Und warum ändern sie sich gelegentlich, sowohl was die Form als auch den Inhalt betrifft? Palm (1995) beschreibt, wie die potenzielle Geburt eines Phrasems aussehen kann. Es handelt sich um die situative Genese eines Idioms im Rahmen einer Konferenz. Auf dem Tisch des Moderators steht ein Wecker, den der Moderator dem Vortragenden gegen Ende des Vortrags zeigen soll, um ihn auf den sich annähernden Auslauf seiner Redezeit aufmerksam zu machen. Allmählich führt das dazu, dass eine Redewendung jemandem den Wecker zeigen entsteht. Deren Bedeutung erweitert sich dann und bedeutet bald auch ‚jemandem Einhalt gebieten‘. Das Beispiel demon striert, dass Phraseme manchmal in kleineren Kontexten oder Sprachgemeinschaften entstehen, und diese nicht unbedingt transzendieren, vgl. auch das Autorphrasem Thomas Manns aus den Buddenbrooks: auf den Steinen sitzen. Phraseme können sich aber auch aus anderen Phrasemen entwickeln. Wegen ihrer kombinierten relativen Fixiertheit und ihrer Komplexität fordern Phraseme geradezu sogenannte Modifikationen heraus (formale Ad-Hoc-Änderungen einzelner Komponenten). Hier ist ein authentisches Beispiel aus einer Zeitungsüberschrift, in dem diese Technik eine beliebte Mischung aus linguistisch-bildungsmäßiger Spielerei und gezielter aufmerksamkeitsschaffender Werbetechnik ist: „Mit Pauken und Raketen“ (< mit Pauken und Trompeten).
Es geht um das propagandistisch motivierte und genutzte Raketenmanöver eines nicht-westlich gesinnten Staates. Durch wiederholte Modifikation z. B. von Slogans oder Titeln können Phraseoschablonen entstehen, eigentlich ein eigener Phraseotyp (vgl. Fleischer 1982): Somit hat der Slogan Quadratisch. Praktisch. Gut. (seit 1970) eine Welle ähnlicher Slogans und Überschriften hervorgerufen, so dass man wohl nun von einer Schablone sprechen muss, dessen Struktur wie folgt modelliert werden kann: [X]. [X]. [X]. Dabei sind die Punkte wichtig, denn sie sind im Grunde genommen ungrammatisch: Kommata wären hier eigentlich angesagt, bei gleichzeitiger Kleinschreibung der drei Adjektive. Beispiele für weitere Bildungen auf dieser Basis sind Chancen. Bildung. Perspektiven, diesmal substantivisch. (Abendgymnasium Offenbach) und Marke. Super. Günstig. (A2 Outlet) − beide Beispiele stammen aus der Datenbank Slogans.de, Stand: 10.10.14). Die Kohäsion des Slogans kann sowohl durch Wortartenidentität wie in den beiden ersten Fällen als auch z. B. durch (elliptische) Satzförmigkeit wie im letzteren Fall (= ‚die Marke ist super günstig‘) gewahrt sein. Wie bei jedem etablierten Sprachzeichen sind Phraseme historisch gewachsene Gebilde. Das erkennt man an unterschiedlichen Merkmalen: Phraseme können ältere Sprachzustände konservieren und widerspiegeln. Nehmen wir das Phänomen
238
Ken Farø
Dativ-e, das von vielen Wörterbüchern und Grammatiken als ein wortgrammatisches Problem gehandelt wird, das vom Sprecher frei gehandhabt werden kann (so z. B. Duden Grammatik, 2009). Dabei kommt das Dativ-e heute fast ausschließlich in phraseologischen Kontexten vor (oder in archaisierenden oder formorientierten Zusammenhängen wie beispielsweise in Gedichten, vgl. etwa Else Lasker-Schülers Gedicht Mein blaues Klavier (1937), das u .a. die Zeilen Die Mondfrau sang im Boote und Ich aß vom bitteren Brote aufweist). Das gilt beispielsweise bei zu/nach Hause, im Hause (Rotschild), … etwas wie es im Buche steht, im Sinne von, etwas kommt zu Tage, jemandem stehen die Haare zu Berge. Phraseme können auch Realia, d. h. Gegenstände außerhalb der Sprache selbst konservieren. So heißt es auf Dänisch immer noch häufig se video („Video schauen“), obwohl dieses Medium seit mehr als fünfzehn Jahren aus den Wohnzimmern zugunsten von DVDs verschwunden ist. Gleichsam hört und liest man ab und zu noch den Ausdruck dreje forkert („falsch drehen“ im Sinne von die falsche Nummer wählen), der aus der Zeit stammt, in der die Nummer nicht per Touchscreen, sondern durch Betätigung einer Drehscheibe eingegeben wurde. Bei großen gesellschaftlichen Ereignissen können jederzeit Phraseme entstehen, so auch bei der Fußball-WM 2014. Das Halbfinalspiel, das mit einem 7:1-Sieg für Deutschland endete, wurde gleich danach Das Wunder von Bel Horizonte getauft, was ein Beispiel für ein Geflügeltes Wort ist, das durch Modifikation eines bereits existierenden Geflügelten Wortes entstanden ist, nämlich das Wunder von Bern, das den 1954er Sieg über Ungarn benannte. Dabei war dies eine Realisierung einer damals bereits etablierten Phraseoschablone: Das Wunder von [ORTSNAME] (z. B. Das Wunder von Heiligenblut, Das Wunder von Wörgl). Eine der geschickteren, weil mehrfach doppeldeutigen Zeitungsüberschriften nach dem Sieg über Argentinien, und zwar „Das Tor zur Welt“ der Süddeutschen Zeitung, war eine Ausnutzung eines bereits etablierten Phrasems, das u. a. als Slogan der Stadt Hamburg fungierte. Eine weitere Quelle für die Entstehung neuer Phraseme in einer Sprache sind Entlehnungen und auch direkte Übernahmen fremdsprachlicher Phraseme. Das englische Phrasem from hell kann sowohl auf Deutsch als auch auf Dänisch in der Originalform und übersetzt verwendet werden, vgl. etwa die Beispiele „Wahlplakate from hell“ und „Kunden aus der Hölle“ (Internetbelege). Im ersteren Fall haben wir es also mit einem neuen Xenophrasem zu tun.
4 Interlingualer Vergleich und Übersetzung von Phrasemen Einer der faszinierendsten Aspekte der Phraseologie ist die sprachübergreifende Untersuchung von Phrasemen zweier Sprachen (s. Farø 2006 und Korhonen 2007). Es kann sowohl die Ausdrucksebene als auch die Inhaltsebene im Zentrum sein. V. a.
Feste Wortgruppen/Phraseologie II: Phraseme
239
sich sehr nahe stehende Sprachen wie etwa das Deutsche und das Dänische eignen sich gut zum Vergleich, weil damit mehr gemeinsame Kategorien zur Verfügung stehen. Dabei tendieren die Unterschiede, insbesondere auf der Ausdrucksebene, kleiner zu sein als beim Vergleich zwischen zwei sich typologisch sehr fern stehenden Sprachen. Doch der genaue, empirisch solide Vergleich kann überraschende Unterschiede bei interlingualen Phrasem-Paaren an den Tag legen, die eigentlich für „gleich“ gehalten werden (s. w. u.). Sprachen können sich unterschiedlich verhalten in Bezug auf Phraseologisierung oder Lexikalisierung der gleichen Begriffsinhalte, was man auch traditioneller als eine analytische bzw. eine synthetische Konstruktion bezeichnet. Im deutschdänischen Vergleich tendiert das Deutsche eindeutig zur Lexikalisierung, wo das Dänische häufig die phraseologische Variante bevorzugt, vgl.: Räucherlachs, Großereignis, Dreisternehotel (dä.: røget laks, stor begivenhed, trestjernet hotel). Es gibt aber auch Ausnahmen, z. B. das Spanische Rohr, das auf Dänisch spanskrør heißt, doch die Tendenz ist eindeutig umgekehrt. Auch die Sequenzierung von Phrasemen kann sich sprachübergreifend unterscheiden. So entspricht deutsch (sich) drehen und wenden dänisch vende og dreje (sig), also die umgekehrte Reihenfolge. Nicht alle Phrasem-Kategorien eignen sich gut zum systematischen kontrastiven Vergleich. Beispielsweise sind die Geflügelten Worte häufig recht sprachgebunden, obwohl sich auch hier das Inventar immer mehr internationalisiert. Vor allem die Idiome (im engeren Sinn) aber, d. h. die ikonographischen (bildhaften) Phrasemen, eignen sich hervorragend zum Vergleich, weil sowohl ihre Ausdrucks- als auch ihre Inhaltsseite sich für den Vergleich bereitstellen. Viele Untersuchungen vergleichen Phraseme aus zwei verschiedenen oder mehreren Sprachen miteinander. Dabei wird häufig die Komposition zum Hauptfokus gemacht, so dass eine Aufteilung in voll-, teil- und null-konvergente Phraseme gemacht werden kann (vgl. Korhonen 2007). Phraseologie kann interlingual unter verschiedenen Aspekten miteinander verglichen werden. Man sollte grundsätzlich zwischen (a) didaktischen, (b) translatorischen, (c) lexikographischen und (d) deskriptiv-neutralen Analysen unterscheiden. Wichtig dabei ist, dass der Vergleich ein anderes Ergebnis in einem Sprachlern- (a) als in einem Übersetzungskontext haben kann (b). Auch zwischen rein neutralen, theorieorientierten Phrasemvergleichen (d) und Wörterbuchkontexten (c) besteht keine 1:1-Beziehung: Ein Idiom muss beim Übersetzen eines Textes nicht unbedingt in ein anderes Idiom übersetzt werden, während gerade dieser formale Aspekt bei einer anwendungsneutralen kontrastiven Analyse zentral sein kann. Auch die Granularität des Vergleichs spielt eine wichtige Rolle: Feingranulierte Analysen führen zu mehr Ungleichheit als grobe, die eher Unterschiede übersehen oder bewusst überbrücken. Ein Beispiel für eine fein granulierte Analyse ist Farø (2006). Kernbegriffe des Vergleichs sind Äquivalenz, Non-Äquivalenz, Divergenz und Konvergenz:
240
Ken Farø
Tab. 1: Zentrale Begrifflichkeiten beim kontrastiven Vergleich von Idiomen
Ausdruck Inhalt
Übereinstimmung
Nicht-Übereinstimmung
Konvergenz (1) Äquivalenz (3)
Divergenz (2) Non-Äquivalenz (4)
Beispiele aus dem Sprachenpaar Deutsch-Dänisch: (1) Alarm schlagen − slå alarm sind konvergent; (2) Das Zünglein an der Waage sein − være tungen på vægtskålen sind in zweierlei Weise divergent: 1. wegen des deutschen Diminutivs, und 2. wegen des dänischen Kompositums gegenüber deutschem Simplex; das Idiompaar wo sich Fuchs und Hase gute Nacht sagen – ude hvor kragerne vender („draussen wo die Krähen umkehren“) (3) ist äquivalent bei gleichzeitiger Divergenz. Schließlich sind (4) jemandem die Stange halten − holde nogen stangen non-äquivalent (bei gleichzeitiger Konvergenz): Das deutsche Idiom meint ‚jemandem helfen, jemanden unterstützen‘, während das dänische fast das Gegenteil bedeutet: ‚sich gegen jemanden halten können, jemanden abwehren‘. Interessant und aufschlussreich ist u. a. die genaue empirische Untersuchung von lexikographisch und translatorisch angenommenen Äquivalenzrelationen (Farø 2006). Aufgrund von psycholinguistischen Tests, Wörterbuchanalysen und Übersetzungsrecherchen lässt sich im Bereich der (ikonographischen) Idiomatik eindeutige Evidenz dafür sammeln, dass bei Sprachbenutzern die Ikonographie sehr stark im Fokus ist. So sehr, dass sie in der Fremdsprache häufig gar nicht auf die Gebrauchsbedingungen, darunter syntaktische, stilistische und pragmatische Eigenschaften der Idiome achten, die zweisprachig häufig divergieren. Hier sind einige Beispiele aus dem Sprachenpaar Deutsch-Dänisch, bei denen die Äquivalenz in vielen Quellen einfach vorausgesetzt wird: (1a) den Kopf unter dem Arm tragen − (1b) have hovedet under armen (2a) am grünen Tisch − (2b) ved det grønne bord (3a) ins Gras beißen − (3b) bide i græsset
Dabei sind sie falsche Freunde. Ihre Komposition ist zwar konvergent, doch ihre Bedeutung ist sehr unterschiedlich: (1a) bedeutet ‚sehr krank sein oder dem Sterben nahe sein‘, während (1b) die Bedeutung ‚unkonzentriert sein und schlecht denken können‘ hat. (2a) bedeutet ‚theoretisch‘, (2b) dagegen ‚beim Examen‘. Und (3a) heißt ‚sterben‘ gegenüber (3b) ‚eine Niederlage erleiden‘ oder konkreter ‚stürzen‘. Solche und viele anderen kontrastiven Untersuchungen demonstrieren wichtige Einsichten: 1. Angenommene interlinguale Phrasemäquivalenzen sind oft problematisch, weil sie auf einer Ausdruckorientierung und unzureichender empirischer Analyse sämtlicher relevanter Äquivalenzaspekte basieren.
Feste Wortgruppen/Phraseologie II: Phraseme
241
2. Phraseologische falsche Freunde sind ein häufigeres Phänomen als bisher angenommen. 3. Die grundlegende Arbitrarität, d. h. die nicht-gezwungene Beziehung zwischen dem Ausdruck (hier: der Komposition) und dem Inhalt gerade von motivierbaren (= ikonischen) Sprachzeichen sollte nicht vergessen werden. Im Gegenteil, gerade hier muss das Arbitraritätsprinzip hochgehalten werden, weil man sonst schnell Gefahr läuft, einem Ikonizismus und einer falschen 1:1-Vorstellung von Sprachinventaren zu unterliegen. Auf jeden Fall sind viele zweisprachige Wörterbücher voller unmarkierter falscher Freunde, und selbst in die Übersetzungen von Professionellen schleichen sich aufgrund der Ausdrucksorientierung auf Bildlichkeit und/oder Form Fehler ein, die den Text oder zumindest die Charaktere der Figuren des Textes erheblich ändern. Dass dies auch in der Textprodukten von Studenten oder Schülern ein Problem ist, muss in diesem Licht kaum extra hervorgehoben werden.
5 Phraseme im Wörterbuch und im Text Die systematische oder selektive Beschreibung der Phraseologie einer Sprache oder mehrerer Sprachen kann unterschiedliche Wege gehen. Z. B. kann man, wie Schemann (2012) es vorgemacht hat, onomasiologisch vorgehen und damit grundsätzlich die Frage stellen, wie sich unterschiedliche semantische Konzepte phraseologisch ausdrücken lassen. Welche Idiome werden beispielsweise dazu verwendet, Zorn auszudrücken? Z. B.: jemandem raucht der Kopf, jemand steigt auf die Palme, jemandem fliegt der Deckel ab u. s. w. Das führte zur Entwicklung eines nützlichen Wörterbuchwerkzeugs, das auch für die Äquivalenzarbeit zwischen zwei Sprachen anwendbar ist, nämlich des Synonymwörterbuchs der deutschen Redensarten. Keineswegs muss aber die Beschreibung von Phrasem-Inventaren lexikographisch sein. Es lassen sich Phraseme in Mikro- und Makrostudien in allerlei Formen untersuchen und darstellen, darunter Phraseme in konkreten Textexemplaren, Textsorten und Texttypen. Wie jedes andere sprachliche Phänomen sind Phraseme nur in Texten real. D. h., Hypothesen über ihr Verhalten und Funktionieren sollten immer anhand authentischer Texte getestet werden. Dies kann auch anhand eines Korpus geschehen (s. Abschnitt 2.2). Dass unterschiedliche Textsorten unterschiedliche Konzentrationen und auch Typen von Phrasemen aufweisen, ist der Forschung schon lange bekannt. Interessant und wichtig ist z. B., welche und wie Phraseme mit bestimmten Textsorten interagieren. Einige Phraseme sind regelrecht textsortengebunden (Es war einmal: Märchen; Zurückbleiben, bitte! Lautsprecherdurchsage im Norden Deutschlands; Zu Risiken und Nebenwirkungen lesen Sie die Packungsbeilage und fragen Sie Ihren Arzt oder Apotheker! Medizinwerbung im Fernsehen), während andere Phraseme (kon)
242
Ken Farø
textuell völlig frei verwendbar sind, z. B. das disjunkte „grammatische“ entweder … oder. Aus der Sicht der Textsorten selbst besteht die Fragestellung darin zu klären, wie viele Phraseme sie jeweils enthalten, welcher Typen die Phraseme angehören und warum gerade diese Typen hier vorkommen. Texte, die völlig phrasemfrei sind, sind selten. Der Leser oder die Leserin sei nun aufgefordert, sich Gedanken zu machen darüber, welcher Textsorte die folgenden Phraseme angehören, die aus einem recht kurzen Text exzerpiert wurden: (1) was für ein; (2) [ART] [ADJ] [SB] von ([ART]) [SB]; (3) in aller Ruhe; (4) bis drei zählen; (5) was haben wir denn da?; (6) rund um die Uhr; (7) Teufel auch; (8) da fällt mir ein; (9) sich kaum halten können (vor …); (10) entweder … oder; (11) [SB] von [ART] [SB]; (12) Liebe Güte!; (13) einen Kurs machen (in); (14) auf dieser Welt; (15) in drei Teufels Namen (16); genau genommen; (17) jemandem unter die Arme greifen; (18) jemandem den letzten Nerv rauben; (19) sonst bist du gesund?; (20) jemandem fällt nichts besseres ein als; (21) jemanden auf die Beine bringen; (22) in die Röhre gucken; (23) normal ist anders; (24) nie im Leben; (25) Ich glaub, ich hab mich verhört; (26), von Glück sagen können, dass…; (27) keine Bange!; (28) einen Zahn zulegen; (29) da fällt mir ein; (30); jemandem etwas auf die Nase binden; (31) mit Verlaub; (32) etwas wie es im Buche steht; (33) das olle Schrapnell; (34) nicht so eilig!; (35) am Ende; (36) Himmel noch eins!; (37) zur Unzeit; (38) was gibt’s da zu [VB]?; (39) sich die Hände waschen; (40) Hände hoch (und Hals zu)!; (42) Grips haben; (43) Mum haben; (44) etwas/jemand kommt wie bestellt; (45) es mit jemandem aufnehmen; (46) schwere Jungs; (47) etwas zu [VB] wissen; (48) Aber woher denn?; (50) sich etwas leisten können; (51) zu guter Letzt; (52) in Ruhe; (53) weit und breit;, (54) nicht die (leiseste) Spur; (55) gähnende Leere; (56) aus technischen Gründen; (57) Platz machen; (58) jemandem die Luft ablassen
Es macht die Aufgabe nicht einfacher, dass sämtliche flektierbaren Formen hier auf die Lemmaformen (Grundformen) hin neutralisiert sind, und dass der Kontext fehlt. Trotzdem wird der aufmerksame Leser schon anhand z. B. der Nummern 7, 12, 15, 28 und 40 viele Textsorten kurzerhand ausschließen können (z. B. Todesanzeige, Bewerbungsgespräch, Lautsprecheransage, Neujahrsrede). Hier ist die Lösung: Comictext, und zwar Lustiges Taschenbuch (457), eine zwanzigseitige Geschichte. Vor allem die Anhäufung von expressiven, bildhaften und z. T. archaisierenden Phrasemen fällt hier auf. Das passt gut zur Textsorte, darf aber nicht für ein generelles Merkmal der Phraseme gehalten werden. Phraseme kommen sowohl in phraseologischen Spezialwörterbüchern, als auch in Allgemeinwörterbüchern vor. Als lexikographische Kategorie stellt sie den Redakteur vor große Schwierigkeiten: Welche Lemmaform soll gewählt werden? Wo im Wörterbuch soll das Phrasem untergebracht werden? Soll unbedingt ein phraseologisches Äquivalent gegeben werden? Soll ein Ausdrucks- oder Inhaltsfokus gemacht werden? Die Phrasem-Lexikographie muss nicht einfach so viele Phraseme wie möglich sammeln. Wichtig ist der Umgang mit den phraseologischen Kategorien, die linguistische Beschreibung oder Äquivalierung, sowie die kommunikativen und informationellen Bedürfnisse des Benutzers. Leider wird in den meisten Wörterbü-
Feste Wortgruppen/Phraseologie II: Phraseme
243
chern noch nicht systematisch und deutlich zwischen Phrasemen und Beispielen unterschieden (vgl. Wotjak 2001). Im Duden Universalwörterbuch (App, 2014) findet man etwa unmarkiert unter den Beispielen die Routineformel darf es sonst noch etwas sein? Anstatt diese Phrase als anonymes Beispiel unter anderen für den Gebrauch von sonst oder noch zu verstecken, sollte sie als ein Element des Inventars an festen Phrasen des Deutschen hervorgehoben werden, wobei eine pragmatische Angabe auch nicht fehl am Platz wäre.
6 Phraseme beim Lernen und Lesen Als Phänomen, das weder beim Lernen der Erst- noch einer Fremdsprache vermeidbar ist, stellt die Phraseologie ein Paradox dar: Einerseits ist sie eine Stütze für das Sprechen, denn Fertiggepräge, auf Englisch so genannte chunks, ein Terminus, der sich allmählich auch in der deutschen Wissenschaftssprache eingebürgert hat, sind sowohl beim Aufbau als auch beim Akt des Sprechens selbst eine wichtige sprachökonomische Ressource: Namentlich solche Phraseme, die eine präzise Sprachhandlung oder ein genaues Konzept o. Ä. ausdrücken, sind eine wertvolle Erweiterung des Wortschatzes und darüber hinaus, denn sie haben in vielen Fällen kommunikativ selbstständigere Funktionen als das einzelne Wort. Andererseits stellt die Phraseologie für das Sprachlernen, und namentlich für das konkrete Textverstehen in der Fremdsprache eine erhebliche Barriere dar, die zu erkennen der erste Schritt einer Lösung ist. Wer sich nicht bewusst ist, wieviel aus einem Text weder als Monolexik noch als Grammatik erklärbar ist, sondern irgendwie im Bereich der Phraseologie oder der Konstruktionen zu platzieren ist, der wird auch große Schwierigkeiten haben, den fremdsprachigen Text vollständig zu verstehen. Dazu gehört ein grober (evtl. intuitiver) Überblick über die Typenvielfalt der Phraseologie und ihrer Funktionen. Weiter muss eine theoretische oder zumindest eine praktische Sensibilität für die semantischen und funktionalen Feinheiten dieses Gebiets entwickelt werden, weil ein ausdrucks- und interlingual 1:1-orientierter Zugang zur Phraseologie viel zu viele Probleme und Missverständnisse mit sich bringt. Semiotisch, d. h. zeichentheoretisch, stellen die Phraseme beim Lesen vor allem in der Fremdsprache eine logische Herausforderung dar, weil sie erstens nicht unmittelbar erkennbare Zeichen sind: sie sind Inhalte, die auf mehrere Komponenten verteilt sind; kennt man sie nicht bereits als Zeichen, kann man erst durch Ausschlussverfahren ableiten, dass es sich um eine Mehrworteinheit handeln muss, weil eine kompositionelle Analyse kein zufriendenstellendes Ergebnis bringt. Zweitens stellen Phraseme beim Lesen in der Fremdsprache eine Herausforderung dar, weil sie im Vergleich zu den Einzelwörtern (Komplexe nicht eingerechnet) häufig das Merkmal Ikonizität aufweisen, d. h. sie scheinen nicht selten ihre Bedeutung nach außen zu tragen. Das ist interlingual aber häufig trügerisch, weil der Spielraum der Semantik
244
Ken Farø
generell viel größer ist, als man sich bewusst ist: Die Vorstellung, dass etwa zu einem sprachlichen Bild wie Schmetterlinge im Bauch haben, in den Seilen hängen, jemandem etwas in die Schuhe schieben und so weiter eine so genannte motivierte Bedeutung gehört, ist nachvollziehbar. Doch der interlinguale Vergleich zeigt, dass sie dezeptiv ist: Es kann und es ist in anderen Sprachen in der Tat häufig anders; die gleichen Bilder vermitteln zum Teil ganz andere Inhalte, und auch der diachrone Vergleich innerhalb der gleichen Sprache demonstriert, dass Phrasembedeutungen keineswegs stabil sind, sondern dass sie mindestens genauso veränderlich sind wie die der Einzelwörter. Das Arbitraritätsprinzip sollte daher nicht kleingeredet werden, sondern im Gegenteil: Gerade im Bereich der Phraseologie sollte man es nicht vergessen, weil es in kommunikativer Hinsicht vor den schlimmsten Missverständnissen schützt.
7 Zur Phraseologieforschung Die Phraseologieforschung wurde von Pionieren wie Charles Bally im ersten und von Viktor Vinogradov im fünften Jahrzehnt des 20. Jahrhunderts begründet. Etwa ab den 1960er Jahren entwickelte sie sich nicht zuletzt durch die sowjetische Sprachwissenschaft, die DDR-Germanistik und Fremdsprachphilologien, in eine immer systematischere Richtung, Heute muss man von einer etablierten linguistischen Disziplin reden, die sowohl eigene Zeitschriften aufweisen kann (Yearbook of Phraseology, Proverbium), internationale Konferenzen, und seit den 1980er Jahren außerdem eine europäische Gesellschaft (EUROPHRAS) (www.europhras.org). Neuere Interessen und Richtungen der Phraseologieforschung sind z. B., wie auch in anderen Zweigen der Geisteswissenschaften, die evtl. kognitiven Implikationen der Phraseme (Dobrovol’skij 2007), nicht zuletzt innerhalb der angelsächsischen Forschung, interkulturelle Phänomene (Sabban 2007), metapherntheoretische und kultursemiotische Bemühungen (Dobrovol’skij & Piirainen 2005). Auch innerhalb der Sprachinformatik sind die Phraseme Gegenstand intensivierter Anstrengungen (s. Colson 2006; Sailer 2007). Mithilfe von Sprachtechnologie lassen sich Phraseme z. T. automatisch aus den großen Textkorpora exzerpieren (so z. B. für das große korpusbasierte Den Danske Ordbog (‚Das Dänische Wörterbuch“, 2003–5)), und teilweise lassen sich auch syntaktische Merkmale von Phrasemen maschinell analysieren (Asmussen/ Ørsnes 2010). Erwähnenswert ist auch das ambitionierte Projekt Widespread Idioms in Europe and beyond (Piirainen 2006), dessen Ziel es ist, Idiome aufzuspüren, die überall in Europa und darüber hinaus verbreitet sind. Damit wird die ältere Auffassung von Idiomen als Wendungen, die es nur in einer Sprache gebe, gründlich falsifiziert. Viele Idiome sind durchaus international stark verbreitet. Zu den Forschungsdesiderata der Phraseologie gehören u. a. folgende Aufgaben: – wirklich ambitionierte deskriptive Inventarisierungen der einzelsprachlichen Phraseolexika, auch semantisch und pragmatisch,
Feste Wortgruppen/Phraseologie II: Phraseme
245
– eine Phraseolexikographie, die den Gegenstand einigermaßen vollständig abdeckt, und die funktional statt formal orientiert ist, – eine Phraseodidaktik, die phraseologisches Bewusstsein mit relevanter produktiver phraseologischer Kompetenz und maximaler rezeptiver Fähigkeit kombiniert, – eine intensivierte Zusammenarbeit der Phraseologieforschung mit der Lexikographie und Translatologie, die nicht immer ein adäquates phraseologisches Bewusstsein aufweisen, – eine Korpusbasiertheit möglichst vieler Phraseologie-Studien, damit deren Hypothesen empirisch abgesichert oder noch besser: falsifiziert werden können, – eine Intensivierung der systematischen Textsortenphraseographie, um möglichst sichere Daten über die Korrelation von Text und Phrasem zu bekommen. Es steht zu hoffen, dass sich die positive Integration der Phraseologieforschung in der übrigen Linguistik fortsetzt. Denn die Phraseologie ist vor allem ein sprachlicher Gegenstand, der sich durchaus mit den bewährten, aber auch mit neuen Mitteln der Sprachwissenschaft untersuchen lässt. Wer das Gebiet weiter studieren möchte, dem seien besonders die beiden HSK-Bände mit fast einhundert sorgfältig recherchierten Artikeln von ausgewiesenen Forschern zu allen Aspekten der Phraseologie empfohlen (Burger u. a. 2007b). Der Weg von sowohl … als (auch) bis Einem geschenkten Gaul schaut man nicht ins Maul ist zwar weit, doch beide Wortverbindungen sind technisch gesehen Phraseme, und ihre Zeichenhaftigkeit ist ihnen nicht von außen anzusehen. Und genau da fangen sowohl die praktischen Probleme als auch das wissenschaftliche Interesse für die Phraseologie an.
8 Literaturverzeichnis Asmussen, Jørg/Bjarne Ørsnes (2009): Konstruktioner og korpora − et case-studie i konstruktioner af typen „Keine Macht dem Stress“. In: Ken Farø u. a. (Hg.): Sprogvidenskab i glimt. Odense, 208−218. Burger, Harald (2001): Von lahmen Enten und schwarzen Schafen. Aspekte nominaler Phraseologie. In: Annelies Häcki Buhofer/Harald Burger/Laurent Gautier (Hg.), 33−42. Burger, Harald (2010): Phraseologie: Eine Einführung am Beispiel des Deutschen. Berlin. Burger, Harald (2007a): Vorwort. In: Ders. u. a. (Hg.): Phraseologie. Ein internationales Handbuch der zeitgenössischen Forschung. (Handbücher zur Sprach- und Kommunikationswissenschaft 28.1). Berlin/New York, 20−26. Burger, Harald u. a. (Hg.) (2007b): Phraseologie. Ein internationales Handbuch der zeitgenössischen Forschung. (Handbücher zur Sprach- und Kommunikationswissenschaft 28.1). Berlin/New York. Colson, Jean-Pierre (2006): Towards computational phraseology. The project of an idiom concordancer. In: Annelies Häcki-Buhofer/Harald Burger (Hg.), 21−32. Den Danske Ordbog, 6 Bde. (2003–05). Kopenhagen. DeReKo: Deutsches Referenzkorpus: www1.ids-mannheim.de/kl/projekte/korpora/.
246
Ken Farø
Dobrovol’skij, Dmitrij (2007): Cognitive approaches to idiom analysis. In: Harald Burger u. a. (Hg.), 789−818. Dobrovol’skij, Dmitrij/Elisabeth Piirainen (2005): Figurative Language. Amsterdam u. a. Donalies, Elke (2009): Basiswissen Deutsche Phraseologie. Tübingen. DUDEN (2009): Die Grammatik. Bd. 4., 8. überarb. Aufl. Mannheim. DUDEN (2014): Deutsches Universalwörterbuch. Mannheim 2014 (App): http://itunes.apple.com/de/ app/id583849946?mt=8. Dǔrčo, Peter (2001): Parömiologische Minima für Deutsch als Fremdsprache. In: Annelies Häcki Buhofer/Harald Burger/Laurent Gautier (Hg.), 99−106. DWDS-Korpus: http://www.dwds.de . EUROPHRAS: Europäische Gesellschaft für Phraseologie: www. europhras.org/ . Farø, Ken (2003): Ordsprog i nutidsdansk: funktioner og problemer. In: Danske studier, 38−64. Farø, Ken (2006): Idiomatizität, Ikoniztät, Arbitrarität − Beitrag zu einer funktionalistischen Theorie der Idiomäquivalenz. Kopenhagen. Farø, Ken (2013): Inventariografi − al leksikografis og grammatikografis mo(r)der?, In: LexicoNordica 20, 35−54. Farø, Ken/Erla Hallsteinsdóttir (2011): Interlinguale Phraseologie: Theorie, Praxis und Perspektiven. In: Yearbook of Phraseology 2010. Berlin u. a., 125−158. Fillmore, Charles u. a. (1988): Regularity and idiomaticity in grammatical constructions: The case of let alone. In: Language 64, 50−38. Fleischer, Wolfgang (1982): Phraseologie der deutschen Gegenwartssprache. Leipzig. Fleischer, Wolfgang (1992): Konvergenz und Divergenz von Wortbildung und Phraseologisierung. In: Jarmo Korhonen (Hg.): Phraseologie und Wortbildung. Tübingen, 53−65. Grzybek, Peter (2007): Semiotik und Phraseologie. In: Harald Burger u. a. (Hg.), 188−208. Häcki Buhofer, Annelies/Harald Burger/Laurent Gautier (Hg.) (2001): Phraseologiae Amor. Aspekte europäischer Phraseologie. Baltmannsweiler. Häcki Buhofer, Annelies/Harald Burger (Hg.) (2006): Phraseology in Motion I-II. Methoden und Kritik. Akten der Internationalen Tagung zur Phraseologie (Basel, 2004). Baltmannsweiler. Hallsteinsdóttir, Erla (2001): Das Verstehen idiomatischer Phraseologismen in der Fremdsprache Deutsch. Hamburg. Hausmann, Franz-Josef (1985): Kollokationen in deutschen Wörterbüchern. Ein Beitrag zur Theorie des lexikographischen Beispiels. In: Henning Bergenholtz/Joachim Mugdan (Hg.): Lexikographie und Grammatik. Tübingen, 118–129. Häusermann, Jörg (1977): Phraseologie: Hauptprobleme der deutschen Phraseologie auf der Basis sowjetischer Forschungsergebnisse. Tübingen. Kindt, Walther (2002): Kommunikative Funktionen von Sprichwörtern: Ein Beispiel für die notwendige Verbindung von Phraseologie und Pragmatik. In: Elisabeth Piirainen/Ilpo Piirainen (Hg.): Phraseologie in Raum und Zeit. Baltmannsweiler, 273−286. Kíspál, Tamás (1999): Sprichwörter unter dem Aspekt des Fremdsprachenlerners. In: Rupprecht Baur/Peter Grzybek/Elisabeth Piirainen (Hg.): Wörter in Bildern − Bilder in Wörtern. Baltmannsweiler, 239−248. Korhonen, Jarmo (2007): Probleme der kontrastiven Phraseologie. In: Harald Burger u. a. (Hg.), 574−589. Levin-Steinmann, Anke (2007): Orthographie und Phraseologie. In: Harald Burger u. a. (Hg.), 36−41. Mieder, Wolfgang (Hg.): Proverbium: Yearbook of International Proverb Scholarship. Vermont. Palm, Christine (1995): Phraseologie. Eine Einführung. Tübingen. Piirainen, Elisabeth (2002): Er zahlt keine Steuern mehr. Phraseologismen für ‘sterben’ in den deutschen Umgangssprachen. In: Elisabeth Piirainen/Ilpo Piirainen (Hg.), 211−238.
Feste Wortgruppen/Phraseologie II: Phraseme
247
Piirainen, Elisabeth (2006): Widespread idioms: Cross-linguistic and cross-cultural approaches. In: Annelies Häcki Buhofer/Harald Burger (Hg.), 155−174. Piirainen, Elisabeth/Ilpo Piirainen (Hg.) (2002): Phraseologie in Raum und Zeit. Baltmannsweiler. Sabban, Annette (2007): Culture-boundness and problems of cultural phraseology. In: Harald Burger u. a. (Hg.), 590−605. Sailer, Manfred (2007): Corpus linguistic approaches with german corpora. In: Harald Burger u. a. (Hg.), 1060−1071. Schemann, Hans (2012): Synonymwörterbuch der deutschen Redensarten. Berlin/New York. Sinclair, John (1991): Corpus, Concordance, Collocations. Oxford. Slogans.de-Datenbank der Werbung: www.slogans.de/ . Walt Disney: Die Neffen sind los! (Lustiges Taschenbuch 457), Berlin, 149−170. Wikiquote: www.wikiquote.org . Wirrer, Jan (2007): Phraseme in der Argumentation. In: Harald Burger u. a. (Hg.), 175−187. Wotjak, Barbara (2001): Phraseologismen im Lernerwörterbuch. In: Annelies Häcki Buhofer/Harald Burger/Laurent Gautier (Hg.), 263−279. Wray, Alison (2002): Formulaic Language and the Lexicon. Cambridge.
Petra Storjohann
11. Sinnrelationale Wortschatzstrukturen: Synonymie und Antonymie im Sprachgebrauch Abstract: Sinnrelationen wurden lange als stabile Beziehungen zwischen Wörtern betrachtet. Dabei zeigen gebrauchsorientierte Untersuchungen, dass Sinnrelationen dynamische Phänomene sind, die sich kommunikativen Bedürfnissen anpassen. Neuere Studien erforschen die Prozesse, die zur Herstellung von Gegensatz bzw. Ähnlichkeit erforderlich sind. Sie untersuchen variable Strukturen, ihre Funktionen sowie kontextuelle Bedingungen und erklären, warum einige Antonyme bessere Gegensatzpaare bilden als andere. Dieser Beitrag konzentriert sich auf deutsche und englische Synonyme und Antonyme aus korpus- und psycholinguistischer Perspektive. Im Mittelpunkt stehen Beschreibungen kontextbasierter und variabler Strukturen, in denen sinnverwandte Wörter regelhaft vorkommen. Es wird gezeigt, dass diese Strukturen über diverse Funktionen verfügen und dass mithilfe kognitiver Prozesse unterschiedlich stark konventionalisierte Muster entstehen. Traditionelle Klassifikationen und Definitionen werden im Lichte neuer empirischer Studien kritisch hinterfragt. Neuere Theorien, die sich um die Einbettung flexibler Beziehungen bemühen, werden erörtert. 1 Einleitung 2 Rückblick auf traditionelle Ansätze 3 Korpus- und kognitionslinguistische Perspektiven 4 Theoretische Verortung: Sinnrelationen aus kognitiver Perspektive 5 Desiderata 6 Literatur
1 Einleitung Wortpaare wie alt/neu, Anfang/Ende oder oben/unten gelten gemeinhin als Gegensatzwörter, auch Antonyme genannt. Gefahr/Risiko, sauber/rein dagegen werden als Synonyme bezeichnet. Es gibt zahlreiche Beziehungsarten, in die zwei Wörter miteinander treten können. Die Antonymie und die Synonymie sind darunter diejenigen, die in der Linguistik in der Vergangenheit die größte Aufmerksamkeit erhielten. Andere lexikalisch-semantische Beziehungen wie die Hyponymie (Beziehung der Über- und Unterordnung, z. B. zwischen Tier und Katze), die Meronymie (Teil-von-Beziehung, z. B. zwischen Hand und Finger) und die Inkompatibilität (Beziehung der semanti-
Sinnrelationale Wortschatzstrukturen
249
schen Unverträglichkeit, z. B. zwischen Hund, Katze und Maus) zählen auch zu den sogenannten Sinnrelationen. Sinnrelationen werden auch alternativ als Bedeutungsbeziehungen oder paradigmatische Beziehungen bezeichnet. Die Beschäftigung mit ihnen erfolgte aus verschiedenen Perspektiven. Für die Sprechergemeinschaft und für Fremdsprachenlernende haben diese Relationen u. a. für die Textrezeption und -produktion sowie für den systematischen (Fremd-)Wortschatzerwerb einen großen Stellenwert. Daher entstanden auch Nachschlagewerke wie Antonym- und Synonymwörterbücher. Für Bereiche der Computertechnologie werden Sinnrelationen beispielsweise zur Strukturierung des Wortschatzes nach Domänen oder Konzepten gruppiert. Diese dienen dann u. a. dem Information Retrieval oder der automatisierten Auflösung von sprachlichen Mehrdeutigkeiten. Neurowissenschaftler/innen wiederum können Erkenntnisse über Sinnrelationen zu sprachtherapeutischen Zwecken heranziehen. Dies sind nur einige Disziplinen, die sich mit semantischem Gegensatz, semantischer Ähnlichkeit bzw. Unverträglichkeit, mit Unter- bzw. Überordnung oder Teil-Ganzes-Beziehungen beschäftigen. In diesem Beitrag werden Sinnrelationen vor allem aus der Sicht der lexikalischen Semantik betrachtet. Hier waren lange Zeit lexikalisch-semantische Relationen im Fokus sogenannter strukturalistischer Theorien, wie z. B. in der Wortfeldtheorie des 20. Jahrhunderts. Diese sahen begriffsverwandte Wörter auf der Grundlage sprachphilosophischer, logischer Beziehungen, die bestimmte lexikalische und in sich geschlossene Begriffsbereiche konstituieren (z. B. die Verben der Fortbewegung, Farbadjektive oder Verwandtschaftsbezeichnungen) und deren Funktion darin lag, Wortschatz zu gliedern. Die Zerteilung des Wortschatzes und die Analyse der Bedeutung einzelner Mitglieder eines Wortfeldes basierten auf intuitiven Einschätzungen einzelner Kontexte. Sinnrelationen existierten zwischen isolierten Wörtern eines bestimmten (Wort-)Feldes. Semantiker/innen erarbeiteten erschöpfende Klassifikationen von Sinnrelationen auf der Basis strikter formalisierter und wahrheitsfunktional Bedingungen und etablierten eine stringente Terminologie, die bis heute in gängigen Lehrwerken anzutreffen ist. Unter welchen Bedingungen werden Synonyme aber im Sprachgebrauch miteinander verwendet? Wie groß ist der Grad an semantischer Überlappung bei Synonymen tatsächlich? Wie sind Antonyme im Kopf abgespeichert und wie kann man ihren Gebrauch tatsächlich in verschiedenen Kontexten beobachten? Wie stark variiert die Wahl von Antonymen je nach Kontext und je nach Sprechergruppe? Wie stark werden Antonyme miteinander assoziiert? Entstehen Sinnrelationen kontextuell im Gebrauch oder sind sie im Kopf der Sprecher/innen fest verankert? Antworten auf diese Fragen lieferten die strukturalistischen Modelle nicht. Es sind die neueren Forschungsorientierungen, die Sinnrelationen als Beziehungen zwischen Bedeutungen, zwischen Konzepten und/oder zwischen Konstruktionen ansiedeln, denen sich dieser Beitrag näher widmet. Die Erforschung von Sinnrelationen hat sich von den Theorien des 20. Jahrhunderts gelöst, ist heute empirisch fundiert. Die oben erwähnten Fragestellungen versuchen gegenwärtige korpuslin-
250
Petra Storjohann
guistische und kognitive Ansätze zu beantworten, indem sie korpusanalytische und psycholinguistische Methoden heranziehen. Aus korpuslinguistischer Perspektive werden Erscheinungen im Sprachgebrauch untersucht und dafür werden große elektronische Textsammlungen, sogenannte Korpora genutzt. Der kognitive Ansatz konzentriert sich u. a. auf Fragestellungen bezüglich des Grades der mentalen Verankerung lexikalisch-semantischer Beziehungen und der kognitiv-konzeptuellen Bedingungen zur situationsbedingten Manifestierung einer Sinnrelation. Für die Beantwortung dieser Fragen werden überwiegend Experimente herangezogen. Beiden Forschungsorientierungen gemein ist die Betrachtung der Sinnrelationen als Beziehungen zwischen Konzepten und/oder zwischen Konstruktionen, aber nicht zwischen Wörtern. Und auch wenn beide Ansätze über unterschiedliche Methoden verfügen, schließen sie sich nicht aus. Der Bereich der Sinnrelationen, und im Besonderen das Phänomen der Antonymie, stellt einen der wenigen Ausnahmen dar, in denen Studien mit unterschiedlichen Ansätzen und Verfahren kollaborativ zu einem gemeinsamen semantischen Modell geführt haben. Korpuslinguistische wie kognitive Strömungen sowie die Möglichkeit Sinnrelationen theoretisch neu zu verorten, werden in diesem Beitrag näher erläutert. Dabei wird sich auf solche Beziehungen gestützt, die in der jüngsten Vergangenheit besondere Beachtung erfuhren und zahlreiche neue Impulse lieferten: die Antonymie und die Synonymie. Dies geschieht vor allem vor dem Hintergrund englischer und deutscher Analyseergebnisse. Forschungslücken, die für weitere Beziehungen, z. B. der Hyponymie, Meronymie und Inkompatibilität vorliegen, werden ebenso explizit offengelegt.
2 Rückblick auf traditionelle Ansätze Die Erforschung von Sinnrelationen hat in der lexikalischen Semantik eine lange Tradition, vor allem innerhalb verschiedener europäischer Strömungen des 20. Jahrhunderts, wie des Strukturalismus (z. B. Lyons 1968, Cruse 1986) und des Generativismus (z. B. Bierwisch 1987). Ihre Ansätze prägten die linguistischen Vorstellungen über Bedeutung und lexikalische Paradigmen. Sinnrelationen wurden als Beziehungen zwischen lexikalischen Einheiten (also Wörtern) oder ihren abstrahierten Grundformen (also Lemmata) betrachtet, welche innerhalb eines gegebenen Syntagmas (z. B. eines Satzes) in lexikalisch-syntaktischer Hinsicht austauschbar sind (siehe Abbildung 1).
251
Sinnrelationale Wortschatzstrukturen
Position 1
2
3
Die Stadt Mannheim
sucht
händeringend Tagesmütter
4
5
6
7
zur
Betreuung
von Kleinkindern.
8
Die Stadt Heidelberg
braucht
dringend
Tagesväter
Beaufsichtigung
Kindern.
Die Stadt Darmstadt
benötigt
akut
Erzieherinnen
Coachen
Schulkindern.
Die Stadt Frankfurt
möchte
umgehend
Kinderpflegerinnen
Pflege
Säuglingen.
Abb. 1: Paradigma mit unterschiedlich besetzten Positionen
Die Wörter, die an den einzelnen Positionen ausgetauscht werden könnten, z. B. unter Position 2 suchen, brauchen, benötigen, möchten oder auch unter Position 6 Betreuung, Beaufsichtigung, Coachen, Pflege gehören der gleichen Wortklasse an und bilden ein Paradigma. Diese stehen in paradigmatischer Beziehung zueinander, sie bilden Wortfelder. Eine weit verbreitete Meinung war es u. a., dass sich die Bedeutung eines Wortes aus seinen Beziehungen zu anderen (meist paradigmatisch) verwandten Wörtern oder Wörtern des gleichen semantischen Feldes konstituiert. Daher waren paradigmatische Relationen für die Wortfeldforschung von zentraler Bedeutung. Sprache wurde als autonomes, geschlossenes und relationales System mit festen Strukturen und Beziehungen dargestellt. Wörter wurden als Einheiten betrachtet, deren Bedeutung sich aus semantischen Merkmalen zusammensetzt, und die demnach auch in Einzelkomponenten, sogenannte Seme, zerlegbar sind (z. B. mittels Komponentenanalyse) (siehe Tabelle 1). Tab. 1: Beispiele für Komponentenanalyse Erzieherin Erzieher
Kinder pflegerin
Kinder pfleger
Tagesvater
Tages mutter
MENSCH
+
+
+
+
+
+
ERWACHSEN
+
+
+
+
+
+
MÄNNLICH
–
+
–
+
–
+
WEIBLICH
+
–
+
–
+
–
BERUF MIT KINDERN
+
+
+
+
+
+
ÖFFENTLICH GEREGELTE PÄDAGOGISCHE ERGÄNZUNGSKRAFT
–
–
+
+
–
–
ÖFFENTLICH GEREGELTE PÄDAGOGISCHE FACHKRAFT
+
+
–
–
–
–
Auf diese Weise wurden Wörter isoliert und kontextlos in Einzelmerkmale segmentiert, die der semantischen Beschreibung dienten. Die einzelnen Wörter nahmen innerhalb ihrer semantischen Felder bestimmte Positionen ein und verfügten über
252
Petra Storjohann
bedeutungsetablierende Beziehungen zu anderen Wörtern des gleichen lexikalischsemantischen Netzes. Das heißt, die Bedeutung eines Wortes wird durch seine Position im Paradigma und durch seine Bedeutungsbeziehungen zu anderen Elementen des gleichen Paradigmas im jeweiligen Sprachsystem determiniert. Dies geschieht auf der Basis inhärenter, primitiver und z. T. universeller Merkmale und Prinzipien. Auf der Basis dieser Grundannahme entstanden neben den detaillierten semantischen Auseinandersetzungen und Klassifikationsmodellen umfassende Beschreibungen, Gruppierungsversuche und theoretische Verortungen, u. a. Lyons 1968, 1977; Bierwisch 1984; Lutzeier 1981; Cruse 1986. Diese Arbeiten lieferten systematische Beschreibungen von Sinnrelationen, die tief in formal-logischen und sprachanalytisch-philosophischen Traditionen verwurzelt waren. Die Arbeit von Cruse (1986) stellt den Höhepunkt umfassender und erschöpfender Taxonomien und einer Terminologisierung dar. Vor dem Hintergrund des Britischen Kontextualismus basiert Cruses Werk bereits auf einem stärker kontextualisierten Semantikverständnis und ebnet damit den Weg von der Betrachtung der Sinnrelationen im Sprachsystem hin zu Untersuchungen im Sprachgebrauch. Aus heutiger Sicht wird besonders kritisiert, dass die verschiedenen Arbeiten es nicht vermochten, die Flexibilität von Sinnrelationen im tatsächlichen Sprachgebrauch angemessen zu erklären. Darüber hinaus basierten ihre Annahmen nicht auf empirischen Auswertungen umfangreicher sprachlicher Daten. Schaut man sich etwa das Wort regional in Antonymwörterbüchern an, wird dort i. d. R. überregional als prototypisches Gegensatzwort gebucht. Im tatsächlichen Sprachgebrauch aber benutzen Sprecher/innen den Ausdruck regional deutlich flexibler, setzen das Wort je nach kontextuell-thematischer Fokussierung in vielfältige Gegensatzbeziehungen ein (siehe Tabelle 2, Beispiele aus elexiko). Tab. 2: Variierende Gegensatzwörter zu regional Perspektive
Gegensatzpartner
Beispiel aus DeReKo
Kontrastierung mit der nächstkleineren geografischen Einheit
bezirklich lokal örtlich
1. Wo künftig Neubauten entstehen, sollen Ausgleichsflächen nicht mehr lokal, sondern regional der Natur zu ihrem Recht verhelfen.
Kontrastierung mit der nächstgrößeren, landschaftsübergreifenden geografischen Einheit
bundesweit 2. In seiner fünften Auflage hat sich der Neue grenzüberschreitend Deutsche Jazzpreis endgültig etabliert – nicht staatlich nur regional, sondern bundesweit. überregional
Kontrastierung mit einer Eigenschaft bezogen auf eine politisch-geografische Größe
national
3. Der Hauptkonkurrent, die Sparkassen, verweisen ebenfalls auf ihre hohe Wohnbaukompetenz, auf 160 Filialen in Oberösterreich und 300 in ganz Österreich, „wodurch die Hypo nicht nur regionale, sondern nationale Bedeutung bekommt“.
Sinnrelationale Wortschatzstrukturen
253
Tab. 2: (fortgesetzt) Perspektive
Gegensatzpartner
Beispiel aus DeReKo
Kontrastierung mit einer Eigenschaft bezogen auf einen Zusammenschluss mehrerer politisch-geografischer Einzelgebilde
europäisch
4. Warum also sollte regionale Vielfalt und ökologisierte Produktion volkswirtschaftlich teurer sein als die Folgen des mit vielen Tiertransporten erkauften europäischen Einheitselends?
Kontrastierung mit weltumspannenden geografischen Einheiten
ausländisch global international weltweit
5. In Europa wird der Fussball immer stärker zur Nummer 1. In der Schweiz dagegen herrscht Konkurrenz durch andere Sportarten wie Skifahren und Eishockey. Sportarten, die nicht wie der Fussball globale, sondern nur regionale Bedeutung haben.
Die Partner sind Kontrastierungen zu regional, die einer bestimmten Stufung von der kleinsten geografischen Einheit bis zur größten Einheit folgen. Je nach thematischer Fokussierung kann regional entweder mit jeweils kleineren (z. B. lokal) oder größeren Einheiten bzw. Größenordnungen (z. B. national) im Gegensatz stehen. Gleichzeitig kann es gleichwertig als eine Option neben zahlreichen anderen thematisiert werden, ohne eine Kontrastierung vornehmen zu müssen. Im Gegensatz zur den Beispielen aus Tabelle 2 wird regional in Beispiel 6 nicht konträr zu anderen Eigenschaftsbezeichnungen gesetzt, sondern nur inkompatibel. Dieses Wort variiert demzufolge nicht nur in seinen Gegensatzbeziehungen, sondern wird auch für die Etablierung anderer Beziehungsarten benutzt (zur Definition der einzelnen Beziehungen siehe Abschnitt 2.1). 6. Von dieser Zentrale aus sind sämtliche lokalen, regionalen, nationalen und internationalen Kommunikationen über Funk, EDV oder Telekommunikation möglich. (DeReKo)
Die Reihenfolge mehrerer Eigenschaftsbezeichnungen solcher räumlichen Bezugspunkte, wie sie im Beispiel 1 genutzt wird, verdeutlicht dabei die Stufung geografischer Einheiten. Der Terminus Sinnrelation steht heute für verschiede relationale Phänomene, je nach Betrachtungsweise und Disziplin. Die nachfolgende Darstellung lehnt sich mit der Verwendung von Sinnrelation auf ein neueres Verständnis im Sinne von Croft/ Cruse (2004) an und bezieht sich auf ein kontextgebundenes, im Sprachgebrauch variabel konstruiertes Phänomen.
254
Petra Storjohann
2.1 Definitionen und Klassifikationen Die Arbeiten von Lyons (1968), Cruse (1986) und Lutzeier (1981) sind vom Streben nach erschöpfenden Klassifikationsmodellen geprägt, die Sinnrelationen innerhalb stabiler und sezierbarer Wortschatzstrukturen formal-linguistisch definieren. Sie erarbeiteten eine an die sprachanalytische Philosophie und Logik angelehnte Terminologie. Definitionen zu paradigmatischen Beziehungen schlossen formal-logische Kriterien ein. Diese wurden z. T. als Testrahmen in Aussagen eingearbeitet, mit denen der Wahrheitsgehalt von Aussagen über semantische Inbegriffenheit oder semantischen Ausschluss überprüfbar gemacht wurde. Damit wurde die Existenz von Synonymie oder Hyperonymie gewissermaßen operationalisierbar. Das komplexe System formal definierter Sinnrelationen wurde ggf. mithilfe introspektiver Beispielsätze illustriert. Nachfolgend werden die wichtigsten Beziehungsarten kurz skizziert. Binäre Opposition: Die Beziehung der binären Opposition (hier generell als Antonymie bezeichnet) wurde traditionell in folgende Kategorien unterteilt: Komplementarität, Kontrarität/Graduierbare Antonymie, Reversivität und Konversivität/Konversität. Komplementarität wurde als logische Relation der binären Kontradiktion verstanden, die Ausdrücke eingehen, die semantisch nicht graduierbare Zustände oder Eigenschaften bezeichnen und die eine konzeptuelle Domäne in zwei sich gegenseitig ausschließende Sektionen trennen (z. B. tot/lebendig, verheiratet/ledig). Aus der Aussage X ist nicht tot folgt notwendigerweise der logische Schluss X ist lebendig und ebenso umgekehrt. Eine Aussage wie X ist tot und gleichermaßen lebendig kann daher nicht wahr sein. Bei der Kontrarität oder Antonymie im engeren Sinn wird dagegen eine Beziehung des Kontrastes hergestellt, bei der sich auf einen Wert oder einen Grad auf einer Skala bezogen wird, der variable Eigenschaften aufweist, wie etwa Länge, Geschwindigkeit oder Gewicht. Antonyme sind daher meist semantisch graduierbare Adjektive, die konträre Pole oder Grade auf dieser Skala bezeichnen (z. B. lang/kurz, heiß/kalt). Aussagen wie X ist lang impliziert X ist nicht kurz und umgekehrt. Aber aus der Aussage X ist nicht lang kann nicht geschlussfolgert werden X ist kurz, und umgekehrt impliziert X ist nicht kurz nicht die Aussage X ist lang. Reversivität besteht z. B. zwischen steigen und fallen oder hoch und runter, also zwischen Wörtern, die Bewegung oder Direktionalität in entgegengesetzte Richtungen entlang eines Weges mit gemeinsamem Referenzpunkt (z. B. einem Ausgangspunkt) bezeichnen. Während ein Ausdruck X darauf abzielt, eine Bewegung ausgehend von einem Ausgangspunkt A in eine bestimmte Richtung (etwa nach B) zu kennzeichnen, bezeichnet Y eine vom Ausgangspunkt entgegengesetzte Bewegung (etwa nach C). In Abhängigkeit des lokalen oder auch qualitativen (z. B. bei stärken/schwächen) Orientierungspunktes können unterschiedliche direktionale Oppositionen bezeichnet werden (auch von A nach B vs. von B nach A). Konversivität ist eine Beziehung der logischen Äquivalenz zwischen Wörtern, die zeitlich oder räumlich relationale Konzepte bezeichnen und zwischen denen jeweils ein Perspektivwechsel zum Ausdruck gebracht wird (z. B.
Sinnrelationale Wortschatzstrukturen
255
kaufen/verkaufen). Dazu zählen auch Verwandtschafts- und Beziehungsbezeichnungen wie Eltern/Kind oder Arzt/Patient. Synonymie: Die Beziehung der Synonymie (Bedeutungsäquivalenz) wurde traditionell in absolute/totale (z. B. Stockwerk/Etage, Apfelsine/Orange), partielle/propositionale (z. B. Brötchen/Semmel, Gesicht/Antlitz) und kognitive/nahe (z. B. kalt/kühl) Synonymie unterteilt. Diese Unterteilung unterlag unterschiedlichen Kriterien, die den Grad und die Art der Bedeutungsdifferenzen oder die kontextuelle Austauschbarkeit näher bestimmen, wie z. B. expressive, stilistische oder diskursive Nuancen, unterschiedliche Präferenzen bei der Wahl kontextueller Mitspieler (vgl. Cruse 1986, 273), unterschiedliche wahrheitsbedingte Implikationen (vgl. Lyons 1968, 450). Die Typologie der Synonymie variiert in der Literatur (vgl. Adamska-Sałaciak 2013), aber die herangezogenen Merkmale zur Definition einer Synonymiebeziehung schließen tief in der strukturalistischen Tradition verankerte Parameter ein: z. B. Symmetrie, Transitivität, Reflexivität und Substituierbarkeit. Hyponymie, Meronymie, Inkompatibilität: Auch Beziehungsarten wie die Hyponymie/Hyperonymie (Unter- bzw. Überordnung), Meronymie (Teil-von-Beziehung) und die Inkompatibilität (Beziehung zwischen Ko-Hyponymen) wurden lange im Sinne logisch-formaler Definitionen zwischen Wörtern oder alternativ zwischen den Bedeutungen von Wörtern beschrieben. Die Hyponymie wird als Beziehung des einseitigen semantischen Einschlusses im Sinne der Unterordnung betrachtet, wie zwischen Hund und Tier oder auch Apfel und Obst. Ihr kommt damit eine wortschatzstrukturierende Funktion zu (siehe Cruse 2004, 148). Klassisch definiert man Tier als das Hyperonym, das ein allgemeineres und damit übergeordnetes Konzept bezeichnet. Ein Hyponym (Hund) ist dagegen eine Unterart, ein spezieller Typ oder Vertreter der übergeordneten Klasse. Die Bedeutung von Es ist ein Tier ist in der Bedeutung der Aussage Es ist Hund inbegriffen. Umgekehrt existiert aber keine semantische Inklusion. Hat ein Hyperonym, z. B. Tier, mehrere Hyponyme (etwa Hund, Katze, Maus), so sind diese durch Inkompatibilität (Kohyponymie) miteinander verbunden. Diese besteht also zwischen Elementen der gleichen hierarchischen Ebene und damit zwischen Ausdrücken, die sich auf das gleiche semantische Feld beziehen oder innerhalb der gleichen Domäne befinden. Sie bilden eine Gruppe von Ausdrücken, die spezielle Arten ihres gemeinsamen übergeordneten Konzepts bezeichnen. Gleichzeitig bezeichnen sie individuelle Klassen und teilen dabei keine Mitglieder ihrer Klassen. Inkompatible Ausdrücke können nicht gleichzeitig gebraucht werden, ohne einen Widerspruch zu implizieren. Wenn etwas ein Hund ist, impliziert das, dass es sich nicht gleichzeitig um eine Katze oder eine Maus handeln kann und umgekehrt. Als Partonymie (auch Meronymie) bezeichnet man eine Teil-von-Beziehung, die zwischen zwei Konzepten besteht, die die Vorstellung eines Inhaltes oder eines Bestandteils von etwas zum Ausdruck bringt. (z. B. Finger/Hand). Finger ist ein fester
256
Petra Storjohann
Bestandteil einer Hand, aber kein Anhang. Schwieriger wird es bei Konzepten wie ‚See‘ oder ‚Teich‘, die auch als Teil eines Parks betrachtet werden können, aber kein notwendiger Bestandteil davon sein müssen. Cruse (1986) und auch Croft/Cruse (2004) haben die Schwierigkeiten bei der Definition und Einschätzung des Konzeptes Part, also Teil herausgearbeitet. Dazu gehört eine unklare Unterteilung in Segment, Portion, Teil, Element etc., die allesamt von Sprecher(inne)n unterschiedlich beurteilt werden. So sind sich nach Croft/Cruse 2004, 155–156) Sprecher/innen uneins darüber, ob z. B. die Glühbirne und die Batterie gleiche Arten von Teilen einer Taschenlampe sind, auch wenn sich beide im Körper des Gegenstandes befinden. Normalerweise ist eine Glühbirne enthalten, während das bei einer Batterie nicht der Fall sein muss. Die Frage, was als Bestandteil bestimmter Gegenstände zählt und was nicht, kann daher nicht immer hinreichend beantwortet werden. Bis heute wurde bei der Meronymie nicht hinreichend geklärt, wo die Grenze einer gesamten Entität liegt. Probleme der Definitionen: Die vollständige Einordnung verschiedener im Sprachgebrauch vorkommender Sinnrelationen nach etablierten formallogischen Kriterien wurde nie umfassend empirisch geprüft. Die in der Literatur vorkommenden Beispiele einzelner Unterarten von Gegensatz etwa sind intuitiv gewonnen. Probleme bestehender Kategorisierungen von Gegensatzbeziehungen wurden u. a. von Philpotts (2001) für zahlreiche englische und deutsche antonymische Adjektivpaare identifiziert. Mithilfe kognitionslinguistischer Verfahren (siehe dazu z. B. Abschnitt 3.2) deckte sie zahlreiche sogenannte Hybridantonyme auf, die weder eindeutig der Antonymie im engeren Sinne noch der Komplementarität zugeordnet werden können. Diskrepanzen und Grenzen herkömmlicher Gruppierungen schließen aber auch Wortpaare ein, bei denen ein Ausdruck die morphologisch-abgeleitete Form des anderen Ausdruckes ist, wie etwa intelligent/unintelligent, gefährlich/ungefährlich. Während die negierte Form einen absoluten Zustand oder eine absolute Eigenschaft bezeichnet (X ist ungefährlich heißt X ist nicht gefährlich und umgekehrt) und damit eher einen Kandidaten für eine komplementäre Beziehung darstellt, ist die unmarkierte Form eher den graduierbaren Antonymen zuzuordnen. Negierte Formen galten lange generell als nicht graduierbar. Resultate experimenteller Studien (z. B. Philpotts 2001) sowie Untersuchungen umfangreicher Korpusdaten (z. B. Storjohann 2011) zeigen hingegen, dass im Sprachgebrauch durchaus Abstufungen negierter Formen zum Ausdruck gebracht werden (siehe z. B. auch Beispiele 7 und 8). 7. Das Fleisch von Rindern, Schweinen und Geflügel soll für die KonsumentInnen in Europa etwas ungefährlicher werden. (die tageszeitung, 16.12.1998, S. 8) 8. Fondsanleger sind auch nicht unintelligenter als andere, tröstet Currier: Jeder Anleger ist immer wieder Trendmitläufer (Die Presse, 11.09.2000, Wer stets nur in erfolgreiche Fonds investiert, verliert)
Sinnrelationale Wortschatzstrukturen
257
Ungeachtet der zugrunde gelegten Analysemethoden zeigen empirische Studien, dass die vom Strukturalismus angebotenen Definitionen bei der Einordnung von Sinnrelationen, wie sie im Sprachgebrauch tatsächlich vorkommen, Diskrepanzen und Lücken aufweisen. Eine weitere Schwierigkeit wird von Paradis u. a. (2009) hervorgehoben. Ihre Untersuchung zur Stärke der Affinität, sprich der gegenseitigen Assoziation zwischen Antonymen (auch Kanonizität genannt), sollte Auskunft darüber erteilen, wie konventionalisiert zwei Ausdrücke im Gebrauch miteinander vorkommen, wie sie im mentalen Lexikon gemeinsam abgespeichert sind und wie tief sie daher miteinander mental und sprachlich verwurzelt sind. Ihre Arbeit basiert sowohl auf experimentellen als auch auf korpuslinguistischen Analysetechniken und zeigt, wie unterschiedlich die gegenseitige Affinität eines Antonympaares bewertet wird. Dementsprechend werden einige Antonympaare als gute (kanonische Antonyme) interpretiert, während andere als weniger gute Kombinationen (nicht-kanonische Antonyme) eingestuft werden. Existierende Modelle, die sich auf logische Inkompatibilitäten stützen, vermögen es nicht, die weniger salienten, also nicht-kanonischen Paare einzugliedern und sie können die Flexibilität und Variabilität im Gebrauch unterschiedlicher Antonympaare nicht erklären. Paradis u. a. (2009) plädieren aufgrund ihrer Erkenntnisse für Definitionen von Gegensatzbeziehungen, die sowohl lexikalische, semantische, konzeptuelle als auch diskursive Aspekte miteinbeziehen. Eine theoretische Beschreibung des Gegensatzes muss ebenso Erklärungen zu semantischen Unterschieden als auch zu Gemeinsamkeiten einschließen und darf nicht ausschließlich auf Kriterien des logischen Ausschlusses fußen. Kritik gibt es aber auch in Bezug auf Synonymklassifikationen. Selbst wenn die üblicherweise angenommenen Kriterien, wie das Kriterium der Austauschbarkeit, hinreichend in formalsemantischer Sicht greift, steht nicht fest, dass diese Ausdrücke tatsächlich im Sprachgebrauch jemals miteinander ausgetauscht werden (Harras 2001; Murphy 2003). Kleinere gebrauchsbasierte Studien englischer Synonyme (Partington 1998; Murphy 2003; Moon 2013) sowie deutscher Bedeutungsäquivalente (Storjohann 2009, 2010; Marková 2012) zeigen deutlich, wie linguistische Muster und die Wortwahl an unterschiedlich spezifische, kommunikative Notwendigkeiten angepasst werden. In Beispiel 9 und 10 wird eine Beziehung zwischen sauber und rein hergestellt, die je nach Sprecherintention variiert. In Beispiel 4 wird kontextuell semantische Äquivalenz dadurch hergestellt, dass mögliche semantische Unterschiede neutralisiert werden, während in Kontext 5 eine Beziehung des Kontrastes konstruiert wird, indem die semantischen Unterschiede hervorgehoben werden. 9. Die Gänge sind, wie der Lokalaugenschein zeigt, sauber. Nicht so rein sind hingegen die Schächte der U-Bahnen. (DeReKo) 10. Sydney, die kosmopolitische Millionenstadt, wirkt so herausgeputzt, daß sie nicht nur sauber ist, sondern rein […] ist. (DeReKo)
258
Petra Storjohann
Bedeutungsäquivalenz wird im Sprachgebrauch kontextuell konstruiert, Synonyme werden je nach Bedarf variabel eingesetzt. Synonymie existiert nicht losgelöst vom Kontext aufgrund fester, atomar zerlegbarer, inhärenter Merkmale, die zwei Ausdrücken innewohnen. Synonymie ist ein kontextabhängiges, sich erst im Gebrauch herstellendes und daher auch dynamisches Phänomen, das konkrete Formen linguistischer Realisierung aufweist und bei dem kognitive Mechanismen und sprachliches Wissen über Prinzipien des Vergleichens, Inkludierens und Abgrenzens, je nach kommunikativem Bedürfnis auch variabel, im Spiel sind (vgl. auch Adamska-Sałaciak 2013). Diese Flexibilität hat natürlich auch ihre Grenzen. Auch in Bezug auf die Hyperonymie stellt Cruse (2004) fest, dass solange prototypische Konzepte miteinander in Bezug gesetzt werden, sogenannte Standardinterpretationen hervorgerufen werden können, die generell die notwendigen Wahrheitsbedingungen dieser als transitiv definierten Beziehung erfüllen. A) A car seat is a type of seat. B) A seat is a type of furniture. C) *A car seat is a type of furniture.
Nach dem Kriterium der Transitivität könnte man die Gültigkeit der Aussage C aus der Gültigkeit der Aussagen A und B schlussfolgern. Der Satz Ein Autositz ist eine Art Möbelstück garantiert aber nicht einen wahrheitsgemäßen Schluss. Darüber hinaus zeigt Croft/Cruse (2004, 147), dass Sprecherinnen und Sprecher sehr viel flexibler mit hyponymen Beziehungen im Sprachgebrauch umgehen. Er führt das Beispiel Hund/Haustier als Variante von Hund/Tier auf. Hund ist vielleicht kein prototypisches Hyponym von Haustier, sondern eher ein Hyponym von Tier. Sprecher/innen verbinden durchaus intuitiv beide Ausdrücke durch eine hyponyme Beziehung, wenn die nötigen spezifischen Domänen anstelle der prototypischen Interpretation Tier konstruiert werden. So befinden sich Hund und Haustier genauso wie Hund und Tiere gleichermaßen in hyponymen Beziehungen, solange spezielle kommunikative Bezüge und dementsprechend semantische Inhalte kontextuell angepasst sind. Nähere Betrachtungen des Sprachgebrauchs brachten also an Licht, dass unter bestimmten kontextuellen Voraussetzungen viele lexikalische Einheiten miteinander verbunden werden können, da diese dynamische und variabel sind. Formalsemantische Definitionen werden den Eigenarten und dem Verhalten dieser Beziehung aus gebrauchsbasierter Sicht nicht gerecht, stellten aber eine gewissen Basis für die Gliederung dieser Art von Wortschatzstrukturen dar.
2.2 Paradigmatische vs. syntagmatische Beziehungen Lexikalisch-semantische Beziehungen wurden lange in paradigmatische (vertikale) oder syntagmatische (horizontale) Strukturen unterteilt. Wie Abbildung 1
Sinnrelationale Wortschatzstrukturen
259
zeigt, wurden Synonymie, Antonymie, Hyponymie, Meronymie etc. den vertikalen Beziehungen zugeordnet, da es sich bei ihnen um sinnverwandte Ausdrücke eines lexikalisch-semantischen Paradigmas (z. B. eines Wortfeldes, also um Ausdrücke der gleichen Wortart) handelt. Syntagmatische Strukturen sind auf Beziehungen zwischen benachbarten lexikalischen Einheiten (meist unterschiedlicher Wortart) beschränkt, die ein Wort konkret kontextuell umgeben, z. B. in Form von Kollokatoren (siehe Belica/Perkuhn in diesem Band). Kognitive und korpuslinguistische Untersuchungsergebnisse zeigen aber, dass Wörter des gleichen lexikalisch-semantischen Paradigmas und damit der gleichen Wortart in gemeinsamen Syntagmen, also innerhalb einer sprachlichen ‚Kette‘ zusammenhängender Wörter, regelhaft miteinander vorkommen. Dies wurde zunächst für englische Gegensatzpaare mehrfach bestätigt (Justeson/Katz 1991; Mettinger 1994; Jones 2002), aber auch für schwedische (Willners 2001) und japanische (Muehleisen/Isono 2009) Antonyme gezeigt. Alle Studien bestätigen, dass Antonyme in gleicher lexiko-grammatischer Umgebung innerhalb eines Satzes systematisch und usuell miteinander vorkommen (siehe dazu 3.1) und daher als paradigmatische Strukturen syntagmatische Erscheinungsformen aufweisen. Nur weil zwei Wörter semantisch gegensätzlich sind, können sie im gemeinsamen Kontext eine kontrastive Beziehung erzeugen. Aber auch andere Sinnrelationen zeigen syntagmatische Muster, in denen sie Bedeutung manifestieren. Eine strikte Trennung, die kontextuelle Ausprägungen ignoriert, sollte daher infrage gestellt werden.
3 Korpus- und kognitionslinguistische Perspektiven Sinnrelationen werden heute aus zwei datenbasierten Perspektiven untersucht, mit korpuslinguistischem Fokus, um statistische Auswertungen zu Kontext und zur Distribution vornehmen zu können, und aus kognitiver Sicht unter Heranziehung experimenteller Methoden, um diverse kognitionslinguistische Fragen beantworten zu können. Beide Strömungen arbeiten mit unterschiedlichen Methoden. Dennoch ist ihnen der Gedanke gemein, dass Sprache ein dynamischer, sozial-interaktiver Prozess ist und dass ein enger Zusammenhang zwischen Sprache, Konzept, Bedeutung, Konvention und Wissen besteht. Beide Ansätze haben dazu beigetragen, neue Erkenntnisse über die Natur sinnrelationaler Strukturen zu gewinnen und haben damit auch die linguistischen Fragestellungen verändert. Heute wissen wir, wie sehr die empirische Wende in der Linguistik die Forschung der Sinnrelationen revolutionierte und das Interesse auf die dynamische Natur und das flexible Verhalten von Beziehungsgeflechten in Text und Diskurs lenkte. Die Antonymie ist dabei auf größeres Interesse gestoßen als andere Beziehungsarten und hat den entscheidenden Impuls zur Erforschung lexikalisch-semantischer Relationen aus neuen Perspektiven und mit neuen Methoden geliefert (z. B. Philpotts 2001; Willners 2001; Jones 2002; Murphy 2003, Murphy u. a. 2009; Muehleisen/Isono 2009; Paradis u. a. 2009).
260
Petra Storjohann
3.1 Sinnrelationen im Text Beziehungen des Gegensatzes: Einen Meilenstein bei der Erforschung antonymischer Strukturen stellt die Arbeit von Jones (2002) dar, der erstmals umfassend das kontextuelle Verhalten englischer Gegensatzpaare anhand von Korpusdaten im öffentlichen Sprachgebrauch untersuchte, dabei sprachliche Daten als Evidenzen nutzte und statistische Verfahren heranzog, um Aussagen zu Häufigkeiten, gegenseitigem Vorkommen und Verteilung treffen zu können. Jones identifiziert zahlreiche lexiko-grammatische „Schablonen“ (templates), in die Antonympaare (X und Y) typischerweise miteinander eingebettet sind. Diese sind beispielsweise charakteristische Koordinationsstrukturen (siehe Tabelle 3). Die Ergebnisse bestätigen die frühere Annahme, dass Antonyme regelhaft miteinander vorkommen und zwar auf statistisch signifikante Weise (Justeson/Katz 1991). Ein weiterer inhaltlicher Schwerpunkt liegt auf der Erfassung unterschiedlicher Text- bzw. Diskursfunktionen (discourse functions) der identifizierten Antonymmuster. Die häufigsten darunter sind die Folgenden (englische Beispiele aus Jones 2002 und Jones u. a. 2012, deutsche Beispiele aus DeReKo): Tab. 3: Antonymschablonen Schablone
englisch
deutsch
Typ
X and/or Y both X and Y (n)either X nor Y either Y or Y X and Y alike X as well as Y
11. It would be good to hear all experiences, good as well as bad.
12. Man kann auf ehrliche und unehrliche Leute stoßen.
Coordinated Antonymy
sentential two-pair 13. The teacher is active and contrast between the student is passive. X/Y and A/B
14. Oft erwiesen sich gerade die besten Praktiker als schlechte Theoretiker.
Ancillary Antonymy
more X than Y X is more than Y X rather than Y X as … as Y
15. In every part of the country, more people think badly of him than think well.
16. Die geplante Beteiligung könnte mehr Nachteile als Vorteile bringen.
Comparative Antonymy
X not Y X instead of Y X as opposed to Y
17. Sponsors want to invest in success, not failure.
18. Wahre Freunde erkennt man nicht in guten, sondern erst in schlechten Tagen.
Negated Antonymy
20. Die Machtverteilung zwischen alten und neuen, großen und kleinen Mitgliedern scheint geglückt.
Distinguished Antonymy
between X and Y 19. To them, […], the distincseparating X and Y tion between fact and X differ from Y fiction or good and bad is not always so obvious.
Sinnrelationale Wortschatzstrukturen
261
Tab. 3: (fortgesetzt) Schablone
englisch
deutsch
Typ
from X to Y, turning X into Y X gives way to Y
21. But it’s been strangely quiet in Twickenham over the last week or two, and I must say my optimism is turning to pessimism.
22. Was schwer war, wird leicht, was schmucklos war, beginnt zu glänzen.
Transitional Antonymy
Sprecher/innen machen sich diese Schablonen zunutze, um einen Kontrast zwischen zwei Konzepten sprachlich zu realisieren. Die Muster selbst demonstrieren spezifische lexiko-grammatische Eigenschaften. In Kontexten mit koordinierenden Schablonen etwa wird angedeutet, dass das Gesagte in Bezug auf beide entgegentretende Konzepte zutrifft. Aber ebenso werden dazwischen liegende Zustände subsumiert und inkludiert, wie z. B. X und auch genauso Y. Auf diese Weise wird der Unterschied zwischen den normalerweise oppositionellen Kategorien etwas neutralisiert. Bei der Komparativen Antonymie wird ein Antonym mit dem anderen direkt verglichen. Mithilfe des Musters mehr X als Y erhält das bezeichnete Konzept in seiner Beschreibung eine zusätzliche Präzision. Jede einzelne Schablone weist formal gesehen lexikalischgrammatische Merkmale auf und verfügt zusätzlich über semantische Eigenschaften. Jeder Schablone können spezielle Funktionen zugeschrieben werden (vgl. Jones 2002). Beziehung der Bedeutungsäquivalenz: Die Synonymforschung hat gegenwärtig zwei Ausprägungen: Zum einen werden feine semantische Unterschiede zwischen sogenannten Nahe-Synonymen ermittelt, um detaillierte Überlappungen sowie Differenzen im kontextuellen Verhalten ermitteln zu können. Das geschieht durch das gegenseitige Vergleichen von Kollokationsprofilen (also dem Inventar an kontextuellen Mitspielern), um voneinander abweichende Mitspieler zu ermitteln. Für das Englische wurde das anhand zahlreicher Studien gezeigt, um z. B. Kollokationsunterschiede zwischen folgenden Adjektiven herauszufinden: sheer/pure/complete/absolute (Partington 1998), tall/high (Taylor 2003), brave/courageous (Moon 2013). Für das Deutsche überprüfte Marková (2012) Unterschiede zwischen einigen Adjektiven, wie kalt/kühl und schön/hübsch. Dieser Strang der Forschung tendiert dazu, Synonymie tendenziell als lexikalische Beziehung zu betrachten. Erkenntnisse dieser Forschung sind für differenzierte Wörterbuchbeschreibungen und bei der Sprachvermittlung von Bedeutung. Zum anderen gibt es Synonymstudien, die, analog zur englischen Antonymforschung, anhand sprachlicher Muster Bedingungen einer kontextuellen Bedeutungsgleichheit erforschen. So zeigt z. B. Storjohann (2006, 2010) in Anlehnung an Jones (2002), dass Synonyme ebenfalls in spezifischen Schablonen mit diskursfunktionalen Kategorien miteinander verbunden sind (siehe Tabelle 4).
262
Petra Storjohann
Tab. 4: Synonymschablonen Schablone
Beispiel
Typ
X und Y X oder Y X sowie Y X und auch Y
23. Der Streit im Abgeordnetenhaus um die Auflösung der Westberliner Akademie der Wissenschaften […] müßte „von unabhängigen und neutralen Gerichten“ entschieden werden, erklärte die ASJ gestern. (DeReKo)
Koordinierte Synonymie
X, Y, Z 24. Das Volk der Deutschen muss beweglicher, flexibler, agiler X und Y und auch Z werden, verlangt sein grosser Häuptling in Bonn, der trotz seiner Leibesfülle erstaunlich leichtfüssig geht. (DeReKo)
Synonym cluster
25. In der ersten schnellen Runde baut sich bei uns eine um X, sprich Y etwa zehn Grad kühlere Temperatur auf. Ist sie dann im X, was bedeutet Y grünen Bereich, dann ist der Reifen aber schon so abgeX, was so viel heißt fahren, daß nicht mehr der optimale, sprich bestmögliche, wie Y Haftwert erreicht wird. (DeReKo)
Subordinierte Synonymie
Korpusdaten wie aus DeReKo, die überwiegend aus Zeitungstexten bestehen, zeigen Synonyme im öffentlichen Sprachgebrauch häufig in koordinierenden Kombinationen. Sie kombinieren mehrere bedeutungsähnliche Wörter, um auf ein gemeinsames komplexeres, zusammenwirkendes Konzept zu referieren. Eine solche Struktur ist äußerst ökonomisch, wenn viele Informationen übermittelt werden sollen und dabei alle möglichen semantischen Unterschiede zwischen zwei oder mehreren Synonymausdrücken bewusst kontextuell einbezogen werden sollen. Sprecher/innen signalisieren damit semantische Inklusion und Vollständigkeit. Ein möglicher Effekt, der durch die häufige Kombination vorkommen könnte, wäre eine semantische Abfärbung entweder eines Konzeptes auf das andere oder eine gegenseitige semantische Assimilation. Die hängt aber davon ab, wie konventionalisiert die Koordination ist. Subordinierende Strukturen werden dagegen häufiger zur Erläuterung oder Klärung von Begriffen/Konzepten genutzt und sind eher in fachsprachlichen Texten zu finden. Die Analyse der Funktionen der Schablonen signalisiert eher, dass Synonymie konzeptueller Natur ist. Aber genauso aufschlussreich und wenig untersucht ist das Verhalten von konkreten Synonympaaren, die sowohl innerhalb eines Satzes als auch im größeren Kontext miteinander auftauchen. Gefahr und Risiko werden synonym gebraucht und können unter bestimmten Bedingungen kontextuell ausgetauscht werden (siehe Beispiel 26). 26. Die Gefahr, in unmittelbarer Nähe des Atommeilers Krümmel bei Geesthacht an Leukämie zu erkranken, ist für Erwachsene noch höher, als in einer Studie bisher bekanntgeworden war. Die neue Studie über das Risiko für Erwachsene, in der Nähe des Atomkraftwerkes Krümmel bei Geesthacht an Leukämie zu erkranken, enthält mehr Brisanz als bisher angenommen. (DeReKo)
Sinnrelationale Wortschatzstrukturen
263
Storjohann (2010) beobachtete, dass neben Kontexten wie in Beispiel 26, in denen zwei Ausdrücke synonym sind, gleichzeitig andere Kontexte vorliegen, in denen spezifische konzeptuelle Beziehungen zum Ausdruck kommen, die Einbeziehung oder semantische Implikation andeuten (Beispiele 27–29). 27. Wer von „Risiko“ spricht, impliziert Gefahr. (DeReKo) 28. „Hunde sind weniger ein Problem“, sagt Stefanie Gomez, „aber Katzen gelten wegen der Gefahr einer Toxoplasmoseübertragung als Risiko.“ (DeReKo) 29. „Ich werde kein zu großes Risiko eingehen, sonst besteht die Gefahr, dass wir uns für mehrere Wochen schwächen“, sagt Stephan Krautkremer. (DeReKo)
Es werden Beziehungen des semantischen Einschlusses hergestellt, sprachlich realisiert werden sie u. a. mithilfe von Schablonen und zusätzlichen Markern. Wie z. B. in den Rahmen X impliziert Y, X wegen Y, X sonst Y (alternativ X bedeutet Y, X ist nichts als Y, X und gleichzeitig Y) signalisiert wird, werden kausale Relationen durch die Sequenzen konstruiert, in die die beiden Ausdrücke Risiko und Gefahr eingebettet sind. In anderen Fällen sind die von zwei Wörtern bezeichneten Konzepte voneinander abhängig oder semantisch assoziiert. Das wird anhand folgender Kombinationen deutlich: falls X dann Y, X sonst Y (konditional), X um Y, X damit Y (zweck- und ziel orientiert) (Beispiele siehe Storjohann 2010). Diese Beziehungen entstehen zwischen zwei Wörtern, deren Konzepte semantisch dicht miteinander verbunden sind, entweder durch eine Art gegenseitige Assoziation oder Nähe aufgrund von Kausalitäten zwischen den bezeichneten Bezügen, Zuständen oder Sachverhalten. Daher werden die Wörter möglicherweise als ähnlich oder zusammengehörig wahrgenommen und entsprechend kann unter bestimmten kommunikativen Umständen eine Ähnlichkeitsbeziehung bis hin zur Synonymie hergestellt werden. Daraus lässt sich ableiten, dass Synonymie eine konzeptuelle Beziehung ist, die konstruiert wird, vorausgesetzt, die beiden Wörter sind aufgrund von Implikationen, Kausalitäten, Konditionalitäten oder Assoziierungen fest miteinander semantisch verankert, um als ähnlich genug zu gelten. Die in Bezug auf das Deutsche gemachten Beobachtungen bestätigen die Behauptung von Croft/Cruse, dass Sprecher/innen für unterschiedliche Zwecke komplexe Konzepte von Synonymie konstruieren können, abhängig von prototypischen Situationen und von bestimmten Umständen und Kenntnissen über die Welt, den sogenannten „contingent facts about the world“ (2004, 165). Dafür muss sprachliches wie außersprachliches Wissen über die Welt im mentalen Lexikon gespeichert sein, das dann bei Bedarf entsprechend genutzt wird, um Bedeutungsgleichheit herzustellen. Es entscheiden also bestimmte semantische Eigenschaften, konzeptuelle Bindungen und Assoziationen, kommunikative Bedürfnisse und Weltwissen darüber, was als ähnlich oder identisch gelten kann. Der Konstruierbarkeit von Ähnlichkeit sind dabei Grenzen gesetzt (vgl. Croft/Cruse 2004, 144). Bisherige Theorien boten wenig Erklärung für solche Prozesse. Erwähnenswert ist in diesem Zusammenhang der Ansatz von Murphy (2003), der pragmatische Erklärungsmodelle zur Entstehung von Ähn-
264
Petra Storjohann
lichkeiten zur Verfügung stellt. Demzufolge werden zwei Wörter zu Synonymen, wenn ihre Unterschiede gering genug sind, um in bestimmten Kontexten zur Bereitstellung der gleichen kontextrelevanten Information beizutragen (siehe Murphy 2003, 150). Hyponymie, Meronymie, Inkompatibilität: Für die Beziehung der Hyponymie und Meronymie liegen keine größeren systematischen korpusanalytischen Untersuchungen vor. Aber einige plausible, intuitive Schablonen wie X, wie Y und Z, X ist Teil von Y, X und dazu gehören Y und Z, X mit Y und Z, X zusammen mit Y und Z, X bestehend aus Y und Z eignen sich durchaus, um Wortpaare zu ermitteln, die gezielt untersucht werden können (vgl. Beispiel 30, 31). 30. Durch Eltern und ehemalige Schüler werden den Jugendlichen Berufe wie Psychologe, Lehrer, Jurist oder Polizist vorgestellt. (DeReKo) 31. An der Learmonth Terrace stiegen sie aus. Dort erblickte der Junge auf einer gegenüber liegenden, mit hohen Bäumen bestandenen Anhöhe ein dunkles Schloss mit einem spitzen Turm in der Mitte und vielen kleineren Türmen und Türmchen und Erkern drum herum, das von da an sein Leben bestimmen würde. (DeReKo)
Auch für diese Relationen gilt wohl, dass sie aufgrund syntagmatischer Ausprägungen weit mehr als rein paradigmatische Strukturen sind. Für die Inkompatibilität gibt es für das Deutsche kleinere diskursanalytische Studien, die dieser Beziehung weit mehr als wortschatzstrukturierende Funktionen zuweisen. Storjohann (2007) legt eine Studie vor, in der die Funktionen inkompatibler Ausdrücke für Text und Diskurs diskutiert werden. Darin wird argumentiert, dass diese Beziehung als Diskursmarker zur Bildung von Diskursgebrauchsmustern fungiert. Diskursgebrauchsmuster (in Anlehnung an Bubenhofers ‚Sprachgebrauchsmuster‘ 2009) beziehen sich auf thematische Fokussierungen innerhalb eines bestimmten (meist kritischen) Diskurses. Diskursgebrauchsmuster lassen sich gut mithilfe inkompatibler Ausdrücke bei Schlüsselwörtern ermitteln, wie z. B. Globalisierung, Wirtschaftskrise, die soziopolitisch brisante Ausdrücke darstellen. Die kohyponymen Partnerwörter von Globalisierung wirken bedeutungskonstituierend und lassen thematische Fokussierungen zu (vgl. Auszüge aus Wörterbuchbeschreibung in elexiko): –
–
–
Deregulierung, Flexibilisierung, Mobilität, Freihandel, Liberalisierung, Privatisierung, Rationalisierung: In dieser Gruppe sind Bezeichnungen enthalten, die derzeitige weltweite wirtschaftliche Zustände bzw. Entwicklungen charakterisieren. Arbeitslosigkeit, Demokratie, Gerechtigkeit, Kapitalismus, Migration, Modernisierung, Neoliberalismus: Diese Relationspartner beziehen sich auf Auswirkungen, Charakteristika sowie Werte aus dem sozialpolitischen Bereich, die eine globalisierte Gesellschaft kennzeichnen oder unter dem Blickwinkel einer globalisierten Realität neu definiert werden müssen. Computerisierung, Digitalisierung, Informationsrevolution, Kommunikation, Technisierung, Technologie: Bei diesen inkompatiblen Ausdrücken handelt es sich um Bezeichnungen im technologischen Bereich sowie im Bereich der Kommunikation, deren zugrunde liegenden Konzepte für eine globalisierte Gesellschaft auf unterschiedlicher Weise wirken und diese prägen.
Sinnrelationale Wortschatzstrukturen
–
–
265
Amerikanisierung, Europäisierung: Die beiden Partnerwörter betonen in gemeinsamen Kontexten den Aspekt der Art, des Ausmaßes bzw. der Herkunft größerer Entwicklungstendenzen. Umwelt, Klimawandel: Die beiden Ausdrücke betonen den Zusammenhang von Globalisierung und Umwelt und thematisieren beide als zentrale und weltweite Probleme.
Zahlreiche inkompatible Wörter treten zusammen in naher kontextueller Nachbarschaft auf und kommen gemeinsam mit dem Suchwort in regelhaften Strukturen vor. Sie zeigen also ebenfalls Muster, wie etwa koordinierende Schablonen (X und Y) Globalisierung und Kapitalismus oder Globalisierung und Umwelt und fächern die thematische Vielfalt eines Diskurses auf.
3.2 Antonymie aus experimenteller Sicht Psycholinguistisch-experimentelle Untersuchungen gibt es derzeit nur für Antonympaare. Diese richten ihr Augenmerk auf die Frage, wie stark die gegenseitige Anziehung (Affinität) von Antonympaaren ist und wie stark beide gemeinsam im mentalen Lexikon (im Gedächtnis) miteinander verankert sind. Liegt eine hohe gegenseitige Affinität vor, spricht man von kanonischen Antonymen. Kanonizität bezieht sich also auf die Stärke, das Ausmaß und den Grad der Konventionalisierung der gegenseitigen Assoziierung zweier Ausdrücke bzw. Konzepte und daher auch den Grad der Memorisierung in den Köpfen der Sprecher/innen. Mithilfe von Experimenten, z. B. Priming- und Auslassungstests, wurden Antonyme und ihr Verhältnis zum Impulsausdruck (Paradis u. a. 2009) für das Englische und für das Schwedische (Willners/ Paradis 2010) untersucht. In diesem Zusammenhang wurde der Frage nachgegangen, warum einige Antonyme eines Paares stärker miteinander assoziiert werden, daher stärker miteinander verbunden sind und somit als ‚bessere‘ Antonyme beurteilt werden als andere. Sprecher/innen nahmen dabei eine Unterscheidung zwischen nicht antonym, etwas antonym oder gut/stark antonym vor. Die Kombination dieser Tests mit korpuslinguistischen Auswertungen brachte ans Licht, dass statistisch signifikante und auch frequente Antonyme in koordinierenden Strukturen auch diejenigen waren, die häufig als kanonisch, sprich ‚gute‘, stark konventionalisierte Antonyme bewertet wurden. Und umgekehrt: die als ‚schlecht‘ bewerteten Gegensatzpaare tauchen auch im Korpus selten bis gar nicht gemeinsam im Kontext auf. Das heißt, kanonische Antonyme kookkurrieren deutlich stärker miteinander als Antonyme, die im Sprachgebrauch weniger konventionalisiert sind. Das Fazit lautete also, dass sich Sprecher/innen recht einig darüber sind, welche Ausdrücke als gute Antonyme gelten und welche nicht. Die Ergebnisse aus experimentellen Studien zeigen auch, dass es eine Skala an Kanonizität gibt, auf der etablierte Antonyme, weniger konventionalisierte und Ausdrücke ohne eindeutige Antonymzuweisung angesiedelt sind. Kanonizität ist also eine graduierbare Eigenschaft in einem
266
Petra Storjohann
Kontinuum der Qualität bzw. Güte der Antonymie („goodness-of-antonymy“) (vgl. Cruse 1986, 262 und Paradis u. a. 2009). Die konkrete Reihenfolge des Stimuluswortes zur Elizitierung von gegensätzlichen Ausdrücken wie z. B. X ist das Gegenteil von Y oder Y ist das Gegenteil von X spielt bei der Bewertung der Güte keine Rolle. Die Tests zeigten auch, dass einige Adjektive zahlreiche variable Antonyme elizitierten (z. B. elizitiert das Adjektiv delicate die Ausdrücke robust/strong/tough), während andere nur die Nennung weniger oder einzelner Antonyme auslösten (z. B. good elizitiert bad, narrow elizitiert wide und rapid elizitiert slow). Auch hier gab es eine Korrelation zwischen der Frequenz im Korpus und der Zahl genannter Gegensatzwörter. Frequente und saliente Adjektive bekamen oft nur wenige bis ein Gegensatzwort, während weniger häufige Ausdrücke mehrere Adjektive zugewiesen bekamen. Insgesamt sprechen die Ergebnisse der psycholinguistischen Studien dafür, Antonymie weniger als eine lexikalisch-kategorielle, sondern als konzeptuelle Relation zu betrachten. Andere Sinnrelationen wurden nicht aus kognitionslinguistischer Sicht und mit experimentellen Methoden untersucht. Korpusbasierte Erkenntnisse über Synonyme oder inkompatible Ausdrücke, wie das Vorliegen bestimmter Schablonen, in denen sinnrelationale Wörter miteinander verbunden werden, lassen vermuten, dass ähnliche Fragen nach der gegenseitigen mentalen Verankerung gestellt werden können.
4 Theoretische Verortung: Sinnrelationen aus kognitiver Perspektive Die gebrauchsorientierte Forschung erbrachte den Beweis, dass Bedeutung kein festes, definitorisches Konstrukt ist, welches klare Grenzen aufweist. Es bestehen heute berechtigte Einwände an bestehenden Klassifikationssystemen (siehe 2.1) und an der Trennung zwischen syntagmatischen und paradigmatischen Beziehungen (siehe 2.2). Ebenso wird die Vorstellung der Sinnrelation als rein lexikalische Beziehung infrage gestellt. Es waren auf der einen Seite korpuslinguistische Ansätze, die unser Verständnis über das lexikalische Verhalten von Ausdrücken im gemeinsamen Kontext und im tatsächlichen Sprachgebrauch erheblich verändert haben. Auf der anderen Seite erhielt die Beschäftigung mit paradigmatischen Beziehungen neue Impulse durch die Entwicklung kognitiver Ansätze (z. B. Cruse/Togia 1996; Croft/ Cruse 2004; Paradis 2005). Der kognitiv ausgerichtete Strang der Semantik liefert heute ein linguistisches Modell, das die rigide Trennungen zwischen der Lexik und Grammatik überwindet und das Zusammenspiel beider, wie es z. B. bei sogenannten Konstruktionen sichtbar wird, in den Mittelpunkt der Betrachtung schiebt. Die gebrauchsbasierte Erforschung der Antonymie ist eines der wenigen Beispiele, für die das Zusammenwirken unterschiedlicher Ansätze und Methoden zur gemeinsamen umfassenden Neubetrachtung und Neuverortung geführt hat (vgl. Jones u. a. 2012).
Sinnrelationale Wortschatzstrukturen
267
Murphy (2006) unterbreitete den Vorschlag, kanonische Antonympaare als Konstruktionen im Sinne der Konstruktionsgrammatik zu behandeln, ohne zwischen lexikalischen und grammatischen Konstituenten zu unterschieden. Die Konstruktionstheorie beschränkt ihre Sicht nicht auf lexikalische Phänomene allein, sondern schlägt Brücken zwischen getrennten Bereichen, wie zwischen Lexikon und Grammatik oder zwischen Form und Inhalt. Ihr zentrales Element ist die Konstruktion, eine sprachliche Einheit aus Form und Bedeutung. Diese kann sich von kleinen morphologischen Elementen bis hin zu komplexeren syntagmatischen Strukturen erstrecken (Goldberg 1995; Fillmore/Kay 1995). Beziehungen wie die Antonymie (und gleiches gilt auch für die Synonymie) werden in Form typischer vorgefertigter lexiko-grammatischer Sequenzen realisiert (siehe 3.1). Diese Schablonen bestehen dabei aus weit mehr als nur aus zwei lexikalisch-semantischen Elementen. Sie sind Einheiten mit speziellen Funktionen (vgl. Jones 2002), besitzen bedeutungstragende Assoziationen und können damit als Form-Bedeutungs-Einheiten interpretiert werden. Zum Beispiel werden die Wörter hot (X) und cold (Y) in Sequenzen wie X and Y, X and Y alike eingebettet. Die Vollständigkeit eines graduierbaren Charakteristikums wird signalisiert und gleichzeitig werden die Zustände der beiden Skalenenden und auch alle Zustände dazwischen sprachlich und konzeptuell impliziert. Ein Teil der Bedeutung der Konstruktion X and Y alike umfasst also die Tatsache „that it unites and neutralizes contrasting categories, and thus any two words that appear in this construction are interpreted as opposites“ (Jones u. a. 2012, 107). Ein kanonisches Antonympaar ist demnach eine komplexe lexikalische Konstruktion. Sie besteht aus zwei lexikalischen Einheiten, die in solche Konstruktionen eingefügt werden können, die zwei Einheiten der gleichen Wortart benötigen (Murphy 2001, 17). In der Konstruktionsgrammatik werden dabei nicht individuelle Konstituenten eines Musters getrennt betrachtet. Sequenzen können sich mit anderen Sequenzen zu größeren Konstrukten verbinden. Wortpaare in einer Antonymbeziehung werden demzufolge als „discontinuous lexical items that are compatible with unifiable slots in other constructions“ (Jones u. a. 2012, 126) interpretiert. Da die Konstruktionstheorie die Betrachtung sämtlicher linguistischer Ebenen einschließt, lässt sich erklären, dass Antonymkonstrukte auch außerhalb spezifischer Grenzen bestimmter Konstituenten auftauchen können. Damit kann u. a. erklärt werden, warum Antonyme in variablen Schablonen wie z. B. hot and cold und genauso in from hot to cold miteinander vorkommen können. Antonyme Strukturen können daher als kontrastive Konstruktionen (contrastive constructions) aufgefasst werden (Murphy 2006, 10). Auch wenn in Bezug auf die Synonymie derzeit wenige Erkenntnisse darüber vorliegen, ob es sich um eine Form-Bedeutungseinheit handelt, deuten die bisherigen Ergebnisse darauf hin, dass einige Synonyme durchaus regelhaft miteinander in musterhaften Strukturen vorkommen (vgl. auch die Ergebnisse bei Gries/Otani 2010). Daher liegt die Vermutung nahe, dass auch Synonympaare, wenn sie kookkurrieren, als Konstruktionen verstanden werden können. So kann einer Verbindung synonymer Wörter die Bedeutung zugeschrieben werden, dass sie semantisch vereint und
268
Petra Storjohann
erschöpfende Vollständigkeit signalisiert. Synonymie und ihre zugrundeliegenden lexiko-grammatischen Muster können daher auch als inklusive/implizierende Konstruktionen aufgefasst werden. Die Anerkennung stark konventionalisierter Antonyme oder Synonyme als ein Konstruktionsphänomen basiert einerseits auf grammatikalischen, lexikalischen und semantischen Charakteristika. Andererseits ist auch der hohe Grad an usuellem Miteinanderauftauchen in gemeinsamen Kontexten bzw. der Nachweis der tiefen Verankerung paarweiser Assoziationen im mentalen Lexikon ein Kriterium für die Definition von sinnverwandten Wörtern als Konstruktion. Sinnrelationen als variables und konzeptuelles Phänomen anzuerkennen und theoretisch einzubetten, versuchten Croft/Cruse (2004) im Rahmen einer umfassenden kognitiven Bedeutungsauffassung des sogenannten Dynamic Construal Approach. Es rückt eine fundamentale Neudefinition des Konzeptes der Sinnrelation in den Vordergrund. Antonymie, wie andere Sinnrelationen auch, ist nicht eine Beziehungen zwischen Wörtern, auch nicht eine Beziehung zwischen den Bedeutungen von Wörtern oder einfach zwischen Konzepten, sondern es handelt sich um eine semantische Beziehung zwischen „particular contextual construals of words“ (Croft/Cruse 2004, 141). Mit construal bezeichnet man dabei einen „mental process of meaning construction“, also einen mentalen Prozess der Bedeutungskonstruierung (für Details siehe Paradis in diesem Band). Wörter haben keine ihnen permanent zugewiesene Bedeutung. Bedeutungen treten im tatsächlichen Gebrauch hervor und sind Resultat verschiedener Construalprozesse (Cruse 2004, 262). Wie aber sehen solche Prozesse genauer aus und welches Wissen wird dafür benötigt? Paradis (2005) nimmt einige grundlegende Gedanken des Construal-Modells auf und entwickelt mit besonderem Blick auf die Antonymie und mit empirischen Erkenntnissen ausgestattet ein integriertes deskriptives gebrauchsbasiertes Modell. Ihre Perspektive, die als Lexical Meaning as Ontologies and Construals (LOC) bezeichnet wird (siehe Paradis in diesem Band) schließt zwei grundlegende Seiten der Bedeutungskonstruierung ein: – Grundstrukturen (Entitäten) der Wirklichkeit und die Einteilung in semantische Netze (Ontologien) als konzeptuelle Strukturen, die mit Wörtern ausgedrückt werden können, – Construals als kognitive Prozesse, um Bedeutung im Sprachgebrauch zu kreieren. Dieses kognitive Modell betrachtet Antonymie als konzeptuelles Phänomen, das sich dynamisch kontextuell etabliert und danach strebt, Erklärungen anzubieten, wie Antonymie im Gebrauch konstruiert wird. Es versucht auch zu erklären, warum manche Paare ‚bessere‘ Antonyme sind als andere (Paradis 2010) und liefert eine theoretische Erklärung der Mechanismen, die beteiligt sind, wenn Sprecher(innen) Kontrast sprachlich realisieren. Antonymie wird unter LOC-Perspektive wie folgt definiert: […] our definition of antonymy as a construal of binary contrast is in effect a construal of comparison, grounded in perception and cognitive processing. (Jones u. a. 2012, 128)
Sinnrelationale Wortschatzstrukturen
269
Antonyme verfügen also nicht über innewohnende auffällige Merkmale, sondern werden semantisch kontextualisiert (konfiguriert). Die Konstruierung einer Antonymiebeziehung ist daher das Resultat eines Construalprozesses, bei dem verschiedene Vorgänge mit grundlegenden ontologischen Kategorien eine Rolle spielen. Man denke da etwa an Adjektivpaare wie lang/kurz, gut/schlecht, arm/reich, männlich/weiblich, bei denen Kategorien wie Skala, Grad, Grenze eine Rolle spielen, um semantische Steigerbarkeit, Vergleichbarkeit und Abgrenzbarkeit zwischen den einzelnen Wörtern/Konzepten überhaupt zu ermöglichen. Diese Kategorien wiederum umfassen verschiedene semantische Komponenten und Eigenschaften wie z. B. länge (lang/kurz), grösse (groß/klein), wert (gut/schlecht) oder geschlecht (männlich/ weiblich). Beim Aufbau des semantischen Inhalts zur Herstellung sprachlichen Kontrastes werden kognitive Prozesse (construals) genutzt, die mit solchen ontologischen Einheiten arbeiten (vgl. Jones u. a. 2012, 130). So ist es z. B. wichtig, semantische Abgrenzungen vorzunehmen und bestimmte Grenzen zu schaffen, um ontologische Domänen in zwei Bereiche zu teilen. Nur so können Sprecher/innen eine Vorstellung darüber haben, wann etwas entweder lang oder kurz, entweder gut oder schlecht ist, entweder männlich oder weiblich ist. Der kognitive Prozess des Teilens ermöglicht die Unterscheidung zweier binärer Bereiche mit gegensätzlichen Kategorien. Die beiden gegenüberliegenden Seiten der Domäne werden durch eine Grenze geteilt, die es erlaubt, dass die jeweiligen Antonyme unterschiedliche spezifische Kategorien bezeichnen. Der semantische Inhalt wird also in zwei gegensätzliche Teile gesplittet, miteinander verglichen und kontrastiert, ungeachtet der semantischen Salienz der beiden Teile. Die Stärke der Antonymaffinität oder die Konfigurationsmethode hängen weitestgehend von der Komplexität der Basiskonzepte ab, also von grundlegenden semantischen Strukturen wie Skala oder Grenze. Wörter sind besonders stark miteinander verankert, wenn sie sich auf einfache Konzepte beziehen, bei denen eine einfache Bezugsdimension oft nur zwei allgemeine Zustände zulässt (Jones u. a. 2012, 139– 140). Beispiele dafür wären Antonympaare wie männlich/weiblich oder tot/lebendig. Tot und lebendig sind in der ontologischen Kategorie Leben anzusiedeln, die in zwei Bereiche (Leben vs. Nichtleben) gesplittet wird, mit jeweils einem Ausdruck als Lexikalisierung für die eine Hälfte. Der Inhalt der Bereiche, sprich seine semantische Struktur, ist also nicht komplex. Für Ausdrücke, die eine komplexere Struktur aufweisen, ist es dagegen typisch, weniger affine, weniger konventionalisierte Antonyme zu haben, wie z. B. für das Adjektiv riskant (siehe Beispiele 12–15). 32. Für Anleger, die trotz der starken D-Mark in Fremdwährungen investieren wollen, hält Sexauer eine riskante und eine eher konservative Empfehlung parat. (DeReKo) 33. Deutschlands Manager scheuen sich einer Studie zufolge vor riskanten Innovationen. Die Führungskräfte bevorzugten vermeintlich risikoarme Neuerungen, bei denen vorhandene Produkte nur geringfügig verbessert würden. (DeReKo) 34. Diese Entwicklung führt auch dazu, dass Sportärzte in die Zwickmühle geraten: Einerseits sind sie der Gesundheit und dem Leben verpflichtet, andererseits wissen sie aber auch,
270
Petra Storjohann
dass ein sportliches Ziel sowohl durch zu riskantes als auch durch zu vorsichtiges Verhalten nicht erreicht werden kann. (DeReKo) 35. Ein Flug Wien-New York sei unbedenklich, aber häufiges Fliegen könne für einen Fötus in den ersten Monaten riskant sein. (DeReKo)
Da das Adjektiv riskant sich nicht nur auf die Charakterisierung eines Zustandes oder eines bestimmten Sachverhaltes bezieht und ein komplexeres Konzept bezeichnet, werden sehr verschiedene ontologische Komponenten beschrieben. Für die verschiedenen Kategorien werden dann unterschiedliche Antonyme assoziiert. Insgesamt lautet das Fazit gegenwärtiger Antonymieforschung, dass Antonymie primär als konzeptuelle Beziehung und als Form-Bedeutungseinheit (Paar) zu verstehen ist, die sich im Gebrauch als Konstruktion formiert. Dabei sind bestimmte Prozesse und Wissens kategorien nötig, um flexibel und kommunikationsbedingt angemessenen Kontrast zu konstruieren. Croft/Cruse (2004) erklären auch die Hyponymie (z. B. Apfel-Frucht/Obst), die Meronymie (Finger-Hand) und die Inkompatibilität (Hund-Katze-Maus) als konzeptuelle Relation, die dynamisch in bestimmten Kontexten und unter bestimmten Bedingungen konstruiert wird. Nach Croft/Cruse (2004, 163) erfordert auch die Herstellung einer Beziehung der Meronymie etwa konzeptuelles Wissen und kognitive Prozesse und sie kann je nach Wahrnehmung von Entitäten variieren. Empirische Forschungen zu diesen Beziehungsarten fehlen aber bislang. Datengeleitete Forschung zur deutschen Synonymie (z. B. Marková 2012) liefert anfängliche Beweise dafür, dass diese Sinnrelation ebenfalls in das Modell des Dynamic Construal eingebettet werden könnte. Möglicherweise gelten die gleichen Kategorisierungsprinzipien, Konfigurationsmechanismen und Construalprozesse, wie z. B. Komparation (Vergleich), bei der Verhandlung darüber, was im jeweiligen Kontext Ähnlichkeit ist. Diese Annahmen müssen aber mittels umfangreicherer Studien und möglichst mithilfe weiterer Analyseverfahren und -methoden gestützt werden.
5 Desiderata Es bleiben viele Forschungsfragen unbeantwortet. Dies betrifft z. B. Fragen danach, wie lexiko-semantische Beziehungen konventionalisiert, gespeichert und von Sprecher/innen in der Kommunikation gezielt genutzt werden. Weitere Untersuchungen zur Negation und zum unterschiedlichen Verhalten von Antonymen mit Negationsaffixen fehlen, die die Frage beantworten, warum Adjektive wie natürlich sehr häufig mit Adjektiven wie künstlich, unecht oder falsch kookurrieren, aber deutlich weniger mit seiner morphologisch abgeleiteten Form unnatürlich. Ein weiterer interessanter Aspekt ist die Beobachtung (Jones 2002), dass Antonyme im Text spezielle Präferenzen in der Anordnung innerhalb ihrer syntagmatischen Kombinationen aufweisen. So werden die Konstruktionen long and short, good and bad vor den Kombinationen
Sinnrelationale Wortschatzstrukturen
271
short and long bzw. bad and good präferiert. Sieht man mal von den einsilbigen Beispielen wie diesen ab, scheint es bei Wortpaaren und Paarformeln eine Tendenz zu geben, dass die Abfolge der Wörter u. a. nach ihrer Silbenzahl angeordnet werden (Behagel‘sches Gesetz). Die Prinzipien der Anordnung und die Symmetrie zwischen Antonymen wurden bisher aber in keiner Sprache empirisch näher untersucht. Ein weiterer Aspekt der Antonymforschung, der bisher unberücksichtigt blieb, betrifft die Untersuchung einer möglichen Korrelation zwischen den Kollokationsprofilen von Antonymen, dem Anteil gemeinsamer Referenznomina bei Adjektiven etwa und ihrem Grad an Affinität. Weisen Antonyme eine höhere Affinität zueinander auf, wenn sie gleiche Bezugsnomina haben? Der größte Forschungsbedarf besteht jedoch für andere Beziehungsarten wie die Synonymie, die Hyponymie, die Inkompatibilität und die Meronymie. Das schließt nicht nur die Erforschung von Strukturen aus unterschiedlicher Perspektive, sondern vor allem auch die Untersuchung gesprochener Sprache ein. Darüber hinaus können auch disziplinübergreifende Untersuchungen und lexikalisch-typologische Arbeiten wertvolle Erkenntnisse bringen, die es einzubetten gilt. Zu guter Letzt sollten neue lexikologische Einblicke in angemessenen lexikografischen Dokumentationen Einzug halten (vgl. auch Haß in diesem Band). Eine schier unüberwindbare Kluft existiert zwischen den Erkenntnissen neuerer Studien und der Beschreibung sinnverwandter Ausdrücke in Wörterbüchern. Hier wirken, erstens, traditionelle lexikografische Erklärungen bis in die Gegenwart hinein (vgl. Storjohann 2006). Zweitens, werden die zur Verfügung stehenden Methoden zur Ermittlung und konsistenten Dokumentation von Wortschatzstrukturen noch kaum in der Lexikografie eingesetzt (vgl. Paradis/Willners 2007; Storjohann 2012). Ein dritter Kritikpunkt bezieht sich auf die unzureichende Ausschöpfung des Potenzials elektronischer Nachschlagewerke hinsichtlich Umfang, Innovation, Benutzerführung und Präsentation sinnverwandter Beziehungen (vgl. Murphy 2013). Mit der weiteren Entwicklung computationeller Verfahren, die präzisere und komplexere Datenrecherche zulassen, sollten weitere Entdeckungen über die Natur und das Verhalten sinnrelationaler Beziehungen erwartet werden, die auch lexikografische Veränderungen mit sich bringen sollten.
6 Literatur Adamska-Sałaciak, Aleta (2013): Equivalence, synonymy, and sameness of meaning in a bilingual dictionary. In: International Journal of Lexicography 26/3, 329–345. Bierwisch, Manfred (1984): Dimensionsadjektive : Semantische Struktur und begriffliche Interpretation; davon Abschnitt 1. Grundannahmen 490–497; Abschnitt 3. Semantik der Graduierung 500–505. In: Zeitschrift für Phonetik, Sprachwissenschaft und Kommunikationsforschung (ZPSK) 37 (1984) 4; Ergebnisse und Ausblicke ZPSK 37/6, 680–686.
272
Petra Storjohann
Bubenhofer, Noah (2009): Sprachgebrauchsmuster. Korpuslinguistik als Methode der Diskurs- und Kulturanalyse. Berlin/New York (Sprache und Wissen, 4). Croft, William/Alan D. Cruse (2004): Cognitive Linguistics. Cambridge. Cruse, Alan D. (1986): Lexical Semantics. Cambridge. Cruse, Alan D. (2002a): Paradigmatic relations of inclusion and identity: synonymy. An overview. In: Alan D. Cruse u. a. (Hg.): Lexikologie. Ein internationales Handbuch zur Natur und Struktur von Wörtern und Wortschätzen. Berlin/New York, 485–497. Cruse, Alan D. (2002b): Paradigmatic relations of exclusion and opposition: reversivity. An overview. In: Alan D. Cruse u. a. (Hg.): Lexikologie. Ein internationales Handbuch zur Natur und Struktur von Wörtern und Wortschätzen. Berlin/New York, 507–510. Cruse, Alan D./Pagona Togia (1996): Towards a cognitive model of antonymy. In: Journal of Lexicology 1, 113–141. DeReKo: Deutsches Referenzkorpus, Mannheim: Institut für Deutsche Sprache. http://www. ids-mannheim.de/kl/projekte/korpora/. elexiko: Online-Wörterbuch zur deutschen Gegenwartssprache. http://www.owid.de/wb/elexiko/ start.html . Fillmore, Charles J./Paul Kay (1995): Construction Grammar. Ms., University of California, Berkeley. Goldberg, Adele E. (1995): Constructions: A Construction Grammar Approach to Argument Structure. Chicago. Gries, Stefan Th./Naoki Otani (2010): Behavioral profiles. A corpus-based perspective on synonymy and antonymy. In: ICAME Journal 34, 121–150. Harras, Gisela (2001): Synonymie und Synonymik. In: Gisela Harras (Hg.): Kommunikationsverben. Konzeptuelle Ordnung und semantische Repräsentation. Tübingen, 131–194 (Studien zur Deutschen Sprache, 24). Justeson, John S./Slava M. Katz, (1991): Co-occurrence of antonyms adjectives and their contexts. In: Computational Linguistics 17, 1–19. Jones, Steven (2002): Antonymy: A Corpus-Based Perspective. London/New York. Jones, Steven u. a. (2012): Antonyms in English. Construals, Construction and Canonicity. Studies in English Language. Cambridge. Lyons, John (1968): Introduction to Theoretical Linguistics. Cambridge. Lyons, John (1977): Semantics. Cambridge. Lutzeier, Peter Rolf (1981): Wort und Feld. Wortsemantische Fragestellungen mit besonderer Berücksichtigung des Wortfeldbegriffes. Tübingen. Marková, Věra (2012): Synonyme unter dem Mikroskop: eine korpuslinguistische Studie. Tübingen. Mettinger, Arthur (1994): Aspects of Semantic Opposition. Oxford. Moon, Rosamund (2013): Braving synonymy: from data to dictionary. In: International Journal of Lexicography 26/3, 260–278. Murphy, Lynne M. (2003): Semantic Relations and the Lexicon. Antonymy, Synonymy and other Paradigms. Cambridge. Murphy, Lynne M. (2006): Antonyms as lexical constructions: or, why paradigmatic construction is not an oxymoron. In: Constructions, Special Volume 1/8, 1–37. (http://sro.sussex. ac.uk/701/). Murphy, Lynne M. (2013): What we talk about when we talk about synonyms (and what it can tell us about thesauruses). In: International Journal of Lexicography 26/3, 279–304. Murphy, Lynne u. a. (2009): Discourse functions of antonymy: a cross-linguistic investigation of Swedish and English. In: Journal of Pragmatics 41, 2159–2184. Muehleisen, Victoria/Maho Isono (2009): Antonymous adjectives in Japanese discourse. In: Journal of Pragmatics 41, 2185–2203. Paradis, Carita (2005): Ontologies and construal in lexical semantics. In: Axiomathes 15, 541–573.
Sinnrelationale Wortschatzstrukturen
273
Paradis, Carita (2010): Good, better and superb antonyms: a conceptual construal approach. In: Marie Vachková (Hg.): The Annual of Texts by Foreign Guest Professors. Vol 3. Charles University Prague, Faculty of Philosophy and Arts, 385–402. (http://lup.lub.lu.se/luur/download?func=do wnloadFile&recordOId=1583460&fileOId=1590145 ). Paradis, Carita (2011): A dynamic construal approach to antonymy. Selected papers from the 19th International Symposium of Theoretical and Applied Linguistics. Aristotle University of Thessaloniki, Monoxromia, Greece, 33–42. Paradis, Carita/Caroline Willners/Steven Jones (2009): Good and bad opposites: using textual and experimental techniques to measure antonym canonicity. In: The Mental Lexicon 4/3, 380–429. Paradis, Carita/Caroline Willners (2007): Antonyms in dictionary entries: methodological aspects. In: Studia Linguistica 61, 261–277. Partington, Alan S. (1998): Patterns and Meanings: Using Corpora for English Language Research and Teaching. Amsterdam. Philpotts, Victoria (2001): A Comparative Analysis of Antonymy and Hybrid Anto-Complementarity in English and German within a Cognitive Framework. PhD Dissertation University of Manchester. Storjohann, Petra (2006): Kontextuelle Variabilität synonymer Relationen. Mannheim. (http://pub. ids-mannheim.de/laufend/opal/opal06-1.html ). Storjohann, Petra (2007): Incompatibility: A no-sense relation? In: Matthew Davies u. a. (Hg.): Proceedings of the 4th Corpus Linguistics conference. Birmingham. (http://corpus.bham.ac.uk/ corplingproceedings07/paper/36_Paper.pdf ). Storjohann, Petra (2010): Synonymy in corpus texts – conceptualisation and construction. In: Petra Storjohann (Hg.): Lexical-Semantic Relations. Theoretical and Practical Perspectives. Amsterdam, 69–94. Storjohann, Petra (2011): Paradigmatische Konstruktionen in Theorie, lexikografischer Praxis und im Korpus. In: Annette Klosa (Hg.): elexiko. Erfahrungsberichte aus der lexikografischen Praxis eines Internetwörterbuchs. Tübingen, 99–129. Storjohann, Petra (2012): Der Einsatz verschiedener Korpusmethoden und -verfahren zur Qualitätsund Konsistenzsicherung am Beispiel der Ermittlung und Dokumentation von Synonymen und Antonymen. In: Lexicographica 28, 121–139. Taylor, John (2003): Near synonyms as coextensive categories: ‘tall’ and ‘high’ revisited. In: Languages Science 25, 263–284. Willners, Caroline (2001): Antonyms in Context: A Corpus-Based Semantic Analysis of Swedish Descriptive Adjectives. Lund University Department of Linguistics (Travaux de l’Institut de Linguistique de Lund 40). Willners, Caroline/Carita Paradis (2010): Swedish opposites. A multimethod approach to antonym canonicity. In: Petra Storjohann (Hg.): Lexical-Semantic Relations: Theoretical and Practical Perspectives. Amsterdam, 15–47.
Carita Paradis
12. Meanings of words: Theory and application Abstract: This chapter presents a Cognitive Semantics framework for the analysis of words and meaning-making in language, Lexical Meaning as Ontologies and Construals, and the basic socio-sensory-cognitive assumptions on which this framework rests. It demonstrates the repercussions of the basic assumptions of the approach to word meaning, highlighting its usefulness for describing and explaining meaning-making in communication. Special attention is given to word classes, degree, antonymy, metonymization and metaphorization. 1 Introduction 2 The socio-sensory-cognitive basis 3 Words and their meanings 4 Lexical meanings as ontologies and construals 5 Ways of viewing and construing in discourse 6 Summary 7 References
1 Introduction The purpose of this chapter is to give a brief outline of Lexical Meaning as Ontologies and Construals (Paradis 2005; LOC for short) within the broad framework of Cognitive Linguistics (Langacker 1987a; Talmy 2000; Croft/Cruse 2004; Geeraerts/Cuyckens 2007) and to demonstrate with data from different studies, how the model can be used for the description and explanation of meaning-making in discourse. The model is designed with the aim of accounting for the conceptual structures that words evoke and the dynamics of meaning creation both at the level of single words and larger chunks of discourse. It is important to note that the notion of word is not restricted to a number of letters enclosed by empty spaces in writing, but the notion of word is used as a synonym of the technical term Construction (Goldberg 2006) to also include words that are more than one word, e.g. in spite of, have a bath, all of a sudden. The title of the chapter is deliberately formulated as the meaning of words rather than word meanings because in LOC words do not have meanings; words evoke meanings when they are used in speech and writing. Word forms are cues to structures in conceptual space, and it is this space that is the entire use potential of a word. This use potential is not static but in principle constantly developing as an effect of the influence of new experiences, new input and/or lack of input from language use. Lexical knowledge thus hinges on our experience of the world and therefore relies
Meanings of words: Theory and application
275
heavily on our knowledge of and interaction with the world. Meanings of words are always negotiated and only get their specific readings in the contexts where they are used. Multiple readings and senses of words are natural and expected in a dynamic usage-based framework such as LOC. LOC has been applied in a wide range of different investigations using different observational techniques, in which it has proved well suited for framing and explaining effective research without imposing constraints on what the researcher can undertake to investigate in lexical semantics. The procedure in this article is as follows. Section 2 presents the socio-sensory-cognitive basis of LOC, followed by a more detailed discussion about the importance of this triad for how words mean, in Section 3. Section 4 presents the LOC framework. In Section 5, various different linguistic issues and studies using the framework are discussed: Word classes, degree, antonymy, metonymization and metaphorization. The most important points are brought together and summarized in Section 6.
2 The socio-sensory-cognitive basis The LOC framework is founded on the idea of the importance of the socio-sensory-cognitive triad. Those systems constitute the three pillars of all work presented here on how words mean and how we use language to communicate. The way we express ourselves is the way we perceive and understand the world around us, and the way we perceive and understand the world around us is the way we express ourselves. Central to Cognitive Linguistics in general is the view of language as a structured collection of meaningful categories or lexical concepts, which are formed on the basis of our experiences in the world. These categories help language users store and manage knowledge in a way that reflects the needs of human beings. It reflects commonalities across cultures, and it reflects differences. There is no completely neutral or indeed objective way of sensing, understanding and describing the world (Langacker 1987a; Croft/Cruse 2004; Paradis 2003, 2012a, 2012b). This socio-sensory-cognitive foundation makes the study of language essentially the opposite of, say, mathematics, which deals with relations of concepts to each other without consideration of their relation to our experience with the world around us. The study of language is concerned with concepts that are strongly related to our sensory, social and cultural experiences. Language is social action performed by interlocutors. Language is used to recontextualize experiences into written and spoken forms of words in discourse (Caballero/Paradis 2013; Paradis 2015). Its social role is to affect the state of mind of other people in order to bring about cognitive changes. Communicative acts and interactions are performed by language users through what Gärdenfors/Warglien (2013) and Gärdenfors (2014, 91–111) refer to as the meetings of minds. The metaphor they are using points to the importance of shared goals in com-
276
Carita Paradis
munication. The idea is that, in communication, there are meeting-points at which the interlocutors believe they have understood each other. Pickering/Garrod (2013) presents an integrated theory of language production and comprehension, the main thrust of which is that production and comprehension in communication are forms of action, action perception and joint interaction. Communication always involves prediction which is used to monitor upcoming utterances both when language users produce messages and when they interpret them. The ability to make predictions presupposes intersubjective awareness and enables people to manage their own utterances and predict other people’s utterances. This underlying fabric of acts, sensations and concepts constituted by the socio-sensory-cognitive triad is important for any usage-based analysis of the meanings of words. If we do not take the importance of the role of the socio-sensory-cognitive triad seriously, it is hard for a theory of semantics to address the fundamental questions of what meaning in language is, and how meaning relates to the world. It is also hard to address the question of how words mean when they form larger units and discourses, if the foundation is not spelled out.
3 Words and their meanings This section discusses the issue of symbolization, i.e. the mapping of words to meanings. The socio-sensory-cognitive systems that form the backdrop for all word meanings are extremely rich (Gibbs 1994; Barsalou 2008; Lacey/Stilla/Sathian 2012). The role of words is to act as cues to people’s inner worlds built up by the integrated triadic web of systems. As language users, we communicate about what we see, hear, feel and know (and at the same time we also see, hear and feel in our inner worlds (Gärdenfors 2014, 8–20). Imagine what it takes to be treated to 90 % dark chocolate and know what it looks like, smells like, tastes like, feels like, how you eat it, what you eat with it, and so on and so forth. Visually, there is not much difference between mud and chocolate, and small children may very well put them in the same category of brown things. However, with more experience we realize that the differences are remarkable from all points of view but vision. Everything we learn, not only about mud and chocolate, but about all entities as we grow older teach us that lesson. These different experiences call for different conceptual categorizations and meaning distinctions. Concepts are mental entities that form systems of areas of human experience. They provide the necessary knowledge for our understanding of the world around us and the multitude of impressions that we are exposed to in our daily doings. Knowledge related to each concept is referred to as domains (Langacker 1987a, 147–182), or frames (Fillmore 2006). Some of them are basic domains, which are considered to be inborn and make it possible for human beings to experience ranges of colour, pitch, taste, smell and touch, extensions of space and time, and experiences of emotion.
Meanings of words: Theory and application
277
However, domains are not only basic domains but may involve conceptualizations of any degree of complexity. The conceptual use potential that words are associated with consists of multiple domains, and concepts expressed through words in language use are associated with multiple domains, so-called domain matrices. A free-standing specification of, say, apartment is unthinkable in the sense that the existence of an apartment is dependent on the existence of a building. In a similar way, a building and a piece of land are dependent on one another, and a piece of land and a geographical area and so on and so forth. As language users, we also know that apartment is something that is not generally found in old villages but associated with more densely populated areas or more recently urbanized locations. This means that our understanding of apartment is viewed against the backdrop of our cultural experience of apartments and our knowledge of urban communities. The conceptual structure evoked by apartment is referred to as the profile, and the backdrop against which apartment is made salient is called the base. This said, it is also important to note that not all aspects of the knowledge base of a concept are of equal importance in meaning-making at all times. Profiling is not static but a construal that is adaptive to the contextual situation and the interlocutors. Interpretative contrasts in language use are always the result of the actual domains evoked in combination with the ranking of the different domains depending on how prominent they are on that occasion of use. For instance, we have a spatio-visual representation of an apartment. We have experienced the auditory feeling of being in an apartment, which is very different from being in a concert hall or a church. We know that we pay rent on a specific day and so on and so forth. Langacker (1987a, 158–161) deals with prominence ranking in terms of four centrality factors. In the terminology used here, the centrality of a certain meaning specification is a matter of its relative socio-sensory-cognitive entrenchment and likelihood of activation in a certain situation. The notion of centrality correlates with the degree to which a specification is conventional, generic, intrinsic and characteristic (Langacker 1987a, 158–161). For instance, my own very idiosyncratic knowledge of apartment includes the fact that I used to live in one when I was a student. It was very small. You had to pass through a very narrow passage in the kitchenette to get into the bathroom. Should the oven door come unfasten, you would be locked up in the bathroom for a long time (because in those days most students were not in possession of a telephone). Now this fact cannot possibly be knowledge that is knowledge about apartments that I share with other people. For that reason, it cannot be on a par with essential properties such as ontological type and function that most people share. What this story boils down to is that some specifications are not possible to omit, such as an apartment is part of an apartment building, while other specifications are completely irrelevant for even the most comprehensive description. While form-meaning pairings/Constructions such as apartment/apartment are very complex in themselves, complexity increases exponentially when words are combined in larger chunks in discourse. The effect of conceptual embedding into
278
Carita Paradis
larger bodies of knowledge in combination with the dynamics of the system is indeed very complex, and as already mentioned, it is not the case that profile and base enjoy a stable relation. On the contrary, when we express meanings through language, the ordering and the weighting of the domains in the matrix of a profiled concept change and adapt to what is being communicated. Consider (1) through (4). (1) (2) (3) (4)
The boys signed up for the semantics course. He was looking at the wine’s legs. Four bottles rushed through the garden. The chair of the vase is blue.
In (1), the sentence evokes a university setting where courses are given and the boys are prospective students that can select courses. The combinations of expressions of meanings allow us to infer that the boys are students and the course is likely to be a university course because semantics is not normally taught in schools or at work places. Given a sentence such as (1), this is how meanings emerge and how speakers make predictions about the content and thus about the discursive meanings of the words that make up the whole. Example (2) may appear obscure at first blush. To make sense of it we need to know a bit about wine and be familiar with the social practice of wine tasting. If we have this background knowledge, we envisage somebody swirling his or her wine glass, raising the glass towards the light to watch the wine’s legs, i.e. the long, slender droplets that form on the sides of the wine glass above the surface of the wine, which are caused by the interplay between evaporation and surface tension. The legs are most readily observable for wines with high alcohol content. Example (3) is similar to (2) in that it is not congruent with the more general use of the words in the sentences. The sentence evokes the scene of entities rushing through space. The entities are bottles. Talking about bottles in combination with rushed suggests that bottles have agentive power, which bottles do not have. This makes us start thinking how else we could interpret (3), and of course there are various interpretations at hand depending on the context in which the sentence is used. One interpretation is that the bottles are radio-controlled bottles; another one could be that they are not bottles at all, but people dressed up as bottles; and yet another is that they, in fact, are bottles and the speaker wants to infuse some life into them and thereby compare them with animate agents. All three interpretive variants make use of construal operations of metonymization and metaphorization (we return to these operations in in Section 5.4). Finally, (4) is a more problematic sentence to interpret, both from a social, perceptual and cognitive perspective. The difficulty of interpreting (4) is related to the difficulty of forming an image of it as well as reasoning about what this could be about, which is not the case in any of the other examples. All this suggests that meanings of words can never be defined. The very idea of complete word definitions is utopian (except in mathematics). If it had been at all
Meanings of words: Theory and application
279
possible to take all uses and nuances that form the basis of people’s knowledge of and about words and their meanings in different discourses into account, an attempt at defining meanings of words would lead to an explosion of structures. When words are used or interpreted, a rather limited part of their conceptual structure is evoked and profiled. This, in particular, is most obvious for meanings of words based on rich and complex domain structures, such as apartment, city, dog, business, holiday, child and white asparagus. Meanings of words crystallize on the occasion of use, and they do so only to be open to new interpretations in the flow of human communication and meetings of minds. The use potential of stored knowledge structures is rich and flexible. In order to describe and explain the mechanisms, we need a framework that can take care of how words mean. Two ingredients appear to be necessary: conceptual structures (ontologies) and construal operations.
4 Lexical meanings as ontologies and construals This section offers a presentation of the framework of Lexical Meaning as Ontologies and Construals (Paradis 2005), the basic assumptions of which are consistent with what has already been presented in the previous sections. These assumptions presuppose that meanings of lexical items are dynamic and sensitive to contextual demands, rather than stable and fixed. Construal operations are the source of all readings, conventional as well as idiosyncratic. In accordance with Cruse (2002), LOC states that word meanings are both facilitated and constrained by world knowledge, conventionalized mappings between words and concepts, and conventional modes of thinking in different contexts and situational frames that we are familiar with. Similar to my notion of use potential, Cruse (2002) describes the total meaning of a speaker’s knowledge of a language as a pattern of knowledge representations in conceptual space. There are more densely populated areas, more sparsely populated areas and empty areas. Different readings tend to cluster in groups with different degrees of cohesiveness. They form clusters of shadings of uses which are separated from one another by sparsely inhabited regions. The spaces separating different senses, on the other hand, are substantial empty spaces, resulting in meaning autonomy between different senses of polysemous words autonomous. The distances between the densely populated areas are important for the modelling of sense distinctions as well as the distinctions between more closely related readings within senses (see section 5). This approach to the notions of readings and to senses (and polysemy) as a function of distance in conceptual space is consistent with the approach in LOC (Paradis 2004, 2005, 2008, 2011, 2015). The spaces separating different senses are also crucial for the modelling of meaning change and the development of new meanings (Paradis 2011).
280
Carita Paradis
The notion of sense boundaries and boundaries between readings within a sense are closely related to the degree of autonomy of the clusters that the sparsely inhabited spaces delimit. While readings within a sense are only weakly autonomous or form a continuum, senses exhibit strong signs of autonomy because they are kept apart by substantial separating spaces. They are the symptoms emerging through various definitional tests that are often used in linguistics (Croft/Cruse 2004, 109–140), e.g. I continuum from metonymization proper, which concerns different senses to zone activation, which is omnipresent in all uses within senses (explicated in Paradis 2004, 2011) and returned to in Section 5.4. Now, in order to identify discursive meanings, we need a framework that provides the tools and the operations to do so. For this purpose, LOC makes two fundamental distinctions between Ontologies on the one hand and Construals on the other. The former are conceptual structures modelled as two types: Contentful ontologies and Configurational ontologies, as shown in Table 1. Tab. 1: Ontologies and Construals in meaning construction, adapted from Paradis (2005) Ontologies (conceptual structures)
Construals (processes)
Contentful pre-meaning structures
Configurational pre-meaning structures
(i) concrete spatial matters (ii) temporal events, processes and states (iii) abstract phenomena
boundedness scale part-whole thing-relation point frequency focus path order
Gestalt: e.g. structural schematization, profiling Salience: e.g. metonymization, generalization, zone activation Comparison: e.g. metaphorization, categorization Perspective: e.g. grounding and viewpointing
Table 1 offers a break-down of the two types of ontological pre-meaning structures and the various main types of construals that operate on the conceptual structures in the creation of meaning in language use. The two types of conceptual structure are on a continuum from Contentful to purely Configurational. The conceptual ontologies are not fixed word meanings but pre-meaning structures (or purport, to use Cruse’s term, Croft/Cruse 2004, 100–101), and as such they contribute to the final discursive interpretations of words in context. They are not themselves full meanings but are created at lower levels of conceptual organization on the way to be used in discourse. They serve as the raw material on which Construals operate to fix the discursive meanings in accordance with the perspectives and points of salience required in actual communication. In accordance with the basic assumptions presented in Sections 2 and 3, meanings in language emerge
Meanings of words: Theory and application
281
from the Contentful and Configurational pre-meaning structures, which combine and subsequently crystallize on the occasion of use. The pre-meaning stage can be described using the blurred picture below where we, at this point in time, discern the vague contours of a human being heading somewhere. The final interpretation of the photo only becomes clear when the pre-meaning is eventually properly couched in its situational context and clearly configured with respect to the woman agent walking up the stairs in an old building on the way to her apartment.
Fig. 1: A person heading somewhere (Olof Ekedahl©2010 All rights reserved)
The next couple of sections take a closer look at the ontological structures, Contentful and Configurational structures, and the Construal operations.
4.1 Contentful and Configurational structures Contentful structures involve meaning structures pertaining to (i) concrete spatial phenomena, (ii) spatio-temporal phenomena: events, processes, states, and (iii) abstract phenomena as shown in Table 1. They are the three most general Contentful pre-meaning structures, which accommodate more fine-grained structures. For instance, (i) are pre-meaning structures that relate to concrete categories such as dog, boat, and stone, and (ii) include structures, such as swim, die, and beautiful for the three main types respectively, and (iii) abstract structures cover pre-meanings such as idea, problem, and system (for more detail, see Paradis 2005). Configurations, next, are schematic structures that combine with the Contentful structures when meanings are profiled in discourse. The list of different Configurations represents a sample of central types. It is not to be understood as an exhaustive
282
Carita Paradis
list. In the same way as Contentful meanings need to be shaped by Configurations, the latter need some substantial qualitative meaning structures to become meaningful. Configurations are templates that combine with Contentful ontologies, much like grammatical and morphological elements combine with what is often referred to as lexical elements in text and discourse. Configurations combine with Contentful structures in meaning creation in order to “format” them to suit the communicative context. Such structures have been shown to have psychophysical basis (Bianchi et al. 2011, Bianchi et al. 2013) Up to this point we have considered pre-meaning structures only. We now proceed to the stage where the pre-meanings are put to use in discourse. For that purpose, we may consider short, big and intelligent, in (5), (6) and (7). (5) The politician gave a short answer to the question. (6) The big maple leaves were already red. (7) Katie is a very intelligent student.
Short, big and intelligent in (5), (6) and (7) evoke Contentful properties of the dimensions of length, size, and human propensity, respectively. Their meanings are interpreted against a meaning Configuration, which in all these cases is a simple schematic unbounded scale structure. This scale structure coalesces with the Contentful properties of short, big and intelligent along the dimensions, length, size, and human propensity, respectively. In the English language, they might be expressed by short, big and intelligent or expressions that evoke similar meanings such as brief, large or clever, or in other ways, given the context above.
4.2 Construals The role of Construals is to bridge the gap between perceptions and cognition in communication. The Construals are the dynamic component of the framework. Through them we can account for the flexibility of language use in a systematic and explainable way. The Construals are the prerequisites for the dynamics of meaning in language and allow for the final interpretation in context. As shown in Table 1, Construal operations are modelled as special cases of four general perceptual-cognitive processes, namely (i) the forming of a Gestalt, which involves structural schematization and profiling of meanings. It concerns the organization and understanding of a whole rather than individual elements such as points and boundaries, where the whole is not only the sum of the parts but more (examples of different Gestalts will be given in Section 5), (ii) salience, which involves the establishment of the focus of attention or point of reference as in metonymization, (iii) comparison, which involves an assessment, which is part and parcel of categorization and metaphorization, and (iv) perspective, which relates to the grounding and viewpointing of meanings in the communicative
Meanings of words: Theory and application
283
situation. The four types of systems of Construals are not mutually exclusive. On the contrary, they are simultaneously co-occurring and co-active and their roles are described and exemplified in Section 5. The typology of Construals brings together construal operations discussed in the Cognitive Linguistics literature (Langacker 1987, 1999, Talmy 2000) and in psychology and phenomenology as synthesized by Croft/Wood (2000). To all intents and purposes, the take in LOC is the same as the one presented in Croft/Wood (2000), but it is not identical in detail. Most importantly, LOC differs from how Talmy (2000) or Langacker (1987, 1999) treat Construals. Neither of them makes a distinction between Construals and Configurational structures. In LOC, Configurations are conceptual structures and Construals are processes that are responsible for the various different discursive meaning arrangements. This division allows the analyst to make a principled distinction between affordances (Configurations) on the one hand, and Contentful structures and operations (Construals) on the other (for more details see Paradis 2005).
5 Ways of viewing and construing in discourse This section briefly presents a number of examples of meaning construals in language use and how they are accounted for in LOC, namely word classes (5.1), degree (5.2), antonymy (5.3), metonymization and metaphorization (5.4).
5.1 Word classes We express ourselves in a way that mirrors how we perceive and conceive of something. This state of affairs is true at all levels of complexity from the level of form-meaning pairings to larger chunks of text. This is an important factor for how we choose to construe meanings in terms what is referred to as word classes in the traditional literature. In Cognitive Linguistics, parts of speech are configuration construals of some content. The speakers’ choice of Configuration depends on how they want to present a meaning structure, i.e. how the content is best visualized for optimal communicative success. A distinction is made between viewing a meaning structure as thing or relation. Nominal meanings are configured as summary scanned things, and verbs and adjectives as temporal and atemporal relations, respectively (Langacker 1987b, Paradis 2005). Thing is a Configuration of some content construed as an atomic notion, i.e. conceived as static and holistic. It is the summary scanning which allows all relevant aspects of the concept to be available at the same time and together they form the thing Gestalt. Verb meanings are relational and sequentially scanned over time, while adjectival meanings are similar to both nominal and verbal
284
Carita Paradis
meanings. They are relational like verbs but atemporal rather than temporal, and summary scanned like nouns. Langacker (1999, 11) gives yellow as a concrete example to illustrate the crucial function of construal for parts of speech. The conceptual content yellow in the colour domain is kept constant over its various construals into different parts of speech as in (8), (9), (10) and (11). (8) Yellow is my favorite colour. (9) This piece of paper is yellow. (10) The paper yellowed very quickly. (11) The yellowed paper was torn at the edges.
In (8) yellow is a noun, which profiles a particular kind of thing in the colour domain. Yellow in (9) is an adjective profiling an atemporal relation of a colour sensation as a specification of the meaning dimension of thing, i.e. paper. In (10), yellowed is a verb that profiles a process in which the colour of thing (paper) has gone through a process of gradual change. In all three examples, the contentful meaning structure pertaining to the colour domain is invariant. There is a difference between the verbal construal, which profiles a sequential process and the stative adjectival construal of the participle form that is used in combination with nominal meanings as in (11). The verbal construal and the participle again evoke the same content, but the participle in (11) profiles the final state only, which makes it atemporal and non-verbal. The process profiled in the verbal construction, the paper yellowed, serves as the base for the participle in the yellowed paper in that something can only be yellowed, if it has undergone a process of yellowing. The upshot of this is that it is the speaker who construes some content in the act of communication and parts of speech are configuration construals of some content.
5.2 Degree There are words that are primarily expressions of degree and words whose content has an underlying degree Configuration. This means that degree may be construed as the most salient component of a meaning structure, or it may be part of the backgrounded meaning structure. For instance, degree modifiers such as very, quite, a bit, little, much, totally, completely foreground degree. These meanings are either associated with a scale (very), a boundary (totally) or both (almost). These elements are used to specify gradable meanings, e.g. very good, completely identical, and almost impossible. Linguistic expressions, such as good, empty and impossible foreground the Contentful dimensions, merit, identity, possibility, respectively, while degree resides in the background. There are also many linguistic expressions that at first sight do not appear to be associated with grading, e.g. woman or book,
Meanings of words: Theory and application
285
but they may on many occurrences of use highlight properties that are gradable. For instance, the profiling of an intelligent woman involves the evaluation of a property of woman along a gradable dimension of intelligence. Similarly, the profiling of a fantastic book involves a gradable dimension of book as being ‘a good read’ or ‘a beautiful artifact’ (Paradis 2004, 2005). The backgrounded degree structures of such meanings provide the necessary condition for combination with degree modifiers, either directly as in very nice, absolutely excellent, quite a man, badly needed, or as in a very good book through a gradable property of a book (thing) bridged by merit, here specified by good. The above-mentioned configurational structures make it possible for speakers to construe objects and situations differently in discourse. It is important for linguistic theories to be able to account for the dynamics in meanings in discourse. If we cannot do that we have to stipulate polysemies of words in a way so that agree and cars have two different meanings in (12) – (13) and (14) – (15) below. LOC handles this as a choice between construals meaning Gestalts as either bounded or scalar as in (12) through (15) below. (12) I completely agree with you. (13) I very much agree with you. (14) At the moment we sell a lot of cars. (15) You get a lot of car for your cash.
In (12), the Gestalt of the content is bounded. The agreement is total, whereas the Gestalt of (13) is construed in terms of a scalar Configuration, expressing a range on a scale of agreement. In (14) cars are presented as many individuated objects, while in (15) the Gestalt Construal is a mass construal of an amount. It is not a matter of a heap of cars or something similar. The combination of a lot of and car in the singular makes the interpreter search for a reasonable interpretation in the context where the example is encountered, which is likely to be in the context of car advertisements. A reasonable interpretation would be to pick up on a powerful engine or a spacious car for your big family. The beauty of this expression in an advertisement is that it fits well with several aspects of the advantages of this car depending on who the potential customer is. In any interpretation of (15) the Gestalt is scalar and the range on the scale is having a lot of that property, be it the power of the engine, the size of the car or the degree of comfort of the interior. In sum, degree is a pervasive phenomenon in language use, involving scales and boundaries. It is part and parcel of all kinds of different meaning structures (Sapir 1949, Bolinger 1972, Paradis 2001, Hartman 2013). Traditional morpho-syntactic approaches fail to account for the combinatorial dynamics of gradability in discourse and the ease with which it is invoked in new contexts (Paradis 2008). Degree is a Configurational meaning structure which is used to construe things, events and states, and it plays a role as a structure that grounds the utterance in the relevant
286
Carita Paradis
communicative situation, invoking an (inter)subjective perspective in expressions such as quite obvious and very pleased.
5.3 Antonymy Along the same lines that degree can be applied to most Contentful meaning structures, most, if not all, Contentful meaning structures can be construed as binary opposites, i.e. antonyms in language (Paradis et al. 2009, Paradis/Willners 2011, Jones et al. 2012, for a survey of different lexical semantic relations see Storjohann this volume). When asked to give examples of good opposites, speakers offer pairs such as high–low, long–short, buy–sell, man–woman. Such pairs share the characteristic of expressing simple Contentful structures of one or a couple of dimensions. This simplicity is the reason why, in particular, some adjectival meanings that express opposite properties on a single meaning dimension such as height or length are readily elicited by speakers as a response to questions such as What is the opposite of X?. For instance, the majority of words whose meanings are described through their opposites in dictionaries are adjectives such as high–low, long–short or prepositions such as in–out, up–down. (Paradis/Willners 2007). Like degree, binary opposition is not confined to certain words or classes of words, but is part of the use potential of most words, as in (16) through (18). (16) I prefer stress to boredom any day. (17) They are not calm, rather they are excited. (18) Laparoscopic surgery is less expensive than open surgery.
In cross-linguistic investigations of English and Swedish, a continuum of goodness of antonym couplings has been identified (Paradis et al. 2009, Willners/Paradis 2010). In both languages there is a group of antonymic pairs that speakers regard as excellent antonyms, such as high–low and man–woman, and there are pairs that do not appear to form strong couplings but in restricted registers, such as stress–boredom (16), calm–excited (17) and laparoscopic–open (18). Experimental research has shown that the salience of the Contentful dimension along which two words are used to express binary opposition is the cause of the felicity of the pairings (van de Weijer et al. 2012). Such salient dimensions are easily identifiable representations that relate to space, time and other aspects that are close to human life in general, such as height, length, merit and truth. In accordance with those findings, antonym felicity does not seem to be primarily an effect of frequency of co-occurrence. Yet, frequency of the members of the pairs, individually, has been shown to correlate with participants’ assessment of antonym felicity (Paradis 2009). Neurophysiological experiments using Event Related Potentials have confirmed that the group of very strongly coupled pairs have strong priming effect on
Meanings of words: Theory and application
287
one another both out of context and within a suitable context, while other antonym pairs such as calm and excited only have a priming effect on one another when a contextual clue is provided (van de Weijer et al. 2014). In accordance with several different experiments and corpus studies, this neurophysiological effect indicates that the relation of antonymy should not be regarded as monolithic category as suggested by the Structuralists, but as a category where the members exhibit different strengths of relatedness (Paradis et al. 2009). In addition, it is worth mentioning that the most strongly coupled adjectival antonymic pairings have been found to occur in the same type of semantic environments also when they are not used to express oppositeness, which is a fact that may be part of participants’ tacit knowledge of their symmetrical usage pattern (Paradis et al. 2015). What this research suggests is that there is a great deal of dynamics in antonym Construals. Through LOC, we are able to account for the meaning structure of words used as antonyms in terms of both their Content and the Configuration, and to explain why some pairings are considered to be excellent antonym partners as well as how it is perfectly possible to construe most meanings of words as antonyms. As pointed out, the profiled meaning structures of good antonyms are simple, salient dimensions such as length, width, height, merit and gender. We have also established that there is a continuum from conventionalized uses to highly creative or idiosyncratic uses. The more creative pairings are dependent on contextual boosting, as in the Richard Wilbur poem in (19). Wilbur presents the opposite of riot using a much longer chunk, namely lots of people keeping quiet and thereby highlights the dimension of opposition in terms of loudness. (19) What is the opposite of riot? It’s lots of people keeping quiet. (Wilbur 2006, 8)
In spite of differences of strength and affinity of opposition between form–meaning pairings, these are all expressions of communicatively motivated binary opposition. At the level of Configurational representation, all binary opposition is equal. The underlying Contentful meaning structure is divided into two parts, as shown in Figure 2. Antonymy as a Gestalt construal is an instance of a bisected domain, where the two sides of a Contentful dimension is divided by a boundary. This is the structure that all antonym Construals share.
288
Carita Paradis
Fig. 2: The meanings structure of binary oppositeness
The discursive Construal arrangement and the resulting interpretation are shaped by the Construals of profiling, i.e. the assignment of focus of attention on a specific Contentful dimension within a larger domain structure, which allows for the alignment of the two properties of the dimension, and comparison across the opposing properties of that dimension. That is, if a pair of lexical items is used as binary opposites, their relation is a bounded Configuration dividing a Contentful structure in two parts, irrespective of whether the Contentful dimension is a single-domain concept, such as length, height, or speed, or a multi-domain concept, such as thing. For instance, if Bill Clinton has been said to be the opposite of Richard Nixon it would have been in terms of some salient profiled dimension where the properties of the two presidents had been compared. This would then involve the Contentful dimension shared by the two properties, the binary Configuration and a comparison of the properties on either side of the Configuration (cf. Figure 2). Antonyms are maximally similar and differ only with respect to the opposing binarity of the properties when antonymy is construed. Clearly, synonymy can be treated in more or less the same way. Synonyms share essential aspects of meaning, but may differ with respect to style or register, e.g. mother – mum, lasting – sustainable, with respect to perspective, e.g. borrow – lend, learn – teach, or part-whole , kill – murder (for a treatment of various discursive and configurational generalities, see Storjohann 2010). As has been stressed several times already, meanings of words are not static and situated in a mental lexicon with set senses, rather they are dynamic and their interpretation crucially depends on our sensory perceptions and our knowledge and reasoning in and about the world. World knowledge is taken seriously in this framework. No principled difference between world knowledge and linguistic knowledge is assumed. What is considered to be either literal or figurative meaning in many approaches to meaning is a non-problem in LOC because it is the Construal of both Contentful and Configurational structures in discourse that makes meaning modelling dynamic.
Meanings of words: Theory and application
289
5.4 Metonymization and metaphorization The final topic that is brought up for discussion in the chapter is how this model handles what is commonly referred to as figurative language, namely metonymization and metaphorization. It should be noted that in LOC both metonymy and metaphor are Construal operations. This is also the reason for why metonymy and metaphor come with the suffix –ization, thus highlighting their role as processes. They are regarded to be part of the dynamics. While metonymization comprises various levels of relationships between word forms and meanings, we are only concerned with the Construal operation as such here using metonymization as an umbrella term for the Construal of salience, i.e. the assignment of focus of attention in a part-whole (or a whole-part) Configuration, as in (20), but not whether or not the it is metonymization proper across senses or zone activation within senses (for more details on this see Paradis 2004, 2011). (20) She took a cold shower and went back to work again.
In (20) it is not the shower itself that is cold, but the water that comes from the shower sprayer. There is a contingent relation between the shower itself and the water, i.e. what it is used for. Through the use of cold the reader knows that it is the water that is the focus of attention in the utterance and not the shower itself. In the case of cold shower, the metonymization is conventionalized in the sense that it is likely to be found in a dictionary, while other types of metonymization might not, e.g. the piano was ill today, where piano is used as a shortcut for the pianist. From the Construal operation of salience, more precisely, metonymization, we proceed to methaporization, which is a Construal operation which is based on comparison. Consider (21) through (24). (21) Bill felt his blood turn cold. (22) Anna’s gaze pierced him like cold steel. (23) They are all so hot-blooded. (24) Her warm eyes smiled at him.
His blood turned cold in (21) is an example of metaphorization. What happens when an object or an animate being turn cold is that they become stiff and unpleasant, or applied to animates, it is what happens when they die. The expression involves the comparison of the concrete entity blood, which under normal circumstance is warm. Turning cold indicates that something is wrong. The construction suggests that the person experienced a feeling of horror. A comparison across the Contentful domains of concrete blood is made with fear. The Configuration of the process of stiffening is kept invariant in the two readings. This is thus also how metaphorical meanings are defined and explained.
290
Carita Paradis
In (22), Anna’s gaze pierced him like cold steel comprises an explicit comparison across the domains of human sight and metal through like. Furthermore, hot-blooded in (23) characterizes a person who is easily excited. Whereas, the aspect of heat is invariant, there is a shift from the physical domain of hot blood and what that can do to people in the mental domain of personal disposition when it is hot. Warm in warm eyes in (24) is not an extreme range of the temperature scale, but rather a moderate and pleasant one. It indicates friendliness also in the domain of personal propensities. What is particularly interesting about temperature dimensions is that the antonymic members are used to carry evaluative polarity in their metaphorical use, where the heat range of the scale is often positive and coldness negative as is the case for many of the canonical couplings. This is not always the case since the extreme, as in (23) may be too much of a good thing. This means that through the contentful dimensions of antonymic partners there are generalizable valenced superstructures (Paradis et al. 2012). Like the above uses of hot, cold and warm, many dimensional adjectives are often used across domains. That is, not only as metaphorical uses of temperatures for personalities, but also cross-sensory uses. An interesting case in point is the use of sharp in descriptions of sensory experiences of wine (Paradis/Eeg-Olofsson 2013) in (25), (26) and (27). (25) …cinnamon, and white raisins can be found in the zesty sharp aromas of the 2001 Riesling Eiswein… (26) …a medium-bodied wine with gorgeously proportioned, razor sharp flavors… (27) …the high acidity levels give the wine a compressed sharp feel on the palate…
In (25)-(27), sharp is used for smell, taste and texture respectively. The Contentful ontological cross-overs of sensory modalities are to be considered symptoms of ‘synesthesia’ in the wine-tasting practice. The words can be considered monosemous at the conceptual level because they do not exhibit any strong zeugmatic effects when they combine, as in both the smell and the taste were sharp. Using Cruse’s way of describing sense distinctions, this suggests that olfactory and gustatory structures are not separated by robust empty regions in conceptual space, but are rather close to one another, which makes the use of sharp for both modalities felicitous. In contrast to the standard view of the meanings of words for sensory perceptions, my contention is that it is not the case that, for instance, sharp in sharp taste primarily evokes a notion of say touch which would be the traditional metaphor approach to the meaning of such descriptors; rather the sensory experiences are strongly interrelated in cognition. When instantiated in, say smell, sharp spans the closely related sense domains, and the lexical syncretism is taken to be grounded in the workings of human sensory cognition (for a more detailed discussion of the semantics of this see Paradis 2015). Descriptions of sensory perceptions are interesting, in particular smell, because there
Meanings of words: Theory and application
291
is not a distinct modality specific vocabulary, at least not in Western cultures (Caballero/Paradis, 2013, 2015).
6 Summary The purpose of this chapter has been to present a framework, LOC, for the modelling of meaning-making in discourse, focussing on the meanings of words. LOC, assumes that meaning in language is founded on sensory perceptions and concepts that are formed from our encounters with other people in the world, i.e. the socio-sensory-cognitive triad. Much of our understanding of language consists in thinking by means of mental imagery, conceptual structures and schemas of reasoning. The ways we sense and understand the world are communicated through the words of the languages of the world. Similarities across languages are due to factors that human beings share; differences are due to cultural differences. There is a great deal of flexibility in how we can express our thoughts, feelings and observations. The role of words is to act as triggers for large amounts of meaning structures of different kinds that are stored in our brains. Some of these meanings are shared with other people, while others are not. Words serve the purpose of coordinating the actions of communication between human beings in their pursuit of shared goals. A leading idea of the LOC approach to meaning in language is that lexical items evoke meanings rather than have meanings; lexical meanings emerge in actual language use in human communication. These fundamental assumptions presuppose that meanings of lexical items are dynamic and sensitive to contextual demands, rather than stable and fixed. Construal operations are the source of all readings —conventional as well as ad hoc. I hope to have demonstrated how the dynamics of meaning-making in language use can be modelled and explained in the LOC framework.
7 References Barsalou, Lawrence (2008): Grounded cognition. In: Annual Review of Psychology 59, 617–645. Bianchi, Ivana/Roberto Burro/Stefania Torquati/Ugo Savardi (2013): The middle of the road: perceiving intermediates. In: Acta Psychologica 144:1, 121–135. Bianchi, Ivana/Ugo Savardi/Michael Kubovy (2011): Dimensions and their poles: a metric and topological approach to opposites. In: Language and Cognitive Processes 26, 1232–1265. Bolinger, Dwight L. (1972): Degree Words. The Hague/Paris. Caballero, Rosario/Carita Paradis (2013): Perceptual landscapes from the perspective of cultures and genres. In: Caballero Rosario, Díaz Vera Javier (eds.): The Embodied Soul – Explorations into Human Sentience – Imagination, (E)motion and Perception. Berlin, 77–105.
292
Carita Paradis
Caballero, Rosario/Carita Paradis (2015): Making sense of sensory perceptions across languages and cultures. In: Sensory Perceptions in Language and Cognition. Special Issue of Functions of Language 22/1, 1–19. Croft, William/Alan Cruse (2004): Cognitive Linguistics. Cambridge. Croft, William/Esther J. Wood (2000): Construal operations in linguistics and artificial intelligence. In: Liliana Albertazzi (ed.): Meaning and Cognition: A Multidisciplinary Approach. Amsterdam, 51–78. Cruse, Alan (2002): The construal of sense boundaries. In: Revue de Sémantique et Pragmatique 12, 101–19. Fillmore, William (2006): Frame semantics. In: Dirk Geeraerts (ed.): Cognitive Linguistics: Basic Readings. Berlin/New York, 373–400. Gärdenfors, Peter/Massimo Warglien (2013): The development of semantic space for pointing and verbal communication. In: Carita Paradis/Jean Hudson/Ulf Magnusson (eds.): The Construal of Spatial Meaning: Windows into Conceptual Space. Oxford, 29–42. Gärdenfors, Peter (2014): The Geometry of Meaning: Semantics Based on Conceptual Spaces. Cambridge/Massachusetts. Geeraerts, Dirk/Hubert Cuyckens (2007): The Oxford Handbook of Cognitive Linguistics. Oxford. Gibbs, Raymond (1994): The Poetics of Mind: Figurative Thought, Language and Understanding. New York. Goldberg, Adele (2006): Constructions at Work: The Nature of Generalization in Language. Oxford. Hartman, Jenny (2013): Bit: An Examination of the Explanatory Power of a Meaning Potential Approach to the Description of Lexical Meaning. Dissertation: Stockholm University. (http://urn. kb.se/resolve?urn=urn:nbn:se:su:diva-89401 ). Jones, Steven/M. Lynne Murphy/Carita Paradis/Caroline Willners (2012): Antonyms in English: Construals, Constructions and Canonicity. Cambridge. Lacey Simon/Stilla Randall/Krish Sathian (2012): Metaphorically feeling: comprehending textural metaphors activates somatosensory cortex. In: Brain and Language 120:3, 416–421. Langacker, Ronald (1987a): Foundations of Cognitive Grammar. Vol. 1: Theoretical Prerequisites. Stanford. Langacker, Ronald (1987b): Nouns and verbs. In: Language 63:1, 53–94. Langacker, Ronald. (1999): Grammar and Conceptualization. Berlin/New York. Morrot, Gil/Frédéric Brochet/Denis Dubourdieu (2001): The color of odors. In: Brain and Language 79, 309–320. Paradis, Carita (2001): Adjectives and boundedness. In: Cognitive Linguistics 12:1, 47–66. Paradis, Carita (2003): Is the notion of linguistic competence relevant in Cognitive Linguistics. In: Annual Review of cognitive Linguistics 1, 247–271. Paradis, Carita (2004): Where does metonymy stop? Senses, facets and active zones. In: Metaphor and Symbol 19:4, 245–264. Paradis, Carita (2005): Ontologies and construals in lexical semantics. In: Axiomathes 15, 541–573. Paradis, Carita (2008): Configurations, construals and change: expressions of degree. In: English Language and Linguistics 12:2, 317–343. Paradis, Carita (2009): Good, better and superb antonyms: a conceptual construal approach. In: Marie Vachková (ed.): The Annual of Texts by Foreign Guest Professors. Faculty of Arts, Charles University in Prague, 385–402. Paradis, Carita (2011): Metonymization: key mechanism in language change. In: Reka Benczes/ Antonio Barcelona/Francisco Ruiz de Mendoza Ibáñez (eds.): What is Metonymy? An Attempt at Building a Consensus View on the Delimitation of the Notion of Metonymy in Cognitive Linguistics. Amsterdam, 61–88.
Meanings of words: Theory and application
293
Paradis, Carita (2012a): Cognitive grammar. In: Carol A. Chapelle (ed.): The Encyclopedia of Applied Linguistics. Oxford, 690–697. Paradis, Carita (2012b): Lexical semantics. In: Carol A. Chapelle (ed.): The Encyclopedia of Applied Linguistics. Oxford, 3357–3356. Paradis, Carita (2015): Conceptual spaces at work in sensory cognition: domains, dimensions and distances. In: Frank Zenker/Peter Gärdenfors (eds.): Applications of Geometric Knowledge Representation. Berlin, 33–55. Paradis Carita/Caroline Willners (2007): Antonyms in dictionary entries: selectional principles and corpus methodology. In: Studia Linguistica 61:3, 261–277. Paradis, Carita/Caroline Willners (2011): Antonymy: from conventionalization to meaning-making. In: Review of Cognitive Linguistics 9:2, 367–391. Paradis, Carita/Mats Eeg-Olofsson (2013): Describing sensory perceptions: The genre of wine reviews. In: Metaphor & Symbol 28:1, 1–19. Paradis, Carita/Caroline Willners/Steven Jones (2009): Good and bad opposites: using textual and psycholinguistic techniques to measure antonym canonicity. In: The Mental Lexicon 4:3, 380–429. Paradis, Carita/Simone Löhndorf/Joost van de Weijer Joost/Caroline Willners (2015): Semantic profiles of antonymic adjectives in discourse. In: Linguistics 53, 153–191. Pickering, Martin, J./Simon Garrod (2013): An integrated theory of language production and comprehension. In: Behavioral and Brain Sciences 36:4, 329–347. Sapir, Edward (1949): Grading: A study in semantics. In: David Mandelbaum (ed.): Selected Writings of Edward Sapir in Language, Culture and Personality. University of California, 122–149. Storjohann, Petra (2010): Synonyms in corpus texts: conceptualisation and construction. In: Petra Storjohann (ed.): Lexical-Semantic Relations: Theoretical and Practical Perspectives. Amsterdam, 69–94. Talmy, Leonard (2000): Toward a Cognitive Semantics. Cambridge (Massachusetts). van de Weijer, Joost/Carita Paradis/Caroline Willners/Magnus Lindgren (2012): As lexical as it gets: The role of co-occurrence of antonyms in a visual lexical decision task. In: Dagmar Divjak/ Stefan Th. Gries (eds.): Frequency Effects in Language Representation. Berlin, 255–280. van de Weijer, Joost/Carita Paradis/Caroline Willners/Magnus Lindgren (2014): Antonym canonicity: temporal and contextual manipulations. In: Brain & Language 128, 1–8. Wilbur, Richard (2006): Opposites, More Opposites, and a Few Differences. Orlando Florida. Willners, Caroline/Carita Paradis (2010): Swedish opposites: A multi-method approach to ‘goodness of antonymy’. In: Petra Storjohann (ed.): Lexical-Semantic Relations: Theoretical and Practical Perspectives. Amsterdam, 15–47.
III Das einzelne Wort
Lothar Lemnitzer/Kay-Michael Würzner
13. Das Wort in der Sprachtechnologie Abstract: Dieser Beitrag setzt sich mit der Verwendung des Terminus Wort in der Sprachtechnologie und den damit verbundenen Problemen auseinander. Es wird eine Reihe von Termen eingeführt, die sich vor allem im Kontext von grundlegenden Verfahren der Sprachverarbeitung wie der Segmentierung (Tokenisierung) und der Kategorisierung (Part-of-Speech Tagging) eingebürgert haben. Diese erweisen sich als präziser als der vage Begriff Wort. In einem weiteren Abschnitt wird gezeigt, dass durch die Verwendung des Terminus Wort in komplexen sprachtechnologischen Anwendungen Probleme, die mit mangelnder Auflösung sprachlicher Ambiguität zusammenhängen, eher verdeckt werden. Wir plädieren deshalb für eine Herangehensweise, die nicht gänzlich auf den Terminus Wort verzichtet, dieser aber jeweils klar definiert und das Verhältnis zu den anderen Termini geklärt wird. 1 Einleitung 2 Begriffliches: Type, Token, Lemma und Lexem 3 Tokenisierung 4 Morphologische Analyse 5 Anwendungsbeispiele 6 Ausblick 7 Literatur
1 Einleitung Da das Handbuch, in dem dieser Artikel erscheint, ganz dem Thema ‚Wort‘ gewidmet ist, ist es müßig, hier eine weitere Begriffsbestimmung zu versuchen. Wir wollen stattdessen zunächst klären, was wir im Kontext dieses Artikels unter ‚Sprachtechnologie‘ verstehen. Carstensen (2011) folgend, definieren wir Sprachtechnologie als eine wissenschaftliche Praxis, die sich mit der anwendungsbezogenen, ingenieursmäßig konzipierten Entwicklung von Programmen und Systemen für die Verarbeitung natürlicher Sprache beschäftigt. Diese Praxis ist abzugrenzen von der Computerlinguistik, die sich auch mit theoretischen Konzepten etwa aus den Bereichen der Informatik und der Linguistik befasst und diese auf ihre Eignung für die Aufgabe der maschinellen Verarbeitung natürlicher Sprache prüft. In der Sprachtechnologie steht die Machbarkeit und Effizienz bestimmter Verarbeitungsschritte und -ketten innerhalb eines konkreten Systems oder einer Anwendung im Vordergrund, ferner deren Optimierung und schließlich die Handhabbarkeit für die Benutzer des Systems oder der Anwendung. Theoretische
298
Lothar Lemnitzer/Kay-Michael Würzner
Konzepte werden aus den grundlegenden wissenschaftlichen Disziplinen übernommen und angewendet. Erst im Falle des Scheiterns, also mangelnder Funktionalität oder Performanz eines Systems, werden die Konzepte hinterfragt und der klärende Dialog mit den Fachwissenschaften gesucht. Dennoch ist es wichtig, wenn nicht gar essentiell für eine erfolgreiche ingenieursmäßige Entwicklung sprachtechnologischer Systeme und Werkzeuge, dass die Entwickler ein tieferes Verständnis von den zugrundeliegenden linguistischen Konzepten haben. Auf der anderen Seite ist es für einen fruchtbaren Austausch zwischen Linguisten und Entwicklern sprachtechnologischer Anwendungen wichtig, dass die Linguisten die grundlegenden technischen Konzepte der automatischen Sprachverarbeitung verstehen. Deshalb richtet sich dieser Text an Linguistinnen und Linguisten und Wissenschaftler anderer Disziplinen, die einen Zugang zur Sprachtechnologie suchen, aber auch an sprachtechnologische Entwickler, die ein tieferes Verständnis des Konzepts ‚Wort‘ und benachbarter Konzepte gewinnen möchten. Die Problematik einer sprachwissenschaftlich präzisen und zugleich sprachtechnologisch operationalisierbaren Definition des Konzepts ‚Wort‘ soll hier kurz am Problem der Erstellung eines Indexes für einen Text oder ein Korpus erläutert werden. Ein solcher Index ist eine Datenstruktur, die für eine Reihe sprachtechnologischer Anwendungen elementar ist, z. B. Information Retrieval und Textmining (ausführlicher hierzu Abschnitt 5). Die typische Datenstruktur ist eine Liste von Indexeinträgen mit textuellen Einheiten und der Angabe der Stellen, an der diese Einheiten im Text oder Korpus zu finden sind. Aber was sind diese Einheiten – beliebige Zeichenketten zwischen Trennsymbolen wie etwa Leerzeichen oder sprachliche Zeichen, die mit einer Bedeutung verbunden sind? Diese kurzen Betrachtungen zeigen, dass in sprachtechnologischen Zusammenhängen das Wort mehr etwas anderes ist als eine Folge zusammenhängender Zeichen in einem Text (Bsp. höre .. auf). Es ist also angebracht, sich vor der Entwicklung eines Informationssystems gründlich Gedanken über die verwendeten Konzepte zu machen. Der folgende Text ist wie folgt gegliedert. In Abschnitt 2 werden wir die grundlegende Konzepte im Zusammenhang mit der sprachtechnologischen Verarbeitung von Zeichenketten – Token, Type, Lemma und Lexem – einführen. In Abschnitt 3 gehen wir ausführlich auf die Tokenisierung ein, die als ein grundlegendes computerlinguistisches Verfahren einen möglichst universalen Übergang von einer textuellen Zeichenkette zu abstrakteren, sprachlich beschreibbaren Einheiten anstrebt. In Abschnitt 4 beschreiben wir Verfahren der Lemmatisierung, die einen weiteren Schritt hin zu Einheiten des Lexikons und deren (lexikographischer) Beschreibung ermöglicht. Hierfür werden Konzepte und Methoden aus dem Bereich der Morphologie benötigt. Wir werden Verfahren der Lemmatisierung von ebenfalls noch gebräuchlichen Verfahren des Stemmings (Rückführung auf Stammformen) abgrenzen und einige sprachtechnologische Werkzeuge, die das Verfahren der Lemmatisierung (nicht nur) für das Deutsche implementiert haben, vorstellen. In diesem Zusammenhang werden wir auch die Grenzen zeigen, an die Verfahren der Lemmatisierung für das Deutsche
Das Wort in der Sprachtechnologie
299
beim momentanen Stand der Technik stoßen. In Abschnitt 5 werden wir die Rolle des Konzepts ‚Wort‘ in einigen sprachtechnologischen Anwendungen skizzieren. Abschnitt 6 schließlich liefert einen Ausblick auf das Wechselspiel zwischen Linguistik und Sprachtechnologie und deren Konsequenzen für die Weiterentwicklung der Sichtweisen auf diese Konzepte. Die in diesem Artikel gemachten Aussagen treffen generell auf die alphabetischen Sprachen zu, auch wenn wir zu illustrativen Zwecken meist deutsche Beispiele gewählt haben. Für die silbischen Sprachen sieht die Situation grundlegend anders aus. Die Darstellung sprachtechnologischer Segmentierungs- und Analyseverfahren für nicht-alphabetische Sprachen liegt allerdings außerhalb des Rahmens dieses Artikels.
2 Begriffliches: Type, Token, Lemma und Lexem Die Unschärfe des Konzepts ‚Wort‘ hat in der Sprachtechnologie zur Etablierung einer Reihe von Bezeichnungen für die verschiedenen Konzepte, die mit diesem Begriff assoziiert sind, geführt. In diesem Abschnitt beschreiben wir zunächst diese Termini und die mit ihnen assoziierten Beschreibungsebenen anhand einiger Beispiele zeigen deren konkreten Anwendungsbezug.
2.1 Type und Token Für die textbasierte Sprachtechnologie sind klar und eindeutig abgrenzbare orthografische Einheiten wichtig. Die Identifikation dieser Einheiten bzw. Segmente im Fließtext ist ein wichtiger Schritt am Beginn jeder Verarbeitungskette. Das folgende Beispiel zeigt, dass ein Segmentierungsverfahren, das lediglich die Leerraumtrennung als Hilfsmittel verwendet, nicht zu einer Segmentierung führt, die für die weitere Verarbeitung (Kategorisierung etc.) relevant ist. (1) Rd. 6 000 Beamte, keiner hat Ahnung.
Ein solches Verfahren würde die folgenden Einheiten produzieren: {„Rd.“, „6“, „000“, „Beamte,“, „keiner“, „hat“, „Ahnung.“}.
Um dieses präziser zu fassen, verwendet man in der Sprachtechnologie den Begriff Token (nach. Peirce 1906) zur Bezeichnung von sprachlichen Einheiten, die dem in der Linguistik mit Wort Bezeichneten näher sind als die oben genannten „Zeichenketten zwischen Leerzeichen”. Ein Token ist danach eine dem Wort weitgehend entspre-
300
Lothar Lemnitzer/Kay-Michael Würzner
chende orthografische Einheit, die man an einer exakten Stelle im Text verorten kann (Ausnahmen werden in Abschnitt 4.3 diskutiert). Die präzisere Definition bestimmt auch die Festlegung einer Segmentierungsvorschrift und der auf Grundlage dieser Vorschrift entwickelten Segmentierungsverfahren, die in der Sprachtechnologie Tokenisierung genannt werden (hierauf gehen wir ausführlicher in Abschnitt 3 ein). Eine angemessenere Segmentierungsvorschrift berücksichtigt orthographiespezifische Phänomene wie Interpunktion, und unterscheidet Tokengrenzen von Leerraum, der gelegentlich keine Tokengrenze darstellt. Unterteilt man den obigen Beispielsatz nach dieser Vorschrift, dann erhält man die Tokenfolge: {„Rd.“, „6 000“, „Beamte“, „,“, „keiner“, „hat“, „Ahnung“, „.“}.
Um zwischen der konkreten, kontextbezogenen Realisierung (Token) und einer abstrakteren, kontextunabhängigen Repräsentation einer sprachlichen Einheit zu unterscheiden, führt man (nach Peirce, 1906) für letztere den Ausdruck Type ein. Man kann einen Type als Klasse seiner Token betrachten (vgl. Quine 1987, 218). Die Unterscheidung zwischen Token und Type beeinflusst auch die Messung der Zahl elementarer Einheiten in einem Textkorpus und damit die Bestimmung der Korpusgröße. (2) Wenn vor Fliegen Fliegen fliegen, fliegen Fliegen Fliegen nach.
Der Satz in Beispiel (2) wird in 11 Segmente (Token) zerlegt. Diese können auf 7 bzw. 5 Types abgebildet werden ({„Wenn“, „vor“, „Fliegen“, „fliegen“, „,“, nach, „.“}). Zwei dieser 7 Types sind Interpunktionszeichen; diese werden je nach Theorie und Anwendungszweck (nicht) mitgezählt. Die Größe eines Korpus wird in der Regel durch die Anzahl der Token angegeben. Den lexikalischen Reichtum eines Textes kann man als das Verhältnis der Anzahl von Types und Token quantifizieren (vgl. Wimmer/Altmann 1999). Je größer dieser Wert ist, desto lexikalisch reicher ist der analysierte Text. Für die Erstellung von Indizes aus Texten, einem Verfahren, das man im Information Retrieval braucht, werden in der Regel die Types verwendet. Token werden in solchen Indizes indirekt durch eine Menge von Positionen, an denen die Instanzen dieses Types im Korpus vorkommen, repräsentiert.
2.2 Lemma/Grundform Der Terminus Lemma wird in der Lexikographie und in der Sprachtechnologie unterschiedlich verwendet. Er kann auf eine lange Verwendungsgeschichte zurückblicken, die bis in das Altgriechische zurückreicht (Wolski 1989, 360). In der Lexikographie wird er vor allem in der überlieferten Bedeutung Thema, Überschrift verwendet. In
Das Wort in der Sprachtechnologie
301
den frühen Arbeiten zur Lexikographie wird Lemma als Etikett für eine zur Beschreibung bzw. Definition anstehende lexikalische Einheit verwendet. Wörterbücher und ihre Artikel sind nach der Form der Lemmata alphabetisch geordnet (Wolski 1989, 361). In der Sprachtechnologie hat sich eine andere Verwendung dieses Ausdrucks etabliert: hiermit werden die Grundformen im Text bezeichnet (Dietrich 1973, 1). Das Lemma ist damit ein Repräsentant einer Menge von Types bzw. Token. Die Abstraktion von Types/Token auf Lemmata ist in der Sprachtechnologie vor allem für solche Sprache notwendig, bei denen die grammatischen Funktionen überwiegend durch morphologische Einheiten und Prozesse wie Flexive oder Um- und Ablautung realisiert werden. Wenn es darum geht, die Bedeutungssubstanz eines sprachlichen Zeichens zu repräsentieren, ist es sinnvoll, von den Merkmalen der Flexion zu abstrahieren. Da der ontologische Status des Konzepts Lemma sowohl in der Lexikographie als auch in der Sprachtechnologie umstritten ist (Wolski 1989, 362 für die Lexikographie; Dietrich 1973, 2 für die Sprachtechnologie), hat es sich im sprachtechnologischen Kontext bewährt, von Grundform statt von Lemma zu sprechen. In den meisten europäischen Sprachen gibt es Konventionen für den Ansatz von Grundformen als Repräsentanten von Wortformenmengen (Paradigmen); für Substantive wird als Grundform der Nominativ Singular angesetzt und für Pluraletanta der Nominativ Plural, für Verben wird der Infinitiv Präsens Aktiv und für Adjektive die unflektierte, also prädikativ verwendete, Positivform angegeben (Maier-Meyer 1995, 44). Der Ansatz einer Grundform ist somit wortartabhängig, z. B. „betonteV,1.Ps. Sg. Prät. Aktiv“ ↦ „betonenV“ vs. „betonteAdj Nom. Sg. Fem. Stark“ ↦ „betontAdj“, woraus sich ein Mehrdeutigkeit der Wortform betont hinsichtlich der Grundformen ergibt, denen sie zugeordnet werden kann. Der semantische Inhalt des Zeichens spielt beim Ansetzen der Grundform keine Rolle. In der Sprachtechnologie kommt der Grundform als Abstraktionsform eine herausragende Bedeutung bei der Erstellung von Indizes und statistischen Sprachmodellen zu: Für viele Anwendungen etwa im Bereich des Information Retrieval, der Informationsextraktion etc., aber auch bei der Bildung von statistischen Sprachmodellen ist es wünschenswert oder notwendig, von der konkreten grammatischen Form zu abstrahieren (vgl. Becker/König 2002). Von dem in Abschnitt 2.1 skizzierten Index wird also weiter abstrahiert, indem eine Liste von Grundformen (evtl. mit Auflistung der zugeordneten Types) erzeugt wird. Das zugrundeliegende und in Abschnitt 3 dieses Artikels beschriebene Verfahren ist die Lemmatisierung.
2.3 Lexem und Lexemverband Ein Lexem ist eine abstrakte sprachliche Einheit. Lexeme sind die elementaren Bestandeile des Lexikons. In Nachschlagewerken, zumindest in den gedruckten, wird ein Lexem repräsentiert durch eine konventionalisierte Ansetzungsform oder
302
Lothar Lemnitzer/Kay-Michael Würzner
kanonische Zitierform. Ein oft mit der gleichen Bedeutung wie ‚Lexem‘ verwendeter Ausdruck ist lexikalische Einheit. Ein Lexemverband ist eine Menge von Lexemen, die sich aus einem Wortstamm durch die für eine Sprache üblichen Verfahren der Wortbildung bilden lässt. Im Deutschen sind dies die Affigierung, die Konversion und graphematische Stammveränderungen wie die Umlautung und die Ablautung (vgl. Römer in diesem Band). Für jedes Lexem, das im Wertebereich dieser Funktionen für einen bestimmen Wortstamm liegt, gilt, dass es Teil eines bestimmten Referenzlexikons sein muss. So liegt das Lexem überarbeitbar im Wertebereich des Wortstammes -arbeit-, nicht aber das Lexem *zerarbeitbar. Letzteres ist jedenfalls nicht in Nachschlagewerken verzeichnet. Prinzipiell kann man auch die Komposition als regulären Wortbildungsprozess auffassen und die Lexeme, die durch diesen Prozess aus dem Stamm gebildet werden, in den entsprechenden Lexemverband aufnehmen. Aber erstens sprechen praktische Gründe dagegen, da der Lexemverband in vielen Fällen zu groß für eine praktische Handhabung wird. Dies gilt besonders für kompositionsfreudige Sprachen wie das Deutsche. Zweitens spricht die prinzipielle Erwägung dagegen, dass ein Kompositum aus zwei oder mehreren Wortstämmen besteht. Für kompositareiche Sprachen wird deshalb dem Verfahren des Stemming oder der Lemmatisierung oft eine Komponente vorgeschaltet, durch die Komposita zerlegt werden (Kompositazerlegung). Wir wollen am Schluss dieses Abschnittes die terminologischen Zusammenhänge an einem Beispiel verdeutlichen: der Stamm -arbeit- definiert einen Lexemverband, zu dem in Rahmen unseres Beispiels nur die Lexeme Arbeit, arbeiten und zuarbeiten gehören sollen. Jedes Lexem wird durch eine Grundform repräsentiert und umfasst eine Reihe von Wortformen, die im linguistischen Kontext Wortformen und im sprachtechnologischen Zusammenhang Types genannt werden. Für zuarbeiten sind dies u. a. {zuarbeiten, zuarbeite, zuarbeitet, zuarbeitete, zugearbeitet}. Jeder Type kann in Texten vorkommen, und zwar bei einigen Types entweder als ein Token (Bsp. 3) oder als zwei diskontinuierliche Token (Bsp. 4) (3) …, weil er mit heute nur zuarbeitet (→ zuarbeitet) (4) Er arbeitet mir heute nur zu (→ zuarbeitet)
Wir hoffen, in diesem Abschnitt gezeigt zu haben, dass der Terminus Wort im Kontext von Computerlinguistik und Sprachtechnologie sehr unscharf verwendet wird, d. h. zu viele Phänomene bezeichnet, die in einer sprachtechnologischen Werkstattsprache durch präzisere Bezeichnungen voneinander abgegrenzt und unterschiedlich bezeichnet werden müssen. Zudem gibt es für diese präziseren Begriffe unterschiedliche Bezeichnungen im Kontext der Linguistik und der Sprachtechnologie (Wortform/ Type; Lemma/Grundform). Je nach der Analyseebene, auf der man arbeitet, wird durch diese präziseren Bezeichnungen auf unterschiedliche Mengen von linguistischen Objekten Bezug genommen.
Das Wort in der Sprachtechnologie
303
3 Tokenisierung Die automatische Identifikation von Token in Fließtext ist eine grundlegende und zentrale Aufgabe in der Sprachtechnologie. Die Qualität der Tokenisierung beeinflusst die Qualität nachfolgender Bearbeitungsschritte wie die morphologische und syntaktische Analyse und die Erstellung frequenzbasierter Statistiken. Die wesentliche Herausforderung bei der Tokenisierung ist die Behandlung der funktionellen Mehrdeutigkeit einzelner Zeichen, insbesondere des Punktes (vgl. Beispiel 5, nach Jurish/Würzner 2013). (5) Am 24.01.1806 feierte E. T. A. Hoffmann seinen 30. Geburtstag.
Der Punkt markiert hier Ordinalzahlen und Abkürzungen – hier wird der Punkt als Teil des Tokens betrachtet und somit nicht abgetrennt – und das Ende des Satzes – hier wird der Punkt als ein Token abgetrennt und markiert. Dass der Punkt in vielen Fällen das Satzende markiert, hat dazu geführt, dass das Problem der Satzendeerkennung und damit die Segmentierung eines Textes in Sätze als ein Teilproblem der Tokenisierung behandelt werden (vgl. Grefenstette/Tapanainen 1994, Schmid 2000). Leerraum wird oft als sicherer Tokentrenner bzw. eigenständiges Token angenommen, kann aber auch tokenintern auftreten (vgl. Beispiel 1 in Abschitt 2.1). Definition: Gegeben ein endliches Alphabet Σ und eine Zeichensequenz t = t0 … tn ε Σ* mit n = |t|, definieren wir die Funktion bot als Abbildung {ℕ} → {0,1}, wobei bot(i) 1 zurückgibt, wenn ti der Anfang eines Tokens ist, ansonsten 0.
Die Essenz einer solchen Tokenisierungsroutine ist die bot genannte Funktion, die nach Regeln oder einem statistischen Modell die Tokenanfänge und damit die Token in einem Eingabestring markiert. Der erste Teil des Textes in Beispiel 1 würde demnach wie folgt annotiert: R/1, d/0,./0,SPACE/1,6/1,SPACE/0,0/0, 0/0,0/0,SPACE/1 (in Worten: die Zeichenketten „Rd.“, „6 000“ und das Leerzeichen dazwischen sind je ein Token). Die Aufgabe der Tokenisierung kann auf zweierlei Weise bewerkstelligt werden: Einserseits werden rein regelbasierte Ansätze (z. B. Grefenstette/Tapanainen 1994) angewendet. Diese sind wesentlich von Arbeiten zur Tokenisierung von Programmiersprachen beeinflusst. Mit einer Menge von Regeln (sog. reguläre Ausdrücke) werden Token und ihre Grenzen definiert. Listen von Abkürzungen unterstützen dabei die Unterscheidung der verschiedenen Funktionen des Punktes. Die folgende Abbildung zeigt einen einfachen, regelbasierten Tokenizer auf Basis von lex (Lesk/Schmidt 1975), einem weitverbreiteten Werkzeug zur Generierung von Tokenisierungsprozeduren‚ \w steht hier für alphabetische Zeichen, \s für Leeraum und [^] ist das Symbol für alle noch von keiner Regel erfassten Zeichen. Für jede Regel wird die Zeichen- bzw. Tokenklasse als Symbol zurückgegeben.
304
Lothar Lemnitzer/Kay-Michael Würzner
\s+ [´']+ [?!\.:]+ [0-9]+ ("," [0-9]+)? [0-9\w\-]+ [^]+
{ { { { { {
continue; return QUOTE; return SBOUND; return NUM; return WORD; return OTHER;
/* /* /* /* /* /*
Leeraum überlesen Anführungsstriche Satzgrenzsymbole (Komma-)Zahlen "Wörter" sonstige Zeichen
*/ */ */ */ */ */
} } } } } }
Abb. 1: einfacher regelbasierter Tokenizer auf der Basis von lex
Demgegenüber stehen Ansätze bei denen ein statistisches Modell auf Basis von vorverarbeitetem Text trainiert wird. Die Vorverarbeitung kann dabei in der manuellen Unterteilung in Token und/oder Sätze (sog. überwachtes Training; z. B. Palmer/Hearst 1997) oder in der automatischen Generierung von Trainingsmaterial auf Basis von Heuristiken zur Identifikation eindeutiger Kontexte (sog. unüberwachtes Traning; z. B. Schmid 2000; Kiss/Strunk 2006) bestehen. Zur Illustration der zugrundeliegenden Techniken im Bereich der automatischen Tokenisierung skizzieren wir im folgenden WASTE, einen Ansatz, der ausführlich in Jurish/Würzner (2013) dargestellt wird. Ein Text wird zunächst unter Anwendung von Regeln in Segmente untergliedert (Leerraum, Sonderzeichen, Sequenzen alphabetischer bzw. numerischer Zeichen). Auf Grund von bekannten Segementmerkmalen wie Länge, vorangehender Leeraum, Groß-, Kleinschreibung etc., wird für jedes dieser Segmente bestimmt, ob es ein Token bzw. einen Satz einleitet oder abschließt (wir nennen diese die versteckte Segmentmerkmale, die es zu ermitteln gilt). Segmente können somit zu Token und Sätzen verbunden werden. Die Akkuratheit automatischer Tokenisierungsverfahren auf standardsprachlichen Korpora ist sehr hoch. Schon der in Abbildung 1 dargestellte, einfache, regelbasierte Tokenisierer erzielt auf dem Tiger-Korpus (Brants u. a. 2004) eine Genauigkeit von 99,12 % auf Token- und 88,34 % auf Satzebene im Vergleich zu dessen manueller Tokenisierung. Elaboriertere Verfahren wie das oben skizzierte erreichen auf diesem Korpus bis zu 99,95 % bzw. 95,98 % Korrektheit (Jurish/Würzner 2013, 73ff). Da der Tokenisierungsprozess einen Eingabetext in eine lineare Abfolge von Segmenten zerlegt, ist die Zusammenführung nicht-benachbarter Segmente (wie in Beispiel 3 oben) zu einem Segment nicht möglich. Hier liegt die Grenze dessen, was die Tokenisierung zu leisten imstande ist. Damit wird aber auch deutlich, dass ein Token einen anderen Status bzw. Begriffsumfang hat als die sprachlichen Einheiten, die man üblicherweise als Wörter bezeichnet.
Das Wort in der Sprachtechnologie
305
4 Morphologische Analyse 4.1 Begriffsdefinitionen Das Ziel der morphologischen Analyse eines einzelnen, komplexen sprachlichen Zeichens ist dessen Zerlegung in kleinere Segmente, denen als Ganze eine lexikalische Bedeutung oder grammatische Funktion zugeschrieben werden kann. Diese Einheiten werden auf der Ebene des Lexikons (Sprachsystem) Morpheme und auf der Ebene des Textes (Sprachverlauf) Morphe genannt. Ein Morphem kann also im Text durch verschiedene Morphe realisiert werden. Man unterscheidet weiterhin zwischen freien und gebundenen Morphemen. Freie Morpheme (oft auch als Wortbasis oder Wortstamm bezeichnet) sind solche, die allein den Status eines selbstständigen sprachlichen Zeichens besitzen. Gebundene Morpheme hingegen können nur in Verbindung mit freien Morphemen sprachliche Zeichen bilden. Die Verbindung von zwei oder mehr Morphemen wird als Wortbildung bezeichnet. Es können verschiedene Wortbildungsprozesse unterschieden werden. Die für die meisten europäischen Sprachen wichtigsten Prozess sind die Komposition, die Derivation und die Konversion (ausführlicher hierzu Römer in diesem Band). Aufgabe der morphologischen Analyse ist es, bei einem komplexen sprachlichen Zeichen die Wortbildungsprozesse und die daran beteiligten Morpheme, die zu dessen Konstruktion beigetragen haben, zu identifizieren und das analysierte Wort in Morphe zu zerlegen. Diese Morphe werden anschließend als Instanzen von Morphemen klassifiziert. Neben der Segmentierung können so auch die möglichen Wortarten des sprachlichen Zeichens bestimmt werden. Im Deutschen bestimmt fast immer die Kategorie des am weitesten rechts stehenden Morphems, das kein Flexiv ist, die Kategorie des gesamten Zeichens. Eine formalere Definition des Konzepts und Verfahrens der morphologischen Analyse findet sich in Geyken/Hanneforth 2006, Abschnitt 2.1. Bei morphologisch komplexen Sprachen verbietet die Produktivität von Wortbildungsprozessen die einfache Auflistung aller sprachlichen Zeichen, da die Menge bildbarer sprachlicher Zeichen potenziell unendlich ist. Die morphologische Analyse zumindest der sprachlichen Zeichen, die nicht explizit in einem Lexikon aufgelistet sind, muss mit sprachtechnologischen Mitteln geleistet werden. Ein wichtiges Ergebnis der Segmentierung und morphologischen Analyse von sprachlichen Zeichen ist die dadurch mögliche Rückführung dieser sprachlichen Zeichen auf eine Grundform (Lemmatisierung) oder auf einen Stamm (Stemming). Mit Lemmatisierung wird die Menge von Operationen bezeichnet, durch die eine Vollform bzw. ein Type auf die Grundform abgebildet wird, die das zugrundeliegende Lexem repräsentiert. Die wichtigsten Operationen sind die Tilgung von Flexiven, die Ergänzung von zugunsten der Flexive getilgten Elementen (Beispiel 6) und die Reversion von Prozessen der Umlautung und Ablautung.
306
Lothar Lemnitzer/Kay-Michael Würzner
machtest → (durch Tilgung der Personalendung) macht → (durch Tilgung der Tempusen(6) dung) mach → (durch Ergänzung der Infinitivendung) machen
Mit Stemming wird die Menge von Operationen bezeichnet, durch die eine Wortform bzw. ein Type auf den Wortstamm abgebildet bzw. auf diesen reduziert wird. Zu den oben genannten Operationen der Lemmatisierung tritt die Tilgung von Affixen (Beispiel 7): (7) unüberbrückbar → (durch Tilgung des ersten Präfixes) überbrückbar → (durch Tilgung eines weiteren Präfixes) brückbar → (durch Tilgung des Affixes) -brück-
Lemmatisierung und Stemming sind, anders als die morphologische Analyse, keine Verfahren der Segmentierung, da bei einigen Teiloperationen auch die Segmente verändert werden (können). In sprachtechnologischen Systemen für Sprachen mit einer komplexen Morphologie wie das Deutsche oder das Arabische wird die Lemmatisierung oft als Teilaufgabe der morphologischen Analyse realisiert (vgl. Al-Sughaiyer/Al-Kharashi 2004). Wir werden im Folgenden Verfahren und sprachtechnologische Komponenten für die morphologische Analyse und die Lemmatisierung aus technischer Perspektive vorstellen.
4.2 Ansätze zur automatischen morphologischen Analyse Verfahren zur automatischen morphologischen Analyse lassen sich anhand zweier Merkmalspaare klassifizieren: Zunächst findet man auch auf der Ebene der Morphologie die schon in Abschnitt 3 für die Tokenisierung dokumentierte Unterscheidung zwischen regelbasierten und statistischen Verfahren. Regelbasiert heißt hier, dass die möglichen Verbindungen zwischen Morph(em)en mit Hilfe einer Grammatik händisch modelliert werden. Bei einem statistischen Vorgehen wird ein Modell auf der Basis von Sprachdaten induziert. Das zweite Merkmal betrifft die Frage, ob dem Analysesystem ein Lexikon freier Morpheme zur Verfügung steht oder nicht. Ein solches Lexikon ist der Qualität der Analyse sehr zuträglich, bedeutet aber einen hohen Aufwand bei seiner Erstellung. Wir wollen im Folgenden prototypische Techniken innerhalb der skizzierten Klassifikation vorstellen und dabei besonders auf die jeweilige Lösung des Lemmatisierungsproblems eingehen.
4.2.1 Regelbasierter Ansatz mit Lexikon: Finite-State Morphology Der weitverbreitetste Formalismus zur Implementierung computationeller Morphologien sind kontextsensitive Ersetzungsregeln: Ein (komplexes) Symbol, also zum
Das Wort in der Sprachtechnologie
307
Beispiel ein Graphem oder ein Morphem, wird immer dann durch ein anderes ersetzt, wenn jenes von einem passenden linken und rechten Kontext umgeben ist. Das Verfahren ist computationell wenig aufwendig, es lässt sich mit Hilfe endlicher Automaten implementieren. Lediglich die zyklische Regelanwendung muss ausgeschlossen werden (Johnson 1972). Eine ausführliche Darstellung der Anwendung solcher endlicher Automaten im Bereich der morphologischen Analyse findet sich bei Beesley/ Karttunen (2003). Ausgehend von Koskenniemis (1983) Vorschlag für ein Morphologiesystem auf Basis endlicher Automaten für das Finnische wurden ähnliche Ansätze für die meisten vergleichbaren Sprachen entwickelt (vgl. Beesley/Karttunen 2003). Für das Deutsche liegen unter anderem die Systeme Gertwol (Haapalainen/Majorin 1995), SMOR (Schmid/Fitschen/Heid 2004) und TAGH (Geyken/Hanneforth 2006) vor.
4.2.2 Regelbasierter Ansatz ohne Lexikon Die Abhängigkeit des oben skizzierten Ansatzes von Qualität und Umfang des Lexikons hat zu einer Reihe von Versuchen geführt, das Lemmatisierungsproblem ohne diese aufwendig zu erstellende Ressource zu lösen. Die zugrundeliegende Idee ist, dass die Menge der gebundenen Morpheme wesentlich kleiner und damit leichter vollständig zu erfassen ist als die der freien Morpheme. Die Analyse besteht dann aus der Entfernung aller Affixe unter der Annahme, dass die verbleibende Zeichenkette ein Stammmorphem ist. Frakes (1992) fasst derartige Ansätze als Affix Removal Stemmers zusammen. Um den Wortstamm komplexer englischer Wörter zu bestimmen, nutzt Porter (1980) eine Liste bekannter Affixe. Dabei ist jedem verzeichneten Affix eine Regel zugeordnet, durch deren Anwendung das Affix entweder entfernt (house#s → house) oder durch ein anderen Symbol ersetzt (fl#ies → fl#y) wird. Dies erlaubt die Behandlung orthographischer bzw. phonotaktischer Prozesse, die mit der Affigierung einhergehen. Es gibt eine Menge von Regeln auf mehreren Regelebenen, die sukzessive angewendet werden. Der sog. Porter-Stemmer, der für mehrere Sprachen implementiert wurde, erfreut sich in Anwendungen des Information Retrieval großer Beliebtheit. Einen vergleichbaren Ansatz für das Deutsche präsentieren Reichel/Weinhammer (2004).
4.2.3 Statistische Verfahren ohne Lexikon: Morphologieinduktion Im Unterschied zu regelbasierten Verfahren ist bei statistischen Ansätzen zur morphologischen Analyse das sprachliche Wissen nicht als Regelsatz, sondern als Wahrscheinlichkeitsverteilung repräsentiert. Bei der Morphologieinduktion wird diese aus unbearbeiteten Daten, also unanalysiertem Rohtext, gewonnen. Die Identifikation
308
Lothar Lemnitzer/Kay-Michael Würzner
von Morphemen erfolgt über die Häufigkeit von Zeichensequenzen. Eine Reihe von Ansätzen (z. B. Déjean 1998; Goldsmith 2001) bedienen sich des Konzepts der Nachfolgerfrequenz (engl. successor frequencys, vgl. Harris 1955), definiert als Anzahl der verschiedenen Buchstaben, die, gegeben ein Korpus oder eine große Wortliste, einer Position in einem Wort folgen können. Positionen hoher Nachfolgerfrequenz sind gute Kandidaten für Morphemgrenzen. Goldsmith (2001) kombiniert diese Heuristik mit der Annahme einer zugrundeliegenden Wortstruktur Präfix? Stamm Suffix*, um sogenannte Signaturen zu identifizieren, d. h. Gruppen von Stämmen, die mit den gleichen Affixen auftreten. Diese Signaturen dienen sowohl zur Generalisierung als auch zur Bestimmung von Kategorien. Die von Goldsmith (2001) angenommene starre Wortstruktur wurde von Creutz/ Lagus (2002) als ungeeignet für die Induktion komplexerer Morphologien in agglutinierenden oder komponierenden Sprachen kritisiert. Stattdessen bewerten diese Autoren alle möglichen Zerlegungen. Dazu wird eine Morphemliste verwendet, die anfangs leer ist. Die Morphologieinduktion besteht im Prinzip aus dem Befüllen dieser Liste durch wiederholte Iteration über den Rohtext. Kann ein Wort auf Basis der aktuell gesammelten Morpheme nicht zerlegt werden, so wird es als Ganzes in die Liste aufgenommen. Zusätzliche Listeneinträge sind mit Kosten verbunden, so dass eine Zerlegung präferiert wird und Wörter im Verlauf der Lernphase auch wieder entfernt werden können. Der Vorgang wird so lange wiederholt, bis sich die Liste stabilisiert. Das System von Creutz/Lagus (2002) wurde mehrfach überarbeitet und so erweitert, dass auch Wortfrequenz und Längenverteilungen berücksichtigt werden (vgl. Creutz/Lagus, 2007).
4.2.4 Statistisch mit Lexikon Die Genauigkeit morphologischer Analyseverfahren, die vollständig ohne lexikalisches Wissen arbeiten, entspricht bisher nicht den Anforderungen (vgl. z. B. die Ergebnisse der Morpho Challenge, einem Wettbewerb von Morphologieinduktionsverfahren: Kurimo u. a. 2010). Dies betrifft v. a. sprachtechnologische Anwendungen, die morphologische Informationen weiterverarbeiten (z. B. syntaktische Parser oder Graphem-Phonem-Konvertierungsroutinen). Ansätze, die ein statistisches Inferenzverfahren mit manuell erstellten Lexika verbinden, erzielen eine wesentlich höhere Akkuratheit. Der Umfang der notwendigen händischen Vorarbeiten ist wesentlich geringer als bei regelbasierten Ansätzen, da Regularitäten aus dem Trainingsmaterial inferiert und auf unbekannte Wörter übertragen werden. Ein Vertreter dieser Strategie ist MOSES (Klenk/Langer 1989): Anhand manuell segmentierter Wörter wird die Wahrscheinlichkeit abgeleitet, dass sich zwischen zwei Buchstaben eines Wortes eine Morphemgrenze befindet. Dazu werden die Wörter in Buchstabenpaare zerlegt (zerlegen → , , , , , , ). Für jedes Buchstabenpaar wird nun bestimmt, wie oft es durch eine Morphemgrenze unterbrochen wird (M), wie oft
Das Wort in der Sprachtechnologie
309
es auf eine Morphemgrenze folgt (A) und wie oft es vor Morphemgrenzen vorkommt (E). Da die Anzahl der möglichen Buchstabenpaare im lateinischen Alphabet klein ist, können bereits mit kleinen Trainingsmengen verlässliche Wahrscheinlichkeiten abgeleitet werden. Der automatische Segmentierungsschritt eines Wortes umfasst für jedes Buchstabenpaar dann die Verrechnung der Werte für E, M und A und daraus die Bestimmung der wahrscheinlichsten Morphemgrenzen. Oflazer u. a. (2001) haben ein Verfahren vorgestellt, das den Aufwand bei der Erstellung eines regelbasierten Verfahrens minimiert. Zugrunde liegt die Tatsache, dass die Flexion vieler Wortformen von einigen wenigen morphologischen Paradigmen geregelt wird. Aus strukturierten Beispielen für diese Paradigmen extrahiert ein Induktionsmechanismus Transformationsregeln. Es werden zunächst alle möglichen Stamm/Affix-Konfigurationen, die mit dem Paradigma kompatibel sind, erstellt. Es wird dann die Kombination gewählt, bei der der Stamm den geringsten Editierabstand zu den Wortformen des Paradigmas aufweist.
4.3 Ambiguitätsbehandlung Wie bereits oben erwähnt, sind Ambiguitäten im Bereich der Morphologie häufig zu beobachten. Wir können verschiedene Dimensionen von Ambiguität unterscheiden: 1. Kategorielle Ambiguität, 2. Morphosyntaktische Ambiguität, 3. Zerlegungsambiguität und 4. Lexikalische Ambiguität. Von einer kategoriellen Ambiguität spricht man in Fällen, in denen ein sprachliches Zeichen zu mehreren Wortarten gehören kann. Im deutschen Funktionswortbereich betrifft das zum Beispiel die, das sowohl als Artikel als auch als Relativpronomen verwendet wird; grüne kann, abhängig vom Kontext, als Adjektiv oder als Imperativform des Verbes grünen verwendet werden. Eine morphosyntaktische Ambiguität liegt vor, wenn mehrere Ausprägungen eines morphologischen Paradigmas die gleiche Oberflächenform haben. Formgleichheit ist beispielsweise in der schwachen deutschen Verbflexion zwischen 1. und 3. Person Plural Indikativ Aktiv sowohl im Präsens als auch im Präteritum zu beobachten. Auch der Artikel die ist bezüglich Numerus, Genus und Kasus in diesem Sinne ambig. Von Zerlegungsambiguität spricht man in solchen Fällen, in denen ein sprachliches Zeichen in mehrere verschiedene Morphemsequenzen unterteilt werden kann, wie bei Stau#becken und Staub#ecken oder Er#blasser und Erb#lasser. Lexikalische Ambiguitäten treten im Bereich der Homonymie auf: Eine Oberflächenform kann unabhängig von der morphologischen Struktur zwei Lexemen zugeordnet werden. Bank bezeichnet entweder ein Geldinstitut oder eine Sitzgelegenheit. Ein sprachliches Zeichen kann dabei durchaus von mehreren Ambiguitätsbereichen betroffen sein. So verursacht die lexikalische Ambiguität bei modern (mōdern vs. modérn) eine Mehrdeutigkeit auf kategorieller Ebene (Verb vs. Adjektiv).
310
Lothar Lemnitzer/Kay-Michael Würzner
Die Auflösung von morphologischen Ambiguitäten ist eine wichtige Aufgabe der Sprachtechnologie. Für die oben skizzierten Ambiguitätsarten sind verschiedene Disambiguierungsverfahren vorgeschlagen worden, die eine unterschiedlich tiefe linguistische Analyse voraussetzen. Kategorielle Mehrdeutigkeiten werden im Rahmen des Part-of-Speech (PoS) Taggings aufgelöst. Dabei wird jedem Wort in Abhängigkeit seines Kontexts genau eine syntaktische Kategorie (engl. Part-of-Speech) zugewiesen. Einen Überblick über etablierte Techniken und Implementationen gibt Voutilainen (2003). Für die Auflösung morphosyntaktischer Ambiguitäten reicht das Wissen über die syntaktische Kategorie nicht aus. Es müssen zusätzlich die syntaktischen Abhängigkeiten des fraglichen Wortes innerhalb des Satzes bestimmt werden. Man bedient sich dazu des sogenannten Dependenzparsings. Auf Basis einer Dependenzgrammatik werden dabei paarweise Beziehungen zwischen regierendem (Regens) und abhängigem (Dependens) Wort hergestellt, beispielsweise zwischen Verb und Nomen. Diese werden zudem typisiert. Damit kann bei Verb-Nomen-Beziehungen zwischen Subjekt, Akkusativ- und Dativobjekt unterschieden werden, was wiederum die Bestimmung des tatsächlichen Kasus der im Satz verwendeten Artikel ermöglicht. Zerlegungs- sowie lexikalische Ambiguitäten sind nicht mit Hilfe syntaktischer Analysen aufzulösen. Hier bewegt man sich in den Bereich der Semantik. Volk (1999) schlägt ein heuristisches Verfahren für die Auswahl der wahrscheinlichsten Segmentierung eines Wortes vor. Jede morphologische Operation wird mit einem vorher festgelegten „Kosten“-Gewicht assoziiert: Derivationen kosten einen Punkt, während Kompositionen 4 Punkte kosten. Im Falle von Abteilungen (i.e. Abtei#lunge{n} vs. Ab|teil|ung{en}) wird die Analyse, die zum Lemma Abteilung führt, als die „kostengünstigere“ bevorzugt. Schiller (2006) schlägt eine Modifikation dieses Verfahrens vor, bei dem die Gewichte anhand von Trainingsdaten von der Frequenz der beteiligten Morpheme abhängen. Beiden Verfahren ist es gemein, dass die Entscheidung über die korrekte Zerlegung kontextunabhängig getroffen wird. Dem Bereich der lexikalischen Ambiguitäten widmen sich Verfahren der Wortartendisambiguierung (engl. „word sense disambiguation“, WSD). Dabei wird die wahrscheinlichste Bedeutung eines Wortes im spezifischen Kontext anhand der Inhaltswörter in der Umgebung bestimmt, zugrunde liegt auch hier ein an Referenzdaten trainiertes, statistisches Modell. Ein umfassender Überblick in diese Thematik findet sich bei Navigli (2009). Alle diese Ambiguitäten beziehen sich auf eine der in Abschnitt 2 genannten Kategorien sprachlicher Objekte im Verhältnis zu einer anderen Kategorie sprachlicher Objekte: a) die kategorielle Ambiguität bezieht sich auf Types bzw. Grundformen im Verhältnis zum Lexem, das sie repräsentieren; b) die morphosyntaktische Ambiguität bezieht sich auf Types, die unterschiedliche Positionen im Formparadigma einer Grundform einnehmen; c) Die Zerlegungsambiguität betrifft ebenfalls Types, in diesem Fall aber im Verhältnis zum (komplexen) Lexem, das sie auf textueller Ebene
Das Wort in der Sprachtechnologie
311
repräsentieren; d) die lexikalische Ambigutät schließlich bezieht sich auf Grundformen im Verhältnis zum Lexem, das sie repräsentieren. Allen diesen Typen von Ambiguität ist gemeinsam, dass sie potenzielle Fehlerquellen für sprachtechnologische Anwendungen darstellen, also Probleme, die die Performanz dieser Systeme negativ beeinflussen. Für die erfolgreiche Auflösung dieser Ambiguitätsklassen sind unterschiedliche Grade computer-linguistischer Finesse und unterschiedlich komplexe linguistische Ressourcen notwendig. Es sollte außerdem deutlich geworden sein, dass die in Abschnitt 2 eingeführten Bezeichnungen gut dafür geeignet sind, die grundlegenden sprachtechnologischen Analyseverfahren zu beschreiben und die damit verbundenen Probleme, vor allem die Ambiguitäten, kategoriell zuzuordnen. Im folgenden Abschnitt werden wir sog. „high level“ Verfahren in der Sprachtechnologie beschreiben, also solche, die auf den bisher beschriebenen grundlegenden Analyseprozessen aufbauen, und Probleme zeigen, die sich aus einer undifferenzierten Verwendung des Terminus Wort bei der Beschreibung dieser Systeme und ihrer Komponenten ergeben.
5 Anwendungsbeispiele 5.1 Extraktion von Informationen aus Texten Eine Klasse textbasierter sprachtechnologischer Anwendungen befasst sich mit der Erschließung von Informationen aus Texten und Korpora. Wir möchten hier zwei dieser Verfahren herausgreifen und im Folgenden vor allem hinsichtlich des zugrundeliegenden Wortbegriffs beschreiben (eine kritische Reflexion (auch) der sprachtechnologischen Grundlagen findet sich in Stavrianou u. a. 2007). (1) Die älteste und am weitesten entwickelte Anwendung ist das Information Retrieval. Es ist das Ziel des Information Retrieval, zu einem als Frage formulierten Informationsbedürfnis eines Benutzers die Dokumente in einer Dokumentensammlung zu finden (und bereitzustellen), die in Bezug auf dieses Informationsbedürfnis die relevantesten sind. Eine Spezialanwendung des Information Retrieval sind FrageAntwort-Systeme, die auf eine Frage nicht eine Menge von Dokumenten zurückgeben, sondern eine Menge von Textausschnitten, die wahrscheinlich die Antwort auf diese Frage sind (ausführlicher zu Grundlagen und Architektur von Frage-Antwort-Systemen Pasca 2003). (2) Eine neuere Entwicklung ist das Verfahren des Textmining. Das Verfahren ist explorativ und geht nicht von einer konkret formulierbaren Nutzerfrage aus. Im Fokus sehen vielmehr Beziehungen zwischen den Texten eines Korpus, die zwar vorhanden, aber nicht offensichtlich sind. Hearst führt das folgende Beispiel an:
312
Lothar Lemnitzer/Kay-Michael Würzner
As another example, one of the big current questions in genomics is which proteins interact with which other proteins. There has been notable success in looking at which words co-occur in articles that discuss the proteins in order to predict such interactions. The key is to not look for direct mentions of pairs, but to look for articles that mention individual protein names, keep track of which other words occur in those articles, and then look for other articles containing the same sets of words. (Hearst 2003).
Ausführlicher zu den Grundlagen und Anwendungen des Textmining s. Hotho/Nürnberger (2005). Beiden Verfahren ist gemeinsam, dass Texte formal und inhaltlich miteinander verglichen werden müssen. Im Falle des Information Retrieval werden jeweils paarweise die Anfrage und ein Text miteinander verglichen, beim Textmining werden Texte paarweise verglichen. Im Falle des Information Retrieval ist das Ergebnis eine Rangfolge der Texte hinsichtlich ihrer Relevanz für die Anfrage. In die für das Ranking erforderliche Kennziffer kann eingehen, wie viele der Terme in der Suchanfrage wie oft in einem Text vorkommen. Die einfachste Methode, Anfrage und Text zu vergleichen, ist es, beide Zeichenketten in Token zu segmentieren und diese Token in Vektoren umzuwandeln. Jedem Token in jedem Text wird im Vektor ein Kennziffer zugeordnet: 1 (0) für „im Text (nicht) vorhanden“. Alternativ kann einem Type die absolute bzw. relative Häufigkeit des Vorkommens, also die Anzahl der Token, als Kennziffer angegeben werden. Sind diese Wortvektoren gebildet, dann stehen mathematische Verfahren der Operation mit Vektoren zur Verfügung, die Ähnlichkeit von Frage und Dokument bzw. von zwei Dokumenten als Nähe der beiden Vektoren operationalisieren und auf die wir hier nicht weiter eingehen. Dieses Verfahren wird als „bag-of-words“-Verfahren bezeichnet. Der eine, in unserem Zusammenhang weniger relevante Kritikpunkt an diesem Vorgehen ist, dass es von der Position, in der die „Wörter“ im Text auftreten, abstrahiert. Der wichtigere Kritikpunkt ist, dass der ungeklärte Bedeutungsumfang des Ausdrucks Wort, der in „bag of words“ steckt, etwa im Verhältnis zu den in Abschnitt 2 eingeführten Bezeichnungen, unklar ist. Dies soll an einigen (konstruierten) Beispielen verdeutlicht werden. (i) Bleibt man an der Oberfläche der Texte und legt einen simplen, am Leerraum orientierten Tokenisierungsprozess zugrunde, wie er etwa in Stavrianou u. a. 2007 beschrieben wird (‚a common delimiter is the space or tab between words‘), dann bekommt man bereits Probleme mit der Abbildung einer Suchanfrage, in der eine lexikalische Einheit als ein Token realisiert wird (‚welche Risiken bringt es mit sich, wenn man Säuren mit Wasser zusammenschüttet?‘), im Text aber als zwei Token (‚Schüttet man diese Säure mit Wasser zusammen, dann…‘). Dieses praktische Problem hängt konzeptuell damit zusammen, dass ein Token kein Wort im engeren Sinn ist, obwohl in vielen Fällen die beiden Objekte identisch sind. (ii) Verzichtet man bei der Aufbereitung der Texte in Vektoren auf den Abstraktionsschritt der Lemmatisierung, dann werden Merkmale distinkt und führen zu einer Nicht-Abbildung, die in den meisten Fällen rein morphosyntaktischer Natur und damit für die zu lösende Aufgabe irrelevant sind. Die Wörter Aminosäure und Ami-
Das Wort in der Sprachtechnologie
313
nosäuren in Anfrage und Text (oder in zwei Texten) sollten als (bedeutungs)gleich erkannt und behandelt werden. Hierfür ist es notwendig, Vektoren zu bilden, die als Elemente Grundformen enthalten und nicht Types. Der „Preis“ dieser Abstraktion ist, dass Fehler entstehen, wo die Abbildung eines Types auf eine Grundform selber ambig ist (s. Abschnitt 4.3). (iii) Ebenso unerwünscht im Sinne eines optimalen Retrievalergebnisses ist es, wenn ein Konzept durch sprachliche Umformung in zwei verschiedenen Gestalten auftritt. Ein Beispiel hierfür ist Flusssäurekonzentration vs. Konzentration an Flusssäure. Das Abbildungsproblem, welches auch wieder ein Problem der Nicht-Abbildung ist, lässt sich dadurch lösen, dass man auf beide Texte die Operation der Kompositazerlegung und des Stemming anwendet, und so im zweiten Fall bei beiden Texten zu -konzentrat-, -fluss- und -säure- zu kommen. Ein solches Retrievalsystem würde einen Index aus Stammmorphemen verwenden. Der Rückgriff auf Stämme ist berechtigt und hat sich in vielen Fällen als effektiv in Hinsicht auf die Performanz von Retrievalsystemen erwiesen. Der Preis dieses Verfahrens sind Zuordnungsambiguitäten zwischen Stämmen und Lexemen, was in unserem Beispiel besonders an dem Stamm -fluss- deutlich wird. (iv) Durch Anwendung des Stemming erreicht man, dass lexikalische Einheiten, die sich nur dadurch unterscheiden, dass unterschiedliche Wortbildungsprozesse auf einen Stamm angewendet werden, in einen Lexemverband zusammengefasst werden und im Zuge des Vergleichs von Anfrage und Text und bzw. von zwei Texten als gleiche sprachliche Einheiten behandelt werden. Dies trifft jedoch nicht zu, wenn ein Konzept durch zwei oder mehr Lexeme ausgedrückt werden kann (Synonyme), die formal keine oder (zu) wenig Ähnlichkeit aufweisen (Beispiele: Apfelsine, Orange; Flusssäure, Flourwasserstoffsäure). In diesem Fall kann man versuchen, bedeutungsgleiche oder bedeutungsähnliche Lexeme zu einem Synonymenset zusammenzufassen und in Textvergleichen auf einander abzubilden. Man nennt solche Verfahren semantisches Information Retrieval. Gurevych und Kollegen haben gezeigt, dass durch die Zusammenfassung semantisch verwandter sprachlicher Zeichen die Performanz ‚klassischer‘ Retrievalansätze verbessert werden kann (vgl. z. B. Müller/Gurevych 2010). Man hat sich hier allerdings von an der Oberflächenform orientierten Ansätzen weit entfernt und operiert mit Datenstrukturen, die im Bereich lexikalisch-semantischer Ressourcen als Synonymenmenge bezeichnet werden.
5.2 Computerlexikographie Unter Computerlexikographie versteht man den Einsatz von Rechnern und Software im Prozess der Erstellung von sprachlichen Referenzwerken. Diese Definition ist bewusst sehr weit gefasst und umfasst im Grunde genommen nicht nur den Erstellungsprozess, sondern auch die Basis des Erstellungsprozesses (in der Regel sind dies heutzutage digitalisierte Korpora) und das Ergebnis des Prozesses, die Wörterbücher.
314
Lothar Lemnitzer/Kay-Michael Würzner
Die Lexikographie verfügt über eine ausgefeilte Terminologie und Werkstattsprache, die sich eng an die Terminologie von Linguistik und Lexikologie anlehnt, zumindest in den Bereichen, in denen sich die Arbeits- und Forschungspraxis überschneiden (vgl. Haß in diesem Band). So ist in der Werkstattsprache von Lemma, Lemmazeichen, Lemmatisierung etc. die Rede, aber auch von Lexem, Lexikalisierung etc. Dennoch wird in der Lexikographie gelegentlich auf den Terminus Wort zurückgegriffen, ungeachtet von dessen semantischer Unschärfe. Dies zeigt sich schon in der Benennung Wörterbuch für diesen Typ von Nachschlagewerk. Ein besonders problematischer Terminus, der ein altes Problem der Lexikographie offenbart ist Mehrwortlexem. Dieser ist insofern interessant, als er die Ausdrücke Wort und Lexem kombiniert. Der Ausdruck findet gelegentlich in der lexikographischen und computerlexikographischen Literatur Anwendung (z. B. Herberg u. a. 1997, 171, Tschichold 2000). Kritisch zu diesem Ausdruck äußern sich Lemnitzer/Kunze (2007, 279)). Das Dilemma der Lexikographie in den Zeiten des Printwörterbuches, einer mehrere Jahrhunderte umfassende Epoche, war, dass der Zugriff auf die lexikalische Einheit und in den europäischen, alphabetorientierten Sprachen über die Sortierung der einzelnen Grapheme stattfand. Eine Sicht auf das Lexikon unter dem Aspekt des Zugriffs auf einzelne Einheiten ist deshalb formorientiert. Dies macht sich auch in anderen Elementen einer erweiterten Werkstattsprache wie Stichwort bemerkbar. Eine Folge davon ist, dass sich komplexe oder mehrgliedrige sprachliche Zeichen – dies ist die in Lemnitzer/Kunze 2007 verwendete Terminologie – nur schwer in eine Liste von Lemmazeichen einordnen lassen, die ausschließlich aus einfachen, nicht durch ein Leerzeichen unterbrochenen Zeichenketten besteht. Zum einen lassen sich einige mehrgliedrige lexikalische Zeichen nicht einem Glied zuordnen, weil es ein solches Glied gar nicht gibt (gang und gäbe wird man nicht dem im Wörterbuch verzeichneten, aber bedeutungsarmen Element und zuordnen wollen), zum anderen sind Glieder vieler Phraseme semantisch verblasst und werden in der ursprünglichen Bedeutung nicht mehr in gegenwartssprachlichen Wörterbüchern geführt; so wird man wissen, wo Bartel den Most holt nicht unter dem Eintrag zum Stichwort Most einordnen wollen. Hausmann (1984) hat dieses Dilemma für die Gruppe der Kollokationen und deren Erfassung in Lernerwörterbüchern aufgezeigt und in Antwort auf die Frage, unter welchem Stichwort man denn nun eine Kollokation verzeichnen solle, die fruchtbare Unterscheidung zwischen der Basis einer Kollokation und dem davon abhängigen Element, dem Kollokator eingeführt. Eigentlich müssten sich Internetwörterbücher nicht mehr mit diesem Zugriffsproblem herumschlagen. Wenn man etwa Bartel in die Suchmaschine des Wörterbuchplattform „dict.leo.org“ eingibt, erhält man unter der Rubrik „Phrasen“ die gesuchte Redewendung inklusive Übersetzung in die gewählte Zielsprache. Für die Sprachtechnologie ist dieses Problem aber dennoch relevant. Phraseme können im Gebrauch vielfältig modifiziert werden (ein Überblick hierzu findet sich in Lemnitzer/ Kunze 2007, 300 ff.). Dies erschwert ihre automatische Erkennung im Text. Ebenso ist unklar, ob man für Phraseme eine Normalform ansetzen kann, die der Grundform
Das Wort in der Sprachtechnologie
315
bzw. dem Lemma für einfache Textwörter entspräche. Für das erste Problem, die Erkennung von mehrgliedrigen idiomatischen Wendungen in Texten, haben Breidt u. a. 1996 einen Vorschlag gemacht, der darauf hinausläuft, die möglichen textuellen Muster von Klassen von Phrasemen als reguläre Ausdrücke zu modellieren. Diese können durch lokale Grammatiken formal beschrieben und durch Übereinstimmung von Textfragmenten mit den Regeln der Grammatik automatisch erkannt werden. Es handelt sich also um ein auf komplexe sprachliche Zeichen bezogene Variante der in Abschnitt 4 beschriebenen morphologischen Analyse. Zusammenfassend kann man zum Verhältnis der Computerlexikographie zum Wort sagen, dass dieser Terminus in zwei Zusammenhängen eine Rolle spielt: zum einen beim Übergang bzw. der Abstraktion von textuellen Zeichen zu lexikalischen Einheiten, die den eigentlichen Gegenstand der lexikalischen Beschreibung bilden. Da der Zugang zu den Korpustexten in erster Linie formbasiert ist und sich auf Folgen von Zeichen in Texten bezieht, hat hier der Terminus eine gewisse Berechtigung, wenn auch nur im Umgang mit den Korpora und den Analysewerkzeugen. Zum anderen bei der Präsentation der Daten und bei der Organisation des Zugriffs auf diese Daten durch den Benutzer. In dieser Beziehung hat der Terminus Wort bestenfalls eine didaktische Funktion, da die Nutzer in den Wörterbüchern in der Regel das suchen, was sie unter dem Begriff Wort kennen, und sich das Modell der Suchmaschinen bei Internetwörterbüchern und Wörterbuchportalen an diesem Konzept orientiert. Modernere Konzepte von Internetwörterbüchern gehen aber wie gezeigt darüber hinaus und es ist eine Forderung an die Wörterbuchdidaktik (und indirekt auch an die Gestaltung von Bedienungselementen), dem Nutzer zu vermitteln, dass es jenseits der Wortsuche im Nachschlagewerk viel zu entdecken gibt.
6 Ausblick Wir haben gezeigt, dass der Terminus Wort, da er auch vorwissenschaftlich verwendet wird, eine erhebliche Bandbreite und damit an Unschärfe besitzt. Dies macht ihn als Bezeichnung für ein fest umrissenes Konzept innerhalb einer die Sprachtechnologie rahmenden Theorie eigentlich unbrauchbar. Die in der Sprachtechnologie alternativ verwendeten Termini, die zum Teil aus der Linguistik und ihren Teildisziplinen entstammen (Lemma, Lexem), zum Teil aus der Philosophie in die Sprachtechnologie übernommen wurden sind (Type, Token, vgl. Wetzel 2014), sind ein weiteres Indiz für diese Situation. Die terminologische Vielfalt erschwert das gegenseitige Verständnis der Ansätze zwischen den Disziplinen und auch die angemessene Würdigung einzelner theoretischer Ansätze in der Sprachtechnologie. Eine gewisse Gleichgültigkeit gegenüber terminologischer Präzision in der Sprachtechnologie, solange nur die Performanz der Systeme und deren Ergebnisse stimmen bzw. besser sind als die konkur-
316
Lothar Lemnitzer/Kay-Michael Würzner
rierender Verfahren, steht der Schärfung des terminologischen Rahmens ebenfalls entgegen. Im Prinzip gibt es drei Möglichkeiten, zu größerer terminologischer Klarheit zu gelangen: (1) Die erste, radikalste Variante ist der Verzicht auf den Terminus Wort – und seine Komposita wie Wortform, Wortbildung etc. – als Bausteine eines sprachtechnologischen Rahmens für die Sprachtechnologie. Zumindest in einigen linguistischen Theorien wurde so etwas versucht: Some linguists argue […] that since the morpheme must be recognized anyway as the minimal unit of grammar, in many cases smaller than the word, grammar is better built on this unit with the word occupying a less important position (if any) […] (Ross, zit. nach Juilland/Roceric 1976, 45).
Diese Vorgehensweise hat einige Nachteile: Erstens wird durch diesen Verzicht die Verbindung zum vorwissenschaftlichen Diskurs über Sprache gekappt. Zweitens ist diese Haltung weltfremd, weil der Terminus in einem Großteil der sprachtechnologischen Literatur etabliert ist und allein durch die Tatsache seiner wiederholten Verwendung dieser Terminus seinen Anspruch auf einen Platz in der (Fach-)Sprache der Sprachtechnologie behauptet. Ein solcher Ansatz muss als nicht praktikabel verworfen werden. (2) Die zweite Möglichkeit des Umgangs mit diesem Terminus ist eine präzisere begriffliche Festlegung, wie dies z. B. in Lemnitzer (1997) geschieht. Dort wird der Begriffsumfang zum einen auf die Bezeichnung von Objekten auf textueller Ebene verwendet (in Abgrenzung zu korrespondierenden Objekten auf der lexikalischen Ebene), zum anderen wird er in Abgrenzung zu kleineren Einheiten (Morphen) und größeren Einheiten (Satzgliedern, Konstituenten) definiert (Lemnitzer 1997, Abschnitt 3.4 und vor allem Abb. 3.5 auf Seite 93). Abgesehen davon, dass diese Festlegung auch nicht perfekt ist – zum Beispiel ist der Status von komplexen lexikalischen Zeichen auf textueller Ebene nicht berücksichtigt – muss sich eine solche Festlegung im wissenschaftlichen Diskurs durchsetzen, sonst bleibt sie eine akademische Übung – und für solche hat man in der Sprachtechnologie wenig übrig. (3) Am erfolgreichsten scheint uns eine dritte Strategie zu sein. Angesichts der terminologischen Unschärfe eines Terminus sollte dieser in jeder sprachtechnologischen Darstellung, die der Verwendung dieses Terminus bedarf, dessen Verwendung(sregel) explizit erläutert werden. Dies kann am besten in Abgrenzung zu anderen, im jeweiligen Diskurs ebenfalls verwendeten Termini wie Token, Type, Lemma, geschehen. Es kann so gleichzeitig überprüft werden, ob die Verwendung von Wort wirklich notwendig ist, also eine terminologische Leistung erbringt, die durch konkurrierende Bezeichnungen nicht erbracht wird. Ein weiterer Vorteil dieser Herangehensweise liegt darin, dass Grenz- und Problemfälle sowie Ambiguitäten durch das Brennglas einer klaren Terminologie besser sichtbar werden.
Das Wort in der Sprachtechnologie
317
7 Literatur Al-Sughaiyer, Imad A./Ibrahim A. Al-Kharashi (2004): Arabic morphological analysis techniques: a comprehensive survey. In: Journal of the American Society for Information Science and Technology 55, 189–213. Becker, Tanja/Esther König (2002): Lexikonfreie Lemmatisierung für Substantive des Deutschen. In: Proc. KONVENS 2002, Saarbrücken (http://konvens2002.dfki.de/cd/pdf/17V-Becker.pdf ). Beesley, Kenneth R./Lauri Karttunen (2003): Finite State Morphology. Stanford. Brants, Sabine u. a. (2004): TIGER: Linguistic interpretation of a German corpus. In: Journal of Language and Computation 2, 597–620. (online-Dokumentation des Korpus: http://www.ims. uni-stuttgart.de/forschung/ressourcen/korpora/tiger.html ). Breidt, Elisabeth/Frédérique Segond/Giuseppe Valetto (1996): Formal description of multi-word lexemes with the finite-state formalism IDAREX. In: Proceedings of the 16th conference on Computational linguistics. Volume 2. Kopenhagen, 1036–1040. Carstensen, Kai-Uwe (2011): Sprachtechnologie. Ein Überblick. (https://files.ifi.uzh.ch/cl/carstens/ Materialien/Sprachtechnologie.pdf ). Creutz, Mathias/Krista Lagus (2002): Unsupervised discovery of morphemes. In: Proceedings of the Workshop on Morphological and Phonological Learning, Pennsylvania, ACL-02. Philadelphia, 21–30. Creutz, Mathias/Krista Lagus (2007): Unsupervised models for morpheme segmentation and morphology learning. In: ACM Transactions on Speech and Language Processing 4/1, 21–30. Déjean, Hervé (1998): Morpheme as necessary concept for structure discovery from untagged corpora. In: Proceedings of the Joint Conferences on New Methods in Language Processing and Computational Natural Language Learning, January 11–17, 1998, Sydney, 295–298. Dietrich, Rainer (1973): Automatische Textwörterbücher. Studien zur maschinellen Lemmatisierung verbaler Wortformen im Deutschen. Tübingen. Frakes, William B. (1992): Stemming algorithms. In: William B. Frakes/Ricardo Baeza-Yates (Hg.) Information retrieval. Upper Saddle River (New Jersey), 131–160. Geyken, Alexander/Thomas Hanneforth (2006): TAGH: A complete morphology for German based on weighted finite state automata. In: Anssi Yli-Jyrä/Lauri Karttunen/Juhani Karhumäki (Hg.): Finite State Methods and Natural Language Processing. Berlin/Heidelberg, 55–66 (http://www.dwds. de/static/website/publications/text/Geyken_Hanneforth_fsmnlp.pdf ). Goldsmith, John (2001): Unsupervised learning of the morphology of a natural language. In: Computational Linguistics 27/2, 153–198. Grefenstette, Gregory/Pasi Tapanainen (1994): What is word, what is a sentence? Problems of tokenization. In: Proceedings of the 3rd Conference on Computational Lexicography and Text Research, COMPLEX’94, Budapest, 1–11. (http://www.coli.uni-saarland.de/~schulte/Teaching/ ESSLLI-06/Referenzen/Tokenisation/grefenstette-tapanainen-1994.pdf ). Haapalainen, Mariika/Ari Majorin (1995): GERTWOL und morphologische Disambiguierung für das Deutsche. In: Proceedings of the 10th Nordic Conference of Computational Linguistics, University of Helsinki. Helsinki. Harris, Zellig (1955): From phoneme to morpheme. In: Language 31, 190–222. Hausmann, Franz Josef (1984): Wortschatzlernen ist Kollokationslernen. In: Praxis des neusprachlichen Unterrichts 31, 395–406. Hearst, Marti A. (2003): What is Text Mining? (http://people.ischool.berkeley.edu/~hearst/ text-mining.html ). Herberg, Dieter/Doris Steffens/Elke Tellenbach (1997): Schlüsselwörter der Wendezeit. Wörterbuch zum öffentlichen Sprachgebrauch 1989/1990. Berlin/New York.
318
Lothar Lemnitzer/Kay-Michael Würzner
Hotho, Andreas/Andreas Nürnberger/Gerhard Paaß (2005): A brief survey of text mining. In: Zeitschrift für Computerlinguistik und Sprachtechnologie 20/1, 19–62. Johnson, Douglas C. (1972): Formal Aspects of Phonological Description. The Hague. Juilland, Alphonse/Alexandra Roceric (1976): The word and its definitions. In: Alphonse Juilland (Hg.): Linguistic Studies offered to Joseph Greenberg. Vol. 1. Saratoga, 43–55. Jurish, Bryan/Kay-Michael Würzner (2013): Word and sentence tokenization with hidden Markov models. In: Journal for Language Technology and Computational Linguistics 28/2, 61–83. Kettunen, Kimmo (2009): Reductive and generative approaches to management of morphological variation of keywords in monolingual information retrieval: An overview. In: Journal of Documentation 65/2, 267–290. Kiss, Tibor/Jan Strunk (2006): Unsupervised multilingual sentence boundary detection. In: Computational Linguistics 32/4, 485–525. Klenk, Ursula/Hagen Langer (1989): Morphological segmentation without a lexicon. In: Literary and Linguistic Computing 4/4, 247–253. Koskenniemi, Kimmo (1983): Two-Level Morphology: A General Computational Model for Word-Form Recognition and Production. Helsinki (University of Helsinki, Department of General Linguistics, Publications, 11). Kurimo, Mikko u. a. (2010): Overview and results of Morpho challenge 2009. In: Carol Peters u. a. (Hg.): Multilingual Information Access Evaluation I. Text Retrieval Experiments. Berlin, 578–597. Lemnitzer, Lothar (1997): Extraktion komplexer Lexeme aus Textkorpora. Tübingen. Lemnitzer, Lothar/Claudia Kunze (2007): Computerlexikographie. Tübingen. Lesk, Mike E./Eric Schmidt (1975), Lex – A Lexical Analyzer Generator, Computing Science Technical Report No. 39, Bell Laboratories, Murray Hill (New Jersey). Maier-Meyer, Petra (1995): Lexikon und automatische Lemmatisierung. Univ. Diss. München (Centrum für Informations- und Sprachverarbeitung, 84). Müller, Christof/Iryna Gurevych (2010): Semantically enhanced term frequency. In: Cathal Gurrin u. a. (Hg.): Proceedings of the 32nd European Conference on Information Retrieval Research. Berlin/Heidelberg, 589–601. Navigli, Roberto (2009): Word sense disambiguation – A Survey. In: ACM Computing Surveys 41/2, 1–69. (http://promethee.philo.ulg.ac.be/engdep1/download/bacIII/ACM_Survey_2009_ Navigli.pdf ). Oflazer, Kemal/Sergei Nirenburg/Marjorie McShane (2001): Bootstrapping morphological analyzers by combining human elicitation and machine learning. In: Computational Linguistics 27/1, 59–85. Palmer, David D./Marti A. Hearst (1997): Adaptive multilingual sentence boundary disambiguation. In: Computational Linguistics 23/2, 241–267. Pasca, Marius (2003): Open-Domain Question Answering from Large Text Collections. Stanford. Peirce, Charles S. (1906): Prolegomena to an apology for pragmaticism. In: The Monist 16, 492–546. Porter, Martin F. (1980): An algorithm for suffix stripping. In: Electronic Library and Information Systems, 14/3, 130–137. Quine, Williard van Orman (1987): Quiddities. An Intermittently Philosophical Dictionary. Boston. Reichel, Uwe D./Karl Weilhammer (2004): Automated morphological segmentation and evaluation. 4th International Conference on Language Resources and Evaluation LREC, 26.–28. Mai 2004, Lisboa, 503–506. Schiller, Anne (2006): German compound analysis with wfsc. In: Anssi Yli-Jyrä/Lauri Karttunen/ Juhani Karhumäki (Hg.): Finite State Methods and Natural Language Processing, Berlin/ Heidelberg, 239–246.
Das Wort in der Sprachtechnologie
319
Schmid, Helmut (2000): Unsupervised Learning of Period Disambiguation for Tokenisation. Internal report, Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart (online: http://www. cis.uni-muenchen.de/~schmid/papers/tokeniser.pdf ). Schmid, Helmut/Arne Fitschen/Ulrich Heid (2004): SMOR: A German computational morphology covering derivation, composition, and inflection, In: Proceedings of the IVth International Conference on Language Resources and Evaluation (LREC 2004), 1263–1266. Stavrianou, Anna/Periklis Andritsos/Nicolas Nicoloyannis (2007): Overview and semantic issues of textmining. In: SIGMOD Records 36/3, 23–34. Tschichold, Cornelia (2000): Multi-Word Units in Natural Language Processing. Hildesheim. Volk, Martin (1999): Choosing the right lemma when analysing German nouns. In: Multilinguale Corpora: Codierung, Strukturierung, Analyse. 11. Jahrestagung der GLDV. Frankfurt a. M., 304–310. Voutilainen, Atro (2003): Part-of-speech tagging. In: Ruslan Mitkov (Hg.): The Oxford HandBook of Computational Linguistics. Oxford, 219–232. Wetzel, Linda (2014): Art. “Types and tokens”. In: Edward N. Zalta (Hg.): The Stanford Encyclopedia of Philosophy Online. Stanford: http://plato.stanford.edu/archives/spr2014/entries/ types-tokens/. Wimmer, Gejza/Gabriel Altmann (1999): Review article: on vocabulary richness. In: Journal of Quantitative Linguistics 6/1, 1–9. Wolski, Werner (1989): Das Lemma und die verschiedenen Lemmatypen. In: Franz Josef Hausmann u. a. (Hg.): Wörterbücher. Dictionaries. Dictionnaires., Berlin/Heidelberg, 360–371 (Handbücher für Sprach- und Kommunikationswissenschaft (HSK), 5/1).
Christine Römer
14. Die Elemente des Worts Abstract: Eingangs wird dargestellt: Die lexikalischen Einheiten sind in einem dynamischen mentalen Lexikon als komplexe Strukturen mit grammatischen und pragmatischen Charakteristika gespeichert. Kommunikationssituationen, Muster und Verbindungen zwischen den Einheiten bestimmen die Rezeption und Produktion von Wörtern. Der Beitrag charakterisiert danach die Einheiten des Lexikons und geht auf Abgrenzungsprobleme und den Wortbildungswandel ein. Die Interpretation und Bildung von komplexen Wörtern sowie die wichtigsten Typen, Muster und Regeln werden am Beispiel der deutschen Sprache diskutiert. Spezifika von Wortbildungen im Sprachgebrauch und Spracherwerb werden nachfolgend aufgezeigt. 1 Wortstrukturelles Wissen 2 Konstituenten komplexer Wörter 3 Wortbildung 4 Wortbildungswandel erforschen 5 Wortbildungen im Sprachgebrauch 6 Wortbildung im Spracherwerb 7 Fazit 8 Literatur
1 Wortstrukturelles Wissen Texte bestehen aus Sätzen und Sätze werden mit Wörtern erstellt und dabei immer Laute bzw. Buchstaben mit Bedeutungen verbunden. In die so erzeugten komplexen Gebilde geht auch verschiedenartiges lexikalisches Wissen ein, von dem in diesem Kapitel das Wissen zu den komplexen Wörtern im Zentrum stehen soll. Wenn man die Elemente des Worts ermitteln und beschreiben möchte, ist es sinnvoll, das mentale Lexikon zu betrachten, zu fragen, wie Wörter im Gehirn gespeichert und verarbeitet werden (vgl. Schnörch in diesem Band). Die Einstellung, dass das „mentale Lexikon“ eine statische, abgeschlossene Liste aller Wörter enthalte und mit einem Wörterbuch gleichzusetzen sei, wird heute kaum noch vertreten. Man geht vielmehr von einem dynamischen Lexikon aus, das keine starre Struktur hat, da es sich ständig verändert, weil Neues hinzu kommt oder anderes vergessen wird (vgl. Aitchison 2003, Möhle 1997). Es ist der Teilbereich des Langzeitgedächtnisses einer Person, in dem das Wissen über Wörter in hochorganisierter, vernetzter Form gespeichert ist. Es ist erweiter- und veränderbar. Die kognitive Linguistik, beispielsweise Croft/Cruse (2004), nimmt an, „that language is governed by general cognitive principles“. Solche
Die Elemente des Worts
321
generellen Prinzipien könnten die Netzwerkorganisation und die Aktivierungsübertragung (Levelt et al. 1999) sowie die Existenz mentaler Schemata sein. So kann man annehmen, dass die kleinsten lexikalischen Bedeutungsträger (Basismorpheme), wie beispielsweise die grafische Form/wasch/mit der Bedeutung [WASCH] eine referentielle Funktion haben und Schemata (auch Frames genannt) wie „Wäsche-waschen“ aufrufen. Wortbasen können durch Wortbildungs- und Flexionselemente (Affixe) semantisch und grammatisch spezifiziert werden, so dass ein komplexes Wort entsteht: [WASCH] Schokokuss.
Aus kognitiver Sicht ist die schon besprochene lexikalische Kompetenz, das lexikalische Wissen, dafür verantwortlich, dass die Sprachbenutzer den Wortschatz erweitern können. Es wird darüber hinaus zwischen regelgeleiteten, vorhersagbaren Neubildungen und nicht-regelgeleiteten Neubildungen unterschieden, die ersteren werden der Produktivität auf der Sprachsystemebene und die zweiten der Kreativität in der Sprachverwendung zugewiesen (bspw. von Bründl 2001, 60). Neben der sprachlichen spielt auch die kognitive Ökonomie eine wichtige Rolle. Die kognitiven Kapazitäten der Menschen sind zwar biologisch beschränkt, jedoch großzügig angelegt. So besitzen wir weit mehr Zellen im Gehirn, als wir brauchen. Nach einem Schlaganfall können beispielsweise intakte areale Funktionen von beschädigten Bereichen übernommen werden. Andererseits gibt es auch Kapazitätslimitierungen, die einen ökonomischen Umgang mit dem Vorhandenen verlangen bzw. erzwingen. Deshalb führt die Begrenzung der Kommunikationszeit dazu, dass man gehalten ist, nur das Relevante mitzuteilen, der Rest muss hinzugedacht werden. Dies wird durch das vorhandene allgemeine Hintergrundwissen, Annahmen über die
Die Elemente des Worts
329
Kommunikationspartner und Diskursbezüge erleichtert. Auch können wir aufgrund der begrenzten Kurzspeicherkapazität pro Zeiteinheit nur eine bestimmte Menge an Informationen verarbeiten. Man nimmt in der kognitiven Linguistik an, dass mental operierende Ökonomieprinzipien die Sprachfähigkeit restringieren. Ein solches universales Ökonomieprinzip besagt, dass „Geläufiges kurz kodiert wird“, je häufiger ein Wort verwendet werde, desto kürzer sei es. „Worüber man sich auf Grund hoher Relevanz für die Lebensvollzüge in einer bestimmten Sprachgemeinschaft häufig verständigen will oder muss, dafür findet man kürzere Ausdrücke“ (Fenk-Oczlon 2002, 6). Unter diesem Blickwinkel kann eine Wortbildung im morphologischen Teilsystem als ein Reduktionsprozess angesehen werden. Häufig verwendete Phrasen werden als bekannt angesehen und können deshalb ökonomisiert, im Formativ verkürzt werden. Beispielsweise wurde durch den Ausbau von Rundfunk, Fernsehen und Internet Technik zur Übertragung von Daten wichtig und häufig kommuniziert, weshalb es sprachlich zu Übertragungstechnik reduziert werden konnte. Die entstandene Üblichkeit von Übertragungstechnik blockiert bedeutungsgleiche Neubildungen. Die Aussparung von Morphemen ist oft mit phonologischen Reduzierungen (Tilgungen, Fusionen, etc.) verbunden, die den artikulatorischen Aufwand reduzieren, beispielsweise Uni oder Perso.
3.2 Wortbildungskompetenz Jederzeit können auf der Basis der sprachlichen Kompetenz neue Wörter gebildet werden, weshalb die Wortbildung eine dynamische Sprachkomponente ist. Diese spontanen Wortbildungsprozesse knüpfen nicht nur an das vorhandene Morphem inventar an, sondern auch an die vorhandenen Wortbildungstypen, Muster und Regeln. Diese Typen, Muster und Regeln betreffen sowohl die formale als auch die inhaltliche Struktur. Das vorhandene Inventar an Einheiten sowie diese Typen, Muster und Regeln sind auch bedeutungsvoll für die Interpretation, das Verständnis schon vorhandener komplexer Wörter. Diejenigen Wortbildungen, die segmentiert werden können, sind transparent. Formale und semantische Transparenz kann angenommen werden: Regenschirm [Regen] [Schirm] = formal transparent ‚Schirm gegen Regen‘ = semantisch transparent.
Durch Laut- und/oder Bedeutungswandel kann Intransparenz (Undurchsichtigkeit) entstehen: Drittel [< Dritter Teil], Ehrgeiz [‚Geiz < Begehren‘].
330
Christine Römer
3.3 Typen, Muster und Regeln Wortbildungstypen sind die grundlegenden Verfahren zur Bildung von Wörtern, die sich nach der Art der verwendeten Bestandteile unterscheiden. Im Deutschen werden in der Regel drei Typen unterschieden (wie bei Donalies 2005): die Komposition, die Derivation und die Kurzwortbildung. Sie werden im nachfolgenden Teilkapitel charakterisiert. Wortbildungsmuster knüpfen an die Typen an und charakterisieren diese weiter nach dem morpho-syntaktischen, morpho-phonologischen und/oder morphosemantischen Status der Bausteine. Sie sind beschreibend und sagen mögliche Wortbildungen vorher. Der Terminus Wortbildungsmuster wird in der wissenschaftlichen Literatur uneinheitlich verwendet. Morpho-syntaktische Muster für adjektivische Komposita sind (die Partizipialkomposita werden nicht als Extraklasse angesehen): – – – – – – –
Adjektiv+Adjektiv=Adjektiv (hellblau) Substantiv+Adjektiv=Adjektiv (bauernschlau) Verb+Adjektiv=Adjektiv (bügelleicht) Konfix+Adjektiv=Adjektiv (autobiografisch) Pronomen+Adjektiv=Adjektiv (selbstverliebt) Präposition+Adjektiv=Adjektiv (ausgefuchst, übervorsichtig) Adverb+Adjektiv=Adjektiv (linksliberal)
Semantische Muster können als Prädikat-Argument-Strukturen beschrieben werden (siehe Motsch 2004, 5); beispielsweise für adjektivische Vergleichsbildungen: [WIE (Substantiv)(Adjektiv) ‚ein adjektivisches Bezugswort hat prominente Eigenschaften des Substantivs‘ bärenstark, bärenruhig [WIE (BÄR)(Adjektiv) ‚ein adjektivisches Bezugswort hat prominente Eigenschaften von Bären‘.
Wortbildungsmuster können aktiv sein, also mögliche neue Bildungen (potentielle Bildungen wie bärenbraun oder bärenschwer) begründen, die zu usuellen Bildungen werden können, wenn die Sprachgemeinschaft sie annimmt. Sie können aber auch okkasionelle Bildungen bleiben, die einen momentanen Kommunikationsbedarf erfüllt haben, jedoch nicht usualisiert werden. Wortbildungsregeln, wie „adjective + ness → noun“ befinden sich neben den Wortbildungseinheiten im mentalen Lexikon (Aitchison 1994, 166 f., 226). Sie können auch als die dynamische Variante der Wortbildungsmuster aufgefasst oder als Bildungsmuster bezeichnet werden. Die Anwendung der Wortbildungsregeln unterliegt Restriktionen, die ihre Anwendung blockieren (Blank 1981, 148) und die Produktivität der Regeln begrenzen. Diese Anwendungsbedingungen können auf den verschiedenen Systemebenen liegen. Bei-
Die Elemente des Worts
331
spielsweise können Wörter, die auf -chen enden, auf Grund einer phonologischen Beschränkung keine Verkleinerungsform mit dem Suffix -chen bilden, die Regel „Substantiv + chen → Substantiv“ wird dadurch in ihrem Geltungsbereich eingeschränkt. (Siehe weiter Meibauer 2002, 43 ff.)
3.4 Wortbildungstypen Man geht allgemein davon aus, dass es nur wenige morphologische Wortbildungstypen gibt. Für flektierende Sprachen, wie das Deutsche, nimmt man, wie schon erwähnt, die Komposition, Derivation und Kurzwortbildung an. Immer mal wieder wird die Frage aufgebracht, ob die morphologischen Ersetzungsbildungen dazu gehören (Becker 1994), die durch einen Umbau der Morphemstruktur gekennzeichnet sind. Das Kompositum Hausmann wird damit nicht mit dem Muster A+B=C (Haus+Mann=Hausmann) erklärt, sondern durch die Ersetzung AB>AC (Hausfrau>Hausmann). Dieses Muster spielt aus sprachhistorischer und spracherwerbstheoretischer Sicht eine wichtige Rolle, da neue Wörter oft in Analogie zu schon vorhandenen gebildet werden. Im Verlaufe der Integration dieser Wörter in das Lexikon geht diese analogische Motivierung jedoch meist verloren und sie werden als Komposita restrukturiert. Gegenwärtig ist zu beobachten, dass Übergangsphänomene zwischen den Typen zunehmen. Dies trifft auf Konversionen (Wörter vollziehen ohne sichtbares Wortbildungsmorphem einen Wortartenwechsel) zu, die, wenn sie nicht lexikalisiert werden, grammatische Formen ihrer Ausgangswortart sind, beispielsweise das Ich (substantiviertes Pronomen). Bei Lexikalisierungen (dem Eingehen ins usuelle Lexikon), wie der Dank (Substantiv) > dank (Präposition), kann man sie als implizite Derivationen mit Nullsuffix auffassen. Auch ist die Zunahme von Partikelverbbildungen, die sowohl Charakteristika von Derivationen als auch von Komposita haben, ein Indiz für diese Entwicklung (siehe dazu 3.4.2).
3.4.1 Komposition Die Komposition (Zusammensetzung) ist der am häufigsten im Deutschen verwendete Wortbildungstyp. Einfache oder komplexe existierende Wörter bzw. Stämme werden zu neuen Wörtern zusammengefügt, die im Deutschen zusammengeschrieben werden (dt. Flugzeugabsturz vs. engl. plane crash). Sie können mehr als zwei Wörter einschließen, sind aber meist binär aufgebaut. Dienst + Auto=Dienstauto, miet- + Auto=Mietauto, Spielzeug+Auto=Spielzeugauto, Spielzeugauto+Fabrik=Spielzeugautofabrik.
332
Christine Römer
Der Aufbau der Komposita ist rekursiv; das erzeugte Kompositum kann in ein neues Kompositum eingehen: Quelle+Wasser=Quellwasser, Quellwasser+hoch=Hochquellwasser, Hochquellen+Wasserleitung=Hochquellwasserleitung.
Die Gesamtbedeutung der Komposita ergibt sich im Prinzip aus den Bedeutungen der Bestandteile. Nach der Entstehung setzt oftmals ein Idiomatisierungsprozess ein. Aus dem Syntagma hohes Haus wurde das Kompositum Hochhaus. Heute sieht man im Amtsdeutsch in Deutschland ein Haus nur dann als Hochhaus an, wenn mindestens ein Raum mehr als 22 Meter über der Geländeoberfläche liegt. In China und Japan gelten nur Gebäude, die mehr als 100 Meter hoch sind, als Hochhaus. Der Kopf der Komposita steht im Deutschen in der Regel rechts und legt den morpho-syntaktischen Status des Kompositums fest. Er bestimmt die Wortart des Kompositums, welches Genus es hat und wie es flektiert wird. Wenn sich ein Kompositum aus den Kategorien X und Y zusammensetzt, bekommt es die Kategorie Y (N steht nachfolgend für Nomen, Substantiv). stink-[V]+Tier[N]=Stinktier[N]
Auch semantisch stellt im Deutschen die rechte Konstituente den Kopf dar. Man kann dies wie Heringer (2009, 101) generalisieren zu „X hat mit Y zu tun“. Um die Bedeutung jedoch richtig zu deuten, braucht es meist den Kontext, in dem die Komposita auftreten. Komposita kann man nach verschiedenen Merkmalen subklassifizieren. Dies kann nach dem kategorialen Status der unmittelbaren Konstituenten geschehen (wie bspw. bei Meibauer 2002, 48): Nomen-Komposition: N+N=N (Hemdbluse) A+N=N (Hohlkopf) V+N=N (Lehrberuf) P+N=N (Durchschlag)
Adjektiv-Komposition: N+A=A (tragikomisch) A+A=A (neumodisch) V+A=A (sehbehindert)
Die Elemente des Worts
333
Phrasen-Komposition: Satz+N=N (Trimm-dich-Pfad) NP+N=N (Kalte-Krieger-Party, www.spiegel.de, 7.3.2014)
Konfix-Komposition (die geschweiften Klammern kennzeichnen eine Alternative): Konfix+N=N (Agroprodukt) Basismorphem+(Fugenelement)+Konfix={N,Adj}(Metallograph, angloophil) Konfix+Konfix={N,Adj} (Bibliothek, homogen)
Nach der logisch-semantischen Struktur der unmittelbaren Konstituenten können drei Hauptarten der Komposition unterschieden werden: Determinativkomposita Die Determinativkomposition ist das mit Abstand am häufigsten verwendete Wortbildungsmuster. Das logisch-semantische Verhältnis zwischen den unmittelbaren Konstituenten ist hypotaktisch, wobei im Deutschen die rechte Konstituente in der Regel der semantische und grammatische Kopf ist: Bestimmungswort → Kopfwort Fremdkorrektor [N]: fremd [Adj]+Korrektor [N] Regenschirm, Sonnenschirm = ein Schirm
Kopulativkomposita Bei den Kopulativkomposita besteht zwischen den unmittelbaren Konstituenten eine parataktische (anreihende) logisch-semantische Relation. Diese Gleichrangigkeit der unmittelbaren Konstituenten verlangt kategoriale Gleichartigkeit und partielle semantische Gleichartigkeit: das grünblaue (‚grünlichblaue‘ = determinativ) vs. grün-blaue (‚grün+blau‘ = kopulativ) Kleid
Zusammenrückungen Die Zusammenrückungen sind nur lose zusammengefügte Wortverbindungen und folgen deshalb nicht dem grundlegenden Kopfprinzip. Der kategoriale und semantische Kopf steht nicht im Wort. Eine binäre Struktur ist nicht zwingend. Der Bursche[N] ist ein richtiger Tunichtgut. Tu[V] nicht[Partikel] gut[Adj]
Zusammenrückungen kann man auch als Univerbierungen ansehen. Mit diesem zum Teil vieldeutig benutzten Terminus wird das Zusammenwachsen von Wortgruppen zu Wörtern gekennzeichnet.
334
Christine Römer
Von lexikalischer Einschließung (Inkorporation) kann man sprechen, wenn zwischen den Konstituenten eines komplexen Wortes eine lose bzw. instabile Beziehung besteht, wenn eine relativ selbstständige Konstituente in das Wort eingeschlossen wird. Dies wird durch grammatische Abweichungen von prototypischen Wortbildungen sichtbar. Maria saugte Staub (Inkorporation) vs. Maria staubsaugte (Univerbierung)
3.4.2 Derivation Derivationen (Ableitungen) leiten von schon vorhandenen Wörtern bzw. Konfixen neue Wortbildungen ab. Dies geschieht durch das Hinzufügen von Derivationsaffixen (Wortbildungsmorphemen). klug+heit=Klugheit; Wort+Suffix un+klug=unklug; Wort+Präfix mechan+isch; Konfix+Suffix
Nach diesen Ableitungsmitteln kann man Suffigierungen von Präfigierungen unterscheiden. Bei den Suffigierungen wird an ein schon vorhandenes Wort oder an einen Wortstamm ein Suffix angehängt, das den kategorialen Status der entstehenden Derivation festlegt. So leitet das Suffix -ung Substantive (Übung, Hoffnung, Kleidung) ab. Als ein Muster der Suffigierung kann die kombinatorische Derivation angesehen werden. Hier wird ein Suffix, das mit einem Präfix verknüpft ist (Zirkumfix), an die Basis angefügt. Ge- -e [N] +laufen = Gelaufe ge- -ig [Adj] +fügen = gefügig
Ein spezielles Derivationsmuster ist die Rückbildung (retrograde Derivation). Durch Wegfall oder Austausch eines Suffixes entsteht ein neues Wort: Mähdrescher → mähdreschen, Notlandung → notlanden.
Präfigierungen entstehen durch das Anbringen eines Präfixes an den Wortanfang, das wie ein Suffix auch allgemeinere semantische Modifikationen vornehmen kann, jedoch keine kategorialen Festlegungen vornimmt. Mit dem Negationspräfix un- kann man Substantive (Untreue) und Adjektive (unwahr) ableiten. Es hat eine homonyme (gleichlautende) Form, die verstärkenden Inhalt hat, und nur an Substantive tritt (Unmenge, Unsumme, Unkosten).
Die Elemente des Worts
335
Die trennbaren Verben, die bei der Flektierung in Präsens und Präteritum aus einanderfallen (abfahren, fährt/fuhr ab) werden heute meist als Partikelverbkonstruktionen angesehen (siehe bspw. Römer 2006, 116 ff.). Probleme für die wissenschaftliche Beschreibung werfen die Ableitungen ohne sichtbare Affixe auf: greifen → Griff, essen → das Essen.
Manche sehen sie als den besonderen Wortbildungstyp „Bildung ohne Konstitu entenstruktur“ (Lohde 2006 bspw.) an, andere gehen von Derivationen mit Nullsuffixen aus. Diese Nullsuffixe (Ø) haben eine Funktion, sind jedoch ohne phonetisch-phonologische bzw. grafische Realisierung. Mit ihnen kann die Binärität und Köpfigkeit von Wortbildungen aufrechterhalten werden. werf(en)+ Ø[N] → Wurf Salz+Ø[V] → salzen
3.4.3 Reduktion Wortkürzungen, die in gekürzter Form auch gesprochen werden, werden in der Regel als Kurzwörter bezeichnet und als eigenständige Lexikonelemente angenommen. Abkürzungen (u. a., z. B.) dagegen sind nur auf die Schriftsprache beschränkt und keine Lexeme. Die Wortkreuzung (auch Blending, Kontamination, Kofferwort) ist ein weiteres Reduktionsmuster. Wortkreuzungen sind keine Kurzwörter, da sie keine Vollformen besitzen. Besserwessi ← Besserwisser + Wessi Bolliwood ← Bombay + Hollywood
Schwierig ist auch die Einordnung der Kunstwörter (Steinhauer 2007, 134), die vor allem als Produkt- und Unternehmensnamen entstehen (Odol, Persil). Dies trifft auch auf Wortkürzungen mit anschließender bzw. gleichzeitiger Suffigierung mit –i (Studi, Tussi) zu. Die Hauptmuster der Kurzwortbildung sind nach Steinhauer (2007): –
– –
Buchstabenkurzwörter, das Kurzwort besteht aus einzelnen Buchstaben: A4 (in DIN-A4-Format), B1 (für Bundestraße 1) GmbH = multisegmentales Buchstabenkurzwort Silbenkurzwörter, das Kurzwort besteht aus Silben: Kripo ← Kriminalpolizei Morphemkurzwörter, das Kurzwort besteht aus einem Morphem der Vollform: Kilo ← Kilogramm
336 –
Christine Römer
Mischkurzwörter, das Kurzwort besteht aus einer Mischung von Buchstaben- und Silbenkürzung: E-Book ← electronic book
4 Wortbildungswandel erforschen Wortbildungswandel im Sprachsystem vollzieht sich zum einen durch Veränderungen am kategorialen und inhaltlichen Morphemstatus: Schuhwerk: Werk ‚Fabrik‘ = Basismorphem vs. –werk ‚Menge an …‘ = Suffix
Aus freien Wörtern können unfreie Elemente werden. Diese Grammatikali sierungsprozesse führen zu grammatischer Polysemie von formgleichen Morphemen, die nebeneinander koexistieren. Dabei kommt es zu formaler Erosion, semantischer, syntaktischer und pragmatischer Differenzierung (Lehmann 2004). Dies kann man beispielsweise auch bei den Präfixverben beobachten. Zum anderen kommt es zu Veränderungen bei den Anwendungsdomänen und zu neuen Wortbildungsbeschränkungen. Affixe können ihre Produktivität verändern und sogar verlieren, wie beispielsweise –nis (Finsternis) oder –sal (Schicksal), die heute nicht mehr produktiv sind. Andere verringern ihre Produktivität (-e + Umlaut, groß>Größe). Um den Produktivitätsgrad von Mustern zu messen, wurden verschiedene Methoden für maschinenlesbare Korpora entwickelt (siehe Gaeta/Ricca 2006). Diese Wandelphänomene zu erforschen ist ein Gegenstand der historischen Sprachwissenschaft und der oftmals interdisziplinär angelegten Sprachwandel forschung. Dabei wird der enge Zusammenhang von morphologischer Produktivität, allgemeinen kognitiven Prinzipien und außersprachlichen kulturellen Einflüssen angenommen (siehe Baayen 2009, Bybee 2010, 194 ff.). Beispielsweise stellt Booij (1977) in seiner regelbasierten, konstruktions grammatischen Wortbildungstheorie einen Zusammenhang zwischen der Produktivität von Mustern und Restriktionen her. Er beschreibt die Wortbildungsmuster für potentielle neue Wortbildungen als abstrakte Schablonen (templates), die aus den vorhandenen komplexen Wörtern abstrahiert werden und Teil des Lexikons sind. Schablone für die Komposition [[X]x[Y]y] y Schablone für die N zu V Konversion [[X]N]V (Hier wird Binärität aufgegeben und Konversion als reine Umkategorisierung angenommen)
Von Wichtigkeit ist auch die Grammatikalisierungsforschung, die die diachrone Entwicklung und synchrone Variation sprachlicher Elemente untersucht. Der Umbau
Die Elemente des Worts
337
von Morphemen und Morphemkonstruktionen, den wir in der Wortbildung haben, spielt in diesen Forschungen eine wichtige Rolle. Mit Hilfe korpuslinguistischer Methoden werden seit der Jahrtausendwende viele neue empirische Erkenntnisse gewonnen. Linguistische Untersuchungen nehmen heute Sprachdatenbanken (Korpora) als eine zentrale Ressource zur Objektivierung ihrer Ergebnisse. Öffentlich zugängliche, annotierte Spezialkorpora für Wortbildungsforschungen gibt es bisher kaum, meist legen die Wissenschaftler für Wortbildungsuntersuchungen eigene, auf das spezielle Projekt zugeschnittene Datensammlungen an. Die Universität Innsbruck stellte ihre Sammlung für das DFG-Projekt „Deutsche Wortbildung“ (Pümpel-Mader 1966–1991), die über 200.000 Wortbildungen umfasst, ursprünglich frei zugänglich ins Netz. Aktuell (7.5. 2014) ist sie ohne Passwort der Universität Innsbruck nicht mehr erreichbar. Die Grundlage für dieses Projekt war die umfangreiche Innsbrucker Beschreibung der Wortbildung in der deutschen Gegenwartssprache. Die Autoren des Teils „Substantivkomposita und Adjektivkomposita“ führen dazu aus: Ziel des Wortbildungsprojektes war es, das System der Wortzusammensetzungen im Deutschen nach inhaltlichen und formalen Gesichtspunkten so gründlich, so ausführlich und lückenlos wie möglich zu analysieren und darzustellen, und die Vielfalt, die die deutsche Sprache in der Wortkomposition zeigt, sachgerecht zu ermitteln. Die Grundlage der Analyse war ein besonders großes (nicht-EDV-gestütztes) Materialkorpus. Im Projekt wurden 62.000 verschiedene Substantivkomposita, 6.500 Adjektivkomposita und 6.000 Partizipialbildungen nach inhaltlichen und formalen Kriterien beschrieben. Wichtig für Wortbildungsanalysen sind neben den entsprechenden Spezialkorpora Referenzkorpora, die die Gesamtheit des Wortschatzes als Bezugsgröße zur Verfügung stellen, wie für die deutsche Schriftsprache das DeReKo am Institut für deutsche Sprache (IDS). (Pümpel-Mader 1966–1991)
Man kann natürlich die „unspezifischen“ Korpora, wie beispielsweise das Referenzkorpus des Instituts für deutsche Sprache (siehe www.ids-mannheim.de/kl/projekte/ korpora), das die deutsche Gesamtsprache repräsentiert, für Wortbildungsfragen benutzen. Auch die „Wortwarte“ (Lemnitzer 2000–2014), auf der täglich neue Wörter angeboten werden, ist dafür empfehlenswert.Für die Wortbildungsforschung eignen sich Korpora besonders für Untersuchungen zur Produktivität spezieller Muster. Sie können aber auch etwas zur Evaluierung der eingangs besprochenen kognitiven Modelle beitragen, wie z. B. Gries (2006) zeigt.
5 Komplexe Wörter im Sprachgebrauch Neben der Beschäftigung mit der Wortbildungskompetenz ist die Frage nach den Spezifika von Wortbildungen im Sprachgebrauch wichtig. Generell ist davon auszugehen, dass die Wortanalyse und Wortverwendung wie das Wortinventar und die Regeln auch kontextuell bestimmt sind. Wortbildungen sind sowohl unterscheidend
338
Christine Römer
als auch konstituierend in Texten. Ihre textkonstituierende Funktion gegenüber Simplizia besteht darin, dass sie aufgrund ihrer Motiviertheit und ihrer Strukturiertheit zur Kohäsion eines Textes beitragen können (Barz/Schröder 2001, 184). Durch die Wiederholung einzelner Morpheme und ihre Wiederaufnahme in komplexen Wörtern kann zum sprachlich manifestierten (Kohäsion) und inhaltlichen (Kohärenz) Zusammenhang im Text beigetragen werden: (Das Essen ist nicht mehr warm,) es muss aufgewärmt werden.
Die distinktive Funktion der Wortbildung zeigt sich u. a. in den Varietätenspezifika. Bezüglich der Wortbildungen gibt es sowohl bei den Standardvarietäten als auch bei den Dialekten Besonderheiten und Varianten sowie Präferenzen für bestimmte Wortbildungsmuster. Das „Variantenwörterbuch des Deutschen“ verweist als Beispiele auf die Differenzen in der Setzung der Fugenzeichen. „Bei einem verbalen Bestimmungswort (Erstglied) verzichtet das Schweizerhochdeutsch häufig auf das Fugenzeichen, während die meist gemeindeutschen Entsprechungen eine e-Fuge aufweisen: Badmeister (Bademeister), Wartsaal (Wartesaal), Zeigfinger (Zeigefinger)“. (Ammon u. a., 2004, LXXII) Auch bei den Wortbildungsmorphemen gibt es bestimmte Präferenzen. So werden Verkleinerungsformen in Österreich gern mit dem Suffix -l(e) gebildet (Zuckerl). In Nord- und Mitteldeutschland benutzt man in der Regel -chen für Verkleinerungen (Häuschen). Aus funktionaler Sicht kann man die „Wortbildung als Stilindikator“ ansehen, an der „Verwendung komplexer Wörter stilistischen Willen festmachen“ (Eichinger 2012, 23). Wortbildungsmuster und -affixe können textsortenspezifisch sein, in spezielle Diskursbereiche eingebunden sein und dort spezielle Funktionen ausfüllen. Es gibt gewisse Bevorzugungen für spezielle Funktionalstile. So treten Kurzwörter verstärkt in den Fachsprachen und expressive okkasionelle Bildungen in der Belletristik auf. Soziolektale Differenzierungen treten auch im Wortbildungssystem auf. Beispielsweise kommt es zur Prägung spezieller, salopper jugendsprachlicher Affixe zur Verstärkung und positive Bewertungen, die in diesem Soziolekt sehr produktiv sind (Androutsopoulos 1998) und zum Teil auch nach einem bestimmten Zeitraum in die Standardsprache eingehen und dann folgerichtig aus der Jugendsprache verschwinden: Präfixe: hyper-, mega-, ober-, riesen-, sau-, über-, ultra-, urst-.
Erben (2011, 266) macht soziolinguistische Veränderungen, die zunehmende Aufhebung von privater und öffentlicher Rede, für eine Instabilität bei den Wortbildungsmustern verantwortlich.
Die Elemente des Worts
339
6 Wortbildungen im Spracherwerb Spracherwerb ist ein mehrdeutiger Terminus, der zum einen phylogenetisch den Erwerb der menschlichen Sprache als Gattungseigenschaft meint; zum anderen ontogenetisch sich auf den kindlichen Erstsprach(en)erwerb und den nachfolgenden Fremdsprach(en)erwerb bezieht. Zur Phylogenese gibt es einen interessanten Ansatz von Wunderlich (2008), der gegen die postsyntaktische Morphologie, bspw. die Distributed Morphology von Halle/Maranz 1993) argumentiert, die die Morphologie nicht als primär ansieht, sie auf die Syntax und Phonologie verteilt. Wunderlich erläutert die Vermutung, dass die Morphologie älter sei als die Syntax. Wenn man davon ausgeht, dass die Ontogenese der Phylogenese folgt, kann dies auch zu interessanten Hypothesen über den Wortschatzerwerb führen. Zum ontogenetischen lexikalischen Erstspracherwerb haben psycholinguistische Arbeiten in den letzten Jahrzehnten belegt, dass die meisten Kinder bis zum Schul eintritt einen umfangreichen Wortschatz erworben haben und diesen verwenden können (vgl. Schnörch in diesem Band). Dazu gehört auch die Fähigkeit, neue komplexe Wörter zu verstehen und bilden zu können. Berman (2004, 14) unterscheidet fünf Stufen des Erstspracherwerbs: 1. Lernen von Einzelwörtern; 2. Erwerben der ersten Kontrastwörter; 3. Hinzukommen von Schemata niedriger Abstraktionsgrade; 4. von Regelwissen; 5. situationsangemessenes Einsetzen der Regeln. Die beiden ersten Stufen bilden zusammen die Phase der Emergenz, wobei „die Verarbeitungskategorien „Segmente, Morpheme, Wörter” nicht als a priori gegeben angenommen werden; vielmehr emergieren sie als Einheiten u. a. aufgrund von kognitiven Beschränkungen, insb. des Arbeitsgedächtnisses.” (Hohenberger 2014, 1). Die dritte und vierte Stufe sind für Berman der eigentliche Spracherwerb. Behrens (2009) geht unter Zugrundelegung einer konstruktionsgrammatischen Sicht davon aus, dass die Strukturen gebrauchsorientiert sind und vom Kind nach und nach abstrahiert werden müssen. Dieser Abstraktionsprozess sei auch mit dem Memorierungsprozess verbunden. Es wird angenommen, dass das Kind eingangs mit unanalysierten Einheiten operiert, jedoch die komplexen Einheiten noch nicht analysiert. Wenn das Kind die interne Struktur erkennen gelernt habe, würde es diese Strukturen auch als Muster benutzen (Behrens 2009, 431). Die fünfte Stufe führt zur kontextadäquaten Sprachbeherrschung. Zum konkreten kindlichen Wortschatzerwerb gibt es im anglo-amerikanischen Sprachraum und auch im Deutschen etliche publizierte Studien (Augst 1984, Meibauer/ Rothweiler 1999, Kauschke 2012). Der Erwerb der deutschen Wortbildung wird von Rainer (2010) in einer ausführlichen empirischen Studie über den Erwerb der Wortbil-
340
Christine Römer
dung seiner Tochter Carmen mit Bezug auf die Wortbildungstheorie beschrieben. Aus dem Beispielfall werden theoretische Schlussfolgerungen getroffen, die noch weiterer Überprüfungen bedürfen. So meint er, dass „aus der Erwerbsperspektive” Partikelverben besser zu den Komposita passen würden (Rainer 2010, 20) und Nachbildungen nach dem Muster ganz konkreter Wörter im Wortbildungserwerb eine wichtige Rolle spielen: In „der produktiven Verwendung der Wortbildung“ spielen „zumindest im Vorschulalter konkrete Vorbilder eine große Rolle“ (Rainer 2010, 207).
7 Fazit Das mentale Lexikon ist ein komplexer Bestandteil der menschlichen Sprachfähigkeit. Es enthält die fundamentalen Bausteine und grundlegenden Muster, die in spezifischer Weise zusammenwirken, um das Verstehen und Erzeugen sprachlicher Äußerungen zu ermöglichen. Zur Kreativität und Dynamik der Sprachen gehört, neue, komplexe Wörter bilden zu können. Wortbildungen können mittels Morphemanalysen adäquat beschrieben werden. Da sich jedoch das Lexikon ständig verändert, gibt es einige Morpheme, die nicht prototypisch sind. Auch bei den Wortbildungsmustern gibt es Vagheiten und Übergangsphänomene, die wissenschaftliche Zuordnungen schwierig gestalten. Wörter und Regeln sind sozial und kontextuell bestimmt. Wortbildungsmorpheme und Wortbildungen können stilbildend sein. Untersuchungen zum Spracherwerb oder Ergebnisse aus der Neurowissenschaft erbringen ebenso wie korpusgestützte Analysen weitere Einsichten in die Wortstrukturtheorie. Statistische Aussagen zu Wortbildungsmustern erfolgen heute in der Regel auf der Basis elektronisch aufbereiteter, selbsterstellter Korpora. Diese werden aktuell hauptsächlich zu Produktivitätsfragestellungen genutzt. Neue Impulse für die Wortbildungsforschung vermitteln auch die neueren, empirisch orientierten Grammatikmodelle (wie Optimalitätstheorie oder Konstruktionsgrammatik) (vgl. Olsen 2010).
8 Literatur Aitchison, Jean (2003): Words in the Mind. An Introduction to the Mental Lexicon. 3. Aufl. Oxford. Androutsopoulos, Jannis K. (1998): Wie sagt man ‚sehr gut‘ in der Jugendsprache? Unveröff. Manuskript. (http://jannisandroutsopoulos.files.wordpress.com/2010/01/wie-sagt-man-sehrgut-in-der-jugendsprache.pdf ). Ammon, Ulrich u. a. (Hg.) (2004): Variantenwörterbuch des Deutschen. Berlin/New York. Augst, Gerhard (Hg.) (1984): Kinderwort. Der aktive Kinderwortschatz (kurz vor der Einschulung) nach Sachgebieten geordnet mit einem alphabetischen Register. Frankfurt a. M./Bern.
Die Elemente des Worts
341
Baayen, Harald (2009): Corpus linguistics in morphology: morphological productivity. In: Anke Lüdeling/Merja Kytö (Hg.): Corpus Linguistics. An International Handbook. Berlin, 900–919. Barz, Irmhild/Marianne Schröder (2002): Grundzüge der Wortbildung. In: Wolfgang Fleischer/ Gerhard Helbig/Gotthard Lerchner (Hg.): Kleine Enzyklopädie Deutsche Sprache. Frankfurt a. M., 178–217. Becker, Thomas (1993): Morphologische Ersetzungsregeln im Deutschen. In: Zeitschrift für Sprachwissenschaft 12/2, 185–217. Behrens, Heike (2009): Konstruktionen im Spracherwerb. In: Zeitschrift für germanistische Linguistik 37/1, 427–444. Berman, Ruth A. (2004): Between emergence and mastery: The long developmental route of language acquisition. In: Ruth A. Berman (Hg.): Language Development across Childhood and Adolescence. Amsterdam, 9–34. Bhatt, Christa (1991): Einführung in die Morphologie. Hürth-Efferen (Kölner linguistische Arbeiten – Germanistik, 23). Booij, Geert (1977): Construction morphology and the lexicon. In: Fabio Montermini/Gilles Boyé/ Nabil Hathout (Hg.): Selected Proceedings of the 5th Décembbrettes. Somerville, 34–44. Booij, Geert (2005): The Grammar of Words. An Introduction to Linguistic Morphology. Oxford. Broselow, Ellen (2000): Transfixation. In: Geert Booij u. a. (Hg.): Morphologie. Ein internationales Handbuch zur Flexion und Wortbildung. 1. Halbband. Berlin/New York, 360–369. Bründel, Monika Elisabeth (2001): Lexikalische Dynamik. Kognitiv-linguistische Untersuchungen am englischen Computerwortschatz. Tübingen. Bubenhofer, Noah (2011): Korpustypen und ihre Zusammensetzung. (http//www.bubenhofer.com/ korpuslinguistik/kurs/index.php?id=korpustypen.html ). Bybee, Joan (2010): Language, Usage and Cognition. Cambridge. Croft, William/D. Alan Cruse (2004): Cognitive Linguistics. Cambridge. Donalies, Elke (2005): Die Wortbildung des Deutschen. Ein Überblick. 2. Aufl. Tübingen. Draxler, Christoph (2008): Korpusbasierte Sprachverarbeitung. Eine Einführung. Tübingen. Eichinger, Ludwig M. (2012): Werbekommunikation morphologisch. In: Nina Janich (Hg.): Handbuch Werbekommunikation. Sprachwissenschaftliche und interdisziplinäre Zugänge. Tübingen, 17–33. Ellis, Andrew W./Andrew W. Yong (1991): Einführung in die kognitive Neuropsychologie. Bern. Elsen, Hilke/Sascha Michel (Hg.) (2011): Wortbildung im Deutschen zwischen Sprachsystem und Sprachgebrauch. Stuttgart. Erben, Johannes (2006): Einführung in die deutsche Wortbildungslehre. 5. Aufl. Berlin. Erben, Johannes (2011): Nachwort und Ausblick. In: Elsen/Michel, 265–269. Fenk-Oczlon, Gertraud (2002): Kognitive Ökonomie – sprachliche Universalien. In: Peter Anreiter/ Peter Ernst/Isolde Hausner (Hg.): Namen, Sprachen und Kulturen. Wien, 203–220. Fleischer, Wolfgang (1983): Wortbildung der deutschen Gegenwartssprache. 5. Aufl. Leipzig. Fodor, Jery (1983): The Modularity of Mind. Cambridge (Massachusetts). Gaeta, Livio/Davide Ricca (2006): Productivity in Italian word formation. A variable-corpus approach. In: Linguistics 41/1, 57–89. Gries, Stefan Th. (2006): Cognitive determinants of subtractive word formation: A corpus-based perspective. In: Cognitive Linguistics 17/4, 535–558. Halle, Morris/Alec Marantz (1993): Distributed morphology and the pieces of inflection. In: Kenneth Halle/Samuel J. Keyser (Hg.): The View from Building 20. Cambridge, 11–176. Heringer, Hans Jürgen (2009): Morphologie. Paderborn. Hohenberger, Annett (2014): Emergenz im Spracherwerb und in der Sprachverarbeitung. (http://ikw. uni-osnabrueck.de/de/events?id=4359&type=clq&mode=show ). Kauschke, Christina (2012): Kindlicher Spracherwerb im Deutschen. Berlin.
342
Christine Römer
Kovács, László (2010): Netzwerkbezogene Organisationsprinzipien im mentalen Lexikon. In: Iwona Bartoszevicz/Marek Halub/Eugeniusz Tomiczek (Hg.): Literatur und Sprache in Kontexten. Breslau (Acta Universitatis Wratislaviensis 3256; Germanica Wratislaviensia, 131), 105–113. Langacker, Ronald W. (2000): A dynamic usage-based model. In: Michael Barlow/Suzanne Kemmer (Hg.): Usage-Based Models of Langugae. Stanford, 1–64. Lehmann, Christian (2004): Theory and method in grammaticalization. In: Zeitschrift für germanistische Linguistik 32/2, 152–187. Lemnitzer, Lothar (2010–2014): Wortwarte. http://www.wortwarte.de (http://www.wortwarte.de/< 7.5.2014>). Lemnitzer, Lothar/Heike Zinsmeister (2010): Korpuslinguistik. Eine Einführung. 2. Aufl. Tübingen. Levelt, Willem J. M./Ardi Roelofs/Antje S. Meyer (1999): A theory of lexical access in speech production. In: Behavioral and Brain Sciences 22, 1–38. Lohde, Michael (2006): Wortbildung des modernen Deutschen. Tübingen. Meibauer, Jörg/Monika Rothweiler (Hg.) (1999): Das Lexikon im Spracherwerb. Tübingen/Basel. Meibauer, Jörg (2002): Wortbildung im Lexikon. In: Jörg Meibauer u. a. (Hg.): Einführung in die germanistische Linguistik. Stuttgart/Weimar, 15–69. Meibauer, Jörg (2003): Phrasenkomposita zwischen Wortsyntax und Lexikon. In: Zeitschrift für Sprachwissenschaft 22/2, 153–188. Möhle, Dorothea (1997): Deklaratives und prozedurales Wissen in der Repräsentation des mentalen Lexikons. In: Wolfgang Börner/Klaus Vogel (Hg.): Kognitive Linguistik und Fremdsprachenerwerb: Das Mentale Lexikon. Tübingen, 39–49. Motsch, Wolfgang (2004): Deutsche Wortbildung in Grundzügen. 2. Aufl. Berlin. Olsen, Susan (Hg.) (2010): New Impulses in Word-Formation (Linguistische Berichte. Sonderheft, 17). Pinker, Steven (2000): Wörter und Regeln. Die Natur der Sprache. Heidelberg. Plank, Frans (1981): Morphologische (Ir-)Regularitäten. Aspekte der Wortstrukturtheorie. Tübingen (Studien zur deutschen Grammatik, 13). Polenz, Peter von (1991): Deutsche Sprachgeschichte vom Spätmittelalter bis zur Gegenwart. Bd. 1. Berlin/New York (Sammlung Göschen 2237). Pümpel-Mader, Maria (1966–1991): Sammlung des DFG-Projektes „Deutsche Wortbildung. Universität Innsbruck. (http://www.uibk.ac.at/germanistik/mitarbeiter/puempel-mader/wort. html ). Rainer, Franz (2010): Carmens Erwerb der deutschen Wortbildung. Wien. Römer, Christine (1997): Semantik – Pragmatik – Syntax: Zum Verhältnis von semantischem, pragmatischem und syntaktischem Wissen in der Kognitiven Semantik – dargestellt am Beispiel der Modalwörter. In: Inge Pohl (Hg.): Methodologische Aspekte der Semantikforschung. Frankfurt a. M. u. a., 125–140. Römer, Christine (2006): Morphologie der deutschen Sprache. Tübingen/Basel. Römer, Christine (2009): Wortstrukturelle Ambiguität. In: Andrea Bachmann-Stein/Stephan Merten/ Christine Roth (Hg.): Perspektiven auf Wort, Satz und Text. Trier, 193–202. Römer, Christine/Brigitte Matzke (2010): Der deutsche Wortschatz. Struktur, Regeln und Merkmale. Tübingen. Rothweiler, Monika/Jörg Meibauer (1999): Das Lexikon im Spracherwerb – Ein Überblick. In: Jörg Meibauer/Monika Rothweiler (Hg.): Das Lexikon im Spracherwerb. Tübingen/Basel, 9–31. Spalek, Katharina (2012): Wortproduktion. In: Höhle, Barbara (Hg.): Psycholinguistik. 2. Aufl. Berlin, 53–66. Steinhauer, Anja (2007): Kürze im deutschen Wortschatz. In: Jochen A. Bär/Thorsten Roelcke/Anja Steinhauer (Hg.): Sprachliche Kürze. Konzeptuelle, strukturelle und pragmatische Aspekte. Berlin/New York, 131–158.
Die Elemente des Worts
343
Sternefeld, Wolfgang (2006): Syntax. Eine morphologisch motivierte generative Beschreibung des Deutschen. Bd. 1. Tübingen. Strohner, Hans (1995): Kognitive Systeme. Eine Einführung in die Kognitionswissenschaft. Opladen. Zimmermann, Ilse (1987): Die Rolle des Lexikons in der Laut-Bedeutungszuordnung. In: Wolfgang Motsch/Ilse Zimmermann (Hg.): Das Lexikon als autonome Komponente der Grammatik. Berlin (Linguistische Studien, Reihe A, Arbeitsberichte, 163), 1–27. Wunderlich, Dieter (2008): Spekulationen vom Anfang der Sprache. In: Zeitschrift für Sprachwissenschaft 27, 229–266.
Claudia M. Riehl
15. Besondere Wörter I: Lehnwörter, Neu‑Wörter Abstract: Der Beitrag zeigt auf, wie neue Wörter in eine Sprache gelangen. Dabei liegt der Schwerpunkt auf Wörtern, die aus anderen Sprachen entnommen worden sind. Aus der Perspektive der Sprachkontaktforschung wird zuerst auf die Unterscheidung von Fremd- und Lehnwort eingegangen und daran anschließend gezeigt, auf welche Weise Fremd- und Lehnwörter gebildet werden. Es wird illustriert, wie Lehnprozesse funktionieren, d. h. welche Wortarten am häufigsten betroffen sind und wie entlehnte Wörter in das System eingepasst werden. Dabei wird auch auf strukturelle Entlehnungen wie Lehnübersetzungen und Lehnbedeutungen eingegangen. Die Prozesse der Entlehnung werden exemplifiziert anhand von Beispielen aus dem Sprach- und Kulturkontakt, mit Schwerpunkt auf der Sprachgeschichte des Deutschen. Schließlich werden noch Fragen der Sprachnorm und der Akzeptanz von Fremd- bzw. Lehnwörtern betrachtet und anhand von Purismusdebatten illustriert. 1 2 3 4 5 6
Einführende Bemerkungen Fremdwort vs. Lehnwort Entlehnung: Wortarten und Integration Strukturelle Entlehnung Beispiele aus dem Sprach- und Kulturkontakt Sprachnorm und Purismus
1 Einführende Bemerkungen Wie bereits in den Beiträgen von Schnörch und Pfefferkorn (in diesem Band) gezeigt wurde, ist der Wortschatz einer bestimmten Sprache ständig im Fluss, neue Wörter entstehen, alte verschwinden und bestehende Wörter nehmen neue Bedeutungen an. Das ist v. a. deshalb notwendig, weil die Sprache dem ständigen Anpassungsprozess an die sich verändernde Lebenswelt Rechnung tragen muss. Technische, soziale, politische und kulturelle Innovationen fordern ein rasches Reagieren des Lexikons auf diese Prozesse. Für diese neuen Bezeichnungen kann man nun Wortbildungsmuster nutzen (z. B. Kompositionen wie in Kühl-schrank, Staub-sauger, Spülmaschine oder Ableitungen wie Steck-er bzw. Kurzwortbildungen wie Akku) oder man kann die Semantik eines Wortes durch Analogie erweitern (z. B. U-Boot neben Segelboot, Motorboot, Schnellboot etc.), man kann Metaphern verwenden (Maus für das an den Computer angeschlossene Eingabegerät) oder einen neuen Begriff durch Paraphrasierung bilden (Spezialputz für Hauswände). Sehr häufig nutzt man allerdings
Besondere Wörter I: Lehnwörter, Neu-Wörter
345
die Möglichkeit, die Bezeichnungen einfach aus anderen Sprachen zu entlehnen. Im Deutschen sind die Übernahmen aus dem Englischen überaus häufig: vom Computer über die Inline-Skates bis zur Bodylotion. Viele dieser Bezeichnungen sind gleichzeitig mit dem entsprechenden Produkt oder der Erfindung aus dem Englischen übernommen worden. Ähnliches findet sich in allen Sprachen und allen Epochen wieder und wird als cultural borrowing bezeichnet (vgl. Myers-Scotton 2006, 212). Neben der Übernahme eines Wortes in der fremden Gestalt (Lehn- bzw. Fremdwort) kann man auch aus Mitteln der eigenen Sprache ein fremdes Wort nachbilden (sog. ‚Lehnprägung‘). Beispiele dafür sind Taschenbuch nach engl. pocket book oder Kulturhaus nach russ. dom kultury. Bisweilen sind die Teile aber nur teiläquivalent wie Wolkenkratzer analog zu engl. skyscraper („Himmelskratzer“). Schließlich kann man natürlich Wörter auch völlig neu bilden: Ein Beispiel dafür ist etwa das Verb simsen aus SMS für das Versenden von Textnachrichten. Dass allerdings eine Wurzel neu entsteht, ist eher selten. Meist geschieht das nur bei lautmalenden Wörtern wie bimmeln, prusten oder quieken (Stedje 2007, 20). Lediglich bei Markennamen gibt es neben Personennamen (Daimler, Leitz, Dr. Oetker), Abkürzungen und Kurzwörtern (BP, Sinalco) auch völlig neugebildete Kunstwörter wie Bluna oder Thalys. Da Markennamen sich aber in der Regel wie Eigennamen verhalten, werden sie nicht in diesem Kapitel besprochen. Manchmal gibt es auch Versuche, etwa in Wettbewerben, Wörter zu erfinden, um lexikalische Lücken zu schließen: So gibt es etwa im Deutschen ein Wort für ‚nicht mehr hungrig sein‘, nämlich satt, aber keines für ‚nicht mehr durstig sein‘. Die Dudenredaktion veranstaltete daher in Zusammenarbeit mit dem Getränkehersteller Lipton im Jahre 1999 einen Wettbewerb, an dem sich mehr als 100.000 Personen aus verschiedenen Kontinenten beteiligten (vgl. Bär 1999). Der Gewinner des Wettbewerbs, nämlich das Wort sitt, hat sich allerdings im allgemeinen Sprachgebrauch nie durchgesetzt (s. dazu u. 6.1 zur Akzeptanz). Alle Wörter, die in einem Zeitraum in einer Sprachgemeinschaft auftreten, seien es völlig neu gebildete Wörter, Wörter mit einer anderen (oft metaphorischen) Bedeutung oder aus anderen Sprachen übernommene Wörter, bezeichnet man, so lange sie nicht in einschlägigen Wörterbüchern oder Kodices aufgenommen sind, als „NeuWörter“ oder „Neologismen“. Charakteristisch für die Neologismen ist, dass die Sprecher der Sprachgemeinschaft sie als neu empfinden. Dieses Kapitel geht nun im Folgenden besonders auf die Wörter ein, die aus anderen Sprachen übernommen oder mit Hilfe von Elementen fremder Sprachen gebildet wurden. Diese bezeichnet man als Fremd- oder Lehnwörter.
346
Claudia M. Riehl
2 Fremdwort vs. Lehnwort Die deutsche Sprache hat im Laufe ihrer Geschichte sehr viele Wörter aus anderen Sprachen (hauptsächlich aus dem Lateinischen, Französischen und Englischen) übernommen, von denen viele heute ein selbstverständlicher Bestandteil des deutschen Wortschatzes sind. So wissen viele Sprecher gar nicht, dass altbekannte Wörter wie Pfanne (von lat. panna) oder Tante (von frz. tante) aus anderen Sprachen stammen (vgl. dazu u. 5.2). Das rührt daher, dass sich die Wörter im Laufe der Zeit völlig in das Sprachsystem integriert haben und zwar phonologisch und morphologisch: Das p in panna wird in der 2. Lautverschiebung zu pf und die -a im Althochdeutschen abgeschwächt zu ə. Das französische ['tȃt] wird deutsch ausgesprochen ['tantə]. Graphematisch werden die beiden Wörter durch die Großschreibung integriert. Auch eine morphologische Eingliederung findet statt: Beide Wörter gehören zu der Klasse der Feminina auf –e mit regulärem deutschen Plural auf –en wie das heimische Wort Freude. Viele Forscher gehen davon aus, dass Entlehnungen in der Regel nicht den Kernwortschatz betreffen (Haspelmath 2009, 36), aber wie die genannten Beispiele zeigen, ist das nicht immer der Fall (dazu auch u. 5.2.2). Im Deutschen hat man daher versucht, eine Trennung zu ziehen zwischen Wörtern, denen man ihre Fremdheit in Schreibung und/oder Aussprache noch ansieht wie etwas das Wort Rhythmus oder Restaurant (sog. ‚Fremdwörter‘) und Wörtern, die sich so verhalten wie die beiden Wörter Pfanne und Tante (sog. ‚Lehnwörter‘).
2.1 Bestimmung von Fremd- und Lehnwort Betz (1949) hat in seiner einschlägigen Arbeit über Entlehnung die beiden Begriffe ‚Lehnwort‘ und ‚Fremdwort‘ festgelegt und definiert. Die Unterscheidung ist aber sehr schwer zu treffen. Bereits 1897 hatte Schuchardt diese beiden Begriffe kritisiert und ein Kontinuum gefordert, das auf synchronen Kriterien wie Bewusstsein der Sprecher über Fremdheit des Wortes oder Vertrautheit beruht (s. dazu Clyne 2004, 801). Ob ein Wort als Fremdwort oder Lehnwort eingeordnet wird, richtet sich entweder nach dem Grad der Assimilation und Integration in den Wortschatz einer Sprachgemeinschaft oder aber nach semantisch-strukturellen Kriterien. Allerdings wird in der neueren Forschung diskutiert, ob diese Abgrenzung überhaupt noch sinnvoll erscheint, da sich der Fokus stärker auf die gesprochene Sprache richtet (vgl. Munske 2009, 251). Diese Diskussion folgt damit der anglophonen Tradition, in der die Trennung von Lehnwort und Fremdwort nicht vorgenommen wird. Hier hat sich der Begriff loanword für beide Erscheinungen eingebürgert (vgl. Haspelmath 2009, 43). Van Coetsem (1988, 8 ff.) hat allerdings in Anlehnung an Haugen die Unterscheidung zwischen imitation und adaptation eingeführt. Imitation bedeutet, dass die phonologische Form des entlehnten Wortes beibehalten wird, im Fall von adaptation wird das Wort in das phonologische System der Aufnahmesprache eingepasst. Der unterschiedliche Status
Besondere Wörter I: Lehnwörter, Neu-Wörter
347
von Fremd- und Lehnwörtern im Deutschen und Englischen wird auch dadurch deutlich, dass das Deutsche spezielle Fremdwörterbücher kennt (z. B. DUDEN Fremdwörterbuch 2010), das Englische dagegen nicht.
2.1.1 Zur Definition von Fremdwörtern Während von Polenz (1967, 15) vorschlägt, dann vonFremdwort zu sprechen, wenn eine Sprache ein Wort (oder einen Ausdruck) einer anderen nur gelegentlich und als Zitat gebraucht, und von Lehnwörtern, wenn die entsprechenden Wörter zum üblichen Vokabular wenigstens einer größeren Gruppe von Sprechern gehören, plädiert etwa Wurzel (1981) dafür, nur dann von ‚Fremdwort‘ zu sprechen, wenn die entsprechenden Wörter den generellen grammatischen Regularitäten der Sprache nicht entsprechen – damit ist im Wesentlichen die Lautstruktur gemeint. Diese Auffassung hat sich als „synchron fundierter Begriff von fremdes Wort“ etabliert (Eisenberg 2012, 17). Auch Eisenberg (ebd, 29) schließt sich dieser Auffassung an, indem er formuliert: „Ein Wort ist im gegenwärtigen Deutschen fremd, wenn es Eigenschaften hat, die es von den Wörtern des Kernwortschatzes unterscheidet“. Allerdings fügt Eisenberg hinzu, dass diese fremden Eigenschaften auch von einem Normalsprecher zugeschrieben werden müssen. D. h. das Wissen der Sprecher von der Fremdheit eines Wortes ist hier entscheidend. Damit verbindet Eisenberg den strukturellen mit dem soziolinguistischen Ansatz, ähnlich wie es Poplack (2012) vorsieht, indem sie fordert, dass man von Entlehnung nur dann sprechen dürfe, wenn die entsprechende Form bei vielen oder allen Sprechern auftrete, wenn sie phonologisch und morphologisch in die Nehmersprache integriert sei und darüber hinaus syntaktische Regeln der Nehmersprache akzeptiere. Es ist allerdings problematisch, linguistische Anpassung und Akzeptanz bzw. Verbreitung als Kriterium anzusetzen, da ein Großteil des Vokabulars einer Einzelsprache gruppenspezifisch ist oder sich auf ein bestimmtes Register bezieht. So kann einerseits ein graphematisch und phonetisch völlig ins System integriertes Wort den meisten Sprachbenutzern unbekannt sein, wie im Deutschen das Wort Filüre (‚Gewebe‘), und andererseits Material, das phonetisch nicht integriert ist, sehr weit verbreitet sein, wie das Wort Restaurant. Insgesamt lassen sich die folgenden Kriterien aufführen, die im Wesentlichen zur Bestimmung von ‚Fremd- bzw. ‚Lehnwort‘ herangezogen werden können (im Folgenden nach Riehl 2001, 59 f.): Kriterien der Verwendung und Akzeptanz: – Gebrauchsfrequenz: Wie häufig tritt das Lexem auf? (z. B. Jeans vs. obsolet) – Wissen der Sprecher: Bezeichnen die Sprecher das Wort als Fremdelement? (z. B. „T-Shirt kommt aus dem Englischen“)
348
Claudia M. Riehl
– Soziale Diffusion: Kommt das Wort nur in bestimmten Gruppen oder im gesamten Wortschatz der Sprachgemeinschaft vor? (z. B. chillen in der Jugendsprache vs. Computer in der Allgemeinsprache) – Gebrauchssituation: In welchen Diskursen oder Texten tritt das Wort auf? (z. B. Lexem in linguistischen Fachtexten vs. Ekzem auch in Alltagstexten). Strukturelle Kriterien: – Flexion: Werden auch die fremden Endungen verwendet oder ist das Wort morphologisch in das System der entlehnenden Sprache integriert? (z. B. drei Cappucini vs. drei Cappuccinos) – Intonation: Besteht ein fremder Akzent oder ein einheimischer Akzent? (z. B. Büró mit Endbetonung wie im Französischen gegenüber Pízza mit Anfangsbetonung wie im Deutschen) – Phonetische oder graphematische Einpassung: Behält das Wort seine ursprüngliche Gestalt oder wird es der heimischen Aussprache und Schreibung angepasst? (z. B. Jeans vs. Streik) – Phonemkombinationen: Sind die Phonemkombinationen mit denen in der entlehnenden Sprache kompatibel? (z. B. Drink wie dt. Drang vs. Snob mit einer untypischen Lautkombination im Anlaut). In Bezug auf die strukturelle Integration scheint auch das Alter des Wortes eine Rolle zu spielen: Je länger ein Wort Bestandteil einer Sprache ist, desto mehr wird es strukturell integriert und verliert auch durch den häufigen Gebrauch seine Fremdheit. Das kann man beispielsweise an Entlehnungen feststellen, die bereits im Mittelalter erfolgt sind (s. u. 5.2.1 und 5.2.2).
2.1.2 Das Konzept der Entlehnung Im Gegensatz zum Fremdwort sind Lehnwörter in den Stammwortschatz integriert. Dass der Stamm eines Wortes aus einer anderen Sprache kommt, ist zwar sprachund kulturhistorisch interessant, wie wir in Kap. 5 noch sehen werden, aber dem Normalsprecher häufig unbekannt. Er behandelt diese Wörter auch als nichtfremd. Ein schönes anekdotisches Beispiel in diesem Zusammenhang, das mir vor kurzem eine russische Kollegin berichtete: Sprecher des Russischen beschweren sich, dass ihr „gutes altes russisches Wort“ buterbrod immer mehr durch engl. sandwich ersetzt werde. Dem Sprecher des Deutschen wird sofort klar, dass das Russische dieses Wort selbst entlehnt hat! Im Übrigen lässt sich an diesem Beispiel auch eine weitere Gesetzmäßigkeit von Lehnwörtern erkennen. Obwohl sie völlig in das sprachliche System integriert sind, sind sie für den Normalsprecher nicht analysierbar: Während das Wort für deutsche Sprecher ein durchsichtiges Kompositum aus Butter und Brot
Besondere Wörter I: Lehnwörter, Neu-Wörter
349
darstellt, ist das russische Wort monomorphematisch und nicht analysierbar für die Sprecher (vgl. Haspelmath 2009, 37). Entlehnungen aus einer anderen Sprache kommen nun besonders häufig in Sprachgemeinschaften vor, die mehrere Sprachen regelmäßig nebeneinander verwenden, also in mehrsprachigen Gemeinschaften. Daher sind Entlehnungen in der Regel ein wichtiges Thema der Sprachkontaktforschung. In der anglophonen Forschung zu Sprachkontakt wird ein sog. loanword definiert als ein Wort „that at some point in the history of a language entered its lexicon as a result of borrowing“ (Haspelmath 2009, 36). Diese Entlehnungsprozesse finden in mehrsprachigen Gemeinschaften oft ad hoc statt, d. h. ein Sprecher verwendet ein Wort aus der anderen Sprache nur in einer bestimmten Äußerung. Einige Forscher fassen dies unter dem Begriff ‚CodeSwitching‘. Da aber hier genau das gleiche geschieht und die gleichen Regeln eingehalten werden wie bei kodifizierten Entlehnungen sollte man besser von ‚Ad-hoc-Entlehnung‘ oder ‚Ad-hoc-Transfer‘ sprechen (vgl. Riehl 2014, 22 f. mit entsprechenden Argumenten). Es handelt sich dabei um einen sog. ‚lexikalischen Transfer‘ (s. ebd.). Das bedeutet, dass ein Lexem aus dem mentalen Lexikon einer anderen Sprache in das System der gerade verwendeten Sprache integriert wird. Das Wort passt sich dann morphosyntaktisch an die Sprache an, die gerade gesprochen wird. Sprachen haben hier unterschiedliche Mechanismen ausgebaut, wie sie solche fremden Lexeme in ihr System einbauen können und daher gibt es keine Unterschiede in der Art und Weise, wie die Wörter integriert werden (vgl. die Argumentation von Poplack 2012). Ein Beispiel: Ein ganz spontan aus dem Englischen entlehntes Verb wie collecten in einer Äußerung die collecten die animals einer zweisprachigen deutsch-australischen Sprecherin (vgl. Riehl 2014, 101) hat die gleiche morphologische Struktur wie ein im Deutschen bereits etabliertes Wort checken (vgl. u. 3.2). Haspelmath (2009, 43) sieht gewisse Ähnlichkeiten zwischen solchen Einmalübernahmen und Fremdwörtern, wobei erstere am wenigsten in das sprachliche System einer Sprachgemeinschaft integriert sind (zwar strukturell, aber nicht usuell).
2.1.3 Gastwörter Einen anderen Vorschlag bringt im Bereich der Mehrsprachigkeitsforschung der Psycholinguist François Grosjean (1995 ff.): In seiner Definition ist die phonetischphonologische Einpassung entscheidend, um von Entlehnung sprechen zu können. Grosjean unterscheidet allerdings nicht zwischen Lehn- und Fremdwort, sondern zwischen Entlehnung und Code-Switching: Werden die Wörter in der sog. ‚Gastsprache‘ ausgesprochen, dann handle es sich um sog. ‚Gastwörter‘, werden sie aber in der Nehmersprache artikuliert, um Entlehnung. Beispiele für Gastwörter im Sinne von Grosjean sind die folgenden aus dem Englischen stammenden Wörter to switch und to slash, die lautlich und morphologisch völlig an das Französische angepasst werden:
350 1.
Claudia M. Riehl
a) On peu switcher les places? [‚Können wir die Plätze tauschen?‘] b) Il a slashé le rideau. [‚Er hat den Vorhang zerrissen.‘] (vgl. Grosjean 2008, 161).
Allerdings bemerkt Grosjean zu Recht, dass eine binäre Entscheidung kaum möglich ist, sondern höchstens ein Kontinuum stufenweise zunehmender lautlicher Integration angesetzt werden kann. Grund dafür ist, dass viele Sprecher trotz hoher Kompetenz in ihrer Zweitsprache einen fremdsprachlichen Akzent haben, so dass sie die Wörter gar nicht ganz korrekt wie in der Zielsprache aussprechen können (vgl. dazu auch Bullock 2009). Das betrifft auch das bereits mehrfach erwähnte Wort Restaurant. Hier finden sich je nach Bildungsstand und Sprachkenntnissen der Verwender eine Reihe von verschiedenen Aussprachevarianten!
2.2 Prozesse der Fremd- und Lehnwortbildung Fremdwörter und Lehnwörter sind nicht nur unterschiedlich motiviert, sondern sie können auch auf ganz unterschiedliche Weise entstehen: Sie können von mehrsprachigen Sprechern von einem Lexikon ins andere transferiert werden (sog. ‚lexikalischer Transfer‘) oder sie können ganz bewusst aus fremdem Wortmaterial künstlich gebildet werden.
2.2.1 Transfer Die Übernahme von einem Lexem von einer Sprache in die andere im bilingualen mentalen Lexikon ist nun psycholinguistisch so zu erklären, dass Konzepte und die dazugehörenden Wortmarken verschiedener Sprachen im mentalen Lexikon so miteinander vernetzt sind, dass beim Aufruf eines bestimmten Konzeptes nicht nur die jeweiligen Wortmarken für verwandte Konzepte, sondern auch Übersetzungsäquivalente in anderen Sprachen aufgerufen werden. Wenn das Übersetzungsäquivalent mehr Aktivierungsenergie bekommt als die Wortmarke in der aktuellen Sprache, dann wird diese aktiviert und geäußert. Häufig benutzen mehrsprachige Sprecher aber auch ganz bewusst ein Wort aus der anderen Sprache, weil damit ein anderes Konzept verbunden ist. Die Entscheidung, ob ein bestimmtes Wort sich dann in der Sprachgemeinschaft verbreitet und sozusagen den Kernwortschatz ergänzt, kann nur mit Hilfe von soziolinguistischen Kriterien erklärt werden (dazu u. Kap. 6.1). Entlehnungen im Bereich des Kernwortschatzes finden daher v. a. dort statt, wo mehrere Sprachen nebeneinander gebraucht werden. Mit Zunahme der Mehrsprachigkeit verwenden dann die Sprecher immer mehr Ad-hoc-Entlehnungen wie oben beschrieben, weil sie einen schnelleren Zugang zu dem Wort haben oder das Wort treffender ist. Sehr oft spielen hier auch sprachökonomische Überlegungen eine Rolle: Häufig übernehmen mehrsprachige Menschen Wörter aus anderen Spra-
Besondere Wörter I: Lehnwörter, Neu-Wörter
351
chen, weil diese entweder ökonomischer sind (z. B. ital. patentino statt dt. Zweisprachigkeitsnachweis in Südtirol) oder ein Konzept beschreiben, das es in der anderen Sprache nicht gibt (z. B. afr. pad für eine plattgewalzte Sandpiste in Namibia, die im Deutschen nicht existiert).
2.2.2 Kreation Die Fremd- und Lehnwortbildung kann nun ganz bewusst eingesetzt werden, um Benennungslücken zu schließen. Dies ist etwa der Fall bei der Einführung neuer Erfindungen, neuer Produkte, Tätigkeitsfelder, Strömungen etc. Hier werden von den Produzenten oder Erfindern der Produkte oder von anderen Spezialisten entweder Wörter aus anderen Sprachen entnommen und dem entsprechenden Produkt oder Tätigkeitsfeld zugeschrieben oder es werden Neubildungen aus verschiedenen Elementen geschaffen, die nie von einem muttersprachlichen Sprecher verwendet wurden. Dazu gehören im Deutschen viele Latinismen wie Materialismus und transkulturell. Man kann auch hybride Bildungen darunter finden, die sich aus einem lateinischen und aus einem griechischen Stamm zusammensetzen: Automobil (gr. autos, lat. mobilis) oder Monokel (gr. monos, lat. oculum) (vgl. Eisenberg 2012, 33). Letztere werden v. a. zur Bezeichnung neuer Erfindungen eingesetzt. Hierher gehören aber auch sog. ‚Pseudoanglizismen‘ wie Dressman (analog zu businessman gebildet) oder Wellness (analog zu fitness), Wörter die beide im Englischen nicht vorkommen. Diese sind zu unterscheiden von richtigen Entlehnungen in Form des gerade beschriebenen lexikalischen Transfers.
3 Entlehnung: Wortarten und Integration 3.1 Typen von Wortarten bei der Entlehnung Von der Entlehnung aus anderen Sprachen sind die verschiedenen Wortarten in unterschiedlicher Weise betroffen. Am häufigsten treten Substantive auf, da, wie bereits erwähnt, meist Bezeichnungen für neue Errungenschaften, neue Erfindungen oder neue gesellschaftliche Entwicklungen benötigt werden. Dabei ist es am einfachsten, mit den neuen Konzepten auch die jeweilige Bezeichnung aus der Sprache zu übernehmen, aus der die entsprechenden Konzepte stammen. Bei Sprachminderheiten kommt hinzu, dass sie sich an eine neue Umwelt sprachlich anpassen müssen und dort schon in der Natur Dinge vorfinden, die sie mit dem eigenen Wortschatz nicht benennen können. So haben etwa die deutschen Einwanderer in Namibia Wörter wie das bereits erwähnte Pad für die plattgewalzte Sandpiste und Vlej für das Trockental aus dem Afrikaansen übernommen und andere Bezeichnungen aus heimischen
352
Claudia M. Riehl
afrikanischen Sprachen entlehnt, wie Munoko (‚lehmiger Schlamm‘, der nach dem Regen entsteht) aus dem Herero. Viele Sprachgemeinschaften treffen auf neue Staatsund Gesellschaftssysteme, die bestimmte Einrichtungen haben, die es ebenfalls in deutschsprachigen Ländern nicht gibt: z. B. carabiniere (‚Militärpolizist‘) in Italien, das die Südtiroler übernommen haben, oder kolchos (‚Kolchose‘), das die Russlanddeutschen verwenden (vgl. dazu Riehl 2014, 97 f.). Aber auch aus einem strukturellen Grund eignen sich Substantive besonders gut für Entlehnung, da sie präzisere Konzepte liefern, keinen Subkategorisierungsrahmen haben (d. h. eine bestimmte Art und Zahl von Argumenten fordern wie etwa Verben) und im Gegensatz zu Verben und Adjektiven im Singular häufig nicht flektiert werden müssen. In ihrer Untersuchung zu einer Typologie von Lehnwörtern in 41 verschiedenen Sprachen konnten Haspelmath/Tadmor (2009) feststellen, dass der Lehnwortschatz bei Substantiven 31,2 %, bei Adjektiven 15,2 % und bei Verben 14 % beträgt. Neben diesen Inhaltswörtern gibt es eine weitere Wortklasse, aus der sehr häufig entlehnt wird, nämlich die Klasse der Diskursmarker. Das sind Wörter, die das Gespräch steuern und keine eigentliche semantische Bedeutung haben, z. B. dt. also. Sie haben „interaktionsstrategische“ Funktionen oder tragen zur Strukturierung von Äußerungen bei. Es handelt sich daher um die Entlehnung eines sprachlichen Subsystems, nämlich der „oral communication patterns“ (Matras 1998, 310). Diese Ausdrucksformen stehen dem Kommunikationssystem der Gestik nahe. Partikeln, die als Gesprächswörter dienen, werden umso eher entlehnt, je weniger durchsichtig ihre lexikalische Bedeutung ist und je mehr ihre Funktion der von entsprechenden Gesten gleichkommt. In der gesprochenen deutschen Gegenwartssprache bemerkt man z. B. ein neues Gebrauchsmuster des aus dem Englischen übernommenen Bestätigungssignals okay. Es wird nicht mehr nur zur Zustimmung gebraucht im Sinne von ‚in Ordnung‘, sondern als gesprächssteuerndes Signal im Sinne von ‚aha‘ oder ‚ich verstehe‘, wie in folgendem Beispiel, in dem H. erklärt, warum sie dafür qualifiziert ist, Rezensionen klassischer Konzerte zu schreiben: 2. H: […] Ich spiel mehrere Flöten und Klavier und so weiter. J: dann fühlst du dich da fit. Okay. (vgl. Imo 2013, 226: im Original konversationsanalytische Transkription)
3.2 Integration von Entlehnungen Wie bereits erwähnt, lässt sich der Grad der Integration von neuen Wörtern aus der Kontaktsprache auf drei Ebenen messen: – an der phonetisch-phonologischen Einpassung in das entsprechende Lautsystem, – an der graphematischen Einpassung in das orthographische System der Zielsprache, – an der morphologischen Einpassung in das Flexionssystem der Zielsprache.
Besondere Wörter I: Lehnwörter, Neu-Wörter
353
3.2.1 Lautliche Integration Die phonologische Integration ist häufig graduell (s. o. 2.1.3) und teils auch in unterschiedlichen Entlehnungsphasen verschieden. So wurden etwa frühe Entlehnungen aus dem Englischen im Deutschen lautlich angepasst (Streik < strike, Keks < cakes, vgl. von Polenz 1999, 403), die nach dem Zweiten Weltkrieg übernommenen Wörter sind dagegen lautlich kaum integriert, allerdings kommt es im Bereich der Aussprache zu größeren Schwankungen und zahlreichen Varianten (s. Munske 2010). Insgesamt ist ein Bemühen festzustellen, die Entlehnungen möglichst quellsprachnah zu verwenden. Lautsubstitutionen kommen weitgehend nur bei Sprechern mit wenig Übung im Englischen vor: [ʃ] statt [s] vor Konsonant in Wörtern wie Spleen, Snob, stop, Monophthong [o:] oder [e:] statt Diphthong in Toast, Baby usw. In manchen Sprachen ist die phonologische Anpassung so stark, dass das Ausgangswort gar nicht mehr zu erkennen ist: vgl. Piraha topagahai < engl. tape-recorder, Jordanisches Arabisch banšer < engl. puncture (Beispiele aus Matras 2009, 149).
3.2.2 Graphematische Einpassung Es spielt eine entscheidende Rolle, ob die Wörter über geschriebene Texte oder über die gesprochene Sprache in die Nehmersprache gelangen. Viele Entlehnungen in historischer Zeit sind aus der gesprochenen Sprache übernommen, was man aus ihrer graphematischen Gestalt sehen kann: Das zeigen sehr schön die Übernahmen loschieren im Mittelalter oder Böfflamot in der Alamodezeit (vgl. 5.2.2). Im Gegensatz zum Deutschen, das die Fremdschreibung besonders in den aus dem Lateinischen und Griechischen stammenden Wörtern kultiviert (vgl. etwa Philosophie, Rhythmus, Thermometer), haben andere Sprachen diese Wörter in ihr graphematisches System integriert (vgl. die italienischen Entsprechungen filosofia, ritmo, termometro). Aber auch die Schreibungen französischer Lehnwörter, die im Deutschen die französische Schreibung erhalten haben, wie Chauffeur, sind in anderen Sprachen völlig graphematisch integriert, wie etwa im Türkischen: şoför. Entlehnungen aus dem Französischen sind insofern interessant, als hier Fremdschreibungen heimischen Schreibungen gegenüberstehen: Restaurant, charmant, Plateau gegenüber Likör, Bluse, Plüsch. Teilweise lässt sich das damit erklären, dass die Wörter eine heimische Schreibung erhielten, wenn sie aus der gesprochenen Sprache entlehnt wurden. Das ist aber nicht immer der Fall. Die Behandlung französischer Grapheme bleibt insgesamt sehr uneinheitlich und ist teils vom Entlehnungsalter, teils vom Sachbereich oder Popularitätsgrad abhängig (vgl. von Polenz 2000, 91).
354
Claudia M. Riehl
3.2.3 Morphosyntaktische Integration Substantiva aus der Kontaktsprache, die im Gegensatz zu Verben und attributiven Adjektiven ohne Hinzufügen von Suffixen verwendet werden können, lassen sich ohne größere Veränderungen in das System der deutschen Sprache einpassen. Vgl.: 3. a) Geh mal einen Espresso holen. b) Gib mir den Stick.
Die Substantive werden mit Hilfe des Artikels problemlos in das System der deutschen Sprache integriert. Das Genus wird dabei vom Genus der Gebersprache bestimmt, falls diese Genus markiert: So ist etwa espresso im Italienischen maskulin und bleibt es auch im Deutschen. In Fällen, wo das entlehnte Wort in der Gebersprache genusneutral ist, wird das Genus häufig von einem Wort mit gleicher oder ähnlicher Bedeutung übernommen: engl. stick ist genusneutral, es bekommt das maskuline Genus von dt. Stift. Weitere Möglichkeiten für Genusbestimmung sind Reihenbildung: z. B. der Foxtrott, Quickstep, RockʼnʼRoll, Swing nach der Tanz (vgl. Yang 1990, 155) oder lautlichmorphemische Ähnlichkeit: der Roof (‚Dach‘ im Australiendeutschen) analog zu der Ruf (vgl. Clyne 1994, 110). Bei Endungen wie engl. -er, frz. -eur dienen die Substantiva auf dt. -er als Vorbild (vgl. auch Eisenberg 2012, 229 ff.). Die Pluralbildung (bzw. Integration in das Flexionssystem) bietet keine Schwierigkeiten in den Fällen, in denen die Lexeme der Ausgangssprache eine Flexionsendung besitzen, die auch im Deutschen vorkommt, z. B. den s-Plural: 4. a) Kauf bitte fünf Tickets. b) Ich muss noch diese beiden Restaurants anrufen.
Der s-Plural wird bei Fremdwörtern im Deutschen häufig verwendet, vgl. Auto-s, Büro-s, wird aber auch an Eigennamen (die Bachs), Abkürzungen (AGs), metaphorischen Substantivierungen (die Hochs, die Tiefs) oder Mehrsilbern, die mit unbetontem Vollvokal enden (Omas, Uhus) gebraucht. Das Suffix wurde ursprünglich aus dem Französischen entlehnt, ob es heute zur Kerngrammatik gehört, ist umstritten (vgl. Eisenberg 2012, 227). Eisenberg (ebd, 228) weist aber darauf hin, dass Anglizismen häufig auch den s-Plural bekommen müssten, wenn sie ihn im Englischen nicht hätten, etwa weil sie auf unbetonten Vollvokal enden und die Stammschreibung erhalten bleiben muss: vgl. Baby – Babys (und nicht Babies). Nach Wegener (2004) ist es besonders für unassimilierte Fremdwörter wichtig, dass ihre Pluralformen den Singular noch erkennen lassen. Dies ist durch das s-Suffix besser gewährleistet als durch andere Pluralendungen (vgl. Pizza-s gegenüber Pizzen). Für einheimische Wörter ist es dagegen wichtiger, dass sie phonetisch und prosodisch wohlgeformt sind, damit sie leichter artikuliert werden können. Sie haben daher oft silbische Pluralformen (vgl. Zwerg – Zwer-ge). Erst, wenn die Wörter einen
Besondere Wörter I: Lehnwörter, Neu-Wörter
355
bestimmten Bekanntheitsgrad erreicht haben (wie Pizza), können sich assimilierte Flexionsformen ausbilden (wie Pizz-en). Allerdings bemerkt man etwa bei Wörtern aus anderen Sprachen, die keinen s-Plural kennen, häufig Probleme bei der Einpassung. So hat etwa der italienische i-Plural kein Pendant im Deutschen. Die Bildungen schwanken hier öfter zwischen dem Originalplural, s-Plural und Nullplural: 5.
Bestell bitte zwei Espressi/Espressos/Espresso.
In Kontaktsituationen bei Minderheiten, etwa im Südtiroler Deutsch, werden die Substantive nicht mit einem im Deutschen üblichen Pluralmorphem versehen, sondern behalten die Endung des Italienischen. Sie sind also in diesem Fall nur durch den Artikel in das System der deutschen Sprache integriert. Auch Adjektive können durch Hinzufügen der deutschen Endungen einfach in das System der deutschen Sprache eingepasst werden: 6. a) Das war ein cooles Stück. b) Das ist ein lelikes Fluchwort. [Bsp. Namibia, afr. lelik ‚hässlich‘].
Die Integration in das System der deutschen Sprache scheint allerdings davon abzuhängen, ob die Laut- und Silbenstruktur dem Deutschen entspricht. So stellt man fest, dass im Australiendeutschen viele aus dem Englischen übernommene Adjektive ausschließlich prädikativ gebraucht werden: Da war er happy. Das war so annoying. (Australiendeutsch, vgl. Riehl 2014, 102). Hier spielen offensichtlich Unterschiede in der Kombinierbarkeit von Phonemen und/oder Unterschiede in der Silbenstruktur eine Rolle. Bei Adjektiven mit einer dem Deutschen ähnlichen Laut- und Silbenstruktur (ein cooler Typ [analog zu kühler], ein cleveres Mädchen [analog zu braves]) ist das dagegen kein Problem. Interessant ist die Einpassung von Verben. Im deutsch-romanischen Sprachkontakt beobachtet man, dass die Verben mit Hilfe des Suffixes -ieren integriert werden. Dieses Suffix wurde schon in mhd. Zeit aus französischen Lehnwörtern isoliert und mit seiner Hilfe wurden zahlreiche Lehnwörter aus romanischen Sprachen (diktieren, traktieren) oder Verben mit lateinischer oder griechischer Basis (protestieren, telefonieren) in das Deutsche integriert: 7. a) Sie panikiert. [Bsp. Ostbelgien, frz. paniquer ‚in Panik geraten‘] b) Aber tu nicht deine Familie inkomodieren. [Bsp. Brasilien, port. incomodar ‚belästigen, verärgern‘].
Im deutsch-englischen oder deutsch-afrikaansen Sprachkontakt wird dagegen immer die deutsche Verbendung ‑en angehängt. Das geschieht auch mit den neuen Entlehnungen aus dem Englischen, die wir im Standarddeutschen vorfinden (vgl. checken, testen, biken). Das Gleiche gilt auch im slawischen Kontext: z. B. russlanddt. znaje
356
Claudia M. Riehl
(russ. znatʼ ‚wissen‘). Hier wird entsprechend die dialektale Infinitivendung -je analog zu standdarddt. -en angefügt. Dass im deutsch-romanischen Sprachkontakt das erweitere Suffix -ieren verwendet wird, scheint entweder durch das Vorhandensein des Infinitivsuffixes auf -r in den romanischen Sprachen oder durch die romanisch-lateinische Basis motiviert zu sein. Das Fehlen eines Infinitivsuffixes im Afrikaansen und Englischen und in den slawischen Sprachen zieht eine bloße Anfügung des einfachen Suffixes -en nach sich. So lautet die Entlehnung von engl. to panik und frz. paniquer (‚in Panik geraten‘) im Namibiadeutschen paniken und im Belgiendeutschen panikieren (vgl. Riehl 2014, 101). Die Integration von Partikelverben des Englischen gestaltet sich allerdings etwas komplizierter: Hier ist nicht immer klar, ob eine Trennung von Partikel und Verbstamm geschehen soll wie etwa bei downloaden. Es gibt auch hier verschiedene Möglichkeiten wie etwa downgeloadet oder gedownloaded (vgl. Hausmann 2008). Allerdings werden hier die Verben mehrheitlich gemäß den für das Deutsche geltenden Regeln gebildet. Da, wo dies nicht geschieht, sind meist semantische Gründe verantwortlich (vgl. Siekmeyer 2007). In anderen Sprachpaarungen ist selbst die Integration von einfachen Verben problematisch, so dass etwa im türkisch-deutschen Sprachkontakt die deutschen Verben mit dem türkischen Passe-partout-Verb yapmak ‚machen‘ integriert werden, das deutsche Verb bleibt dabei im Infinitiv (z. B. tauschen yapmam ‚ich tausche nicht‘, wörtl. ‚ich mache nicht tauschen‘); ähnliches geschieht im Italienischen mit fare ‚machen‘ (fa una Pokemon-Karte einsetzen ‚er setzt eine Pokemon-Karte ein‘, facciamo schmücken ‚wir schmücken‘, s. Krefeld 2004, 105) (vgl. dazu auch Wohlgemuth 2009, 102 ff. mit Beispielen aus anderen Sprachen). Auch dies deutet darauf hin, dass ähnliche phonotaktische Regeln von Sprachen bzw. gleiche Silbenstrukturen die Integration erleichtern oder vielleicht sogar erst ermöglichen.
4 Strukturelle Entlehnung Neben diesen direkten Übernahmen von sprachlichem Material aus einer anderen Sprache muss noch ein viel produktiverer Bereich betrachtet werden, der in der Regel immer im Zusammenhang mit lexikalischen Entlehnungen besprochen wird, nämlich die Übernahme von strukturellen oder semantischen Merkmalen eines Begriffes der Kontaktsprache. Munske (2009, 251) schlägt hierfür den Terminus ‚Lehnbildung‘ vor.
4.2.1 Lehnübersetzung und Lehnübertragung Wie in Kap. 1 bereits bemerkt, gibt es die Möglichkeit, Wörter mit dem Wortmaterial der eigenen Sprache, aber nach dem strukturellen Muster der Kontaktsprache zu
Besondere Wörter I: Lehnwörter, Neu-Wörter
357
bilden (sog. morpheme-for-morpheme transference, Clyne 2003, 78). Beispiele für derartige Lehnübersetzungen sind das dt. herunter-laden (analog zu engl. down-load) oder engl. loan-word analog zu dt. Lehnwort. Das kann sich auch auf morphologische Derivate beziehen wie in tschech. diva-dlo analog zu griech. thea-tron (‚schau‘+Suffix für Platz) (vgl. Haspelmath 2009, 39). Mit der Bezeichnung ‚Lehnübertragung‘ wird dagegen eine Teilübersetzung beschrieben: Luftbrücke für engl. air-lift (eigentlich ‚Luft-Fahrstuhl‘), Halbinsel für lat. paeninsula (eigentlich ‚Beinahe-Insel‘), Erdkunde für griech. geographia (eigentlich ‚Erdbeschreibung‘) (vgl. Stedje 2007, 29).
4.2.2 Semantischer Transfer (Lehnbedeutung) Eine interessante und häufig den Sprechern nicht bewusste Form der strukturellen Entlehnung ist die Übertragung einer Bedeutung eines Wortes auf einen Begriff in der Zielsprache, der sich nur in einem Teil des Begriffsumfangs mit diesem überschneidet (sog. ‚Teiläquivalenz‘). Dies wird in der Regel als ‚Lehnbedeutung‘ bezeichnet. Häufig wird auf diejenigen Lexeme eine zusätzliche Bedeutung übertragen, die in beiden Sprachen lautlich ähnlich sind. So hat etwa das dt. Wort buchen, das ursprünglich nur die Bedeutung ‚in ein Rechnungsbuch eintragen‘ hatte, die zusätzliche Bedeutung ‚einen Platz bestellen‘ von engl. to book übernommen. Auch die Bedeutung von schneiden ‚nicht beachten‘ ist aus dem Englischen übernommen (to cut a person) (Stedje 2007, 29), obwohl hier überhaupt keine etymologische Verwandtschaft oder lautliche Ähnlichkeit zwischen den beiden Wörtern besteht. Semantische Entlehnung findet allerdings am häufigsten bei sog. cognates statt. Dies sind etymologisch miteinander verwandte Wörter in beiden Sprachen wie das eben erwähnte engl. to book und dt. buchen. Je näher die Sprachen miteinander verwandt sind, desto größer ist der gemeinsame Erbwortschatz und damit auch die Möglichkeit der semantischen Entlehnung (vgl. Riehl 2014, 102 ff.).
5 Beispiele aus dem Sprach- und Kulturkontakt 5.1 Sprach- und Kulturkontakt als Grundlage europäischer Sprachen Die gesamte Geschichte der europäischen Sprachen kann als eine Geschichte des Sprach- und Kulturkontakts interpretiert werden. Dabei gibt es zwischen verschiedenen Sprachen und Kulturen zu verschiedenen Zeiten unterschiedlich intensive Kontaktphasen und damit unterschiedlich starke gegenseitige Beeinflussungen: So
358
Claudia M. Riehl
übte etwa in der Frühphase der romanischen und germanischen Sprachen das Lateinische einen sehr starken Einfluss auf diese Sprachen aus, der sich nicht nur in der Lexik und Semantik, sondern auch in syntaktischen und morphologischen Strukturen bemerkbar macht. Auf dem Gebiet des heutigen Frankreich etwa wurde die einheimische keltische Bevölkerung romanisiert, aber das Lateinische, das dort gesprochen wurde, übernahm auch Elemente der alten keltischen Sprache (= Substratwirkung). Dies ist nachweisbar vor allem im Wortschatz der Landwirtschaft: afr. mesgue < gall. *mesigus ‚Molke‘, afr. brèche < gall. brisca ‚Wabe‘, afr. lie < gall. līga ‚Trester‘ (vgl. Wolf/Hupka 1981, 12). Umgekehrt übernahmen die germanischsprachigen Franken, nachdem sie Gallien eroberten hatten, die dort gesprochene romanische Sprache; einige Elemente aus ihrer Sprache flossen aber auch in die romanische Varietät ein (= Superstratwirkung). Das gilt besonders für Entlehnungen im Bereich des Wortschatzes, die sich in fast allen Lebensbereichen zeigen, wie Heerwesen (épieu ‚Speer‘, heaume ‚Helm‘), Landwirtschaft (blé ‚Weizen‘, gerbe ‚Garbe‘), Tier- und Pflanzenwelt (roseau ‚Schilf‘, frelon ‚Hornisse‘) sowie Hausbau und Wohnung (faîte ‚First‘, salle ‚Saal‘) wie auch Charaktereigenschaften (orgueil ‚Stolz‘). Sprach- und Kulturkontakt findet aber nicht nur im Zuge von Eroberungen statt, sondern auch infolge lange währender Nachbarschaft (= Adstratwirkung). Dabei gehen manche Wörter regelrecht auf „Wanderschaft“, wie etwa das oben erwähnte frz. orgueil zeigt: Dieses wurde aus dem Fränkischen ins Französische übernommen, dann über das Katalanische weitergegeben an das Spanische (vgl. Coromines/Pascual 1981, 296 f.). Daraus ergeben sich auch Probleme bei etymologischen Angaben zu Entlehnungen in der Lexikographie, wie Haß (in diesem Band) zeigt. Auch mehrfache Entlehnung des gleichen Quellworts aus der gleichen Sprache kommt vor: So wurde aus dem lateinischen Wort cella in germanischer Zeit das Wort Keller entlehnt und in mittelhochdeutscher Zeit das Wort Zelle. Unterschiedliche lautliche Anpassungen lassen auf das unterschiedliche Alter der Entlehnungen schließen. Generell kann man davon ausgehen, dass drei Sprachen einen besonders intensiven Einfluss auf andere europäische Sprachen gehabt haben bzw. haben: das Lateinische, das Französische und das Englische. Ich werde im Folgenden einige Phänomene des historischen Sprachkontakts anhand der Geschichte der deutschen Sprache exemplifizieren (zu weiteren Gebersprachen wie Italienisch, Russisch u. a. s. von Polenz 2009; Eisenberg 2012, 37 ff.).
Besondere Wörter I: Lehnwörter, Neu-Wörter
359
5.2 Beispiele aus der Sprachgeschichte des Deutschen 5.2.1 Einflüsse des Lateinischen Noch zu Zeiten des römischen Imperiums übernehmen die germanischen Völker von den Römern die überlegene Sachkultur und damit auch die dazugehörenden Bezeichnungen. Etwa 500 Wörter werden zu dieser Zeit entlehnt, meist Substantive. Beispiele finden sich in einer Reihe von Bereichen: – Kriegswesen: Kampf (< campus), Pfeil (< pilum); – römische Verwaltung: Zoll (< tolonium), Kerker (< carcer); – Geräte: Spiegel (< speculum), Pfanne (< panna), Schüssel (< scutella); – Lebensmittel: Pilz (< boletus), Käse (< caseus), Pfeffer (< piper), Senf (< sinapis); – Verkehr und Handel: Straße (< via strata), Markt (< mercatus), Sack (< saccus), Korb (< corbis), Kiste (< cista), Münze (< moneta), Pfund (< pondo). Eine interessante Domäne ist auch der Hausbau: Die Germanen bauten ursprünglich fensterlose Lehmhäuser mit Weidegeflechttragwerk (vgl. Wand < winden, da die Weidenzweige ineinander gewunden wurden) und übernehmen von den Römern nicht nur die Bauweise mit Stein, sondern auch die Bezeichnungen für die dazugehörenden Materialien und Bauteile: Ziegel (< tegula), Mörtel (< mortarium), Mauer (< murus), Pfeiler (< pilarium), Keller (< cellarium), Fenster (< fenestra). Auch Gartenund Weinbau wird eingeführt und damit der zugehörige Wortschatz: Wein (< vinum), Kelter (< calcatura), Kelch (< calix, -cis) (vgl. Stedje 2007, 70). Die zweite lateinische Welle setzt dann in althochdeutscher Zeit ein: Die vor allem aus Kirche und Klosterkultur übernommenen Wörter sind dadurch charakterisiert, dass sie die lateinischen Plosive p, t, k nicht mehr verschieben, da ja die Entlehnung bereits nach Abschluss der zweiten Lautverschiebung einsetzt. Übernommen werden Bezeichnungen für: – kirchliche Einrichtungen und Begriffe: Papst (< papa), Kloster (< mlat. clostrum), Kaplan (< capellanus), Pilger (< vulgärlat. pelegrinus), Kreuz (< crux, crucis), Zelle (< cella), predigen (< praedicare); – neue materielle Errungenschaften: Mantel (< mantellum), Teppich (< tapetum), Brezel (< brachitum); – neue Pflanzen aus den Klostergärten: Petersilie (< mlat. petrosilium), Zwiebel (< mlat. cipolla), Salbei (< salvia). Ein sehr wichtiger Bereich ist auch die Schreib- und Schriftkultur: Klosterschüler ritzten nicht mehr Runen ins Holz, sondern schreiben (< scribere) mit Tinte (< aqua tincta ‚gefärbtes Wasser‘) auf Pergament (< mlat. pergamentum) oder mit einem Griffel (< graphium) auf eine Tafel (< tabula) (vgl. Stedje 2007, 88 f.). Begriffe, die mit der neuen Sachkultur übernommen werden, können auch alte Wörter ganz verdrängen. So dringt mit der griechischen Medizin, die über die römische vermittelt wird, das
360
Claudia M. Riehl
Wort Arzt (aus vulgärlat. archiater) in die althochdeutsche Sprache und verdrängt das heimische leikari ‚Besprecher‘. Eine dritte Welle des lateinischen Sprachkontakts tritt dann wieder mit dem Humanismus auf den Plan: Hier erleben wir in germanischen wie romanischen Sprachen eine starke Renaissance des Lateinischen. Latein war die ausschließliche Sprache an den neu entstehenden Universitäten und wurde dort nicht nur geschrieben, sondern bis weit ins 17. Jh. hinein auch gesprochen (vgl. von Polenz 2009, 87). Es werden allerdings in dieser Zeit sehr viele Wörter aus dem Lateinischen (und auch Griechischen) übernommen (Universität, Humanität, Pensum, Text, diskutieren, präparieren, Prozess, Akte, legal u. v. m.). Sogar die alten deutschen Monatsnamen werden durch lateinische Namen ersetzt: z. B. Juli statt Heumonat, Dezember statt Christmonat (vgl. Stedje 2007, 132). Eine wahre Wortschatzflut aus den beiden klassischen Sprachen bereichert den Fachwortschatz (siehe dazu auch Roelcke in diesem Band). Damit hat sich aber im deutschen Wortschatz nichts anderes ereignet als in anderen westeuropäischen Kultursprachen. Die Zahl der Wortstämme, mit denen neue Wörter gebildet werden konnten, hat sich in vielen semantischen Bereichen nahezu verdoppelt. Aus dem Nebeneinander mit dem autochthonen (= einheimischen) Wort ergibt sich oft die Möglichkeit der Bedeutungsdifferenzierung: sozial vs. gesellschaftlich, Telegramm vs. Fernschreiben (vgl. von Polenz 2009, 88). Neben lautlich und graphematisch integrierten Lexemen wie supplicatz, disputaz, oratz, reformatz und compositz stehen eine ganze Reihe von nicht-integrierten Lexemen, die mit dem konservativen Rückgriff auf das wiederentdeckte klassische Latein in Zusammenhang stehen. Dies führte auch dazu, dass bestimmte Wörter ihre lateinische oder griechische Flexion im Plural beibehielten: vgl. Index – Indices, Atlas – Atlanten, Thema – Themata, Topos – Topoi, Tempus – Tempora. In diesem Fall entsteht zwar eine Lehnmorphologie (Aikhenvald 2008, 21), aber da diese auf die wenigen Substantive beschränkt bleibt und nicht reihenbildend wirkt, ist sie Teil der lexikalischen Entlehnung. Die Tradition lateinischer und griechischer Flexionssuffixe diente besonders im 16. und 17. Jh. als Statussymbol (auch bei längst bekannten und eingedeutschten Lehnwörtern). Neben dem Wortschatz aus dem Lateinischen und Griechischen werden in frühneuhochdeutscher Zeit viele Suffixe und Präfixe übernommen, die an die lateinischen und griechischen Basen angehängt werden, etwa die Suffixe -ität, -ation, -ur, -age, -ant, -al, -abel und Präfixe wie ex-, de-, con-, dis-, hyper-. Allerdings wird in dieser frühen Phase noch viel mit Kombinationen von Suffixen und Präfixen fremder und heimischer Provenienz experimentiert, so dass es hier zu einer Doppel- und Mehrfachsuffigierung kommt, vgl. sakramental, sakramentar, sakramentalisch, sakramentarisch, sakramentarlich oder Sakramenter, Sakramentierer, Sakramentist, sakramenten, sakramentieren, versakramenten (von Polenz 2000, 223).
Besondere Wörter I: Lehnwörter, Neu-Wörter
361
5.2.2 Französische Einflüsse Bereits im Mittelalter macht sich neben dem Lateinischen ein weiterer Sprach- und Kulturkontakt bemerkbar und zwar in der höfischen Dichtung. Mit der Übernahme der französisch-provenzalischen Lebensform kommt es zum Kontakt mit dem Französischen bzw. Provenzalischen (Chrétien de Troyes, Troubadourlyrik etc.). Am deutlichsten wird dies zunächst im Wortschatz, der meist durch das Mittelniederländische (flandrisches Rittertum) in das Mittelhochdeutsche eindringt. Bis ins 14. Jh. werden etwa 2000 Wörter übernommen, von denen allerdings nur noch ein kleiner Teil heute fortlebt. Dies sind vor allem Bezeichnungen für: – Kampfspiele (Turnier < afrz. tornei ‚ritterliches Waffenspiel‘); – Unterhaltung (Tanz < frz. danse, Melodie < frz. mélodie); – Kleidung und Stoffe (schapel < afrz. chapel ‚Kranz, Diadem‘, Samt < afrz. samit); – Kostbarkeiten (Rubin < frz. rubin). Neben den Substantiven werden auch eine Reihe von Verben entlehnt, die ritterliche Tätigkeiten beschreiben: turnieren, parlieren, buhurdieren (‚Buhurt reiten‘ = ritterliches Kampfspiel). Bestimmte Entlehnungen wurden auch neben einheimischen Wörtern verwendet, hatten dann aber eine andere Bedeutung. So wird etwa der deutsche Begriff höfscheit zur Bezeichnung der Charakterbildung gebraucht, während das altfranzösische Pendant courtoisîe bestimmte höfische Fertigkeiten wie musikalisches Talent benennt. Der entlehnte Wortschatz wird also als Mittel der stilistischen Differenzierung und zur Konstituierung verschiedener Stilebenen oder Funktiolekte eingesetzt, genau wie heute das Englische (s. u. 5.2.3). Daneben gibt es auch Entlehnungen im Bereich der Morphologie. So wird von Verben, wie den gerade genannten, das Suffix -ieren isoliert und kann ab dem 14. Jh. auch an heimische Basen angehängt werden: vgl. buchstabieren, amtieren. Es dient aber meist zur Ableitung von Verben mit lateinisch-griechischer oder romanischer Basis (vgl. Fleischer/Barz 2012, 431 f.). Ein weiteres Suffix, das in dieser Zeit aus dem Französischen übernommen wird, ist -îe, das aus Wörtern wie melodîe, courtoisîe isoliert wird und im Frühneuhochdeutschen zu -ei wird. Es ist, wie die Bildungen Bäckerei, Druckerei, Brüllerei, Heuchelei etc. zeigen, auch heute noch sehr produktiv. Nicht mehr produktiv ist heute das Suffix -lei, das vom frz. loi kommt (vielerlei, mancherlei). Die fremde Herkunft der Suffixe ist vor allem daran festzumachen, dass sie im Gegensatz zu heimischen Endungen die Betonung tragen. Gerade dieser Aspekt sowie die Tatsache, dass die entsprechenden Wörter nach dem Hören eingedeutscht werden (vgl. loschieren mit [ʃ] nach frz. logier) sprechen für die Übernahme aus der gesprochenen Sprache (vgl. von Polenz 2009, 50). Ein zweiter Einfluss des Französischen wird in der sog. ‚Alamode‘-Epoche deutlich, der Zeit nach dem Dreißigjährigen Krieg. Vor und nach Ludwig XIV. (1650–1770) ist Frankreich die führende Nation. Adel und gehobenes Bürgertum orientieren sich an der Mode (à la mode) von Paris und am französischen Königshof. Um 1700 ist in
362
Claudia M. Riehl
diesen Schichten Zweisprachigkeit absolut üblich. Die Sprache des Hofes und damit Prestigesprache ist das Französische. Aus dieser Zeit des Sprachkontakts resultieren wieder eine ganze Reihe von Lehnwörtern: – im Bereich Mode: Mode, Kostüm, Weste, Parfüm, frisieren, Perücke; – im Bereich der Küche: Bouillon, Omelette, Ragout, Torte, Serviette, Tasse; – in der Wohnkultur: Balkon, Salon, Hotel, Gardine, Sofa, Büfett; – im Gesellschaftsleben: Maskerade, Billard, Karussell, Promenade. Neben Substantiven findet sich hier eine Vielzahl von Adjektiven (galant, charmant, curiös, nobel, nett, interessant) und Verben (amüsieren, spendieren, parlieren, maskieren). Allerdings handelt es sich dabei häufig um eine kontextbedingte Auswahl aus herkunftssprachlichen Verwendungsmöglichkeiten. Grundsätzlich werden Lehnwörter nicht in allen Bedeutungen der Herkunftssprache entlehnt, vgl.: – Karriere: ‚beruflicher Aufstieg‘, aber nicht: ‚Fahrt, Bahn‘; – Plateau: ‚Hochebene‘, aber nicht: ‚Platte, Waagschale, Bett‘. Durch Kontakt mit Reisenden, Händlern und Soldaten in Kriegszeiten gelangten viele Wörter auch in untere Volksschichten und leben heute noch in Mundarten fort (vgl. bair. Trottoir, Böfflamot ‚Bœuf à la mode‘, Berlinisch Budike ‚Geschäft‘, direktemang ‚direkt, gerade‘, rheinländ. Paraplü (‚Regenschirm‘), alät (‚munter, aufgeweckt’), Filu (‚Spitzbub‘), malat (‚kränklich‘),) (vgl. von Polenz 1994, 100 f.). Während es sich bei diesen Wörtern häufig um sog. ‚Bedürfniswortschatz‘ handelt (neue Bezeichnungen werden mit der jeweiligen Sachwelt übernommen), geht der Lehneinfluss so weit, dass auch der Kernwortschatz betroffen ist. Aus dem Französischen übernommene Verwandtschaftsbezeichnungen wie Papa, Mama, Onkel, Tante, Cousin, Cousine verdrängen die ursprünglichen deutschen Begriffe. Die Bezeichnungen Onkel und Tante stehen nun für jeweils zwei Bezeichnungen im Deutschen: für Vetter (= ‚Vaterbruder‘) und Oheim (= ‚Mutterbruder‘) einerseits und für Base (= ‚Vaterschwester‘) und Muhme (= ‚Mutterschwester‘) andererseits. Die Übernahme der französischen Begriffe ist mit einem soziokulturellen Wandel erklärbar: Durch den Verfall des alten Verwandtschaftssystems kommt es zu einer Neutralisierung der Unterscheidung von ‚väterlicherseits‘ vs. ‚mütterlicherseits‘ und ‚blutsverwandt‘ vs. ‚heiratsverwandt‘. Die lexikalischen Übernahmen heben damit die semantische Differenzierung auf (vgl. von Polenz 1994, 85). Etwa die Hälfte der Wörter, die in der Zeit entlehnt wurden, sind wieder verschwunden.
5.2.3 Der Einfluss des Englischen Der Einfluss des Englischen auf die deutsche Sprache begann auf literarischer Ebene schon im 17. und 18. Jh. – durch Handelskolonien in Hamburg oder literarische Zirkel
Besondere Wörter I: Lehnwörter, Neu-Wörter
363
in Zürich, Leipzig und Göttingen –, verstärkt sich aber deutlich im 19. Jh. im Zuge der Industriellen Revolution und der ersten Ansätze der Demokratisierung (von Polenz 1999, 401). England war Vorbild in Industrie und Handel, im Verkehrs- und Pressewesen. Mit diesen Errungenschaften wird wieder der dazugehörige Wortschatz entlehnt (z. B. Trust, Partner, Tunnel, Waggon, Express, Essay, Reporter, Interview). Die Beziehungen zwischen Deutschland und England wirkten auch im „modischen Gesellschaftsleben[.]“ (ebd). Um 1900 hat das Englische als modische Konversationssprache das Französische verdrängt. Im 20. Jh. nahm der Einfluss weiter zu, viele Lehnwörter waren bereits in den 20er Jahren üblich (Film, Bestseller, Jazz, Song, Pullover, Manager, tanken), wurden nur durch puristische Haltungen während des Ersten Weltkrieges und in der Nazizeit wieder zurückgedrängt (vgl. 6.2). Ab 1945 machte sich nun nicht mehr der britische, sondern der angloamerikanische Einfluss bemerkbar und dehnt sich auf alle gesellschaftlichen Schichten aus. Durch die Verbreitung des Englischen als schulische Fremdsprache sind die englischen Lehnwörter meist nicht in das deutsche Schriftsystem integriert (d. h. sie werden mit englischer Orthographie geschrieben), wohl aber weitgehend auf lautlicher und auf morphematischer Ebene (d. h. die Wörter sind deklinierbar und konjugierbar). Allerdings kommt es im Bereich der Aussprache zu größeren Schwankungen und zahlreichen Varianten (s. o. 3.2.1). Viele Lehnwörter decken den Bedarf, andere sind Luxuslehnwörter und werden aus Prestigegründen entlehnt. Dabei wird in der Regel eine Bedeutungsdifferenzierung vorgenommen: Drink (‚alkoholisches Getränk‘), Hit (‚erfolgreicher Schlager‘), Meeting (‚sportliche, geschäftliche Zusammenkunft‘), Bike (‚Fahrrad als Sportgerät‘). Ein Bedürfnislehnwort in diesem Zusammenhang war das Wort Baby. Die deutschen Pendants Säugling und Kleinkind sind amtliche Bezeichnungen, Baby vermittelt dagegen den Gefühlswert (von Polenz 2009, 139 f.). Hier lässt sich also eine ganz ähnliche Entwicklung erkennen wie bei den Übernahmen aus dem Französischen im Mittelalter und teilweise auch im 18. Jh.
5.3 Germanismen in anderen Sprachen So wie das Deutsche sehr viele Wörter aus anderen Sprachen übernommen hat, sind auch umgekehrt deutsche Wörter in andere Sprachen entlehnt worden. Ganz besonders passierte das in den Regionen, die historisch gesehen lange in Sprachkontakt mit der deutschen Sprache standen, etwa in Osteuropa: Ein schönes Beispiel dafür ist das Ungarische, auf dessen Sprachgebiet sich bereits im 12. Jh. deutsche Siedler niederließen. Hier wurden schon sehr früh Ausdrücke wie polgár (‚Bürger‘), pór (‚Bauer‘) oder szoba (‚Stube‘) übernommen. Weitere Bezeichnungen für das bürgerliche Leben, städtische Institutionen, Kleingewerbe, Handel und Bergbau kamen v. a. im 13./14. Jh. hinzu: céh (‚Zunft‘ < zeche), borbély (‚Barbier‘), kalmár (‚Krämer‘), kufár (‚Käufer‘) u. v. m. Der Einfluss des Deutschen stieg weiter mit der Thronbesteigung
364
Claudia M. Riehl
der Habsburger im 16. Jh. und hatte seinen Höhepunkt im 18. Jh. Interessant ist hier, dass das Ungarische viele Bezeichnungen für Mode, Ess- und Wohnkultur – ähnlich wie das Deutsche aus dem Französischen, wie wir in 5.2.2 gesehen haben – aus dem (österreichischen) Deutschen entlehnt hat: vgl. copf, púder, slafrock, smink, gefrorenesz, kommód, firhang, luszter sowie die Adjektive fess, hercig, nett, snáidig. Allerdings sind darunter auch viele Wörter, die das Deutsche seinerseits aus dem Französischen übernommen hat (vgl. 5.2.2): frizura, módi, garderobe, desszert, likőr und Adjektive wie kokett, elegáns (dazu Földes 2009, 103 ff.). Ein eigenes Kapitel stellen die Berufssprachen dar: Die Terminologie im Handwerk stammt nicht nur im Ungarischen, sondern auch in vielen slawischen Sprachen, auf deren Gebieten sich deutsche Handwerker ansiedelten, zu einem nicht unwesentlichen Teil aus dem Deutschen, etwa Bezeichnungen für ‚Zollstock‘, ‚Schraube‘, ‚Leiter‘, ‚Blech‘ etc. (vgl. ebd.). Ganz besonders kann man das auch an den Bezeichnungen für die Berufe selbst sehen, vgl. die Entsprechungen für dt. Maler in den slawischen Sprachen: tschech. maliř, poln. malarz, kroat. maler, serb. молер, russ. маля́р. Allerdings wurde im Zug nationalistischer Bestrebungen in vielen Sprachen versucht, das deutsche Wortgut durch einheimisches zu ersetzen (vgl. u. 6.2.2). Neben diesen Sprachen, mit denen das Deutsche über viele Jahrhunderte in direktem Sprachkontakt stand, haben auch andere Sprachen Wörter aus dem Deutschen übernommen, die typisch deutsche Phänomene, Befindlichkeiten oder Verhaltensweisen bezeichnen: vgl. engl. blitzkrieg, gemuetlichkeit, wanderlust, schadenfreude, wirtschaftswunder, kindergarten oder frz. waldsterben, tschech. hochštapler, schwed. besserwisser. Die meisten Entlehnungen dieser Art finden sich im Englischen. Bezeichnungen für technische Phänomene dagegen, wie etwa Bremsstrahlung, werden in eine Vielzahl von Sprachen unübersetzt übernommen. Wie in 5.2 gezeigt, findet bei Entlehnungsprozessen häufig eine Bedeutungsdifferenzierung statt: So wird das deutsche Wort Arbeit im Japanischen nicht nur lautlich angepasst (= arubaito), sondern bezeichnet auch etwas anderes, nämlich einen Zweitjob oder eine Nebentätigkeit (vgl. Limbach 2007 und Siedenberg 2009 mit vielen weiteren Beispielen).
6 Sprachnorm und Purismus 6.1 Spracheinstellungen und Akzeptanz von Lehn- und Fremdwörtern Bei der Aufnahme von Fremd- oder Neuwörtern in den Wortschatz einer Gemeinschaft spielen eine Reihe von Faktoren eine Rolle. Dabei ist natürlich auch von Bedeutung, ob eine Bezeichnung oder ein Fachbegriff eingeführt wird, der im Sinne eines Terminus Technicus verwendet wird (wie Automobil, Computer, Handy), etc. oder ob es sich
Besondere Wörter I: Lehnwörter, Neu-Wörter
365
dabei um Wortschatz handelt, der bereits Äquivalente in der Nehmersprache hat (wie Bike – Fahrrad, Kids – Kinder, Verben wie checken – überprüfen oder Adjektive wie cool – gelassen). Wie die letzten Beispiele zeigen und wie bereits in 5.2.3 diskutiert, sind diese sog. ‚Luxuslehnwörter‘, die aber dennoch eine Bedeutungsdifferenzierung haben. Hier kann man ähnliche Gesetzmäßigkeiten beobachten, die auch in traditionell mehrsprachigen Gemeinschaften vorkommen: Denn ob eine Gemeinschaft viele oder wenige Entlehnungen in ihrem allgemeinen Sprachgebrauch hat, ist vom kommunikativen Verhalten (wird oft zwischen den Sprachen gewechselt oder nicht), vom Prestige der Kontaktsprache und von den sozialen Netzwerken (viel oder wenig Umgang mit den Sprechern der Umgebungssprache) abhängig (vgl. Winford 2003, 40 f.). Ob die Entlehnungen dann in einer Sprache Fuß fassen, hängt von verschiedenen Faktoren ab, die etwa Keller (2003) sehr anschaulich dargestellt hat. Sprecher benutzen bestimmte neue Formen und Strukturen, weil sie entweder ökonomischer oder anschaulicher sind als die bisher verwendeten oder bestimmten kommunikativen Prinzipien (wie z. B. Höflichkeit) folgen. Bisweilen werden nämlich bestimmte Entlehnungen von einigen Sprechern aufgrund einer bestimmten sprachpolitischen Haltung heraus bewusst abgelehnt, oder ihre Existenz wird sogar geleugnet. So etwa bei der deutschsprachigen Minderheit in Südtirol: In den Zeitungen erscheinen häufig Leserbriefe, die sich über Italianismen im Südtiroler Deutschen beklagen (vgl. Riehl 2014, 198).
6.2 Purismus Im Laufe der Geschichte der europäischen Sprachen gab es immer wieder Wellen, die versuchten, die jeweilige Nationalsprache vom Einfluss anderer Sprachen zu ‚säubern‘. Während das in der Frühen Neuzeit noch mit Bestrebungen zusammenhing, die neu entstehenden Literatursprachen auf ebenbürtigen Rang mit den klassischen Sprachen zu stellen und sie zu einer universell verwendbaren Sprache zu machen, sind die Bestrebungen des 19. und 20. Jh. auch mit nationalistischen Gedanken verbunden. Die Reinigung von „Fremdheit“ wird hierbei auch auf die Sprache übertragen. Die sog. ‚Fremdwortverdeutschung‘, die im Rahmen der im 17. Jh. entstehenden deutschen Sprachgesellschaften entsteht, hatte ursprünglich zum Ziel, den Wortschatz des Deutschen zu erweitern und damit die deutsche Sprache literatur- und wissenschaftsfähig zu machen. Die Verdeutschung von Fremdwörtern (besonders lateinisch-basierter) diente dem Ausbau der sog. copia verborum (d. h. dem Wortreichtum) im Rahmen der „Grundrichtigkeit“ und „Kunstrichtigkeit“, wie Justus Georg Schottelius es formuliert (vgl. von Polenz 1994, 110 f.). Eine Reihe dieser Verdeutschungsversuche, v. a. von Philipp von Zeesen, sind als Experimentierübungen anzusehen, die oft in poetisch-metaphorischen Kontexten entstanden (wie etwa
366
Claudia M. Riehl
Gesichtserker für Nase oder Jungfernzwinger für Kloster), andere haben sich durchaus durchgesetzt, bilden aber lediglich Dubletten neben dem aus dem Lateinischen stammenden Ausdruck, bisweilen mit Bedeutungsdifferenzierung (Distanz – Abstand, Adresse – Anschrift, Moment – Augenblick, Bibliothek – Bücherei) (vgl. ebd, 121).
6.2.1 Fremdwortpurismus im deutschen Sprachraum Im deutschen Sprachraum war Fremdwortpurismus v. a. Teil einer politischen Sprachkritik, besonders seit Mitte des 19. Jhs. (vgl. Kirkness 1998). Dabei stehen drei Argumente im Vordergrund: 1. Fremdwörter sind schädlich, weil sie aus anderen Sprachen kommen und daher fremd bleiben. 2. Fremdwörter sind schädlich, weil sie unverständlich sind. 3. Fremdwörter sind schädlich, weil sie die Sprache zerstören bzw. sie in einem gravierenden Maße verändern. Der deutsche Fremdwortpurismus richtete sich dabei zuerst gegen das Französische, dann gegen das Jiddisch-Hebräische (im Nationalsozialismus) und in neuerer Zeit gegen das Englische. Die Ablehnung des Französischen erschloss sich unmittelbar aus politischen Ereignissen, nämlich den Befreiungskriegen gegen Napoleon. Wie in Kap. 5.2.2 dargestellt, hatte das Französische im 18. Jh. nicht nur einen enormen Einfluss auf die deutsche Sprache, sondern war auch im Alltagsleben präsent. Daher konnte man dieser Sprache „für jedermann sichtbar zu Leibe rücken“ (Eisenberg 2012, 114). Erste Bestrebungen finden sich zu Anfang des 19. Jhs. und wurden institutionalisiert im 1885 gegründeten Allgemeinen Deutschen Sprachverein (ADSV). Die Purifizierungsbestrebungen gipfelten zu Beginn des Ersten Weltkriegs in Aktionen wie Entfernung französischer Beschriftungen in der Öffentlichkeit und in Geschäften, in Änderungen der Speisekarten sowie im Verbot des Französischsprechens (von Polenz 1999, 276). Während der Zeit des Nationalsozialismus richtete sich der Fremdwortpurismus v. a. gegen Wörter aus dem Jiddisch-Hebräischen. Allerdings zeigte sich hier, dass viele aus dem Jiddischen stammende Wörter vollständig in die deutsche Sprache integriert waren und dadurch keinerlei Merkmale von Fremdheit mehr aufwiesen. Das ist natürlich auch teilweise durch die enge genetische Verwandtschaft zwischen Jiddisch und Deutsch zu begründen. Jiddisch stellt ja eine Kontaktvarietät des Deutschen da, die bereits in mhd. Zeit Wörter aus dem Hebräischen entlehnt und sie in das grammatische System der von der jüdischen Bevölkerung gesprochenen Form des Deutschen integriert hat. In neuerer Zeit (verstärkt seit 1990) richtet sich die Fremdwortkritik gegen die sog. ‚Anglizismen‘, aus dem Englischen übernommene Fremdwörter und Wendungen. Dabei steht besonders die Bedrohung durch die Anglizismen und die Gefahr für die
Besondere Wörter I: Lehnwörter, Neu-Wörter
367
deutsche Sprache im Vordergrund. Hier werden auch immer wieder Auswirkungen auf die Phonologie, Morphologie und Syntax diskutiert, obwohl ja die Wörter in der Regel morphosyntaktisch korrekt integriert werden (detailliert dazu Lipczuk 2007).
6.2.2 Fremdwortpurismus im Sprachvergleich Wie im Deutschen hängt der Fremdwortpurismus (im Gegensatz zum etwas allgemeineren Sprachpurismus, der sich auch gegen Regionalismen, Dialektwörter und Archaismen richtet) in vielen anderen Nationen sehr stark mit der Nationalstaatenbildung und dem Nationalismusgedanken zusammen: Ein weiteres Beispiel, das ich hier aufführen möchte, ist das Tschechische, das sich in einem jahrhundertelangen intensiven Sprachkontakt mit dem Deutschen befand. Hier wurden nun im Zuge der Nationalbewegung deutsche Elemente ausgemerzt. Puristische Bestrebungen im Tschechischen gab es zwar bereits seit dem 15. Jh., allerdings ist hier – wie auch in Deutschland – ein systematischer Fremdwortpurismus im Zuge der „Nationalen Wiedergeburt“ besonders im 19. Jh. zu verzeichnen. Die aus dem Deutschen entlehnten Wörter wurden entweder durch Neubildungen, Archaismen oder Entlehnungen aus dem Russischen ersetzt: Beispiel für eine Neubildung ist náměstí ‚Platz‘ aus na- ‚auf‘, měst ‚Stätte/Stadt‘ und dem Suffix –i an Stelle des Germanismus‘ rynk. Einen Archaismus stellt dagegen das Wort chut‘ ‚Geschmack‘ dar, das das aus dem Deutschen stammende smak ersetzt. Die Einführung des Wortes tečka ‚Punkt‘ statt des bisherigen puntík nimmt Anleihen aus dem Russischen (točka). Interessant ist in diesem Zusammenhang, dass man zwar versucht, deutsches Wortgut zu verdrängen, gleichzeitig aber neue Wörter in Form von Komposita (nach Muster des Deutschen) bildet, obwohl diese als „unslavisch“ gelten: z. B. veselohra ‚Lustspiel‘ aus veselý ‚lustig‘ und hra ‚Spiel‘ (vgl. dazu Berger 2009). Die aus dem Standardtschechischen eliminierten Germanismen sind allerdings in der tschechischen Umgangssprache noch weitgehend erhalten (vgl. ugspr. flaška ‚Flasche‘ gegenüber standardtschechisch lahev). In eine andere Richtung gehen dagegen die puristischen Bestrebungen Anfang des 20. Jh. in der Türkei: Hier war das Ersetzen der zahlreichen persischen und arabischen Elemente im Türkischen Teil der Bildungsreform von Mustafa Kemal Atatürk, der die türkische Bildungssprache der breiten Bevölkerung zugänglich machen wollte. In diesem Zusammenhang wurde eine Sprachgesellschaft (Türk Dil Kurumu TDK) gegründet, deren Aufgabe darin bestand, das Osmanische von persischen und arabischen Elementen zu „reinigen“, um so eine für alle verständliche Sprache zu schaffen (das sog. ‚Öztürkçe‘ = Neutürkische). Die TDK sammelte zu diesem Zweck turksprachliches Wortgut in historischen Quellen und anatolischen Dialekten und bildete so eine ganze Reihe von Neologismen, die dann in die Schulbücher Einzug hielten. Ein Großteil der Neuwörter entstand allerdings durch Kompositabildung und Derivation oder wurde aus indoeuropäischen Lexemen gebildet (wie okul aus dem engl. school). Abstrakte persische und arabische Wörter wurden teilweise auch durch
368
Claudia M. Riehl
konkrete türkische Wörter ersetzt, deren Bedeutungsumfang einfach erweitert wurde (vgl. dazu Haig 1996).
7 Literatur Aikhenvald, Alexandra Y. (2008): Grammars in contact: a cross-linguistic perspective. In: Alexandra Y. Aikhenvald/Robert M. W.Dixon (Hg.): Grammars in Contact. A Cross-Linguistic Typology. Oxford, 1–66. Bär, Jochen A. (1999): „Sitt“ und „satt“: Vom Einfluss des Eistees auf die Sprache. In: Der Sprachdienst 43, 246–248. Berger, Tilman (2009): Tschechisch-deutsche Sprachbeziehungen zwischen intensivem Kontakt und puristischer Gegenwehr. In: Christel Stolz (Hg.): Unsere sprachlichen Nachbarn in Europa: die Kontaktbeziehungen zwischen Deutsch und seinen Grenznachbarn. Bochum, 133–156. Betz, Werner (1949): Deutsch und Lateinisch. Die Lehnbildungen der althochdeutschen Benediktinerregel. Bonn. Bullock, Barbara E. (2009): Phonetic reflexes of code-switching. In: Barbara E. Bullock/Almeida J. Toribio (Hg.): The Cambridge Handbook of Linguistic Code-Switching. Cambridge, 163–181. Clyne, Michael (2003): Dynamics of Language Contact. English and Immigrant Languages. Cambridge. Clyne, Michael (2004): History of research on language contact. In: Ulrich Ammon u. a. (Hg.): Sociolinguistics/Soziolinguistik: Ein internationales Handbuch zur Wissenschaft von Sprache und Gesellschaft. 2. Aufl. Berlin/New York (Handbücher zur Sprach- und Kommunikationswissenschaft, 3.1), 799–805. Coromines, Joan/José A. Pascual (1981): Diccionario Crítico Etimológico Castellano e Hispánico. Bd. 4. Madrid. DUDEN. Das Fremdwörterbuch: 10. Aufl. Mannheim. 2010. Eisenberg, Peter (2012): Das Fremdwort im Deutschen. Berlin. Fleischer, Wolfgang/Irmhild Barz (2012): Wortbildung der deutschen Gegenwartssprache. 4. Aufl. Berlin/Boston. Földes, Csaba (2009): Historische und aktuelle Aspekte des Kontaktfeldes Deutsch-Ungarisch. In: Michael Elmentaler (Hg.): Deutsch und seine Nachbarn. Frankfurt a. M., 101–116. Grosjean, François (1995): A psycholinguistic approach to code-switching: the recognition of guest words by bilinguals. In: Lesley Milroy/Pieter Muysken (Hg.): One Speaker, Two Languages. Cross-Disciplinary Perspectives on Code-Switching. Cambridge, 259–275. Grosjean, François (2008): Studying Bilinguals. Oxford. Haspelmath, Martin (2009): Lexical borrowing: concepts and issues. In: Haspelmath/Tadmor, 35–54. Haspelmath, Martin/Uri Tadmor (Hg.) (2009): Loanwords in the World’s Languages. A Comparative Handbook. Den Haag. Haspelmath, Martin/Uri Tadmor (2009): The loanword typology project and the world loanword database. In: Haspelmath/Tadmor, 1–34. Hausmann, Dagmar (2008): „downgeloadet“ und „geforwardet“ – zur sprachlichen Integration mehrteiliger Verben. In: Sylvia Kutscher/Antje Casaretto (Hg.): Sprachkontakt synchron und diachron. Aachen, 69–91.
Besondere Wörter I: Lehnwörter, Neu-Wörter
369
Haig, Geoffrey (1996): Sprachkontakt und Sprachpurismus am Beispiel der türkisch-osmanischen Sprache. In: Andreas Harder/Jürgen Schmidt-Radefeldt (Hg.): Europäische Sprachen im Kontakt. Rostock, 59–89. Imo, Wolfgang (2013): Sprache in Interaktion. Analysemethoden und Untersuchungsfelder. Berlin u. a. Kirkness, Alan (1998): Das Phänomen des Purismus in der Geschichte des Deutschen. In: Werner Besch u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung, 2. Aufl. Berlin, 401–416. Krefeld, Thomas (2004): Einführung in die Migrationslinguistik. Tübingen. Lipczuk, Ryszard (2007): Geschichte und Gegenwart des Fremdwortpurismus in Deutschland und Polen. Frankfurt a. M. u. a. Limbach, Jutta (Hg.) (2007): Ausgewanderte Wörter. Ismaning. Matras, Yaron (1998): Utterance modifiers and universals of grammatical borrowing. In: Linguistics 36, 281–331. Munske, Horst H. (2009): Was sind eigentlich ‚hybride‘ Wortbildungen? In: Peter O. Müller (Hg.), Studien zur Fremdwortbildung, Hildesheim/Zürich/New York (Germanistische Linguistik, 197–198), 223–260. Munske, Horst H. (2010): o. k. [o'ke:] und k. o. [ka'o:]. Zur lautlichen und graphischen Integration von Anglizismen im Deutschen. In: Carmen Scherer/Anke Holler (Hg.): Strategien der Integration und Isolation nicht-nativer Einheiten und Strukturen. Berlin/New York, 31–49. Myers-Scotton, Carol (2006): Multiple Voices. An Introduction to Bilingualism. Malden (Massachusetts)/Oxford/Carlton. Polenz, Peter von (1967): Fremdwort und Lehnwort sprachwissenschaftlich betrachtet. In: Mutter sprache 77, 65–80. Polenz, Peter von (1994 ff.): Deutsche Sprachgeschichte vom Spätmittelalter bis zur Gegenwart. Bd. 1. 2. Aufl. 2000; Bd. 2: 1994; Bd. 3: 1999, Berlin/New York. Polenz, Peter von (2009): Geschichte der deutschen Sprache. 10. völlig neu bearb. Aufl. von Norbert Richard Wolf. Berlin/New York. Poplack, Shana (2012): What does the nonce borrowing hypothesis hypothesize? In: Bilingualism: Language and Cognition 15/3, 644–648. Riehl, Claudia M. (2001): Schreiben, Text und Mehrsprachigkeit. Zur Textproduktion in mehrsprachigen Gesellschaften am Beispiel der deutschsprachigen Minderheiten in Südtirol und Ostbelgien. Tübingen. Riehl, Claudia M. (2013): Mehrsprachigkeit und Sprachkontakt. In: Peter Auer (Hg.): Sprachwissenschaft. Grammatik, Interaktion, Kognition. Stuttgart, 377–404. Riehl, Claudia M. (2014): Sprachkontaktforschung. Eine Einführung. 3. Aufl. Tübingen. Siedenberg, Sven (2009): Besserwisser beim Kaffeeklatsching. Deutsche Wörter im Ausland. Ein Lexikon. München. Siekmeyer, Anne (2007): Form und Gebrauch komplexer englischer Lehnverben im Deutschen: eine empirische Untersuchung. Bochum. Stedje, Astrid (2007): Deutsche Sprache gestern und heute. Einführung in die Sprachgeschichte und Sprachkunde. 6. Aufl. München. Van Coetsem, Frans (1988): Loan Phonology and the two Transfer Types in Language Contact. Dordrecht. Wegener, Heide (2004): Pizzas und Pizzen – die Pluralformen (un)assimilierter Fremdwörter im Deutschen. In: Zeitschrift für Sprachwissenschaft 23, 47–112. Winford, Donald (2003): An Introduction to Contact Linguistics. Oxford. Wohlgemuth, Jan (2009): A Typology of Verbal Borrowing. Berlin/New York.
370
Claudia M. Riehl
Wolf, Lothar/Werner Hupka (1981): Altfranzösisch. Entstehung und Charakteristik. Eine Einführung. Darmstadt. Wurzel, Wolfgang U. (1981): Phonologie: Segmentale Struktur. In: Karl E. Heidolph u. a. (Hg.): Grundzüge einer deutschen Grammatik. Berlin, 898–990.
Thorsten Roelcke
16. Besondere Wörter II: Fachwörter, Termini Abstract: Fachtexte unterscheiden sich von Texten der Alltagskommunikation insbesondere durch ihren Wortschatz – ein Umstand, der sich in zahlreichen fachsprachlichen Persiflagen widerspiegelt. Dabei muss zwischen intra-, inter-, extra- und nichtfachlichem Wortschatz in verschiedenen Fach- und Kommunikationsbereichen (horizontale und vertikale Gliederung) unterschieden werden. Fachwörter sind durch Konvention oder Definition in ihrer Bedeutung festgelegt, wobei Definitionen zu deren Vernetzung und damit zur Konstituierung terminologischer Systeme beitragen (Terminologisierung); sie zeigen einige Charakteristika auf semantischer und grammatischer Ebene (Exaktheit, Eindeutigkeit, Metaphorik sowie Wort- und Formbildung), die eine möglichst unmissverständliche und ökonomische Kommunikation im Rahmen spezialisierter menschlicher Tätigkeitsbereiche ermöglichen. Nationale und internationale Terminologienormung, Fachlexikographie und Terminographie sowie mutter- und fremdsprachliche Fachwortdidaktik stellen zentrale Bereiche einer Angewandten Sprachwissenschaft dar, die sich der Lösung kommunikativer Probleme in der modernen Gesellschaft verschreibt. 1 2 3 4 5 6
Einleitende Bemerkungen Fachwörter und Fachwortschatz Eigenschaften von Fachwörtern Bereiche Angewandter Linguistik Abschließende Bemerkungen Literatur (in Auswahl)
1 Einleitende Bemerkungen Das „Märchen vom Rotkäppchen“ beginnt in der Fassung von Jacob und Wilhelm Grimm mit dem folgenden Absatz: Es war einmal eine kleine süße Dirne, die hatte jedermann lieb, der sie nur ansah, am allerliebsten aber ihre Großmutter, die wußte gar nicht, was sie alles dem Kinde geben sollte. Einmal schenkte sie ihm ein Käppchen von rotem Sammet, und weil ihm das so wohl stand und es nichts anders mehr tragen wollte, hieß es nur das Rotkäppchen. Eines Tages sprach seine Mutter zu ihm: „Komm, Rotkäppchen, da hast Du ein Stück Kuchen und eine Flasche Wein, bring das der Großmutter hinaus; sie ist krank und schwach und wird sich daran laben. Mach dich auf, bevor es heiß wird, und wenn du hinauskommst, so geh hübsch sittsam und lauf nicht vom Weg ab, sonst fällst du und zerbrichst das Glas, und die Großmutter hat nichts. Und wenn du in ihre Stube kommst, so vergiß nicht guten Morgen zu sagen, und guck nicht erst in alle Ecken herum. (Grimm nach Ritz 2006, 19)
372
Thorsten Roelcke
Diese Sätze sind in der deutschen Sprachgemeinschaft nahezu Allgemeingut und so bekannt, dass sie wiederholt Gegenstand von fachsprachlichen Persiflagen wurden. So nimmt sich der erste Absatz von einem „Rotkäppchen auf Amtsdeutsch“ aus der Feder Thaddäus Trolls etwa wie folgt aus: Im Kinderanfall unserer Stadtgemeinde ist eine hierorts wohnhafte, noch unbeschulte Minderjährige aktenkundig, welche durch ihre unübliche Kopfbekleidung gewohnheitsrechtlich Rotkäppchen genannt zu werden pflegt. Der Mutter besagter R. wurde seitens ihrer Mutter ein Schreiben zustellig gemacht, in welchem dieselbe Mitteilung ihrer Krankheit und Pflegebedürftigkeit machte, worauf die Mutter der R. dieser die Auflage machte, der Großmutter eine Sendung von Nahrungs- und Genußmitteln zu Genesungszwecken zuzustellen. (Troll nach Ritz 2006, 141)
Trolls Persiflage zeigt im Vergleich mit dem Original zahlreiche sprachliche Auffälligkeiten, die für den Gebrauch des Deutschen in Institutionen als mehr oder weniger charakteristisch gelten dürfen (die Kunst der Persiflage besteht ja in der Übertreibung von Typischem). Hierzu zählen unter anderem: ein hypotaktischer Satzbau, einige Passivkonstruktionen oder typische Wortbildungen wie Minderjährige, zustellig und Sendung. Fachliche Kommunikation zeichnet sich neben solchen Auffälligkeiten durch zahlreiche weitere Besonderheiten auf den Ebenen der Grammatik oder des Textes sowie insbesondere durch einen spezifischen Wortschatz aus (vgl. zur Übersicht: Baßler 2002; Fraas 1998; Hoffmann 1985, 72–242; Hoffmann/Kalverkämper/Wiegand 1998, 408–442; Roelcke 2010, 55–112). Oft wird ein solcher Fachwortschatz sogar als das konstitutive Merkmal der Sprache in Wissenschaft, Technik oder Institutionen überhaupt angesehen. Dies einmal dahingestellt, bleibt sicher unbestritten, dass Fachwörter oder Termini innerhalb der fachlichen Kommunikation eine zentrale Rolle spielen und ihnen daher im Gesamtwortschatz einer Einzelsprache eine nicht zu unterschätzende Bedeutung zukommt. Vor diesem Hintergrund wird in dem vorliegenden Handbuchbeitrag zunächst geklärt, was Fachwörter bzw. Termini eigentlich sind und wie der Fachwortschatz des Deutschen gegliedert werden kann. Im Anschluss hieran wird gezeigt, wie Fachwörter gebildet und eingeführt werden und durch welche weiteren Merkmale sie sich auszeichnen. In weiteren Abschnitten werden mit Terminologienormung, Fachlexikographie sowie Didaktik fachsprachlicher Lexik drei wichtige Anwendungsbereiche skizziert. Mit einigen abschließenden Bemerkungen zum Stand der Forschung endet der Beitrag.
Besondere Wörter II: Fachwörter, Termini
373
2 Fachwörter und Fachwortschatz In einem vorwissenschaftlichen Verständnis herrscht innerhalb unserer Sprachgemeinschaft weitgehend Einigkeit darüber, welche Wörter als Fachwörter zu gelten haben und welche nicht. Bei näherem Hinsehen ergeben sich hier allerdings rasch einige Schwierigkeiten: So werden Fachwörter des Öfteren mit Fremdwörtern gleichgesetzt (Roelcke 2010); bisweilen bestehen konzeptionelle Probleme bei der Definition von Fach (Kretzenbacher 2002) oder bei der Abgrenzung zwischen Wort und Begriff. Gliederungen von Fachwortschatz als solchem sind im Weiteren selten – meist erfolgen sie im Rahmen von Klassifikationen oder Typologien von Fachsprachen im Ganzen.
2.1 Bestimmung von Fachwort und Fachwortschatz Wird unter einem Fach ein spezialisierter menschlicher Tätigkeitsbereich und unter einem Wort eine kleinste bedeutungstragende und syntaktisch frei verwendbare sprachliche Einheit verstanden (beide Bestimmungen sollen an dieser Stelle nicht weiter problematisiert werden; vgl. dazu Haß/Storjohann 2015), ist ein Fachwort (oder auch synonym: Terminus) nach Roelcke (2010, 55) wie folgt zu definieren: Ein Fachwort (ein Terminus) ist die kleinste bedeutungstragende und syntaktisch frei verwendbare sprachliche Einheit der Kommunikation in einem spezialisierten menschlichen Tätigkeitsbereich.
Die Definition von Fachwortschatz bzw. Terminologie lautet in Entsprechung hierzu: Ein Fachwortschatz (eine Terminologie) ist die Gesamtheit der kleinsten bedeutungstragenden und syntaktisch frei verwendbaren sprachlichen Einheiten der Kommunikation in einem spezialisierten menschlichen Tätigkeitsbereich.
Mit diesen beiden Definitionen werden sämtliche Wörter erfasst, die im Rahmen der Kommunikation bzw. innerhalb der mündlichen oder schriftlichen Texte eines Faches erscheinen. Dabei ist jedoch nur ein Teil dieser Wörter für das betreffende Fach spezifisch, im Gegenteil: deren überwiegende Zahl findet sich auch in Texten anderer Fächer oder sogar solchen des Alltags. Dies macht nun eine Differenzierung erforderlich, welche die fachliche Zugehörigkeit der einzelnen Fachwörter berücksichtigt und dabei zwischen Fachtextwortschatz (Wort-Tokens in sprachlichen Äußerungen) einerseits und Fachsprachwortschatz (Wort-Types sprachlicher Systeme oder Kompetenzen) andererseits unterscheidet (vgl. Abb. 1):
374
Thorsten Roelcke
fachbezogener Fachtextwortschatz im engeren Sinne intrafachlicher Fachsprachwortschatz
fachbezogener Fachtextwortschatz im weiteren Sinne
fächerbezogener Fachtextwortschatz
gesamter Fachtextwortschatz
interfachlicher Fachsprachwortschatz
extrafachlicher Fachsprachwortschatz
nichtfachlicher Fachsprachwortschatz
Abb. 1: Gliederung von Fachwortschatz (Roelcke 2010, 56).
– Der intrafachliche Fachwortschatz wird gebildet von fachspezifischen Fachwörtern, die (nahezu) allein in den Texten eines bestimmten Faches Verwendung finden (im Bereich der Biologie sind dies zum Beispiel Biozönose, Chlorophyll oder Cytologie). – Der interfachliche Fachwortschatz besteht aus Fachwörtern, die nicht spezifisch für bestimmte Fächer sind, sondern wiederholt in Texten verschiedener Fächer verwendet werden (hierzu gehören unter anderem System, Evaluation oder ethisch). – Der extrafachliche Fachwortschatz besteht aus solchen Fachwörtern, die in Texten eines bestimmten Fachs erscheinen, jedoch spezifisch für andere Fächer sind (etwa juristische Termini in einem biologischen Text zu Ökosystemen). – Der nichtfachliche Fachwortschatz schließlich beinhaltet all diejenigen Wörter, die in fachlichen Texten in Erscheinung treten, dabei jedoch nicht als fachbezogen zu gelten haben (zum Beispiel Hilfsverben, Konjunktionen, Artikel usw.). Die moderne Terminologielehre und Terminologienormung sind im Allgemeinen einem realistischen Sprachverständnis verpflichtet. Hierbei wird die Existenz von Begriffen als außersprachlichen oder zumindest außereinzelsprachlichen kognitiven Entitäten vorausgesetzt, die durch Fachwörter bzw. Termini einer oder mehrerer Sprachen repräsentiert werden. Diese Sprachkonzeption steht im Widerspruch zu solchen der modernen Linguistik, die einer nominalistischen Grundhaltung verpflichtet sind und somit die Existenz von Begriffen allein in Verbindung mit oder in Abhängigkeit von Wörtern annehmen. Vor diesem Hintergrund haben sich in der Fachsprachenlinguistik die folgenden Bestimmungen bewährt:
Besondere Wörter II: Fachwörter, Termini
Ausdruck
=
Bedeutung = Wort = Begriff
=
375
formale (lautliche oder schriftliche) Seite eines (lexikalischen) Zeichens; funktionale (inhaltliche) Seite eines (lexikalischen) Zeichens; lexikalisches Zeichen als Einheit aus Ausdruck und Bedeutung mit Fokussierung der Ausdrucksseite; lexikalisches Zeichen als Einheit aus Ausdruck und Bedeutung mit Fokussierung der Bedeutungsseite.
Ein weiteres Abgrenzungsproblem besteht hinsichtlich der Bezeichnungen Terminologie einerseits und Nomenklatur andererseits: Während eine Terminologie im Allgemeinen als abstrakter Fachwortschatz aufgefasst wird (etwa eines philosophischen oder soziologischen Systems), bezieht sich eine Nomenklatur auf konkrete fachliche Einheiten (so zum Beispiel die chemischen Elemente oder die Anatomie des menschlichen Körpers). Bei einer Verbindung der beiden Termini im Rahmen eines gemeinsamen Fachwortschatzes wird die unterste Ebene einer Terminologie als deren Nomenklatur ausgewiesen (etwa im Rahmen zoologischer oder botanischer Klassifikationen).
2.2 Horizontale und vertikale Gliederung Ganz offensichtlich gibt es nicht die eine Fachsprache des Deutschen, sondern viele verschiedene Fachsprachen, die sich jeweils durch einen eigenen intrafachlichen Wortschatz auszeichnen. In der Fachsprachenforschung wurden daher zahlreiche Gliederungen von Fachsprachen vorgeschlagen, die sich unter anderem auch auf deren Wortschatz beziehen und sich in konzeptioneller wie pragmatischer Hinsicht jeweils mehr oder weniger bewährt haben. Dabei sind horizontale Gliederungen nach verschiedenen Fächern und Fachbereichen sowie vertikale Gliederungen nach kommunikativen Ebenen oder Bereichen innerhalb eines Faches zu unterscheiden, bei denen es sich jeweils nicht um grenzfeste Gliederungen, sondern vielmehr um „gleitende Skalen“ (Kalverkämper 1990, 110–125) oder „komplementäre Spektren“ (Göpferich 1995, 23–31) handelt. Die intrafachlichen Wortschätze verschiedener Fächer unterscheiden sich im Hinblick auf die diversen Gegenstandsbereiche, mit denen es die betreffenden spezifischen Tätigkeitsbereiche jeweils zu tun haben. In Anlehnung an Steger (1988) können dabei zunächst drei solche horizontale Bereiche angesetzt wer-den: – Wissenschaft: Wortschatz der Kommunikation anlässlich empirischer Experimente und theoretischer Reflexion; – Technik: Wortschatz der Kommunikation im Rahmen des zweckgerichteten Einsatzes von Gerätschaften; – Institutionen: Wortschatz der Kommunikation innerhalb von öffentlichen oder nichtöffentlichen Organisationen.
376
Thorsten Roelcke
Differenzierungen sind hier möglich und durchaus sinnvoll. Im Falle der Wissenschaftssprache ist etwa an den Wortschatz der Theoretischen und Angewandten oder an denjenigen der Natur- und Geisteswissenschaften (Dilthey 1910) zu denken. Darüber hinaus sind die drei genannten Bereiche um zwei weitere zu ergänzen (vgl. Kalverkämper 1988): – Wirtschaft: Wortschatz der Kommunikation in den ökonomischen Tätigkeitsfeldern des Handels und des Verkehrs; – Konsum: Wortschatz der Kommunikation zwischen den Anbietern und den Verbrauchern eines Produkts sowie unter den Verbrauchern selbst. Diese Gliederung kann indessen keine Vollständigkeit beanspruchen (es fehlt zum Beispiel der Wortschatz im Bereich der Neuen Medien) und unterscheidet bisweilen verschiedene vertikale Kommunikationsebenen ein und desselben Faches (insbesondere mit dem Wortschatz der Wirtschaft und demjenigen des Konsums). Eine linguistisch unvorbelastete Alternative zu dieser oder vergleichbaren horizontalen Gliederungen besteht in derjenigen nach drei bzw. vier Wirtschaftssektoren (Roelcke 2014b): – Wortschatz des primären Sektors (Gewinnung von Rohstoffen): Jagd, Forstwirtschaft, Ackerbau, Viehzucht usw. (sog. Urproduktion); – Wortschatz des sekundären Sektors (Verarbeitung von Rohstoffen): Handwerk, Industrie, Energie- und Wasserversorgung, Baugewerbe usw.; – Wortschatz des tertiären Sektors (Dienstleistung am Menschen): Handel, Verkehr, Banken, Versicherungen, öffentliche Haushalte usw.; – Wortschatz des quartären Sektors (Verarbeitung von Informationen): Kommunikationstechnologie, Beratungswesen, Bildung und Erziehung usw. Neben horizontalen Gliederungen verschiedener Fachsprachen, die auch und gerade Unterschiede in deren Wortschatz berücksichtigen, liegen diverse vertikale Gliederungen fachlicher Kommunikationsebenen oder -bereiche vor, die ebenfalls mehr oder weniger stark Bezug auf fachsprachliche Lexik nehmen. Die wohl bekannteste und einflussreichste dieser Einteilungen stammt von Hoffmann (21985, 64–70), der fünf Abstraktionsstufen unterscheidet und nach semiotischen wie kommunikativen Merkmalen charakterisiert (vgl. Tab. 1).
Besondere Wörter II: Fachwörter, Termini
377
Tab. 1: Fachsprachliche Abstraktionsstufen nach Hoffmann (1985, 64–70) Abstraktionsstufen
semiotische Merkmale
kommunikative Merkmale
„Sprache der theoretischen Grundlagenwissenschaften“
Künstliche Symbole für Elemente und Relationen
Wissenschaftler unter sich
„Sprache der experimentellen Wissenschaften“
Künstliche Symbole für Elemente, natürliche Sprache für Relationen (Syntax)
Wissenschaftler oder Techniker unter sich, wissenschaftlichtechnische Hilfskräfte
„Sprache der angewandten Wissenschaften und der Technik“
Natürliche Sprache mit einem sehr hohen Anteil an Terminologie und einer streng determinierten Syntax
Wissenschaftler bzw. Techniker und Leiter der materiellen Produktion
„Sprache der materiellen Produktion“
Natürliche Sprache mit einem hohen Anteil an Terminologie und einer relativ ungebundenen Syntax
Leiter der materiellen Produktion und Meister bzw. Facharbeiter
„Sprache der Konsumtion“
Natürliche Sprache mit einigen Termini und ungebundener Syntax
Vertreter der materiellen Produktion, Vertreter des Handels und Konsumenten
An dieser Stelle sind insbesondere die semiotischen Merkmale der einzelnen Abstraktionsstufen von Interesse: So zeichnet sich die unterste Stufe durch eine geringe Zahl an fachlichen und eine entsprechend hohe Zahl an nichtfachlichen Wörtern aus. Die beiden nächst höheren Stufen sind demgegenüber durch eine höhere und hohe Anzahl fachlicher Wörter gekennzeichnet. Auf den beiden oberen Stufen werden diese Wörter schließlich (partiell) durch künstliche Symbole ersetzt. Die vertikale Gliederung Hoffmanns ist an der Fachkommunikation in Naturwissenschaft und Technik orientiert und lässt dabei andere horizontale Bereiche mehr oder weniger außer Acht. Da davon auszugehen ist, dass jedes einzelne Fach spezifische Kommunikationsbereiche aufweist, die nicht in einer allgemeinen Klassifikation zusammengefasst werden können, ist es naheliegend eine Typologie zu entwerfen, die als heuristische Grundlage der Ermittlung jeder beliebigen vertikalen Gliederung dienen kann (vgl. Roelcke 2014b). Dabei werden zwei verschiedene Fächer (Fach 1 und Fach 2) sowie ein eher theoretisch-abstrakter Kommunikationsbereich (Bereich T), ein eher angewandt-konkreter Kommunikationsbereich (Bereich A) und ein sachlicher Kommunikationsbereich ohne echte fachliche Spezialisierung (Bereich L) angesetzt (vgl. Abb. 2). Hiernach können dann fünf Typen fachlicher Kommunikation unterschieden werden, die in jedem Einzelfall auf ihre fachlexikalischen Besonderheiten hin zu untersuchen sind:
378
Thorsten Roelcke
Typ 1: Typ 2: Typ 3:
Typ 4:
Typ 5:
Kommunikation unter Experten ein und desselben Faches (etwa Kommunikation unter Meteorologen des Deutschen Wetterdienstes in Offenbach); Kommunikation unter Laien in einem bestimmten Sachbereich (Gespräch in einem Lehrerkollegium über die Wetteraussichten für eine geplante Skifreizeit); Kommunikation zwischen Experten verschiedener Ebenen oder Bereiche eines bestimmten Faches (Austausch zwischen dem Deutschen Wetterdienst in Offenbach und diversen nationalen Wetterstationen); Kommunikation zwischen Experten eines bestimmten Faches und Laien im entsprechenden Sachbereich (Schneeprognose eines Experten des Deutschen Wetterdienstes anlässlich der Planungen für eine Skifreizeit); Kommunikation zwischen Experten eines Faches und Experten eines anderen Faches (Kommunikation zwischen Meteorologen des Wetterdienstes sowie Messtechnikern oder EDV-Spezialisten).
Fach 1 Bereich T
Experte
1
Fach 2 5
Experte
Experte
3 Bereich A
Bereich L
Experte 4 Laie
2
Laie
Abb. 2: Vertikale Typen fachlicher Kommunikation (Roelcke 2014b)
3 Eigenschaften von Fachwörtern Während der extrafachliche Wortschatz als sog. Bildungswortschatz mehr oder weniger als Konvention zutage tritt und somit meist keiner genauen Bestimmung bedarf, wird der intrafachliche Wortschatz in der Regel anhand von Definitionen verschiedener Art eingeführt und festgelegt. Da die Verständlichkeit fachlicher Kommunikation in starkem Maße von der Unmissverständlichkeit des Fachwortschatzes abhängig gemacht wird, werden Fachwörter mit einer ganzen Reihe weiterer Eigenschaften wie zum Beispiel Exaktheit, Eindeutigkeit oder (fehlender) Metaphorik in Verbindung gebracht.
Besondere Wörter II: Fachwörter, Termini
379
3.1 Definitionen und Terminologisierung Die klassische, sog. aristotelische Definition besteht aus drei bzw. vier Teilen (vgl. Abb. 3). Es sind dies das Definiendum als das zu definierende Element (in diesem Falle also Phonem), das Definiens als das definierende Element (hier die Bedeutungsangabe die kleinste sprachliche Einheit mit bedeutungsunterscheidender Funktion) und der Definitor, welcher das Definiens dem Definiendum zuordnet (ist); das Definiens selbst gliedert sich dabei in die Angabe einer Gattung (das Genus proximum die kleinste sprachliche Einheit) und die Angabe von artunterscheidenden Merkmalen (die Differentia specifica mit bedeutungsunterscheidender Funktion). Ein Phonem
ist
die kleinste sprachliche Einheit
mit bedeutungsunterscheidender Funktion.
Definiendum
Definitor
Genus proximum
Differentia specifica
Definiens Abb. 3: Aufbau einer klassischen, aristotelischen Definition
Klassische Definitionen erscheinen in Texten aus Wissenschaft, Technik und Institutionen immer wieder defizitär, wobei einige Fehlertypen unterschieden werden können: – Zirkeldefinitionen: Das Definiendum wird im Definiens selbst genannt (zum Beispiel: Ein Phonem ist ein Phonem mit bedeutungsunterscheidender Funktion). – Echte Verneinungen, die lediglich andere Bedeutungen ausschließen (etwa: Ein Phonem ist keine sprachliche Einheit mit bedeutungstragender Funktion). – Definitionen mit zu eng gefasstem Definiens (Ein Phonem ist ein Vokal mit bedeutungsunterscheidender Funktion). – Definitionen mit zu weit gefasstem Definiens (Ein Phonem ist eine sprachliche Einheit mit bedeutungsunterscheidender Funktion). Neben dem Typ der klassischen Definition ist eine Reihe an weiteren Definitionsarten bekannt, die sich jeweils durch eine eigene Ausgestaltung des Definiens auszeichnen. Hierzu zählen: – Explikative Definition: Das Definiens enthält eine Reihe an Merkmalen, ohne dass Genus proximum und Differentia specifica eigens genannt werden (zum Beispiel: Ein Phonem wird durch Minimalpaaranalyse und Kommutationstest ermittelt und hat eine bedeutungsunterscheidende Funktion). – Exemplarische Definition durch die Angabe (möglichst guter, prototypischer) Beispiele (Phoneme sind etwa/p/,/t/,/k/,/a/,/e/und /i/). – Genetische oder operationale Definition: Hier wird die Art und Weise angegeben, wie das zu Definierende entsteht oder hergestellt wird (Phoneme werden durch Minimalpaaranalyse und Kommutationstest ermittelt).
380
Thorsten Roelcke
– Synonymische Definition unter Angabe eines bekannten und bedeutungsgleichen Wortes (so zum Beispiel: Phonemik ist Phonologie). Definitionen dienen nicht allein der Einführung und Festlegung fachspezifischer Bedeutungen (Terminologisierung im engeren Sinne). Der Gebrauch von Definitionen trägt darüber hinaus dazu bei, einzelne Fachwörter miteinander zu vernetzen und somit ein terminologisches System zu konstituieren (Terminologisierung im weiteren Sinne). Dies lässt sich anhand der Definitionen einer terminologischen Grundsatznorm des Deutschen Instituts für Normung e. V. (DIN) zur sog. Begriffstheorie leicht zeigen (vgl. Roelcke 2012; 2013a, 1–35): Das begriffstheoretische terminologische System (vgl. Abb. 4) ist weitgehend hierarchisch und binär strukturiert, indem (mit Ausnahme des Fachwortes Definition und der Termini der untersten Ebene) jedem Terminus zwei weitere Termini untergeordnet sind (im Falle des Terminus Benennung etwa die Termini Einwortbenennung und Mehrwortbenennung). Dieses hierarchische Verhältnis wird durch die Definitionen der Termini konstituiert. So lautet das Definiens von Benennung: „Aus einem Wort oder mehreren Wörtern bestehende Bezeichnung“. Im Falle von Einwortbenennung und Mehrwortbenennung lauten die Angaben: „Eine aus einem Wort bestehende Benennung“ sowie „Eine Benennung, die aus mindestens zwei durch Leerstellen getrennten Wörtern besteht“. Es zeigt sich, dass hier die Termini einer bestimmten Ebene des Systems als Genera proxima in den Definitionen der Termini auf der nächst unteren Ebene in Erscheinung treten (vgl. dazu auch die schematisch aufgearbeiteten Definitionen in Abb. 5).
Begriff
Definition
Benennung
Einwortbenennung
übergeordneter Begriff
Mehrwortbenennung
untergeordneter Begriff
Oberbegriff
Unterbegriff Verbandsbegriff
Abb. 4: Terminologisches System in Abschnitt 2 von DIN 2330 (1993), 2
Teilbegriff
Besondere Wörter II: Fachwörter, Termini
Definiendum
381
Definiens Genus proximum
Differentia specifica
1
Begriff
Denkeinheit
die aus einer Menge von Gegenständen unter Ermittlung der diesen Gegenständen gemeinsamen Eigenschaften mittels Abstraktion gebildet wird
2
Benennung
Bezeichnung
Aus einem Wort oder mehreren Wörtern bestehende [Bezeichnung]
3
Definition
Begriffsbestimmung
mit sprachlichen Mitteln
4
Einwortbenennung
Benennung
Aus einem Wort bestehende [Benennung]
5
Mehrwortbenennung
[Eine] Benennung
die aus mindestens zwei durch Leerstellen getrennten Wörtern besteht
6
Oberbegriff
Übergeordneter Begriff
innerhalb eines hierarchischen Begriffssystems, das durch Abstraktionsbeziehungen gekennzeichnet ist
7
Teilbegriff
Untergeordneter Begriff
innerhalb eines hierarchischen Begriffssystems, das durch Bestandsbeziehungen gekennzeichnet ist
8
übergeordneter Begriff
Begriff
innerhalb eines hierarchischen Begriffssystems, der auf einer anderen, höheren Hierarchiestufe mehrere Begriffe zusammenfaßt
9
Unterbegriff
Untergeordneter Begriff
innerhalb eines hierarchischen Begriffssystems, das durch Abstraktionsbeziehungen gekennzeichnet ist
10 untergeordneter Begriff
Begriff
innerhalb eines hierarchischen Begriffssystems, der auf einer anderen, niedereren Hierarchiestufe sich beim Unterteilen eines Begriffs ergibt
11 Verbandsbegriff
Übergeordneter Begriff
innerhalb eines hierarchischen Begriffssystems, das durch Bestandsbeziehungen gekennzeichnet ist
Abb. 5: Definitionen in Abschnitt 2 von DIN 2330 (1993), 2 (schematische Darstellung)
Das Beispiel zeigt ein weiteres Phänomen der Konstituierung terminologischer Systeme (vgl. Roelcke 2014a): Die Reihenfolge, in der die einzelnen Termini in der betreffenden Textpassage der DIN-Norm eingeführt werden, ist nicht beliebig. Sie folgt deren alphabetischer Reihenfolge (vgl. die Ziffern in Abb. 5), auch wenn dies angesichts des terminologischen Systems selbst zu Sprüngen führt (vgl. die Ziffern in Abb. 4). Neben dieser (für normierende Texte sicher nicht unüblichen) alphabetischen Reihenfolge von Definitionen sind in anderen Texten mit einer systematischen
382
Thorsten Roelcke
oder einer diskursiven Einführung terminologischer Systeme weitere Typen der Linearisierung zu beobachten. Es sind somit zu unterscheiden: – Alphabetische Linearisierung: Die Termini werden innerhalb eines Fachtextes in ihrer alphabetischen Reihenfolge eingeführt und bestimmt (bzw. definiert). – Systematische Linearisierung: Die Termini werden innerhalb eines Fachtextes entlang des terminologischen Systems (im Falle einer Hierarchie etwa von oben nach unten) eingeführt und bestimmt. – Diskursive Linearisierung: Die Termini werden innerhalb eines Fachtextes nach dessen argumentativem Aufbau eingeführt und bestimmt.
3.2 Semantik und Grammatik Über ihre Definiertheit und Vernetzung hinaus werden mit Fachwörtern einige weitere Merkmale verbunden, die letztlich die fachliche Kommunikation unterstützen sollen. Hierzu zählen insbesondere die semantischen Postulate der Exaktheit, der Eindeutigkeit und des Mangels an Metaphorik sowie einige grammatische Spezifika wie der Gebrauch zahlreicher Komposita und Kurzwörter oder spezifischer Pluralformen.
3.2.1 Exaktheit, Eindeutigkeit und Metaphorik Die semantischen Postulate gehen zurück auf grundsätzliche Überlegungen der allgemeinen Terminologielehre in der Tradition Wüsters (1931/1970; vgl. Arntz/Picht/ Mayer 2009) und gründen in der Hoffnung, durch eine geeignete Gestaltung von fachsprachlichen Systemen die Kommunikation in den betreffenden Fächern zu erleichtern bzw. deren Unmissverständlichkeit zu ermöglichen; aus Sicht der fachsprachenlinguistischer Sicht bedürfen sie indessen einer kritischen bzw. differenzierten Einschätzung (Roelcke 2004). Die Exaktheit eines Fachworts ergibt sich aus dessen sprachlicher Definition. Da eine solche Definition in dem Kontext eines bestimmten spezialisierten Tätigkeitsbereichs erfolgt und dabei hinsichtlich der Fachwörter am Rande des betreffenden terminologischen Systems an die alltägliche Sprache rückgebunden bleibt, besteht diese Exaktheit nur relativ. So steht die Definition des Terminus Benennung (vgl. hier 3.1) im begriffsrealistischen Kontext der nationalen deutschen Terminologienormung (und nicht etwa im nominalistischen der Fachsprachenlinguistik) und greift dabei auf die alltagssprachliche Bedeutung des Wortes Bezeichnung, das in diesem Falle als Genus proximum erscheint, zurück. Vor diesem Hintergrund ist hier also lediglich von einer relativen und nicht von einer absoluten Exaktheit von Fachwörtern auszugehen (anders verhält es sich bei mathematischen oder logischen Definitionen). Im Unterschied zur Exaktheit besteht die Eindeutigkeit von Fachwörtern nicht in der Art, sondern in der Zahl ihrer Definitionen. Dabei wird im Allgemeinen davon
Besondere Wörter II: Fachwörter, Termini
383
ausgegangen, dass Termini jeweils genau eine Bedeutung tragen. In einer erweiterten Fassung dieses Postulats wird die Vermeidung von Polysemie um die Vermeidung von Synonymie ergänzt, sodass hier von einem Eineindeutigkeitspostulat der lexikalischen Fachsprachensemantik (Roelcke 1991) zu sprechen ist. Doch ist auch dieses Postulat zu relativieren, da zahlreiche Termini auf Systemebene mehrere verschiedene Bedeutungen tragen, die in ihrem spezifischen Gebrauchskontext durchaus eindeutig zu erkennen sind. Diese systematische Mehrdeutigkeit zeigt das Beispiel des Ausdrucks Wurzel, der von der alltagsnahen Bedeutung ausgehend in mindestens drei fachsprachlichen und im entsprechenden Kontext zu bestimmenden Bedeutungen erscheint: 1) neben Sprossachse und Blatt eines der drei Grundorgane der Sprosspflanzen, das die Pflanze im Boden verankert und ihr Wasser mit Nährstoffen zuleitet; 2) n-te W. aus einer nichtnegativen reellen Zahl a ist diejenige nichtnegative reelle Zahl w, deren n-te Potenz gleich a ist; man schreibt w = n√a oder w = a1/n; 3) der einer ganzen Wortfamilie gemeinsame Wortteil, an dem die Grundbedeutung haftet, z. B. geb-en, Gab-e, er-gieb-ig, Gif-t. (Der Große Brockhaus in einem Band 2002, 999)
Dieses Beispiel führt zu einem weiteren Postulat: Die traditionelle Terminologielehre ist noch immer durch ein sog. Metaphern-Tabu gekennzeichnet. Der Anspruch auf Anonymität bzw. Objektivität fachlicher Erkenntnisse bzw. Darstellungen führt dazu, dass die Nennung des Autors (in der ersten Person), der Gebrauch des Präteritums (als Tempus bzw. Modus des Erzählens) und die Bildung von Metaphern als bildhaften Umschreibungen als Verstoß gegen wissenschaftliche Stilideale angesehen werden. Angesichts zahlreicher fachsprachlicher Metaphern setzt sich demgegenüber in der modernen Fachsprachenlinguistik die Auffassung durch, dass die übertragene Verwendung von Wörtern ein wesentliches Verfahren darstellt, neue lexikalische Bedeutungen an bekannte (alltägliche oder fachliche) Bedeutungen anzuschließen und auf diese Weise neue fachliche Bereiche sprachlich zu erschließen (vgl. bereits Weinrich 1989 oder Kretzenbacher 1994). Bekannte Beispiele für dieses Verfahren finden sich etwa im Bereich der Elektronik. Grundbegriffe dieses forschungsgeschichtlich verhältnismäßig jungen Teilfachs der Physik werden hier wiederholt metaphorisch durch Ausdrücke der Alltagserfahrung und solche der klassischen Mechanik an den sprachlichen Diskurs angeschlossen – etwa dann, wenn Strom durch eine Leitung fließt oder es anlässlich einer raschen Entladung von Spannung einen Schlag gibt.
3.2.2 Wort- und Formbildung Die Fachsprachen des Deutschen kennen (so gut wie) keine eigenen grammatischen Regeln, die sie von denjenigen der Standardsprache unterscheiden. Dennoch zeigen Wort- und Formbildung fachlicher Texte gegenüber denjenigen der alltäglichen
384
Thorsten Roelcke
Sprache oftmals eine eigene Charakteristik. Solche grammatischen Besonderheiten fachlicher Lexik sind jedoch meist nicht strukturell-qualitativer, sondern pragmatisch-quantitativer Natur. – Aus dem Bereich der Wortbildung sind dabei insbesondere zu nennen (vgl. im Weiteren Roelcke 2010, 78–90): – Eine erhöhte Anzahl an (zweigliedrigen) Komposita wie zum Beispiel Teilchenphysik, Raumfahrt oder Steuerbescheid; – Komposita mit mehreren Gliedern, etwa: Sprachwissenschaftsgeschichtsforschung, Facharztausbildung oder Einkommensteuerjahresausgleich; – Bildung von sog. Zwillingsverben wie trennschleifen oder spritzgießen oder Verben mit einem vorangestellten Substantiv wie sandstrahlen oder schockfrosten; – Substantivierungen (etwa Untersuchung aus untersuchen) mit entsprechenden Funktionsverben (zur Untersuchung kommen oder bringen) oder semantisch blassen Verben (eine Untersuchung durchführen oder anleiten); – Wortkürzungen wie Lok aus Lokomotive, Bus aus Omnibus, Krad aus Kraftrad, ADAC aus Allgemeiner Deutscher Automobilclub, DIN aus Deutsches Institut für Normung; – Konversion von Verben wie Schleifen, Trennen oder Verordnen oder von Eigennamen: Hertz, Volt, Duden, Zeppelin, Parkinson, oder Röntgen. Im Bereich der Formbildung fällt der Gebrauch fachlicher Lexik unter anderem durch die folgenden Erscheinungen auf: – Bevorzugung der 3. gegenüber der 1. Person im Zuge des sog. Ich-Tabus (Anonymisierung bzw. Objektivierung); – Dominanz des Präsens gegenüber dem Präteritum im Zuge des sog. Erzähl-Tabus; – Erhöhte Zahl an Passiv- und Reflexivkonstruktionen als weiteres Mittel der Anonymisierung bzw. Objektivierung; – Erhöhte Zahl an Genitivformen (neben anderen Attribuierungen bis hin zu Attributsätzen); – Spezifische Pluralformen, die in der nichtfachlichen Standardsprache unüblich sind (zum Beispiel Salze).
4 Bereiche Angewandter Linguistik Die zentrale Rolle, die Termini in der Kommunikation spezialisierter menschlicher Tätigkeitsbereiche zukommt, spiegelt sich in diversen fachwortbezogenen Ansätzen der Angewandten Linguistik wider. Verstanden als „Linguistics for problem solving“ (Knapp/Antos 2011, v) stechen hier insbesondere drei sprachwissenschaftliche Anwendungsbereiche hervor – das Problem, wie Fachwörter für einen großen Kommunikationsbereich genormt werden (Terminologienormung), das Problem, wie diese verzeichnet und beschrieben werden (Fachlexikographie), und das Problem, wie sie an Schulen und Hochschulen vermittelt werden (Fachwortdidaktik).
Besondere Wörter II: Fachwörter, Termini
385
4.1 Terminologienormung Um wissenschaftliche und technische Vorgänge in vielfältigen Zusammenhängen zu erleichtern, werden bestimmte fachliche Bereiche einer sachlichen und sprachlichen Normung auf nationaler und internationaler Ebene unterzogen. Die sprachliche Normung hat sich dabei als ein eigenständiger wissenschaftlicher Bereich etabliert, der von terminologischer Grundlagenforschung bis hin zur Gestaltung von konkreten Normvorschriften reicht (vgl. als Grundlagenwerk Wüster 1970 sowie die Übersichtsdarstellungen von Arntz/Picht/Mayer 2009; Felber/Budin 1989; Roelcke 2010, 113–127). In der (allgemeinen) Terminologielehre werden sprachkonzeptionelle und fachspezifische Grundlagen der Arbeit mit und der Normierung von Fachwörtern entwickelt und erprobt. Die (konkrete) ein- oder mehrsprachige Terminologiearbeit erfasst und beschreibt den Wortschatz einzelner Fächer (Ist-Norm) und entwickelt auf der Grundlage der Richtlinien der Terminologielehre eine optimale Terminologie (SollNorm), die im Zuge der Terminologienormung zum (mehr oder weniger) verbindlichen Ideal gemacht wird. Die sprachtheoretischen Grundlagen der allgemeinen Terminologielehre sind insbesondere durch zwei konzeptionelle Ansätze geprägt: Repräsentationsebene
Benennung
Definition
Begriff Merkmal a Merkmal b Merkmal c
Begriffsebene
Gegenstandsebene Gegenstand 1
Gegenstand 2
Gegenstand 3
Eigenschaft A Eigenschaft B Eigenschaft C Eigenschaft D
Eigenschaft A Eigenschaft B Eigenschaft C Eigenschaft E
Eigenschaft A Eigenschaft B Eigenschaft C Eigenschaft F
Zusammenhänge zwischen Gegenstand, Begriff, Definition und Benennung (am Beispiel der Inhaltsdefinition) Abb. 6: DIN 2330 (Oktober 1993), 3 [nachgezeichnet]
386
Thorsten Roelcke
– Orientierung an einem systemlinguistischen Inventarmodell: Gegenstand der Terminologielehre sind Fachwörter und Fachwortschätze auf der Ebene des sprachlichen Systems. Sie sollen durch Terminologiearbeit und -normung im Vorfeld so gestaltet werden, dass sie dann auf der Ebene des Gebrauchs möglichst keine Missverständnisse zulassen. – Orientierung an einer radikal oder relativ realistischen Begriffstheorie (vgl. Abb. 6): Es wird davon ausgegangen, dass Begriffe als mentale oder kognitive Einheiten unabhängig von Sprache überhaupt oder von einzelnen Sprachen sind, sodass diese im Zuge der Terminologiearbeit und -normung jeweils zunächst übereinzelsprachlich festgelegt werden können, um ihnen dann einzelsprachliche Ausdrücke zuzuweisen. In der Bundesrepublik Deutschland erfolgt die terminologische Normung durch das „Deutsche Institut für Normung“ (DIN) in Berlin, den „Verband deutscher Elektrotechniker“ (VDE) und einige weitere Normungsorganisationen wie den „Verein deutscher Ingenieure“ (VDI), das Bundessprachenamt oder die „Gesellschaft für Mathematik und Datenverarbeitung“ (GMD). Das Deutsche Institut für Normung ist keine Behörde, sondern ein als gemeinnützig anerkannter Verein; seine Normblätter haben daher nicht den Status von Gesetzen oder Verordnungen, sondern lediglich den von Empfehlungen, die jedoch aufgrund der breiten wirtschaftlichen und gesellschaftlichen Verankerung des DIN eine hohe Akzeptanz erfahren. In Österreich und in der Schweiz sind das Austrian Standards Institute (ASI, vormals: Österreichisches Normungsinstitut) in Wien und die Schweizerische Normenvereinigung (SNV) in Winterthur zentrale Normungsinstitutionen. Die internationale Terminologienormung wird durch die „International Organization for Standardization“ (ISO) mit Sitz in Genf koordiniert, der auch das DIN angeschlossen ist. Einen wichtigen Beitrag zur internationalen Terminologiearbeit leistet im Weiteren das „Internationale Informationszentrum für Terminologie“ (Infoterm) in Wien. Die terminologische Grundlagennormung, also die Normung der terminologischen Normung selbst erfolgt im DIN durch den Normenausschuss Terminologie (NA 105 bzw. NAT) und dessen Unterausschüsse, denen jeweils Vertreter aus Wissenschaft, Wirtschaft und Institutionen angehören. Zu den wichtigsten Normen, die vom NAT ausgearbeitet wurden und in regelmäßigen Abständen überarbeitet werden, gehören die folgenden (vgl. Herzog/Mühlbauer 22007): – DIN 2330: Begriffe und Benennungen. Allgemeine Grundsätze (Juli 2013, ersetzt die Ausgabe Dezember 1993). – DIN 2331: Begriffssysteme und ihre Darstellung (April 1980). – DIN 2332: Benennen international übereinstimmender Begriffe (Februar 1988). – Die maßgebliche ISO-Norm lautet: – ISO 869: Terminology work – Harmonization of concepts and terms (Juli 1996).
Besondere Wörter II: Fachwörter, Termini
387
4.2 Fachlexikographie Fächer mit einem umfangreichen Fachwortschatz stehen vor dem Problem, dass dieser so aufgearbeitet sein muss, dass sämtliche Informationen hierzu zugänglich sind. Diese Aufgabe kommt insbesondere fachlichen Wörterbüchern zu. Dabei schlagen sich einerseits Sprach- oder Sachbezogenheit und andererseits Deskriptivität oder Präskriptivität in deren Gestaltung nieder (vgl. auch Felber/Schaeder 1999; Roelcke 2010, 128–149; Schierholz 2003). Im Hinblick auf sprachliche oder sachliche Informationen zu einzelnen Fachwörtern sind nach Wiegand (1988, 761) drei Typen von Fachwörterbüchern zu unterscheiden: – Das fachliche Sachwörterbuch: Fachwörterbuch, aus dem primär Informationen zu nicht-sprachlichen Gegenständen des betreffenden Faches gewonnen werden können (also Lexika mit enzyklopädischen Informationen zur „Sache im Fach“). – Das fachliche Sprachwörterbuch: Fachwörterbuch, aus dem primär Informationen zu fachsprachlichen Gegenständen des betreffenden Faches gewonnen werden können (etwa Wörterbücher zur Häufigkeit von Termini oder rückläufige Wörterbücher). – Das fachliche Allbuch: Fachwörterbuch, aus dem sowohl Informationen zu fachlichen als auch zu fachsprachlichen Gegenständen des betreffenden Faches gewonnen werden können (Kombinationen aus Lexikon und Wörterbuch). In Bezug auf den deskriptiven bzw. präskriptiven Anspruch der gegebenen Informationen ist zwischen Fachlexikographie und Terminographie zu unterscheiden. Auch wenn das Verhältnis dieser beiden Disziplinen nicht endgültig geklärt ist, können sie etwa wie folgt charakterisiert werden: – Die Terminographie erhebt einen normativen Anspruch und zielt auf eine monosemierende Festlegung fachspezifischer Bedeutungen ab: Termini werden möglichst exakt und eineindeutig festgelegt; pragmatische Angaben beschränken sich auf die Nennung von entsprechenden Fächern oder Textsorten. – Die Fachlexikographie verfolgt ein deskriptives Ziel und strebt nach einer adäquaten Beschreibung fachspezifischer Bedeutungen: Dabei werden möglichst auch die Polysemie, die Synonymie und die Metaphorik von Fachwörtern erfasst und über die Nennung von entsprechenden Fächern oder Textsorten hinaus in deren sprachlichen Kotext wie sachlichen Kontext gestellt. Diese unterschiedlichen Charakteristika von terminographischen und fachlexikographischen Wörterbüchern schlagen sich letztlich in deren idealisierter Artikelstruktur nieder (vgl. Tab. 2): Während sich terminographische Werke jeweils auf die Angabe einer einzigen Bedeutung beschränken und diese um entsprechende enzyklopädische Angaben, Fachbereichs- und Textsortenangaben sowie Dokumentationsangaben ergänzen, kommen in fachlexikographischen Werken weitere Bedeutungsan-
388
Thorsten Roelcke
gaben (einschließlich entsprechender Ergänzungen) sowie Angaben zur Polysemie, Synonymie und Metaphorik zu deren Ko- und Kontextualität hinzu (zur lexikographischen Terminologie vgl. auch Haß in diesem Band). Tab. 2: Idealisierte Mikrostruktur von terminographischen und fachlexikographischen Wörter büchern; kursiv = fachlexikographische Spezifika (nach Roelcke 2010, 139) Lexikographische Angabeklassen
Lexikographische Angabeunterklassen/Auswahl)
Lemmazeichengestaltangabe
Angaben zu Aussprache und Schreibung
Formangabe
Angaben zu Form- und Wortbildung sowie Syntax
Bedeutungsangabe
Bedeutungsbeschreibung sowie Angaben zu Hyperonymie und Antonymie Angaben zu Polysemie und Synonymie
Enzyklopädische Angabe
Angaben zu Gebrauch und Verwendung sowie Herstellung und Gewinnung
Pragmatische Angabe
Angaben zum Fachbereich und zur Textsorte Angaben zu Metaphorik sowie Ko- und Kontext
Dokumentationsangabe
Angabe von Beispielen oder Belegen
Weitere Bedeutungsangabe(n)
Bedeutungsbeschreibung sowie Angaben zu Hyperonymie, Antonymie, Polysemie und Synonymie
Weitere enzyklopädische Angabe(n)
Angaben zu Gebrauch und Verwendung sowie Herstellung und Gewinnung
Weitere pragmatische Angabe(n)
Angaben zum Fachbereich und Textsorte, Angaben zu Metaphorik sowie Ko- und Kontext
Weitere Dokumentationsangabe(n)
Angabe von Beispielen oder Belegen
4.3 Fachwortdidaktik Die Kommunikation in der Bundesrepublik Deutschland ist seit dem Ende des 20. Jahrhunderts durch eine zunehmende Verwissenschaftlichung, Technisierung und Institutionalisierung der Alltagssprache bestimmt. Dies zeigt sich insbesondere am Gebrauch von zahlreichen Fachwörtern und Fachtexten unterschiedlicher Fachbereiche wie Medizin, Kraftfahrzeugtechnik oder Verwaltung (vgl. zusammenfassend von Polenz 1999, 485–503; Fluck 2000). Aufgrund zahlreicher fachlicher Entwicklungen und Vernetzungen zeigt die Fachkommunikation in Studium und Beruf selbst darüber hinaus eine weitreichende Dezentralisierung, Differenzierung und Dynamisierung.
Besondere Wörter II: Fachwörter, Termini
389
Diese Pluralität von Fachsprachen im Alltag und im Beruf und die damit verbundenen fachkommunikativen Anforderungen machen eine Vielzahl fachsprachlicher Kenntnisse (hinsichtlich Wortschatz, Grammatik und Text) sowie fachkommunikativer Kompetenzen (in pragmatischer, kognitiver und ethischer Hinsicht) jedes Einzelnen erforderlich. Vor diesem Hintergrund erweist sich eine Didaktik der Fachsprachen im Allgemeinen und eine Didaktik des Fachwortschatzes im Besonderen von einer immer größeren Bedeutung. Dies gilt für Schulen und Hochschulen wie auch für andere Bildungseinrichtungen, wobei diverse Probleme der Verortung wie der Gestaltung des fachwortbezogenen Unterrichts für Mutter- wie Zweit- oder Fremdsprachler zu lösen sind (vgl. Roelcke 2013b; Schellenberg 2011). Eine fachwortbezogene Didaktik dient letztlich der Förderung fachkommunikativer Kompetenzen, zu der eine Reflexion fachlexikalischer Phänomene einen wesentlichen Beitrag leistet. Sowohl Sprachreflexion als auch Kommunikationsförderung haben ihren Ort im Fachunterricht wie im Unterricht der Mutter- oder Fremdsprache (vgl. Abb. 7).
Sprachunterricht
Fachunterricht
Sprachreflexion
Kommunikationsförderung
Abb. 7: Eckpfeiler fachsprachenbezogener Didaktik (nach Roelcke 2013c, 337)
Sowohl der Sprachunterricht als auch der Fachunterricht tragen zu einer Förderung fachsprachlicher Kommunikation bei, indem Fachsprachen in Fachkommunikation schriftlich wie mündlich produziert und rezipiert und in diesem Rahmen gelernt werden. Dabei darf die Bedeutung des Fachunterrichts bei der Vermittlung von fachlexikalischen Kenntnissen und fachkommunikativen Kompetenzen nicht unterschätzt werden: Denn durch den authentischen Gebrauch von Fachwortschatz, wie er im Fachunterricht gefordert wird, wird die fachkommunikative Kompetenz maßgeblich gefördert. Daneben ermöglichen der Sprach- wie der Fachunterricht aber auch die Reflexion von Fachwörtern und Fachkommunikation, indem sie den Wortgebrauch und dessen Besonderheiten im eigenen Fach zum Gegenstand der Betrachtung machen. Im muttersprachlichen Unterricht kommen Beobachtungen und Überlegungen zu fachübergreifenden, allgemeinen Charakteristika hinzu; im fremdsprachlichen Unterricht ist demgegenüber Raum für sprachvergleichende Ansätze und Bemühungen.
390
Thorsten Roelcke
Sprach- und Fachunterricht stützen sich im Idealfall wechselseitig, da mit der Kommunikation in und mit der Reflexion von Fachwortschatz einzelner Sprach- und Sachfächer die Grundlage für den Erwerb einzelner wie auch allgemeiner, übergreifender fachlexikalischer Kenntnisse und fachkommunikativer Kompetenzen geschaffen wird. Einem fächerübergreifendem Unterricht zwischen Sach- und Sprachfächern sowie dem Fachunterricht in einer Fremdsprache kommt dabei eine besondere Bedeutung zu (Immersion; Bilingualer Sach/Fachunterricht; Content and Language Integrated Learning, CLIL). Im Weiteren stützen sich Kommunikationsförderung und Sprachreflexion ebenfalls wechselseitig. So bildet eine tendenziell hohe (rezeptive) Kompetenz fachsprachlicher Kommunikation sicher eine gute Basis für eine erfolgreiche Reflexion von Fachwortschatz und Fachkommunikation. Und umgekehrt mag ein reflektierter Umgang mit Fachwortschatz im Rahmen fachlicher Kommunikation zu einer Verbesserung der kommunikativen Kompetenz selbst beitragen – nicht zuletzt dann, wenn bewusst vollzogene Prozesse nach und nach verselbständigt werden (vgl. die Studie des DESI-Konsortiums 2006; Gibbons 2009). Die grundsätzlichen didaktischen Überlegungen sind durch einige methodische Gesichtspunkte zu ergänzen (vgl. Buhlmann/Fearns 2000, 81–125; Fluck 1992, 1–27; Hutchinson/Waters 1987, 79–156; Kniffka/Roelcke [im Erscheinen]): Im Hinblick auf eine Förderung produktiver (wie rezeptiver) Kompetenz ist hier insbesondere auf das so genannte Scaffolding-Modell nach Gibbons (2002; 2009) hinzuweisen, in dessen Rahmen fachkommunikative Kompetenzen sukzessive aufgebaut werden und sich dabei am kommunikativen Bedarf sowie an den strukturellen Kenntnissen und Kompetenzen der Lernenden orientieren. Im Falle der Reflexion von Fachsprachen und Fachkommunikation ist im Weiteren eine funktionale Fachsprachendidaktik zu fordern, die nicht formale Besonderheiten, sondern funktionale Anforderungen fachlicher Kommunikation zum Ausgangspunkt der Betrachtungen und Überlegungen macht. Dabei scheint nach dem gegenwärtigen Stand der Sprachdidaktik ein hoher Grad an Autonomisierung und Individualisierung des Lernprozesses von großem Vorteil zu sein – etwa im Falle von computer assisted language learning (CALL) in Verbindung mit angemessener Präsenzlehre im Rahmen von blended learning (BL).
5 Abschließende Bemerkungen Die Erforschung fachlicher Lexik stellt einen zentralen Bereich der jüngeren Fachsprachenlinguistik dar und zeigt dabei eine bemerkenswerte Vielfalt. Dies zeigt ein Abriss über die erst fünfzehnjährige Geschichte der Zeitschrift „Terminology“, der den Wandel der internationalen Fachsprachenforschung in den vergangenen Jahrzehnten widerspiegelt (Kageura/L’Homme 2008): Themen der Beiträge älterer Ausgaben bilden danach die Bildung und Definition von Termini, die theoretische Fundierung
Besondere Wörter II: Fachwörter, Termini
391
sowie die praktische Normierung und Verwaltung von terminologischen Systemen sowie die Erfassung und Beschreibung von (Fach)Begriffen. Diese Schwerpunkte bleiben auch in den jüngeren Ausgaben bestehen, werden jedoch durch Beiträge ergänzt, die eine Öffnung der „Terminology“ hin zur Korpuslinguistik, zur automatischen Sprachverarbeitung oder zu Informationswissenschaften dokumentieren. Der vorliegende Artikel fasst insbesondere klassifikatorische und systematische Aspekte von Fachwörtern und Fachwortschätzen ins Auge und greift im Weiteren Aspekte der Terminologienormung, der Fachlexikographie und der Fachwortdidaktik auf. Er gibt damit auch der Überzeugung Ausdruck, dass eine theoretisch begründete und faktisch angemessene Konzeption wie Modellierung fachsprachlicher Lexik einen wichtigen Beitrag zu einer problemorientierten Fachsprachenforschung leistet, indem sie deren zentrale Elemente und Relationen über den Einzelfall hinaus bestimmt.
6 Literatur (in Auswahl) Arntz, Reiner/Heribert Picht/Felix Mayer (2009): Einführung in die Terminologiearbeit. 6. Aufl. Hildesheim/Zürich/New York (Studien zu Sprache und Technik, 2). Baßler, Harald (2002): Definierte Wörter. Fachsprachliche Terminologie. In: Jürgen Dittmann/Claudia Schmitt (Hg.): Über Wörter – Grundkurs Linguistik. Freiburg (Rombach Grundkurs, 5), 211–231. Buhlmann, Rosemarie/Anneliese Fearns (2000): Handbuch des Fachsprachenunterrichts. 6. Aufl. Tübingen. DESI-Konsortium (2006): Unterricht und Kompetenzerwerb in Deutsch und Englisch. Zentrale Befunde der Studie Deutsch Englisch Schülerleistungen International. Frankfurt a. M. Dilthey, Wilhelm (1910): Der Aufbau der geschichtlichen Welt in den Geisteswissenschaften. 8. Aufl. Stuttgart 1992 (Gesammelte Schriften, VII). DIN 2330 (Oktober 1993): Begriffe und Benennungen; Allgemeine Grundsätze. Berlin/Wien/Zürich. Felber, Helmut/Gerhard Budin (1989): Terminologie in Theorie und Praxis. Tübingen (Forum für Fachsprachen-Forschung, 9). Felber, Helmut/Burkhard Schaeder (1999): Typologie der Fachwörterbücher. In: Hoffmann/ Kalverkämper/Wiegand, 1725–1743. Fluck, Hans-Rüdiger (1992): Didaktik der Fachsprachen. Aufgaben und Arbeitsfelder, Konzepte und Perspektiven im Sprachbereich Deutsch. Tübingen. Fluck, Hans-Rüdiger (1996): Fachsprachen. Einführung und Bibliographie 5. Aufl. Tübingen/Basel. Fluck, Hans-Rüdiger (2000): Fachsprachen: Zur Funktion, Verwendung und Beschreibung eines wichtigen Kommunikationsmittels in unserer Gesellschaft. In: Karin M. Eichhoff-Cyrus/Rudolf Hoberg (Hg.): Die deutsche Sprache zur Jahrtausendwende. Sprachkultur oder Sprachverfall? Mannheim u. a., 89–106. Fraas, Claudia (1998): Lexikalisch-semantische Eigenschaften von Fachsprachen. In: Hoffmann/ Kalverkämper/Wiegand, 428–438. Gibbons, Pauline (2002): Scaffolding Language, Scaffolding Learning. Teaching Second Language Learners in the Mainstream Classroom. Portsmouth (New Hamphire). Gibbons, Pauline (2009): English Learners, Academic Literacy, and Thinking. Portsmouth (New Hamphire).
392
Thorsten Roelcke
Göpferich, Susanne (1995): Textsorten in Naturwissenschaften und Technik. Pragmatische Typologie – Kontrastierung – Translation. Tübingen (Forum für Fachsprachen-Forschung, 27). Haß, Ulrike/Petra Storjohann (2015): Wort und Wortschatz. In: Ekkehard Felder/Andreas Gardt (Hg.): Handbuch Sprachwissen. Band 1. Berlin/Boston, 143–166. Herzog, Gottfried/Holger Mühlbauer (2007): Normen für Übersetzer und technische Autoren. 2. Aufl. Berlin/Wien/Zürich. Hoffmann, Lothar (1985): Kommunikationsmittel Fachsprache. Eine Einführung. 2. Aufl. Tübingen (Forum für Fachsprachen-Forschung, 1). Hoffmann, Lothar/Hartwig Kalverkämper/Herbert Ernst Wiegand (Hg.) (1998 f.): Fachsprachen/ Languages for Special Purposes. Ein internationales Handbuch zur Fachsprachenforschung und Terminologiewissenschaft/An International Handbook of Special-Language and Terminology Research. 2 Bde. Berlin/New York (Handbücher zur Sprach- und Kommunikationswissenschaft, 14). Hutchinson, Tom/Alan Waters (1987): English for Specific Purposes. A Learning-Centred Approach. Cambridge. Kageura, Kyo/Marie-Claude L’Homme (2008): Reflecting fifteen years of research and development in terminology. In: Terminology 14, 153–157. Kalverkämper, Hartwig (1988): Die Fachwelt in der allgemeinen einsprachigen Lexikographie (deutsch – englisch – französisch – italienisch). In: Fachsprache 10, 98–123. Kalverkämper, Hartwig (1990): Gemeinsprache und Fachsprachen – Plädoyer für eine integrierende Sichtweise. In: Gerhard Stickel (Hg.): Deutsche Gegenwartssprache. Tendenzen und Perspektiven. Berlin/New York (Institut für deutsche Sprache. Jahrbuch 1989), 88–133. Knapp, Karlfried/Gerd Antos (2011): Introduction to the handbook series. Linguistics for problem solving. In: Christopher N. Candlin/Srikant Sarangi (Hg.): Handbook of Communication in Organisations and Professions. Berlin/Boston (Handbooks of Applied Linguistics, 3), v–xv. Kniffka, Gabriele/Thorsten Roelcke [im Erscheinen]: Fachsprachenvermittlung im Unterricht. Paderborn. Kretzenbacher, Heinz Leonhard (1994): ‚Just give us the facts!‘ The connection between the narrative taboo, the ego taboo and the metaphor taboo in scientific style. In: Lingua e Stile 29, 115–130. Kretzenbacher, Heinz Leonhard (2002): Wissenschaftsbezogene Wortschätze. In: D. Alan Cruse u. a. (Hg.): Lexikologie/Lexicology. Ein internationales Handbuch zur Natur und Struktur von Wörtern und Wortschätzen/An international handbook on the nature and structure of words and vocabularies. 1. Halbbd. Berlin/New York (Handbücher zur Sprach- und Kommunikationswissenschaft, 21), 919–925. von Polenz, Peter (1999): Deutsche Sprachgeschichte. Band III: 19. und 20. Jahrhundert. Berlin/New York. Ritz, Hans (Hg.) (2006): Die Geschichte vom Rotkäppchen. Ursprünge, Analysen, Parodien eines Märchens. 14. Aufl. Kassel. Roelcke, Thorsten (1991): Das Eineindeutigkeitspostulat der lexikalischen Fachsprachensemantik. In: Zeitschrift für germanistische Linguistik 19, 194–208. Roelcke, Thorsten (2004): Stabilität statt Flexibilität? Kritische Anmerkungen zu den semantischen Grundlagen der modernen Terminologielehre. In: Inge Pohl/Klaus-Peter Konerding (Hg.): Stabilität und Flexibilität in der Semantik. Strukturelle, kognitive, pragmatische und historische Perspektiven. Frankfurt/M. (Sprache – System und Tätigkeit, 52), 137–150. Roelcke, Thorsten (2010): Fachsprachen. 3. Aufl. Berlin (Grundlagen der Germanistik, 37). Roelcke, Thorsten (2010): Woran erkennen Schülerinnen und Schüler der gymnasialen Oberstufe Fachwörter? In: Muttersprache 120, 135–148.
Besondere Wörter II: Fachwörter, Termini
393
Roelcke, Thorsten (2012): Terminologisierung in DIN 2330, Abschnitt 2. Überlegungen zur Konstitution eines terminologischen Systems in einem terminologischen Text. In: Fachsprache – International Journal of Specialized Communication 35, 65–86. Roelcke, Thorsten (2013a): Definitionen und Termini. Quantitative Studien zur Konstituierung von Fachwortschatz. Berlin/Boston (Linguistik – Impulse & Tendenzen, 48). Roelcke, Thorsten (2013b): Deutsch als Fach-Fremdsprache (DaFaF). In: Bernt Ahrenholz/Ingelore Oomen-Welke (Hg.): Deutsch als Fremdsprache. Baltmannsweiler (Deutschunterricht in Theorie und Praxis, 10), 378–388. Roelcke, Thorsten (2013c): Fachsprachendidaktik in der Hauptschule und in der Realschule – ein Weg der Ausbildungsvorbereitung? In: Christian Efing (Hg.): Ausbildungsvorbereitung im Deutschunterricht der Sekundarstufe I. Die sprachlich-kommunikativen Facetten von „Ausbildungsfähigkeit“. Frankfurt a. M. u. a. (Wissen – Kompetenz – Text, 5), 319–341. Roelcke, Thorsten (2014a): Three Ways of Terminological Linearisation. In: Glottotheory 5, 85–99. Roelcke, Thorsten (2014b): Zur Gliederung von Fachsprache und Fachkommunikation. In: Fachsprache. International Journal of Specialized Communication 37, 154–178. Schellenberg, Wilhelm (2011): Fachwortschatz. In: Inge Pohl/Winfried Ulrich (Hg.): Wortschatzarbeit. Baltmannsweiler (Deutschunterricht in Theorie und Praxis, 7), 310–319. Schierholz, Stefan J. (2003): Fachlexikographie und Terminographie. In: Zeitschrift für Angewandte Linguistik 39, 5–28. Steger, Hugo (1988): Erscheinungsformen der deutschen Sprache. Alltagssprache – Fachsprache – Standardsprache – Dialekt und andere Gliederungstermini. In: Deutsche Sprache 16, 289–319. Weinrich, Harald (1989): Formen der Wissenschaftssprache. In: Jahrbuch 1988 der Akademie der Wissenschaften zu Berlin. Berlin/New York, 119–158. Wiegand, Herbert Ernst (1988): Was eigentlich ist Fachlexikographie? In: Horst Haider Munske u. a. (Hg.): Deutscher Wortschatz. Lexikologische Studien. Ludwig Erich Schmitt zum 80. Geburtstag von seinen Marburger Schülern. Berlin/New York, 729–790. Wüster, Eugen (1970): Internationale Sprachnormung in der Technik, besonders in der Elektrotechnik. (Die nationale Sprachnormung und ihre Verallgemeinerung). 3. Aufl. Bonn (Sprachforum, Beiheft 2).
Melani Schröter
17. Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung Abstract: Wenn im öffentlich-medialen oder politischen Diskurs gesellschaftlich relevante Sachverhalte oder politische Konzepte diskutiert und Bewertungen derselben vorgenommen werden, nehmen Wörter oft eine herausragende Stellung ein, soweit sie komplexen programmatischen Gehalt, Perspektivierungen und Bewertungen bündeln. Die in Deutschland besonders etablierte und traditionsreiche Beschäftigung mit salienter Lexik und komplexer Semantik in öffentlich-politischen Diskursen hat einige Charakteristika solcher Schlag- oder Schlüsselwörter herausgearbeitet, auf die am Beginn des Beitrages eingegangen wird. Im Rahmen dieser Bemühungen wurden verschiedene Arten von Schlagwörtern unterschieden, die es hier ebenfalls zu nennen gilt. Die in der germanistischen Linguistik neuere Hinwendung zu korpuslinguistischen Analyseverfahren wird zu einem wichtigen Faktor des anhaltenden Interesses an Schlag- und Schlüsselwörtern und sollte daher neben der vorgängigen hermeneutischen Herangehensweise als methodische Annäherung an die wortbezogene Analyse öffentlich-politischer Diskurse gewürdigt werden. Es gilt ebenfalls, auch als Besonderheit der deutschsprachigen Forschung, die Vielzahl der vorliegenden lexikografischen und thematisch-diskursgeschichtlichen Dokumentationen salienter Lexik in öffentlich-politischen Diskursen zu beschreiben. Ein letzter Abschnitt widmet sich aktuellen konzeptionellen und methodischen Entwicklungen in der wortbezogenen Analyse öffentlich-politischer Diskurse. 1 Einführung 2 Charakteristika und Arten von Schlagwörtern 3 Dokumentationen von Schlagwörtern 4 Methodische Herangehensweisen an die Analyse von Schlagwörtern 5 Aktuelle Entwicklungen und Desiderata der Schlagwortforschung 6 Literatur
1 Einführung Bei dem Adjektiv grün denken die meisten wahrscheinlich zunächst an eine Farbe. Allerdings wissen wir auch, dass grüne Gentechnik, und grüner Strom nicht unmittelbar etwas mit der entsprechenden Farbqualität zu tun haben. Wenn man sich in einem großen Korpus deutscher Onlinetexte (deTenTen, ca. 2.3 Milliarden Wörter, zugänglich über Sketch Engine; Kilgarriff et al. 2014) die Verwendung von grün ansieht, dann findet man überraschenderweise Jugend nach einigen Funktionswörtern ganz oben
Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung
395
auf der Liste der Kollokatoren, d. h. der statistisch signifikant gemeinsam mit grün auftauchenden Wörter. Es handelt sich dabei nicht um eine metaphorische Verwendung im Sinne von naiv und unausgewachsen, wie in der idiomatischen Wendung ‚grün hinter den Ohren‘ und es handelt sich bei der grünen Jugend genauso wenig um eine besonders angepasste Spezies, die keine Probleme bereitet, wie im ‚grünen Bereich‘, der Unbedenklichkeit und Normalmaß signalisiert. Wenn man sich das gemeinsame Vorkommen von grün und Jugend im Textzusammenhang ansieht, kann man anhand der Kollokationen feststellen, dass es eine Politik, Delegierte, Geschäftsführerin und Mitglieder der Grünen Jugend gibt. Unser Weltwissen hilft uns dabei zu schlussfolgern, dass es sich hier um eine Organisation handelt, und zwar um die Jugendorganisation der Partei Bündnis 90/Die Grünen. Besonders die Namensgebung der den Umweltschutz in die politische Programmatik einführenden Partei mit der die Natur symbolisierenden Farbe Grün hat eine seit den siebziger Jahren manifest gewordene Bedeutungserweiterung des Adjektivs grün veranlasst, die der Duden online unter Bedeutungsaspekt 4b als „dem Umweltschutz verpflichtet, ihn fördernd“ beschreibt (vgl. Stötzel/Eitz 2002, 182ff). Hier handelt es sich um nur ein konkretes Beispiel dafür, wie die Verwendung von Wörtern im öffentlich-politischen Diskurs lexikalische Semantik beeinflusst und dazu führt, dass die so veranlasste Bedeutungserweiterung letztendlich Eingang in die lexikografische Dokumentation der Standardsprache findet. Das Adjektiv grün ist in dieser Bedeutung auch ein Schlagwort, indem es zur Bezeichnung politischer Zielsetzungen dient. Grün hat in diesem Zusammenhang eine positive Deontik (Deontik bezieht sich darauf, ob etwas sein darf oder soll – Terrorismus und Umweltverschmutzung haben eine negative Deontik, Freiheit und grün haben eine positive Deontik; sie ‚sollen sein‘). Im deutschsprachigen Raum kann das Interesse an Wörtern und Wortbedeutungen im öffentlich-politischen Diskurs auf eine lange Tradition, breites Forschungsinteresse und diverse Dokumentationen von Schlagwörtern zurückblicken. Bereits am Beginn des vergangenen Jahrhunderts erschien Ladendorfs Historisches Schlagwörterbuch (1906), seitdem kann man von einer Tradition der Schlagwortforschung sprechen, die bei Felbick (2003, 3–13) und Niehr (1993, 12–37) beschrieben wird. Inzwischen liegen zahlreiche lexikografische Dokumentationen oder wortbezogene diskursgeschichtliche Darstellungen (s. u. Abschnitt 4) zu verschiedenen historischen Epochen vor, die öffentlich-politischen Sprachgebrauch anhand von salienter Lexik nachvollziehen und beschreiben. Zudem ziehen Schlagwörter in der öffentlichpolitischen Auseinandersetzung auch regelmäßig die Aufmerksamkeit einer breiteren Öffentlichkeit auf sich, vgl. Mell in diesem Band. In der germanistischen Linguistik finden sich verschiedene Bezeichnungen für saliente Lexik im öffentlich-politischen Diskurs: Fahnenwort (Panagl 1998), Symbolwort (Girnth 2001), politische Leitvokabeln (Böke/Liedtke/Wengeler 1996), brisante Wörter (Strauß/Haß/Harras 1989), kontroverse Begriffe (Stötzel/Wengeler 1995), Schlüsselwörter (Herberg/Steffens/Tellenbach 1997), öffentliche Wörter (Diekmannshenke/Niehr 2013) u. a. m. In den entsprechenden Publikationen wird jeweils erklärt
396
Melani Schröter
bzw. für die eigene Fragestellung definiert, welche Lexeme mit welchen Merkmalen unter den jeweiligen Bezeichnungen erfasst werden. Teils überschneiden sich diese mit Schlagwörtern (Leitvokabeln, Schlüsselwörter, kontroverse Begriffe), teils handelt es sich um eine spezielle Art von Schlagwörtern, siehe dazu 2.2 weiter unten (Fahnen- und Stigmawort, Hochwertwort, Unwertwort, Symbolwort). Die Terminologie ist also nicht immer einheitlich; gemeinsam ist diesen Untersuchungen jedoch ein ähnliches Frageinteresse und eine ähnliche Vorgehensweise. Zum einen besteht das Frageinteresse in der Parteilichkeit der Wortverwendung bzw. der damit vorgenommenen Bewertungen komplexer Sachverhalte und somit der Rolle, die das Wort in der öffentlichen Debatte und politischen Auseinandersetzung spielt. Zum anderen finden wir hier stets ein grundlegendes Verständnis von Wortbedeutung vor, das diese stringent im Gebrauch der entsprechenden Lexik durch bestimmte Gruppen in bestimmten diskursiven Kontexten verortet, weswegen den Verwendungen im konkreten textuellen Umfeld besondere analytische Aufmerksamkeit zuteil wird. Trotz der oben konzedierten begrifflichen Vielfalt handelt es sich bei Schlagwort um die in diesem Zusammenhang weithin akzeptierte und gebräuchlichste Bezeichnung für saliente Lexik in öffentlich-politischen Diskursen. Auch Schlüsselwort findet sich häufig – wobei letzteres den programmatischen Gehalt stärker zu betonen scheint, ersteres stärker auf die Rolle von Lexik und Semantik in der öffentlichen Auseinandersetzung zu verweisen scheint. Aus eben diesem Grund wird hier die Bezeichnung Schlagwort bevorzugt.
2 Charakteristika und Arten von Schlagwörtern 2.1 Charakteristika von Schlagwörtern Schlagwörter sind insofern besonders auffällige und für linguistische Untersuchungen interessante sprachliche Einheiten, als sie über einen bestimmten Zeitraum hinweg in öffentlicher politischer Kommunikation häufig auftreten, mit ihnen oft ein ganzes politisches Programm kondensiert erfasst und gleichzeitig die positive oder negative Einstellung gegenüber dem bezeichneten Programm transportiert wird. Mit Hilfe von Schlagwörtern werden Programme, Ideen oder Sachverhalte verkürzt ausgedrückt. „Insofern haben Schlagwörter zunächst eine kognitive Funktion, indem sie komplexe Dinge sprachlich so vereinfachen, dass Kommunikation über sie möglich wird“ (Felbick 2003, 20). Hierin ähneln sie den Fachwörtern; vgl. Roelcke in diesem Band. Zu diesem programmatischen Gehalt und der damit einhergehenden kognitiven Erleichterung kommt allerdings auch noch der Meinungsgehalt, indem die Programme, Ideen oder Sachverhalte gleichzeitig vor dem Hintergrund einer bestimmten Zielvorstellung bewertet werden. Hierin unterscheiden sie sich von Fachwörtern. Diese bewertende Komponente trägt dazu bei, für die transportierten Einstellungen
Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung
397
Zustimmung oder Ablehnung zu erzeugen bzw. dass sie – je nach politischer Einstellung – auf Zustimmung oder Ablehnung verschiedener Personen treffen. Vor allem diese bewertende Komponente und die Komplexität der Wortbedeutung machen das Schlagwort so interessant für die Linguistik. Wie Felbick (2003) herausstellt, sind Schlagwörter Lexeme, zu denen aber auch Mehrwortlexeme gehören können (z. B. langer Marsch durch die Institutionen). Satzwertige Ausdrücke wie Losungen oder Slogans zählen nicht zu den Schlagwörtern. Schlagwörter haben teilweise eine prägnante Form, d. h. sie sind einprägsam oder griffig, etwa durch Metapher (Eiserner Vorhang) oder Alliteration (Kalter Krieg). Dies ist kein Merkmal aller Schlagwörter (Paragraph 218, Agenda 2010), kann aber ihrer Verbreitung förderlich sein. Schlagwörter zeichnen sich vor allem dadurch aus, dass sie an öffentlich-politische Diskurse und an politisch-gesellschaftlich relevante Sachverhalte gebunden sind (vgl. Gür-Şeker in diesem Band). Es werden auch weitere Merkmale angeführt (Felbick 2003, vgl. Schröter/Carius 2009) wie etwa semantischer Spielraum bzw. semantische Komplexität. Zweifellos zeichnen sich Schlagwörter durch einen besonders hohen Grad semantischer Komplexität aus, so dass z. B. Freiheit und Sicherheit parteispezifisch gebraucht und mit parteispezifischen Bedeutungen beschickt werden können (s. u. Abschnitt 2). Jedoch wird vor allem aus korpuslinguistischer Perspektive immer deutlicher, dass gebrauchs- und kontextspezifische semantische Komplexität durchaus kein Alleinstellungsmerkmal von Schlagwörtern, sondern auch für weniger brisante und weniger umstrittene Lexik breiter zu veranschlagen ist. Es erscheint daher sinnvoller, die sich aus der Diskursgebundenheit von Schlagwörtern und aus ihrem Bezug auf gesellschaftliche Relevanz ergebenden Merkmale weiter zu spezifizieren: Erstens kann man davon ausgehen, obwohl dies bisher nicht häufig gezielt empirisch untersucht und belegt wurde, dass Schlagwörter diskursspezifische Frequenzverläufe aufweisen. Teubert und Čermáková (2004) beschreiben, dass Globalisierung in den sieben Jahren zwischen 1988 und 1995 in der tageszeitung insgesamt nur 160mal vorkommt, ab dann jedoch in jedem folgenden Jahr mehr als 300mal. Storjohann/Schröter (2013) zeigen, dass sich auf lexikalischer Ebene Wandel und Verschiebung in Diskursen nachvollziehen lassen, indem sie im Rahmen von Krisendiskursen sowohl in deutschen als auch englischen Zeitungskorpora Verschiebungen in der Vorkommenshäufigkeit von der Wirtschaftskrise bzw. financial crisis im Jahr 2009 hin zur Schuldenkrise bzw. debt crisis 2011 belegen. Dies demonstriert nicht nur aus der Blickrichtung vom Diskurs hin zum Schlagwort, dass die Verwendungshäufigkeit von Schlagwörtern diskursiv determiniert ist, sondern es verweist auch aus der Blickrichtung vom Schlagwort auf den Diskurs – anhand der Gebrauchshäufigkeiten diskurszentraler Lexikalisierungen lassen sich über Zeiträume hinweg Veränderungen in Diskursen ausmachen. Zweitens kann man davon ausgehen, dass die Charakterisierung als Schlagwort von der Brisanz und Relevanz des betreffenden Diskurses abhängt. Dies wird besonders durch einen Blick auf ‚ausgeglühte‘ Schlagwörter deutlich. Stötzel und Eitz
398
Melani Schröter
(2002, 272 ff.) beschreiben Pille als Schlagwort der 50er Jahre im Rahmen eines brisanten Diskurses. Thematisiert wird Pille als damals noch neue Verhütungsmethode sowie deren Implikationen für Sexualmoral auf der einen Seite und Familienplanung und Lebensstandard auf der anderen. Im Verlauf des Diskurses wurde der negativen Deontik von Anti-Baby-Pille die positive Deontik der Wunschkindpille entgegengesetzt. Die Pille als Schlagwort lässt sich nur noch historisch nachvollziehen, heutzutage handelt es sich hierbei um die nicht kontroverse Bezeichnung für eine weithin akzeptierte und alltägliche Sache. Ähnlich verhält es sich mit Gastarbeiter, einer anfangs umstrittenen Bezeichnung (vgl. z. B. Jung/Niehr/Böke 2000, 53 ff., Stötzel/ Eitz 2002, 177 ff.) im Rahmen einer politischen Initiative mit umstrittenen Folgen, die im deutschen Migrationsdiskurs eine große Rolle spielten – der Migrationsdiskurs ist zwar noch immer brisant, aber Gastarbeiter sind jetzt Rentner, deren Kinder und Enkel sind zunehmend Deutsche, und Kontroversen mit Blick auf Migration haben sich auf andere zentrale Thematisierungen und Problematisierungen verschoben. Schlagwörter tauchen also auf, wenn es um etwas gesellschaftlich Relevantes und (somit) auch Umstrittenes geht. Dabei kann zum einen die Sache, auf die sich das Schlagwort bezieht, umstritten sein. Die einen betonen die Chancen, die anderen die Gefahren der Globalisierung; in diesem Fall wird die Sache unterschiedlich bewertet, aber mit dem Schlagwort selbst ist bisher nur gruppenspezifisch, noch nicht allgemein eine bestimmte Wertung verbunden. Es wird auch debattiert, ob Globalisierung überhaupt stattfindet bzw. ob es sich genuin um ein Phänomen des späten zwanzigsten und des einundzwanzigsten Jahrhunderts handelt oder um einen viel weiter zurückgehenden historischen Prozess. Zum anderen kann die Bedeutung eines Schlagwortes umstritten sein, wie bei dem Beispiel Freiheit. Auch wenn Freiheit von den verschiedensten Parteien und Gruppierungen positiv bewertet wird, hinsichtlich der Bewertung der Sache also keine Differenzen bestehen, können sich jedoch große Differenzen bei der Frage nach der konkreten Erscheinungsform von Freiheit ergeben bzw. bei der Frage danach, was getan werden muss, um den Zustand von Freiheit zu erreichen und zu gewährleisten (vgl. Abschnitt 3). Eine dritte Spielart der Umstrittenheit bezieht sich auf die Bezeichnung. Demnach ist es zwischen verschiedenen Gruppierungen mit verschiedenen Perspektiven auf sozial relevante Sachverhalte umstritten, mit welchem Ausdruck man sich adäquat auf ein und dieselbe Sache beziehen kann, zum Beispiel im Falle der Abtreibung mit Selbstbestimmung der Frau vs. Tötung ungeborenen Lebens. Mit der Umstrittenheit hängt auch die für das Schlagwort typische Gruppengebundenheit eng zusammen. Verschiedene Gruppen haben unterschiedliche Ansichten über die gleiche Sache, verstehen unter ein und demselben Ausdruck Verschiedenes oder favorisieren unterschiedliche Bezeichnungen für denselben Sachverhalt. Dabei verlaufen die Linien jedoch nicht immer und bei jedem Schlagwort deutlich zwischen jeweils einer Pro- und einer Contra-Partei. Drittens kann man davon ausgehen, dass die Semantik von Schlagwörtern diskursiv determiniert ist, dass sich also ihre Schlagwortbedeutung aus ihrem Gebrauch in spezifischen Diskurszusammenhängen ergibt. Dies lässt sich gut anhand der fol-
Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung
399
genden Aspekte festmachen: Zum einen tritt Schlagwortbedeutung bei den meisten Wörtern erst hinzu, wenn sich der entsprechende Diskurs abzeichnet (z. B. Pille, grün); Schlagwörter sind nur zum Teil diskursspezifische Prägungen (z. B. Gastarbeiter). Zum anderen führen diskursspezifische Gebrauchsmuster und Bezeichnungs- und Bedeutungskonkurrenz (vgl. Abschnitt 3) dazu, dass sich die Bedeutung als Schlagwort während der ,Schlagwortkarriere‘ verändern kann. Beispiele hierfür wären die Pejorisierung von multikulturelle Gesellschaft, die besonders von konservativer Seite her und besonders mit der Verwendung von Multikulti als Stigmawort als naiv und realitätsfern abgetan wurde (vgl. Schröter 2013). Ein anderes Beispiel wäre die noch deutlichere Pejorisierung von Asylant im Rahmen der Intensivierung der Asylkampagne in den späten 80er und frühen 90er Jahren (vgl. Strauß/Haß/Harras 1989, 86 ff.; Jung/Niehr/Böke 2000, 27 ff.; Wengeler 1993, 1995). Außerdem zeigt ein vergleichender Blick auf andere Sprachen, dass Diskurse unterschiedlich verlaufen und in diesem Verlauf die in Diskursen hinzugezogene Lexik Unterschiede aufweisen kann. Schaut man sich integration im großen Online-Korpus des Englischen (enTenTen, ca. 11 Milliarden Wörter, zugänglich über Sketch Engine; Kilgarriff et al. 2014) an, so wird deutlich, dass es nur marginal als Schlagwort fungiert. Man findet zwar European integration, aber davon abgesehen findet sich integration vor allem im Zusammenhang von Informationstechnologie im Sinne der Integration von Daten oder Anwendungen in Systeme. Der Bezug auf Migration ist fast gänzlich abwesend, während das große Online-Korpus des Deutschen (deTenTen, ca. 2.3 Milliarden Wörter, zugänglich über Sketch Engine) bei einem Blick auf Verwendungszusammenhänge von Integration sofort deutlich macht, dass es sich hier um ein zentrales Schlagwort im Migrationsdiskurs handelt.
2.2 Arten von Schlagwörtern Mit Bezug auf verschiedene Arten von Schlagwörtern ist in der Forschungsliteratur vor allem die Unterscheidung zwischen Hochwert- und Unwertwörtern bzw. Schlagund Fahnenwörtern gebräuchlich. Burkhardt (1998) unterscheidet diese nach dem Kriterium der Parteilichkeit – Hochwertwörter wie Demokratie, Freiheit, Menschenrechte werden parteiübergreifend positiv bewertet, während Unwertwörter wie Terrorismus, Diktatur und Umweltverschmutzung Sachverhalte bezeichnen, die parteiübergreifend negativ bewertet werden. Klein (1989) hat darauf verwiesen, dass Lexik im öffentlich-politischen Diskurs zumeist einer Bedeutungskonkurrenz unterliegt. Gemäß der Unterscheidung von deskriptiver Bedeutung und deontischer Bedeutung nennt Klein (1991) zwei Arten der Bedeutungskonkurrenz, nämlich erstens das Konkurrieren um die deskriptive Bedeutung, was Klein auch als Umdeuten bezeichnet, und zweitens das Konkurrieren um die deontische Bedeutung, d. h. die Umwertung eines Ausdrucks.
400
Melani Schröter
In Bezug auf das Konkurrieren um deskriptive Bedeutung ist die Arbeit von Fuhs (1987) erhellend. Er beschäftigt sich mit den parteispezifischen Bedeutungen von Hochwertwörtern wie Menschenwürde, Freiheit, Frieden, Demokratie, Gerechtigkeit, Gleichheit und Solidarität. Anhand von Parteiprogrammen und Parteitagsreden untersucht er, ob es sich dabei um Leerformeln handelt, also inhaltsarme Worthülsen, die zwecks Erzeugung vager positiver Eindrücke und Gefühle eingestreut werden, oder ob diese Hochwert wörter für verschiedene Parteien tatsächlich unterschiedliche Bedeutungen haben. Ist Letzteres der Fall, dann ist es auch wahrscheinlich, dass die Parteien aus diesen unterschiedlichen Bedeutungen unterschiedliche Handlungsprämissen und Maßnahmen ableiten, wie etwa Gerechtigkeit oder Frieden herbeigeführt werden sollen. Fuhs kann zeigen, dass sich aus den Parteidokumenten tatsächlich solche parteispezifisch unterschiedlichen Bedeutungen herauslesen lassen – somit handelt es sich nicht um Leerformeln und somit wird auch ein Beleg für deskriptive Bedeutungskonkurrenz in Bezug auf Hochwertwörter erbracht. Sprachthematisierungen sind zuverlässige Erkennungszeichen semantischer Konkurrenz. Es handelt sich dabei um Metakommunikation, mit der gruppenspezifisch verwendete Ausdrucksweisen oder, mit Bezug auf das Anliegen dieses Beitrags, saliente Lexik selbst zum Gegenstand von Äußerungen wird, wobei die Wörter je nach Anliegen problematisiert, verteidigt, verurteilt, bekräftigt, verändert und erweitert werden. Auf Bedeutungskonkurrenz weisen die von Niehr genannten de skriptiven Sprachthematisierungen hin: „Im Wesentlichen geht es bei diesem Typ von Sprach thematisierung darum, Wörter zu erläutern oder zu definieren bzw. ihre Verwendung zu begründen“ (2002, 92). Typische Indikatoren für solche deskriptiven Sprachthematisierungen, die sich an der Sprachoberfläche befinden, sind die Muster „Schlagwort (z. B. Gerechtigkeit, grün, Terrorismus, Integration) ist/bedeutet/heißt… bzw. ist/ bedeutet/heißt nicht“ und „Schlagwort statt/oder/und Schlagwort (z. B. Gerechtigkeit statt Umverteilung nach oben, Integration und/oder Assimilation). Besonders interessant mit Blick auf kontrovers diskutierte Sachverhalte und auf die sich in Diskursen manifestierenden gruppengebundenen Perspektivierungen sind Fahnenwörter und Stigmawörter, die jeweils gruppen- oder parteigebundene Wertungen vornehmen. Fahnenwörter sind eng mit der Perspektive einer Gruppe bzw. mit einem Parteiprofil verbunden und werden zur positiven Selbstdarstellung bzw. zur positiven Darstellung der eigenen Position gebraucht (vgl. Hermanns 1994). Das Schlagwort Solidarität ist verbunden mit einer traditionell eher arbeitnehmernahen Politik und spielt eine größere Rolle im Sprachgebrauch und in den Parteiprogrammen der SPD und vor allem der Linken als etwa bei der CDU oder FDP (vgl. Spieß 2006). Sicherheit ist dagegen ein Schlagwort, das enger mit konservativer Politik verbunden ist, eine Stärkung der inneren Sicherheit durch strenge Gesetzgebung, mehr Kontrolle und starke Polizeipräsenz beinhaltend. Dient ein Fahnenwort zur positiven Selbstdarstellung einer Partei, so hat ein Stigmawort die umgekehrte Funktion: nämlich die, eine konkurrierende politische Partei/Gruppe negativ zu bewerten. Oft
Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung
401
setzen Gruppen gezielt den Fahnenwörtern der anderen eigene Prägungen als Stigmawörter entgegen. Verteidigungsbeitrag etwa war in den fünfziger Jahren mit Bezug auf die höchst umstrittene Wiedereinrichtung einer Armee in der Bundesrepublik das Fahnenwort der Befürworter; ein solcher Beitrag müsse angesichts der ‚kommunistischen Bedrohung‘ im Rahmen der Nato geleistet werden. Die Gegner der Sache stigmatisierten dieses Anliegen mit dem Ausdruck Remilitarisierung; eine Bezeichnung mit warnendem Anklang an die deutsche Vergangenheit (Präfix Re-, Verweis auf – negativ bewerteten – Militarismus) (Wengeler 1989). Ebenso sprach die Regierung Kohl im Kontext der Deindustrialisierung und des beginnenden Globalisierungsdiskurses in den frühen 90er Jahren von einer arbeitgeberfreundlicheren Politik im Sinne der Sicherung des Standortes Deutschland, worauf sich politische Gegnerinnen und Gegner mit dem Stigmawort Sozialabbau bezogen (Stötzel/Eitz 2002, 355 f.). Umgekehrt kann natürlich auch einem Stigmawort, etwa Tötung ungeborenen Lebens, ein Fahnenwort entgegengesetzt werden, um eine andere Perspektive in den Diskurs zu bringen, Selbstbestimmungsrecht der Frau (vgl. Böke 1995). Des Weiteren lassen sich stigmatisierende Ausdrücke sozusagen bumerangartig gegen ihre Verwender richten; die Bezeichnung illegale Einwanderer stigmatisiert die betreffenden Personengruppen, während die Gegenprägung illegalisierte Einwanderer den Fokus der Problematisierung von den betreffenden Menschen weg und die Aufmerksamkeit auf restriktive Gesetzgebung lenkt. Solche die eigene Position aufwertenden und andere Positionen abwertenden Gegenüberstellungen von Bewertungen und Perspektivierungen lassen sich auch innerhalb von Einzeltexten beobachten. Zum Beispiel fanden sich in dem Wahlprogramm der FDP aus dem Jahr 2005 mit Bezug auf verschiedene Politikbereiche eine Reihe an Fahnenwörtern für die eigene Position, denen im lokalen Textzusammenhang Stigmawörter für das, was mit anderen Parteien in Verbindung gebracht werden sollte, gegenübergestellt wurden, etwa soziale Marktwirtschaft versus bürokratische Staatswirtschaft, Bürgerdemokratie versus Parteienstaat, Eigenverantwortung versus Staatsgläubigkeit u. a. m. (vgl. Schröter 2006). Das Konkurrieren um die deontische Bedeutung beschreibt einen Prozess, bei dem ein Wort, das von anderen Gruppen mit positiver Bewertung gebraucht wird, mit negativen Bewertungen belegt wird oder umgekehrt, ein negativ wertender Aus druck mit positiven Bewertungen versehen wird. Das Konkurrieren um die deontische Bedeutung von Sozialismus wird bei Liedtke (1989) beschrieben. Er zeichnet die mit Pejorisierung einhergehende Bedeutungsentwicklung von Sozialismus anhand von Pressetexten und Parteidokumenten nach. Bis in die 60er Jahre hinein konnte Sozialismus noch ohne zwingend negative deontische Bedeutung gebraucht werden und wurde von der SPD zur Bezeichnung der eigenen politischen Vorstellungen verwendet; in den 1950er Jahren spielte schließlich auch innerhalb der CDU noch das Konzept des christlichen Sozialismus eine Rolle. Liedtke beschreibt, wie die CDU es im Laufe der 1960er Jahre durch entsprechende Sprachgebrauchsveränderungen geschafft hat, Sozialismus mehr und mehr mit dem real existierenden Sozialismus in der DDR und mit dem Gedanken der Unfreiheit zu verbinden, so dass sich die SPD
402
Melani Schröter
schließlich genötigt sah, von dem Gebrauch ihres ehemaligen Fahnenwortes abzusehen, weil es durch die von der CDU betriebene Verschiebung der deontischen Bedeutung bis zur Unbrauchbarkeit mit negativen Bewertungen versehen wurde. Selbst an der Zwischenlösung des Zusatzes ‘demokratisch‘ in der Prägung demokratischer Sozialismus als einer ersten Reaktion auf die Negativierung von Sozialismus zwecks Abgrenzung vom DDR-Sozialismus mit dem Gedanken der Unfreiheit hat die SPD nicht festhalten können, wollte sie nicht das angestrebte Image als regierungsfähige Partei gefährden. Die Aneignung und damit Aufwertung negativ wertender Ausdrücke ist zu einem bewährten Mittel der Identitätspolitik von Minderheiten geworden; man denke an die Aneignung und Aufwertung von schwul, Weiber (im Feminismus der 70er Jahre) oder Kanacke. Mit Blick auf semantische Konkurrenz indizierende Sprachthematisierungen bemerkt Böke (1996, 46): „Die häufigsten Fälle stellen wohl diejenigen dar, bei denen der eigene Sprachgebrauch als ‚adäquat‘ und der gegnerische als unangemessen präsentiert wird“. Solche Sprachnormierungsversuche entsprechen den bei Niehr (2002) genannten strategisch-präskriptiven Sprachthematisierungen. Diese finden sich in den folgenden Ausprägungen: Erstens wird die Verwendung eines negativen oder neutralen Wortes wird gegenüber einem positiv wertenden favorisiert. Ein relativ bekanntes Beispiel für die Bevorzugung eines negativen Begriffs gegenüber einem neutralen ist die Bezeichnung Kriegsminister statt Verteidigungsminister. Zweitens wird die Verwendung eines positiven oder neutralen Ausdrucks gegenüber einem negativen für angebracht erklärt. Demnach insistiert beispielsweise Weizsäcker in seiner berühmten Rede (1985) zum 8. Mai 1945, dass die Kapitulation Deutschlands als Befreiung durch die Alliierten zu verstehen sei, nicht als Niederlage der Kapitulierenden. Drittens wird die Verwendung eines negativen oder positiven Ausdrucks gegenüber einem neutralen für richtig erklärt, z. B. wenn Brandt expliziert, dass die Ost-West-Politik der sozialliberalen Regierung auch als Politik der aktiven Friedenssicherung bezeichnet werden könnte. Strategisch-präskriptive Sprachthematisierungen sind Anzeichen für Bezeichnungskonkurrenz, da für den jeweils gleichen Sachverhalt verschiedene Ausdrücke genannt werden, von denen aber einer für angemessen, der andere dagegen für unangemessen erklärt wird. An Sprachthematisierungen lässt sich also auch zeigen, „daß sich die Linguistik der politischen Sprache nicht ihre Untersuchungsobjekte selber produziert, sondern tatsächlich bestehende kommunikative Konflikte betrachtet, die die Sprachgemeinschaft von sich aus zum Thema macht“ (Böke 1996, 46).
3 Dokumentationen von Schlagwörtern Vor allem seit den neunziger Jahren liegt eine ganze Reihe an Publikationen vor, die nicht nur, wie einige der oben zitieren Beiträge, einzelne Schlagwörter in den Blick
Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung
403
nehmen, sondern eine Reihe an Schlagwörtern aus einer bestimmten historischen Epoche oder aus einem bestimmten Themenbereich. Die Formate dieser Dokumentationen variieren jedoch: Einige verstehen sich als lexikografische Projekte; d. h. als Schlagwörterbücher bzw. Nachschlagewerke in Ergänzung zu den allgemeinen Wörterbüchern des Deutschen; andere verstehen sich eher als Beiträge zur Beschreibung oder Geschichte von Diskursen. Niehr (1993) und Felbick (2003) stellen jeweils ihrem Wörterbuchteil einen Theorieteil mit einem Forschungsüberblick voran, der eine Auseinandersetzung mit dem Begriff ‚Schlagwort‘ sowie eine Ableitung theoretischer Prämissen und Anforderungen an Schlagwortlexikografie enthält. Die Schlagwortforschung – und auch die Erfassung von Schlagwörtern in Schlagwörterbüchern – geht, wie oben bereits erwähnt, zurück auf Ladendorfs Historisches Schlagwörterbuch aus dem Jahr 1906. Die Entwicklung der Schlagwortlexikografie und ältere Schlagwörterbücher werden bei Felbick (2003) und Niehr (1993) beschrieben, wobei Letzterer auch populärwissenschaftlich-polemische Schlagwortsammlungen und linguistisch nicht reflektierte Schlagwörterbücher, die z. T. aus anderen Disziplinen als der Sprachwissenschaft hervorgegangen sind, behandelt. Basierend auf Kaempfert (1990) führt Niehr auch aus, wie schlagwortlexikografische Dokumentation gestaltet werden sollte. Demzufolge sollen am Beginn eines Eintrages Varianten aufgeführt und es soll angegeben werden, in welcher Zeit das Schlagwort bzw. der dazugehörige Diskurs brisant war, wenn möglich mit Erstbelegen für die Verwendung als Schlagwort. Daraufhin soll der politische und ideelle Horizont des Schlagwortes skizziert und die Umstrittenheit aufgezeigt werden. Nach Abklingen der Brisanzphase werden Schlagwörter nur noch plakativ verwendet; auch diese Phase der Sinnentleerung bis hin zum Verschwinden (bzw. dem Ausglühen, M. S.) eines Schlagwortes soll nachgezeichnet werden. Mit der Darstellung der Themen, die in Schlagwörtern Niederschlag finden, muss und soll gleichzeitig die Sache beschrieben werden, auf die sich das jeweilige Schlagwort bezieht; außerdem sollen Literaturangaben zu dem jeweiligen Thema oder Schlagwort folgen. Viele der im Folgenden erwähnten lexikografischen Dokumentationen halten sich an dieses Grundmuster, aber kleinere Variationen kommen vor. Nicht immer spielt die Phase des Abklingens eine Rolle; manche Einträge enthalten Verweise auf weitere Literatur zum diskursiven oder zeitgeschichtlichen Hintergrund, andere nicht; manche Einträge machen Angaben zur Etymologie, andere nicht. Einige Lexika sind rein alphabetisch angelegt (Niehr 1993, Felbick 2003, Stötzel/Eitz 2002), andere sind nach Themenbereichen organisiert (Herberg/Steffens/Tellenbach 1997, Strauß/ Haß/Harras 1989). Manche Lexika beschreiben die Schlagwörter einer bestimmten historischen Zeitspanne, z. B. Niehr die Bundesrepublik von 1966–1975, Felbick (2003) die Besatzungsjahre 1945–1949, Kämper (2013) den Protestdiskurs 1967/68, Herberg/Steffens/ Tellenbach (1997) die Wendezeit 1989–1990. Andere Schlagwörterbücher dokumentieren bestimmte thematische Diskurse anhand ihrer salienten Lexik, etwa Kämper (2007) den Schulddiskurs der frühen Nachkriegszeit, Stötzel/Eitz (2007) den Diskurs
404
Melani Schröter
der Vergangenheitsbewältigung; Kämpers (2013) lexikografische Dokumentation des Protestdiskurses 1967–68 und Herberg/Steffens/Tellenbachs Darstellung des Wendediskurses ließen sich auch hierunter einordnen. Bei Jung/Niehr/Bökes (2000) Darstellung des bundesdeutschen Migrationsdiskurses handelt es sich in erster Linie um eine thematisch gegliederte Belegsammlung mit kurzem Einführungsteil, die die in ihren Gebrauchszusammenhängen dokumentierte Lexik kurz charakterisiert. Ein nicht lexikografisches Format wurde für die umfassende Darstellung bundesrepublikanischer Diskurse der fünfziger bis frühen neunziger Jahre in dem von Stötzel und Wengeler 1995 herausgegebenen Band Kontroverse Begriffe gewählt. Hier werden verschiedene im Laufe der Geschichte der BRD relevante Diskurse (z. B. Feminismus, Umwelt, Migration, Terrorismus, Bildungspolitik) in einzelnen Kapiteln anhand der Entwicklungen und Verlagerungen diskursrelevanter Lexik nachvollzogen. Am Schluss eines jeden Kapitels befinden sich alphabetische Listen der entsprechenden Lexik, die auch die Vielfalt der diskursiv relevanten Wortfelder illustrieren (z. B. enthält Bökes Liste zum Abtreibungsdiskurs (590 ff.) Einträge von Abbruch einer Schwangerschaft über Babycaust, Gebärmaschine, Lebensschutzbewegung, Notlage und Todespille bis Zwangsberatung). Die Schlagwortlexikografie hat sich auch historischen Epochen vor 1945 zugewendet. Honecker (2004) beschäftigt sich mit vorreformatorischen Schlagwörtern, Diekmannshenke (1994) mit den Schlagwörtern der Radikalen der Reformationszeit (1520–1536), Wolter (2000) mit Schlagwörtern zur Zeit des Dreißigjährigen Krieges. Schottmann (1997) behandelt das Ende der Weimarer Republik zwischen 1929–1934 und Schmitz-Berning (2000) das Vokabular des Nationalsozialismus. Eine Sichtung der Einträge macht deutlich, dass sich Schlagwörterbücher auch als Hilfsmittel zur wissenschaftlichen Arbeit im Zusammenhang mit sprach-, geschichtsund gesellschaftswissenschaftlichen Themenstellungen eignen. Sie beschreiben die Diskurse, die den Hintergrund der Schlagwörter bilden, und die Zusammenhänge, die durch Schlagwörter aufgerufen werden. Sie können demnach als ein linguistischer Beitrag zur allgemeinen Geschichtsschreibung bzw. als Gesellschaftsgeschichte aus linguistischer Sicht betrachtet werden und haben außerdem einen dokumentarischen Wert, insoweit sie Textbelege enthalten. Es wird allerdings auch in der lexikografischen Erfassung der Standardsprache üblicher – wenn auch anscheinend noch nicht systematisch eingeführt –, Informationen über diskursiv determinierte Bedeutungsvarianten oder (z. B. evaluative) Bedeutungskomponenten anzubieten. Ersteres wird besonders deutlich in elexiko, z. B. bei den Einträgen zu Integration, Freiheit und Ausländer. Hinweise auf diskursiv determinierte Bedeutungskomponenten finden sich im Duden online beispielsweise im Eintrag zu Zigeuner dahingehend, dass die Bezeichnung oft abwertend gebraucht und vom Zentralrat der Sinti und Roma als diskriminierend abgelehnt wird. Beim Eintrag zu Asylant im Duden online vermisst man allerdings einen Hinweis auf die problematische Diskursgeschichte und damit einhergehende Pejorisierung.
Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung
405
4 Methodische Herangehensweisen an die Analyse von Schlagwörtern Es lassen sich vor allem zwei Herangehensweisen an Schlagwörter unterscheiden, zum einen eine hermeneutische Herangehensweise, die zum Teil eher begriffsgeschichtlich, zum Teil qualitativ-empirisch ausgerichtet ist, und zum anderen eine korpuslinguistische Herangehensweise. Die hermeneutische Herangehensweise (vgl. Hermanns/Holly 2007) hat in der germanistischen Linguistik eine oben schon erwähnte Tradition und weist Überschneidungen mit der aus der Geschichtswissenschaft entwickelten Begriffsgeschichte (Brunner/Conze/Kosellek 1972 ff.). Im Rahmen linguistischer Untersuchungen stehen der Begriffsgeschichte insbesondere Arbeiten von Dietrich Busse (1987 u. a.) und, für das Englische, Anna Wierzbicka (2006 u. a.) nahe. Die hermeneutische Herangehensweise ist auch im Zusammenhang mit den Bemühungen um die Bestimmung von (Diskurs-)Linguistik als Kulturwissenschaft zu sehen (vgl. Wengeler 2006). Die oben bisher zitierte Forschung und Dokumentation zu Schlagwörtern repräsentiert vor allem ein qualitativ-empirisches Verfahren. Schlagwortforschung war und ist grundsätzlich empirisch orientiert und durch die Prämisse geleitet, dass sich Bedeutung und Gebrauch von Schlagwörtern nur anhand konkreter Verwendungskontexte nachvollziehen lassen. Das bedeutet, dass fast immer schon auf der Grundlage von mehr oder weniger umfangreichen Korpora von für den öffentlichpolitischen Diskurs relevanten Texten (Zeitungsartikel, Parteiprogramme, Reden etc.) gearbeitet wurde. Mit Blick auf den Verwendungskontext salienter Lexik waren dabei vor allem Verwendungszeiträume, Verwendungshäufigkeiten, Kollokationen, Metaphorisierungen (z. B. Einwanderer als Flut, Globalisierung als Sturm) sowie die oben schon erwähnten metalinguistischen Sprachthematisierungen von Interesse. Der Zusatz ‚qualitativ‘ bezieht sich darauf, dass solche Analysen bis vor kurzem vor allem ‚von Hand‘ ausgeführt wurden, d. h. ohne korpusanalytische Hilfsmittel und ohne die empirische Validierung, die sich vor allem in Gestalt der statistischen Signifikanz bei korpusanalytischem Vorgehen bietet. Es wird deutlich, dass sich die genannten Aspekte mit korpuslinguistischen Mitteln untersuchen lassen – wohl zumeist auch effizienter. Die inzwischen klar zu konstatierende Hinwendung zu korpuslinguistischen Analyseverfahren (vgl. Bubenhofer/Scharloth 2013; Scharloth/Eugster/Bubenhofer 2013; Gür-Şeker in diesem Band) ist in mehrererlei Hinsicht konsequent und zeitgemäß: Erstens bringt das Interesse an Schlagwörtern bereits ein gebrauchsbasiertes Verständnis von lexikalischer Semantik mit sich und verträgt sich daher gut mit korpuslinguistischen Prämissen und Analyseoptionen – dieser Aspekt wird vor allem bei Teubert/Čermáková (2007) und Teubert (2010) sehr deutlich. Zweitens tendieren korpusbasierte Analysen derzeit noch deutlich zu einem Fokus auf die lexikalische Ebene des Sprachgebrauchs, so dass auch hier die methodisch-konzeptionelle Ver-
406
Melani Schröter
träglichkeit in hohem Maße gegeben ist. Drittens hat sich in den letzten Jahren die Verfügbarkeit bereits digitalisierten Materials rapide verbessert, so dass für diskursanalytische Studien relevantes Material leichter zu großen, gewinnbringend mit Software prozessierbaren Textkorpora zusammengetragen werden kann. Viertens hat sich die Verfügbarkeit und Nutzerfreundlichkeit von Korpusanalysetools verbessert, und es sind mehrere, auch praxiorientierte Einführungen erschienen, so dass es für eine größere Anzahl an Forschern und Forscherinnen leichter geworden ist, sich in die Analyseverfahren hineinzudenken, die Software zu erwerben und entsprechend anzuwenden. Eingangs wurde bemerkt, dass es sich bei dem vergleichsweise intensiven und langanhaltenden Interesse an salienter Lexik im öffentlich-politischen Diskurs um eine deutsche Besonderheit handelt, während die Integration korpusbasierter Ansätze in Lexikografie und Diskursanalyse im anglophonen Bereich bisher stärker und früher ausgeprägt war als im deutschsprachigen Raum. Durch die Hinwendung zu korpusbasiertem Vorgehen besteht also fünftens die Chance auf internationalen Anschluss in zweierlei Hinsicht: Zum einen könnte die – meist lexikalisch fokussierte – korpusbasierte Diskursanalyse von den konzeptionellen Überlegungen der Schlagwortforschung und Erfahrungen mit der Schlagwortlexikografie profitieren, zum anderen kann sich die deutschsprachige Diskursanalyse an den vorliegenden Arbeiten zu korpusbasierter Diskursanalyse aus dem anglophonen Bereich orientieren (vgl. Gür-Şeker in diesem Band). Die verstärkte Hinwendung zu korpusanalytischen Verfahren hat einen großen Vorteil und einen großen Nachteil. Der Vorteil liegt im Potenzial der empirischen Validierung: Zum einen gehört es für korpusbasierte Studien zum Standard, genaue Angaben zur Zusammensetzung des Korpus (Quellen, Zeitraum) zu machen. Nicht immer findet man in den vorhergehenden Studien zu Schlagwörtern diese Angaben in dieser Genauigkeit. Zweitens decken Korpusanalysen einen Grad der Musterhaftigkeit im Sprachgebrauch auf, der der natürlichen Beobachtung zumeist entgeht und der nur mit Hilfe von Korpusanalysetools auf der Grundlage großer Textmengen sichtbar gemacht werden kann. Zum anderen erlauben es korpusbasierte Vorgehen, sehr große Textmengen zu bearbeiten, so dass sich sicherer belegen lässt, welche diskursiven Relevanzsetzungen, die sich in Schlagwörtern kristallisieren, wirklich relevant – d. h. meistens statistisch signifikant – sind und welche vergleichsweise marginal auftauchen. Wenig wird dabei allerdings thematisiert, ob die durch korpusanalytische Verfahren angezeigte bzw. quantitativ suggerierte Marginalität wirklich einen Mangel an diskursiver Salienz bedeutet. Zum Beispiel analysieren Leuschner/Schröter (2015) und Schröter/Leuschner (2013) die Verwendung von historischen Germanismen wie Anschluss, Blitzkrieg und Drang nach Osten, die Eingang in eine Reihe anderer Sprachen gefunden haben und im Zusammenhang mit die deutsche Vergangenheit thematisierenden bzw. evozierenden Diskursen durchaus als salient zu betrachten sind, obwohl ihre Vorkommenshäufigkeit in öffentlich-politischen Diskursen verschiedener Sprachen (verifiziert anhand von Web- und Zeitungskorpora) äußerste Marginalität suggeriert. Storjohann/Schröter (2011) schlagen ein methodisches Vorgehen
Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung
407
vor, bei dem nicht nur die häufigsten bzw. signifikantesten Kollokationen zur Bedeutungsbeschreibung von Schlagwörtern herangezogen werden, sondern der Blick auch auf abwesende oder marginale Thematisierungszusammenhänge gelenkt wird, denn Diskurszusammenhänge werden durch Absenz genauso mitkonstituiert wie durch Präsenz. Korpusanalysetools werden auch zunehmend als Hilfsmittel zum Auffinden und zur Quantifizierung lexikalischer Phänomene in längeren Einzeltexten verwendet. Das ist nicht unorthodox, vereinfacht die Analyse und sorgt für genauere Ergebnisse, bedeutet aber auch, dass nunmehr mit der Verwendung korpusanalytischer Verfahren nicht automatisch die Analyse einer großen Textmenge einhergeht. Der Nachteil liegt darin, dass korpusanalytische Verfahren auf die Verfügbarkeit digitalisierten Textmaterials angewiesen sind. Nur in großangelegten Forschungsprojekten könnte die z. T. aufwändige Digitalisierung des Analysematerials einen Schritt der notwendigen Arbeit darstellen. Das bedeutet in der Praxis zumeist eine Vernachlässigung diachron angelegter Studien, zumal gerade Studien mit diskursanalytischem Interesse oft wenig mit existierenden Referenzkorpora anfangen können, sondern häufig Korpora mit Texten, die für die gegebene Fragestellung relevant sind, erst selbst zusammenstellen. Auch da, wo digitalisierte Textsammlungen historischer Epochen vorliegen, ist nicht immer eine Kontinuität gewahrt, d. h. man kann damit u. U. nur punktuell historische Tiefe erreichen, nicht aber diskursive Entwicklungsprozesse nachvollziehen. Das bedeutet auch, dass zum gegenwärtigen Zeitpunkt die Gefahr besteht, dass zumindest innerhalb der Linguistik korpusanalytische Verfahren die Weiterentwicklung traditionell hermeneutischer Fragestellungen, die zumindest in Teilen den Blick auf historische Tiefe gelenkt haben, de facto in den Hintergrund drängen. Dies kann sich jedoch im Zuge fortschreitender Digitalisierung von historischem Material und Archiven wieder ändern.
5 Ausblick: Aktuelle Entwicklungen und Desiderata der Schlagwortforschung Neben der neueren Verbreitung korpusanalytischer Methoden in der germanistischen (Diskurs-)Linguistik lässt sich eine Hinwendung zu vergleichender oder kontrastiver Analyse von Diskursen beobachten (z. B. Gür-Şeker 2013; Niehr 2004, 2012; Schröter 2013). Aus Sicht der Verfasserin sind solche Arbeiten nicht nur empirisch und methodologisch interessant, sondern auch theoretisch vielversprechend. Nachdem schon Schlagwörterbücher zum Deutschen aus verschiedenen historischen Epochen, zurückgehend bis in die frühe Neuzeit, vorliegen, könnte eine gewisse Breite an Untersuchungen über verschiedene Sprachen hinweg zusätzlich empirisch die Annahme untermauern, dass es sich bei Schlagwörtern um ein für Diskurse grundsätzlich zu veranschlagendes Phänomen handelt: (Semi-)öffentliche Diskurse über für Gruppen
408
Melani Schröter
relevante Sachverhalte bringen über verschiedene Epochen und Sprachen hinweg zentrale Lexikalisierungen hervor, in denen sich komplexe Bedeutung, Bewertungen und Perspektivierungen bündeln. Außerdem könnten diskursgebundene Unterschiede in Bedeutung und Verwendung von Wörtern, die auf den ersten Blick als lexikalisch äquivalent erscheinen, den Einfluss erhellen, den Diskurszusammenhänge auf die in ihnen verwendete Lexik haben. Dies ist sowohl diskurstheoretisch als auch aus der Sicht lexikalischer Semantik sowie für die Sprachkontaktforschung von Interesse. Schröter (2013) zeigt beispielsweise, dass die Unterschiede in der Verwendung von multikulturelle Gesellschaft im Deutschen und multicultural society im Englischen sogar zu einer Art interdiskursivem Missverständnis geführt haben. Wierzbicka (1997) beschreibt im Detail die Unterschiede in der Bedeutung von ‚cultural key words‘ wie Freundschaft, Freiheit, Heimat und Vaterland in verschiedenen Sprachen. Schröter/ Leuschners (2013) und Leuschner/Schröters (2015) Beiträge zu historischen Germanismen deuten darauf hin, dass sich auch Lehnwörter neuen diskursiven Zusammenhängen in der entlehnenden Sprache anpassen. Zusätzlich dazu zeigt ein Blick in die über Sketch Engine; Kilgarriff et al. 2014 verfügbaren Web-Korpora, dass Lebensraum im Deutschen ganz anders (im Sinne von natürlichem Umfeld für Flora und Fauna) als z. B. im Englischen und Französischen verwendet wird, wo Lebensraum hauptsächlich in Bezug auf die deutsche Nazi-Vergangenheit verwendet, aber auch in andere Zusammenhänge versetzt wird (z. B. American Lebensraum, Israel’s Lebensraum). Schröter/Storjohanns (2015) und Storjohann/Schröters (2013) Beiträge zum Vergleich der Kollokationsprofile von Wirtschaftskrise und financial crisis in deutschen und britischen Zeitungstexten zeigen, dass die durch Kollokationen angezeigten Verwendungszusammenhänge schlüssig auf den unterschiedlichen Grad, in dem Deutschland und Großbritannien im Untersuchungszeitraum von ‚der Krise‘ betroffen waren, verweisen. Weitgehend ein Desiderat bleiben derzeit noch Studien, die der Analyse hegemonialer Diskurse entweder vergleichend oder ergänzend Studien zum Sprachgebrauch von marginalisierten und/oder oppositionellen Gruppen gezielt gegenüberstellen. Ein solches Vorgehen könnte die oben erwähnte semantische Konkurrenz nicht nur zwischen politischen Parteien oder in einem politisch von der Mitte bis zum linken wie rechten Rand angesiedelten Spektrum beschreiben, sondern den Blick für gesellschaftliche Vielfalt und Polyphonie – auch salienter Lexikalisierungen – sowie für Konstellationen von Hegemonie und Marginalität bzw. Marginalisierung öffnen. Wie oben angedeutet, dürfte es auch und gerade im Zusammenhang mit der Verbreitung korpuslinguistischer Analysemethoden für die Bestimmung und Analyse salienter Lexik in öffentlich-politischen Diskursen von Bedeutung werden zu spezifizieren, woraus sich diese Salienz begründet und worin sie sich zeigt. Neben Vorkommenshäufigkeiten ließe sich auch an die Bildung von Komposita denken; zum Beispiel hat das für den gegenwärtigen deutschen Migrationsdiskurs zentrale Schlagwort Integration eine Vielzahl an Komposita hervorgebracht, einschließlich Integrationsbeauftragte, Integrationskurs, Integrationswille/integrationswillig, Integrationspro-
Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung
409
bleme, Integrationsbereitschaft/integrationsbereit, Integrationsverweigerer/-verweigerung etc. Diese Produktivität ist auch ein deutlicher Indikator für diskursive Salienz. Im gleichen Zusammenhang dürfte es von Interesse sein, Vorgehensweisen für die Analyse von Kollokationen zu spezifizieren. Ein korpusanalytisches Verfahren ermöglicht die Erstellung einer Liste von Lexemen, die statistisch signifikant häufig im Umfeld des Such- bzw. Analysewortes auftauchen. Wie man aber mit dieser Liste umgeht, ergibt sich aus deren Vorhandensein noch nicht. Schaut man sich nur die häufigsten Kollokatoren an oder die, die vorhergehende Vermutungen über Verwendungsweisen bestätigen? Kann man Funktionswörter weitgehend ignorieren? Viel hängt von der Fragestellung ab – für die Schlagwortforschung ließe sich vielleicht ein Stück weit spezifizieren, welche der korpuslinguistisch generierbaren Erkenntnisse mit Blick auf Diskurssemantik von besonderem Interesse sind und wie diese interpretativ aus den gewonnenen Daten herausgearbeitet werden können (vgl. Baker 2006). Ansätze aus der kognitiven Linguistik dürften für diskursanalytisch ausgerichtete, wortbezogene Ansätze der Politolinguistik von künftigem Interesse sein, gerade auch, um eine systematischere Beschreibung diskurssemantischer Grundstrukturen zu ermöglichen. So besteht der erklärend-analytische Wert des Frame-Konzeptes in der Beschreibung von Wissensstrukturen; Frames werden verstanden als „typisierte und strukturierte Segmente kollektiven Wissens, die sich induktiv und/oder abduktiv aus der Schnittmenge ähnlicher Einzelerfahrungen ergeben“ (Ziem 2008, 97). Wie in einem Frame typisierte und strukturierte Segmente kollektiven Wissens aufgehoben sind, so sind im Prinzip auch in einem Schlagwort die diskursiven Formationen aufgehoben, die sich durch seine Verwendung in der Entwicklung des entsprechenden Diskurses herausgebildet haben. Man kann davon ausgehen, dass ein diskursiv herausgebildetes Schlagwort einen Frame aufruft, und dass die Leerstellen eines solchen Frames das „virtuell-semantische Potential“ des Ausdrucks darstellen (ebd., 103). Man könnte also mit der software- und korpusbasierten Analyse von Kollokationen eines Schlagworts die prominentesten, also häufigsten Füllwerte des entsprechenden Frames ermitteln, um dann zu einer Beschreibung des Ist-Zustandes eines Diskurses und der in ihm aktualisierten Wissenselemente zu gelangen. Solche Schlüsse müssten allerdings mit einem gewissen Maß an Vorsicht getroffen werden, nicht zuletzt weil Textkorpora immer nur einen kleinen Ausschnitt sozialer und kommunikativer Praxis repräsentieren. In einer wissenschaftsgeschichtlichen Phase, in der die Linguistik ihren Gegenstandsbereich über Satz und Text hinweg weiter hin zum Diskurs ausgeweitet hat, erscheint das anhaltende Interesse an der lexikalischen Analyseebene auf den ersten Blick anachronistisch. Es gilt aber zu würdigen, dass das Interesse an Schlagwörtern die Ebene des Diskurses bereits vor der Etablierung von Diskurslinguistik im Rahmen der germanistischen Sprachwissenschaft fest im Blick hatte; wenn auch weniger begrifflich und konzeptionell bestimmt, als es nunmehr möglich geworden ist. Auch war das Interesse am Schlagwort von jeher grundlegend mit der Prämisse verbunden, dass Bedeutung im Gebrauch, in konkreten Verwendungskontexten von Wörtern
410
Melani Schröter
aufzuspüren ist und nicht außerhalb solcher Kontexte verortet werden kann, was nun die unmittelbare Anschlussfähigkeit an korpusanalytisches Vorgehen gewährleistet – eine Konvergenz, die vor allem aus Arbeiten Wolfgang Teuberts (z. B. 2007, 2010 u. a. m.) immer wieder hervorgeht. Wie eine breite Palette von Einzelanalysen sowie eine Vielzahl umfangreicher Dokumentationen illustrieren, arbeiten Linguistinnen und Linguisten hier z. T. am Puls der Zeit und auf einem Gebiet, das über rein sprachwissenschaftliche Fragen hinaus von großem Interesse ist, an der Schnittstelle zwischen Linguistik, Historiographie, Kulturwissenschaft und populärer, laienlinguistischer Sprachkritik sowie zwischen Lexikologie, Lexikografie und Diskursanalyse. Neuere methodische und konzeptionelle Entwicklungen und Tendenzen – die Ausbreitung korpuslinguistischer Methoden, das Interesse an kontrastiver Analyse, die Verbindung mit Ansätzen aus der kognitiven Linguistik – zeigen, dass der diskursanalytische Horizont der Schlagwortforschung auch für ihre methodische Adaptabilität sorgt.
6 Literatur Baker, Paul (2006): Using Corpora for Discourse Analysis. London. Böke, Karin (1995): Lebensrecht oder Selbstbestimmungsrecht? Die Debatte um den § 218. In: Georg Stötzel/Martin Wengeler (Hg.), 563–592. Böke, Karin/Frank Liedtke/Martin Wengeler (Hg.) (1996): Politische Leitvokabeln der Adenauer-Ära. Berlin/New York. Böke, Karin (1996): Politische Leitvokabeln der Adenauer-Ära. Theorie und Methodik. In: Karin Böke/ Frank Liedtke/Martin Wengeler (Hg.), 131–210. Brunner, Otto/Werner Conze/Reinhart Kosellek (1972 ff.): Geschichtliche Grundbegriffe. Historisches Lexikon zur politisch-sozialen Sprache in Deutschland. Stuttgart. Busse, Dietrich (1987): Historische Semantik. Stuttgart. Bubenhofer, Noah/Joachim Scharloth (2013): Korpuslinguistische Diskursanalyse. Der Nutzen empirisch-quantitativer Verfahren. In: Ingo Warnke/Ulrike Meinhof/Martin Reisigl (Hg.): Diskurslinguistik im Spannungsfeld von Deskription und Kritik. Berlin, 147–168. Burkhardt, Armin (1998): Deutsche Sprachgeschichte und politische Geschichte. In: Werner Besch u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 2., bearb. u. erw. Aufl., Berlin/New York (Handbücher zur Sprach- und Kommunikationswissenschaft, 1. Halbbd.), 98–122. Diekmannshenke, Hans-Joachim (1994): Die Schlagwörter der Radikalen der Reformationszeit (1520–1536). Spuren utopischen Bewußtseins. Frankfurt a. M. u. a. Duden online: http://www.duden.de/. Eitz, Thorsten/Georg Stötzel (2007): Wörterbuch der Vergangenheitsbewältigung. Die NS-Vergangenheit im öffentlichen Sprachgebrauch. Hildesheim. elexiko: Online-Wörterbuch zur deutschen Gegenwartssprache, http://www.owid.de/wb/elexiko/ start.html . Felbick, Dieter (2003): Schlagwörter der Nachkriegszeit 1945–1949. Berlin/New York.
Besondere Wörter III: Schlagwörter in der öffentlich-politischen Auseinandersetzung
411
Fuhs, Klaus (1987): Sind Grundwerte Leerformeln? Bedeutungen und parteispezifische Verwendungen politischer Grundwerte-Lexeme in der Bundesrepublik Deutschland. Frankfurt a. M. Girnth, Heiko (2001): „Soziale Gerechtigkeit“ – Bedeutung und Funktion eines Symbolwortes. In: Muttersprache 111, 193–204. Gür-Şeker, Derya (2012): Transnationale Diskurslinguistik. Theorie und Methodik am Beispiel des sicherheitspolitischen Diskurses über die EU-Verfassung in Deutschland, Großbritannien und der Türkei. Bremen. Herberg, Dieter/Doris Steffens/Elke Tellenbach (1997): Schlüsselwörter der Wendezeit. Wörter-Buch zum öffentlichen Sprachgebrauch 1989/90. Berlin/New York. Hermanns, Fritz (1994): Schlüssel-, Schlag- und Fahnenwörter. Zu Begrifflichkeit und Theorie der lexikalischen ‚politischen‘ Semantik. In: Arbeiten aus dem Sonderforschungsbereich 245 „Sprache und Situation“. Heidelberg/Mannheim 1994. Hermanns, Fritz/Wener Holly (Hg.) (2007): Linguistische Hermeneutik. Theorie und Praxis des Verstehens und Interpretierens. Tübingen. Honecker, Patrick (2004): Vorreformatorische Schlagwörter. Spiegel politischer, religiöser und sozialer Konflikte in der frühen Neuzeit. Dissertation der Universität Trier. (http://ubt.opus. hbz-nrw.de/volltexte/2004/149/pdf/20021212.pdf ). Jung, Matthias/Thomas Niehr/Karin Böke (2000): Ausländer und Migranten im Spiegel der Presse. Ein diskurshistorisches Wörterbuch zur Einwanderung seit 1945. Wiesbaden. Kämper, Heidrun (2007): Opfer – Täter – Nichttäter. Ein Wörterbuch zum Schulddiskurs 1946–1955. Berlin/New York. Kämper, Heidrun (2013): Wörterbuch zum Demokratiediskurs 1967/68. Unter Mitwirkung von Elisabeth Link. Berlin. Kaempfert, Manfred (1990): Das Schlagwörterbuch. In: Frank Josef Hausmann u. a. (Hg.): Wörterbücher. Ein internationales Handbuch zur Lexikographie. 2. Halbbd. Berlin/New York, 1199–1206. Kilgarriff, Adam/Vit Baisa/Jan BuŠta/MiloŠ JakubiČek/Vojtěch Kovàř/Jan Michelfeit/Paavel Rychly/ Vit Suchomel (2014): The Sketch Engine: ten years on. In Lexicography 1, 7–36. Klein, Josef (1989): Wortschatz, Wortkampf, Wortfelder in der Politik. In: Ders. (Hg.): Politische Semantik. Bedeutungsanalytische und sprachkritische Beiträge zur politischen Sprachverwendung. Opladen, 3–50. Klein, Josef (1991): Kann man „Begriffe besetzen“? Zur linguistischen Differenzierung einer plakativen politischen Metapher. In: Frank Liedtke/Martin Wengeler/Karin Böke (Hg.): Begriffe besetzen. Strategien des Sprachgebrauchs in der Politik. Opladen, 44–69. Ladendorf, Otto (1906): Historisches Schlagwörterbuch. Straßburg/Berlin. Leuschner, Torsten/Melani Schröter (2015): Von der Schlagwortforschung zur soziokognitiv orientierten Konstruktionsgrammatik – das Beispiel Drang nach Osten. In: Alexander Ziem/ Alexander Lasch (Hg.): Konstruktionsgrammatik IV. Konstruktionen als soziale Konventionen und kognitive Routinen. Tübingen, 155–177. Liedtke, Frank (1989): Sozialismus. Ein Reizwort. In: Sprache und Literatur in Wissenschaft und Unterricht 20, 23–38. Niehr, Thomas (1993): Schlagwörter im politisch-kulturellen Kontext. Zum öffentlichen Diskurs in der BRD von 1966–1974. Wiesbaden. Niehr, Thomas (2002): Kampf um Wörter? Sprachthematisierungen als strategische Argumente im politischen Meinungsstreit. In: Oswald Panagl/Horst Stürmer (Hg.): Politische Konzepte und verbale Strategien. Brisante Wörter, Begriffsfelder, Sprachbilder. Frankfurt a. M. u. a., 85–104. Niehr, Thomas (2004): Der Streit um Migration in der Bundesrepublik Deutschland, der Schweiz und Österreich. Eine vergleichende diskursgeschichtliche Untersuchung. Heidelberg.
412
Melani Schröter
Niehr, Thomas (2012): Möglichkeiten und Grenzen internationaler Schlagwortforschung. In: Heidrun Kämper/Jörg Kilian (Hg.): Wort – Begriff – Diskurs. Deutscher Wortschatz und europäische Semantik. Bremen, 241–256. Panagl, Oswald (Hg.) (1998): Fahnenwörter der Politik. Kontinuitäten und Brüche. Wien u. a. Scharloth, Joachim/David Eugster/Noah Bubenhofer (2013): Das Wuchern der Rhizome. Linguistische Diskursanalyse und Data-driven Turn. In: Dietrich Busse/Wolfgang Teubert (Hg.): Linguistische Diskursanalyse. Neue Perspektiven. Wiesbaden, 345–380. Schmitz-Berning, Cornelia (2000): Vokabular des Nationalsozialismus. Berlin/New York. Schottmann, Christian (1997): Politische Schlagwörter in Deutschland 1929–1934. Stuttgart. Schröter, Melani (2006): Freiheit und Vorfahrt für Wirtschaft und Bürger. Die Wahlkampfsprache der FDP 2005. In: Aptum 1, 43–59. Schröter, Melani (2013): Die kontrastive Analyse politischer Diskurse: Skizze, Verkomplizierung und Ausblick. In: Jörg Kilian/Thomas Niehr (Hg.): Politik als sprachlich gebundenes Wissen. Politische Sprache im lebenslangen Lernen und politischen Handeln. Bremen, 91–105. Schröter, Melani/Torsten Leuschner (2013): Historical germanisms in British newspaper discourse. A discourse-analytic approach and four corpus-assisted case studies. In: Angermion 6, 139–171. Schröter, Melani/Petra Storjohann (2015): Patterns of discourse semantics: a corpus-assisted study of financial crisis in British newspaper discourse in 2009. In: Pragmatics and Society 5, 43–66. Spieß, Constanze (2006): Solidarität – zwischen Freiwilligkeit und Institutionalisierung. Eine pragmalinguistische Analyse eines Hochwertwortes in den aktuellen Grundsatzprogrammen von CDU, CSU, SPD, Bündnis 90/Die Grünen, FDP und PDS. In: Muttersprache 116, 147–161. Storjohann, Petra/Melani Schröter (2013): Präsenz und Absenz lokaler Diskursgebrauchsmuster am Beispiel des deutschen und britischen Krisendiskurses. In: Martin Wengeler/Alexander Ziem (Hg.): Sprachliche Konstruktionen sozial- und wirtschaftspolitischer Krisen. Bremen, 185–208. Stötzel, Georg/Martin Wengeler (Hg.) (1995): Kontroverse Begriffe. Geschichte des öffentlichen Sprachgebrauchs in der Bundesrepublik Deutschland. Berlin/New York. Stötzel, Georg/Thorsten Eitz (Hg.) (2002): Zeitgeschichtliches Wörterbuch der deutschen Gegenwartssprache. Hildesheim. Strauß, Gerhard/Ulrike Haß/Gisela Harras, (1989): Brisante Wörter von „Agitation“ bis „Zeitgeist“. Ein Lexikon zum öffentlichen Sprachgebrauch. Berlin/New York. Teubert, Wolfgang/Anna Čermáková, (2007): Corpus Linguistics. A Short Introduction. London. Teubert, Wolfgang (2010): Meaning, Discourse and Society. Cambridge u. a. Wengeler, Martin (1989): Remilitarisierung oder Verteidigungsbeitrag? Sprachthematisierung in den Diskussionen um die westdeutsche Wiederbewaffnung. Ein Beitrag zur Sprachgeschichte nach 1945. In: Sprache und Literatur in Wissenschaft und Unterricht 20, 39–57. Wengeler, Martin (1993): Asylantenflut im Einwanderungsland Deutschland. Brisante Wörter in der Asyldiskussion. In: Sprache und Literatur in Wissenschaft und Unterricht 24, 2–30. Wengeler, Martin (1995): Multikulturelle Gesellschaft oder Ausländer raus? Der sprachliche Umgang mit der Einwanderung seit 1945. In: Georg Stötzel/Martin Wengeler (Hg.), 711–749. Wengeler, Martin (Hg.) (2006): Linguistik als Kulturwissenschaft. Hildesheim. Wierzbicka, Anna (1997): Understanding Cultures Through their Key Words. English, Russian, Polish, German, and Japanese. Oxford. Wierzbicka, Anna (2006): English. Meaning and Culture. Oxford. Wolter, Beatrice (2000): Deutsche Schlagwörter zur Zeit des dreißigjährigen Krieges. Frankfurt a. M. u. a. Ziem, Alexander (2008): Frame-Semantik und Diskursanalyse: Skizze einer kognitionswissenschaftlich inspirierten Methode zur Analyse gesellschaftlichen Wissens. In: Ingo Warnke/Jürgen Spitzmüller (Hg): Methoden der Diskurslinguistik. Sprachwissenschaftliche Zugänge zur transtextuellen Ebene. Berlin/New York, 89–116.
Nanna Fuhrhop/Franziska Buchmann
18. Das Wort in der (Recht-)Schreibung Abstract: Das graphematische Wort ist ein zentraler Begriff in der Schriftforschung. Es ist in wenigstens drei Hinsichten für die linguistische Forschung und hier auch insbesondere für den linguistischen Laien interessant: – Wann handelt es sich bei einer bestimmten Sequenz um ein graphematisches Wort und wann um zwei (oder mehr)? Wann wird also zusammen und wann wird getrennt geschrieben? – Wie ist das Verhältnis zu anderen Wortbegriffen, so zum Beispiel zum phonologischen oder morphologischen Wort? Damit einher geht auch die grammatische Fundierung des graphematischen Wortes. – Wie funktionieren die Wortzeichen, also nicht-alphabetische Zeichen? Die genannten Punkte sind zunächst einzelsprachlich interessant und können in einem weiteren Schritt sprachvergleichend und anschließend typologisch untersucht werden; wir behandeln das Deutsche hier also ausführlicher und werden anschließend einige europäische Sprachen kurz anreißen. Zunächst müssen jedoch einige Grundannahmen der Graphematikforschung festgehalten werden. 1 Grundannahmen der Graphematikforschung 2 Das graphematische Wort im Deutschen 3 Das graphematische Wort im Sprachvergleich 4 Resümee 5 Literatur
1 Grundannahmen der Graphematikforschung 1.1 Die Unterscheidung in Graphematik und Orthographie Die Graphematik als Teilgebiet der Systemlinguistik erforscht das Schriftsystem einer Sprache, in unserem Falle des Deutschen. Die Orthographie hingegen schreibt die extern normierten Rechtschreibregeln vor. Während die Graphematik also implizite Regularitäten erforscht, legt die Orthographie explizit Regeln fest (vgl. auch Eisenberg 2013a, 285 ff.). Die Graphematik hat einen primär deskriptiven Charakter. Sie untersucht, mit welcher Regularität eine Schreibung motiviert wird; die empirische Basis aller Untersuchungen liegt im Schreibgebrauch kompetenter Schreiber/Leser/ innen, typischerweise die sogenannte Standardschriftsprache mit einer bestimmten Textsortenmischung, wie sie sich beispielsweise in überregional erscheinenden Tageszeitungen findet (Eisenberg 2007, 2013b). Es hat sich als methodisch sinnvoll
414
Nanna Fuhrhop/Franziska Buchmann
herauskristallisiert, hier verschiedene Wortschätze zu unterscheiden – zunächst wird der Kernwortschatz untersucht, s. auch Schnörch in diesem Band. Daneben nehmen wir mindestens einen Fremdwortschatz und einen Eigennamenwortschatz an sowie die Schreibungen von Kurzwörtern/Akronymen, Abkürzungen und Interjektionen. Jeder dieser Wortschätze verfügt darüber hinaus über einen Kernbereich und eine Peripherie (vgl. Fuhrhop/Müller 2012, s. auch Abschnitt 1.2). Von einer orthographischen Norm abweichende Schreibungen werden damit nicht von der grammatischen Analyse ausgeschlossen; es wird vielmehr untersucht, ob sich Systematiken finden lassen (Eisenberg 2013a, 287). Die Orthographie hingegen hat einen präskriptiven Charakter; ihre Regeln sind allerdings nicht willkürlich. In den Kernbereichen können sie graphematisch rekonstruiert werden und sind damit graphematisch fundierbar (Fuhrhop 2009, 3). Lediglich in den Peripherien gibt es orthographische Regeln, die nicht auf graphematischen Regularitäten aufbauen. Hierzu sind beispielsweise die Großschreibungen bei Phrasen wie im Allgemeinen zu zählen. Eine amtlich normierte Orthographie gibt es erst seit der II. Orthographischen Konferenz (1901) (vgl. zur Herausbildung des Regelwerks Nerius 2007), diese wurde 1996 reformiert und im Jahre 2006 re-reformiert. Bis zum Anfang des 20. Jahrhunderts hat sich die Schreibung relativ natürlich entwickelt und systematisiert (Nübling u. a. 2010, 169 ff.). Es ist eine These, dass sich aus verschiedenen dialektal geprägten Schreibzentren eine überregionale Schriftsprache herausgebildet hat (Nerius 2007, 298 ff.). Mit einem Beschluss der Kultusministerkonferenz von 1955 war der Duden in der Bundesrepublik bis 1996 die maßgebende Instanz in Sachen Rechtschreibung; in der DDR gab es ähnliche Festlegungen aus dem Volksbildungsministerium (Nerius 2007, 373). Die Orthographie des Deutschen ist doppelt kodiert, durch ein Regelwerk und eine Wörterliste.
1.2 Kernwortschatz, Fremdwortschatz, Eigennamen Grundsätzlich erscheint es sinnvoll, für die grammatische Beschreibung zunächst von einem Kernwortschatz auszugehen und die Fremdwörter und Eigennamen mit ihren jeweiligen Besonderheiten erst danach zu betrachten. Sie bilden besondere Eigenschaften heraus und werden mitunter im System auch als solche markiert; bei der Bindestrichschreibung finden sich z. B. sog. Hybridkomposita (‚Zusammensetzungen aus fremden und heimischen Wörtern/Wortteilen‘, s. 2.3.3). Mit Eisenberg (2012) etabliert sich ein synchron systematischer Fremdwortbegriff, der nicht die etymologische Herkunft des entsprechenden Worts in den Vordergrund stellt, sondern die grammatische Struktur. Es sind Wörter, die mehr oder weniger stark integriert sind: Sie können beispielsweise phonologisch (1.a., b.), (flexions-) morphologisch (1.c) und graphematisch (1.d) abweichen (vgl. Fuhrhop/Müller 2012):
Das Wort in der (Recht-)Schreibung
(1)
415
a. [hɛmbɜ:ʀɡɐ] Hamburger mit unbekanntem Laut (ɜ:) bzw. unüblicher Phonem-GraphemKorrespondenz (/ɛ/- ), b. [ʔa:.‘le:] Allee mit abweichender Fußstruktur, c. (flexions-)morphologisch mit der Pluralform Termini, fehlende Adjektivflexion in Hot Dog, High Society, d. graphematisch mit mit |y|, Getrenntschreibung/Großschreibung Hot Dog.
Der Eigennamenwortschatz besteht aus einer großen Anzahl verschiedener semantischer Eigennamenfelder, beispielsweise Personennamen, Familiennamen, geographische Namen aller Art, Produktnamen usw. (vgl. beispielsweise Nübling/Fahlbusch/Heuser 2012). Eigennamen wie zum Beispiel Personennamen weisen ein ganz bestimmtes grammatisches Verhalten auf: So brauchen sie im Singular in der Regel keinen Artikel, da sie einen inhärent individuellen und damit definiten Referenten bezeichnen; weil sie nicht zählbar sind, bilden sie zunächst keine Pluralform (vgl. Eisenberg 2013c, 140 ff.). Das Verhältnis von Vor- und Zunamen wird mitunter überzeugend als Komposition beschrieben; Zusammenschreibung kommt dennoch nicht vor. Auch hier zeigt sich, dass in diesem Bereich mitunter eigene Regeln herrschen, s. auch 2.1. Quer dazu kann für jeden Wortschatz ein Kernbereich und eine Peripherie angenommen werden. Im Kernbereich des Kernwortschatzes lassen sich dann zum Beispiel auf graphematischer Ebene graphisch unmarkierte Schreibungen finden, in der Peripherie graphisch markierte. Zur letzteren Kategorie zählen z. B. Kurzwörter, die sich durch eine durchgängige Majuskelschreibung auszeichnen (ABM) oder wortzeichenhaltige Schreibungen (Abk.-Punkt). Fachsprachliche Ausdrücke (vgl. Roelcke in diesem Band) hingegen gehören häufig zum Fremdwortschatz. Wenn wir also die Schreibung des Deutschen untersuchen, geht es uns zunächst darum, keine Extreme zu analysieren: Packungsaufschriften aus dem Supermarkt oder Schilderbeschriftungen interessieren uns dann genauso wenig wie Schreibungen einzelner Eigennamen oder fremdsprachlicher Fachwortschätze. Vielmehr interessiert uns, wie die kompetenten Schreiber/Leser/innen im Kernwortschatz des Standarddeutschen agieren, s. dazu Bredel 2008; Eisenberg 2007 und 2013b.
2 Das graphematische Wort im Deutschen Häufig wird behauptet oder suggeriert, dass das Wort als eine Einheit insbesondere dem Schriftbild geschuldet ist, das Wort also eine schriftsprachliche Einheit sei. Das Wort ist in einem alphabetischen Schriftsystem wie dem deutschen zweifellos klar gekennzeichnet, zur Diskussion auch Haß/Storjohann (2015). Das Inventar stellt die Leerzeichen zur Verfügung. So ist ein graphematisches Wort – in erster Näherung – eine Graphemkette zwischen zwei Spatien (also Leerzeichen), die intern keine weiteren Spatien enthält. Graphematische Wörter weisen höchstens eine (initiale) Majus-
416
Nanna Fuhrhop/Franziska Buchmann
kel (satzinitiale Großschreibung oder satzinterne Großschreibung des Kerns der Nominalgruppe) auf, gefolgt von Minuskeln.
2.1 Das graphematische Wort und die anderen Wortbegriffe Neben dem graphematischen Wort können weitere Wortbegriffe angesetzt werden, und zwar auf allen Beschreibungsebenen. Wir bleiben hier bei den formalen Beschreibungsebenen, womit sich das phonologische Wort, das flexionsmorphologische, das wortbildungsmorphologische und das syntaktische Wort neben dem graphematischen Wort ergeben. Das phonologische Wort wird inzwischen wesentlich in Verbindung mit morphologischen Gegebenheiten gesehen – phonologisch ist es eine Einheit, weil bestimmte (phonologische) Prozesse innerhalb seiner Wortgrenzen stattfinden (kompakte Darstellung in Fuhrhop/Peters 2013, 117 ff.). Dabei bilden Komposita mehrere phonologische Wörter, ebenso sind Präfixe wie ver-, un- usw. eigene phonologische Wörter. Dass Wortgrenzen einen Einfluss haben, ist zum Beispiel an der Nasalassimilation zu erkennen: In Ungar [ʔʊŋɡar] findet eine Nasalassimilation statt, der Nasal ist ein velarer, weil keine Wortgrenze zwischen dem Nasal und dem velaren Plosiv ist; in ungar [ʔʊn.ɡaʀ] hingegen ist eine Wortgrenze (phonologische Wortgrenze, Morphemgrenze) zwischen den beiden Lauten und die Assimilation findet eher nicht statt. Der Begriff des phonologischen Wortes ist im Wesentlichen so motiviert, dass bestimmte Prozesse eher innerhalb eines phonologischen Wortes stattfinden als über Wortgrenzen hinweg. Man kann dies geradezu als Verdeutlichung von morphologischen Strukturen in der Lautung verstehen. Insgesamt ist dies auf das Deutsche bezogen. Mit Wiese (2000, 65 f.) beispielsweise ist davon auszugehen, dass Suffixe mit vokalischem Anlaut wie -ung und -er kein eigenes phonologisches Wort bilden: Sowohl Lehrer als auch Kränkung sind jeweils ein phonologisches Wort – hier entsprechen die phonologischen Wörter also den graphematischen Wörtern. Wörter mit Präfixen und Komposita sind hingegen typischerweise zwei phonologische Wörter wie Unglück, Haustür, phonologische und graphematische Wörter entsprechen sich nicht. Sowohl die trennbaren als auch die untrennbaren Partikelverben sind in Kontaktstellung zwei phonologische Wörter, aber jeweils ein graphematisches Wort. Morphologisch und syntaktisch sind Wörter wie umfáhren und úmfàhren zu unterscheiden. Flexionsmorphologisch wird zunächst zwischen Wortform und Wort unterschieden – Wortformen sind die flektierten Formen. In den anderen Bereichen wäre dies eine weitführende theoretische Diskussion, die hier nicht ihren Platz hat. In diesem Zusammenhang scheint der Begriff der Wortform sinnvoll – das ist die Form, die in syntaktischen Zusammenhängen auftritt (z. B. „Nur Wortformen kommen in Sätzen vor, niemals Paradigmen oder lexikalische Wörter“ Eisenberg 2013c, 14). Wörter hingegen sind solche flektierbaren grammatischen Einheiten, die über eine einheitliche Flexion verfügen (Wurzel 2000, 36). Damit sind die meisten Komposita und
Das Wort in der (Recht-)Schreibung
417
die meisten Ableitungen im heutigen Deutschen flexionsmorphologische Wörter: Haustür oder Prüfung werden erst nach vollzogener Wortbildung flektiert wie Haustüren oder Prüfungen. Interessant ist in diesem Zusammenhang, ob es ‚interne Flexion‘ gibt. Hier werden vor allem die Fugenelemente genannt wie in Kind-er-garten, Gottes-dienst, Bedarf-s-analyse. Die neuere Forschung zeigt aber, dass die Fugenelemente eine andere Funktion haben (Aronoff/Fuhrhop 2002; Nübling/Szczepaniak 2011); die Form der Fuge ändert sich nicht nach der Funktion des Wortes insgesamt (des Kindergartens, die Gottesdienste, den Bedarfsanalysen, nicht ich spreche von des Bedarfs Analysen, *der Kinder Gartens). Daher handelt es sich nicht um interne Flexion. Das ist anders bei dem viel zitierten Fall Langeweile; hier scheint durchaus im Genitiv der Langenweile (wie der langen Weile, der langen Schlange) möglich zu sein. Das wäre also ein Fall, in dem möglicherweise zwei flexionsmorphologische Wörter vorliegen, aber nur ein graphematisches Wort. Den umgekehrten Fall finden wir möglicherweise bei der Flexion von Namen – ein klassischer Fall wäre, dass Vor- und Familienname, wenn sie gemeinsam stehen, im Deutschen rechtsköpfig flektieren. Angela Merkel ist flexionsmorphologisch ‚ein‘ Wort wie in Angela Merkels Politik; diskutiert wird hier entweder die „Wortgruppenflexion“ wie im Englischen (s. auch 3.1) oder die Interpretation als „Namenkompositum“ (Nübling/Fahlbusch/Heuser 2012, 47). Bei der Interpretation als Kompositum wäre es morphologisch ein Wort, graphematisch wären es zwei. Auch hier entwickeln Eigennamen eine eigene Grammatik. Das Kriterium der Flektierbarkeit ist selbstredend nur für Wörter von flektierbaren Wortklassen relevant und auch hier ist es nur anwendbar, wenn die entsprechenden Wörter in syntaktischen Funktionen stehen, in denen sie auch flektiert werden können: Also weder schwer_beschädigt(e/es) noch nicht_öffentlich können mit diesem Kriterium (eindeutig) beschrieben werden, da nicht nicht flektierbar ist. Hier entsprechen sich aber flexionsmorphologische und graphematische Möglichkeiten, s. 2.2, s. auch Fuhrhop (2007, 104 ff.). Wortbildungsmorphologische Wörter sind durch Wortbildung entstanden, insbesondere durch reguläre Ableitung (Wissen-schaft-ler-in), Komposition (Fuß-ball-spiel) und durch die Kurzwortbildung (Prof, Uni, BGB s. auch 2.4 sowie Römer in diesem Band). Durch Ableitungen und Komposita entstehen komplexe Wörter. Jacobs (2005) hat den wortbildungsmorphologischen Wortbegriff explizit für die Beschreibung der Getrennt- und Zusammenschreibung benannt. Die konkrete Behandlung folgt in 2.2. Als problematisch können zwei Typen von vermeintlichen Wortbildungen herausgegriffen werden: erstens die Rückbildung und zweitens die Univerbierung. Die Univerbierung (zwei ehemals selbstständige Wörter verschmelzen bei häufigem gemeinsamen Auftreten zu einem) ist mit Jacobs (2005, 107) eindeutig kein Wortbildungsprozess – bei der Univerbierung verschwindet eine syntaktische Grenze; es ist somit ein syntaktischer Prozess und im Allgemeinen auch ein historischer Prozess (z. B. aufgrund). Auch die Rückbildung ist kein regulärer Wortbildungsprozess. Drei Beispiele sollen das verdeutlichen: 1. Kuchen essen, 2. bausparen, 3. Rad_fahren.
418
Nanna Fuhrhop/Franziska Buchmann
Aus der Konstruktion jemand isst Kuchen kann ein (Rektions-)Kompositum Kuchenesser gebildet werden; möglicherweise über die Zwischenschritte essen – Esser – Kuchenesser. Die Bildung von Kuchenesser wäre eine normale Substantivkomposition. Nun könnte aus Kuchenesser per Rückbildung Kuchen_essen gebildet werden; dieses wird sofort syntaktisch interpretiert, und zwar Kuchen als Objekt zu essen. Trotz einer Rückbildung entsteht hier quasi nichts Neues; der Prozess ist keine Wortbildung, durch den ein neues Wort entsteht. Auch von einem Substantivkompositum Bausparer (sparen – Sparer – Bausparer) kann das Verb bausparen (möglicherweise über einen substantivischen Infinitiv Bausparen) abgeleitet werden (im DWDS-Kernkorpus taucht Bausparer 1929 das erste Mal auf, Bausparen 1951); es handelt sich aber nicht um ein Rektionskompositum, weil bau/Bau weder das Objekt noch das Subjekt zu sparen ist. Interessant ist, dass dennoch ein Verb bausparen gebildet werden kann; dieses zeigt aber kein vollständiges Paradigma. Die Formen, in denen eine Entscheidung über syntaktische Trennbarkeit getroffen werden müsste, existieren nicht, weil entweder im Infinitiv oder in Verbletztstellung vorkommt: weil er bauspart, wer viele Jahre bauspart, … – *er spart b/Bau, *er bauspart schon seit zwei Jahren. Hier ist durch Rückbildung ein neues, aber nicht vollwertiges Verb entstanden; dies zeigt, dass Rückbildung nicht im gleichen Sinn ein Wortbildungsprozess ist wie zum Beispiel die nominale Komposition. rad_fahren ist trennbar: er fährt r/Rad. Auch Radfahrer ist möglicherweise ein Kompositum aus Rad und Fahrer, aber es ist nicht eindeutig ein Rektionskompositum bzw. Rad verhält sich in der Konstruktion nicht unbedingt wie ein Akkusativobjekt, ich fahre Rad ≠ ich fahre das Rad. In diesem Fall hat eine Rückbildung zu einem Verb mit einem vollständigen Paradigma geführt, aber nicht mit der Interpretation von Rad als Objekt. Der Prozess der Rückbildung ist kein regulärer Wortbildungsprozess, sondern er ist sehr eingeschränkt. Es entstehen nicht unbedingt neue Verben mit vollständigen Paradigmen. Das syntaktische Wort ist die Grundeinheit des Satzes. Es wird syntaktisch nicht weiter analysiert, s. auch Gallmann (1999, 272). Andererseits sind syntaktische Wörter syntaktisch interpretierbar. Beide Kriterien hängen deutlich von der jeweiligen syntaktischen Theorie ab. Gerade für die Bestimmung von syntaktischen Wörtern werden Hilfskriterien herangezogen. Viele graphematische Wörter sind sowohl mit phonologischen, flexionsmorphologischen, wortbildungsmorphologischen als auch mit syntaktischen Wörtern deckungsgleich, aber nicht alle.
Das Wort in der (Recht-)Schreibung
419
2.2 Spatien und die Getrennt- und Zusammenschreibung Im Folgenden soll das Wort in der (Recht-)Schreibung dargestellt werden, es geht also um das System der Getrennt- und Zusammenschreibung. Es gilt: „Ein Wort wird zusammengeschrieben. Ein Syntagma wird nicht zusammengeschrieben“ (Fuhrhop 2010, 237) bzw. „Handelt es sich um die Bestandteile von Wortgruppen, so schreibt man sie getrennt. Handelt es sich um die Bestandteile von Zusammensetzungen, so schreibt man sie zusammen“ (Amtliches Regelwerk 2006, 33). Um herauszufinden, ob zwei nebeneinanderstehende Einheiten ein Wort oder ein Syntagma sind, gelten damit für die heutige Getrennt- und Zusammenschreibung im Deutschen ein wortbildungsmorphologisches und ein syntaktisches Prinzip. Nach dem Wortbildungsprinzip werden nebeneinanderstehende Einheiten aus zwei oder mehr Stämmen zusammengeschrieben, wenn sie durch einen Wortbildungsprozess verbunden sind. Nach dem Relationsprinzip werden zwei nebeneinanderstehende Einheiten dann zusammengeschrieben, wenn eine der beiden Einheiten keine syntaktische Relation zu einer anderen Einheit im Satz erfüllt. Beide Einheiten stehen also in einer syntaktischen Beziehung. Erfüllen zwei nebeneinanderstehende Einheiten zwei unterschiedliche syntaktische Funktionen, gilt Getrenntschreibung. Im Folgenden wird kurz gezeigt, wie die Prinzipien im Kernbereich der Getrennt- und Zusammenschreibung anzuwenden sind. Das Wortbildungsprinzip formuliert quasi die Möglichkeiten, das syntaktische Prinzip wählt aufgrund der konkreten sprachlichen Form aus. (2) Er kocht Erbsensuppe. Er kocht aus Erbsen Suppe.
Sowohl Erbsensuppe als auch Erbsen und Suppe sind mögliche Wörter des heutigen Deutsch. Nun sagt das Wortbildungsprinzip, dass Erbsensuppe durchaus ein mögliches Wort des Deutschen ist, aber es wird in den beiden konkreten Beispielen einmal zusammen- und einmal getrennt geschrieben. Die zusammengeschriebene Wortform Erbsensuppe ist als Determinativkompositum aus einem Wortbildungsprozess entstanden; die Einheit Erbsensuppe hat insgesamt eine syntaktische Funktion zu den anderen Einheiten im Satz. Es ist das direkte Objekt zum Verb kochen. In einem Satz *Er kocht Erbsen Suppe kann einer der beiden Einheiten keine Funktion zugewiesen werden. Dies ist anders in Er kocht aus Erbsen Suppe. Hier gehören Erbsen und Suppe zwei unterschiedlichen Satzgliedern an. Erbsen gehört zum Adverbial (aus Erbsen), Suppe ist hier ‚alleine‘ das direkte Objekt. Die Prinzipien wirken bei allen Kompositumsstrukturen, so auch für grün_tee, glatt_eis, neben_fluss usw. wie in Die beliebtesten Radwege verlaufen neben Flüssen – er kennt die Nebenflüsse des Rheins. Für einen Kernbereich kann die Getrennt- und Zusammenschreibung so rekonstruiert werden. Für Fälle wie rad_fahren, bau_sparen wurden die Gründe für eine mögliche Variation schon genannt; sowohl der Wortbildungsprozess ist nicht regelmäßig als auch die syntaktischen Funktionen; keine der beiden Schreibungen ist also wirklich
420
Nanna Fuhrhop/Franziska Buchmann
durch die Prinzipien erfasst, womit sich die Variation in der Schreibung ergibt. Dieser Zwischenbereich ist nur mit Einzelfallfestlegungen zu regeln, wenn man ihn nicht ungeregelt lassen möchte. Die aktuelle Amtliche Regelung nimmt hier Einzelfallfestlegungen vor, und zwar für die Fälle, die zusammengeschrieben werden dürfen (eislaufen, kopfstehen). Instruktiv ist auch die Schreibung von Partizipien mit ihren vermeintlichen Ergänzungen: freudestrahlend – vor Freude strahlend, videoüberwacht – vom Video überwacht. Die Partizipien verhalten sich zum Teil verbal, zum Teil adjektivisch; in der adjektivischen Verwendung können sie Komposita bilden und werden dann zusammengeschrieben, in der verbalen nehmen sie Ergänzungen. Wenn die Ergänzung einfach (also z. B. keine Präpositionalgruppe) ist, ergeben sich zwei mögliche Schreibungen (die ratsuchenden Bürger, die Rat suchenden Bürger, Amtliche Regelung 2006, 39).
2.3 Das markierte graphematische Wort: Die Wortzeichen Im Kernwortschatz des Deutschen gibt es drei Wortzeichen: den Abkürzungspunkt, den Divis (Binde-, Trenn- und Ergänzungsstrich) und den Apostroph. Wortzeichen sind nicht-verbalisierbare und nicht-alphabetische Zeichen innerhalb eines graphematischen Worts und dienen seiner Strukturierung. Nicht-Verbalisierbarkeit meint, dass diese Zeichen nicht gesprochen werden. Die Wortzeichen bilden ein formales und funktionales System, das das System der Interpunktionszeichen (Bredel 2008) ergänzt. (3) a. u. a. für kommandieren, für kommandiert b. für keine besonderen Vorkommnisse c. für Nachrichtenabteilung (4) a. Elisionsapostroph: gibt’s, hab‘ (Bankhardt 2010) b. Stammformapostroph: Berlin’s (Scherer 2010), Schlöss’chen (Klein 2002), Charles‘, König’s, Günther’schen (Bankhardt 2010) (5)
a. ABM-Stelle, Tel.-Nummer, „Big Brother“-Kandidat b. Casablanca-Bühne, Alumni-Tag c. Alu-Leiter, Bio-Produkte d. Rund-um-die-Uhr-Bereitschaft e. Hans-Dampf-in-allen Gassen
(6) a. be- und entladen b. Haus-[Zeilenende]tür, ver-[ZE]laufen, Kin-[ZE]der
In (3–6) stehen typische Beispiele der verschiedenen Vorkommen der Wortzeichen im Deutschen. Nicht jeden Eintrag findet man in jeder Textsorte: Die Schreibungen mit Abkürzungspunkt sind einem Abkürzungswörterbuch (Steinhauer 2005) ent-
Das Wort in der (Recht-)Schreibung
421
nommen, in für die Standardschriftsprache typischen Fließtexten lassen sich diese Einträge nicht finden, wohl aber andere Lexeme gleicher Struktur ( für so genannte, für vergleiche, für zum Beispiel, für Telefonnummer). Die Schreibungen mit Apostroph stammen aus unterschiedlichen Untersuchungen, die auf verschiedenen Textsorten basieren. Klein (2002, 180) verweist beispielsweise auf Internetseiten, auf denen Nutzer/innen Schreibungen mit einem Foto dokumentieren. Scherer (2010) untersucht den Apostrophgebrauch vor -s in drei Korpora – dem DWDS-Kernkorpus von 1900 bis 1999 (mit den Textsorten Belletristik, Gebrauchsliteratur, Wissenschaftstexte und Zeitungstexte), den Ausgaben der Berliner Zeitung (1994–2005) sowie den Ausgaben der Potsdamer Neuesten Nachrichten (2003–2005). Bankhardt (2010) untersucht ebenfalls ein Zeitungskorpus, den Mannheimer Morgen (alle Dezemberausgaben 2004). Besonders Schreibungen mit Apostroph werden von interessierten Laien emotional diskutiert (beispielsweise auf der Seite www.deppenapostroph.de). Hier finden sich Schreibungen, die in einem Zeitungskorpus wegen des Lektorats kaum anzutreffen sind. Dies zeigt sich an der Datenliste von Bankhardt (und für ‘s auch bei Scherer) im Vergleich zu Klein. Die Schreibungen mit Bindestrich entstammen ebenfalls dem Mannheimer Morgen-Korpus (Januar 1995 bis Juli 2008). Die Wortzeichen bilden folgendes formales und funktionales System:
.
-
‘
Abb. 1: Anordnung der Wortzeichen in den Schreibbändern
Die drei Zeichen stehen im Drei-Bänder-System der Schrift (s. Abbildung 1, die vier Linien ergeben drei Schreibbänder) dort, wo typischerweise Interpunktionszeichen stehen: Der Punkt steht auf der Grundlinie, der Divis im Mittelband, der Apostroph im Oberband. Das Unterband ist unbesetzt. Alle drei Zeichen nutzen darüber hinaus die Möglichkeiten der räumlichen Ausdehnung innerhalb der Schreibbänder aus: Der Punkt hat keine Ausdehnung, der Divis eine horizontale, der Apostroph eine vertikale. Damit besteht zwischen Raum und Form eine eineindeutige Beziehung. Die drei Zeichen bilden ein in sich kompaktes System. Bredel (2008, 173 ff.) hat das System der syntaktischen Zeichen (das Teilsystem ) ähnlich analysiert. Die jeweils für sich konsistenten Teilsysteme führen beim Punkt zu einem Zusammenstoß. Sowohl der Satzpunkt als auch der Abkürzungspunkt sehen formal gleich aus und befinden sich an derselben Stelle in den Schreibbändern. Was sie aber unterscheidet, ist ihr Potential, mit anderen Zeichen zu konkatenieren (zum Begriff Konkatenation s. 2.3.1). Damit einher geht ihre unterschiedliche Funktion (zum Satzpunkt vgl. Bredel 2008, 191 ff., zum Abkürzungspunkt s. 2.3.1). Die Funktionsweisen und damit die Besetzung der verschiedenen Operationsdomänen durch die einzelnen Wortzeichen werden nachfolgend in den Kapiteln 2.3.1, 2.3.2 und 2.3.3 erläutert.
422
Nanna Fuhrhop/Franziska Buchmann
Wortzeichen
. ‘ -
Operationsdomäne
Graphematik
Phonologie
Flexion
Derivation
Komposition
Syntax
Abb. 2: Die Operationsdomänen der Wortzeichen
Die unterschiedliche Graphotaktik des Satzpunkts und des Abkürzungspunkts, also die unterschiedliche graphematische Kombinatorik der beiden Zeichen mit anderen Zeichen, sowie die damit verbundenen unterschiedlichen Funktionen führen auch zu der Frage, ob die Wortzeichen Teil des graphematischen Wortes sind. In 2.4 wird gezeigt, dass gerade der Kürzungsprozess bei Abkürzungen eine Wortbildung ist, und zwar – und das zeichnet sie besonders aus – eine, die nur auf der graphematischen Ebene stattfindet, eine graphematische Wortbildung. Der Abkürzungspunkt ist wesentlicher Teil dieser Wortbildung und ist syntaktisch nicht analysierbar. Der Satzpunkt hingegen muss syntaktisch analysiert werden. Daraus ergibt sich quasi mit den oben genannten Prinzipien zur Getrennt- und Zusammenschreibung die ‚Zusammenschreibung‘ des Abkürzungspunktes mit der Abkürzung (Wortbildungsprinzip) und die ‚Getrenntschreibung‘ des ‚Satzpunktes‘ mit dem Satz (Relationsprinzip). Eine tatsächlich unterschiedliche Schreibung ist aber aufgrund der Form des Punktes nicht möglich: Eine echte Zusammenschreibung im Sinne des Wortbildungsprinzips bei zum Beispiel verbundenen Handschriften würde den Punkt unsichtbar machen; eine echte Getrenntschreibung im Sinne des Relationsprinzips jedoch widerspricht dem Punkt als ‚klitischem‘ Zeichen. Der Punkt ist ein Klitikon (‚das Anlehnende‘) und lehnt sich an die vorhergehende graphische Einheit an (vgl. Bredel 2008, 34). Der Abkürzungspunkt gehört damit zum graphematischen Wort; der Satzpunkt als syntaktisches Zeichen hingegen kann potentiell an jedes graphematische Wort treten und gehört damit nicht zum graphematischen Wort. Neben diesen drei wurden weitere Zeichen als Wortzeichen vorgeschlagen, beispielsweise der Schrägstrich in Schreibungen wie Schüler/innen oder Moll-/OttoBraun-Straße (vgl. Engel 2004, 463). Im Unterschied zu den Wortzeichen wird der Schrägstrich sehr wohl verbalisiert, auch wenn die Art und Weise unterschiedlich ist: Schüler/innen wird als Schüler und Schülerinnen oder Schüler oder Schülerinnen; Moll-/Braunstraße steht für Mollstraße Ecke Braunstraße. In Schreibungen wie 50 Euro/Schnitt wird sogar ein relationales Verhältnis (‚pro/je‘) eröffnet. Wegen der Verbalisierbarkeit ist der Schrägstrich also kein Interpunktionszeichen (Bredel 2008, 24).
Das Wort in der (Recht-)Schreibung
423
2.3.1 Der Abkürzungspunkt Der Abkürzungspunkt steht auf der Grundlinie des Schreibliniensystems und weist keinerlei Ausrichtung auf, weder horizontal noch vertikal (s. Abbildung 1). Der Abkürzungspunkt steht bei graphischen Einheiten, die keine Entsprechung in der Lautung haben: wird nicht [fau.ge.ʔɛl] oder [fɛgl] ausgesprochen, sondern [fʁ.glai.çə]. Es handelt sich bei Abkürzungen um eine rein graphische Form, der Abkürzungspunkt operiert also auf rein graphematischer Ebene (s. Abbildung 2). Dies und die Anwesenheit des Abkürzungspunkts unterscheiden Abkürzungen von Kurzwörtern (ABM, Uni). Es gibt vier (große) Strukturtypen bei den Abkürzungen: Abkürzungen mit kompakten Buchstaben (, ), Abkürzungen ohne kompakte Buchstaben (, ), Abkürzungen mit einem Divis (, ) und Abkürzungen mit internen Punkten (, ). Kompakte Buchstaben sind rein innergraphematisch ermittelte Buchstaben, die im Kern der graphematischen Silbe stehen; es sind also quasi „Vokalbuchstaben“ (zur Definition kompakter Buchstaben und zur graphematischen Silbe vgl. Fuhrhop/Buchmann 2009). Alle Buchstaben bestehen aus zwei hierarchisch geordneten Bestandteilen, einem Kopf und einer Koda, so hat z. B. |d| einen langen Kopf |l| und eine runde Koda |c|. Die Kopflänge eines Buchstaben bestimmt über seine Position in der Längenhierarchie und damit in der graphematischen Silbe, langköpfige Buchstaben (beispielsweise p, d, t, k) stehen im Silbenrand, kompakte Buchstaben (beispielsweise a, o, e) stehen im Silbenkern (vgl. dazu Primus 2004, Fuhrhop/Buchmann 2009). Abkürzungen werden durch zwei Verfahren gebildet: durch Abbruch und durch Zusammenziehung. Bei einem Abbruch wird in der Regel vor dem zweiten kompakten Buchstaben der Langform die Kurzform „abgebrochen“: zu ; bei einer Zusammenziehung werden verschiedene Buchstaben der Langform zu einer Kurzform kombiniert: zu . Hier werden einfach aufgebaute Abkürzungen gebildet. Kombinatorisch aufgebaute Abkürzungen kombinieren die beiden Bildungsweisen miteinander: , . Die verschiedenen Strukturtypen weisen unterschiedliche Buchstabenanzahlen und damit Wortlängen auf: Einfach aufgebaute Abkürzungen umfassen in der Regel drei oder vier Buchstaben und bilden im Allgemeinen graphematische Silben; die Länge der Buchstabenköpfe nimmt also von den Rändern zum Kern hin kontinuierlich ab (s. Fuhrhop/Buchmann 2009). Sie bilden Silben mit folgender Abstufung: komm. > kand. > abk. > abr. > kgl.
424
Nanna Fuhrhop/Franziska Buchmann
lexikalisches Wort
phonologische Silbe
graphematische Silbe
komm.
+
+
+
kand., amb.
–
+
+
abk., altk.
–
–
+
abr., atm.
–
–
?
kgl.
–
–
–
Abb. 3: Silbenartigkeit der einfach aufgebauten Abkürzungen
Die Buchstabenfolge in ist ein lexikalisches Wort und nur der Punkt unterscheidet hier zwischen der Verbform (komm als Imperativ) und der Abkürzung (komm. für kommandieren). Es ist aber auch eine phonologische (aufgrund der Sonorität) und eine graphematische Silbe (aufgrund der Kopflänge). Die durch Abbruch entstandenen Abkürzungen können graphematische Silben ( für abkürzen, für atmosphärisch) bilden, manchmal auch phonologische ( für kandidieren, für ambulant). Nicht alle graphematischen Silben entsprechen hier der Graphotaktik der Buchstaben, wie sie in prototypischen graphematischen Wörtern ermittelt wurde: In nimmt zwar die Länge der Buchstabenköpfe vom Kern zu den Rändern zu; die Abfolge von |b| und |k| verletzt aber die Graphotaktik. Es ist durchaus eine Frage, ob Abkürzungen der Graphotaktik folgen müssen. für u. a. abrechnen und für atmosphärisch weisen im Endrand einen Verstoß gegen das graphematische Silbenbaugesetz auf, da die Kopflänge nach |b, t| wieder abnimmt. Die Formen bilden damit den Übergang zu Abkürzungen, die durch Zusammenziehung entstanden sind (kgl.). Diese Abkürzungen bilden eindeutig keine graphematischen Silben, da ihnen der dazu nötige graphematische Silbenkern fehlt. Insgesamt ist interessant, dass die Tendenz ganz klar zu drei- bzw. vierbuchstabigen Formen geht, also gerade nicht zu einbuchstabigen, wie man zunächst vermuten könnte. Abkürzungen sind also nicht so kurz wie möglich, sondern sie präferieren eine graphematische Silbenstruktur und damit eine bestimmte Wortlänge. Der Abkürzungspunkt steht nie zu Beginn einer Einheit; er konkateniert also nach links nie mit einem Spatium. Konkatenation beschreibt (ähnlich wie der Begriff Graphotaktik) die Abfolgeregularitäten zweier Zeichen, ohne dabei zu unterstellen, dass die jeweiligen Zeichen innerhalb ihrer Segmentklasse kombinierbar sind. Beispielsweise sind Buchstaben untereinander kombinierbar und ebenso Ziffern: Hier werden mit den graphischen Wörtern oder Zahlen neue, größere Einheiten gebildet. Die Interpunktionszeichen dagegen sind untereinander nur bedingt konkatenierbar, aus ihren Zeichenfolgen entstehen keine größeren Einheiten. Daher sind Interpunktionszeichen nicht-kombinierbar (vgl. Bredel 2008, 23, 34 f.). Konkatenation ist ein formaler Begriff, Kombinierbarkeit ist ein funktionaler (vgl. Bredel 2008, 34 f.). Geht es um Konkatenation, wird also nur geprüft, welche zwei Zeichen (auch aus unter-
Das Wort in der (Recht-)Schreibung
425
schiedlichen Segmentklassen) nebeneinander stehen können. Nach rechts kann der Abkürzungspunkt mit einem Spatium, mit einem Divis oder mit weiteren Buchstaben konkatenieren. Im ersten Fall steht der Abkürzungspunkt asymmetrisch, die Abkürzung ist einfach aufgebaut (, wobei der Unterstrich hier das Spatium anzeigt); in den beiden letzteren Fällen steht der interne Abkürzungspunkt symmetrisch, die Abkürzungen sind kombinatorisch aufgebaut (, , vgl. dazu Bredel 2008, Buchmann 2012). Der Abkürzungspunkt kennzeichnet Buchstabenfolgen als lexikalisch unvollständige Einheiten. Steht der Abkürzungspunkt, erkennt der Leser, dass die Buchstabenfolge alleine kein lexikalisches Wort ergibt. Der Abkürzungspunkt löst damit auch einen Suchprozess aus. Die Abkürzungen können in frequente und nicht-frequente Abkürzungen unterschieden werden: Frequente Abkürzungen sind im Schriftspracherwerb erworben und als Ganze gespeichert. Die Langformen nicht-frequenter Abkürzungen müssen im Kontext gesucht werden; die Abkürzung erhält so ihr fehlendes lexikalisches Material.
2.3.2 Der Apostroph Der Apostroph steht im Oberband des Schreibliniensystems und hat eine vertikale Ausrichtung (s. Abbildung 1). Mit Klein (2002) können Elisionsapostrophe (7.a) und Stammformapostrophe (7.b, c) unterschieden werden. (7) a. gibt’s, hab‘ (Bankhardt 2010) b. P eter‘s, Matthias‘ c. König’s (Bankhardt), Schlöss’chen (Klein 2002), Günther’schen, DRK’ler (Bankhardt 2010)
Mit dem Stammformapostroph werden vor allem Flexions- oder Derivationsmorpheme segmentiert. In Matthias‘ ist der Apostroph alleiniger Flexionskennzeichner; die Schreibung zeigt hier Flexion, die in der gesprochenen Sprache keine Kennzeichnung hat, es ist quasi ein Fall von ‚graphematischer Flexion‘ – so auch die graphematische Wortbildung, s. 2.4. Der Apostroph operiert damit auf der graphematischen, der phonologischen sowie der flexions- und derivationsmorphologischen Ebene (s. Abbildung 2). Bankhardt (2010) hat den Apostrophgebrauch im Mannheimer MorgenKorpus, also in der Standardschriftsprache, untersucht. Hier finden sich keine Schreibungen vom Typ Schlöss’chen wie in Klein’s Internetkorpus (2002). Bankhardt hat alle Apostrophschreibungen aus den Dezemberausgaben des Mannheimer Morgens im Jahre 2004 klassifiziert und zeigt, dass der Apostroph sowohl als Elisionsapostroph als auch als Stammformapostroph quantitativ bei -s und bei Eigennamen steht. Das Pronomen es, das als ‘s einer Wortform angehängt wird (), ist der häufigste Elisionsapostroph, mit 448 von 464 Tokens aller Kontraktionen und einer Gesamtzahl von 623 aller Elisionsapostrophe (Bankhardt 2010, 59 ff.). In diesem Korpus tauchen
426
Nanna Fuhrhop/Franziska Buchmann
relativ wenige Stammformapostrophe auf: 190 Tokens auf 116 Types (im Vergleich zu 623 Elisionsapostrophtokens auf 154 Types). Die 116 Types verteilen sich auf die Markierung von Genitiven, Pluralen und Ableitungen auf -ler und -sch. Es überwiegt der Apostroph bei Eigennamen (PRP), die im Genitiv stehen (s. Teuber 2000, der hier zwei verschiedene Genitive für das Deutsche ansetzt): Vorkommen
Types aus 116
Tokens aus 190 Beispiel
PRP im Genitiv, die einen [s]Laut im Nominativ aufweisen
37
60
Charles‘
PRP mit Genitiv-s
28
51
König’s
PRP mit Derivation auf -sch
28
52
Günther‘schen
Abb. 4: Stammformapostrophe bei Eigennamen
Mit diesen Vorkommen ist ein Großteil der Stammformapostrophe in diesen Zeitungstexten beschrieben; es handelt sich immerhin um 93 Types von insgesamt 116 sowie um 163 Tokens von insgesamt 190. Mit einem Blick in die Phonologie überrascht der Apostrophgebrauch bei Buchstaben, die mit einem [s]-Laut korrespondieren, nicht. [s]-Laute können jeder Silbe im Deutschen auch extrasilbisch folgen, also mit [s] steigt die Sonorität, ohne dass es eine neue Silbe wäre. Genau hier hat sich ein zunächst regelwidriger Apostrophgebrauch durchgesetzt, der 1996 im Amtlichen Regelwerk legalisiert wurde (vgl. Deutsche Rechtschreibung 1995, § 97, E). Bankhardt hat außerdem Schreibungen wie DRK’ler gefunden. Bei solchen Ableitungen auf -ler handelt es sich um einen echten Übergangsbereich zum Bindestrich, denn im Mannheimer Morgen finden sich alternative Schreibungen, in denen anstelle des Apostrophs ein Bindestrich steht: FH-ler – FH’ler. Das entsprechende Wortzeichen steht hier bei einem graphisch markierten Kurzwort, die Wortform ist deriviert und das Affix wird graphisch unmarkiert geschrieben. Die Schrift sucht hier eine Möglichkeit, diesen Übergang zwischen graphisch markierter und graphisch unmarkierter Schreibung zu kodieren. Der Apostroph kann als Elisionsapostroph nach links oder rechts sowohl mit einem Spatium als auch mit einem Buchstaben konkatenieren. Der Elisionsapostroph kann also sowohl am Anfang, in der Mitte als auch am Ende einer Einheit stehen. Der Stammformapostroph konkateniert nach links nur mit Buchstaben, nach rechts mit Buchstaben und mit dem Spatium. Der Stammformapostroph steht damit nicht zu Beginn einer Einheit.
2.3.3 Der Divis Der Divis steht über der Grundlinie im Mittelband des Schreibliniensystems und weist eine horizontale Ausrichtung auf (s. Abbildung 1). Er kommt zwar in drei verschiede-
Das Wort in der (Recht-)Schreibung
427
nen Kontexten vor – als Trennstrich am Zeilenende, als Ergänzungsstrich und als Bindestrich –, hat aber insofern nur eine Funktion, als er zeigt, dass ein Wort noch nicht vollständig ist, er ist quasi das Gegenzeichen zum Leerzeichen (vgl. Bredel 2008), zur Funktion des Divis s. unten. Der Divis weist gegenüber dem Abkürzungspunkt oder Apostroph den größten Umfang der Operationsdomänen auf: Er reicht von der Graphematik über die Phonologie und die Morphologie (Derivation und Komposition) bis in die Syntax (s. Abbildung 2). Der Trennstrich trennt ein graphematisches Wort in verschiedene graphematische Silben. Dabei kann die Grenze eine Morphemgrenze sein: Bei Präfixen und Komposita ist dies die übliche Trennstelle: , . Bei Suffixen, die mit einem nicht-kompakten Buchstaben (also einem ‚Konsonantenbuchstaben‘) beginnen, ist dies ebenfalls eine mögliche Trennstelle: . Ansonsten ist durchaus umstritten, was genau getrennt wird, s. Eisenberg 2013a, 307 f. Festzuhalten ist, dass bei der Trennung graphematisch wohlgeformte Silben entstehen. Entscheidend ist, dass beide Teile wenigstens jeweils einen Vokalbuchstaben (kompakten Buchstaben) enthalten und bei Vorhandensein genau ein Konsonantengraphem auf die nächste Zeile gezogen wird (ebd. 2013a, 307) (, , , ). Bei Suffixen, die mit einem kompakten Buchstaben beginnen, entsprechen sich die morphologische Grenze und die Trennstelle dann gerade nicht: Bie-gung, Leh-rer, gei-zig. Insofern kann hier ein Zusammenhang mit einer phonologischen Syllabierung gesehen werden. Der Ergänzungsstrich steht immer an Morphemgrenzen: , (Bredel 2008, 112), . Er kann aber gerade nicht bei Suffixen stehen, die mit einem kompakten Buchstaben beginnen: * (Smith 2000, 60). Er operiert also sowohl morphologisch als auch phonologisch. Der Bindestrich schließlich operiert auf der morphologischen Ebene, und zwar vereinzelt in der Derivation () und vor allem in der Komposition (, ) sowie auf syntaktischer Ebene (). Der Trennstrich am Zeilenende unterliegt bestimmten Regeln und wird genau dann genutzt, wenn mehr oder weniger zufällig ein Zeilenende ansteht; ohne Zeilenende würde schlichtweg ein graphematisches Wort geschrieben werden. Der Ergänzungsstrich unterliegt eindeutig nicht rein graphematischen Notwendigkeiten; im Prinzip ist er möglich, wenn eine entsprechende Konstruktion auch in der gesprochenen Sprache möglich ist; daher auch die Unmöglichkeit bei vokalisch anlautenden Suffixen. Der Bindestrich hingegen ist eine rein graphematische Markierung, die im Allgemeinen im Deutschen zunächst eine Alternativschreibung zur Zusammenschreibung ist. Aus diesem Grund wird die Systematik des Bindestrichs hier etwas genauer betrachtet; sie scheint weniger deutlich zu sein. Er steht vor allem in Substantiven, in Adjektiven (Kopulativkomposita) und in Syntagmen, die als ein syntaktisches Wort fungieren:
428 (8)
Nanna Fuhrhop/Franziska Buchmann
a. ABM-Stelle, Tel.-Nummer, „Big Brother“-Kandidat, b. Casablanca-Bühne, Alumni-Tag, c. Alu-Leiter, Bio-Produkte, d. die Rund-um-die-Uhr-Bereitschaft, e. der Hans-Dampf-in-allen-Gassen, f. rot-grün, deutsch-russisch, marxistisch-leninistisch.
In (8.a) stehen Bindestriche in Komposita mit einem graphisch markierten Bestandteil: ein Kurzwort in durchgängiger Majuskelschreibung, eine Abkürzung mit einem Abkürzungspunkt, ein mehrteiliger fremder Eigenname in Anführungszeichen. Die graphische Auszeichnung dieser Kompositionsglieder ruft einen obligatorischen Bindestrich hervor: (9) – *, *.
In (8.b,c) stehen Bindestriche in Komposita mit graphisch unmarkierten Bestandteilen; diese rufen einen fakultativen Bindestrich hervor: (10) a. – , – , b. – , – .
Diese fakultativen Bindestriche stehen vor allem zwischen Fremdwörtern und/oder Eigennamen und einem Wort aus dem Kernwortschatz (10.a). Betrachten wir nun die Schreibungen in (10.b) genauer: Alu gilt wortbildungsmorphologisch als Kurzwort (vgl. u. a. Kobler-Trill 1994). Es ist aus einem Abbruch entstanden und damit ein unisegmentales Kurzwort. Der Bindestrich zwischen Alu und Leiter ist fakultativ. Analysiert man alle graphisch unmarkiert geschriebenen Kurzwörter, die mit einem Bindestrich segmentiert werden, wird deutlich, dass diese Kurzwörter auch Fremdwörter sind, in diesem Fall Aluminium. Alu vereint also zwei (morphologische) Kriterien der Bindestrichschreibung: Es handelt sich um ein Kurzwort aus dem Fremdwortschatz, s. Buchmann 2015. Auch die Schreibung Bio-Produkte (10.b) ist nur im Zusammenhang zu verstehen: Ex-Freundin, Mini-Club, Öko-Steuer, Extra-Klasse, Super-Sommer, Anti-Held. Diese Schreibungen zeigen die gesamte Dimension: es handelt sich um mit dem Bindestrich segmentierte Einheiten, die als Konfixe (s. unten) oder fremde Präfixe gehandelt werden (Eisenberg 2013a, 239; Ruf 1996, Donalies 2005[=2000]). Die Frage, in welche der Kategorien diese Einheiten einzuordnen sind, kann und soll an dieser Stelle nicht beantwortet werden. Wir können aber zeigen, warum diese Einheiten durch einen Bindestrich segmentiert werden. Alle segmentierten Einheiten verändern ihr ursprüngliches morpho-syntaktisches Verhalten. Auf einer Skala stehen die Konfixe zwischen gebundenen, grammatischen Morphemen (native und fremde Affixe) und freien, lexikalischen Morphemen (Stämmen): Konfixe sind gebundene (nicht-native) Einheiten, die weder wort- noch basisfähig sind, aber eine lexikalische Bedeutung
Das Wort in der (Recht-)Schreibung
429
haben. In (11.a-c) wird deutlich, dass diese Einheiten aber mitunter wortfähig werden können. (11) a. Gemüse esse ich nur bio. b. Wir sind Ökos. c. Da bin ich anti/contra/pro.
(11.a) erinnert an das Phänomen der gespaltenen Topikalisierung (Hervorhebung durch die Verschiebung ins Vorfeld): Wein trinke ich nur roten (vgl. beispielsweise Nolda 2007). Die ‚Konfixe‘ entwickeln nach Bedarf ein Flexionsverhalten (11.b) oder stehen als Prädikatsnomen an der Stelle eines unflektierten Adjektivs (11.c). Diese Einheiten können sowohl mit fremden als auch mit nativen Stämmen kombinieren; der Bindestrich steht hier fakultativ. Allerdings kann nicht jedes Konfix oder fremdes Präfix mit Bindestrich segmentiert werden: *, *. Es sind eher diejenigen, die ein wortfähiges Verhalten entwickeln. Offensichtlich haben die Schreiber/innen (professionelle Schreiber/innen in einer Zeitungsredaktion) eine klare Intuition darüber, dass hier einzelne Einheiten einen Sprachwandel durchlaufen, und zeigen dies durch die Schreibung mit Bindestrich. In (8.d) steht ein syntagmenhaltiges Kompositionserstglied, in (8.e) ein Syntagma, das als ein syntaktisches Wort fungiert. Innerhalb der Syntagmen kann der Bindestrich nicht durch Zusammenschreibung (12.a) ersetzt werden, aber auch nicht durch Spatiensetzung (12.b). Er kann aber durch suprasegmentale Mittel der Schriftauszeichnung ersetzt werden, beispielsweise durch Kursivsetzung (12.c), Fettdruck (12.d) oder durch die Einklammerung durch Anführungszeichen (12.e): (12)
a. *, *, b. *, *, c. , , d. , , e. , .
Insgesamt zeigt sich, dass die Bindestrichnutzung bestimmten Regularitäten unterliegt. Dass insbesondere eine komplexe Struktur verdeutlicht wird, wie die Amtliche Regelung es suggeriert, konnte quantitativ nicht gezeigt werden. In der Korpusuntersuchung haben sich andere Systematiken gezeigt. Die drei Divisvorkommen sind eindeutig durch ihre Position in der Zeile und ihre Konkatenationsmöglichkeiten auseinanderzuhalten. Der Trennstrich am Zeilenende konkateniert am Zeilenende mit Buchstaben, links vom Divis steht eine Minuskel, rechts das Zeilenende, die nächste Zeile ist obligatorisch gefüllt. Sobald das graphematische Wort in eine andere Zeilenposition rückt, verschwindet der Trennstrich am Zeilenende rückstandslos. Der Ergänzungsstrich konkateniert in jeder Zeilenposition normalerweise an einer Seite mit einem Spatium und an der anderen Seite mit einer Minuskel. Das Spatium kann auch von einem anderen Interpunktionszeichen, hier
430
Nanna Fuhrhop/Franziska Buchmann
einem Komma, abgelöst werden: An-, Um- und Neubau. Rückt der Ergänzungsstrich an das Zeilenende, übernimmt er die Funktion des Trennstrichs. Der Bindestrich hat das größte Konkatenationspotential: Alle Arten von Graphemen können links und rechts vom Bindestrich stehen bis auf das Spatium und Diakritika. Es sind also Buchstaben, Ziffern, Interpunktionszeichen (beispielsweise die Anführungszeichen), der Abkürzungspunkt als Wortzeichen, Sonderzeichen (beispielsweise der Schrägstrich). Steht rechts vom Bindestrich ein Buchstabe, unterscheidet die Art der Schreibung die Zugehörigkeit zur Wortart. Steht eine Majuskel, handelt es sich um ein Substantiv bzw. den potentiellen Kern der Nominalgruppe; steht eine Minuskel, handelt es sich um ein Adjektiv (bzw. um den Teil eines Syntagmas). Während also beim Ergänzungsbindestrich ein Spatium stehen muss, ist es beim Trennstrich und beim Bindestrich regelrecht verboten. Der Bindestrich kann sowohl die Funktion des Ergänzungsstrichs als auch des Trennstrichs am Zeilenende übernehmen. Die Funktion für das Lesen ist in allen drei Divisvorkommen identisch. Er interagiert hier mit dem Spatium. Das Spatium gibt lexikalisch vollständig eingelesene Einheiten an die syntaktische Verarbeitung weiter (Bredel 2008, 99 ff.), der Bindestrich steht immer dort, wo die lexikalische Verarbeitung noch nicht abgeschlossen ist, aber aus graphematischen oder morphologischen Gründen keine Zusammenschreibung möglich ist und die syntaktische Verarbeitung aufgehalten werden muss. Dafür wird die Einheit bis zum Divis so lange zwischengespeichert, bis das nächste Spatium steht und damit alle Einheiten gelesen sind und an die syntaktische Verarbeitung weitergereicht werden können (vgl. Bredel 2008, 206 ff.).
2.4 Graphematische Wortbildung: Abkürzung und Kurzwort Die Idee, eine graphematische Wortbildung anzunehmen, ist neu. Die graphematische Wortbildung untersucht erstens die Prozesse, durch die graphische Einheiten entstehen, zweitens wie diese graphischen Einheiten strukturiert sind und drittens ob und an welchen Stellen die graphischen Einheiten ein von der Ausgangsform differentes grammatisches Verhalten entwickeln. Es geht also um eine Wortbildung, die auf der Ebene und mit den Mitteln der Schrift stattfindet. Abkürzungen und Kurzwörter/Akronyme entstehen durch die gleichen Kürzungsprozesse, nämlich Abbruch und Zusammenziehung. Während aber die Bildung von Kurzwörtern und Akronymen als Wortbildung zählt (vgl. u. a. Kobler-Trill 1994; Ronneberger-Sibold 2007; Fleischer/ Barz 2007, 52), ist dies bei den Abkürzungen bisher nicht der Fall. Dies liegt sicherlich auch daran, dass sich die Produkte graphisch unterscheiden: Jede Abkürzung endet mit einem Punkt, sowohl die durch Abbruch entstandenen Abkürzungen als auch die durch Zusammenziehung entstandenen (vgl. 2.3.1). Damit sind Abkürzungen per se graphisch markierte Wörter. Bei Kurzwörtern hingegen entstehen auf der einen Seite graphisch markierte Schreibungen wie ABM oder ASta, auf der anderen Seite graphisch unmarkierte Schreibungen wie Uni. Abkürzungen unterscheiden sich
Das Wort in der (Recht-)Schreibung
431
von Kurzwörtern durch die Anwesenheit des Abkürzungspunkts und dadurch, dass Abkürzungen nicht entsprechend der üblichen Graphem-Phonem-Korrespondenzen gesprochen werden. Sie sind damit ein rein graphisches Phänomen und es ist daher besonders interessant, dass sie silbische Strukturen aufweisen (vgl. Abschnitt 2.3.1). Abkürzungen erfüllen die Kriterien, die in der morphologischen Wortbildung diskutiert werden (vgl. Buchmann noch nicht erschienen). Typische Kriterien für Wortbildungsprodukte sind unter anderem eine eigene Bedeutung bzw. Bedeutungsverschiebung und ein verändertes Flexionsverhalten. Diese beiden Kriterien sollen hier ausreichen, um den Wortbildungscharakter von Abkürzungen anzudeuten. Eine Bedeutungsverschiebung ist deutlich bei s., vgl. zu erkennen; normalerweise würde man hier pragmatisch davon ausgehen, dass der Autor seinen Leser aus Höflichkeit siezt. Die Formen jedoch duzen den Leser (siehe – sehen Sie, vergleiche – vergleichen Sie). Auch im Flexionsverhalten ist einiges zu erkennen, die Pluralform von f. ist ff.; in einer möglichen Langform ergibt sich dies nicht (folgende). Die Abkürzungen entwickeln also Verhaltensweisen, die unabhängig von der Langform sind, und das sind genau die Kriterien, auf deren Grundlage auch Kurzwörter als Produkte von Wortbildungsprozessen gesehen werden.
3 Das graphematische Wort im Sprachvergleich Im Wesentlichen wurde für das Deutsche die Getrennt- und Zusammenschreibung von (vermeintlichen) Komposita gezeigt, es wurden Wortzeichen diskutiert und es wurde über die Länge von Wörtern gesprochen. Im Folgenden möchten wir kurz anreißen, wie sich das graphematische Wort und die Wortzeichen in anderen Sprachen zeigen. Es handelt sich nicht um eine sprachvergleichende Untersuchung, sondern wir werden nur an einigen Punkten Unterschiede zeigen.
3.1 Wortbegriffe in anderen Sprachen Es gibt in verschiedenen Sprachen verschiedene phonologische Prozesse, die über Wortgrenzen hinweg zu guten Silbenstrukturen führen. Nehmen wir als einen Extremfall das Französische mit seiner Liaison, dabei wird der letzte (sonst stumme) Konsonant eines Wortes vor einem vokalisch anlautenden Wort zu dessen Silbenanfangsrand: un apéritif mit [ɛ̃.na.pe.ʀi.tif] ‚ein Aperitif‘. Eine phonologische (Wort-)Grenze ist hier nicht zu erkennen, weil der letzte Konsonant eines Wortes mit dem ansonsten vokalisch anlautenden Wort verschmilzt. Im Französischen sind die phonologischen Phrasen deutlicher als das phonologische Wort. Liaison ist nur zwischen bestimmten Wörtern möglich, zum Beispiel zwischen dem Artikel und dem Substantiv (un apéritif), nach et (et une femme) hingegen geschieht sie nicht. Graphematisch ändert sich
432
Nanna Fuhrhop/Franziska Buchmann
hier allerdings nichts. Das ist anders bei Tilgungsprozessen des Typs l’apéritif, qu’il ‚dass er‘, bei Wörtern wird ein Vokalbuchstabe getilgt, wenn das folgende Wort mit einem Vokal beginnt, ähnlich auch im Italienischen l’amico ‚der Freund‘ vs. il padre ‚der Vater‘. Zur Vermeidung von phonologisch ungünstigen Strukturen werden im Französischen sogar Konsonanten ‚eingefügt‘ wie in der Inversionsfrage: il a ‚er hat‘, aber a-t-il ‚hat er‘. Hier sind vereinzelte Phänomene zur Illustration der phonetischen ‚Verunklarung‘ von Wortgrenzen herausgegriffen worden; es wird in den Beispielen aber deutlich, dass die schriftliche Form hier verschiedene Mittel zur klareren Strukturierung ergreift, s. auch 3.2. Flexionsmorphologisch: Im Englischen gibt es das Phänomen, dass ganze Nominalgruppen die Genitivendung tragen (können), das klassische Beispiel ist the king of England‘s head ‚der Kopf des englischen Königs‘, die Flexion steht an England, gemeint ist aber nicht der Kopf von England. Die Genitivflexion ist hier anders zu interpretieren als zum Beispiel die Pluralflexion. Sie umfasst dann mehr als das durch Leerzeichen gekennzeichnete graphematische Wort. Im Französischen können vermeintliche Komposita (s. auch Bindestrichschreibung in 3.2) durchdekliniert werden wie in mots-clés ‚Schlüsselwörter‘ – trotz Bindestrich behalten die Teile ihre eigene Pluralflexion. Es zeigen sich deutliche Unterschiede zwischen den Sprachen. In der Wortbildungsmorphologie sind Schreibungen von Komposita interessant; hier werden in den Sprachen unterschiedliche Strategien verfolgt. Der Einfachheit halber werden wir hier nur ausschnittweise Substantivkomposita betrachten. In vielen germanischen Sprachen findet sich die Zusammenschreibung wie im Deutschen, so im Niederländischen, Schwedischen und Dänischen. niederländisch schwedisch
dänisch
Zahnbürste
tandenborstel
tandborste
tandbørste
Rasierklinge
scheermesje
rakblad
barberblad
Wasserstand
waterpeil
vattenstånd
vandspejlets niveau
Abb. 5: Komposita in germanischen Sprachen
In romanischen Sprachen sind die entsprechenden Konstruktionen häufig solche mit Präpositionen – das Determinans, also die Einheit, die in einem Kompositum das Grundwort (Determinatum) näher bestimmt, ist dann typischerweise mit einer Präposition nachgestellt wie in Abbildung 6.
Das Wort in der (Recht-)Schreibung
französisch
italienisch
spanisch
Zahnbürste
brosse à dents
spazzolino da denti
cepillo de dientes
Rasierklinge
lame de rasoir
lametta da barba
hoja de afeitar
Wasserstand
niveau d’eau
livelle dell‘acqua
nivel del agua
433
Abb. 6: Komposita in romanischen Sprachen
Diese Konstruktionen erinnern an eine Nominalgruppe mit einem nachgestellten Präpositionalattribut. Während Schpak-Dolt (2010, 135 ff.) und Geckeler/Dietrich (2012, 109) diese Konstruktionen als Komposita für das Französische diskutieren, sieht Schwarze (1988, 530) in den entsprechenden italienischen Strukturen keine Komposition; alle genannten Texte diskutieren aber beide Möglichkeiten. Im Französischen finden sich als mögliche Substantiv-Substantiv-Kandidaten noch Typen wie homme-sandwich ‚Sandwichmann/Plakatträger‘ und assurance-vie ‚Lebensversicherung‘, jeweils ohne Präposition, aber auch mit dem Kopf an erster Stelle (Schpak-Dolt 2010, 135 f.). Im Italienischen gibt es entsprechende Bildungen: treno merci ‚Güterzug‘ mit treno ‚Zug‘, merci ‚Waren‘ (Schwarze 1988, 530). Nach Schwarze (1988, 533 ff.) setzt sich im Italienischen neuerdings auch die Struktur Determinans vor Determinatum durch wie in capolavoro ‚Meisterwerk‘ capo ‚Chef‘, lavoro ‚Werk‘, autostrada ‚Autostraße/Autobahn‘. Grob kann man festhalten, dass bei der Reihenfolge Determinans-Determinatum Zusammenschreibung der Normalfall ist – das gilt neben den germanischen Sprachen, in der das die übliche Reihenfolge ist, auch für das Italienische (scuolabus ‚Schulbus‘). Bei der umgedrehten Reihenfolge, wenn das Determinatum vor dem Determinans steht, gibt es sowohl Getrennt- als auch Zusammenschreibung und Bindestrichschreibung: ital. treno merci, ital. portacenere/posacenere ‚Aschenbecher‘ (cenere ‚Asche‘), frz. homme-sandwich. Im Englischen werden Komposita überwiegend getrennt geschrieben. Th. Berg (2012), der Komposita im Deutschen und Englischen direkt miteinander verglichen hat, kommt zu dem Schluss, dass – neben der Getrenntschreibung – auch sonst durchaus gezeigt werden kann, dass ‚Komposita im Englischen‘ sehr viel weniger kohäsiv (‚cohesive‘) sind als im Deutschen. Eines seiner Argumente ist der Bezug vom vorangestellten Adjektiv auf das Erstglied. Bei jeweils den ersten zweihundert in einer Datenbank vorkommenden Strukturen des Typs ‚Adjektiv Substantiv Substantiv‘ bezieht sich das Adjektiv bei 35,5 % der Fälle im Englischen auf das Erstglied wie bei nuclear power station und local government branch, bei der gleichen Anzahl im Deutschen findet er nicht einen Fall; der Typ verregnete Feriengefahr kam also quantitativ nicht vor (ebd., 4 f.). Th. Berg diskutiert weitere Unterschiede; die Vermutung liegt nahe, dass die unterschiedliche Schreibung von englischen und deutschen Komposita besser begründet werden kann, als es bisher getan wird.
434
Nanna Fuhrhop/Franziska Buchmann
Als letztes wollen wir noch einen weiteren Vergleich zeigen. In anderen europäischen (mit dem lateinischen Alphabet verschrifteten) Sprachen gibt es durchaus im Gegensatz zum Deutschen einige einbuchstabige Wörter: Spanisch: a Präp., e/y ‚und‘, o/u ‚oder‘, Polnisch a ‚und‘, i, o, u, w, z Präp., Englisch a Art., I ‚ich‘ als Majuskel, Französisch a ‚hat‘, y Adv., Italienisch a Präp., e ‚und‘, o ‚oder‘. In den meisten Fällen handelt es sich um Funktionswörter (Artikel, Präpositionen oder Konjunktionen, s. auch Imo in diesem Band, der den Wortstatus von n und Emoticons in nicht-standardschriftsprachlichen Texten untersucht).
3.2 Die Wortzeichen in anderen Sprachen Auch in anderen Sprachen gibt es Wortzeichen – deren Systematisierung steht noch aus. Im Folgenden wollen wir auch hier einige Überlegungen zeigen. Der Apostroph zeigt eine Grenze zumindest im Französischen und Italienischen für eine phonologische und graphematische Elision. Der Apostroph kennzeichnet hier eine lexikalische Wortgrenze, die phonologisch verundeutlicht wurde (s. Abschnitt 3.1): frz. l’ami ‚der Freund‘ qu’il ‚dass er‘ oder ital. l’amico ‚der Freund‘. Hier sind die Elision und damit der Apostroph obligatorisch. Im Englischen steht der Apostroph bei Genitivkonstruktionen wie in my father’s house ‚das Haus meines Vaters‘ (Bunčić 2004, 188), aber auch als ‚alleinige‘ graphematische Genitivmarkierung wie in the fathers‘ (fathers als Plural, fathers‘ als Genitiv). Hier ist der Apostroph Anzeiger morphologischer Strukturen. Er steht aber auch bei vermeintlichen Wortgrenzen, und zwar bei klitisierten Verben mit is in that’s ‚das ist‘, it’s ‚es ist‘, mit are in we’re ‚wir sind‘ oder dem Pronomen us in let’s ‚lass uns‘ (Bunčić 2004, 190). Zumindest diese Formen wirken ähnlich lexikalisiert wie das deutsche geht’s. Besonders interessant ist der Apostrophgebrauch bei _n’t für not ‚nicht‘ mit einem Elisionsapostroph mitten im Wort, allerdings mit der Konsequenz, dass ein ansonsten vorhandenes Spatium nicht mehr geschrieben wird: isn’t ‚ist nicht‘, mustn’t ‚darf nicht‘. Ohne Apostroph ist die Zusammenschreibung nicht möglich (*mustnot aber mustn’t und nicht *must n’t) außer bei can’t – cannot. Im Niederländischen wird das s-Flexiv bei (Fremd-)Wörtern, die mit einem |a, o, u| enden, mit dem Apostroph segmentiert: Plural ‚Autos‘, ‚Paprikas‘, ‚Regenschirme‘, aber nicht ‚Garagen‘; Genitiv Anna’s moeder vs. Peters moeder. Verhindert wird damit die Lesung als Kurzvokal, er kann also ein Elisionsapostroph sein für die drei Vokalbuchstaben (Shetter/Van der Cruysse-Van Antwerpen 2002, 23); er zeigt aber ohne Zweifel auch eine morphologische Struktur. Der Divis als Bindestrich zeigt im Deutschen im Wesentlichen, dass Einheiten ein graphematisches Wort bilden. Im Niederländischen finden sich ähnliche typische Bindestrichstellen, wie in 80-jarige, tv-kijken, IQ-test, rood-wit-blauw, Oost-Vlaanderen, auch wenn sie eher häufiger zu sein scheinen, so auch Zuid-Frankrijk und nietroker (alle Beispiele aus mijnwoordenboek 2014). Auch im Niederländischen steht die
Das Wort in der (Recht-)Schreibung
435
Bindestrichschreibung als Alternative zur Zusammenschreibung, sie kennzeichnet Wörter. Im Englischen hingegen steht der Bindestrich primär nicht wie im Deutschen als Alternativschreibung zur Zusammenschreibung (eine der wenigen Wörter sind girlfriend vs. girl-friend), sondern er steht als Alternative zur Getrenntschreibung. Er macht aus getrennten graphematischen Wörtern jeweils ein graphematisches Wort. Einigermaßen regulär zeigt sich der Bindestrich bei dreigliedrigen Komposita; hierbei muss man allerdings eine Hierarchie ‚Zusammenschreibung – Bindestrich – Getrenntschreibung‘ (K. Berg u. a. 2014) bedenken; die tiefer verschachtelte morphologische Verzweigung wird durch die engere graphematische Verbindung gezeigt. Insbesondere in rechtsverzweigenden Komposita wird die Verzweigung häufig deutlich angezeigt wie air vice-marshall ‚Vize-General der Luftstreitkräfte‘ (Bindestrich ist enger als Getrenntschreibung), class-warfare ‚Klassenkampf‘ (Zusammenschreibung ist enger als Bindestrich) (K. Berg u. a. 2014). Im Französischen und Italienischen kann der Bindestrich genutzt werden, wenn eine Struktur ‚kompositumsähnlich wird‘, wie in après midi ‚nachmittags‘ vs. un après-midi ‚ein Nachmittag‘, zur aktuellen Diskussion s. auch Académie française (1990). Wenn im Französischen und Italienischen Substantiv-Substantiv-Verbindungen auftauchen, sind Bindestriche möglich wie in frz. homme-sandwich (s. 3.1) und ital. divano-letto ‚Schlafcouch‘. Im Französischen wird der aus oben erwähnten lautlichen Gründen eingefügte Konsonant in a-t-il graphisch deutlich durch den Divis getrennt. Allerdings wird hier faktisch eine Subjekt-Prädikat-Struktur zu einem graphematischen Wort. Dies findet sich im Französischen auch bei anderen Inversionsstrukturen vous avez ‚sie haben‘ vs. avez-vous ‚haben sie‘, il dit ‚er sagt‘ vs. dit-il, tu vas ‚du gehst‘ vs. vas-tu. Der Divis hat hier also eine andere Funktion als im Deutschen, syntaktisch selbständige Einheiten (Subjekte und Prädikate) werden miteinander graphisch verbunden. Zum Abkürzungspunkt stehen sprachvergleichende Untersuchungen noch aus. Ein Blick in die Abkürzungsverzeichnisse von Wörterbüchern zeigt aber folgendes: Im Englischen scheint es eine Tendenz zu geben, ihn gar nicht zu setzen (Langenscheidt/ Collins 2008, Umschlagseiten). Im Französischen und Italienischen scheint die Regulierung relativ vergleichbar mit der im Deutschen zu sein (Lange-Kowal 1991, 11 ff., Stenger 1997); im Niederländischen hingegen scheint der Abkürzungspunkt ausschließlich möglich zu sein beim Abbruch, bei Zusammenziehungen wird er offenbar nicht gesetzt (van der Linden 1989, 7 f.).
4 Resümee Das graphematische Wort steht zwischen zwei Spatien. Im Deutschen kann es weitgehend syntaktisch und morphologisch rekonstruiert werden. Bei Abweichungen können Wortzeichen zur Markierung gewählt werden: gibt’s als ein phonologisches Wort, aber zwei morphologische und syntaktische, das Rund-um-die-Uhr-Gejammere
436
Nanna Fuhrhop/Franziska Buchmann
als ein syntaktisches Wort, aber kein morphologisches. In diesem Sinne wurden die Wortzeichen des Deutschen systematisch untersucht. Im letzten Abschnitt haben wir erste sprachvergleichende Überlegungen angestellt. Unterschiede wurden sofort deutlich; weitere Forschung sowohl zur systematischen Erfassung als auch zur theoretischen Einordnung lohnt hier also. Dabei geht es wie im Deutschen primär um Korpusuntersuchungen, also wie die Zeichen tatsächlich von kompetenten Schreibern und Schreiberinnen/Lesern und Leserinnen genutzt werden.
5 Literatur Académie française (1990): (http://www.academie-francaise.fr/sites/academie-francaise.fr/files/ rectifications-1990.pdf ). Amtliches Regelwerk (2006): Deutsche Rechtschreibung. Regeln und Wörterverzeichnis. München/ Mannheim. (http://www.rechtschreibrat.com/) Aronoff, Mark/Nanna Fuhrhop (2002): Restricting suffix combinations in German and English. Closing suffixes and the monosuffix constraint. In: Natural Language & Linguistic Theory 20, 451–490. Bankhardt, Christina (2010): Tütel, Tüpflein, Oberstrichlein. Der Apostroph im Deutschen. Mannheim. Berg, Kristian u. a. (2014): Morphological spellings in English. In: Written Language and Literacy 17/2, 282–307. Berg, Thomas (2012): The cohesiveness of English and German compounds. In: The Mental Lexicon 7/2, 1–33. Bredel, Ursula (2008): Die Interpunktion des Deutschen. Ein kompositionelles System zur OnlineSteuerung des Lesens. Tübingen. Buchmann, Franziska (2015): Die Wortzeichen im Deutschen. Heidelberg. Buchmann, Franziska (noch nicht erschienen): Graphematische Wortbildung. Bunčić, Daniel (2004): The apostrophe. A neglected and misunderstood reading aid. In: Written Language and Literacy 7/2, 185–204. Deutsche Rechtschreibung (1995). Regeln und Wörterverzeichnis. Vorlage für die amtliche Regelung. Hg. v. Internationalen Arbeitskreis für Orthographie. Tübingen. Donalies, Elke (2005): Das Konfix. Zur Definition einer zentralen Einheit der deutschen Wortbildung. Nachdruck. In: Peter Müller (Hg.): Fremdwortbildung. Theorie und Praxis in Geschichte und Gegenwart. Frankfurt u. a., 179–198. Eisenberg, Peter (2007): Sprachliches Wissen im Wörterbuch der Zweifelsfälle. Über die Rekonstruktion einer Gebrauchsnorm. In: Aptum. Zeitschrift für Sprachkritik und Sprachkultur 3, 209–228. Eisenberg, Peter (2012): Das Fremdwort im Deutschen. 2. Auflage. Berlin/New York. Eisenberg, Peter (2013a): Grundriss der deutschen Grammatik. Das Wort. 4. Auflage. Stuttgart/ Weimar. Eisenberg, Peter (2013b): Anglizismen im Deutschen. In: Deutsche Akademie für Sprache und Dichtung (Hg.): Reichtum und Armut der deutschen Sprache. Berlin/Boston, 57–119. Eisenberg (2013c) Grundriss der deutschen Grammatik. Der Satz. 4. Auflage. Stuttgart/Weimar. Engel, Ulrich (2004): Deutsche Grammatik. München. Fleischer, Wolfgang/Irmhild Barz (2007): Wortbildung der deutschen Gegenwartssprache. Tübingen.
Das Wort in der (Recht-)Schreibung
437
Fuhrhop, Nanna (2007): Zwischen Wort und Syntagma. Zur grammatischen Fundierung der Getrenntund Zusammenschreibung. Tübingen. Fuhrhop, Nanna (2008): Das graphematische Wort (im Deutschen): Eine erste Annäherung. In: Zeitschrift für Sprachwissenschaft 27/2, 189–228. Fuhrhop, Nanna (2009): Orthografie. 3. Auflage. Heidelberg. Fuhrhop, Nanna (2010): Getrennt- und Zusammenschreibung: Kern und Peripherie. In: Ursula Bredel/Astrid Müller/Gabriele Hinney (Hg.): Schriftsystem und Schrifterwerb. Linguistisch – Didaktisch – Empirisch. Berlin/New York, 235–257. Fuhrhop, Nanna/Franziska Buchmann, Franziska (2009): Die Längenhierarchie. Zum Bau der graphematischen Silbe. In: Linguistische Berichte 218, 127–155. Fuhrhop, Nanna/Astrid Müller (2012): Fremdwörter in der deutschen Sprache. In: Praxis Deutsch 235 (Basisartikel), 4–13. Fuhrhop, Nanna/Jörg Peters (2013): Einführung in die Phonologie und Graphematik. Stuttgart/ Weimar. Gallmann, Peter (1999): Wortbegriff und Nomen-Verb-Verbindungen. In: Zeitschrift für Sprachwissenschaft 18/2, 269–304. Geckeler, Horst/Dietrich, Wolf (2007): Einführung in die französische Sprachwissenschaft. Ein Lehrund Arbeitsbuch. Berlin. Haß, Ulrike/Storjohann, Petra (2015): Wort und Wortschatz. In: EkkehardFelder/Andreas Gardt (Hg.): Handbuch Sprache und Wissen (Handbücher Sprachwissen, Bd. 1). Berlin/Boston, 143–166. Jacobs, Joachim (2005): Spatien. Zum System der Getrennt- und Zusammenschreibung im heutigen Deutsch. Berlin/New York. Klein, Wolf Peter (2002): Der Apostroph in der deutschen Gegenwartssprache. Logographische Gebrauchserweiterung auf phonographischer Basis. In: Zeitschrift für germanistische Linguistik 30, 169–197. Kobler-Trill, Dorothea (1994): Das Kurzwort im Deutschen. Eine Untersuchung zu Definition, Typologie und Entwicklung. Tübingen. Lange-Kowal, Ernst Erwin (1991): Langenscheidts großes Schulwörterbuch Deutsch-Französisch. 10. Auflage. München. Langenscheidt/Collins (2008): Großwörterbuch Englisch. 4. Auflage. München. van der Linden, G. A. M. M (1989): Nederlands – Duits. 14. Auflage. Utrecht. Mijnwoordenboek (2014): (http://www.mijnwoordenboek.nl/spelling-samenstellings-streepje.php ). Nerius, Dieter (2007): Deutsche Orthographie. 4. Auflage. Hildesheim/Zürich/New York. Nolda, Andreas (2007): Die Thema-Integration. Syntax und Semantik der „gespaltenen Topikalisierung“ im Deutschen. Tübingen. Nübling, Damaris u. a. (2010): Historische Sprachwissenschaft des Deutschen. Eine Einführung in die Prinzipien des Sprachwandels. 3. Auflage. Tübingen. Nübling, Damaris/Fabian Fahlbusch/Rita Heuser (2012): Namen. Eine Einführung in die Onomastik. Tübingen. Nübling, Damaris/Renata Szczepaniak (2011): Merkmal(s?)analyse, Seminar(s?)arbeit und Essen(s) ausgabe: Zweifelsfälle der Verfugung als Indikatoren für Sprachwandel. In: Zeitschrift für Sprachwissenschaft 30/1, 45−73. Primus, Beatrice (2004): A featural analysis of the modern Roman alphabet. In: Written Language and Literacy 7/2, 235–274. Ronneberger-Sibold, Elke (2007): Zur Grammatik von Kurzwörtern. In: Jochen Bär/Thorsten Roelcke/ Anja Steinhauer (Hg.): Sprachliche Kürze. Konzeptuelle, strukturelle und pragmatische Aspekte. Berlin/New York, 276–291.
438
Nanna Fuhrhop/Franziska Buchmann
Ruf, Birgit (1996): Augmentativbildungen mit Lehnpräfixen. Eine Untersuchung zur Wortbildung der deutschen Gegenwartssprache. Heidelberg. Shetter, William Z./Inge van der Cruysse-Van Antwerpen (2002): Dutch. An essential Grammar. London/New York. Scherer, Carmen (2010): Das Deutsche und die dräuenden Apostrophe. In: Zeitschrift für germanistische Linguistik 38, 1–24. Schpak-Dolt, Nikolaus (2010): Einführung in die französische Morphologie. Berlin/New York. Schwarze, Christoph (1988): Grammatik der italienischen Sprache. Tübingen. Smith, George (2000): Word remnants and coordination. In: Rolf Thieroff u. a. (Hg.): Deutsche Grammatik in Theorie und Praxis. Tübingen, 57–68. Steinhauer, Anja (2005): Duden. Das Wörterbuch der Abkürzungen. Mannheim. Stenger, Christian (1997): Das große Wörterbuch. Italienisch – Deutsch, Deutsch – Italienisch. St. Augustin. Teuber, Oliver (2000): Gibt es zwei Genitive im Deutschen. In: Rolf Thieroff u. a. (Hg.): Deutsche Grammatik in Theorie und Praxis. Tübingen, 171–184. Wiese, Richard (2000): The Phonology of German. Oxford. Wurzel, Wolfgang Ullrich (2000): Was ist ein Wort? In: Rolf Thieroff u. a. (Hg.): Deutsche Grammatik in Theorie und Praxis. Tübingen, 29–42.
Ruth Maria Mell
19. Das Wort in der Sprachkritik Abstract: Wer Sprachkritik betreibt, grenzt sich von allen übrigen Sprachverwendern ab, indem er kritisch wertend die Sprache betrachtet. Diese Bewertungen werden meist am einzelnen Wort, an der Aussage oder der Äußerung vollzogen. In der Sprachkritik kommt der Kritik am einzelnen Wort oder an einer einzelnen Äußerung besondere Bedeutung zu, vollzieht sich unser Denken und unsere Wahrnehmung der Welt doch nicht selten in vorgeprägten Schlag- und Schlüsselwörtern. Dieser Beitrag zur Sprachkritik richtet daher den Fokus auf das Wort als sprachliche Einheit. Nach einer definitorischen Einführung in die Gegenstände und Kriterien der Sprachkritik werden vier Bereiche von wortbezogener Sprachkritik erläutert – politische Sprachkritik, feministische Sprachkritik, Sprachpurismus und medienwirksame Sprachkritik –, wobei das Verhältnis von Wort- und Sachkritik stets mitbetrachtet wird. Dabei wird auch das Spannungsfeld von laienlinguistischer und linguistischer Sprachkritik berücksichtigt, wenn in der Öffentlichkeit die Streitfrage „Wer darf welches Wort inwieweit kritisieren?“ diskutiert wird. Die in Abschnitt 3 gewählten Beispiele sollen dabei dazu dienen, das einzelne Wort oder einen bestimmten Ausdruck als Element sprachkritischer Betrachtung zu fokussieren. 1 Was ist Sprachkritik? – Zum Diskurs von linguistischer und laienlinguistischer Sprachkritik 2 Gegenstände, Kriterien und Ziele der Sprachkritik 3 Kritik am Wort in Beispielen 4 Fazit 5 Literatur
1 Was ist Sprachkritik? – Zum Diskurs von linguis tischer und laienlinguistischer Sprachkritik Häufig sind es im Alltag einzelne Wörter, an denen sich Bewertungskämpfe und kritische Diskussionen etwa um herrschende Sprachnormen, z. B. in der Presse, im Fernsehen oder im Internet entzünden. Kritik wird dabei nur vereinzelt an Aussprachevarianten oder Grammatiknormen, wie etwa am Ersatz der Flexion durch Präposition nach angloamerikanischem Vorbild, geübt. Von allen Bereichen der Linguistik sind es, vor allem nach den Orthografiereformstufen 1996 bis 2006, die Schreibung sowie die Semantik von Wörtern, die von der Öffentlichkeit kritisiert werden. Bereits in Platons „Kratylos“ wird die Frage des Verhältnisses von Wort und Gegenstand diskutiert. Kratylos zufolge könne man durch ein sprachanalytisches Studium der Bezeichnungen
440
Ruth Maria Mell
das Wesen des Bezeichneten erkennen (vgl. Dieckmann 2012, 122) und Stellung dazu nehmen, ob ein gewähltes Wort den gemeinten Gegenstand adäquat bezeichnet. Damals wie heute setzt sich die Gesellschaft mit der richtigen Verwendung einzelner Wörter auseinander – dies auch gerne dann, wenn es etwa gilt, medienwirksam das „Wort des Jahres“ zu küren, welches seit 1972 von der Gesellschaft für deutsche Sprache ausgerufen wird. Solche Aktionen scheinen durchaus geeignet, die Sprachsensibilität in der Öffentlichkeit zu fördern (vgl. Wimmer 2000, 2061). Medienwirksame Aktionen wie die Auslobung des Wortes des Jahres werden häufig in der Öffentlichkeit als Sprachkritik wahrgenommen. Eine in den Medien wirksame Sprachkritik hat es auch beispielsweise durch Sprachglossen in überregionalen Tages- oder Wochenzeitungen gegeben (vgl. von Polenz 1999, 394–337). Diese Sprachglossatorik hat ihre Ursprünge im kritischen Feuilleton Ende des 19. Jahrhunderts. Berühmte Vorbilder sind Karl Kraus oder Kurt Tucholsky (vgl. Wimmer 2000, 2061). Ihre Gegenstände sind neben Klagen über einen angeblichen Sprachverfall, über Anglizismen oder Amerikanismen im Deutschen (von Polenz 1999, 400 ff.), über den unkorrekten Sprachgebrauch in den Medien (Biere/Henne (Hg.) 1993) auch die Kritik an bestimmten Ausdrücken der Jugendsprache (vgl. Wimmer 2000, 2061). Sprachkritik und Sprachbewertung werden häufig gleichgesetzt. Auch kategoriale Akte wie Sprachpolitik, Spracharbeit, Sprachpflege, Sprachlehre, Sprachkultur/ Sprachkultivierung, Sprachlenkung, Sprachnormierung werden unter dem Oberbegriff Sprachkritik zusammengefasst (vgl. Dieckmann 2012, 3). So verstanden ist Sprachkritik „etwas für alle; jeder darf es, jeder tut es“ (Schmich 1987, 6). Viele verstehen sich selbst als zur Sprachkritik berechtigt. So formuliert Neuland herausfordernd: „Sprachkritiker sind wir doch alle“ (Neuland 1996, 110). Doch fehlt es vielen kritischen Sprachbetrachtern an einer für dieses Unterfangen notwendigen Selbstkritik und an sprachreflexivem Vermögen, beruht Sprachkritik nicht zuletzt auf der sprachreflexiven Kompetenz der Sprecherinnen und Sprecher einer Sprache (Wimmer 2000, 2054). Dass diese Kompetenz bei weitem nicht jedem eigen ist, nur weil er oder sie die Fähigkeit des Sprechens besitzt, betont bereits Johann W. v. Goethe (Goethe 1978, 511). Eichinger konstatiert in neuerer Zeit zu dieser Thematik mahnend: Man sollte „über die sprachlichen Sachverhalte, über die man urteilt, Bescheid wissen […], wenn und bevor man darüber urteilt“ (Eichinger 2009, 201). Dennoch ist Sprachkritik am Wort nicht etwas, was nur Linguisten üben dürfen. Es gibt: argumentative Traditionslinien der laienlinguistischen Sprachkritik […], die seit mehr als einhundert Jahren gepflegt werden und deshalb in aktuellen wie historischen Publikationen ihren Platz haben. (Kilian/Niehr/Schiewe 2010, 1)
Laienlinguistische Sprachkritik wird sowohl von Einzelpersonen (wie Eike Christian Hirsch oder Bastian Sick) als auch von Gruppen (z. B. der Unwort-des-Jahres-Jury) betrieben und über die Massenmedien der Öffentlichkeit zugänglich gemacht (vgl. Kilian/Niehr/Schiewe 2010, 1). Die Frage, inwieweit Sprachkritik sinnvollerweise
Das Wort in der Sprachkritik
441
Aufgabe oder selbst Gegenstand der Linguistik sein könne, wird ausführlich in Dieckmann (2012) oder Kilian/Niehr/Schiewe (2010) diskutiert. Neben der Sprachkritik als Teil der öffentlichen Sprachdiskussion steht also die linguistisch-fachwissenschaftliche Sprachforschung (Dieckmann 2012, 43), wobei sich die deskriptiv arbeitenden Linguistinnen und Linguisten gerade nicht als Sprachkritiker verstehen. Häufig wird jedoch diskutiert, inwieweit die Linguistik überhaupt Sprachkritik oder Sprachpflege betreiben dürfe. Antos (vgl. Antos 1996, 6) beklagt, dass es der Linguistik im Gegensatz zu vielen anderen Disziplinen neben der Forschung und der Lehre an einem tertiären Wissenschaftssektor mangele, in welchem linguistische Erkenntnisse für die Lösung gesellschaftsrelevanter Sprachprobleme herangezogen werden könnten. Allerdings wünscht sich die Seite der laienlinguistischen Sprachkritik kaum tatsächlich Hilfestellung von den Linguistinnen und Linguisten (Dieckmann 2012, 43). Bär (2002, 224) merkt lediglich an, dass „[d] ie eigenen Ansichten […] von kompetenter Seite bestätigt, gleichsam ‚abgesegnet‘ werden“ sollen. Die Sprachwissenschaftlerinnen und -wissenschaftler selbst vertreten die Meinung, in der laienlinguistischen Sprachkritik sei man eher mit fragwürdigen Annahmen über Sprache konfrontiert und müsse mit unwissenschaftlichen Analysen rechnen, sodass von der öffentlichen Sprachkritik keine gewinnbringenden Erkenntnisse zu erwarten seien. Soweit Sprachkritik überhaupt in den Fokus der Linguistik tritt, kann sie dabei entweder selbst Gegenstand linguistischer Analyse sein oder von den Wissenschaftlerinnen und Wissenschaftlern als linguistische Tätigkeit ausgeübt werden (Dieckmann 2012, 43–44). Obwohl seit zehn bis fünfzehn Jahren die Sprachkritik in der Linguistik wieder mehr Befürworter gefunden hat (Dieckmann 2012, 55), ist linguistische Sprachkritik noch heute selten. Auch wenn die Bibliographie zur Sprachkritik von Janich/Rhein (2010) im Kapitel „(Sprach-)wissenschaftliche Sprachkritik“ 107 Publikationen verzeichnet, sinkt diese Zahl doch rapide, wenn man die Liste auf diejenigen Autorinnen und Autoren beschränkt, welche tatsächlich Linguistinnen und Linguisten sind: In aller Regel beschäftigen sie [die Autorinnen und Autoren] sich auf der Metaebene mit wechselnden theoretischen, methodologischen, historischen o. a. Aspekten der Sprachkritik. (Dieckmann 2012, 44)
So sind die Widerstände gegen Sprachkritik als linguistische Tätigkeit noch größer, als gegen die Beschäftigung mit der Sprachkritik als Untersuchungsgegenstand. Für Dieckmann (2012, 45) sind es vor allem fünf Argumente, die die grundsätzliche Ablehnung einer sprachkritischen Aufgabe für die Linguistik begründen sollen: – das wissenschaftstheoretische Argument der Wertfreiheit der Wissenschaft, das nur deskriptive, nicht aber wertende Äußerungen als wissenschaftliche Aussagen gelten lässt;
442
Ruth Maria Mell
– das Argument, dass es eine linguistische Sprachbewertung zumindest deshalb nicht geben könne, weil die Linguistik über keine fachspezifischen Bewertungskriterien verfüge; – das Argument, Sprachkritik sei unnötig, weil es an Sprache und Sprachgebrauch, richtig verstanden, nichts zu kritisieren gebe; – das Argument, Sprachkritik sei sinnlos, weil Sprache und Sprachgebrauch durch Sprachkritik kaum beeinflussbar seien und diese daher erfolglos bleiben müsse; – das Argument, dass die Sprache gemeinsamer Besitz der Sprachgemeinschaft sei und niemand legitimiert sei, seine partikularen Interessen und Vorstellungen zur Norm zu machen. Peter von Polenz (2005, 107) stellt fest, dass linguistisch fundierte Sprachkritik immer nur der Versuch eines Kompromisses sein kann. Diesen deutet Dieckmann als Kompromiss […] zwischen dem Versuch, der öffentlichen Kritik an der Wertungsabstinenz der Linguistik durch Lockerung des wissenschaftlichen Deskriptionsprinzips entgegenzukommen, und den fachinternen Anforderungen an Wissenschaftlichkeit. (Dieckmann 2012, 55)
Dieckmann (2012, 55) vergleicht das Problem mit der Redensart zwischen zwei Stühlen sitzen. Auf der einen Seite platziert er den Linguisten, der „Sprachkritik nicht nur prinzipiell für unwissenschaftlich“ hält. Auf der anderen Seite sitzen, so Dieckmann, die Journalisten und Publizisten, für die es offensichtlich zu sein scheint, dass es mit der deutschen Sprache rapide bergab geht, so dass sie von diesem Standpunkt nicht abzubringen sind und diesbezüglich keine Einwände gelten lassen (vgl. Dieckmann 2012, 55). Die Sprachkritik bewegt sich also in einem Spannungsfeld verschiedener Interessen und Perspektiven.
2 Gegenstände, Kriterien und Ziele der Sprachkritik Höchst verschiedenartige Phänomenbereiche umfasst das Feld der Sprachkritik. Wird die Bezeichnung Sprachkritik in einem weiten Sinn als generelle Form von Sprachbewertung oder als Form von Bewertung sprachlicher Sachverhalt verstanden, hat dies den „erwünschte[n] Nebeneffekt […], dass die gesellschaftliche Bedeutung der Sprachkritik wächst, je weiter der Begriff bestimmt wird“ (Dieckmann 2012, 4). Ein Nachteil ist dabei aber, dass der als Sprachkritik bestimmte Gegenstandsbereich immer heterogener wird Insbesondere seit Mitte des 20. Jahrhunderts kam es zu einer Ausweitung der sprachkritischen Gegenstandsbereiche. Damit einher ging auch die Entwicklung steigender Ansprüche an eine Sprache, die die Wirklichkeit auf bestmögliche Art reflektieren sollte. So wurde mehr und mehr auch im öffentlichen Raum – z. B. bei journalistischer Tätigkeit, im Rahmen von Literaturkritik oder in politischen
Das Wort in der Sprachkritik
443
Auseinandersetzungen – Sprachkritik betrieben. Damit erfasste Sprachkritik nun auch gesellschaftlichen Institutionen, die ‚sprachförmig‘ organisiert sind, d. h. die ihre Organisationsformen auf sprachliche Formulierungen und Festsetzungen gründen. […] Äußerungen bzw. Feststellungen dieser Institutionen sind Gegenstände der öffentlichen Sprachkritik. (Wimmer 2000, 2054)
Zum Spektrum der Motive und Gegenstandsbereiche von Sprachkritik haben u. a. Wimmer (2003), Dieckmann (2012) sowie Kilian/Niehr/Schiewe (2010) in ihrer Einführung referiert. Über die Bezeichnung und die Terminologien bezüglich der Arten von Sprachkritik herrscht ebenso Uneinigkeit wie in Bezug auf ihre Sachverhalte. Die gängigste Methode in der Linguistik, Arten von Sprachkritik zu unterscheiden, orientiert sich an der Saussure’schen Unterscheidung von langage, langue und parole (vgl. Saussure 1931, u. a. 11–17), womit die richtige Verwendung einzelner Wörter in den Mittelpunkt gerückt wird (vgl. von Polenz ([1973] 1982, 70). Dieckmann (2012, 9–13) wie auch – wenn auch in leicht modifizierter Form – Kilian/Niehr/Schiewe (2010, 8–11) benennen sieben Erscheinungsformen von Sprachkritik: Sprachverwendungskritik, Sprachverkehrskritik, Sprachkompetenzkritik, Sprachsystemkritik, Sprachgebrauchskritik, Universalkritik an der menschlichen Sprachfähigkeit und Sprachnormenkritik. Eine andere Einteilung gebräuchlicher Unterscheidungen präsentiert Dieckmann, auch unter Bezugnahme auf Gauger (1995, 41–51), wenn er zwischen feministischer Sprachkritik, ideologie- bzw. bewusstseinskritischer Sprachkritik, literarischer Sprachkritik, philosophischer Sprachkritik, publizistischer Sprachkritik sowie Sprachnormenkritik bzw. Sprachnormierungskritik unterscheidet (Dieckmann 2012, 14–19). In Bezug auf einzelne lexikalische Einheiten, zählen zu den primären Zielen der Sprachkritik, welche „prototypisch aus negativ wertenden Äußerungen über sprachliche Sachverhalte“ bestehen (Dieckmann 2012, 19): – die Beseitigung und Vermeidung kritikwürdiger Ausdrücke, – die Bewusstmachung der Konsequenzen bei der Verwendung kritischer sprachlicher Ausdrücke, – die öffentliche Diskreditierung derjenigen Person, die einen kritikwürdigen Ausdruck verwendet, – die versteckte Funktion von sozialer Abgrenzung, dergestalt, sich durch normativ gestützte Einhaltung eines guten und rechten Sprachgebrauchs von anderen Gruppen (z. B. den so genannten Unterschichten) abzugrenzen sowie – die Bekämpfung sprachnormierender Einschränkungen des Sprachgebrauchs (vgl. dazu Dieckmann 2012, 21–25). Dabei geht es nicht nur um die Offenlegung grammatischer Fehler oder die in semantischer Hinsicht ‚richtige‘ Verwendung von Wörtern; auch will eine so verstandene
444
Ruth Maria Mell
Sprachkritik Aufklärung dahingehend betreiben, „welche Sicht der Wirklichkeit von wem aus welchen Gründen“ und durch welchen Wortgebrauch konstituiert worden ist (Schiewe/Wengeler 2005, 7). Im 21. Jahrhundert hat öffentliche Sprachkritik gerade in und durch Internetforen deutlich an Intensität gewonnen. Eines der Hauptprobleme sowohl der öffentlichen als auch der laienlinguistischen Sprachkritik ist es daher, die Bewertungskriterien der Kritik zu konkretisieren sowie Anwendungsmethoden zu entwickeln, welche übersubjektiven Geltungsanspruch haben können (vgl. Dieckmann 2012, 25). Dafür unterscheidet z. B. Heringer (2009, 251) zwischen dem subjektiven Ausdrucksverhalten, welches er Geschmacksurteil[e] nennt („Mir gefällt dieser Stil“) und den bewertenden Aussagen, über die intersubjektiv Verständigungsmöglichkeit besteht („Dieser Stil ist angemessen“). Neuere Bewertungstypologien erheben den Anspruch, nicht nur kleinere lexikalische Einheiten wie Wörter, sondern ebenso Sprechakte, Sprechaktsequenzen oder vollständige Texte bewertend analysieren zu können (vgl. Nussbaumer 1995, Fix 1995, Ickler 2007, Dieckmann 2012). Dieckmann stellt für die Bewertung die vier Hauptkriterien Sprachrichtigkeit, Funktionalität, Sprachästhetik und Sprachethik heraus, wobei er einen flexiblen Umgang mit den Kriterien „je nach Art des sprachlichen Sachverhalts und seiner Einbettung in das mehrdimensional gegliederte Gefüge von Sprache und Sprachgebrauch“ (Dieckmann 2012, 28) betont. Jene Kriterien sind sowohl auf einzelne Wörter als auch auf ganze Äußerungen anwendbar. Laienlinguistische Sprachkritik ist stärker auf das Wort fokussiert, vernachlässigt aber in ihrer kritischen Betrachtung häufig die Verwendungsbedingungen. Die wissenschaftliche Sprachkritik hingegen betont gerade, dass der Gebrauch eines Wortes vor allem in seinem interaktiven Kommunikationszusammenhang beurteilt werden müsse. Damit werden häufig die Wortverwender, also die Sprecherinnen und Sprecher einer Sprache, in die Verantwortung genommen und kritisiert, nicht das Wort selbst.
3 Kritik am Wort in Beispielen Seit den 70er Jahren vollzieht sich Kritik am Sprachgebrauch vor allem in den Bereichen Verwaltung, Justiz, Medizin, Bildung, Politik, Umwelt, Gleichstellung der Geschlechter und Medien. Die sprachkritische Reflexion über Wörter ist dabei durch ein wesentliches Kennzeichen markiert: Das Wort wird aus dem Text- oder Redezusammenhang gelöst und quasi kontextlos analysiert. Somit muss eine Wortkritik damit beginnen, das im Wort angelegte Verhältnis von Form und Bedeutung, von Ausdrucksseite und Inhaltsseite zu untersuchen und danach zu fragen, ob das Wort zu dem bezeichneten Gegenstand passt und ob der gewählte Ausdruck die Sache adäquat wiedergibt (vgl. Kilian/Niehr/Schiewe 2010, 18). Sprachkritik ist somit nicht bloße Kritik am Wort, an individuellen Äußerungen oder Texten, sondern ist Teil
Das Wort in der Sprachkritik
445
des Komplexes aus lexikalischem Ausdruck, seiner Bedeutung und dem zugrundeliegenden Konzept, das diverse Wissensaspekte über die Wirklichkeit einschließt (siehe auch Dieckmann 2012, 137). Dieckmann unterscheidet daher unterschiedliche Formen der Kritik am Wort, wobei er, wo dies möglich ist, Beispiele aus Schlossers ‚Unwörterbuch‘ anführt und diese seinerseits kritisch bewertet: – die Kritik an der Wortform – am Beispiel der Ein-Eltern-Familie (Dieckmann 2012, 138), – die Kritik an der (sprachlich bezeichneten) Sache – am Beispiel Ahnenpass (Dieckmann 2012, 138 f.), – die Kritik an der Struktur des Wortinhalts (Dieckmann 2012, 139 f.), – die Kritik am (in der Sprache sich spiegelnden) Denken – am Beispiel ausländerfrei (Dieckmann 2012, 140–142) sowie – die Kritik an der (sprachlich bewirkten) Verzerrung der Wirklichkeit – am Beispiel ethnische Säuberung (Dieckmann 2012, 142–144). Häufig sind es einzelne Ausdrücke oder einzelne Begriffe, die wir dann negativ bewerten, wenn uns etwas stört oder uns etwas falsch, missverständlich oder gar moralisch verwerflich erscheint. Bei wortbezogener Sprachkritik liegt es nahe, die jeweils als kritisch markierten Wörter nicht mehr zu verwenden. Ein weiteres Ziel einer so verstandenen Sprachkritik ist es, einzelne Wörter nicht mehr zu verwenden und vielmehr die Implikationen des Gebrauchs bewusst zu machen, „damit die befürchteten schädlichen Wirkungen der kritisierten Ausdrucksweisen auf das Denken ihre Kraft verlieren“ (vgl. Dieckmann 2012, 144 f.). So bemerken auch Frohning u. a. (2002, 2), dass Sprachkritik „oft als Stellvertreterkritik für umfassende kulturelle oder politische Diskurse geübt wird, ohne die zugrunde liegenden Motivationen transparent zu machen“. Die in der Öffentlichkeit betriebene laienlinguistische Sprachkritik ist häufig Kritik am Wortgebrauch, aber auch an allgemeinen Sprachverwendungsweisen, an sprachlichen Haltungen und Einstellungen, wie sie vor allem durch die Medien einer Öffentlichkeit zugänglich gemacht werden (vgl. Wimmer 2000, 2054). Medienwirksam ist vor allem auch die Wahl der ,Wörter des Jahres‘ und ,Unwörter des Jahres‘ (vgl. Wimmer 2000, 2061). Der von der Gesellschaft für deutsche Sprache so genannte „sprachliche Jahresrückblick »Wort des Jahres«“ (vgl. GfdS 2014) wurde erstmals 1972 für ein Wort bzw. für einen sprachlichen Ausdruck vergeben und wird seit 1978 in der Zeitschrift „Der Sprachdienst“ veröffentlicht. Ausgewählt werden nach eigenen Angaben Wörter und Ausdrücke, die die öffentliche Diskussion des betreffenden Jahres besonders bestimmt haben, die für wichtige Themen stehen oder sonst als charakteristisch erscheinen (»verbale Leitfossilien« eines Jahres). Es geht nicht um Worthäufigkeiten. Auch ist mit der Auswahl keine Wertung bzw. Empfehlung verbunden. (GdfS 2014)
446
Ruth Maria Mell
Damit bezeichnet das „Wort des Jahres“ eher ein Schlüsselwort oder Konzept eines gesellschaftspolitisch relevanten Diskurses des je vergangenen Jahres und ist, im Gegensatz zur explizit als sprachkritisch bezeichneten Aktion „Unwort des Jahres“, aus linguistischer Perspektive nicht als reine Sprachkritik zu werten. Die „Wörter des Jahres“ 2003 bis 2014 waren: das alte Europa (2003), Hartz IV (2004), Bundeskanzlerin (2005), Fanmeile (2006), Klimakatastrophe (2007), Finanzkrise (2008), Abwrackprämie (2009), Wutbürger (2010), Stresstest (2011), Rettungsroutine (2012) sowie GroKo (2013) und Lichtgrenze (2014) (vgl. GfdS 2014). Doch anders, als man annehmen könnte, wird das Unwort des Jahres hingegen nicht von eben jener Institution vergeben. Die Jury, welche das ,Unwort des Jahres‘ kürt, und sich selbst als „institutionell unabhängig“ (vgl. http://www.unwortdesjahres.net/) beschreibt, besteht aus vier Sprachwissenschaftlern und Sprachwissenschaftlerinnen, einem Journalisten sowie einem jährlich wechselnden kooptierten Mitglied, welche „Sprachwissenschaft auch außerhalb der Universität für relevant halten“ (http://www.unwortdesjahres.net/). Dabei charakterisiert sich die Jury selbst auf ihrer Homepage als „Vermittler öffentlichen Unbehagens an bestimmten Sprachgebrauchsweisen, nicht aber – ein häufiges Missverstehen – als ‚Sprachschützer‘“ (http://www.unwortdesjahres.net/). Erklärtes Ziel dieser sprachkritischen Aktion, an der sich alle Bürgerinnen und Bürger mit ihren Unwort-Vorschlägen beteiligen können, ist „ein sensiblerer Umgang mit Sprache in der öffentlichen Kommunikation“; m. a. W. ‚Sprachbewusstsein‘ und ‚Sprachsensibilität‘ in Bezug auf das einzelne Wort und dessen Gebrauch sollen in der Bevölkerung gefördert werden. Die Parameter der Kritik und der alltäglichen sprachkritischen Reflexion sind dabei – laut eigener Aussage – Unangemessenheit sowie Inhumanität von Formulierungen im öffentlichen Sprachgebrauch (vgl. http://www.unwortdesjahres.net/). So formuliert Janich (nach Angaben der Süddeutschen Zeitung) beispielsweise die Begründung zur Wahl des Unwortes 2013 mit folgenden Worten. Mit dem Schlagwort Sozialtourismus wurde von einigen Politikern und Medien gezielt Stimmung gegen unerwünschte Zuwanderer, insbesondere aus Osteuropa, gemacht‘ […] Dies diskriminiert Menschen, die aus purer Not in Deutschland eine bessere Zukunft suchen, und verschleiert ihr prinzipielles Recht hierzu. […] Das Grundwort ‚Tourismus‘ suggeriert in Verdrehung der offenkundigen Tatsachen eine dem Vergnügen und der Erholung dienende Reisetätigkeit. Das Wort ‚Sozial‘ reduziere die damit gemeinte Zuwanderung auf das Ziel, vom deutschen Sozialsystem zu profitieren. (SZ 2014)
In dieser Begründung zeigt sich zugleich die Grundannahme der Jury, dass sprachliche Ausdrücke erst dadurch zu Unwörtern würden, dass sie von Sprechern entweder gedankenlos oder mit kritikwürdigen Intentionen in öffentlichen Kontexten verwendet würden. Unwörter der letzten Jahre waren Tätervolk (2003), Humankapital (2004), Entlassungsproduktivität (2005), freiwillige Auslese (2006), Herdprämie (2007), notleidende Banken (2008), betriebsratsverseucht (2009), alternativlos (2010), Döner-Morde (2011), Opfer-Abo (2012), Sozialtourismus (2013), Lügenpresse (2014) (vgl. Unwort des Jahres 2015).
Das Wort in der Sprachkritik
447
Mit ihrer Sprachkritik, die je ein einzelnes Wort in den Fokus rückt, erhofft sich die Jury mehr Verantwortung im sprachlichen Handeln sowie im Umgang mit einzelnen Ausdrücken. Damit ist eine so verstandene Kritik am einzelnen ‚Unwort‘ nicht die Ablehnung einer Bezeichnung, sondern vielmehr Kritik an den Sprecherinnen und Sprechern selbst (vgl. Schlosser 2000). So bettet auch Schlosser, einem der Initiatoren der „sprachkritischen Aktion Unwort des Jahres“, in seinem ‚Lexikon der Unwörter‘ die Stichwörter (Lemmata) in thematische Grundtexte und unterteilt sein Buch in Kapitel mit Titeln wie „Wenn Gegner ins Abseits gestellt werden, …“, „Wenn der Krieg seinen Schrecken verliert, …“ oder „Wenn Individuen im Kollektiv verschwinden, …“. Dabei seien verschiedenartige Mehrwortverbindungen (siehe Belica/Perkuhn sowie Farø in diesem Band) wie Untergang des Abendlandes (Schlosser 2000, 75) oder Volk ohne Raum (Schlosser 2000, 75) ebenso zu den Unwörtern zu zählen wie Heimatfront (Schlosser 2000, 80), allmächtig (Schlosser 2000, 100) oder Kollateralschaden (Schlosser 2000, 81). Das Wort erhält eine Stellvertreterfunktion, wenn es zu einer Art Platzhalter für Einstellungen, Denkmodelle und Wertvorstellungen wird: Getragen von der Auffassung, dass Sprache, Denken und Wirklichkeit drei Teilaspekte eines komplexen Ganzen sind und sich letzten Endes nicht mehr ausdifferenzieren lassen, wird mit der Kritik am Wort und damit an seinem Gebrauch sowohl der Sprecher sowie sein Bewusstsein und Verständnis von der Welt kritisiert.
3.1 Wort, Wirklichkeit und Denken: Politische Sprachkritik und Political Correctness Die von der Unwort-Aktion thematisierten Lexeme oder Lexemverbindungen bezeichnen häufig insbesondere ideologische bzw. propagandistische Konzepte. Sprachliche Beschönigungen, Täuschungsversuche oder die Absicht, mit der Wahl eines speziellen Wortes zu verletzen, sind die wesentlichen Aspekte seiner Entscheidung, ob ein Wort als Unwort bezeichnet werden muss oder nicht (vgl. auch Schröter und Gür-Şeker in diesem Band). Unwörter sind für Schlosser beispielsweise Nullwachstum, Outsourcing, Personalentsorgung, Putenformfleisch, Schalterhygiene, das Verb abkindern oder Peanuts (Schlosser 2000, 42; 46). Schlossers Kritik an den so genannten Peanuts der 1990er Jahre, welche er mit zynischer Bedeutung versehen wissen will (vgl. Schlosser 2000, 46), ist auch für Dieckmann (2012, 136) ein gutes Beispiel für eine eigentlich „harmlose Bezeichnung“ (vgl. Schlosser 2000, 46), die zum Unwort wird: Hilmar Kopper, 1994 Vorstandssprecher der Deutschen Bank, bezeichnete auf einer Pressekonferenz die 50 Millionen DM, die der Bauunternehmer Jürgen Schneider seinen Handwerkern schuldig geblieben war, als Peanuts. Dieses Wort wurde in der Öffentlichkeit als Indiz für die Überheblichkeit der Banker gewertet, denn die Bezeichnung Peanuts, in der konventionellen Bedeutung von Kleinigkeit oder kleine Menge, war nicht auf die Summe von
448
Ruth Maria Mell
50 Millionen DM anwendbar und die Wahl die Wortes in dieser ernsten öffentlichen Situationen unangebracht (vgl. Dieckmann 2012, 136). Debatten um eine politische Streitkultur, den angemessenen Sprachgebrauch von Wörtern oder um die so genannte Political Correctness entbrennen häufig dann, wenn sich Politiker oder andere Personen, welche in der Medienöffentlichkeit stehen, kommunikative Fehlgriffe erlauben, wie im Falle der Peanuts. Dabei sind es nie ausschließlich die sprachlichen Ausdrücke und Ausdrucksformen selbst, die kritisiert werden. Gegenstand der Kontroversen sind vielmehr meist die politischen Gegenstände und Sachverhalte selbst (vgl. Wimmer 2000, 2059). Seit dem Bestehen der Bundesrepublik sind öffentlich geführte Auseinandersetzungen über politisch korrekten Wortgebrauch zu finden: In ihnen ging es u. a. um die Verdrängung der Gewalt- und Schreckenstaten des Nationalsozialismus, um die Verharmlosung von Antisemitismus oder um Tendenzen, das Erinnern an die Gewaltherrschaft und deren Folgen mit einem sog. ‚Schlussstrich‘ zu beenden, um die erste Hälfte des 20. Jhs. als Teil einer ‚Normalität‘ erscheinen zu lassen. (Wimmer 2000, 2059; vgl. dazu auch Stötzel 1995, 355–382)
So musste im Jahre 1988 der Bundestagspräsident Jenninger von seinem Amt zurücktreten, weil er sich – der öffentlichen Meinung zufolge – in seiner Gedenkrede zur Reichspogromnacht 1938 „in der Perspektivierung der Nazi-Gewalttaten vergriffen hatte“ (Wimmer 2000, 2059). Dabei wurde kritisiert, Jenninger hätte sich nicht eindeutig gegen den Nationalsozialismus positioniert. Auch Formulierungen wie „seine [Hitlers] Erfolge“ oder „politische[r] Triumphzug Hitlers“ (Jenninger-Rede 1988) wurden stark kritisiert. Ähnliches galt für die Wortwahl in einer Rede des ehemaligen Bundespräsidenten Richard von Weizsäcker, die zu einer lang andauernden Debatte führte. Im Mittelpunkt stand hier die Frage, ob das Kriegsende am 8. Mai 1945 korrekterweise als Befreiung oder als Niederlage bezeichnet werden sollte. Auch historisch markierte Wörter, welche in ihrem Gebrauch Erinnerungen an Verwendungszusammenhänge z. B. im Dritten Reich aktivieren, haben die Sprachkritik seit dem zweiten Weltkrieg beschäftigt (vgl. Dieckmann 2012, 148). Häufig ist in diesem Zusammenhang in Zeitungen, im Fernsehen oder im Internet von ‚belasteten Wörtern‘ die Rede. Dabei besteht die Belastung oder Markierung sowohl in der assoziativen Erinnerung, welche mit dem Wort verbunden ist, als auch in der kollektiven Erinnerung an die Verwendungszusammenhänge, die mit der Verwendung des jeweiligen Wortes erneut ausgelöst und aktualisiert werden. Lexikalische Ausdrücke können daher auf ganz unterschiedlichen Ebenen – dialektal, soziolektal, funktionalstilistisch – oder, wie im Falle von NS-Vokabular, historisch negativ markiert sein (vgl. Dieckmann 2012, 148). Grund der Kritik an Wörtern wie Aufnordnung, Entjudung, Herrenrasse, lebensunwertes Leben, Menschenmaterial, Rassenschande, Untermensch, Völkerbrei oder fanatisch (Beispiele aus Dieckmann 2012) ist auch die Sorge, dass mit der Verwendung dieser Wörter, beabsichtigt oder unbeabsichtigt, auch das
Das Wort in der Sprachkritik
449
nationalsozialistische Gedankengut und Weltverständnis transportiert werden könne (vgl. Dieckmann 2012, 150). Die Kritik an den ‚belasteten Wörtern‘ ist damit im Grunde eine Kritik an den Wortinhalten. Sie soll aber auch vor dem fahrlässigen und unreflektierten Gebrauch dieser Ausdrücke warnen. Doch nicht alle Wörter, die heute als nationalsozialistisch (indiziert) gelten, können als Wortbildungen der Nationalsozialisten gelten. Dennoch sind sie heute ideologisch konnotiert. Dies belegt u. a. folgendes Zitat: Insbesondere kollektive Erfahrungen können Wörter semantisch bis zur Unerträglichkeit und Unverwendbarkeit belasten. Wer würde heute noch Wörter wie ‚Endlösung‘, ‚Sonderbehandlung‘ oder ,Vergasung‘ ohne Arg benutzen wollen, obgleich auch diese Wörter einmal höchst ,unschuldig‘ waren! (Schlosser 1995, 137)
Solche Ausdrücke, deren Erinnerungspotential so problematisch und kritikwürdig ist, sollten allein schon „mit Rücksicht auf die Gefühle der Opfer und ihrer Nachkommen“ vermieden werden (Wengeler 2002, 12), so dass die Betroffenen durch die Verwendung der Wörter nicht noch zusätzlich an ihr Leid und ihren Schmerz erinnert werden. Solche Wörter sollten also – so Dieckmann mit Wengeler – aus zwei Gründen nicht öffentlich verwendet werden: zum einen, um die Opfer zu schonen, zweitens um kein NS-Gedankengut weiterzutransportieren. Für Dieckmann (2012) stellt sich die Belastung dieser Wörter mitunter als Resultat sprachkritischer Reflexion dar. Für diejenigen, die das „Dritte Reich“ erlebt haben, waren nach 1945 viele Ausdrücke mit Erinnerungen verknüpft. Die Verwendungsweisen waren fixiert. Eine mögliche Ausbildung neuer oder die Wiederbelebung älterer Gebrauchsweisen dieser belasteten Wörter kann seit 1945 als verzögert gelten. Den Grund sieht Dieckmann (2012, 153) in der öffentlichen Sprachdiskussion, welche den semantischen Erinnerungsgehalt des nationalsozialistischen Gebrauchs belebt und präsent hält. Er vertritt die These, dass heute vornehmlich Wörter als belastet empfunden werden, die in der sprachkritischen Reflexion nach dem Ende der nationalsozialistischen Herrschaft als NS-typische Wörter thematisiert wurden und in den Jahrzehnten seitdem in dieser Rolle metakommunikativ gesetzt worden sind: Belastung nicht als Resultat des Gebrauchs im ,Dritten Reich‘, sondern als Resultat sprachkritischer Reflexion nach dem Ende der NS-Herrschaft. […] Für die Entstehung, Verfestigung und Aufrechterhaltung einer NS-Indizierung sprachlicher Ausdrücke ist deshalb bei den nachwachsenden Generationen zunehmend die öffentliche Thematisierung der NS-Sprache und ihrer Weiterverwendung in der Sprachkritik und Publizistik bedeutsam geworden. (Dieckmann 2012, 154)
Auch die Wahl zum „Unwort des Jahres“ unterstützt, so Dieckmann, diese Form sprachkritischer Erinnerungserhaltung. So wird Menschenmaterial von der ‚Sprachkritischen Aktion Unwort des Jahres‘ zum Unwort des 20. Jahrhunderts gewählt. Öffentlichkeitswirksam unterstützt wird die Wahl durch die Berichterstattung in den Medien, welche jedes Jahr in hohem Maße ein Wort (oder Wortverbindungen) in den Fokus des allgemeinen Interesses rückt. Auch in Schlossers Lexikon nimmt die Gruppe der NS-Unwörter einen unübersehbaren Platz ein und bis heute sind Nazi-
450
Ruth Maria Mell
Vergleiche kontinuierlicher Bestandteil öffentlicher sprachkritischer Diskussionen (vgl. Dieckmann 2012, 154). Ein thematisch damit eng verbundenes virulentes Thema in der Sprachkritik ist zudem die Auseinandersetzung mit Wörtern, die sich auf Konzepte des Antisemitismus, des Rassismus oder der Ausländerfeindlichkeit beziehen (vgl. Wengeler 1995, 711–749). Dabei schüren Reste eines völkischen Nationalismus die Angst vor Überfremdung (Wimmer 2000, 2060). Die Globalisierung und die Öffnung europäischer Grenzen werden als Ursache für Angriffe gegen Ausländer und Minderheiten gewertet (vgl. dazu z. B. den Anhang in Jäger 1993, 230 ff., bes. S. 234–267.). Wurden in den 60er Jahren immigrierte Arbeiter als Gastarbeiter scheinbar willkommen geheißen (vgl. dazu auch Schröter in diesem Band), werden heute Menschen und ihre Emigrationsgründe mit dem Ausdruck Wirtschaftsflüchtlinge abgewertet und als Rechtfertigung für die Metapher Ausländerflut sowie für eine angebliche Überfremdung in der Gesellschaft instrumentalisiert. Das Wort in der Sprachkritik ist in dieser Perspektive mit politisch korrektem Wortgebrauch und Sprachverhalten verbunden: Mit der Wahl des richtigen Ausdrucks trägt der Sprecher seine moralische Integrität in die Öffentlichkeit. Sein korrektes Denken wird im korrekten Sprechen manifest. Allerdings wird diese Wortkritik aus Sicht des „Gutsprech“ in der öffentlichen Mediendiskussion nicht immer positiv aufgenommen. Manche fühlen sich als Geisel einer Sprachnormenpolitik, in welcher sie jedes Wort, das sie äußern, prüfen müssen. So schreibt Josef Joffe auf der Onlineplattform der ZEIT zu diesem Thema in ironisierendem Unterton: Wie uns aber Freud lehrte, haben Tabus die Tendenz, sich unaufhörlich auszuweiten. Ein beliebtes Sprachverbot transportiert das Wörtchen ‚Generalverdacht‘. Wer ihn pflegt, macht aus Zigeunern (neu: Sinti und Roma) ‚lichtscheues Gesindel‘, aus Türken ‚Schulabbrecher‘ und ‚Ehrenmörder‘, aus Muslimen ,Terroristen‘, aus Frauen ,Zicken‘, aus Arbeitslosen ,Sozialschmarotzer‘, aus Homosexuellen ,Aids-Mutterschiffe‘. Natürlich ist menschliches Denken ohne Kategorisierung unmöglich. Also muss ‚gerechte Sprache‘ her. Also verbietet das korrekte Denken alles Abwertende, außer bei rechten Scheusalen wie Bankern, Jägern, Machos und Kapitalisten. (Joffe 2010 in ZEIT ONLINE.)
Auseinandersetzungen um den jeweils angemessenen und gebotenen Wort- und Sprachgebrauch sowie insbesondere um die angemessene Benennung und Bezeichnung der relevanten Gegenstände und Tatbestände werden nicht nur mit großem Engagement, sondern auch mit Rigorismus und Dogmatismus geführt. Daher gilt es abzuwägen, inwiefern es geboten sein muss, das Wort Negerkönig aus den PippiLangstrumpf-Erzählungen oder die Bezeichnung Negerlein aus Ottfried Preußlers Kleiner Hexe zu streichen, da doch Neger bei der Entstehung der deutschen Fassung/ Übersetzung noch nicht als diskriminierender Begriff empfunden wurde. Allerdings mangelte es zu diesen Zeiten an einem medial vermittelten wortkritischen Diskurs (vgl. dazu auch die Umfrageergebnisse in Kleine 2014).
Das Wort in der Sprachkritik
451
Änderungen und Anpassungen im Wortschatz schaffen Unsicherheiten, können auch zu Ungenauigkeiten führen. So informiert die Bundeszentrale für politische Bildung auf ihren Internetseiten: Setzt man für behindertes Kind das besondere […] Kind ein, bleibt der Ersatzausdruck so vage, dass für den Kommunikationszusammenhang wichtige Informationen fehlen können. (Forster 2010)
Die Grenzen zwischen übertriebener Political Correctness und notwendiger Sprachkritik sind nicht immer leicht auszumachen. Doch bleibt es geboten, über die Wörter, die man verwendet, zu reflektieren, da sie etwas über unser Denken und unsere Wirklichkeitswahrnehmung aussagen. Eine linguistisch begründete und in der Aufklärungstradition stehende Sprachkritik kann dabei gegenüber schematischen Normierungsversuchen im Sinne einer Political Correctness ausgleichend wirksam werden (vgl. Wimmer 2000, 2061).
3.2 Feministische Sprachkritik – Wort, Wirklichkeit und Denken Ein wichtiges sprachkritisches wie sprachpolitisches Thema, welches sowohl national als auch international medienwirksam diskutiert wird, behandelt die Frage nach der Gleichberechtigung und Gleichbehandlung von Frauen in Sprache und Gesellschaft (vgl. von Polenz 1999, 327 ff.; Gorny 1995, 517–562; Schiewe 1998, 270 ff.). Man spricht in diesem Zusammenhang auch von der sprachlichen Gleichbehandlung der Frau oder von gendergerechter Sprache. Die linguistische Teildisziplin, die sich kritisch mit verbesserten Partizipationsmöglichkeiten von Frauen in der mündlichen Kommunikation, in Gesprächen oder in öffentlichen Diskursen befasst, wird auch als Genderlinguistik bezeichnet. Mit Gender wird das sozial und kulturell konstruierte Geschlecht einer Person bezeichnet, das nicht notwendig mit dem biologischen Geschlecht (Sexus genannt) übereinstimmt und das nachweislich nicht mit dem sprachlichen Genus (Maskulinum, Femininum, Neutrum) zusammenhängt (vgl. Klann-Delius 2005, 8 f.). Die feministische Sprachkritik beschäftigt sich nicht nur mit einer als defizitär verstandenen kommunikativen Partizipation von Frauen (vgl. u. a. Klann-Delius 2005), sie zeigt auch, dass es geschlechtstypische Unterschiede im Sprachverhalten gibt. Nach Wimmer 2000 deuten Untersuchungsergebnisse darauf hin, dass Frauen hinsichtlich ihrer Gesprächsbeteiligung und ihrer Durchsetzungsmöglichkeiten, ihrer Themenwahl sowie ihrer Gesprächssteuerung benachteiligt werden (vgl. Wimmer 2000, 2003). Doch ist es nicht selten, vor allem in der feministischen Sprachkritik, das einzelne Wort, welches in den Fokus der Kritik gerät. Als Beispiel für die genderbezogene Kritik am Sprachsystem als Kritik am Wort sei hier exemplarisch die Asymmetrie in den Formen der höflichen Anrede angeführt, in der pluralisch zwar die höfliche
452
Ruth Maria Mell
Variante Meine Damen und Herren gewählt wird, im Singular aber nur Herr Meier, nicht Dame Meier üblicherweise verwendet wird. Ein anderes Beispiel der wortbezogenen feministischen Sprachkritik zeigt sich in der Benennung der „sprachliche[n] Unsichtbarkeit von Frauen“ bei der Verwendung des generischen Maskulinums – in Sätzen wie Diese Sendung wird dem Zuschauer gefallen. (vgl. Klann-Delius 2005, 25–27). Ausgehend von der These der geschlechtsbezogenen Sprachforschung, dass die Kategorie Geschlecht in Sprache und Sprachgebrauch patriarchale Machtverhältnisse reflektiert und diese Reflexion in Forschung und Theoriebildung aufzuklären sei (Klann-Delius 2005, 9), wird von der feministisches Sprachkritik u. a. die hinreichende Markierung des weiblichen Geschlechts im Sprachsystem gefordert, wenn diese z. B. kontextuell geboten ist. Auch bei Berufsbezeichnungen, wenn jene Berufe von Frauen ausgeübt werden, gilt diese Forderung nach adäquaten femininen Formen der Berufsbezeichnungen: z. B. Lehrerin, Beamtin, Ministerin, Professorin usw. Berufsund Personenbezeichnungen für Frauen sind im Deutschen dabei hauptsächlich durch so genannte Movierung per Suffix -in von der maskulinen Wortform abgeleitet und damit zugleich markiert und herausgehoben (wie Anwältin, Ärztin, Linkshänderin, Wählerin, Patientin), womit die „Vorherrschaft des Männlichen“ sprachlich reflektiert wird (Klann-Delius 2005, 31; vgl. auch Schoenthal 2000, 2065; zu Movierung vgl. Fleischer/Barz 1992, 182). Nur in seltenen Fällen ist bei Berufsbezeichnungen das feminine Ausgangswort maßgeblich. Dann jedoch wird die maskuline Form gerade nicht von der femininen abgeleitet oder rückgebildet, sondern es wird eine neue Bezeichnung eingeführt, wie z. B. bei Hebamme – Entbindungspfleger, Krankenschwester – Krankenpfleger, Kindergärtnerin – Erzieher (Schoenthal 2000, 2065). Tatsächlich besteht sprachlich durchaus die gendergerechter erscheinende Möglichkeit, die Opposition männlich/weiblich bei Berufsbezeichnungen nicht durch -in, sondern durch -mann/-frau auszudrücken, wie es bei Bildungen wie Kaufmann/Kauffrau der Fall ist. So schlagen sich Gesellschaftsstrukturen in unterschiedlicher Weise im Sprachsystem, vor allem aber am einzelnen Ausdruck, nieder. So wurde besonders die bisher praktizierte Möglichkeit zur Personenbezeichnung von der feministischen Sprachkritik als asymmetrisch erkannt: In dieser Sicht werden Männer bevorzugt, Frauen unsichtbar gemacht oder diskriminiert. Die Personenbezeichnungen stellen – als Teilwortschatzbereich – im Deutschen eine Ausnahme dar, weil sie in der Regel gerade nicht arbiträr sind, sondern in grammatischem und biologischem Geschlecht übereinstimmen. Ausnahmen sind das Weib, das Mädchen, der Gast, die Person oder das Mitglied. So konzentriert sich die feministische Sprachkritik, mit Fokus auf grammatisch-morphologische Kombinatorik, auf den Wortschatz, z. B. eben auf Personenbezeichnungen wie Frau, Nichte, Linkshänderin, Wählerin, Patientin, Seniorin sowie mit dem unter emanzipatorischen Gesichtspunkten wichtigen Wortschatz von Berufsbezeichnungen wie Schneiderin, Ministerin, Hebamme oder Ärztin (vgl. Schoenthal 2000, 2065; Klann-Delius 2005, 34–37). Kritisiert wird u. a. in diesem Zusammen-
Das Wort in der Sprachkritik
453
hang der generische Gebrauch des Maskulinums, der „fundamentale Asymmetrien im Bereich der Personenbezeichnung“ (Schoenthal 2000, 2064), d. h. „Asymmetrien im Wortschatz“ (Klann-Delius 2005, 36) belege. Auch wenn feministische Sprachkritik vorrangig verwendungsorientiert ist, zielt sie aber mit der Abschaffung resp. der Einschränkung z. B. des generischen Maskulinums letztendlich auf die Veränderung eines Teils des deutschen Wortschatzes im Sinne des Sprachsystems. Die Aufgabe einer zukünftigen feministischen Sprachkritik besteht, so KlannDelius (2005, 18), darin, wie sich die Bestimmung einzelner sprachlicher und wortbezogener Befunde zum Geschlechterverhältnis u. a. auf Bildungschancengleichheit auswirken. Feministische Sprachkritik fordert die Aufhebung der sprachlichen Asymmetrie sowie die Vermeidung diskriminierender Begriffe für Frauen. Nach dem Vorbild des „Wörterbuchs des Unmenschen“ von Sternberger, Storz und Süßkind ([1945] 1968), einem Nachschlagewerk, in welchem Wörter versammelt sind, die nach dem Willen der Herausgeber vorerst nicht benutzt werden sollten, haben Sprachkritikerinnen frauendiskriminierende Unwörter zusammengestellt und empfohlen, diese aus der deutschen Sprache zu streichen. Neben der Anrede Fräulein sind dies vor allem Schimpfwörter wie alte Jungfer, alte Schachtel, altes Weib, Mannweib, dummes Weibsbild, weibisch, spätes Mädchen, Weibergeschwätz, Tippse oder Klatschbase (vgl. Schoenthal 2000, 1957). Die Gleichstellung von Mann und Frau ist unmittelbar mit geschlechtergerechter Wortwahl und Wortbildung verbunden, werden doch in diskriminierendem Sprachgebrauch die kognitiven Aspekte einer Asymmetrie der Geschlechter reflektiert. Dies zeigen auch empirische Untersuchungen (vgl. Braun 2004, bes. 14–25).
3.3 Purismus – das Wort als Fremdes Unter Purismus versteht man Bestrebungen, eine Sprache von vor allem lexikalischen Einflüssen einer, mehrerer oder aller anderen Sprachen zu ‚reinigen‘. Puristische Sprachkritik ist keine deutsche Besonderheit, sondern wurde und wird auch in vielen anderen Ländern betrieben. Gegenwärtig haben in Deutschland puristische Bestrebungen vor allem im Zusammenhang mit der öffentlichen Kritik an der von den Puristen als ‚übermäßig’ empfundenen Verwendung von Anglizismen an Bedeutung gewonnen (vgl. Sauer 2010, 545). Aus linguistischer Perspektive muss bei lexikalischen Entlehnungen aus anderen Sprachen zwischen Fremdwort und Lehnwort unterschieden werden. So genannte Fremdwörter sind nicht oder nur wenig in das phonologische, morphologische und graphematische System z. B. des Deutschen integriert (vgl. Riehl in diesem Band). Sie gelten im Deutschen zumeist als akzeptiert, wenn sie einer Fachsprache zuzurechnen sind. So wird insbesondere der Gebrauch von Fremdwörtern aus dem Lateinischen oder dem Griechischen als Beleg einer ‚gebildeten‘ Ausdrucksweise geschätzt. Alltagssprachlich werden vor allem Anglizismen in den letzten Jahren wieder stärker kritisiert (vgl. Schmöe 2010a, 211). Im
454
Ruth Maria Mell
Gegensatz zum Fremdwort handelt es sich beim Lehnwort um eine lexikalische Entlehnung, die weitgehend in das System der Nehmersprache integriert ist. Dabei ist die fremdsprachige Abstammung für Laien häufig nicht mehr erkennbar, vgl. dt. Stiefel aus ital. stivale. Doch da solche Integrationen graduell verlaufen, ist die Abgrenzung zwischen Lehnwort und Fremdwort zuweilen schwierig bis unmöglich (vgl. Schmöe 2010b, 392). Daher gerät das Lehnwort wesentlich seltener in den Fokus sprachpuristischer und sprachkritischer Bestrebungen. In einer kontinuierlichen Traditionslinie sind Fremdwörter seit dem 17. Jahrhundert Gegenstand der Sprachkritik, wobei die Intensität der Kritik in den einzelnen Epochen recht unterschiedlich ist. Dabei sind unterschiedlichste Begründungen gegen Fremdwörter vorgebracht worden. Eine davon ist ihre geringere Verständlichkeit, welche auch Dieckmann (2012, 108 ff.) betont. Dieckmann zufolge sei es gerade diese Begründung, die noch heute von Sprachkritikern und -kritikerinnen vorgebracht werde, um sprachpuristische Bestrebungen nicht dem „Verdacht nationalistischer oder gar chauvinistischer Motive“ auszusetzen (Dieckmann 2012, 108). So stellen sich einige Sprachkritiker heute in die Traditionslinie von Schottelius, Leibniz, Jochmann und vor allem Campe, welcher die Notwendigkeit einer verständlichen, puristischen Sprache sah, d. h. einer Sprache, die auf die Fremdwörter verzichtet (vgl. Dieckmann 2012, 108): So lange ein Volk noch keinen Ausdruck für einen Begriff in seiner Sprache hat, kann es auch den Begriff selbst weder haben noch bekommen. Nur diejenigen unter ihm können ihn haben oder bekommen, die der fremden Sprache kundig sind, welche das Wort dazu leiht. Dies ist der Gesichtspunkt, aus welchem die Reinigung unserer Sprache von fremden Zusätzen zu einer so überaus wichtigen Angelegenheit wird. (Campe 1794, zit. in Schiewe 1998, 35)
Campes Vorstellung zufolge sollte man über das Erlernen der Bedeutung von Wörtern „wortgesteuert“ Kenntnisse über die mit den Wörtern bezeichneten Gegenstände oder Sachverhalte erlangen (vgl. Dieckmann 2012, 110). Daher schlug Campe für Fremdwörter deutsche Ersatzausdrücke vor, die aber mitunter die kommunikative Brauchbarkeit der Wörter beeinträchtigten (vgl. Dieckmann 2012, 109). Auch von Polenz (1994, 131) nennt eine Reihe von Ursachen für den Misserfolg vieler Verdeutschungsvorschläge Campes. Über Campes Grundauffassung, Fremdwörter seien wegen der Undurchsichtigkeit ihrer Ausdrucksseite unverständlicher als „einheimische“ Wörter, besteht allerdings noch heute in der öffentlichen Sprachdiskussion weitgehend Konsens (vgl. Dieckmann 2012, 110). Ein zweites Motiv des Purismus, das im obigen Zitat von Campe bereits ebenso angedeutet wird, besteht in der Identifikation einer nationaler Identität mit einer ‚reinen Sprache‘. Die Bedeutung der deutschen Sprache als Kennzeichen von Nationalität ist vor allem auf den Ursprung des Wortes deutsch als Bezeichnung für die Sprache sowie die Bildung der „deutschen Nation“ im 19. Jahrhundert zurückzuführen, die nach einer jahrhundertelangen politischen Zersplitterung und anders als in den zentralistischen Staaten England und Frankreich, als rein ideelles Gebilde
Das Wort in der Sprachkritik
455
existierte. In dieser „deutschen Nation“, so der puristische Gedanke, konnten sich „die Deutschen“ vor allem durch eine gemeinsame Sprache repräsentiert fühlen (vgl. Townson 1992, 232). Townson stellt unter Bezugnahme auf Kirkness (1984/1998) heraus, dass um die Wende des 19. Jahrhunderts vermehrt stärkere nationalpolitische Züge zur Purismusdiskussion hinzutreten. In dieser geht es einerseits um eine politische Einigung im Inneren, andererseits um eine stärkere nationale Abgrenzung nach außen. Sprache, Volk und Staat werden mehr und mehr gleichgesetzt und „der Gedanke der Sprachnation und der Nationalsprache wird staatspolitisch umgesetzt“ (Townson 1992, 233). In dieser Zeit weicht das Argument einer besseren Verständlichkeit der eigenen Sprache, die auf fremdsprachliche Ausdrücke weitestgehend verzichtet, dem Gedanken „der Erhaltung der nationalen Eigenart“ (Townson 1992, 233). So wird in dieser Phase der nationalsprachlichen Abgrenzung um 1815 auch die Bezeichnung des ‚Fremdworts‘ geprägt. Beeinflusst wird die Beschäftigung mit dem Fremdwort durch eine Metaphorik aus dem biologischen Bereich, mit der das Deutsche als eine ‚reine‘ und ‚organisch gewachsene‘ Sprache beschrieben und klassifiziert wird. Infolgedessen wird der Topos von der ‚Reinheit‘ der deutschen Sprache einem Bedeutungswandel unterzogen: Das fremde Wort wird dabei als „Verunreinigung“ und als „schädlicher Einfluss“ verstanden (Townson 1992, 233). Diese Auffassung ist es, die dann auch rassistische Vorwürfe nährt, wenn das Fremde als Gefährdung der eigenen nationalen Identität verstanden wird (vgl. Townson 1992, 233). Der „Allgemeine deutsche Sprachverein“ ist Ende des 19. Jahrhunderts institutioneller Hauptvertreter des Fremdwortpurismus. In den Zielen des Sprachvereins spiegelt sich eine Vorstellung von Purismus wider, die den Purismus als Diener eines „nationalen Gedankens“ versteht, der sich der „Reinhaltung der deutsche Sprache verpflichtet sieht“ (Townson 1992, 233 f.). Diese Wahrung der „Reinheit“ rückt im Laufe der Zeit mehr und mehr in den Vordergrund. Die Fremdwörter, die nach dem Ersten Weltkrieg „sogar als Feindwörter“ (Townson 1992, 238) bezeichnet werden, werden als Bedrohung für das Deutsche wie auch für Deutschland aufgefasst und entsprechend ,bekämpft‘. Dennoch haben Anglizismen heute einen nahezu festen Platz im Grundwortschatz des Deutschen. Der „Verein Deutsche Sprache“ (VDS) hat es sich daher zur Aufgabe gemacht, Deutsch als eigenständige Kultursprache zu fördern und schlägt deutsche Wörter als Alternativen vor (vgl. Über den VDS 2014). Dafür haben seine Mitglieder einen so genannten „Anglizismen-INDEX“ zusammengestellt, ein Nachschlagewerk für Anglizismen, die in der deutschen Sprache verwendet werden. Dieser Index liefert darüber hinaus Synonyme für die Anglizismen oder listet Vorschläge für deutsche Entsprechungen (vgl. VDS Index 2014). Jedoch scheinen die alternativen Wörter teilweise die Semantik des zu ersetzenden Anglizismus nicht ganz zu treffen, so Sandbrettern für Sandboarding, Klappstulle oder Doppelbrot für Sandwich, das Terminmerken für den Ausdruck Safe the date oder Abtastung für scan (vgl. VDS Liste 2014).
456
Ruth Maria Mell
Im Fokus des aktuellen Purismus stehen nahezu ausschließlich englische Entlehnungen, kaum jedoch lateinische. Die Kritik an lateinischen Fremdwörtern ist indes auch daher anders zu werten als z. B. die Anglizismenkritik, zumal die lateinischen Ausdrücke weder in der Lautung noch in der Schreibung die Schwierigkeiten des Englischen bieten. Überdies wurden und werden die lateinischen Begriffe eher in der bildungsbürgerlichen Sprache verwendet. Bezeichnungen, Ausdrücke und Produktnamen, wie z. B. iPad oder Finanzcheck, prägen heute den Alltag aller sozialen Schichten. Generell sind in Situationen, in denen alltagsweltliche Gegenstände thematisiert werden, Fremdwörter für uns problemlos zu verstehen (vgl. Dieckmann 2012, 123). So geben Bezeichnungen wie Telefon, Garage, Portemonnaie oder Pizza nur in Ausnahmefällen Anlass zu Sprachkritik. Wörter werden dann als Verstehensbarriere und somit als kritikwürdig empfunden, wenn die Wörter fachlichen Domänen angehören, die uns wenig oder gar nicht vertraut sind, wie z. B. Texte auf Beipackzetteln eines Medikaments, in Vertragsbedingungen von Versicherungen, Texte im Wirtschaftsteil der Zeitung oder wissenschaftliche Vorträge (vgl. Dieckmann 2012, 123). Damit korrespondiert die Erfahrung des Nicht-Verstehens eines Textes in der öffentlichen Wahrnehmung mit der Beobachtung, dass jener viele Fremdwörter enthält. Obwohl hier eine Ursache-Wirkung-Korrelation naheliegt, ist es jedoch vielmehr so, dass nicht die Fremdwörter unser Verstehen negativ beeinflussen. Es ist das Fehlen der fachspezifischen Kenntnisse, das zu Verständnisproblemen führt. Zu Unrecht begründet daher die Laienlinguistik die Schwerverständlichkeit von Texten mit der Verwendung von „fremden Wörtern“ (Dieckmann 2012, 124). Kieserling betont in Bezug auf das Verständnis von Fachtexten einen weiteren kritischen Punkt, wenn er auf die Problematik einer vertraut erscheinenden deutschen Wortform und deren eventuell dennoch ‚fremde‘, weil wissenschaftlich neu semantisierte Inhaltsseite Bezug nimmt: Denn die Sprache einer Wissenschaft sondert sich nicht durch eigene Wörter, sondern durch eigene Begriffe von der Alltagssprache ab. Als Begriffe können aber auch die ganz normalen Wörter der Alltagssprache fungieren […] Dass es daneben immer auch Kunstwörter gibt, die das Verständnis der Laien schon als Wort (und nicht erst als Begriff) überfordern, sollte nicht davon ablenken, dass die sozialen Zumutungen einer wissenschaftlichen Sprache in den Begriffen liegen […]. (Kieserling 2001, 21)
So ist das Wort Stammzelle zwar deutsch gebildet, aber für Nicht-Mediziner nahezu unverständlich. Der Purismus begründet seine Wortkritik also vor allem so durch zwei Argumente: Verständlichkeit und nationale Identität durch eine nationale, d. h. reine, Sprache, wobei sich das Motiv der Identität von bloß identitätsschmückenden bis hin zu nationalistisch-chauvinistischen Ausprägungen spannt.
Das Wort in der Sprachkritik
457
3.4 Das Wort und die Ökonomie der Medien – Das Beispiel Bastian Sick Die in Glossen und Kommentaren von Online- oder Printkolumnen praktizierte öffentliche Sprachkritik ist durchaus mit derjenigen Tradition sprachkritischer Tätigkeit verbunden, welche ihren Fokus häufig auf die Veränderungen einer Sprache – zumeist auf die Ebene des Lexikons, d. h. des Wortschatzes – richtet. Meistens sind es Werbetexter, TV-Promis, Journalisten oder Institutionen wie die ‚Deutsche Bahn‘ oder die ‚Post‘, die als Verursacher negativer Sprachveränderungen ausgemacht werden. Auch die Jugendsprache wird „gerne für solche Veränderungen verantwortlich gemacht, welche dann mit dem Stigma ‚Sprachverfall‘ belegt werden. All diese Veränderungen geben Anlass zur Sorge, dass diese neuen im Sprachgebrauch zu beobachtenden Entwicklungen der deutschen Sprache schadeten und längerfristig zu ihrem Verfall führen könnten. (vgl. Dieckmann 2012, 174–176). Gerade das Beispiel Bastian Sick hat gezeigt, wie gut heute noch die publizistische Sprachglosse in unserer Medienlandschaft gedeiht. So sei an dieser Stelle an die mehrfach multimediale Verwertung der „Zwiebelfisch-Kolumne“, nicht nur in der Druckfassung der Zeitschrift DER SPIEGEL oder auf SPIEGEL ONLINE, sondern auch als mehrbändige Buchreihe, als Hörbuch sowie als „sprachkritisches Showereignis“ (Dieckmann 2012, 180) in Form der „größte[n] Deutschstunde der Welt“ in der Köln-Arena im März 2006 mit mehr als 15000 Teilnehmerinnen und Teilnehmern (vgl. Hundt 2010, 174) erinnert: „Der Dativ ist dem Genitiv sein Tod“ – 2004 im Verlag Kiepenheuer & Witsch erschienen – avancierte binnen kürzester Zeit zum Bestseller. Der Erfolg Bastian Sicks verdankt sich wohl nicht zuletzt den Irrungen und Wirrungen um die Rechtschreibreform, deren „Amtliches Regelwerk“ am 1. August 2006 in Kraft trat, womit eine neue Welle der sprachlichen Verunsicherung im deutschsprachigen Raum begann. Klare Aussagen zu auch für Nicht-Linguistinnen und Nicht-Linguisten leicht fassbaren wortbezogenen sprachlichen Einzelphänomenen, welche in Zweifelsfällen eindeutig mit richtig oder falsch antworteten, so wie Sick es in seinen sprachkritischen Glossen tut, wurden gerade in dieser Zeit als hilfreiche, oft sogar notwendige Orientierung empfunden (vgl. Hundt 2010, 178). Für die Laienlinguistik ist es häufig die Wahl oder Verwendung einzelner Wörter, ihre Schreibung sowie ihre Flexion, an denen sich auch bei Sick die Streitfragen über richtiges und gutes Deutsch entzünden: sei es die Semantik des Begriffspaares scheinbar/anscheinend (Hundt 2010, 180; Schneider 2005, 11 f.; Kilian/Niehr/Schiewe 2010, 80), Wortübernahmen aus dem Englischen wie Service Point, (vgl. Hundt 2010, 182) oder die Wahl des korrekten Verbs, wie z. B. schmeißen vs. kriegen (vgl. Hundt 2010, 187; Schneider 2005, 13 f.). Es ist mitunter gerade die vermeintlich inflationäre Verwendung von Anglizismen, z. B. bei der ‚Deutschen Bahn‘ oder bei der ‚Telekom‘, die sowohl im Inland als auch im fremdsprachigen Ausland (vgl. SZ 2010) kritisch betrachtet und sogar zuweilen als unnötig empfunden werden. Schneider betont, dass mit der Verwendung von
458
Ruth Maria Mell
CityCall, GlobalCall, Intercity, BahnCard, Counter oder dem so genannten Kiss and Ride für Kurzzeitparker lediglich das ‚kommunikative‘ Ziel verfolgt werden könne, das Unternehmen als ‚Global Player‘ zu präsentieren (Schneider 2005, 14). So äußert sich auch Sick zu diesem Themenkomplex, sowohl mit Bezug auf Wortübernahmen aus dem Englischen, als auch im Bereich syntaktischer Strukturen in seiner Kolumne Stop making sense! (Sick 2004, 47–50), wobei er die Vorstellung einer einzigen und unverrückbaren Bedeutung eines Wortes zur Erklärung heranzieht, warum etwa Sinn machen keine korrekte deutsche Formulierung sein könne (vgl. Hundt 2010, 182): ‚Sinn‘ und ‚machen‘ passen einfach nicht zusammen. Das Verb ‚machen‘ hat die Bedeutung von fertigen, herstellen, tun, bewirken; es geht zurück auf die indogermanische Wurzel -mag, die für ‚kneten‘ steht. Das erste, was ‚gemacht‘ wurde, war demnach Teig. Etwas Abstraktes wie Sinn lässt sich jedoch nicht kneten oder formen. Er ist entweder da oder nicht. Man kann den Sinn suchen, finden, erkennen, verstehen, aber er lässt sich nicht im Hauruck-Verfahren erschaffen. (Sick 2004, 49)
Auch für die Unterscheidung von ‚sinnvollen‘ und ‚überflüssigen‘ Anglizismen bleibt Sick auf der Wortebene. Wenn Fremdwörter die deutsche Sprache bereicherten, so Sick, seien sie „willkommen“. Wenn Anglizismen „gleichwertige deutsche Wörter“ nur „ersetzen oder verdrängen“, seien sie „unnötig“ (Sick 2004, 147). Sick schlägt daher für gevotet das Wort abgestimmt vor, statt upgedated sollte aktualisiert und anstelle von gebackupt der Ausdruck gesichert verwendet werden (vgl. Sick 2004, 147). Sicks Unterscheidungskriterium zwischen ‚deutschen Wörtern‘ und Anglizismen muss jedoch als inkonsistent gewertet werden, da englische Wörter auch in die deutsche Sprache und Grammatik aufgenommen werden (vgl. Schneider 2005, 15). Sick, der – für Sprachpfleger und Sprachpflegerinnen typischerweise – weitgehend auf die Einzelwort- bzw. Lexemebene fixiert bleibt (vgl. Schneider 2005, 19), will dem sprachinteressierten Laien in Zeiten sprachlicher Unsicherheit einfache Gebrauchsanweisungen zur richtigen semantischen, aber auch grammatikalischen Verwendung des Wortes an der richtigen Stelle im Sprachsystem bieten, was jener dankend annimmt. Egal, ob es sich um die richtige Numerusmarkierung bei eingedeutschten italienischen und lateinischen Wörtern (nicht ein Mafiosi, ein Soli) handelt (Sick 2004, 98 f.) oder ob Sick die falsche Verwendung des Apostrophs (z. B. Futter’n wie bei Mutter’n, stet’s, nirgend’s oder eigen’s) in seinen Kolumnen behandelt (vgl. Sick 2004, 32); ob der „Deklinationsdilettantismus“ (Hundt 2010, 184) am Beispiel dieses Jahres/diesen Jahres (Sick 2004, 90–93) oder die zum Syntaxfehler erklärte doppelte Perfektbildung am Beispiel des Partizips gehabt (Sick 2004, 179–182) als Missstand diskutiert wird, stets ist es doch ein einzelnes Wort oder ein Ausdruck, den Sick in den Mittelpunkt seiner Kritik stellt. Dabei stehen einzelne von ihm zu Sprachfehlern erklärte Phänomene für den Untergang, den „Tod“, des gesamten Sprachsystems, in dem die Mehrheit der Sprachgemeinschaft nicht mehr zwischen falschem und richtigem, d. h. gutem Deutsch unterscheiden können.
Das Wort in der Sprachkritik
459
Sowohl der Linguist Schneider als auch sein Kollege Hundt mahnen zur Vorsicht bei dieser Form populärer Sprachkritik. Hundt formuliert scharf, Sicks Werk ließe zuweilen Wissenschaftlichkeit und Fundiertheit vermissen. Auch die Idee, dass sich Elemente einer natürlichen Sprache immer in den Kategorien richtig/falsch bewerten ließen sowie eine Unterstützung falscher Autoritätsgläubigkeit, verbunden mit einem eher fragwürdigen Verhältnis zum Sprachwandel, sprechen gegen Sicks Ansatz und sind „weit entfernt […] von eine[r] ernsthafte[n] sprachwissenschaftliche[n] Auseinandersetzung mit der Gegenwartssprache“ (vgl. Hundt 2010, 193–196).
4 Fazit Es ist häufig, wenn auch nicht ausschließlich, das einzelne Wort, das im Fokus der laienlinguistischen wie auch der linguistisch begründeten Sprachkritik steht, wobei das einzelne Wort dann repräsentativ für das gesamte Sprachsystem gesetzt wird. Im Bereich der Genderlinguistik wie auch in der öffentlichen Diskussion, z. B. um den politisch korrekten Ausdruck, ist die Kritik am Gebrauch einzelner Wörter zudem auch Kritik an einzelnen Sprecherinnen und Sprechern, zuweilen sogar Kritik am Gesellschaftssystem selbst. Es ist also der ungeschickte, strategisch gewollte Gebrauch oder eine bestimmte Gebrauchsweise eines Wortes, die vor allem in der laienlinguistischen Sprachkritik zum Gegenstand der Kritik wird. Ebenso wird häufig von der Laienlinguistik die Sache, für die ein Wort steht, oder eine in der Fehldeutung des Sprachkritikers vermeintlich als falsch beschriebene Wirklichkeit durch ein Wort, kritisiert (vgl. Dieckmann 2012, 146 f.). Die Ausdrucksseite eines sprachlichen Zeichens wird dabei weniger kritisiert. Vielmehr steht ein vermeintlich normgerechter semantischer, grammatikalischer oder stilistisch-pragmatischer Gebrauch von Wörtern im Fokus. Für die laienlinguistische Sprachkritik nimmt das Wort häufig eine Stellvertreterposition für das gesamte Sprachsystem ein, wie auch Sick in seinen sprachkritischen Kolumnen beweist. Bei medienwirksamer öffentlicher Sprachkritik am einzelnen Wort, wie zum Beispiel bei der Nominierung des „Wortes des Jahres“ scheint es zudem vielmehr um die Wahl von Schlüsselwörtern öffentlicher gesellschaftspolitischer Diskurse als um sprachkritische Betrachtung zu gehen, wie auch die Wahl des Wortes des Jahres 2014 Lichtgrenze demonstriert. Ein weiterer Schwerpunkt laienlinguistischer Sprachkritik liegt in der Unterscheidung von richtigem und falschem Wortgebrauch wie auch auf der Verwendung der ‚richtigen‘ Schreibung. Der historisch motivierte Variantenreichtum natürlicher Sprachen wird dabei jedoch als Mangel identifiziert; Doppelformen wie Frisör und Friseur werden von der Öffentlichkeit als unzumutbar empfunden, da nur eine Schreibung die richtige sein könne (vgl. Hundt 2010, 178). Die linguistisch fundierte Sprachkritik hingegen ist mehr auf Rede, Text und Sprache als Kommunikationsmittel oder als System fokussiert. Das Ziel einer linguistischen Wortkritik könnte vielmehr darin liegen, im Gegensatz zur laienlinguistischen
460
Ruth Maria Mell
Kritik an der deutschen Sprache, mittels der Durchsetzung eines interessengeprägten und normgerechten, d. h. eines politisch korrekten Sprachgebrauchs sowohl die Wortgebrauchsnormen als auch die Wahrnehmungsnormen zu verändern (vgl. Wimmer 2000, 2061). Damit verbunden wäre zudem, eine aktive und kritische Haltung aller Bürgerinnen und Bürger im gesellschafts- und sprachpolitischen Diskurs zu vermitteln und zu fördern. Vielleicht gilt es daher, vor allem im Rahmen einer als Wortkritik zu verstehenden öffentlichen Sprachkritik, eine verstärkte Sensibilität in Bezug auf den Wortgebrauch zu fordern und Sprachkritik so zu fassen, wie es Frohning u. a. aus linguistischer Perspektive bereits 2002 formulieren: Sinnvolle Sprachkritik, die Verständlichkeit und Kommunizierbarkeit in den Mittelpunkt stellt, konstruktiv und gebrauchsorientiert ist und in einer aufklärerischen Tradition steht, sollte im öffentlichen Bewusstsein deutlich abgegrenzt werden von jenen Formen der Sprachbewertung, die aus nationalistischen oder puristischen Motivationen hervorgehen, konservativ ausgerichtet sind und nicht primär die Verbesserung von Kommunikation verfolgen. (Frohning u. a. 2002, 2)
Eine Wortkritik, die gerade auf nationalistisch-puristische Kritikmotivation verzichtet und bei der Kritik am Wort wesentlich zum Zweck einer besseren Verständlichkeit und Kommunizierbarkeit geübt wird, versteht Sprachkritik als Erziehungsinstrumentarium zur Bildung einer aufgeklärten Öffentlichkeit. Zudem trägt eine solche Wortkritik zu einem reflektierten Wortgebrauch bei, wenn sie in rassistischen, faschistischen oder anderen Kontexten, in den Menschen ungerecht behandelt oder unterdrückt werden, zu einen semantisch sensibilisierten Umgang mit ‚schwierigen‘ Wörtern auffordert. Die in diesem Beitrag ausgeführten Erläuterungen beziehen sich primär auf das Wort in der Sprachkritik. Darüber hinaus gibt es auch Gegenstandsbereiche in der Sprachkritik, die anderen sprachlichen Ebenen zuzuordnen sind, wobei auch dort gilt, dass sich Interessen, Perspektiven und Ziele verschiedener Strömungen stark voneinander unterschieden.
5 Literatur Antos, Gerd (1996): Laien-Linguistik. Zum Verhältnis von Laien und Experten in der Sprachwissenschaft. Studien zu Sprach- und Kommunikationsproblemen im Alltag am Beispiel von Sprachratgebern und Kommunikationstrainings. Tübingen. Bär, Jochen A. (2002): Darf man als Sprachwissenschaftler die Sprache pflegen wollen? Anmerkungen zu Theorie und Praxis der Arbeit mit der Sprache, an der Sprache, für die Sprache. In: Zeitschrift für germanistische Linguistik (ZGL) 30, 222–251. Biere, Bernd Ulrich/Helmut Henne (Hg.) (1993): Sprache in den Medien nach 1945. Tübingen. Dieckmann, Walther (2012): Wege und Abwege der Sprachkritik. Bremen. Eichinger, Ludwig M. (2009): Vom rechten Deutsch. Wer darf die Sprach kritisieren? In: Wolf-Andreas Liebert/Horst Schwinn (Hg.): Mit Bezug auf Sprache. Festschrift für Rainer Wimmer. Tübingen
Das Wort in der Sprachkritik
461
(= Studien zur Deutschen Sprache. Forschungen des Instituts für Deutsche Sprache. Hrsg. v. Arnulf Deppermann, Stefan Engelberg und Ulrich Hermann Waßner; Bd. 49), 201–218. Fix, Ulla (1995): Ansprüche an einen guten (?) Text. In: Aptum. Zeitschrift für Sprachkritik und Sprachkultur, 4, Heft 1, 1–20. Fleischer, Wolfgang/Irmhild Barz (1992): Wortbildung in der deutschen Gegenwartssprache. Tübingen. Frohning, Dagmar u. a. (2002): Einleitung. In: Jürgen Spitzmüller u. a. (Hg.): Streitfall Sprache. Sprachkritik als angewandte Linguistik? Mit einer Auswahlbibliographie zur Sprachkritik (1990 bis Frühjahr 2002). Bremen (= Freiburger Beiträge zur Linguistik, 3), 1–15. Gauger, Hans-Martin (1995): Über Sprache und Stil. München. Goethe, Johann Wolfgang von (1978). Maximen und Reflexionen 1033. In: Goethes Werke. Hamburger Ausgabe in 14. Bänden. Hrsg. v. Erich Trunz. 8. überarbeitete Auflage. München. Bd. 12, 511. Gorny, Hildegard (1995): Feministische Sprachkritik. In: Georg Stötzel/Martin Wengeler (1995): Kontroverse Begriffe. Geschichte des öffentlichen Sprachgebrauchs in der Bundesrepublik Deutschland. Berlin/New York (= Sprache. Politik. Öffentlichkeit. Bd. 4. Hrsg. v. Armin Burkhardt u. a.), 517–562. Heringer, Hans Jürgen (2009): Kritik in der Krise? In: Aptum. Zeitschrift für Sprachkritik und Sprachkultur. 5, 251–260. Hundt, Markus (2010): Bastian Sick: Der Dativ ist dem Genitiv sein Tod. In: Mittelungen des Deutschen Germanistenverbandes 2/2010, Jg. 57, 174–196. Ickler, Theodor (2007): Wie gut ist die deutsche Sprache? In: Ulrich Knoop (Hg.): Jahrbuch 2001–2005 der Henning Kaufmann-Stiftung. Paderborn, 23–40. Jäger, Siegfried (1993): Kritische Diskursanalyse. Eine Einführung. Duisburg. Janich, Nina/Lisa Rhein (2010): Sprachkultur, Sprachkultivierung, Sprachkritik (= Studienbibliographien Sprachwissenschaft, 37). Tübingen. Kieserling, André (2001): Soziologen zwischen Terminologie, Jargon und Alltagssprache. In: Gegenworte. Heft 7, 21–24. Kilian, Jörg/Thomas Niehr/Jürgen Schiewe (2010): Sprachkritik. Ansätze und Methoden der kritischen Sprachbetrachtung (= Germanistische Arbeitshefte, 43). Berlin. Kirkness, Alan (1984/1998): Das Phänomen des Purismus in der Geschichte des Deutschen. In: Werner Besch/Oskar Reichmann/Stefan Sonderegger (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 2., vollständig neu bearbeitete und erweiterte Auflage. 1. Teilband. Berlin/New York (= Handbücher zur Sprach- und Kommunikationswissenschaft, Bd. 2: Sprachgeschichte), 407–416. Klann-Delius, Gisela (2005): Sprache und Geschlecht. Eine Einführung (= Sammlung Metzler, Bd. 349). Stuttgart/Weimar. Neuland, Eva (1996): Sprachkritiker sind wir doch alle! Formen öffentlichen Sprachbewußtseins. Perspektiven kritischer Deutung und einige Folgerungen. In: Karin Böke/Matthias Jung/ Martin Wengeler (Hg.): Öffentlicher Sprachgebrauch. Praktische, theoretische und historische Perspektiven. Georg Stötzel zum 60. Geburtstag. Opladen, 110–120. Nussbaumer, Markus (1995): Bewertungskriterien für die Sprachberatung in der Schule. In: Bernd Ulrich Biere/Rudolf Hoberg (Hg.): Bewertungskriterien in der Sprachberatung. Tübingen, 74–90. Platon [1957]: Kratylos. In: Platon. Sämtliche Werke. Rowohlts Klassiker, Hamburg: Rowohlt Taschenbuch. Bd. 2, 123–181. Polenz, Peter von (1994): Deutsche Sprachgeschichte. Vom Spätmittelalter bis zur Gegenwart. Bd. II. 17. und 18. Jahrhundert. Berlin/New York. Polenz, Peter von (1999): Deutsche Sprachgeschichte vom Spätmittelalter bis zur Gegenwart. Band III. 19. und 20. Jahrhundert. Berlin/New York.
462
Ruth Maria Mell
Polenz, Peter von (2005): Streit über Sprachkritik in den 60er Jahren. In: Aptum. Zeitschrift für Sprachkritik und Sprachkultur. 1, Heft 2, 97–111. Polenz, Peter von [1973] (1982): Sprachkritik und Sprachnormenkritik. In: Hans-Jürgen Heringer (Hg.) (1982): Holzfeuer im hölzernen Ofen. Ansätze zur politischen Sprachkritik. Tübingen, 70–93. Sauer, Wolfgang (2010): Artikel Purismus. In: Helmut Glück (Hg.): Metzler Lexikon Sprache. Stuttgart/Weimar, 545–546. Saussure, Ferdinand de (1931): Grundfragen der allgemeinen Sprachwissenschaft. Hrsg. v. Charles Bally und Albert Sechehaye unter Mitwirkung v. Albert Riedlinger. Übers. V. Herman Lommel. Berlin/Leipzig. Schiewe, Jürgen (1998): Die Macht der Sprache. Eine Geschichte der Sprachkritik von der Antike bis zur Gegenwart. München. Schiewe, Jürgen/Martin Wengeler (2005): Aptum. Zeitschrift für Sprachkritik und Sprachkultur. Einführung der Herausgeber zum ersten Heft. In: Aptum. Zeitschrift für Sprachkritik und Sprachkultur. 1, Heft 1, 1–13. Schlosser, Horst Dieter (2000): Lexikon der Unwörter. Gütersloh. Schlosser, Horst Dieter (1995): Sprachkritik zwischen „political correctness“ und anderen Klippen. In: Bernd Biere/Rudolf Hobert (Hg.): Bewertungskriterien in der Sprachberatung. Tübingen, 132–146. Schmich, Walter (1987): Sprachkritik, Sprachbewertung, Sprecherkritik. Dossenheim. Schmöe, Friederike (2010a): Artikel Fremdwort. In: Helmut Glück (Hg.): Metzler Lexikon Sprache. Stuttgart/Weimar, 211. Schmöe, Friederike (2010b): Artikel Lehnwort. In: Helmut Glück (Hg.): Metzler Lexikon Sprache. Stuttgart/Weimar, 392. Schoenthal, Gisela (2000): Impulse der feministischen Linguistik für Sprachsystem und Sprachgebrauch. In: Werner Besch u. a. (Hg.) (2000): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 2. Teilband. 2. Aufl. Berlin/New York, 2064–2100. Sick, Bastian (2004): Der Dativ ist dem Genitiv sein Tod. Köln. Sternberger, Dolf/Wolfgang Storz/Wilhelm Emanuel Süskind ([1945] 1968): Aus dem Wörterbuch des Unmenschen. 3. Aufl. Hamburg/Düsseldorf. Stötzel, Georg (1995): Der Nazi-Komplex. In: Georg Stötzel/Martin Wengeler (Hg.): Kontroverse Begriffe. Geschichte des öffentlichen Sprachgebrauchs in der Bundesrepublik Deutschland. Berlin/New York (= Sprache. Politik. Öffentlichkeit. Bd. 4), 355–382. Teubert, Wolfgang (2014): Die Bedeutung von Sprachkritik für die Demokratie. In: Aptum. Zeitschrift für Sprachkritik und Sprachkultur. 10 Jg., Heft 2, 98–114. Townson, Michael (1992): In: OBST – Osnabrücker Beiträge zur Sprachtheorie. März 1992/Ausg. 46: Der Diskurs des Rassismus. Ergebnisse des DISS-Kolloquiums November 1991. Hrsg. v. Siegfried Jäger/Franz Januschek, S. 229–240. Wengeler, Martin (1995): Multikulturelle Gesellschaft oder Ausländer raus? Der sprachliche Umgang mit der Einwanderung seit 1945. In: Georg Stötzel/Martin Wengeler (Hg.): Kontroverse Begriffe. Geschichte des öffentlichen Sprachgebrauchs in der Bundesrepublik Deutschland. Berlin/New York (= Sprache. Politik. Öffentlichkeit. Bd. 4.), 711–749. Wengeler, Martin (2002): „1968“, öffentliche Sprachsensibilität und „political correctness“. In: Muttersprache 112, 1–14. Wimmer, Rainer (2000): Sprachkritik in der Öffentlichkeit seit der Mitte des 20. Jahrhunderts. In: Werner Besch, u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 2. Teilband. 2. Aufl. Berlin/New York, 2054–2064.
Das Wort in der Sprachkritik
463
Wimmer, Rainer (2003): Wie kann man Sprachkritik begründen? In: Angelika Linke/Hanspeter Ortner/Paul R. Portmann-Tselikas (Hg.): Sprache und mehr. Ansichten einer Linguistik der sprachlichen Praxis. Tübingen (= Reihe Germanistische Linguistik 245), 417–449.
Internetquellen Forster, Iris (2010): Sprache und Politik. Political Correctness / Politische Korrektheit. Online unter: Bundeszentrale für politische Bildung (bpb): http://www.bpb.de/politik/grundfragen/spracheund-politik/42730/politische-korrektheit?p=all . GfdS = Gesellschaft für deutsche Sprache (2014): Wort des Jahres, http://www.gfds.de/aktionen/ wort-des-jahres/. Jenninger, Philipp (1988): Gedenkrede zur Pogromnacht im Deutschen Bundestag. Online unter: https://www.youtube.com/watch?v=Z4wh9zdtxgM . Joffe, Josef (2010): Neusprech und Gutdenk. Auf: ZEIT ONLINE No 16/2010: http://www.zeit. de/2010/16/Sprache-Tabu: Political Correctness: Neusprech und Gutdenk . Kleine, Lisa (2014): Vom Neger zum Afroamerikaner: Brauchen wir eine politisch korrekte Sprache? Focus-online vom Samstag, 03.05.2014. Online unter: http://www.focus.de/wissen/mensch/ philosophie/vom-neger-zum-afroamerikaner-wer-braucht-eine-politisch-korrekte-sprache_ id_3696453.html . Schneider, Jan Georg (2005): Was ist ein sprachlicher Fehler? Anmerkungen zu populärer Sprachkritik am Beispiel der Kolumnensammlung von Bastian Sick. Erschienen in: Aptum. Zeitschrift für Sprachkritik und Sprachkultur 2, 154–177. Online unter: http://www. uni-koblenz-landau.de/landau/fb6/germanistik/mitarbeiter/professoren/jan-schneider/sick. pdf; darin S. 1–24 . Sprachkritische Aktion „Unwort des Jahres“: http://www.unwortdesjahres.net/index. php?id=startseite . Unwort des Jahres (2015): http://www.unwortdesjahres.net/index.php?id=44 . SZ = Süddeutsche Zeitung (2010): „Deutsch bei der Bahn. Briten „very amused“, Süddeutsche Zeitung vom 18.02.2010. Online unter: http://www.sueddeutsche.de/reise/deutsch-bei-derbahn-briten-very-amused-1.70222 . SZ = Süddeutsche Zeitung (2014): „Sozialtourismus“ ist das Unwort des Jahres. Süddeutsche Zeitung vom 14.01.2014. Online unter: http://www.sueddeutsche.de/kultur/sprachesozialtourismus-ist-das-unwort-des-jahres-1.1862368 . VDS = Verein Deutsche Sprache (2014): Über den VDS. Online unter: http://www.vds-ev.de/ ueber-vds . VDS Index (2014): Der Anglizismen-INDEX. Online unter: http://www.vds-ev.de/aindex-thema . VDS Liste (2014): Wörterliste. Online unter: http://www.vds-ev.de/index .
Oliver Pfefferkorn
20. Das Wort und seine Geschichte Abstract: Jedes Wort besitzt zwei Geschichten, eine Geschichte seiner Ausdrucksseite und eine seines Inhalts. Beide Seiten entwickeln sich meist, aufgrund der Arbitrarität des sprachlichen Zeichens, unabhängig voneinander, sie können sich jedoch auch wechselseitig beeinflussen. Dieser Beitrag fokussiert beide Seiten der Wortgeschichte: kurz den Wandel der formalen Seite, ausführlicher den Bedeutungswandel mit seinen innovativen Verfahren und die Archaisierung. Dabei wird die Perspektive des Einzelwortes eingenommen, die von der Perspektive des Wortschatzes zu trennen ist. Der Wortschatzwandel umfasst weitere Prozesse, auf die nicht eingegangen wird, so die Vermehrung des Wortschatzes durch Wortbildung und Entlehnung. Aufgrund der Vielfalt der stattfindenden Prozesse strebt dieser Beitrag keine Vollständigkeit an. Zudem können die meisten wortgeschichtlichen Erscheinungen nur kurz charakterisiert und nicht ausführlich diskutiert werden. 1 Lautwandel 2 Bedeutungswandel 3 Wechselseitige Beeinflussung von Form und Bedeutung 4 Archaisierung 5 Wortgeschichte und Korpora 6 Literatur
1 Lautwandel Auf der Ausdrucksseite bestehen Wörter aus Lauten, denen in der Schrift Grapheme entsprechen. Die Geschichte der Ausdrucksseite des Wortes wird durch die Prozesse des Lautwandels bestimmt. So durchläuft ein Wort in der Entwicklung vom Germanischen (Germ.) zum Neuhochdeutschen (Nhd.) vielfältige konsonantische und vokalische Veränderungen. Als übergeordneter Bezugspunkt der meisten Lautgesetze gilt neuerdings der Wandel der Silbenstruktur vom Althochdeutschen (Ahd.) zum Nhd., der wiederum in ursächlichem Zusammenhang steht mit dem Festwerden des freien germanischen Akzents auf der ersten bzw. der Stammsilbe im Ahd. Dieser neue Anfangsakzent beginnt sich jedoch erst im späteren Ahd. auf die Silbenstruktur auszuwirken. Während das Ahd. als Silbensprache (oder als silbenzählende Sprache) eingeordnet werden kann, weist das Nhd. deutliche Züge einer Wortsprache (oder akzentzählenden Sprache) auf. Eine ausführliche Beschreibung dieses Wandels des Deutschen von einer Silbensprache zu einer Wortsprache und den damit verbundenen lautlichen Entwicklungen bietet Szczepaniak (2007). Eine kurze Zusammenfas-
Das Wort und seine Geschichte
465
sung enthält Nübling u. a. (2013, 11–43). Silbensprachen wie das Ahd. zeichnen sich u. a. durch folgende lautliche Merkmale aus (ebd., 18–22): – Die Silbenstruktur ist sehr einfach: Häufig bestehen Silben aus Konsonant (C) und Vokal (V) (ahd. gimeinida ‚Gemeinschaft‘, managi ‚mehrere‘), es befinden sich meist nur zwei Konsonanten nebeneinander (ahd. scirmen ‚schützen‘, bringan ‚bringen‘). – Sowohl in betonten als auch in unbetonten Silben können kurze und lange Vokale auftreten. – Volle Vokale kommen in jeder Silbe eines Wortes vor, auch in den Endungen (ahd. erda ‚Erde‘, salbōn ‚salben‘, friuntin ‚Freundin‘). – Im Wortinnern können lange Konsonanten (Geminaten) vorhanden sein (ahd. leittan ‚geleiten‘, lāzzan ‚lassen‘). – In Silbensprachen kommt es zu Prozessen der Vokalharmonie, d. h., Vokale in aufeinander folgenden Silben werden hinsichtlich ihres Artikulationsortes einander angeglichen. Innerhalb von Silbensprachen finden Prozesse zur Optimierung der Silbenstruktur statt, die der Erleichterung der Aussprache dienen. Konsonantengruppen, die schwierig auszusprechen sind, werden im Ahd. z. B. durch Einfügung eines Vokals (Vokalepenthese) vereinfacht: ahd. berg > bereg ‚Berg‘, thurft > thuruft ‚Bedürfnis‘. Dadurch werden gleichzeitig komplexe Silbenränder vermieden. Ein innerhalb eines Wortes auftretender Hiatus (Zusammentreffen zweier Vokale, die zu verschiedenen Silben gehören) kann durch die Einfügung eines Konsonanten aufgelöst werden, denn eine mit einem Vokal beginnende Silbe ist nicht optimal: ahd. būan > būwan ‚wohnen‘, trūēn > trūwēn ‚vertrauen‘. Außerdem können Hiate durch den Ausfall eines Vokals beseitigt werden: ahd. quidu ich > quidih ‚sage ich‘. Als silbenbezogene Erscheinung gilt weiterhin die Entstehung des i-Umlauts: „Durch die Angleichung des betonten Vokals an die Palatale i, ī und j wird die gesamte Silbenfolge einheitlicher, weil in beiden Silbennuklei palatale Vokale stehen. Die Zungenlage muss nicht grundsätzlich verändert werden, was die Aussprache erleichtert“ (Nübling u. a. 2013, 25): ahd. gasti > mhd. geste ‚Gäste‘ ahd. krafti > mhd. krefte ‚Kräfte‘
Die im Übergang vom Germ. zum Ahd. als Bestandteil der 2. Lautverschiebung stattfindende Tenuesverschiebung (die Verschiebung der stimmlosen Verschlusslaute p, t, k) wird von Szczepaniak (2007, 126–131) ebenso als silbenbezogener Prozess gedeutet, der dazu beiträgt die Silbenstruktur des Ahd. zu verbessern. Das Nhd. dagegen stellt eine Wortsprache dar, die durch die folgenden lautlichen Merkmale zu charakterisieren ist (Nübling u. a. 2013, 18–23):
466
Oliver Pfefferkorn
– Der Akzent wird deutlich realisiert, er hebt eine Silbe innerhalb eines phonologischen Wortes besonders hervor. – In betonten Silben können alle Vokale des Vokalsystems auftreten, während in unbetonten Silben nur stark abgeschwächte Vokale erscheinen, meist das unbetonte –e (Schwa-Laut). – Die Opposition zwischen kurzen und langen Vokalen bleibt auf die betonte Silbe beschränkt. – Betonte Silben und Wortrandsilben weisen eine komplexere Struktur, vor allem komplexere Ränder als unbetonte Silben auf. – Häufig treten komplexe Silben mit Konsonantenhäufungen auf (z. B. in Herbst, Hengst, Sandstrand). – Vokalharmonien finden nicht statt. – Im Wortinnern können kurze ambisilbische Konsonanten vorhanden sein, die sowohl zur vorhergenden als auch zur folgenden Silbe gehören können. Doppelschreibung von Konsonanten dient der Bezeichnung der Kürze des vorherigen Vokals, während die Doppelschreibung im Ahd. auf Geminaten (Doppel- oder Langkonsonanten) verweist. Insgesamt besteht in Wortsprachen die deutliche Tendenz, das phonologische Wort auf Kosten einer ausgeprägten Silbenstruktur zu optimieren. Dieser Tendenz lassen sich die meisten lautlichen Veränderungen vom Ahd. zum Nhd. zuordnen. Erste entsprechende Entwicklungen setzen im Spätahd. ein. Deutlich wird das zunächst an der Abschwächung der unbetonten Nebensilben, die ein Merkmal des Mittelhochdeutschen (Mhd.) darstellt: ahd. reganōn > mhd. regenen ahd. regula > mhd. regele
ahd. saga > mhd. sage ahd. bisprehhan > mhd. besprechen
Die Vokale der unbetonten Nebensilben werden zum Schwa-Laut reduziert, während in den betonten Silben weiterhin sämtliche vorhandenen Vokale auftreten können, die jetzt deutlicher hervortreten. Das führt zu einem Verfall der optimalen Silbenstruktur, aber zugleich zu einer Betonung des phonologischen Wortes. Diese Entwicklung setzt sich fort in der Tilgung unbetonter Vokale im Wortauslaut (Apokope) oder im Wortinnern (Synkope) im Übergang vom Mhd. zum Frühneuhochdeutschen (Frnhd.): mhd. mensche > frnhd. mensch mhd. market > frnhd. markt mhd. ane > frnhd. an mhd. gelīch > frnhd. glīch.
In der Folge werden viele Wörter des indigenen Wortschatzes einsilbig. Dieser Prozess wirkt bis weit in das Frnhd. hinein. So entstehen an den Worträndern partiell komplexe Konsonantencluster. Derivationssuffixe sind von diesem Prozess jedoch zumeist
Das Wort und seine Geschichte
467
nicht betroffen; sie werden zwar einsilbig, in ihnen bleiben jedoch die vollen Vokale erhalten, da sie noch einen Nebenton tragen: ahd. manunga > mhd. manunge > nhd. Mahnung ahd. finstarnissi > mhd. finsternisse > nhd. Finsternis
Die vor allem während des Frnhd. auftretende t-Epithese, die Anfügung eines t oder d an das Ende eines Wortes, dient ebenfalls der Stärkung und damit der Hervorhebung des rechten Wortrandes. mhd. obez > frnhd. obst mhd. saf > frnd. saft
mhd. ieman > frnhd. jemand mhd. ackes > frnhd. axt
Ein t oder d kann ebenfalls vor eine Ableitungssilbe an den rechten Rand des Wortstammes treten. Es trägt dann zur Hervorhebung der morphologischen Wortstruktur bei (Nübling u. a. 2013, 37). mhd. ordenlich > frnhd. ordentlich mhd. eigenlich > frnhd. eigentlich
Im Frnhd. kommt es weiterhin zur Bildung von Sprossvokalen (unbetontes e wie in den folgenden Beispielen) zwischen Langvokalen und Konsonanten, wodurch Hiate entstehen, die das Wortinnere anreichern, während Hiate in Silbensprachen möglichst vermieden werden. mhd. sūr > frnhd./nhd. sauer mhd. gīr > frnhd./nhd. Geier
mhd. viur > frnhd./nhd. Feuer mhd. schūr > frnhd./nhd. Schauer
Dieser Prozess geht mit einem Verfall der ursprünglichen Silbenstruktur einher, wobei jedoch wiederum das phonologische Wort optimiert wird (Szczepaniak 2007, 247–249). Die gleiche Funktion weist die im Übergang vom Mhd. zum Frnhd. stattfindende Dehnung der kurzen mhd. Vokale in offener betonter Tonsilbe auf, die in der Schrift allerdings oft nicht angezeigt wird: mhd. rede/rɛ.də/> nhd. Rede/re:.də/ mhd. nemen > nhd. nehmen
mhd. sigen > nhd. siegen mhd. vane > nhd. Fahne
Die betonte lange Silbe wird jetzt stärker hervorgehoben und von der unbetonten abgegrenzt. Zur Differenz in der Vokalqualität zwischen betonter (Vollvokal) und unbetonter (reduzierter Vokal) Silbe tritt somit noch der Kontrast in der Vokallänge (Szczepaniak 2012, 95). Von einzelnen Lautwandelerscheinungen ist jedoch bislang nicht geklärt, inwieweit sie in diesen typologischen Wandel des Deutschen von einer Silben- zu einer
468
Oliver Pfefferkorn
Wortsprache zu stellen sind. Das betrifft vor allem paradigmatische Lautwandelprozesse wie z. B. Hebung und Senkung, die nhd. Diphthongierung und Monophthongierung und die vor allem für das Frnhd. kennzeichnende Rundung und Entrundung (Wegera/Waldenberger 2012, 121). Durch die zunehmende Verschriftlichung des Deutschen seit der Etablierung des Buchdrucks in der Mitte des 15. Jhs. und die zugleich einsetzende Normierung wird der Lautwandel zunehmend erschwert, bis er in der Schriftsprache nahezu vollständig zum Erliegen kommt (Schweikle 1996, 74). Der Schrift kommt eine konservierende Funktion zu. Die Kommunikation würde durch einen weiterhin stattfindenden Lautwandel in der schriftlichen Standardsprache erheblich erschwert. Lautwandelprozesse finden allerdings weiterhin in der nicht kodifizierten gesprochenen Sprache statt, wobei die Schriftsprache wiederum auf die gesprochene Sprache ausstrahlt.
2 Bedeutungswandel Die Inhaltsseite eines Wortes ist natürlich ebenfalls von diversen Wandelprozessen betroffen. Ein Wort kann auf der Basis verschiedener innovativer Verfahren seine Bedeutung verändern, d. h., zu einer Ausgangsbedeutung tritt eine neue Bedeutungsvariante, in der Folge entsteht Polysemie. Blank (1997, 113) bezeichnet diesen Prozess als innovativen Bedeutungswandel, den er dem reduktiven Bedeutungswandel gegenüberstellt, dem Wegfall einer Bedeutungsvariante bzw. im Extremfall dem Verschwinden eines Lexems. Allerdings besitzen die Prozesse der semantischen Veränderung einen völlig anderen Status als die schon erwähnten Lautgesetze. Während man in der früheren traditionellen Bedeutungslehre – in Analogie zu den Lautgesetzen – nach den Gesetzen des Bedeutungswandels suchte, geht man heute eher von einzelnen Tendenzen oder Mechanismen aus, die eintreten können und die nicht den Wortschatz in seiner Gesamtheit, sondern immer nur einzelne Lexeme betreffen. Damit ist der Bedeutungswandel auch nicht prognostizierbar. Es kann nicht vorausgesagt werden, welche Lexeme sich wandeln, und ebenfalls nicht, in welche Richtung sich ein solcher Wandel bewegen könnte, wenn er denn einträfe. Bedeutungswandel lässt sich immer nur retrospektiv erfassen.
2.1 Stabilität und Wandel Obwohl Sprache permanent im Wandel begriffen ist, verändert sich die Lexik nie in ihrer Gesamtheit. Der Wandel einzelner Wortschatzelemente setzt wiederum die Stabilität von anderen Wortschatzelementen voraus. Große Teile des Wortschatzes haben sich seit dem Ahd. in ihren Verwendungsweisen kaum verändert (z. B. die Bezeichnungen für Verwandte ersten Grades: ahd. muoter, fater, bruoder, swester,
Das Wort und seine Geschichte
469
sunu, tohter). Es wäre also durchaus interessant zu fragen, warum einzelne Lexeme in ihrer Bedeutung stabil bleiben, während sich bei anderen ein Bedeutungswandel einstellt. Dieser Problematik wurde jedoch in der historischen Wortforschung bisher nur wenig Aufmerksamkeit geschenkt. Die Stabilität und Kontinuität der Verwendungsweisen beruht zunächst wohl auf der Kontinuität einzelner kommunikativer Verhältnisse (Fritz 2006, 83). Es besteht kein Grund, etablierte sprachliche Mittel, die sich für die Lösung bestimmter kommunikativer Aufgaben bewährt haben, zu verändern. So wirken z. B. einzelne Diskursbereiche wie die religiöse Kommunikation, die juristische Kommunikation und weitere fachsprachliche Bereiche in starkem Maße sprachkonservierend. Sie können aufgrund der Konstanz der kommunikativen Verhältnisse und Aufgaben sprachliche Verwendungsweisen tradieren, die in der Standardsprache schon veraltet sind (ebd., 84). Einen weiteren Grund für semantische Stabilität nennt Bechmann (2013, 213): „Semantische Kontinuität und semantischer Wandel stehen in einem engen Verhältnis zur Frequenz der Wortbedeutung.“ Wenig frequente Wörter sind in ihrer Bedeutung weitaus stabiler als hochfrequente und damit den meisten Sprachnutzern vertraute Lexeme. Selten gebrauchte Wörter treten oft nur in speziellen Bedeutungen in bestimmten kommunikativen Bereichen auf und sind meist schwerer zu verstehen als Wörter des Allgemeinwortschatzes. Deshalb erscheint ihre abweichende Verwendung, die zu einem Bedeutungswandel führen könnte, den Sprechern nicht besonders erfolgversprechend. Bei hochfrequenten und meist leichter verständlichen Wörtern aus der Alltagssprache sind die Aussichten auf einen kommunikativen Erfolg einer neuen Bedeutungsvariante weitaus höher. Bechmann (ebd., 211) vermutet weiterhin, dass speziell im Bereich der Verben vor allem hochfrequente Wörter, für die mehrere bedeutungsgleiche oder bedeutungsähnliche Wörter existieren, von Bedeutungswandel betroffen sind. Er begründet dies vor allem aus sprachökonomischer bzw. sprachsystematischer Perspektive: Wenn mehrere Synonyme auf einen Sachverhalt referieren, dann wird nicht jedes von ihnen unbedingt benötigt, so dass es kein Problem ist, wenn seine ursprüngliche Verwendungsweise in der Folge des Bedeutungswandels veraltet oder überhaupt untergeht (ebd.). Allerdings existieren zum Thema Bedeutungswandel und Frequenz keinerlei statistische Analysen. Auf der Hand liegt allerdings, dass sich eine neue Bedeutungsvariante nur dann etablieren kann und lexikalisiert wird, wenn die Sprecher sie häufig genug verwenden. Bedeutungswandel tritt zudem nicht nur punktuell auf Einzelwörter bezogen auf, betroffen sind oft ganze Wortfelder. Die Bedeutungsveränderung eines einzelnen Wortes kann Veränderungen sinnverwandter Wörter nach sich ziehen.
470
Oliver Pfefferkorn
2.2 Bedeutungswandel als Invisible-Hand-Prozess Fruchtbar für die Betrachtung und Erklärung des Bedeutungswandels war in den letzten Jahren ein handlungstheoretischer Ansatz. Sprache bestimmt Rudi Keller als Phänomen der dritten Art neben Naturphänomenen und von Menschen hergestellten Artefakten (Keller 1994, 87). Ein Phänomen der dritten Art entsteht zwar als Folge intentionalen individuellen Handelns, bildet aber ein nicht intendiertes Nebenprodukt dieses Handelns. Keller vergleicht dies mit dem Entstehen eines Trampelpfades oder eines Staus. Für die Rekonstruktion und Erklärung eines derartigen Prozesses zieht er die Theorie der unsichtbaren Hand heran. Eine solche Erklärung versucht die Brücke zu schlagen zwischen der Mikroebene der Handlungen der Individuen und der durch diese erzeugten Struktur. (Keller/Kirschbaum 2003, 132)
Kein Autofahrer möchte, dass im Straßenverkehr ein Stau entsteht. Damit sie aber auf einer stark befahrenen Straße nicht auffahren, drosseln die Fahrer ihre Geschwindigkeit oder bremsen. Wenn jedoch alle Fahrer ihre Geschwindigkeit immer wieder auch nur geringfügig durch Bremsen reduzieren, wird der Verkehr ständig zäher, bis er schließlich ganz zum Erliegen kommt. Ein Stau ist entstanden, obwohl ihn kein einziger Verkehrsteilnehmer beabsichtigt hat (vgl. Keller 1994, 89 f.). Das lässt sich ebenso auf die Ebene des Sprechens und des Bedeutungswandels beziehen. Kein Sprachteilnehmer zielt darauf ab, die Bedeutung einzelner Lexeme bewusst zu verändern. Mit seinem sprachlichen Handeln verfolgt er andere Intentionen, die mit Kommunikationsmaximen beschrieben werden. Zunächst und überhaupt möchte er natürlich verstanden werden, also erfolgreich kommunizieren. Hinzu kommen weitere, dieser generellen Intention aber untergeordnete Motive. Der einzelne Sprecher möchte sich möglichst genau, aber zugleich auch originell und vielleicht auffällig ausdrücken, um so seine Sprachkompetenz zu demonstrieren. Er möchte daneben höflich erscheinen, in anderen Situationen mit seiner Rede aber auch provozieren. Er kann darauf abzielen, mit seiner Sprache die Zugehörigkeit zu einer Gruppe erkennen zu geben oder aber zu zeigen, dass er über Möglichkeiten verfügt, die über eine Gruppensprache hinausweisen. Schließlich gehört es zu den Maximen des Sprechens, mit möglichst wenig Aufwand und Anstrengungen erfolgreich zu kommunizieren. Welche dieser Teilintentionen verfolgt wird, kann von Kommunikationsereignis zu Kommunikationsereignis differieren. In allen diesen Fällen ist es möglich, dass die Sprecher überlieferte und gebräuchliche Lexeme in ungewohnter Art verwenden, damit bewusst vom üblichen Sprachgebrauch abweichen und gelegentlich in Kauf nehmen, missverstanden zu werden. Damit aber ein Bedeutungswandel eintritt, müssen diese neuen Verwendungsweisen von weiteren Sprechern aufgegriffen und weiter verbreitet, also konventionalisiert werden.
Das Wort und seine Geschichte
471
In dieser Theorie der unsichtbaren Hand bilden die Sprecher mit der Wahl ihrer sprachlichen Mittel den Ausgangspunkt und die Ursache für Sprachwandel und speziell für Bedeutungswandel (Keller/Kirschbaum 2003, 136). Diese Mikroebene der einzelnen Sprachteilnehmer wird mit der Makroebene der Sprache, den Veränderungen auf der Ebene des Sprachsystems in Beziehung gesetzt. Für historische Sprachstufen gestaltet es sich allerdings schwierig, semantische Veränderungen mit Bezug auf Sprecherintentionen zu rekonstruieren. Dies gelingt nur bei ausgezeichneter Beleglage. Für den Bedeutungswandel von ahd. chopf, mhd. kopf haben dies Augst (1970) und Fritz (2005, 150–154) nachvollzogen. Im Ahd. bezog sich das Lexem chopf auf ein Trinkgefäß. Mit der Bedeutung ‚Kopf‘ wurde houbit verwendet. Nach 1150 finden sich in Schilderungen von Schlachten erste Belege für kopf, die sich auf den Kopf einer Person beziehen. (1) König Rother 1649 (zw. 1152 u. 1180): Asprian der helit got. | Die hant her vf hofc. | Vnde scloc ime einin orsclac. | Daz eme der kopf alzo brach. (2) Konrad von Würzburg, Heinrich von Kempten 152 (zw. 1261 u. 1277): daz er begunde zwirben | alumbe und umbe sam ein topf; | daz hirne wart im und der kopf | erschellet harte, dünket mich. (3) Neidhart 54, 30 (1. H. 13. Jh.): so daz hundert swert uf sinem kophe lute erklingen.
Die semantische Neuerung trat zuerst in Texten auf, die schilderten, wie der mit einem Helm bedeckte Kopf einerseits unter Schlägen erklingt und andererseits zerschlagen wird. Ausgangspunkt für die metaphorische Bedeutungsübertragung von ‚Becher, Trinkgefäß‘ zu ‚Kopf‘ war hier die Sprache der Soldaten und das Motiv wohl das Streben nach einer zynisch-originellen Ausdrucksweise. Dieses Beispiel demonstriert zugleich, dass Bedeutungswandel nicht immer einen Reflex des außersprachlichen, gesellschaftlich-sozialen Wandels darstellt. Für den Wandel von kopf im Mhd. lässt sich schwerlich eine Veränderung in der außersprachlichen Welt als Erklärung finden. Andererseits gibt es durchaus Belege für eine außersprachliche Bedingtheit lexikalischer Veränderungen. Neue Entwicklungen auf technischem oder kulturellem Gebiet müssen benannt werden. Dies kann durch Wortbildung, Entlehnung, aber auch durch Bedeutungswandel schon vorhandener Lexeme geschehen, so im oft angesprochenen Beispiel Maus in der Bedeutungsvariante ‚Computermaus‘. Doch Wandel im sozialen Bereich manifestiert sich eben nicht zwingend als Bedeutungswandel, sondern oft nur vermittelt oder gebrochen durch das sprachliche Handeln der individuellen Sprecher. Die kulturellen Rahmenbedingungen, die die Wahl der sprachlichen Mittel der einzelnen Individuen mitbestimmen, können auf der Makroebene der Sprache vollständig verzerrt und gleichsam ins Gegenteil verkehrt erscheinen. (Keller 1991, 216)
472
Oliver Pfefferkorn
2.3 Innovative Verfahren des Bedeutungswandels Im Zentrum der historischen Semantik als linguistischer Disziplin standen schon immer Bestrebungen, die beobachteten vielfältigen Arten der Bedeutungsveränderungen von Lexemen zu systematisieren. Bereits innerhalb der traditionellen Bedeutungslehre bildete sich im Laufe des 19. Jhs. ein an die Tropenlehre der klassischen Rhetorik angelehnter Kanon von Verfahren des Bedeutungswandels heraus, der heute noch im Zentrum entsprechender Arbeiten steht: Metapher, Metonymie, Euphemismus, Ironie u. a. Rhetorische Tropen stellen auf spezielle Wirkungen abzielende, bewusste Abweichungen vom üblichen Sprachgebrauch dar und genau deshalb eignen sie sich zur Klassifizierung der innovativen Verfahren des Bedeutungswandels, die ihren Ausgangspunkt ebenso in der normabweichenden Verwendung lexikalischer Mittel durch den Sprecher haben. Diesen unter Bedeutungsübertragung (und Bedeutungsverschiebung) subsummierten Verfahren werden meist die Generalisierung und Spezifizierung der Bedeutung sowie Bedeutungsverbesserung und Bedeutungsverschlechterung zu Seite gestellt (vgl. z. B. Wanzeck 2010, 72–81). Gelegentlich erscheinen noch weitere Verfahren, die sich kaum in eine Systematik einordnen lassen: Implikatur, Umdeutung (Reanalyse), Nutzung von Präzedenzen (z. B. in Fritz 2006, 47–53). Eine Neuordnung der rhetorischen Typologie und zudem eine partielle Neudefinition der traditionellen Verfahren auf assoziationspsychologisch-kognitivistischer Grundlage wurde in Blank (1997) unternommen. Blanks Differenzierung liegen drei Assoziationsprinzipen zugrunde, denen er die einzelnen Verfahren des Bedeutungswandels zuordnet: – Similarität: Metapher, kohyponymische Übertragung, Bedeutungserweiterung, Bedeutungsverengung, – Kontiguität: Metonymie, Ellipse, Auto-Konverse, – Kontrast: Antiphrasis, Auto-Antonymie. Die Volksetymologie als weiteres Bedeutungswandelverfahren verbindet Blank (ebd., 312) sowohl mit Similarität als auch mit Kontiguität. Diese Assoziationsvorgänge ergeben sich für Blank (ebd., 152) nicht auf der Ebene der sprachlichen Zeichen, sondern vielmehr auf der davon zu unterscheidenden konzeptuellen Ebene der außersprachlichen Vorstellungen, während die strukturelle Semantik von Assoziationsbeziehungen eben zwischen Zeicheninhalten ausging. Blank schließt jedoch nicht gänzlich aus, dass auch eine Relation zwischen Zeicheninhalten zum Bedeutungswandel führen kann (ebd.), allerdings bleiben für ihn die Assoziationsrelationen zwischen den Zeicheninhalten in den entsprechenden Relationen der Konzepte aufgehoben. Für den Fall der Ellipse konstatiert er jedoch eine Kontiguität allein zwischen sprachlichen Zeichen. Im Unterschied zu den bisher genannten Auffassungen verzichtet Harm (2000) bei seiner Beschreibung des Bedeutungswandels von Wahrnehmungsverben völlig
Das Wort und seine Geschichte
473
auf die rhetorischen Kategorien. Bedeutungswandel wird bei ihm, einem Ansatz von Job (1987) und Job/Job (1997) folgend, anhand zweier Relationen beschrieben: einem Beziehungsindikator, der die zugrunde liegende konzeptuelle Relation erfasst (z. B. Teilhandlung, Begleithandlung, Allgemeinere Handlung, Erfolgreicher Abschluss der Handlung u. a.), und einem Prozessindikator, der auf die Neuzuordnung von Zeichenkörper und Bedeutung bezogen ist und somit die auftretenden sprachlichen Verfahren erfasst (z. B. Fokussierung, Entfokussierung, Fokuswechsel, Fokusverschiebung) (Harm 2000, 62–71). Im Folgenden soll auf einige der erwähnten Verfahren etwas ausführlicher eingegangen werden. Metaphorisierung: Der metaphorische Bedeutungswandel zählt zu den wichtigsten und häufigsten Verfahren des Bedeutungswandels. Er wird in der Literatur zur historischen Semantik seit jeher an exponierter Stelle behandelt. Speziell für den Verbwortschatz gilt die Metaphorisierung als Hauptverfahren des Bedeutungswandels (Bechmann 2013, 239). Die Metapher als eine Form bildlicher Übertragung beruht auf einer Similarität zwischen dem ursprünglichen und dem neu bezeichneten Konzept bzw. zwischen Ursprungs- und Zielbedeutung, die jeweils verschiedenen Sinnbereichen angehören: mhd. īndruc/frnhd. eindruk ’Eindruck von etw. auf etw.‘ < ‚Sinneseindruck‘.
Diese Ähnlichkeit wird gelegentlich erst durch die metaphorische Verwendung des Ausgangslexems ermöglicht, sie ist nicht von vornherein gegeben (Fritz 2006, 44). Die Erschließung der metaphorischen Verwendung setzt bei Sprecher und Hörer ein gemeinsames Wissen voraus. Nur dann kann die Kommunikation erfolgreich sein. In erster Linie gibt der Kontext darüber Aufschluss, inwieweit ein Lexem metaphorisch gebraucht wird. Metaphorischen Wortverwendungen kommen unterschiedliche Funktionen zu. Einerseits dienen sie als Mittel der Expressivität oder auch nur des sprachlichen Schmucks. Andererseits können sie als Mittel der Veranschaulichung und damit der Verstehenssicherung dienen, vor allem dann, wenn sie eine lexikalische Lücke füllen. Bei der Einführung von neuen Gegenständen erlaubt es die Verwendung von metaphorischen Redeweisen, Vertrautheit zu schaffen durch Bezug auf verbreitetes Alltagswissen. (Fritz 2005, 86)
Im Laufe der Zeit kann allerdings das Bewusstsein, dass es sich bei einer Wortverwendung um eine Metapher handelt, allmählich verblassen. Das geschieht, wenn die ursprüngliche, nicht bildhafte Bedeutungsvariante veraltet oder ganz ausstirbt. Fritz (ebd., 90 f.) spricht in diesem Fall von Exmetaphern. Sie liegen in den folgenden Beispielen vor:
474
Oliver Pfefferkorn
spätmhd. krane ‚Kranich‘ > frnhd. kran ‚Hebevorrichtung für Lasten‘, mhd. swiric ‚schwärend, eitrig‘ > frnhd. schwirig ‚aufsässig, aufrührerisch‘.
Innerhalb der sprachlichen Entwicklung haben sich bestimmte semantische Pfade herauskristallisiert, denen metaphorische Verwendungsweisen bevorzugt folgen, wobei die Darstellung abstrakter Sachverhalte durch konkrete Bilder meist die zugrundeliegende Tendenz ist. Als solche traditionellen Entwicklungspfade sind z. B. zu nennen (vgl. ebd., 40 f.): – Wandel von lokaler zu temporaler Verwendung vor allem von Präpositionen: vor, am, – Wandel von deskriptiver zu evaluativer Verwendung vor allem im Bereich der Adjektive: groß, grün, kindisch, – Wandel von der Verwendung im optischen Bereich zur Verwendung im kognitiven Bereich des Erkennens und Verstehens: sehen, einleuchten, einsichtig, – Wandel von der Verwendung im haptischen Bereich zur Verwendung im Bereich des Verstehens/Erkennens: begreifen, erfassen, – Wandel von der Verwendung im lokalen Bereich zu einer Verwendung als Rangordnung: oben, unten. Metonymisierung: Im Falle der Metonymie besteht zwischen dem Ausgangs- und dem Zielkonzept bzw. zwischen der Ausgangs- und der Zielbedeutung eine Kontiguitätsrelation, beide stehen in einem sachlichen (z. B. zeitlichen, räumlichen, logischen) Zusammenhang, wobei der Gegenstandsbereich (auch Bezugsrahmen oder Frame) nicht verlassen wird. Ausgangspunkt für die metonymische Bedeutungsübertragung sind stereotype Wissensbestände (Frames) zu charakteristischen Gegenständen, Situationen und Handlungen, über die wir verfügen und die sich auf der Basis von Erfahrungen herausgebildet haben. Wird in einem Text ein Bestandteil eines solchen Frames erwähnt, sind wir in der Lage die weiteren Bestandteile dieses Frames zu ergänzen und entsprechende Zusammenhänge zu realisieren. Bei einer innovativen Verwendung einer Metonymie kann aufgrund solcher Bezugsrahmen rekonstruiert werden, worauf die neue Verwendung referiert. Typische und für den Bedeutungswandel zentrale metonymische Beziehungen sind z. B. die folgenden: – Material/Produkt aus diesem Material (Glas), – Teil/Ganzes (pro Kopf), – Behälter/Inhalt des Behälters (Flasche), – Handlung/Ergebnis der Handlung (Ernte), – Raum/Personen, die im Raum tätig sind (Küche), – Gebäude/Personen, die im Gebäude wohnen (Haus), – Institution/Vertreter der Institution (Regierung), – Begleiterscheinung/Empfindung (aufatmen).
Das Wort und seine Geschichte
475
Gelegentlich können mehrere metonymische Bedeutungswandel aufeinander folgen, da jede neue Metonymie Möglichkeiten für weitere Kontiguitätsassoziationen schafft, wie das Blank (1997, 248) an der Wortgeschichte von frz. bureau demonstriert: altfrz. burel ‚grober brauner Wollstoff‘ > ‚Stoff zur Bespannung von Kontortischen‘ > mfrz. bureau ‚mit Stoff bespannter Kontortisch‘ > frz. bureau ‚Arbeitstisch‘ > ‚Arbeitszimmer, Arbeitsraum, Büroraum‘ > ‚Büroangestellte‘.
Euphemismus: Unter einem Euphemismus versteht man die Umschreibung eines als unangenehm oder anstößig empfundenen Sachverhalts durch ein beschönigendes oder abschwächendes Wort. Bedeutungswandelprozesse, die auf die Vermeidung solcher tabuisierter Ausdrücke zurückgehen, treten gehäuft in den Sachbereichen von Sexualität, körperlichen und geistigen Krankheiten und Unvollkommenheiten, Tod, Stoffwechsel und Verdauung, Rasse, sozialem Status u. a. auf. Dazu kommt es aus Scham, Taktgefühl und aus Rücksicht auf herrschende Normen. So wird dierne (ein in der Literatur häufig aufgegriffenes Beispiel) im Mhd. zunächst zur Bezeichnung von ‚Mädchen‘ und spezieller für ‚junge Dienerin, Magd‘ gebraucht, dabei häufig auch mit Bezug auf die Jungfrau Maria als Dienerin Gottes (MWB I 1291). (4) Hermann von Fritzlar, Heiligenleben 112,8 (1343–49): ein dirne heizet, di umme sust dinet oder ūffe gnāde; aber ein maget heizet, di umme lōn dinet und umme kost. (5) Yolande 3138 (um 1290): nū was dy můme ein wīse wīf. / sy sach der junger dyrnen līf / noch kranc noch zart noch linde. (6) Rheinisches Marienlob 61,7 (1220–30): dů du würds godes můder genant, / du nandes dich gods diͤrn alzehant.
Doch schon im späten Mhd. wird dierne in eindeutig verschleiernder Funktion im Sinne von ‚Prostituierte, Hure‘ verwendet. Erstmals nachzuweisen ist diese neue Bedeutungsvariante im Spiegel des menschlichen Heils von Konrad von Helmsdorf; sie breitet sich vor allem im 15./16. Jh. stark aus. (7) Konrad von Helmsdorf, Der Spiegel des menschlichen Heils 2145 (nach 1330): der sines ebenmenschen gůt / empfacht und unrecht vertůt / mitt dirnen; […] / die oͮgen sin oͮch im verblendet.
Durch häufigen Gebrauch kann der Euphemismus seine Funktion allerdings verlieren und selbst zu einem tabuisierten oder anstößigen Ausdruck werden, so dass ein neuer Euphemismus an seine Stelle tritt. Daneben können Euphemismen zur bewussten Beeinflussung und Täuschung des Rezipienten besonders in den Bereichen von Politik, Wirtschaft und Werbung eingesetzt werden, wobei es sich oft um ad-hoc-Wortbildungen handelt, die nur selten längere Zeit im Sprachgebrauch Bestand haben, weniger um Fälle von Bedeutungswandel (z. B. Null-Wachstum für ‚wirtschaftliche Stagnation‘, Gebührenanpassung für ‚Gebührenerhöhung‘).
476
Oliver Pfefferkorn
Ellipse: Mehrgliedrige Ausdrücke können auf ein Wort verkürzt werden, das dann in seiner Bedeutung mit der des gesamten Ausdrucks übereinstimmt und damit einen Bedeutungswandel vollzogen hat. Dahinter steht meist das Bestreben nach Kürze, gelegentlich auch eine Tendenz zur Beschönigung oder Verschleierung, wie im folgenden Beispiel:
trinken ‚Flüssigkeit zu sich nehmen‘ > trinken ‚Alkohol trinken‘
Gerade im Falle von Verben müssen nicht immer sämtliche Aktanten realisiert werden, und zwar dann nicht, wenn sie im weiteren Kontext schon genannt oder innerhalb der Kommunikationssituation erschlossen werden können. Wenn jedoch solche verkürzten Formen in charakteristischen Kontexten besonders häufig erscheinen, dann können sich die weggelassenen Bestandteile fest in der Semantik der entsprechenden Lexeme verankern, was zur Lexikalisierung der elliptischen Form führt. Dies zeigt sich z. B. in der Entwicklung der Bedeutungsvariante ‚auf der Reise einkehren‘ des Verbs absteigen. Ausgangspunkt ist die bereits im Mhd. nachgewiesene Bedeutung ‚von etw. herabsteigen‘ (8), die häufig auf das Absteigen vom Pferd oder von einem Wagen bezogen ist (9). Das Verb tritt in gleichem Gebrauch schon bald auch ohne Ergänzungen auf; aus dem Kontext kann erschlossen werden, welches Beförderungsmittel gemeint ist. Im 17./18. Jh. wird absteigen häufig mit einer Lokalbestimmung (Herberge, Wirtshaus) verwendet, wobei dann das Anhalten und Absteigen mit der Möglichkeit einer kürzeren oder längeren Pause verbunden ist (10). Auch in diesen Fällen kann die lokale Ergänzung wiederum wegfallen, das Verb wird dann im Sinne von ‚(auf einer Reise) in einem Gasthof/Hotel einkehren (und dort übernachten)‘ gebraucht (11); die Vorstellung vom konkreten Beförderungsmittel tritt in den Hintergrund (vgl. Wellander 1928, 159 f.). Dem elliptischen Bedeutungswandel folgt in diesem Fall ein weiterer metonymischer von einer Ausgangshandlung zur Folgehandlung. Eine entsprechende Entwicklung zeigt übrigens das niederländische afstij gen (ebd., 160 f.). (8) Berliner Evangelistar 124,12 (1340): unde der uf dem dache ist, der in stigit nicht abe in daz hus. (9) Maaler, Teutsche Spraach 6v (1561): Von eim rossz oder pfaͤrd Absteygen. (10) La Roche, Fräulein von Sternheim 1,223 (1771): Froh sie an dem Wirthshause absteigen zu sehen, bedacht ich mich nicht lange. (11) Klinger, Faust 97 (1791): Nun ist der Kaiserliche Gesandte blos seinetwillen hierher gereist, gar bey ihm abgestiegen, findet in dem einen großen Mann, den wir als einen Schuhputzer herumgehudelt haben.
Elliptische Formen stellen ebenfalls Verkürzungen von Determinativkomposita dar, deren Bestimmungswort weggelassen wurde; das Grundwort nimmt die Bedeutung des ursprünglichen Kompositums an und erhält damit eine neue Bedeutungsvariante. Auch hier wirkt das Prinzip der Sprachökonomie.
Das Wort und seine Geschichte
477
Kraftwagen > Wagen, Bleistift > Stift, Anti-Baby-Pille > Pille
Grzega (2004, 84–89) diskutiert, ob im Falle der Kürzung von Komposita die Ellipse tatsächlich als eigener Bedeutungswandeltyp anzunehmen ist. Wird das Bestimmungswort getilgt, liegt für ihn eher eine Bedeutungsverengung vor; wird das Grundwort getilgt (das Weizenbier > das Weizen), handele es sich bei der Ellipse um einen Wortbildungstyp (ebd. 89). Ironie: Bedeutungswandel kann weiterhin durch eine ironische Verwendung eines Wortes hervorgerufen werden. Das Wesen der Ironie besteht darin, das Gegenteil von dem zu sagen, was eigentlich gemeint ist. Blank (1997, 221) betrachtet die Ironie allerdings nicht als eigenes Verfahren des Bedeutungswandels, sondern nur als Ursache einer solchen gegensätzlichen Bedeutungsvariante. Sie liegt den von ihm unterschiedenen Verfahren Antiphrasis und Auto-Antonymie zugrunde. Dass eine ironische Redeweise vorliegt, ergibt sich wiederum aus dem Kontext, der mit der eigentlichen Bedeutung des verwendeten Wortes in Widerspruch steht, oder durch die Rede begleitende Ironiesignale (Betonung, Anführungsstriche, Interjektionen wie ja, doch, so u. a.). In den meisten Fällen tritt zu einer positiv bewertenden, lobenden Bedeutung vor allem von Adjektiven und Substantiven eine negativ bewertende, tadelnde Variante: eine schöne Bescherung, ein sauberer Herr, ein nettes Früchtchen, so ein Held (vgl. Dornseiff 1955, 63 f.). Die ironische Wortverwendung hat in diesen Fällen durchaus auch eine euphemistische Funktion. Für das Französische nennt Blank (1997, 227) das Adjektiv sacré, das sowohl für ‚heilig, geheiligt‘ als auch für ‚verflucht‘ verwendet werden kann, weiterhin afrz. vergondos, das sich von ‚schamhaft‘ zu ‚schamlos‘ gewandelt hat. Ironische Wortverwendungen bleiben jedoch, da sie bei den Hörern meist gewisse Kenntnisse voraussetzen, um die Ironie zu verstehen, in der Regeln auf kleinere Kommunikationsgemeinschaften und engere Diskursbereiche beschränkt, so dass sie nur selten eine Lexikalisierung (eine Aufnahme ins Lexikon) zur Folge haben. Keller/Kirschbaum (2003, 93–98) interpretieren abweichend vom bisher geschilderten Ironieverständnis ebenfalls den Wandel von ordentlich, anständig und gehörig zu Adjektiven mit intensivierenden Bedeutungen auf der Basis eines ironischen Gebrauchs. Als anständig wird zunächst etwas charakterisiert, was der herrschenden Sitte und Moral entspricht (vgl. z. B. Adelung III 611). Seit Mitte des 19. Jhs. ist jedoch daneben die umgangssprachliche Bedeutungsvariante ‚sehr, viel, stark, beträchtlich‘ nachweisbar: (12) Dtsch. Romanzeitung 2, 289 (1865): ne anständige Tracht Prügel wird dem ‚Groß-Mogul‘ doch am Ende noch Vernunft einbläuen!
Keller/Kirschbaum (2003, 95) beschreiben diese intensivierende Verwendung als eine ehemalige ironische Untertreibung, die aber als Übertreibung zu charakterisieren sei. Die Ironie besteht für sie darin, etwas zu sagen, was offensichtlich gelogen zu sein
478
Oliver Pfefferkorn
scheint, sich bei genauerer Betrachtung jedoch nur als eine Simulation der Unwahrheit herausstellt (ebd., 94). Die Übertreibung im Falle von anständig kommt dabei dadurch zustande, dass für ein moralisches Verhalten latent die Gefahr besteht, die herrschende Norm aus den Augen zu verlieren, und man sich deshalb im Einzelfall immer etwas stärker an der Norm orientiert, als eigentlich notwendig ist. Diese ironische Verwendung kann sich jedoch nur in Kontexten entfalten, in denen letztlich gar keine Normen existieren. Bedeutungserweiterung/Bedeutungsverengung: Im Falle einer Bedeutungserweiterung (Generalisierung) verliert das betroffene Lexem semantische Merkmale und kann damit auf einen größeren Bereich von Denotaten angewendet werden. Es vergrößert sich die Extension des Lexems, während sich seine Intension verringert. Zu nennen sind z. B.: ahd. thing/ding ‚Rechtssache, Gerichtsversammlung‘ > nhd. Ding ‚Sache, Gegenstand, Ding‘ mhd. vrouwe ‚vornehme Frau (aus dem Adel) > frnhd. frau ‚erwachsene weibliche Person‘.
Bei der Bedeutungsverengung (Spezifizierung) dagegen treten ein oder mehrere Merkmale zur Bedeutung hinzu, so dass sich der Referenzbereich des Lexems verkleinert: mhd. hōchzīt ‚Fest‘ > frnhd. hochzeit ‚Fest der Vermählung‘, mhd. vaz ‚Gefäß‘ > frnhd. fas ‚Fass‘.
Ausgangsbedeutung und neue Bedeutung verhalten sich bei dieser Form des Bedeutungswandels zueinander wie Ober- und Unterbegriff. Bedeutungserweiterung liegt dann vor, wenn die Ausgangsbedeutung in diesem Prozeß wie ein Hyponym und die neue wie ein Hyperonym wirkt; bei der Bedeutungsverengung ist es umgekehrt. (Blank 1997, 201)
Bedeutungserweiterung ist deutlich zu unterscheiden von der als Folge des Bedeutungswandels auftretenden Polysemie, einer Erweiterung des Spektrums von Verwendungsweisen, Bedeutungsverengung hingegen vom Abbau der Polysemie als Reduzierung des Spektrums von Verwendungsweisen. Als Endpunkt einer Bedeutungsverengung dienen gelegentlich die entsprechenden Prototypen für den Oberbegriff. So wandelt sich in mehreren Sprachen die Bezeichnung für Getreide zur Bezeichnung für die am häufigsten angebaute und damit wohl auch prototypische Getreidesorte (vgl. Grzega 2004, 76): lat. frumentum ‚Getreide‘ > frz. froment ‚Weizen‘ engl. corn ‚Getreide‘ > engl. ‚Weizen‘, schott. engl. ‚Hafer‘ germ. korn ‚Getreide‘ > dt. (dialektal) ‚Roggen‘
Das Wort und seine Geschichte
479
Dazu bemerkte schon das DWB (XI 1816): aber korn schlechthin bezeichnet auch eine bestimmte getreideart, und zwar landschaftlich verschieden, es ist immer die wichtigste und häufigste, meist die eigentliche brotfrucht (brotkorn, gegensatz futterkorn), daher auch genauer gemeines korn, d. i. ‚das (hier zu lande) gewöhnliche korn‘.
Auto-Konverse: Dieser bisher vor allem in Blank (1997, 269–280) behandelte, bevorzugt bei Verben auftretende Typ des Bedeutungswandels beruht auf einem Perspektivwechsel, der eine Vertauschung der Aktanten einer verbalen Handlung zur Folge hat. Ein und dieselbe Handlung wird jeweils aus der Perspektive ihrer verschiedenen Aktanten beleuchtet. Dies sei am Beispiel des mhd. Verbs herbergen demonstriert. In der vereinzelt schon im Ahd. nachgewiesenen Ausgangsbedeutung ‚sich in einer Herberge/an einem Ort als Gast aufhalten‘ (13) nimmt der Gast die Subjektrolle ein (AWB IV 977), in der als Folge des Bedeutungswandels entstandenen Bedeutungsvariante ‚jn. beherbergen‘ (14) kommt die Subjektrolle dagegen dem Wirt zu (vgl. auch Blank 2001, 84). (13) Trierer Ägidius 1101 (2. Hälfte 12. Jh.): die lantkundigen man, …, in eine stat sie karten vn̄ herbergiten dare. (14) Speculum ecclesiae 45,26 (Mitte 12. Jh.): Ir sult iwer almōsin dicher gēbin, sult den durftīgen herbergen, sult ime iwer ezzin gēbin.
Auto-konverser Bedeutungswandel betrifft besonders Verben des Verfügungswechsels und Gefühlsverben (Blank 1997, 272). Diese Art wird ermöglicht durch die Kontiguität, die Aufeinanderbezogenheit der zur Debatte stehenden ‚Mitspieler‘ innerhalb des Frames, den das Verb selbst eröffnet sowie durch bestimmte diesen Mitspielern anhaftende semantische Eigenschaften (ebd., 278).
Der für die Auto-Konverse typische Perspektivwechsel findet sich ebenfalls, aber seltener im Bereich von Substantiven und Adjektiven: frnhd. herberger ‚Wirt, Quartiergeber‘ > ‚Untermieter‘ frnhd. lehener ‚Person, die jm. etw. ausleiht‘ > ‚Person, die sich etw. leiht‘ lat. altus ‚hoch‘ > ‚tief‘.
Bedeutungsverschlechterung/Bedeutungsverbesserung: Die Erscheinungen Bedeutungsverbesserung (Melioration) und Bedeutungsverschlechterung (Pejoration) befinden sich auf einer anderen Ebene als die bisher beschriebenen Phänomene des Bedeutungswandels. Sie stellen keine Verfahren des Bedeutungswandels dar, sondern bilden vielmehr Resultate des Bedeutungswandels und gehen jeweils mit anderen Verfahren einher. In der Folge werden bislang eher deskriptiv verwendete Lexeme konnotativ auf- oder abgewertet oder es können ursprünglich vorhandene
480
Oliver Pfefferkorn
positive oder negative Assoziationen neutralisiert werden (Blank 1993, 68), wobei die Entwicklung negativer Assoziationen weitaus häufiger festzustellen ist. So überträgt sich in der Folge eines euphemistischen Bedeutungswandels die negative Bewertung des zu verhüllenden Sachverhaltes auf das zunächst nicht wertend verwendete neue Wort (vgl. mhd. dierne ‚junges Mädchen, Dienerin‘ > ‚Prostituierte‘). Blank (1993) zeigt vor allem für die romanischen Sprachen auf, dass neben der Euphemisierung weitere Verfahren des Bedeutungswandels mit Veränderungen der Konnotation einhergehen können: Bedeutungsverschlechterung: Bedeutungsverengung: Metonymie: Metapher:
frz. bande ‚Gruppe‘ > ‚Verbrecherbande‘ frz. vulgaire ‚zum Volk gehörig‘ > ‚vulgär‘ it. bagordo ‚Turnier‘ > ‚Prasserei‘ frz. délicat ‚köstlich, zart‘ > ‚heikel‘
Bedeutungsverbesserung: Bedeutungsverengung: Metonymie: Metapher:
frz. goût ‚Geschmack‘ > ‚guter Geschmack‘ frz. noble ‚adlig‘ > ‚edel‘ lt. rectus ‚gerade‘ > ‚sittlich gut‘
Davon abzugrenzen ist allerdings der Bedeutungswandel hin zu einer Bedeutung ‚schlecht‘. In diesen Fällen erhält ein Lexem keine negative Konnotation, sondern die negative Komponente setzt sich tatsächlich in der denotativen Bedeutung fest, z. B. im Wandel von billig ‚preiswert‘ zu ‚wertlos, nichtig‘. Dies kann eben soweit gehen, dass das Wort überhaupt ‚schlecht, schlimm, negativ‘ bedeutet (ebd., 67), wie der Wandel von mhd. sleht ‚einfach, schlicht‘ zu nhd. schlecht ‚schlecht, böse, unfreundlich‘ aufzeigt. Für die romanischen Sprachen nennt Blank (ebd., 67 f.) u. a. folgende Beispiele: frz. altération ‚Veränderung‘ > ‚Verschlechterung‘ lat. pravus ‚krumm‘ > ‚schlecht‘.
2.4 Bedeutungswandel als Wandel der Gebrauchsregel Die handlungstheoretische Semantik geht davon aus, dass sprachliche Äußerungen zur Realisierung sprachlicher Handlungen dienen, denen jeweils eine bestimmte Intention eines Sprechers zugrunde liegt. Verständigung kommt dadurch zustande, dass die Kommunikationspartner in ihren Äußerungen Lexeme nach Regeln benutzen, die sich innerhalb der jeweiligen Situation und zur Realisierung eines bestimmten Zwecks bewährt haben. Die Bedeutung eines Wortes wird in der Tradition Wittgen-
Das Wort und seine Geschichte
481
steins als die Gebrauchsregel eines Wortes aufgefasst und auf der Basis sprachlichen Handelns definiert. Für den Bedeutungswandel sind innerhalb dieser instrumentalistischen Bedeutungsauffassung drei Aspekte zentral (Keller/Kirschbaum 2003, 13): – die Sprecherintention, – die sprachliche Realisierung dieser Intention, – die Folgen auf der Ebene des Sprachsystems. Bechmann (2013, 33) geht nun der Frage nach, welche Veränderungen auf der Ebene der Gebrauchsregel dazu führen, dass sich die Bedeutung eines Wortes wandelt, wobei er sich ausführlich mit der Struktur der Gebrauchsregel auseinandersetzt. Die Gebrauchsregel eines Wortes besteht aus verschiedenen Typen semantischer Merkmale, den sog. Bedeutungsparametern. Bechmann unterscheidet bezüglich des von ihm analysierten Bereichs der Verben fünf verschiedene Typen solcher Bedeutungsparameter (ebd., 108): 1. Parameter aus der äußeren Welt (= wahrheitsfunktionale Parameter) 2. Parameter aus der inneren Welt (= epistemische Parameter) 2.1. Parameter aus der Welt der Haltungen (= evaluative Parameter) 2.2. Parameter aus der Welt der Gedanken und Kognitionen (= mentale Parameter) 2.3. Parameter aus der Welt der Gefühle (emotive Parameter) 3. Parameter aus der Welt des Sozialen (soziale Parameter) 4. Parameter aus der Welt des Diskurses (diskursbezogene Parameter) 5. Parameter aus der sprachlichen Welt (sprachliche Parameter) Auf der Grundlage der außersprachlichen Parameter (1–4) kategorisiert Bechmann dann verschiedene Gruppen von Verben: 1. deskriptive Verben (z. B. schlafen, stehen, essen, liegen) 2. emotive Verben (z. B. erschrecken, packen, reißen) 3. evaluative Verben (z. B. saufen, fressen, klauen) 4. mentale Verben (z. B. begreifen erfassen, raffen) 5. expressive Verben (z. B. verpissen, abkacken) 6. soziale Verben (z. B. vorwerfen, verurteilen) 7. diskursive Verben (z. B. sich auseinandersetzen) Bedeutungswandel kommt zustande, wenn sich die Parameterstruktur innerhalb der Gebrauchsregel eines Wortes ändert, indem sprachliche und/oder außersprachliche Parameter neu in die Regel inkorporiert werden. Oder anders ausgedrückt: Der Sprecher verfolgt mit seiner Äußerung ein kommunikatives Ziel und verändert durch abweichenden Wortgebrauch die Struktur der Bedeutungsparameter innerhalb der Wortbedeutung (ebd., 323). Bechmann definiert Bedeutungswandel dann auch als „Ergebnis einer durch Bedeutungsparameter gekoppelten Relation zwischen der Wahl sprachlicher Mittel und dem beabsichtigten Zweck des Sprechers (Mittel-Zweck-
482
Oliver Pfefferkorn
Relation)“ (ebd., 327). Dieser Zweck drückt sich in der Verschiebung eines Verbs in eine andere Kategorie aus. Bechmann demonstriert dies letztlich anhand von nur wenigen, immer wiederkehrenden Beispielen, so am Verb begreifen. Dieses ursprünglich deskriptive, haptische Verb beinhaltet in seiner Gebrauchsregel wahrheitsfunktionale Parameter, mit denen Sprecher eine Aussage über die äußere Welt treffen (ebd., 358). Bechmann bietet in diesem Fall, wie auch in den meisten anderen Fällen, die er beschreibt, allerdings keine Textbelege, er ordnet die von ihm beschriebenen Wandelvorgänge ebenso nicht zeitlich ein. Sie erscheinen bei ihm vielmehr merkwürdig aus der Zeit gefallen. Seine Analysen bleiben weitgehend Gedankengebäude, sie geschehen nicht auf empirischer oder korpuslinguistischer Grundlage. Der Wandel von begreifen z. B. fand schon während der ahd. Sprachperiode (ahd. begrīfan) statt. Zunächst wird dieses Verb im Ahd. im Sinne von ‚etw./jmdn. ergreifen, in Besitz nehmen’ gebraucht (AWB IV 421). (15) Notker, Marcianus Capella: De nuptiis Philologiae et Mericurii 721,27 (vor 1022): Polymnia daz chit plurima memoria. Diu begreif ten ring Saturni.
Ganz vereinzelt wird begrīfan auch schon mit Bezug auf einen kognitiven Verstehens prozess verwendet: (16) Notker, Psalmen und katechet. Denkmäler, Fides 6 (vor 1022): irmezzin unde begrifen nemag in [Gott] nehein sin. uuanda er presens unde totus ist in allen steten.
Aber erst in den Texten der mittelalterlichen deutschen Mystiker tritt diese neue Bedeutungsvariante häufiger auf. (17) David von Augsburg, Die sieben Staffeln des Gebetes 460 (13. Jh.): das si [die Seele] vor aller der welte creaturen gottes erkantnvste begrifen mac. (18) Tauler, Predigten 56,4 (14. Jh.): waz sú do vint, daz ist úber alle sinne, vernunft kan es nút erlangen, nieman mag es begriffen noch verston.
Innerhalb der Gebrauchsregel verschieben sich in diesem Prozess des Bedeutungswandels die Parameter, das Verb besitzt nun keine wahrheitsfunktionalen Bedeutungsparameter mehr, sondern inkorporiert kognitiv-mentale Parameter, womit begrīfan eine abstrakte Bedeutung annimmt. Der Sprecher referiert auf einen im Innern des Menschen ablaufenden Prozess, indem er eine metaphorische Beziehung zu einem Bereich der äußeren Welt herstellt. Die konkrete Bedeutung des Verbs begreifen bleibt allerdings recht lange bestehen. Adelung (I 806) nennt sie zwar, kennzeichnet sie aber als veraltet und bringt vor allem Belege aus der Bibel. Das DWB (Neubearb.) (IV 607) führt für die konkrete Verwendung noch einen Beleg aus dem Jahr 1980 an: (19) Jendryschek, Ebene 75 (1980): vom vielen Begreifen bleibst’s [das Turngerät] rostfrei.
Das Wort und seine Geschichte
483
Doch spätestens im Laufe des 17./18. Jhs. veraltete diese Bedeutungsvariante, auch wenn sie im gegenwärtigen Deutsch nicht völlig verblasst ist und gelegentlich noch auftritt, z. B. in poetischen Texten (19) oder in Kontexten, die deutlich signalisieren, dass begreifen nicht in der üblichen Bedeutung verwendet wird: (20) Berliner Zeitung (14.7.2007): Sie [Besucher] hätten [in der Ausstellung] die einmalige Möglichkeit, „die Bedeutung der Evolution im wahrsten Sinne des Wortes zu begreifen“. Anfassen ist nämlich erlaubt.
Allerdings ist die Bedeutungsgeschichte von begreifen viel komplizierter, denn neben den hier erwähnten existieren schon im Ahd. und Mhd. weitere sowohl konkrete als auch abstrakte Bedeutungsvarianten, so dass wohl noch andere Pfade des Bedeutungswandels anzusetzen wären. Die semantische Entwicklung von begreifen stellt ein Beispiel für den abstrahierenden Pfad beim verbalen Bedeutungswandel dar, der im Bereich der Verben als zentraler Wandelpfad gilt. Bechmann (2013, 345–377) differenziert insgesamt zehn Pfade solcher auf den kommunikativen Zielen des Sprechers basierenden strukturellen Parameterverschiebungen. Neben dem erwähnten abstrahierenden Pfad sind die folgenden zu nennen: – ein deskriptives Verb wird zu einem expressiv-evaluativen Verb (expressiv-evaluativer Pfad) – ein expressives oder expressiv-evaluatives Verb wird zu einem deskriptiven Verb (abschwächender Pfad) – ein deskriptives Verb wird zu einem evaluativen Verb (evaluativer Pfad) – ein deskriptives Verb wird zu einem expressiven Verb (expressiver Pfad) – ein abstraktes Verb wird zu einem konkreten Verb (konkretisierender Pfad) – ein deskriptives Verb wird zu einem emotiven Verb (emotiver Pfad) – ein deskriptives Verb wird zu einem illokutionären (sozialen) Verb (illokutionärer Pfad) – ein deskriptives Verb wird zu einem sozial-diskursiven Verb (sozial-diskursiver Pfad) Den letzten von ihm aufgeführten Pfad nennt Bechmann den Null-Pfad, weil in diesem Fall keine Veränderung der Sprecherabsicht und damit keine Veränderung der Parameterstruktur zu beobachten ist. Es verändert sich allerdings die Extension des Verbs, indem es unter Beibehaltung der deskriptiven Absicht zu einer metaphorischen Übertragung kommt: köpfen ‚einem Lebewesen den Kopf abschlagen‘ > ‚den obersten Bestandteil einer Sache entfernen, um diese zu öffnen‘.
484
Oliver Pfefferkorn
3 Wechselseitige Beeinflussung von Form und Bedeutung Die Ausdrucksseite des Wortes und seine Inhaltsseite entwickeln sich normalerweise getrennt und unabhängig voneinander. In Einzelfällen können sie sich jedoch auch gegenseitig beeinflussen. So besteht die Möglichkeit, dass die Bedeutung eines Wortes die Ausdrucksseite verändert. Seit dem späten Mhd. ist das Substantiv velīs in der Bedeutung ‚Mantelsack, Reisetasche‘ belegt. Es geht zurück auf gleichbedeutendes ital. valigia (< mlat. valisia, valixia) und wurde wohl aus dessen oberital. Mundartform valis entlehnt (Pfeifer 1993, 335). Daneben ist im späten Mhd. auch die Lautvariante veleis belegt (Lexer 1, 54). Da dieses Lexem im Deutschen als Fremdwort natürlich nicht motiviert ist, wurde es spätestens im Frnhd. mit den lautlich ähnlichen, indigenen Substantiven Fell und Eisen, aus denen ein solches Gepäckstück wohl auch bestehen konnte, in Zusammenhang gebracht. Die Form Felleisen erscheint zum ersten Mal im 16. Jh. und verdrängt im 17. Jh. die Konkurrenzformen Fellis, Felles, Fellentz und Velleis (ebd, 335). Es liegt hier der Prozess einer sog. volksetymologischen Veränderung der Ausdrucksseite vor. Die Bedeutung eines Wortes kann jedoch eine Lautentwicklung auch verhindern, so dass ein lautlicher Archaismus entsteht. So wird z. B. das im Zentrum der christlichen Theologie stehende ahd. heilant ‚Heilsbringer, Erretter, Erlöser (mit Bezug auf Jesus Christus)‘ (zu ahd. heilen, heilan, got. heiljan ‚heilen; retten, zum Heil bringen; heiligen‘ AWB IV 828 ff.) von der Abschwächung der vollen Endsilbenvokale ausgenommen (mhd. heilant, nhd. Heiland), während das zugrundeliegende Partzip I in der profanen Bedeutung an dieser Entwicklung teilhat (nhd. heilend). Die Zugehörigkeit zur religiösen Sphäre wirkt in diesem Fall stabilisierend und konservierend (Birkhan 1985, 225). Die im Ahd. ebenso für ‚Heilsbringer‘ vereinzelt belegte lautliche Konkurrenzform heilent setzt sich bezeichnenderweise nicht durch. Die Ausdrucksseite kann allerdings ebenso die Inhaltsseite beeinflussen. Aus afrz./frz. hanter ‚häufig aufsuchen, Umgang haben‘ wurde über mndl./mnd. hantēren im Spätmhd. hantieren in der Bedeutung ‚Handel, treiben, einem Geschäft nachgehen, tun, verrichten‘ entlehnt (Pfeifer 1993, 508). Durch den lautlichen Anklang an Hand ändert sich jedoch die Bedeutung von hantieren zu ‚handhaben, umgehen mit‘, es wird auf Tätigkeiten festgelegt, die primär mit der Hand ausgeführt werden. Schließlich kann ein Bedeutungswandel mit einer Differenzierung auf der Ausdrucksseite einhergehen. Zur Bezeichnung des Vogels Rabe (Corvus) besitzt das Mhd. verschiedene Lautvarianten, u. a. rabe, rappe. Auf dem Weg der (metaphorischen) Bedeutungsübertragung entwickelt sich Anfang des 16. Jhs. daraus die Bedeutungsvariante ‚Rappe, Pferd von rabenschwarzer Farbe‘. Die Gelegenheit dieses Bedeutungswandels wurde dann dazu genutzt, den beiden nun vorhandenen Bedeutungsvarianten verschiedene Lautkörper zuzuordnen: Rabe referiert seitdem nur auf den Vogel, Rappe nur auf das Pferd (Kronasser 1968, 178), zumindest in der deutschen
Das Wort und seine Geschichte
485
Standardsprache. Im oberdeutschen Sprachraum ist allerdings die Lautvariante Rapp für den Vogel erhalten geblieben (Suolahti 1909, 176).
4 Archaisierung Wortschatzelemente können veralten, wenn sie nur noch selten verwendet werden. Dieser Prozess der Archaisierung kann bis zum völligen Aussterben eines Wortes führen. Während der Bedeutungswandel in der Forschung in starkem Maße thematisiert wird, existieren zur Archaisierung nur wenige Arbeiten. Vor allem die Gründe des Veraltens und Absterbens lexikalischer Elemente wurden bislang eher am Rande diskutiert. Zunächst ist festzuhalten, dass die Sprachteilnehmer Lexeme dann nicht mehr verwenden, wenn sie für sie keine kommunikative Bedeutung mehr besitzen, d. h., wenn sie sich vom Einsatz alternativer Elemente eine erfolgreichere Kommunikation versprechen. Das betreffende Wort wird zwar bewusst vermieden, allerdings nicht mit dem Zweck, es veralten zu lassen oder ganz abzuschaffen. Die Archaisierung stellt zumeist das Ergebnis eines Bezeichnungswandels dar. Die Sprecher wählen zwischen verschiedenen Wörtern dasjenige aus, das ihre Intentionen am besten realisiert. Dazu gehört zunächst natürlich das bessere Verstandenwerden überhaupt, daneben die Suche nach einem originelleren Ausdruck. Andererseits kann die Archaisierung auch dem Bedeutungswandel folgen. Die ursprüngliche Bedeutung eines Lexems veraltet und stirbt aus, die neue Bedeutungsvariante bleibt erhalten. Damit wird die durch den Bedeutungswandel entstandene Polysemie wieder abgebaut. Je seltener ein Lexem in der Kommunikation auftritt, desto unbekannter wird es für einen Großteil der Sprecher, vor allem für die jüngeren, die es nicht mehr lernen können, während es ältere Sprecher zumindest noch passiv beherrschen. Archaisierungsprozesse vollziehen sich über längere Zeiträume hinweg und betreffen mehrere Generationen von Sprechern. Von den veraltenden oder veralteten Wörtern, den Archaismen, sind die Historismen zu unterscheiden. Ein Historismus referiert auf heute nicht mehr vorhandene und meist auch nicht mehr bekannte Gegenstände, Sachverhalte und Handlungen/ Vorgänge. Die Bedingungen, unter welchen Sprecher bestimmte Lexeme vermeiden und alternative Ausdrucksweisen bevorzugen, sind vielfältig. Hinweise darauf geben Osman (2002, 245–256), Blank (1997, 425–429) und Fritz (2006, 79–82). Es können im Folgenden nur einige genannt werden. 1. Lange Zeit bestehen im Deutschen mehrere dialektale Varianten gleichberechtigt nebeneinander. Im Zuge der Herausbildung einer einheitlichen deutschen Standardsprache setzt sich innerhalb des Frnhd. in der Regel die Variante mit der großräumigsten Geltung durch. Die anderen Varianten werden weniger häufig verwendet und
486
Oliver Pfefferkorn
veralten allmählich. Sie können jedoch in einzelnen Dialekten oder landschaftlichen Umgangssprachen überleben, werden dann aber nicht mehr allgemein verstanden. So setzten sich z. B. im späten Frnhd. die ostmitteldeutschen Wortformen heuchler, stufe, teppich, ufer, hügel, beben durch, nicht zuletzt auch dadurch, dass Luther sie in seiner Bibelübersetzung verwendet, während die oberdeutschen Varianten gleißner, staffel, gauter, gestade, bühel, bidmen nicht in die Standardsprache aufgenommen wurden und allmählich veralteten (vgl. Besch 2000, 1724 f.). 2. Das Prinzip der Sprachökonomie bewirkt, dass Sprecher längere und umständlichere Wortformen (z. B. Komposita) abkürzen. Oft setzen sich die entsprechenden elliptischen Formen durch, während auf die Ausgangsformen kaum noch zurückgegriffen wird: Laden statt Kaufladen, Kneipe oder Schenke statt Kneipschenke. Archaisch wirken heute viele Abstraktbildungen auf –ung, die lange Zeit charakteristisch für den Kanzleistil und die Rechtssprache waren. Häufig wurden diese Lexeme durch kürzere Wortbildungen vom gleichen Stamm ersetzt: Annahme statt Annehmung, Haft statt Behaftung, Gelöbnis statt Angelobung, Verhör statt Verhörung. Möglicherweise steht dahinter auch ein genereller Wandel in den Voraussetzungen für die Bildung von –ung-Abstrakta. 3. Indigene Lexeme werden gelegentlich von fremden Lexemen verdrängt. So besitzen in verschiedenen Epochen der deutschen Sprachgeschichte bestimmte Sprachen einen hohen Prestigewert, sind damit für die Sprecher besonders attraktiv und modern, so dass es zu vielfältigen Entlehnungen aus diesen Sprachen kommt. Am Ende der frühen Neuzeit betrifft das besonders das Französische. Die aus dem Frz. entlehnten Verwandtschaftsbezeichnungen Onkel und Tante z. B. verdrängten seit dem 17. Jh. die deutschen Entsprechungen Oheim und Muhme. Eingebettet ist dieser Bezeichnungswandel in eine größere Umschichtung der Verwandtschaftsbezeichnungen überhaupt (Fritz 2006, 108 f.). Vor allem seit der Mitte des 20. Jhs. dringt zunehmend Sprachgut aus dem angloamerikanischen Raum in das Deutsche ein und verdrängt partiell einheimische Wörter (z. B. Badminton statt Federball, Ticket statt Fahrkarte, Eintrittskarte, Service statt Dienstleistung, Kundendienst, vgl. auch Riehl in diesem Band). Andererseits wird fremdsprachiger Wortschatz zugunsten deutscher Wörter gelegentlich wieder aufgegeben, womit sich die Fremdwörter zu Archaismen entwickeln. Die deutsche Bildung Fahrrad z. B. ersetzt seit dem Ende des 19. Jhs. das aus dem Frz. entlehnte Veloziped, Bahnsteig ersetzt Trottoir. Wanzeck (2010, 58 f.) spricht in diesen Fällen vom Präferenzwechsel zwischen deutschen und fremden Wörtern. Bei der Verdrängung früher aus dem Frz. entlehnter Wörter mögen wohl auch orthographische Probleme eine Rolle spielen. 4. Wie schon erwähnt neigen Euphemismen dazu, schnell wieder zu veralten. Sie nutzen sich leicht ab, indem sie bald die negative Konnotation des Wortes annehmen, welches sie eigentlich verdrängen sollten. Im Laufe der Sprachgeschichte bildeten sich z. B. sehr viele Ausdrücke mit der Bedeutung ‚Toilette‘ heraus, von denen heute viele wieder ausgestorben bzw. als Archaisimen einzuordnen sind. Das Mhd. Handwörterbuch von Matthias Lexer verzeichnet die folgenden, die partiell noch im
Das Wort und seine Geschichte
487
Frnhd. und später gebräuchlich sind: ganc, geswæse, (heimliches) gemach, loubelīn, heimlīcheit, privēt, sprāchhūs, sprāchkammer, stuol, swās, schīzhūs, secrēte. Im FWB sind darüber hinaus belegt: abtrit, ausgang, danzk, grube, häuslein, kloake, profei. Für das ältere Nhd. nennt das DWB u. a.: Abort, Bequemlichkeit, Garderobe, Gelegenheit, Gericht, Kanzlei, Kothhaus, Laddrein, Nothhaus. Den Prozess der Abnutzung des Euphemismus im Zusammenhang mit der Erscheinung der Toilette beschreibt schon Adelung (1, 127): Da es der Wohlstand nothwendig gemacht hat, manche Dinge nicht bey ihrem rechtem Nahmen zu nennen, so hat man auch diesem Orte schon in den mittlern Zeiten verschiedene theils allgemeine, theils mildere Nahmen gegeben, den damit verbundenen schmutzigen Begriff zu verstecken. … . Abtritt ist eine ähnliche Benennung, welche anfänglich auch dem strengsten Wohlstande nicht anstößig scheinen konnte, aber durch den immer gemeiner gewordenen Gebrauch auch schon niedrig zu werden anfängt, daher sich viele Statt derselben lieber des Ausdruckes heimliches Gemach bedienen.
5. Ein Wort kann innerhalb des Wortschatzes semantisch isoliert sein. Von ihm lassen sich keine Verbindungen zu gebräuchlichen Wörtern oder Wortstämmen herstellen, so dass seine Bedeutung zumindest einem großen Teil der Sprecher unbekannt ist und sie von ihnen auch nicht erschlossen werden kann. Das Wort wird dann meist durch semantisch deutlich motivierte Bildungen ersetzt, z. B.: urgicht (zu mhd. jehen ‚sagen, sprechen, bekennen‘) durch Geständnis (als Rechtsterminus), dahlen (Etymologie unklar) durch schwätzen, watsack (zu mhd. wât ‚Kleidung, Kleidungsstück‘) durch Reisesack, Reisetasche. 6. Die Erscheinung der Homonymie kann zu Störungen oder Missverständnissen in der Kommunikation führen, so dass die Sprecher oft nur eines der beiden Lexeme verwenden und das andere ersetzen: ahd. botah ‚Körper ohne Kopf und Glieder, Rumpf‘ – ahd. botah ‚Bottich‘ frnhd. maus ‚Muskel‘ – frnhd. maus ‚Maus‘.
Zu Verständnisproblemen kann es aber auch zwischen der ursprünglichen Bedeutung eines Lexems und der aus ihr im Zuge des Bedeutungswandels entstandenen neuen Bedeutungsvariante kommen, so dass eine von beiden, oft die frühere, wieder aufgegeben wird oder zumindest veraltet. Abendmahl
-
1. ‚Abendessen‘ (heute veraltet) 2. ‚kirchliches Sakrament‘
Allerdings bleibt zu fragen, warum in einigen Fällen die Homonymie erhalten bleibt, in anderen aber aufgelöst wird und warum auch im Falle des Bedeutungswandels eine Gebrauchsweise veralten kann. Wanzeck (2010, 58 f.) vermutet:
488
Oliver Pfefferkorn
Erst wenn Wörter in ihrer Bedeutung weit genug voneinander entfernt sind, wie bei Schloss ‚Gebäude‘ vs. Schloss ‚Vorrichtung zum Verschließen‘, dann bleiben beide Bedeutungen erhalten.
Möglicherweise hängt dies mit störenden Assoziationen zusammen, was jedoch am jeweiligen Einzelfall genau analysiert werden müsste. Solche negativen Assoziationen liegen sicher bei Wortbildungen mit dem Präfix after- vor, das als Substantiv auf den Darmausgang (anus) referiert. Eine Vielzahl solcher Komposita veralteten spätestens seit dem früheren Nhd.: aftergeburt ‚Nachgeburt‘ (Adelung I 178), afterglaube ‚falscher Glaube, Irrglaube‘ (FWB I 688), afterkosen ‚üble Nachrede‘ (FWB I, 691), aftermontag ‚Dienstag‘ (FWB I 695), afterrede ‚üble Nachrede‘ (Adelung I 180), afterschlag ‚Äste und Zweige gefällter Bäume, Holzabfall‘ (Adelung I 181).
5 Korpora und Wortgeschichte Die historische Sprachwissenschaft und speziell auch die Wortgeschichte arbeiten seit jeher vorrangig empirisch und damit eben korpusbezogen. Die seit den 90er Jahren aufkommende starke korpuslinguistische Ausrichtung der gegenwartssprachlichen Forschung bedeutete somit für die historische Sprachwissenschaft bis auf die nun möglich werdende Digitalisierung ihrer Quellen keine generelle Neuorientierung. Freilich stellten die den frühen sprachlichen Analysen zu den historischen Sprachstufen des Deutschen, vor allem den historischen Grammatiken und Wörterbüchern zugrundeliegenden Textsammlungen eher Zufallskorpora dar, sie beruhten nicht auf einer bewussten Textauswahl. Es wurden meist die Texte herangezogen, die (leicht) greifbar waren. Da die Anzahl der für das Ahd. vorliegenden sprachlichen Zeugnisse sowieso nur sehr gering ist, konnte und kann ein ahd. Textkorpus sowieso sämtliche überlieferten Texte einbeziehen. Ein solches Gesamtkorpus wäre theoretisch noch für das Mhd. bis zur Mitte des 13. Jhs. möglich, für das spätere Mhd. und das Frnhd. aber aufgrund der Textfülle schon nicht mehr realisierbar (vgl. Wegera 2000, 1305). In jüngerer Zeit folgt der Aufbau umfangreicher digitaler Korpora für historische linguistische Untersuchungen zur Gewährleistung von Repräsentativität jedoch im Vorfeld festgelegten Kriterien, wobei jeweils Raum, Zeit und Textsorte im Zentrum stehen. Entsprechende Referenzkorpora für die einzelnen Sprachstufen befinden sich gerade im Aufbau. Für das ältere Nhd. liegt mit dem Deutschen Textarchiv (www.deutschestextarchiv.de) schon ein umfangreiches Korpus vor, das aber noch ergänzt wird. Historische Korpora differieren allerdings nach dem Zweck, zu dem sie erstellt werden. Korpora zur Analyse der formalen Aspekte des Wortes (Lautung/Graphie und Grammatik) können auf einen geringeren Umfang begrenzt werden. Für die systematische Analyse von Flexionsparadigmen reichen üblicherweise 30 Seiten eines Textes
Das Wort und seine Geschichte
489
mit jeweils etwa 400 Wortformen aus, für den Laut- und Graphembereich sogar noch weniger. Das erbrachte die Arbeit an der Grammatik des Frühneuhochdeutschen (ebd., 1310). Darin nicht belegte Einzelphänomene erfordern gelegentlich die Heranziehung des Volltextes oder Zusatzexzerptionen weiterer Texte. Für lautliche und grammatische Analysen erstellte moderne Korpora beziehen sich heute für die Vordruckzeit zudem auf Handschriften, nicht mehr auf Texteditionen (z. B. das Bochumer Mittelhochdeutsch-Korpus). Editionen bieten die historischen Texte zum Zwecke einer besseren Lesbarkeit oft in einer (meist lautlich und graphisch) normalisierten Form. Die Herausgeber der großen, zum Teil heute noch gültigen Texteditionen des 19. und beginnenden 20. Jahrhunderts strebten danach, aus der Vielzahl der vorliegenden Handschriften einen möglichen Urtext zu rekonstruieren, der in dieser Form jedoch nicht überliefert war. Sie boten keinen authentischen Text. Historische Textkorpora, die eher für lexikalische Analysen erstellt werden und die Bedeutungsentwicklung eines Wortes dokumentieren oder verschiedene Bedeutungsvarianten eines Lexems aufdecken sollen, müssen allerdings einen erheblichen Umfang besitzen. Letztlich müssten sie die gesamte überlieferte, vielfach in sich differenzierte, nicht zuletzt regional gegliederte Lexik einer Sprachperiode repräsentieren. Dies kann ein Korpus allein nur in Ansätzen leisten, so dass notwendig immer Lücken bleiben. Ein nicht unbeträchtlicher Teil der Lexik außerhalb des Allgemeinwortschatzes tritt in den heute noch vorhandenen Texten von vornherein eher selten auf, so dass ihn selbst umfangreichere Korpora nur bruchstückhaft enthalten können. Kleinere Korpora spiegeln ohnehin nur Ausschnitte oder einzelne Aspekte der Bedeutungsentwicklung eines Wortes wider, aber nie seine gesamte Geschichte, die sich häufig über mehrere Sprachperioden erstreckt. Neue Lexeme oder neue Bedeutungsvarianten eines Lexems treten gelegentlich nur in eng begrenzten Kommunikationsbereichen (z. B. Fachsprachen) auf, können dort längere Zeit verbleiben und sind meist nur in einzelnen Texten nachweisbar, ehe sie sich allmählich ausbreiten und gegebenenfalls in die sich im Frnhd. entwickelnde Standardsprache aufgenommen werden. So kann die Benutzung verschiedener Korpora schon hinsichtlich der Erstbelegung von Lexemen zu ganz unterschiedlichen Ergebnissen führen. Historische Korpora stellen wichtige und unverzichtbare Hilfsmittel bei der Analyse wortgeschichtlicher Erscheinungen dar. Sie bilden jedoch immer nur einen mehr oder weniger großen (bzw. kleinen) Ausschnitt der schriftlichen Sprache einer bestimmten Zeit ab. Gegebenenfalls sind sie durch weitere Texte gezielt zu ergänzen oder ihr Befund muss anhand von verschiedenen anderen Hilfsmitteln (z. B. historischen Sachlexika, speziellen Monographien zur Wortgeschichte und natürlich historischen Sprachwörterbüchern, die selbst wiederum auf Korpora basieren, wie das MWB und das FWB) überprüft werden.
490
Oliver Pfefferkorn
6 Literatur 6.1 Wörterbücher Adelung, Johann Christoph: Grammatisch-kritisches Wörterbuch der Hochdeutschen Mundart, mit beständiger Vergleichung der übrigen Mundarten, besonders aber der Oberdeutschen. Zweyte vermehrte und verbesserte Ausgabe; Bd. 1‒4. Leipzig 1793–1801 (Nachdruck Hildesheim/New York 1990). AWB = Althochdeutsches Wörterbuch. Aufgrund der von Elias von Steinmeyer hinterlassenen Sammlungen im Auftrag der sächsischen Akademie der Wissenschaften zu Leipzig bearb. u. hrsg. von Elisabeth von Karg-Gasterstädt und Theodor Frings. Bd. 1 ff. Berlin 1968 ff. DWB = Deutsches Wörterbuch von Jacob und Wilhelm Grimm. Bd. 1 ff. Fotomechanischer Nachdruck der Erstausgabe Leipzig 1854 ff., München 1984. DWB (Neubearb.) = Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm. Neubearbeitung. Bd. 1 ff. Leipzig/Stuttgart 1983 ff. FWB = Frühneuhochdeutsches Wörterbuch. Hrsg. v. Robert R. Anderson, Ulrich Goebel u. Oskar Reichmann. Bd. 1 ff. Berlin, New York 1989 ff. Lexer, Matthias: Mittelhochdeutsches Handwörterbuch. 3 Bde. Leipzig 1872‒1878. MWB = Mittelhochdeutsches Handwörterbuch. Hrsg. von Kurt Gärtner, Klaus Grubmüller u. Karl Stackmann. Bd. 1. Stuttgart 2013. Pfeifer = Etymologisches Wörterbuch des Deutschen. Erarbeitet im Zentralinstitut für Sprachwissenschaft, Berlin, unter der Leitung von Wolfgang Pfeifer. 2. Aufl., durchges. u. erg. v. Wolfgang Pfeifer. Berlin 1993.
6.2 Sekundärliteratur Augst, Gerhard (1970): „Haupt“ und „Kopf“. Eine Wortgeschichte bis 1550. Diss. Mainz. Bechmann, Sascha (2013): Bedeutungswandel deutscher Verben. Eine gebrauchstheoretische Untersuchung. Tübingen (Tübinger Beiträge zur Linguistik, 543). Besch, Werner (2000): Die Rolle Luthers für die deutsche Sprachgeschichte. In: Werner Besch, u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 2. Teilbd. 2. Aufl. Berlin/New York, 1713‒1745 (Handbücher zur Sprach- und Kommunikationswissenschaft/Handbooks of Linguistics and Communication Science (HSK), 2.2). Birkhan, Helmut (1985): Etymologie des Deutschen. Bern/Frankfurt a. M./New York (Germanistische Lehrbuchsammlung, 15). Blank, Andreas (1993): Zwei Phantome der Historischen Semantik: Bedeutungsverbesserung und Bedeutungsverschlechterung. In: Romanistisches Jahrbuch 44, 58‒85. Blank, Andreas (1997): Prinzipien des lexikalischen Bedeutungswandels am Beispiel der romanischen Sprachen. Tübingen (Beihefte zur Zeitschrift für romanische Philologie, 285). Blank, Andreas (2001): Einführung in die lexikalische Semantik für Romanisten. Tübingen. Dornseiff, Franz (1955): Bezeichnungswandel unseres Wortschatzes. Ein Blick in das Seelenleben der Sprechenden. 6. neubearb. Aufl. v. Albert Waag. Lahr in Baden. Fritz, Gerd (2005): Einführung in die historische Semantik. Tübingen (Germanistische Arbeitshefte, 42). Fritz, Gerd (2006): Historische Semantik. 2. Aufl. Stuttgart/Weimar (Sammlung Metzler, 313). Grzega, Joachim (2004): Bezeichnungswandel: Wie, Warum, Wozu? Ein Beitrag zur englischen und allgemeinen Onomasiologie. Heidelberg.
Das Wort und seine Geschichte
491
Harm, Volker (2000): Regularitäten des semantischen Wandels bei Wahrnehmungsverben des Deutschen. Stuttgart (Beihefte der Zeitschrift für Dialektologie und Linguistik, 110). Job, Michael (1987): Semantischer Wandel und lexikalische Rekonstruktion. In: Wolfgang Meid (Hg.): Studien zum indogermanischen Wortschatz. Innsbruck, 57‒63. Job, Michael/Ulrike Job (1997): Überlegungen zum semantischen Wandel. In: Andreas Gather/Heinz Werner (Hg.): Semiotische Prozesse und natürliche Sprache. Festschrift für Udo L. Figge zum 60. Geburtstag. Stuttgart, 255‒272. Keller, Rudi (1991): Sprachwandel, ein Zerrspiegel des Kulturwandels? In: Karl-Egon Lönne (Hg.): Kulturwandel im Spiegel des Sprachwandels. Tübingen/Basel, 207‒218. Keller, Rudi (2003): Sprachwandel. Von der unsichtbaren Hand in der Sprache. 3. Aufl. Tübingen. Keller, Rudi/Ilja Kirschbaum (2003): Bedeutungswandel. Eine Einführung. Berlin/New York. Kronasser, Heinz (1968): Handbuch der Semasiologie. Kurze Einführung in die Geschichte, Problematik und Terminologie der Bedeutungslehre. 2. Aufl. Heidelberg. Nübling, Damaris u. a. (2013): Historische Sprachwissenschaft des Deutschen. Eine Einführung in die Prinzipien des Sprachwandels. 4. Aufl. Tübingen. Osman, Nabil (Hg.) (2002): Kleines Lexikon untergegangener Wörter. Wortuntergang seit dem Ende des 18. Jahrhunderts. 12. Aufl. München. Schweikle, Günther (1996): Germanisch-deutsche Sprachgeschichte im Überblick. 4. Aufl. Stuttgart/ Weimar. Suolahti, Hugo (1909): Die deutschen Vogelnamen. Eine wortgeschichtliche Untersuchung. Photomechanischer Nachdruck. 2. Aufl. Berlin/New York 2000. Szczepaniak, Renata (2007): Der phonologisch-typologische Wandel des Deutschen von einer Silben- zu einer Wortsprache. Berlin u. a. (Studia linguistica Germanica, 85). Szczepaniak, Renata (2012): Lautwandel verstehen. Vom Nutzen der Typologie von Silben- und Wortsprachen für die historische und die synchrone Linguistik. In: Péter Maitz (Hg.): Historische Sprachwissenschaft. Erkenntnisinteressen, Grundlagenprobleme, Desiderate. Berlin u. a. (Studia linguistica Germanica, 110), 85‒104. Wanzeck, Christiane (2010): Lexikologie. Göttingen (Uni-Taschenbücher, 3316). Wegera, Klaus-Peter (2000): Grundlagenprobleme einer mittelhochdeutschen Grammatik. In: Werner Besch u. a. (Hg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 2. Teilbd. 2. Aufl. Berlin/New York, 1304‒1320 (Handbücher zur Sprach- und Kommunikationswissenschaft/Handbooks of Linguistics and Communication Science (HSK), 2.2). Wegera, Klaus-Peter/Sandra Waldenberger (2012): Deutsch diachron. Eine Einführung in den Sprachwandel des Deutschen. Berlin (Grundlagen der Germanistik, 52). Wellander, Erik (1928): Studien zum Bedeutungswandel im Deutschen. 3. Teil: Ellipse in semasiologischen einheitlichen Verbindungen. Uppsala.
Ulrike Haß
21. Das Wort in der Lexikografie Abstract: Ausgangspunkt des Beitrags ist das Dilemma, das sich aus der wissenschaftlich ‚eigentlich falschen‘ Isolierung der Wörter im Wörterbuch und dem unabweisbaren Nutzen von Wörterbüchern für Wissenschaft und Bildung ergibt. Die Lexikografie versucht das Dilemma durch unterschiedliche Methoden der Darstellung zu lösen, die das zunächst im Alphabet isolierte Wort wieder in seine ursprünglichen, im realen Sprachgebrauch gegebenen Nachbarschaften und Bezüge einordnet. Die Verfahren der Re-Kontextualisierung des Worts werden auf zwei Ebenen (Makro- und Mikrostruktur) beschrieben und veranschaulicht. Schließlich wird deutlich gemacht, dass Wörterbücher nicht nur kein zu enges ‚Gehege‘ für das Wort sind, sondern sogar das Potenzial besitzen, die vermeintlichen Grenzen der Wörter und des einzelsprachlichen Wortschatzes als äußerst durchlässig kenntlich zu machen. 1 Das lexikografische Dilemma 2 Warum und zu welchen Zwecken man Wörterbücher braucht 3 Stichwörter sind mehr als Wörter 4 Das Wort im Wortartikel 5 Resümee 6 Literatur
1 Das lexikografische Dilemma So ziemt es dem edlen deutschen Jüngling. Er durstet nach Bier, die Jungfrau durstet nach Freiheit. Er zwängt seinen Hals in einen Strangulierapparat von Kragen, der ihm die Respiration hemmt, sie schafft das Korsett ab und alles sonst Einschnürende. „Es strebt das Weib nach Freiheit, der Mann nach Sitte.“ Mit beifallheischendem Blick stieg Julia von der Fußbank nieder. Der Beifall aber blieb uns Allen in der Kehle stecken. (Dohm 1902, 168, Hervorhebungen UH)
Beifall und beifallheischend oder Beifall heischend – wo soll das Wörterbuch Nomen, Verb, Partizip einsortieren? Welche Wörterbuchwörter suchen die Nutzer und Nutzerinnen wo? Und welche Informationen zum Wort Beifall sind unabdingbar, wenn es doch so eng mit dem Verb heischen sowie mit weiteren Verben (ernten, spenden, klatschen) verbunden ist und wo es doch mit unterschiedlichen Präpositionen (Beifall von jemandem, für etwas) je andere Mitspieler einer Szenerie zum Ausdruck bringt? Ist es sprachüblich, dass Beifall „in der Kehle stecken bleibt“, wie in diesem Textauszug, oder fällt diese Kombination unter dichterische Freiheit, die im Wörterbuch nichts zu suchen hätte? Ist es sinnvoll oder eher grotesk, Beifall zwischen Beifahrer und bei-
Das Wort in der Lexikografie
493
fällig einzuordnen? Stünde Beifall nicht besser zwischen Applaus und Zustimmung? Sollte man beifällig sowie die Komposita Beifallsjubel, -geschrei, -donner sowie Beifallsbezeugung (oder heißt es Beifallsbezeigung?) nicht im selben Textzusammenhang erläutern? Es sind recht viele Fragen dieser Art, die Lexikografinnen und Lexikografen unablässig bedrängen, denn sie müssen im Wörterbuch auseinandernehmen und trennen, was eigentlich zusammengehört. Das Alphabet und die durch die Textsorte erzwungene Fokussierung auf das Wort zerstören die vielfältigen Relationen, die das Einzelwort mit anderen Wörtern der Sprache verbinden. Dieses Dilemma ist umso spürbarer geworden, je mehr sich die Sprachwissenschaft seit der zweiten Hälfte des 20. Jahrhunderts dem Sprachgebrauch zugewendet hat. Wörter sind ein zwar wesentliches, v. a. für Nicht-Linguisten greifbar erscheinendes, aber eben nur ein Element des Gesamtsystems einer Sprache und sie sind mit den übrigen Ebenen der Sprache (Morphologie, Syntax, Text, Diskurs) und auch miteinander enger verknüpft, als die Auflistung der Wörter in einem beliebigen Wörterbuch es suggeriert. Für Linguisten mit strikter Orientierung an den Strukturen einer Sprache sind Wörter vage, zwischen Morphem und syntaktischer Einheit schwankende, undefinierbare Größen (vgl. Haß/ Storjohann 2015); infolgedessen gelten Wörterbücher bei manchen Linguisten nicht als ernstzunehmende wissenschaftliche Textsorte. Ihnen zum Trotz kann die moderne professionelle Lexikografie beschrieben werden als fortgesetzter Versuch, die Isolierung und Versteinerung der Wörter durch methodische Innovationen aufzuheben und gleichzeitig das Sezieren des Wortschatzes und das Analysieren der Wörter zu erhalten. Die gemessen an Text und Gespräch künstliche lexikografische Isolierung der Wörter ist eben auch gewollt und notwendig: Nur durch sie sind erhellende, weil verallgemeinernde Darstellungen des Wortgebrauchs möglich – Wörterbücher sind zentrale Instrumente von Sprachbildung, Sprachreflexion und Sprachpolitik einer Sprechergemeinschaft.
2 Warum und zu welchen Zwecken man Wörter bücher braucht Wörterbücher werden von enzyklopädischen Lexika unterschieden; erstere behandeln Aspekte des Wortgebrauchs, letztere erläutern Dinge und Sachverhalte. Dennoch gibt es in manchen Wörterbuchkulturen mehr, in anderen weniger Mischformen, die diese Unterscheidung bei Substantiven tendenziell aufheben, weil z. B. die Fragen nach der Bedeutung des Worts Vanille und nach dem, was Vanille ist, zusammenfallen können und theoretisch nicht zufriedenstellend gelingt (vgl. Engelberg/Lemnitzer 2009, 7–17). Der Entwicklung scheint hier zum gemeinsamen Online-Portal zu gehen, über das sich Sachlexikon und Wörterbuch eines Anbieters über dieselbe Suchwort eingabe erschließen lassen.
494
Ulrike Haß
Es werden zwei grundlegende Anlässe der Wörterbuchbenutzung unterschieden, die manch ein Wörterbuch auch kombiniert bedienen können möchte: Nachschlagen aufgrund sprachlicher Probleme bei Textrezeption und Textproduktion (‚das Wörterbuch als Nachschlagewerk‘) sowie Anlässe der Sprachreflexion/Sprachbildung (‚das Wörterbuch als Lese- und Lernbuch‘) (Engelberg/Lemnitzer 2009, 94 f.). Jede dieser Benutzungsanlässe kann feiner differenziert werden und entsprechende Anforderungen an ein Wörterbuch stellen. Z. B. kann Textproduktion in der Erst- oder in einer Fremdsprache stattfinden, es kann sich um eine Übersetzung und zwar entweder um ein Hinübersetzen (von der Erst- in die Fremdsprache) oder um ein Herübersetzen handeln. Dabei gilt, dass ein Wörterbuch die Bedürfnisse eines Nutzers umso besser erfüllt, je spezifischer es auf die Benutzungssituation zugeschnitten ist. Es gilt aber auch, dass ein Wörterbuch nur dann genügend Käufer findet, wenn es möglichst viele Benutzungssituationen für einen breiteren Adressatenkreis abdeckt. Aktuell steht die Lexikografie vor einem ähnlichen Problem wie der Journalismus: Beides wird zunehmend online genutzt, und Nutzer wollen für Online-Inhalte am liebsten überhaupt nichts mehr bezahlen. Da ist die Tendenz hin zum Mehrzweckwörterbuch (z. B. Leo) und zur Automatisierung lexikografischer Arbeit unschwer zu prognostizieren. Für das Englische als globaler Sprache sieht der Markt wohl anders aus. Das Verhältnis eines Wörterbuchs zu dem Wortschatzausschnitt, der in ihm präsentiert wird, wird von Nutzerinnen und Nutzern oft anders verstanden als es von den Lexikografen gedacht ist. Wissenschaftliche und professionelle Verlagswörterbücher basieren auf dem Sprachgebrauch, der, bezogen auf das einzelne Wort, so realitätsnah wie möglich erfasst und beschrieben werden soll. Dies geschah früher anhand umfangreicher Zettelarchive und heute anhand großer Textkorpora. Auf dieser Basis können der übliche und der abweichende Gebrauch beschrieben werden – subjektive Sprachurteile werden damit weitgehend ausgeschlossen. Diese Art von Wörterbüchern nennt man deskriptiv; sie dokumentieren bestimmte Teile des Wortschatzes ihrer Zeit und können genau deshalb zu einer historischen Quelle werden. Nutzer greifen aber oft zu deskriptiv angelegten Wörterbüchern und interpretieren sie präskriptiv, d. h. normsetzend und zur Orientierung über richtigen und falschen Wortgebrauch. Sie tendieren dazu, die Beschreibung als Vorschrift zu lesen. Präskriptive Wörterbücher sind in Wirklichkeit sehr selten und im Grunde nur für die Kommunikation von Fachleuten untereinander und ihre Fachterminologien sinnvoll. Problematisch kann die präskriptive Interpretation deskriptiver Wörterbuchinformationen dann werden, wenn die nie ganz aufzulösende Diskrepanz zwischen dem, was das Wörterbuch dokumentiert, und dem tatsächlichen Wort- bzw. Sprachgebrauch aus historischen oder anderen Gründen größer wird. Wenn z. B. ein Wörterbuch, das den Gebrauch des hochsprachlichen Wortschatzes der Nachkriegsbundesrepublik dokumentiert, von heutigen Nutzern präskriptiv fehlinterpretiert wird, können ältere Gebrauchsweisen als stilistisch höherwertige, ‚bessere‘ überdauern. Wörterbüchern kommt in bestimmten historischen Situationen einer Sprachgemeinschaft die Aufgabe zu, den zur Verfügung stehenden Wortschatz in Gänze zu
Das Wort in der Lexikografie
495
dokumentieren, weil erst auf dieser Basis sprachpolitische Maßnahmen wie Pflege, Ausbau, Terminologiearbeit und sprachbildungsbezogene Maßnahmen getroffen werden können. Deshalb werden z. B. aus historischem Interesse Wörterbücher einer Epoche gern als Repräsentationen der Sprache jener Epoche herangezogen. Von einem spiegelbildlichen Verhältnis darf hierbei aber keinesfalls ausgegangen werden – zu zahlreich sind, bedingt durch die angewendeten lexikografischen Konzepte und Methoden, die Brechungsfaktoren. Im Blick auf deskriptiv angelegte Sprachwörterbücher ist in den letzten Jahrzehnten eine differenzierte Wörterbuchtypologie entwickelt worden, die weit über die gängige Unterscheidung zwischen zweisprachigem und einsprachigem Wörterbuch hinausgeht. Oft zitiert wird die Wörterbuchklassifikation von Kühn, die von den Funktionen der Wörterbuchbenutzung ausgeht (nach Engelberg/Lemnitzer 2009, 20). Nachfolgend eine alphabetische Liste von Wörterbuchtypen, die grundsätzlich für alle Sprachen vorkommen (können), auch wenn wegen des globalen Markts die größte Ausdifferenzierung bei englischen Wörterbüchern vorliegen dürfte: abbreviation dictionary, analogical dictionary, author dictionary (with various subtypes), basic vocabulary dictionary, bilingual dictionary (with various subtypes), citation dictionary, collocation dictionary, colloquial language dictionary, dialect dictionary (with various subtypes), dictionary of animal names, dictionary of antonyms, dictionary of archaisms, dictionary of careers, dictionary of conjunctions, dictionary of difficult words, dictionary of eponyms, dictionary of false friends, dictionary of gestures, dictionary of homonyms, dictionary of insults, dictionary of internationalisms, dictionary of phraseologisms, dictionary of place names, dictionary of proverbs, dictionary of pseudonyms, dictionary of surnames, dictionary of variants, dictionary of word formation means, dictionary/book of field names, dictionary/book of water names, doublet dictionary, etymological dictionary (with various subtypes), flexion dictionary, foreign word dictionary, frequency dictionary, general monolingual dictionary, grammatical dictionary, historical dictionary (synchronic, diachronic), language contact dictionary (e.g. dictionary of Anglicisms, Gallicisms, etc.), language period dictionary, monolingual dictionary, multilingual dictionary, neologism dictionary, onomatopoetic dictionary, orthographic dictionary, particle dictionary, picture dictionary, preposition dictionary, pronunciation dictionary, rhyme dictionary, sentence dictionary, sign language dictionary, specialized dictionary (with various subtypes), synonym dictionary (distinctive, cumulative, partially distinctive), valency dictionary (noun, verb, adjective valency dictionary), word family dictionary. (Gouws u. a. 2013, 3)
Bei solchen Typologien sind, wie man sieht, unterschiedliche Arten von Merkmalen im Spiel, die sich wenigen Eigenschaftsdimensionen zuordnen lassen. Dies sind: – der Wörterbuchgegenstand, d. h. derjenige Wortschatz(ausschnitt), der in einem Wörterbuch beschrieben wird, z. B. der allgemeine Wortschatz, Tierbezeichnungen, Eigennamen, Antonyme, Epochenwortschatz, Verben, Kernwortschatz, usw., – die Varietät, die der Wörterbuchgegenstand repräsentiert, z. B. Dialekte, Fachsprachen, Literatursprache, Autorensprache, Umgangssprache, usw.; hierbei wird im Verständnis der Nutzer oft Wortschatz implizit (und fälschlicherweise)
496
Ulrike Haß
mit Sprache gleichgesetzt und es werden weitere Ebenen der betreffenden Sprache, etwa die Morphologie und die Syntax, ausgeblendet, – schriftsprachlicher oder gesprochensprachlicher Wortgebrauch; letzteres ist lexikografisch schwer zu realisieren, da die Dokumentation gesprochener Sprache sehr viel aufwändiger ist als diejenige geschriebener Sprache, – Fokussierung der Informationen, die das Wörterbuch enthält, auf wenige, bestimmte Arten, z. B. Rechtschreibung, Aussprache, Bedeutung, Etymologie, Bedeutungsrelationen usw. In künftigen Typologien wird ein weiteres, zusätzliches Kriterium immer wichtiger werden: die Frage, ob es sich um ein von Menschen gemachtes oder um ein computergeneriertes Wörterbuch handelt, das aus automatisch extrahierten Angaben ohne nennenswerte menschliche Überarbeitung besteht. Letzteres nimmt zweifellos zu und damit einhergehend wandelt sich zwangsläufig die Vorstellung vom Wort im Wörterbuch, und zwar vermutlich tendenziell weg vom Wort als begrifflichem Zeichen und hin zum Wort als formal identifizierbarer Zeichenkette. Auf einen nur für die deutsche Sprache existierenden Typ von Wörterbuch muss hier eingegangenen werden: das Fremdwörterbuch. Es ist das Resultat eines jahrhundertlangen Fremdwortpurismus und seit Beginn des 19. Jahrhunderts eines der kulturellen Symbole deutsch-nationaler Ideologie (zum Zusammenhang von Ideologie und Fremdwortpurismus ausführlich Gardt 2000). Die Unterscheidung zwischen fremden, d. h. aus anderen Sprachen übernommenen, und eigenen ‚ererbten‘ Wörtern ist linguistisch streng genommen nicht möglich, denn schon die früheste Sprachstufe des Deutschen, das Althochdeutsche, ist durch Übernahme lateinischer Wörter aus der römischen Kultur wie aus dem Christentum nachhaltig geprägt (zu Wörtern im Sprachkontakt s. Riehl in diesem Band). Aber die damals entlehnten Wörter wie Anker, Mauer, lesen, schreiben hat niemand je im Fremdwörterbuch gesucht. Eine absolute zeitliche Grenze, ab der Sprecherinnen und Sprecher ein Wort als ‚fremd‘ empfinden, lässt sich nicht ziehen; vielmehr gibt der Grad der phonetischen und morphologischen ‚Eindeutschung‘ eines entlehnten Worts den Ausschlag über seine Aufnahme in ein Fremdwörterbuch. In der Online-Version von Langenscheidts Fremdwörterbuch finden sich z. B. Baby und stylen, nicht aber Keks (aus engl. cake, pl. cakes) und Streik (aus engl. strike), weil letztere nicht nur nach deutschen Regeln flektiert, sondern auch dem deutschen Phonemsystem (der Aussprache) angeglichen wurden, wohingegen Baby bisher (neben der Großschreibung) ‚nur‘ die Plural- und Genitivform (Babys, nicht babies bzw. baby’s) aus dem Deutschen übernommen hat, nicht aber die lautliche Realisierung des Stammvokals. Kaum vorhersagbare Besonderheiten in Schreibung und Flexion sowie die Tatsache, dass Fach- und Wissenschaftswörter oft griechisch-lateinischer Herkunft sind, begründen einen Nachschlagebedarf und damit die Existenz des Typs Fremdwörterbuch. Unsinnig ist die Trennung zwischen deutschen ‚Erbwörtern‘ und ‚Fremdwörtern‘ im Hinblick auf den Sprachgebrauch bzw. die Realität der sprachlichen Kommunikation.
Das Wort in der Lexikografie
497
Sprachkulturen unterscheiden sich auch durch ihre Traditionen der Wörterbuchnutzung; z. B. scheint im angelsächsischen Sprachraum die Nutzung von Wörterbüchern im Erst- und Fremdsprachenunterricht der Schulen und Universitäten viel selbstverständlicher und intensiver zu sein als in deutschsprachigen Ländern. Entsprechend ungleich kann der kompetente Umgang mit den in Wörterbüchern enthaltenen Informationen verteilt sein.
3 Stichwörter sind mehr als Wörter „Wörterbuch ist die alphabetische verzeichnung der wörter einer sprache.“ So lapidar definierte es Jacob Grimm 1854 in seiner Vorrede zum ersten Band des Deutschen Wörterbuchs (DWB). Es klingt, als sei nichts einfacher, als eine Liste von Stichwörtern für ein Wörterbuch anzulegen. In diesem Abschnitt wird erläutert, dass und wie Stichwörter fürs Wörterbuch konstruiert werden und inwiefern sie sich von ‚normalen‘ Wörtern unterscheiden.
3.1 Das sogenannte Lemma und der Lemmaansatz Da ein Wörterbuch nicht nur morphologisch einfache Wörter (Fall, bei), sondern auch komplexe Wortbildungen (Beifall, Beifallsbezeugung), Wortteile (zer-, -lich, -log) und Mehrwortausdrücke (Beifall heischend, zur Ruhe kommen) enthalten kann, bezeichnet man in der Lexikografie das meist fettgedruckte Element am Beginn eines Wortartikels als Lemma und die zum Ansatz der Form des Lemmas notwendigen Schritte als Lemmatisierung; sie sollte Prinzipien folgen. Nachfolgend die wichtigsten, von den meisten gegenwartsbezogenen deutschen Wörterbüchern angewendeten Prinzipien: Nomina werden in der Form angesetzt, die dem Nominativ Singular mit unbestimmtem Artikel entspricht: Atlas, Beifall, (ein) Angestellter, (eine) Angestellte, usw. Verben werden im Infinitiv angesetzt, wenn dieser einigermaßen gebräuchlich ist: spenden, heischen, gebären, vergewissern, verholen, usw. Verben mit abtrennbarem vorderem Bestandteil (Präverben, Partikelverben) werden ebenfalls als Infinitiv angesetzt, der die Abtrennbarkeit nicht erkennen lässt; diese Information muss im Wortartikeltext gegeben werden: abholen (holt … ab), nachdenken (dachte … nach), entgegenkommen (kommst … entgegen), usw. Adjektive werden ungesteigert in derjenigen Form angesetzt, die sie in prädikativer Verwendung haben, also nicht (der) kleine (Hund), (ein) kleiner (Hund), kleiner (als), sondern (der Hund ist) klein. Bei Artikelwörtern (der, die, das, ein, eine) und Pronomina (er, sie, es, ihm, ihr, deren, seinesgleichen, mein, dein, sein usw.) werden oft alle Flexionsformen für sich lemmatisiert, da eine Formverwandtschaft kaum zu erkennen ist und manche Formen (die, der, ein) zudem ambig sind (s. 4.1). Die nicht flektierbaren Wortarten (Adverben, Präpositionen, Kon-, Subjunktionen, Partikeln – gestern, mit, und, weil, doch) haben nur eine Form, die angesetzt werden kann.
498
Ulrike Haß
Sonderfälle erzwingen gerade bei alphabetischer Ordnung oft Sonderregelungen: Wörter, die sowohl zusammen als auch getrennt geschrieben vorkommen (kennenlernen oder kennen getrennt von lernen, beifallheischend oder Beifall getrennt von heischen); morphologische Varianten bei unveränderter Bedeutung (löchrig/löcherig, Friede/Frieden); sog. Suppletivformen bei einigen Adjektiven und Adverbien (gut, besser, (am) best-; gern, lieber, (am) liebst-), beim Verb sein (bin, bist, seid, war, wären, gewesen, usw.).
Wenig Konsens existiert in der Frage, wie und ob überhaupt Mehrwort-Ausdrücke (Phraseologismen wie zur Ruhe kommen, klipp und klar, Kopf und Kragen, Kohldampf schieben und feste Wortverbindungen wie Schwarzes Brett, Heiliger Stuhl u. a.) als Lemma angesetzt werden sollen. Die Wörterbücher des Duden-Verlags lemmatisieren solche Mehrwortausdrücke nicht, sondern integrieren sie in den Wortartikel zu einem seiner lexikalischen Elemente; hier fällt eine systematische Regelung schwer (Kopf und Kragen unter Kopf oder unter Kragen?). Das am Anfang stehende Wort ist oft das semantisch unwichtigste (zur in zur Ruhe kommen). Dass die Lemmata eines Wörterbuchs nicht immer, aber meistens alphabetisch angeordnet werden sollen, spielt bereits bei der Frage nach dem sinnvollsten Lemmaansatz eine Rolle, aber ebenso die Frage: Wo suchen die Nutzer zuerst? Im elektronischen Wörterbuch hat sich das Problem der Einsortierung ins und der Suche im Alphabet weitgehend aufgelöst, nicht aber die Aufgabe der Lemmatisierung. Fehlertolerante Suchmöglichkeiten und Trunkierungen (Beif*, hei*), die Wortvorschläge wie „Meinten Sie Beifuß bzw. heilen?“ machen, lösen die Orientierung der Lexikografie am Alphabet auf (Gouws u. a. 2013, 11, 13). Alle Lemmata zusammen und die Art und Weise ihrer Anordnung im Wörterbuch wird Makrostruktur genannt. Mediostruktur bezeichnet das Verweissystem eines Wörterbuchs und Mikrostruktur die Struktur des einzelnen Wortartikels (erläuternd Schlaefer 2009, 82–92).
3.2 Wortschätze und Makrostrukturen „Wörterbuch ist die alphabetische verzeichnung der wörter einer sprache.“ Hintergrund dieser oben zitierten Definition Jacob Grimms war ein Streit um die der deutschen Sprache angemessenste Weise der Wörter-Anordnung (Haß 1997), denn das Alphabet zerreißt v. a. in der deutschen Sprache, bedingt durch die Möglichkeiten der Wortbildung, wichtige Zusammenhänge zwischen Wörtern. Z. B. finden sich die zur selben Wortfamilie gehörenden Wörter Sinn, sinnvoll, versinnbildlichen an auseinanderliegenden Stellen des (gedruckten) Wörterbuchs, und Komposita wie Ableitungen zum selben Grundwort (Abfall, Beifall, Krankheitsfall, Streitfall) stehen nie beisammen. Daher haben sich Abweichungen von der strikt alphabetischen Anordnung herausgebildet, die solche Wort-Nachbarschaften wenigstens teilweise wiederherstellen. Es werden heute unterschieden: die glattalphabetische, die nischenalphabetische, die nestalphabetische Anordnung (mit Beispielen Engelberg/Lemnitzer 2009, 148; Schlaefer 2009, 87) und, nicht-alphabetisch, die Anordnung nach Begriffen,
Das Wort in der Lexikografie
499
Wort- oder Sachfeldern, z. B. Dornseiff/Quasthoff 2004. Während bei glattalphabetischer Anordnung zu jedem Lemma ein Wortartikel existiert und die Lemmata strikt alphabetisch angeordnet sind, präsentieren nischen- und nestalphabetische Ordnung den Wortartikel mit einem Haupt- und mehreren, in den fortlaufenden Wortartikeltext integrierten, lediglich fettgedruckten Sublemmata. Dadurch wird erreicht, dass Komposita und Ableitungen in der Nähe des Basislexems stehen, und es wird auch Druckraum gespart. Die nischenalphabetische Ordnung fügt sich dabei dennoch dem Alphabet und fasst nur solche Sublemmata unter einem Hauptlemma zusammen, die ihm alphabetisch nachfolgen, wohingegen die nestalphabetische Ordnung das Alphabet zugunsten der Wortbildung durchbricht, z. B. folgen im Wortartikel zum Hauptlemma Buch die Sublemmata Buchauflage, Buchdrucker, Buchschmuck usw. Erst danach folgt das Hauptlemma Bücherregal. Mehrwortausdrücke werden oft als Sublemmata behandelt. Solche Probleme hat die Online-Lexikografie kaum noch, denn sie ist nicht mehr auf das Alphabet als Findehilfe angewiesen (ausführlicher Engelberg/Lemnitzer 2009, 151–154). Eine Anordnung nach Sachgruppen oder semantischen Feldern, wie sie Dornseiff/Quasthoff 2004 aufweisen, muss im gedruckten Medium von einem alphabetischen Register ergänzt werden, um das einzelne Wort in seiner semantischen Klasse auffindbar zu machen. Es wurde schon darauf hingewiesen, dass die Menge der Lemmata eines Wörterbuchs nicht mit dem Wortschatz der zugehörigen Sprechergemeinschaft (vgl. Schnörch in diesem Band) identisch ist. Woran liegt es, dass ein Wörterbuch niemals den gesamten Wortschatz einer gewählten Kommunikationsdomäne abdeckt? Die wichtigsten Gründe sind: In Texten wie vermutlich auch in Gesprächen werden etwa die Hälfte aller vorkommenden Wörter nur einmal gebraucht (sog. Hapax Legomena), sind also nicht usuell; Wörterbücher erfassen i. d. R. aber nur den usuellen Wortschatz ab einer bestimmten Häufigkeit und Verbreitung. Es werden auch nicht alle usuellen Wörter aufgenommen, sondern nur diejenigen, die die Nutzer vermutlich nachschlagen wollen. Somit entfallen alle Komposita und Ableitungen, deren Bedeutung pro blemlos aus ihren Bestandteilen erschlossen werden kann, z. B. Küchentür, Schlafzimmertür usw. Haustür jedoch wird aufgenommen, weil damit eine ganz bestimmte Tür eines Hauses bezeichnet wird und weil die Bedeutung des Kompositums nicht aus den Elementen erschlossen werden kann; dieses Kompositum ist ‚lexikalisiert‘, d. h. im mentalen Lexikon als Einheit gespeichert. Ähnlich: Rollstuhl wird aufgenommen, Holzstuhl, Drehstuhl eher nicht. Die deutsche Sprache wird beständig durch neue Wortbildungen bereichert, die kein Wörterbuch vollständig einfangen kann. Selbst usuelle und lexikalisierte Wörter fehlen oft deshalb, weil der Herstellungsprozess eines Wörterbuchs der Wortschatzentwicklung immer ein Stück hinterherhinkt. Auswahlkriterien wie die eben genannten unterliegen selbst einem historischen Wandel, v. a. wenn es sich nicht um sprachsystematisch begründbare, sondern um bewertende Kriterien handelt wie die ‚Wörterbuchwürdigkeit‘. Als wörterbuchunwürdig galten z. B. in verschiedenen Epochen des Deutschen: Fremdwörter, Anglizismen, umgangssprachliche Wörter (‚des Pöbels‘), Wörter der obszönen Stilschicht, Tabu-
500
Ulrike Haß
wörter/Sexualwortschatz, Wörter der Zeitungssprache, Wortneuschöpfungen der feministischen Sprachkritik (zum Wandel der Auswahlkriterien des wörterbuchwürdigen Wortschatzes vgl. Gouws u. a. 2013, 2). Wörter und Wortschatz, wie sie im Wörterbuch wahrgenommen werden, sind verglichen mit ihrem Vorkommen ‚in der freien Wildbahn‘ auf vielfältige Weise selektiert, als Lemma normalisiert und in der Makrostruktur domestiziert. Waren die Motive dafür in früheren Jahrhunderten eher normativer Natur, weil Wörterbücher den vorbildlichen Wortgebrauch bzw. das Wertvolle am Wortschatz vorführen sollten (Haß 2001), so sind es heutzutage die Interessen und Fähigkeiten der Nutzerinnen und Nutzer, die für wenig Geld auf knappsten Raum, aber übersichtlich, schnell und ohne größeres Nachdenken das eine Wort mit Erläuterungen finden wollen, die die Selektions- und Normalisierungsmaßnahmen der Lexikografen leiten (Müller-Spitzer 2014). Das Wörterbuch als ‚Wörterzoo‘ kann man als armseliges oder sogar irreführendes Surrogat der realen Wörtervielfalt ablehnen; man kann es aber auch als komplexitätsreduzierenden Zugang zum Inventar lexikalischer Ausdrucksmöglichkeiten schätzen, der – anders als Text- und Gesprächskorpora – auch linguistischen Laien zur Verfügung steht.
4 Das Wort im Wortartikel Dieser Abschnitt vergleicht den ‚realen‘ Gebrauch eines Worts mit der Repräsentation dieses Gebrauchs im einzelnen Wortartikel und fokussiert die lexikografischen Bemühungen, das o. g. Dilemma zu lösen, das darin besteht, die im Gebrauch zusammenspielenden Wörter voneinander zu isolieren und die unzähligen einander ähnlichen, aber doch nie völlig übereinstimmenden Gebrauchsakte in einem Wortartikel abstrahierend zusammenzufassen. Wortartikel sind sehr spezielle Texte, die mehr oder weniger komprimierte Erläuterungen zu vorab festgelegten Eigenschaften des Worts zu einem ‚Bild‘ verbinden. Manchmal erzählen Wortartikel Geschichten, in denen das Wort nicht der Protagonist, sondern vielmehr das Instrument ist, dessen sich Sprecher(gruppen) so und so bedienen, um bestimmte kommunikative Ziele zu erreichen. Metaphern wie ‚das Wort X setzte sich gegen Y durch‘, ‚Wörter breiten sich aus, dringen in eine Sprache ein‘ usw. dürfen nicht vergessen machen, dass nur die Sprachverwender handeln und sich verhalten können, nicht die Wörter, die in der sprachphilosophischen Tradition von Platon über W. v. Humboldt bis zu Wittgenstein zum Instrumentarium der Sprache gehören. Ein Wortartikel beschreibt, wie Millionen von Sprechern wiederholt mit einem bestimmten Wort als Instrument gehandelt haben, welche Formen und welche Funktionen das Wort dabei angenommen hat. Die Beschreibung kürzlich vergangener Wortverwendungsakte gibt zugleich das gegenwärtig den Sprechern zur
Das Wort in der Lexikografie
501
Verfügung stehende Potenzial an, das die Basis eines jeden neuen Gebrauchsaktes liefert (vgl. Paradis in diesem Band). Im gedruckten Wörterbuch folgt der Aufbau des Wortartikels bestimmten, vom Nutzer nicht veränderbaren Prinzipien, die oft nach den Eigenschaften der Wortarten differenziert sind, d. h. dass Wortartikel zu Nomina, Verben und Adjektiven usw. partiell anders aufgebaut sind. Üblicherweise, aber keineswegs notwendigerweise bestehen Wortartikel aus einem Kopfteil mit eher formalen Angaben zu Genus, Plural- und Genitivbildung sowie Herkunft und einem ausdifferenzierteren Bedeutungsteil, der neben semantischen auch pragmatische und syntaktische Angaben enthält. Die Zahl aller prinzipiell möglichen Angabearten ist recht groß (bis über 200; Engelberg/Lemnitzer 2009, 157), so dass Lexikografen auswählen müssen, welche zur Realisierung ihres Wörterbuchkonzepts erforderlich sind. Die Struktur des Wortartikels lässt sich grafisch als Baum darstellen (vgl. Engelberg/Lemnitzer 2009, 161) und muss in der heutigen lexikografischen Praxis auch so definiert sein, dass sie in einer (relationalen) Datenbank bzw. in XML modelliert werden kann. Für Nutzerinnen und Nutzer ist die Lektüre eines Wortartikels umso informativer, je besser sie die diversen Arten von Strukturanzeigern im Artikel dekodieren können; dazu gehören Schriftart und -schnitt, nicht-sprachliche Symbole, Abkürzungen, Klammern und explizite Kommentare, deren Bedeutung in einleitenden Textteilen eines Wörterbuchs immer erklärt wird. Man muss kein Pessimist sein, um anzunehmen, dass der normale Nutzer nur einen Bruchteil des Informationsangebots eines gedruckten Wortartikels (korrekt) aufnimmt. Elektronische, v. a. Online-Wörterbücher können so angelegt sein, dass der Dekodierungsaufwand für Nutzer geringer ausfällt. Im Hinblick auf das ‚Bild‘ vom Wort, das ein Wortartikel vermitteln kann, ist die Möglichkeit des Ein- und Ausblendens einzelner Angabearten aber der entscheidendere Unterschied (‚Benutzeradaptivität‘). Beim Oxford Advanced Learner’s Dictionary kann die Nutzerin in der App-Version einstellen, welche Teile des Wortartikels standardmäßig verborgen werden sollen („pronunciation, pictures, synonyms and opposites, examples, cross-references, Help notes, Origin notes, idioms, phrasal verbs“); nicht abwählbar sind mithin die Bedeutungsumschreibungen und Angaben zu syntagmatischen Verknüpfungen (Kollokationen). Die ausgeblendeten Angaben können im Einzelfall aber rasch wieder sichtbar gemacht werden. Auch hier wird das Gesamtbild eines Worts also eher selten wahrgenommen, sondern immer nur einzelne seiner Eigenschaften. Offenbar wollen Wörterbuchnutzer nicht nur die Präsentation des von anderen isolierten Worts, sondern sie wollen von ihm auch nur bestimmte, wechselnde Einzelheiten wissen. Befürworter einer automatisierten, nicht-interpretierenden Lexikografie finden in diesem Nutzerverhalten ein Hauptargument. Nachfolgend werden vier Aspekte ausgewählt, um zu veranschaulichen, wo das einzelne Wort die ihm in dieser Betrachtung gesetzten Grenzen überschreitet und welche Lösungswege Lexikografinnen und Lexikografen entwickelt haben, um im eingezäunten Gehege des Wortartikels die Grenzüberschreitungen sichtbar werden zu lassen.
502
Ulrike Haß
4.1 Ambiguität Ein Wort erhält in einem konkreten Verwendungszusammenhang eine Bedeutung: Sie erhielt minutenlangen Beifall, in einem anderen Zusammenhang kann dasselbe Wort etwas anderes bedeuten: Die Idee einer Bergwanderung fand in der Gruppe heute keinen Beifall. Im ersten Beispiel ist der Beifall in bestimmter Weise hörbar und im zweiten Beispiel nicht bzw. auf unbestimmte Art anders. Wenn im lexikografischen Prozess eine Vielzahl von Gebrauchsakten des Worts Beifall verglichen werden, lassen sich semantische Klassen bilden, die anschließend abstrahierend als Bedeutungsvarianten (Einzelbedeutungen) beschrieben werden. In der lexikografischen oder einer anderen sprachreflexiven Distanz erscheint ein Wort also mehrdeutig (ambig), obwohl es in der ‚freien Wildbahn‘ des Gebrauchs üblicherweise hinreichend eindeutig ist (vgl. Paradis in diesem Band). Wenn man in Fällen wie Beifall nicht von zwei Wörtern ausgehen möchte, bei denen lediglich die Wortformen übereinstimmen, dann ist von einer semantischen Ambiguität auszugehen. Daher ist ein Wörterbuch nicht, wie Jacob Grimm behauptete (s. o.), die alphabetische Verzeichnung der Wörter einer Sprache, sondern ein Verzeichnis von Lemmata, und oft behandelt der unter einem Lemma angeordnete Wortartikel nicht ein Sprachzeichen, sondern mehrere. Ein Wörterbuch ist das möglichst geschickte Verzeichnis der Bedeutungsvarianten einer Sprache. Bei semantischer Ambiguität wird zwischen Polysemie und Homonymie unterschieden. Polyseme Wörter haben mehrere, semantisch zusammenhängende, aber unterscheidbare Bedeutungsvarianten, z. B. hat Beifall zwei Bedeutungsvarianten (im Duden Wörterbuch online): 1. Bekundung von Zustimmung oder Begeisterung durch Klatschen, Trampeln, Rufen u. a.; Applaus; 2. Bejahung, Zustimmung.
Das aus fünf Morphemen bestehende Kompositum Beifallsbezeigung hat nur eine Bedeutung. Das maskuline Simplex Fall hingegen hat im selben Wörterbuch sieben Bedeutungsvarianten, wenn man die Untervarianten (1a, 1b; 2a, 2b) mitzählt. Hinzu kommt noch das Wort Fall mit Genus Neutrum, dessen Bedeutung (‚Seil zum Hochziehen und Herunterlassen eines Segels‘) aber mit der von Fall mit maskulinem Genus in keiner Weise zusammenhängt; solche Fälle nennt man Homonyme, selbst wenn u. U. beide auf eine lange zurückliegende gemeinsame etymologische Wurzel zurückgeführt werden können – diese Wurzeln sind den Wortverwendern nicht zugänglich und oft ohnehin unsicher. Bei homonymen Wörtern liegt eine in den Augen der Sprachverwender ‚zufällige‘ Übereinstimmung in Lautung und/oder Schreibung vor. Aber Homonyme sind häufig auch an grammatischen Unterschieden festzumachen. Sie werden im Wörterbuch als getrennte Lemmata angesetzt, etwa: I. Fall, der … II. Fall, das … Die Beispiele Fall, Beifall, Beifallsbezeigung zeigen prototypisch, dass morphologisch einfache Wörter, insbesondere die lange im täglichen Gebrauch befindlichen, in
Das Wort in der Lexikografie
503
höherem Grade polysem sind als morphologisch komplexe Wörter. Wie viele Bedeutungsvarianten Lexikografen zu erkennen glauben und dann im Wortartikel mit Zahlziffern (1., 2.) oder Buchstaben (a., b.) ansetzen, hängt nicht nur von der jeweils zu beschreibenden Varietät und dem Zweck des Wörterbuchs ab, sondern auch von seinem Umfang, d. h. vom Grad der Körnigkeit, mit der die Lexikografinnen das semantische Spektrum eines Worts darstellen können; in umfangreicheren Wörterbüchern ist das semantische ‚Bild‘ des Worts feinkörniger und differenzierter als etwa in einem schmalen Spezialwörterbuch. Die Vorstellung vom Wort als einem Sprachzeichen mit je einer Form- und einer Inhaltsseite ist nur richtig im Hinblick auf einen einzelnen Gebrauchsakt. Der Wortartikel beschreibt auch gar nicht ein Wort, wie das Lemma als ‚Textüberschrift‘ des Wortartikels vielleicht suggeriert, sondern er beschreibt immer viele, von den Lexikografen nach semantischen Gemeinsamkeiten klassifizierte Gebrauchsakte. Dies führt u. a. dazu, dass das Wort als Sprachzeichen je nach morphologischer Komplexität zwar eine Formseite, aber meist mehrere Inhaltsseiten, d. h. ein aufgefächertes semantisches Potenzial hat. Das Wörterbuch erlaubt dem einzelnen Wort also, viele und vieles mehr zu sein, als es im konkreten Gebrauchsakt sein darf. Computergenerierte Wörterbücher sind heute noch nicht besonders gut im Erkennen semantischer Ambiguität, so dass sie zur semantischen Homogenisierung tendieren. Außerdem fehlt ihnen die erläuternde Umschreibung der Bedeutungen; stattdessen werden verschiedene Kontextarten aufgelistet.
4.2 Syntagmatische und paradigmatische Relationen Gehen wir in diesem Abschnitt von einem Wortartikel aus, der ein Lemma wie Beifall mit mehreren Bedeutungsvarianten beschreibt bzw. erläutert. Dieses Wort kommt im gegenwärtigen Sprachgebrauch nicht mit völlig beliebigen anderen Wörtern verbunden, sondern besonders oft und typischerweise in folgenden Syntagmen vor (Folgendes nach DeReKo 2013-II): vereinzelter Beifall lebhafter Beifall Beifall bei [gefolgt von der Bezeichnung eines Kollektivs wie den Abgeordneten oder einer Partei wie der CDU] Beifall von [gefolgt von einem Personennamen] anhaltender Beifall demonstrativer Beifall pflichtgemäßer Beifall starker Beifall frenetischer Beifall Beifall zollen Beifall finden
504
Ulrike Haß
Es ist auch zu erkennen, dass die Syntagmen sich oft eindeutig einer bestimmten Bedeutungsvariante zuordnen lassen; Beifall finden gehört der Bedeutungsvariante 2 von Beifall an (s. o.), während lebhafter Beifall das Wort in der Bedeutungsvariante 1 realisiert. Das Wort heischen ist ebenfalls zweifach polysem (Duden Wörterbuch online). Die Sprecher gebrauchen es typischerweise in folgenden Wortverbindungen: Mitleid heischen(d) Aufmerksamkeit heischen(d) Ehrfurcht heischen(d) Beifall heischend sowie beifallheischend
Daneben verwenden Sprecher diese Wörter aber auch unvorhersagbar anders, z. B. Beifall erzielen, billiger Beifall. D. h. sie sind nicht völlig von den typischen Syntagmen (Kollokationen) ‚gefangen‘, sondern ‚dürfen‘ variieren. Variiert wird zudem auch die Form des Lemmas; der Infinitiv heischen ist nur die Normal- oder Zitierform, und die Angaben zu diesem Verb gelten natürlich auch für alle anderen vierzehn belegten Flexionsformen (heischt, heischte, geheischt usw.). Die in den Beispielen deutlich werdende enge syntagmatische Verbindung des Einzelworts in einer Bedeutungsvariante zu bestimmten anderen Wörtern kann in einem Wortartikel mittels sogenannter syntagmatischer Angaben bzw. Kollokationsangaben sichtbar gemacht werden, sodass das Einzelwort in einer bestimmten Bedeutungsvariante nicht länger von seinen syntagmatischen Nachbarwörtern isoliert erscheint. Im Duden Wörterbuch online wird diese Angabe (irrigerweise) unter die Überschrift „Beispiele“ gesetzt, die je Bedeutungsvariante wiederholt wird: Beifall […] Beispiele: 1) starker, anhaltender, brausender, herzlicher, schwacher Beifall der Beifall bricht los, hält an Beifall klatschen viel Beifall ernten Beifall auf offener Szene (spontaner Beifall als unmittelbare Reaktion) 2) seine Ansicht fand [keinen] Beifall sich Beifall heischend (gehoben; Beifall erwartend, fordernd) umsehen heischen […] Beispiele: a) etwas heischt Zustimmung ein Respekt heischender Blick b) Hilfe, Mitleid heischen
Das Wort in der Lexikografie
505
Betrachtet man diese typischen Wortverbindungen, wird noch mehr deutlich: Die Verbindungen von Beifall und heischen sowie heischen in Verbindung mit Mitleid, Respekt usw. evozieren gemeinsam einen gehobenen oder veralteten Stil; man denkt vielleicht an einen Roman aus dem 19. Jahrhundert. Andere Verbindungen von Beifall wecken Assoziationen an Theater- oder Musikaufführungen. Die nicht im Duden, aber im Korpus belegte Verbindung Beifall bei …/von… (s. o.) zeigt eine Zugehörigkeit zu parlamentarischen Debatten. Falls ein Wörterbuch nicht nur solche „Beispiel“Syntagmen, sondern syntaktisch vollständige Zitate mit Angabe des Herkunftstextes enthält (wie das DWB), wird das Bild des Worts in seinen Vergemeinschaftungen noch bunter und detaillierter. „der verstand ist zum beifalle sehr geneigt. Kant 8, 34“ zitiert Jacob Grimm im DWB beim Lemma Beifall, was auch damals sicher eine untypische Gebrauchsweise war, aber wer beginnt da nicht unweigerlich, über die Vorund Nachteile von Zustimmung nachzudenken? – Syntagmatische Angaben weisen auf eine bestimmte Art über die Grenzen des Wörterbuchs hinaus. Eine andere Art sind die Sinnverwandtschaften oder paradigmatischen Relationen (s. Storjohann in diesem Band), die verschiedene Wörter untereinander verknüpfen, obwohl sie nicht zwangsläufig im gleichen Satz- oder Textzusammenhang stehen. Es lässt sich wie bei den Syntagmen anhand realen Sprachgebrauchs in Korpora zeigen, dass Beifall mit den folgenden Wörtern annähernd synonym verwendet wird bzw. dass die Wörter dieses Wortfelds füreinander eingesetzt werden, etwa um den Ausdruck zu variieren oder um das eine Wort mit dem anderen zu erklären: Applaus, Händeklatschen, Huldigung, Jubel, Ovation, Akklamation, Lob, Zustimmung, Zuspruch, Anerkennung, Anklang, Echo usw. (vgl. Wortschatz-Portal, Lemma Beifall), abfordern, begehren, verlangen, abverlangen, fordern, postulieren, usw. (vgl. ebd. Lemma heischen).
Zu vielen Wörtern lassen sich zudem Felder mit Gegensatzwörtern (Beifall – Ablehnung; heischen – ablehnen, verweigern) finden, etwa in argumentativen oder mit Gegenüberstellungen arbeitenden Äußerungen, z. B. Er sah Beifall heischend um sich, aber die Zustimmung wurde ihm verweigert und sein Vorschlag wurde abgelehnt. Ferner hängt das einzelne Wort semantisch mit Wörtern zusammen, die Ober- oder Unterbegriffe (Hyperonyme, Hyponyme) bezeichnen. So ist Zustimmung genaugenommen kein synonymes, sondern ein hyperonymes Wort zu den hyponymen Wörtern Beifall, Applaus und Bejahung. Die Existenz paradigmatischer Wortfelder ist zwar weniger unmittelbar an der Oberfläche des Sprachgebrauchs abzulesen, als es bei den syntagmatischen Beziehungen der Fall ist. Dennoch ist ihre Existenz im ‚realen‘ Sprachgebrauch unumstritten und empirisch belegbar. Wie gehen die Wörterbücher mit diesen Relationen um? Erstens sind Synonyme das einfachste Mittel, die Bedeutung eines Worts zu erklären und so erklärt auch das Duden Wörterbuch online die zweite Bedeutung von Beifall mit: „Bejahung, Zustimmung“, d. h. mit zwei Synonymen. Zweitens gibt es
506
Ulrike Haß
eine Angabeart namens „Synonyme“, „Sinnverwandte“, „Relationen“ o. ä. Im OnlineWörterbuch elexiko werden „Sinnverwandte Wörter“ weiter differenziert, um z. B. Synonyme von Antonymen und anderen Arten der Sinnverwandtschaft abzugrenzen. Drittens werden sinnverwandte Wörter, gleichgültig, wo im Wortartikel sie genannt sind, als Ausgangspunkt für Verweise (→) oder Hyperlinks auf andere Lemmata und eine der dort behandelten Bedeutungsvarianten genutzt. Pfeile oder eine kleine Hand mit ausgestrecktem Zeigefinger weisen ganz bildlich aus dem Gehege des Wortartikels hinaus zu einem anderen Wortartikel und meist zu einer der dort erläuterten Bedeutungsvarianten hin. Das Wörterbuch aber verlassen Verweise typischerweise nicht. Die in diesem Abschnitt behandelte semantische In-Beziehung-Setzung des einen Wörterbuch-Worts zu anderen Wörtern beschreibt den Fall der interpretierenden Lexikografie und setzt sprachwissenschaftliche Expertisen voraus. Auch automatisch generierte Wörterbücher präsentieren oft lexikalische Relationen per Links auf andere Wörter; diese sind aber semantisch nicht präzisiert, sondern basieren auf statistischen Textanalysen. Man vergleiche entsprechende Angaben in WortschatzPortal (automatisch generiert) und elexiko (lexikografisch interpretiert).
4.3 Text und Diskurs Die in den letzten Jahrzehnten entstandene Diskurslinguistik (s. Gür-Şeker in diesem Band) sowie die auch von Lexikografen wie Wörterbuchnutzern begeistert angenommenen Möglichkeiten elektronischer Medien haben Wege aufgezeigt, die lexikografische Beschreibung des Worts mit Diskursen, Text- und Gesprächswelten außerhalb des Wörterbuchs zu verbinden und so einen herausragenden Beitrag zur Lösung des o. g. Dilemmas zu leisten. Der Begriff des Diskurses ist u. a. notwendig, um auf Sprachgebräuche, die über einzelne Texte oder begrenzte Textmengen hinausgehen, Bezug zu nehmen. Selbst wenn aus methodischen Gründen Diskurse i. d. R. anhand definierter Textmengen (Korpora) untersucht werden können, wird der Diskurs als etwas Umfassenderes verstanden, als etwas, das das Denken, das Fühlen und die Einstellungen bzw. die Mentalitäten von Sprechern beeinflusst. Diskurse reichen sozusagen bis in die Köpfe hinein und können anhand des Sprachgebrauchs rekonstruiert werden. Solche Rekonstruktionen haben eine ganze Reihe verschiedener Aspekte eines Diskurses zum Thema, unter denen sich Schlüsselwörter, diskurstypische Syntagmen und metaphorische Ausdrücke einer wortbezogenen Betrachtung in wörterbuchähnlichen Formen anbieten. Das elektronische ‚Wörterbuch‘ zum Schulddiskurs 1945–55, zugänglich über das Portal OWID, erläutert die Rolle von Schlüsselwörtern für einen Diskurs folgendermaßen:
Das Wort in der Lexikografie
507
Dieses Wörterbuch ist das Nachschlagewerk zu der im Jahr 2005 erschienenen Untersuchung zum Schulddiskurs in der frühen Nachkriegszeit. Es fasst die lexikalisch-semantischen Ergebnisse dieser Untersuchung in Form von Wortartikeln zusammen. Diese Wortartikel beschreiben diejenigen Wörter nach lexikographischen Prinzipien, die gleichsam das lexikalische Gerüst des Schulddiskurses darstellen. […] Die Schlüsselwörter, in deren Bedeutung sich dieser Diskurs verdichtet, sind demnach die lexikalischen Erscheinungen des Umbruchs nach 1945. Das bedeutet natürlich nicht, dass der hier verzeichnete Wortschatz, von Angst bis Zebrakleidung, von Befehl bis treu, von Abendland bis Zukunft, ein neues, erst nach 1945 im deutschen Wortschatz aufgekommenes Vokabular darstellt. Vielmehr handelt es sich um denjenigen Wortschatzbereich, der hinsichtlich Frequenz oder Funktion den Schulddiskurs der frühen Nachkriegszeit repräsentiert. (http://www.owid.de/wb/disk45/einleitung.html ).
Die Schlüsselwörter werden lexikografisch so beschrieben, dass sie als Fenster in den Diskurs fungieren: Die Wortartikel sind oft deutlich länger als in herkömmlichen Bedeutungswörterbüchern und verzichten weitgehend auf Mittel der Textverdichtung, d. h. sie sind lesbarer. Der Wortartikel-Text enthält Verweise zu anderen Wörtern desselben Diskurses, so dass der Diskurs als Netz anschaulich wird. Vor allem aber geizen die Wortartikel nicht mit gut gewählten Zitaten, denn die Zitate vermitteln, wie das Schlüsselwort im Diskurs verankert ist und auf welche Weise es dort von welcher Sprechergruppe gebraucht wird. Zuguterletzt kann der dem Zitat beigegebene Quellennachweis per Hyperlink in das Gesamtquellenverzeichnis oder gar unmittelbar in diese Quelle führen, die Bestandteil des den Diskurs repräsentierenden Textkorpus ist. Letzterem sind zwar oft urheberrechtliche Grenzen gesetzt, entscheidend ist aber die lexikografische Innovation, die Diskurs und Schlüsselwort in mehrfacher Hinsicht mit einander verbindet (vgl. Kämper 2006). Harm (2005) hat am Beispiel der Lemmata Frau und Fräulein und der Neubearbeitung des DWB gezeigt, wie eine diskurslinguistische Perspektive die bisherige wortgeschichtliche Sicht des von den Brüdern Grimm begründeten Deutschen Wörterbuchs deutlich erweitert und sogar sachlich korrigiert. Wörter als Knoten eines Diskursnetzes zu verstehen geht weit über die oben erläuterten Wege, das Wort in seinen syntagmatischen und paradigmatischen Bezügen zu beschreiben, hinaus. Da Wörterbücher seit mittlerweile etlichen Jahrzehnten auf der Basis immer größer werdender und besser annotierter (elektronischer) Textkorpora entstehen und insofern die Kluft zwischen Wörterbuch und realem Sprachgebrauch schon deutlich geringer worden ist, als sie es bis in die erste Hälfte des 20. Jahrhunderts war, liegt der Gedanke nahe, das elektronische ‚Wörterbuch‘ enger mit dem zugrundeliegenden Textkorpus zu verknüpfen. Hier kann den Nutzern das Angebot gemacht werden, von einer bestimmten Bedeutungsvariante ausgehend das Wort in der ‚freien Wildbahn‘ seiner Textumgebungen zu beobachten oder auch ausgehend von einer einzelnen Angabe im Wortartikel nachzuprüfen, ob die dort gegebene Information mit einem bestimmten Sprachgebrauch übereinstimmt. Dabei ist nicht nur die Einbettung in einen Text bzw. ein Gespräch wichtig, sondern auch die Informationen über Thema, Textsorte, Zeit, Raum und Funktion der betreffenden Textquelle, die im Korpus stets
508
Ulrike Haß
mitgenannt sind. Der Wechsel vom Wortartikel in das Korpus liegt bei Angaben zu pragmatischen Merkmalen (s. Engelberg/Lemnitzer 2009, 157) eines Worts besonders nahe, z. B. für Fachgebietsangaben, Stilschichtangaben, Textsortenangaben, Angaben zum Medium („gesprochene Sprache“), Konnotationsangaben („abwertend“), Normierungsangaben („besser“, „nicht gebräuchlich“) sowie Angaben zur sprachkritischen Relevanz (vgl. z. B. den „Besonderen Hinweis“ zu den Lemmata Zigeuner und Erziehungsurlaub in Duden Wörterbuch online). Wenn ein Wörterbuch mit einem Korpus verlinkt ist, ist es entscheidend für die Einordnung der Erweiterung, die ein Wort dadurch erfährt, ob es sich um eben dasjenige Korpus handelt, das die Lexikografen zur Erarbeitung ihrer Wortartikel benutzt haben (z. B. elexiko) oder ob das Korpus nachträglich erstellt bzw. dem Wörterbuch elektronisch zugeordnet wurde (z. B. im Digitalen Wörterbuch der deutschen Sprache). In letzterem Fall stimmen die Wortgebräuche des Wörterbuchs und des Korpus nicht immer hundertprozentig überein. Wenn Nutzerinnen und Nutzer nicht über ein diesbezügliches Hintergrundwissen verfügen, könnten sie falsche Schlüsse ziehen. Es gibt Versuche, Wörterbuch und Korpus so zu verbinden, dass Nutzer beides über dieselbe Nutzerwebseite und ein und dieselbe Suchmaske präsentiert erhalten (Asmussen 2013; umgesetzt in OWID als „Korpussuche“). Man spricht hier nicht mehr von Wörterbuch, sondern von lexikalischen Informationssystemen, die unterschiedliche Datenbestände für wortbezogene Abfragen bündeln. Als Wörterbuchportal wird hingegen der Fall bezeichnet, bei dem unterschiedliche Wörterbücher miteinander verknüpft und zum Teil über ein und dieselbe Suchmaske nutzbar sind; am bekanntesten sind OWID und Wörterbuchnetz. In Wörterbuchportalen wird das Wort nicht mehr in einem Wörterbuch beschrieben, sondern in mehreren, unabhängig voneinander entstandenen, und die Nutzer sind frei, beliebig zwischen ihnen hin und her zu wechseln (dazu Klosa/Lemnitzer/Neumann 2008). Kombinationsprodukten aus Wörterbuch und Korpus, Wörterbuch und Wörterbuch wird zumindest in den textbezogenen Wissenschaften die Zukunft gehören. Man darf gespannt sein, wie sich das Bild, das Wörterbuchnutzerinnen und -nutzer vom Wort im Allgemeinen haben, durch diese medialen Grenzüberschreitungen verändern wird. Vermutlich wird das einzelne Lemma zwar noch den Anhalts- und Einstiegspunkt in die unübersichtlicher werdende ‚freie Wildbahn‘ des Sprachgebrauchs‘ abgeben, darüber hinaus aber wird die Vorstellung vom Wort tendenziell dynamischer und vager werden.
4.4 Eigenes Wort oder fremdes Wort In diesem Abschnitt soll beleuchtet werden, wie der Kontakt zwischen verschiedenen Sprachen bzw. ihren Sprechern das Bild vom Wort in Wörterbüchern prägt und welche Wege Lexikografen gehen, um die ‚Wanderschaft‘ von Wörtern über nationale und
Das Wort in der Lexikografie
509
sprachliche Grenzen hinweg erkennbar zu machen oder im Gegenteil tendenziell zu verbergen. Handelt es sich beispielsweise bei Schule, school, école, scuola und szkoła um ein Wort oder um verschiedene? In Wörterbüchern wird diese Frage an zwei Orten thematisiert: in der Makrostruktur, d. h. im Zusammenhang der Entscheidung, welche Lehn-, Fremd- oder Fachwörter in ein Wörterbuch aufgenommen werden sollen, und in der Mikrostruktur bei der Angabe zu Herkunft bzw. Etymologie des Worts. Wie viel Raum und Aufmerksamkeit dieser Angabe von den Lexikografen und Lexikografinnen zugestanden wird, hängt zunächst vom Wörterbuchtyp ab. Etymologische und Herkunftswörterbücher wie Kluge (2011) sowie historische Bedeutungswörterbücher wie DWB und Deutsches Fremdwörterbuch (DFWB) behandeln Wortgeschichten und Wortverwandtschaften am ausführlichsten, während Rechtschreib- und allgemeine Wörterbücher wie Duden Wörterbuch online nur bei Fremd- und jüngeren Lehnwörtern die Herkunftssprache, eventuell noch die eine oder andere historische Wortform angeben. Zunächst ein Beispiel für eine eher ausführliche Herkunftsangabe zum Lemma Wolle (DWB Bd. 30, Sp. 1317/1318, die Lieferung mit diesem Artikel erschien 1951):
Abb. 1: ausführliche Herkunftsangabe zum Lemma Wolle
Diese komprimierte Form des Textes lässt sich wie folgt paraphrasieren und auf Aussagen zu einer die Einzelsprachen übergreifenden Identität des Worts hin fokussieren: Wolle ist ein allen germanischen Sprachen gemeinsames Wort, für das man einen indoeuropäischen Ursprung rekonstruieren kann. Anschließend werden Wortformen verschiedener historischer Sprachstufen des Oberdeutschen, Niederdeutschen, Niederländischen, Friesischen, Englischen, Dänischen, Schwedischen und Norwegischen aufgeführt und die indoeuropäische Grundform konstruiert, erkennbar an dem vorgesetzten Sternchen. Anschließend werden die Wortformen für ‚Wolle‘ in weiteren Sprachen aufgeführt, die auf dieselbe Grundform zurückgehen: Sanskrit, Avestisch, Altslawisch, Serbokroatisch, Litauisch, Lettisch, Altpreußisch, und schließlich Lateinisch und Griechisch. Dann wird auf eine mögliche, aber nicht erwiesene Verwandtschaft von Wolle mit einer griechischen, lateinischen, armenischen und altgermanischen
510
Ulrike Haß
Bezeichnung für die Eigenschaft ‚kraus‘ bzw. für ‚Vlies‘, ‚Filz‘ hingewiesen. Hingegen ist unklar, ob bedeutungsähnliche Wortformen der keltischen Sprachen, im Einzelnen werden die mittelirische, die cymbrische und die bretonische genannt, ebenfalls der Wurzel von Wolle, oder nicht eher einer anderen, ähnlichen zugeordnet werden müssen. Dann wird noch der Versuch gemacht, die rekonstruierte indoeuropäische Wurzel von Wolle auf eine noch ältere indoeuropäische Wurzel zurückzuführen, deren mögliche Bedeutung aber nicht einmal mehr vermutet werden kann.
Das folgende Beispiel zeigt die Geschichte eines jüngeren deutschen Worts, Couch, zunächst im komprimierten Original des Deutschen Fremdwörterbuchs (DFWB), wo die Geschichte von der Gegenwart ausgehend zurück dargestellt wird. Dann folgt eine Paraphrase in umgekehrter, chronologischer Richtung vom frühestmöglichen Zeitpunkt der Wortexistenz bis heute, um wiederum die Frage der übereinzelsprachlichen Identität des Worts zu fokussieren.
Abb. 2: die Geschichte eines jüngeren deutschen Worts, Couch. Aus: DFWB Bd. 3 (1997), Auszug ohne Belegteil
Paraphrase: Am Anfang der Geschichte stand das lateinische Verb collocare, bei dem unschwer zu erkennen ist, dass es aus den lateinischen Wörtern locus ‚Ort‘ und co(m) ‚gemeinsam‘ zusammengesetzt ist. Das von den Römern gebrauchte Verb collocare bedeutet ‚hinstellen, hinsetzen, hinlegen‘ und wurde von Sprechern einer oder mehrerer der altfranzösischen Sprachen (9. bis 14. Jahrhundert) übernommen und an ihre Sprache angeglichen, so dass das Wort die Form (soi) couchier mit der Bedeutung ‚sich niederlegen‘ erhielt. Im späteren Französischen wurde dies zu (se)
Das Wort in der Lexikografie
511
coucher ohne Bedeutungsveränderung. Neben dem Verb existierte bereits im Altfranzösischen und unverändert im späteren Französischen das Nomen couche für ‚Bett, Lager‘. Man kann annehmen, dass es vom Verb abgeleitet wurde, also jünger ist als das Verb. In altfranzösischer Zeit wird das Nomen couche ins damalige Englische (Mittelenglisch, 12. bis 15. Jahrhundert) übernommen und anschließend irgendwann als couch in der Schreibung und vermutlich auch in der Aussprache ans Englische angeglichen. Über das, was mit dem Wort in den nächsten Jahrhunderten geschieht, wird hier nichts mitgeteilt, weil es aus deutscher Perspektive unwichtig ist. Erst zu Beginn des 20. Jahrhunderts wird das Wort als Anglizismus Couch eingeführt und zur Bezeichnung eines Möbelstücks gebraucht, das sich zunächst in bestimmter Weise von den möglicherweise schon länger bekannten Möbeln Chaiselongue, Diwan, Kanapee, Sofa unterschied. Diese bedeutungsverwandten Bezeichnungen können im selben Wörterbuch nachgeschlagen werden, um den semantischen Unterschieden nachzugehen. Die Lexikografin (HK, Heidrun Kämper) weist uns dann noch auf aktuellere Diskurse im Zusammenhang mit der Rezeption der Freud’schen Psychoanalyse hin, in denen die Couch und bestimmte Kollokationen wie sich auf die Couch legen zur schlüsselwortartigen Metapher geworden ist. –(Couch potatoe ist sicherlich erst nach Fertigstellung dieses Wortartikel aufgekommen und als Ganzes neu aus dem Amerikanischen entlehnt worden.)
Vergleicht man schließlich die viel kürzer gefassten und unanschaulicheren Herkunftsangaben etwa im Duden Wörterbuch online, Wolle: […] Herkunft: mittelhochdeutsch wolle, althochdeutsch wolla, vielleicht eigentlich = die (Aus)gerupfte oder die Gedrehte, Gekräuselte […] Couch: […] herkunft: englisch couch < (alt)französisch couche = Lager, zu: coucher = hinlegen, lagern < lateinisch collocare […],
so wird deutlich, dass das Wie der Herkunftsinformationen entscheidend dazu beiträgt, ob Nutzerinnen und Nutzer das betreffende Wort für eines der ‚eigenen‘ Sprache oder ein ‚fremdes‘ Wort halten, oder ob ihnen ein Bild davon vermittelt wird, wie sehr sich die Wortschätze zumindest der europäischen Sprachen ähneln, überlappen und gegenseitig durchdringen. Das Feld der sog. Eurolinguistik, für die hier nur auf die Bibliografie von Grzega (2013) verwiesen werden kann, hat erst in den letzten Jahrzehnten den Blick für die vielfältigen Grenzüberschreitungen der Sprachen und insbesondere ihrer Wortschätze geschärft, so dass man sich noch wird gedulden müssen, bis sich eurolinguistische Erkenntnisse auch in den etymologischen und Herkunftsangaben der Wörterbücher niederschlagen. Dabei macht es einen Unterschied, ob man ein Wort vor sich hat, das eher zeitunabhängige Gegenstände bezeichnet, z. B. Naturerscheinungen (Wolle, Regen, Meer) und elementare Körperkonzepte (Hand, Herz, laufen) oder ein Wort, das stärker an eine bestimmte Kultur und Epoche gebunden ist, wie es Bezeichnungen für soziale Beziehungen (Mutter, Bruder, Feind), für Artefakte (Wein, Boot, Burg), für Ideen und abstrakte Gegenstände (Frieden, Demokratie, Funktion) sind. Man darf erwarten, dass die zuerst genannten Wortklassen eine längere Geschichte haben als die zuletzt genannten und dass die jüngeren, die bereits den Epochen der Literalität und größerer Mobilität angehören, in stärkerem Maße einem gesamteuropäischen, politischen oder wissenschaftlich-technologischen
512
Ulrike Haß
Diskurs angehören. Es bietet sich generell an, solche Wörterwanderungen grafisch zu visualisieren wie im Lehnwortportal Deutsch. Das bekannteste englische Wörterbuch, das Oxford English Dictionary (OED), vereint in seinem lexikografischen Konzept Angaben zum aktuellen Gebrauch der Wörter der vielen existierenden ‚Englishes‘ mit Herkunfts- bzw. ‚Wanderungs‘-Angaben. Von einer internen Reform dieser Angaben für die Neuauflage von 2004 berichtet Simpson, wie durch Veränderungen in der lexikografischen Methode, insbesondere durch Berücksichtigung alltagsnäherer Texte und Übersetzungen, das Bild des Worts sich wandelt. Ferner werden die jeweiligen Entlehnungsprozesse ausführlicher beschrieben und es wird stärker auf die kulturellen Kontexte geachtet, in denen das Wort erstmals in englischen Texten auftaucht. Auf diese Weise erscheint es den Wörterbuchnutzern nun viel eher als Resultat sprachlicher und kultureller Kontakte denn als auf die eigene Nation begrenztes Erbe. Entlehnungen auf Ebene der Wortform wie auf Ebene der Bedeutung oder der Wortbildung werden im OED seit 2004 nicht mehr wie zuvor als Einzelfälle und Ausnahmen, sondern als systematisch eingebundene und wichtige Elemente des englischen Wortschatzes beschrieben. Für die Lexikografie zur deutschen Sprache steht eine solche ‚Europäisierung‘ noch aus, denn es ist gerade hier Tradition, ‚deutschen‘ von ‚fremdem‘ Wortschatz zu unterscheiden und beides in getrennten Wörterbüchern zu präsentieren (s. o.). In dieser Tradition sind noch die sprachideologischen Voraussetzungen des 19. und 20. Jahrhunderts präsent, in denen das erwünschte Nationalbewusstsein von den beiden Größen Sprache und Geschichte her aufgebaut werden sollte. Dabei wurde v. a. im Laienverständnis Sprache mit Wortschatz identifiziert und dem ‚Deutschen‘ Wörterbuch die Aufgabe zugewiesen zu belegen, welch altehrwürdige ‚Wurzeln‘ der deutsche Wortschatz hat (Gardt 2000; Haß 1997). Dies führte im Resultat zu einem Widerspruch: Die Brüder Grimm schlossen Lehn- und v. a. jüngere Fremdwörter ihrer Gegenwart aus dem DWB aus (und nachfolgende Bearbeitergenerationen blieben im Großen und Ganzen dabei), aber in den ausführlichen etymologischen Teilen der Wortartikel werden deutsche Wörter regelmäßig auf zwar unbelegte, aber rekonstruierbare indoeuropäische Wurzeln zurückgeführt und zu einer Menge verwandter Wörter aus anderen germanischen, romanischen, slawischen und weiteren Sprachen vergleichend in Beziehung gesetzt (s. o. Wolle). Dabei konnte und kann auch heute nur höchst selten gesagt werden, ob die Ähnlichkeiten der Wörter unabhängig voneinander allein aufgrund des Lautwandels entstanden sind oder ob nicht schon in grauer Vorzeit Kontakte zwischen wandernden Volksgruppen zur Angleichung von Form und Inhalt der Wörter geführt haben. Das Wissen hierüber hängt wohl auch von Erkenntnissen der Archäologie und Paläogenetik ab. Ob ein Wort im Wörterbuch den Nutzerinnen und Nutzern als nationalspezifisches Wort oder als ein aus interkultureller Kommunikation entstandenes und zu einer solchen Kommunikation fähiges Sprachzeichen erscheint, wird also weitgehend von der Gestaltung der Herkunftsangabe und weiteren, damit zusammenhängenden lexikografischen Verfahren geprägt. Geschichte und ‚Wurzel‘ eines Worts sind
Das Wort in der Lexikografie
513
kulturelle Konstruktionen, die sich mit der Geschichte der Lexikografie und ihrem jeweiligen kulturellen Kontext wandeln (Haß 2012).
5 Resümee Es sollte deutlich geworden sein, dass Wörterbücher nicht nur kein Gefängnis für das Wort und den einzelsprachlichen Wortschatz sind, sondern sogar das Potenzial besitzen, über manche Begrenzungen des realen Wortgebrauchs hinauszugehen. Einerseits muss die Grenzauflösung im Verständnis der Nutzerinnen und Nutzer dadurch beginnen, dass ihnen bewusst (gemacht) wird, dass das Lemma Platzhalter für ‚viele Wörter‘ ist, dass Wortschätze immer größer sind als die für das Wörterbuch ausgewählten Wörter und dass professionelle Wörterbücher deskriptiv angelegt sind. Andererseits und mit mehr Gewicht sind lexikografische Methoden und Innovationen dafür verantwortlich, dass die Durchlässigkeit zwischen ‚Wörterzoo‘ und ‚freier Wildbahn‘ v. a. durch Bedeutungsdifferenzierung, durch Angaben zu syntagmatischen wie paradigmatischen Relationen der Bedeutungsvariante, durch Angaben zur diskursiven Funktion des Worts und durch Verknüpfungen zwischen Wörterbuch und Wörterbuch sowie zwischen Wörterbuch und Korpus vergrößert wird. Eine besondere Herausforderung besteht schließlich darin, die interlingualen Existenzen von Wörtern verschiedener Sprachen nicht länger zu marginalisieren und stattdessen eine Art der ‚Mehrfachstaatsbürgerschaft‘ der Wörter deutlich zu machen. Automatisch generierte und ohne lexikografische Interpreten auskommende Wörterbücher werden dies noch lange nicht leisten können.
6 Literatur Asmussen, Jörg (2013): Combined products: dictionary and corpus. In: Rufus Gouws u. a., 1081–1090. DeReKo 2013-II: Institut für Deutsche Sprache (2013b): Deutsches Referenzkorpus/Archiv der Korpora geschriebener Gegenwartssprache 2013-II (Release vom 19.09.2013). Mannheim: Institut für Deutsche Sprache. www.ids-mannheim.de/DeReKo . DFWB (1995–2010): Deutsches Fremdwörterbuch. Begonnen von Hans Schulz, fortgeführt von Otto Basler, 2. Aufl., völlig neu erarbeitet im Institut für Deutsche Sprache, Mannheim. Bände 1 bis 7. Berlin. Dohm, Hedwig (1902): Christa Ruland. Elektron. Neuauflage, Berlin 2004. Dornseiff, Franz/Uwe Quasthoff (2004): Der deutsche Wortschatz nach Sachgruppen. 8. völlig neu bearb. und mit einem vollst. alphabetischen Zugriffsreg. vers. Aufl. mit CD-ROM. Berlin. DWB: Deutsches Wörterbuch von Jacob Grimm und Wilhelm Grimm. 16 Bde. in 32 Teilbänden. Leipzig 1854–1961. Quellenverzeichnis Leipzig 1971: http://woerterbuchnetz.de/DWB/. DWDS: Das digitale Wörterbuch der deutschen Sprache. http://www.dwds.de/. Duden: http://www.duden.de/woerterbuch .
514
Ulrike Haß
elexiko. Online-Wörterbuch zur deutschen Gegenwartssprache: http://www.owid.de/wb/elexiko/ start.html . Engelberg, Stefan/Lothar Lemnitzer (2009): Lexikographie und Wörterbuchbenutzung. 4., überarb. und erw. Aufl., Tübingen. Gardt, Andreas (2000): Sprachnationalismus zwischen 1850 und 1945. In: Gardt, Andreas (Hg.) (2000): Nation und Sprache. Die Diskussion ihres Verhältnisses in Geschichte und Gegenwart. Berlin, 247–271. Gouws, Rufus u. a. (1989–1991): Wörterbücher/Dictionaries/Dictionnaires. Ein internationales Handbuch zur Lexikographie. An International Encyclopedia of Lexicography/Encyclopédie internationale de lexicographie. 3. Teilbde. Berlin (Handbücher zur Sprach- und Kommunikationswissenschaft/Handbooks of Linguistics and Communication Science (HSK) 5/1–5/3). Gouws, Rufus u. a. (Hg.) (2013): Dictionaries. An International Encyclopedia of Lexicography. Supplementary Volume: Recent Developments with Focus on Electronic and Computational Lexicography. Berlin/Boston (Handbücher zur Sprach- und Kommunikationswissenschaft / Handbooks of Linguistics and Communication Science (HSK) 5/4). Gouws, Rufus/Wolfgang Schweickard/Herbert E. Wiegand (2013): Lexicography through the ages: From the early beginnings to the electronic age. In: Rufus Gouws u. a. (Hg.), 1–24. Grzega, Joachim (2013): Eurolinguistik. Tübingen (Studienbibliografien Sprachwissenschaft, 43). Harm, Volker (2005): Perspektiven auf die sprachhistorische Lexikographie nach dem Deutschen Wörterbuch. In: Zeitschrift für Germanistische Linguistik 33, 92–105. Haß, Ulrike (1997): „alle welt erwartet hier eine erklärung von mir“ – Jacob Grimms Vorrede zum Deutschen Wörterbuch zwischen Apologie und Programm. In: Zeitschrift für germanistische Linguistik 25, 1–23. Haß, Ulrike (2001): Deutsche Wörterbücher. Brennpunkt von Sprach- und Kulturgeschichte. Berlin. Haß, Ulrike (2010): Chancen und Perspektiven der historischen Lexikografie des Deutschen. In: Ulrich Heid u. a. (Hg.): Lexicographica. Berlin, 45–62. Haß, Ulrike (Hg.) (2012): Große Lexika und Wörterbücher Europas. Europäische Enzyklopädien und Wörterbücher in historischen Porträts. Berlin. Haß, Ulrike/Petra Storjohann (2015): Wort und Wortschatz. In: Ekkehard Felder/Andreas Gardt (Hg.): Handbuch Sprache und Wissen, Band 1. Berlin/Boston, 143–166. Kämper, Heidrun (2006): Diskurs und Diskurslexikographie. Zur Konzeption eines Wörterbuchs des Nachkriegsdiskurses. In: Deutsche Sprache 4, 334–353. Kämper, Heidrun (2007): Opfer – Täter – Nichttäter. Ein Wörterbuch zum Schulddiskurs 1945–55. Berlin/New York (http://www.owid.de/wb/disk45/einleitung.html ). Klosa, Annette/Lothar Lemnitzer/Gerald Neumann (2008): Wörterbuchportale – Fragen der Benutzerführung. In: Annette Klosa (Hg.): Lexikografische Portale im Internet. Mannheim, Institut für deutsche Sprache (OPAL-Sonderheft, 1), 5–35. (http://pub.ids-mannheim.de/ laufend/opal/pdf/opal08-1_klosa-lemnitzer-neumann.pdf ). Kluge, Friedrich (2011): Kluge. Etymologisches Wörterbuch der deutschen Sprache. Völlig neu bearb. von Elmar Seebold. 25. Aufl. Berlin. Langenscheidts Fremdwörterbuch: https://woerterbuch.langenscheidt.de/ssc/search/free.html . Lehnwortportal Deutsch: http://lwp.ids-mannheim.de/. Leo Online Wörterbücher: http://www.leo.org/. Müller-Spitzer, Carolin (Hg.) (2014): Using Online Dictionaries. Berlin (Lexicographica Series Maior, 145). OED: Oxford English Dictionary: http://www.oed.com/.
Das Wort in der Lexikografie
515
OWID: Online-Wortschatz-Informationssystem Deutsch. Mannheim, Institut für Deutsche Sprache: http://www.owid.de/index.jsp . Oxford Advanced Learner’s Dictionary. 8th edition. App für Android, Version 3.5.42, 8. Januar 2014. Oxford. Schlaefer, Michael (2009): Lexikologie und Lexikographie. Eine Einführung am Beispiel deutscher Wörterbücher. 2. Aufl. Berlin. Simpson, John (2004): Will the Oxford English Dictionary be more ‚European‘ after its first comprehensive revision since its first edition of 1884–1928? In: Miscelánea. A Journal of English and American Studies 29, 59–74. Wörterbuchnetz: http://woerterbuchnetz.de/. Wortschatz-Portal: http://wortschatz.uni-leipzig.de/.
Sachregister A Abbruch 423, 428, 430, 435 Abkürzung 63, 414, 430 –, Bildung 423 – und Abbruch 423 – und Zusammenziehung 423 Abkürzungspunkt 425, 435 Ablautung 302 Ableitung 417 adaptation 346 Ad-hoc-Entlehnung 350 Adjektiv –, deontisches 120 Affigierung 302 Affix –, Wandel der Produktivität 336 Affix Removal Stemmer 307 Ähnlichkeitsbeziehung – s.a. Synonymie 261, 263 Akronym – s.a. Kurzwort 414, 430 Alltagswortschatz 36 Althochdeutsch – als Silbensprache 464 Ambiguität 502 –, Dimensionen 309 –, kategorielle 309 –, lexikalische 311 –, morphosyntaktische 310 –, semantische 503 – und Zerlegung 309 Amerikanismus 440 Analyse –, kontrastive 239, 241, 407 –, korpuslinguistische 81 –, morphologische 309, 315 Anglizismus 354, 366, 440, 454 f., 457 f. Anpassung –, linguistische 344, 347, 353, 358 Antiphrasis 477 Antonyme 248, 254, 269 –, graduierbare 256 – Hybridantonyme 256 – im Text 270 –, konventionalisierte 268 f. – mit Negationsaffixen 270
– und Kanonizität 257 – und Kontext 249, 269 – und Sprachgebrauch 265 Antonymie 18, 254, 261, 270 –, konzeptuelle 266 – und Text und Diskurs 259, 264 Antonymieforschung 270 antonymy 288 Apokope 466 Apostroph 426, 434 – als Flexionskennzeichner 425 – und Korpora 421 Äquivalenz 147, 240, 254, 257 –, semantische 257 Äquivalenzpräferenz 211 Äquivalenzprojektion 148 Arbitraritätsprinzip 241, 244 Archaisierung 488 – und Bezeichnungswandel 485 – und Sprachökonomie 486 – von Euphemismen 486 Archaismus 135, 367 –, lautlicher 484 – und poetischer Wortschatz 137 Ausdrücke –, sinnverwandte 248, 259, 271 Ausdrucksseite –, Volksetymologie 484 Äußerung 185 Auto-Antonymie 477 Auto-Konverse 479 – und Wortarten 479 Automat –, endlicher 307 Autosemantikum – s.a. Inhaltswort 154, 158 B Bag-of-Words-Verfahren 312 Basisebene – als Begriffsebene 136 – und Alltagskommunikation 136 – und Wortschatz 136 Basismorphem 325 Bedeutung 80, 499 – und Wortpotential 203
518
Sachregister
–, Variante 506, 513 Bedeutungsäquivalenz – s.a. Synonymie 258, 261 Bedeutungsbeziehung – s.a. Sinnrelationen 205, 249, 252 Bedeutungserweiterung/Bedeutungsverengung 479 Bedeutungsgleichheit –, kontextuelle, s.a. Synonymie 261 Bedeutungskonstruierung 268 Bedeutungsverschiebung 431 Bedeutungsverschlechterung/ Bedeutungsverbesserung 480 – und denotative Bedeutung 480 Bedeutungswandel 468 –, Beziehungsindikator und Prozessindikator 473 –, metaphorischer 473 –, reduktiver 468 – und handlungstheoretischer Ansatz 470 – und Kontiguität 472 – und Kontrast 472 –, Wandel der Gebrauchsregel 483 Begriff –, kontroverser 395 Begriffsebene – und Prototypensemantik 136 Begriffsgeschichte 405 Beziehung – der Bedeutungsgleichheit 255, 262 – der Partonymie (auch Meronymie) 255 – des Gegensatzes 260 – im Text 147 – im Wortschatz 147 –, lexikalisch-semantische 248 –, linguistische und nichtsprachliche 38 –, paradigmatische 249, 251, 254 –, sinnrelationale 249, 271 –, sinnverwandte 249, 271 –, syntagmatische 258, 266 –, syntagmatische, s.a. Relation 419 – und Arbitrarität 202 – und Wortschatzstruktur 264 – zwischen Konzepten und/oder Konstruktionen 250 – zwischen Wörtern 250 Bigramm 216 f. Bild 112, 114, 125 –, prototypisches 108
– und System 108 Bildempfänger 144 Bildspender 144 Binäre Opposition – s.a. binary oppositeness 254, 288 binary oppositeness – s.a. Binäre Opposition 254, 288 Bindestrich 427 –, Schreibung 435 – und Konkatenation 430 blended space 144 borrowing 349 C Chat 54, 62 chunk 243 Cluster 85 –, Analyse 84 Cognitive Linguistics 275, 283 collocation 208 – s.a. Kollokation 201, 204, 214, 231 communication 282, 291 Computerlexikographie 315 – und Wort 315 – s.a. Lexikografie, elektronische 20 Computerlinguistik 297 conceptualization 277 configuration 283, 287 construal 268 f., 280, 283 – Construalprozess 268–270 construal operation 279, 283, 289, 291 construction 267, 274 –, contrastive 267 –, inclusive 268 corpus-driven 23 Critical Discourse Analysis 81 –, corpus-assisted 81 –, corpus-driven 82 cultural borrowing – s.a. Übernahme 345 D Datenbank 179, 184, 186 Definition 382 degree 286 – of cohesiveness 279 – of complexity 277 Dehnung 467 Deixis 111
Sachregister
Denotation 133 Deontik 399, 401 Dependenzgrammatik 310 Dependenzparsing 310 Derivation 305, 335, 427 –, kombinatorische 334 –, Nullsuffixe 335 –, Suffigierung 334 Derivationsmorphem 425 Derivationssuffix 466 Design 104, 125 –, Nutzbarkeit und Ästhetik 116 –, visuelles 106 Determinans 432 Determinans-DeterminatumZusammenschreibung 433 Determinativkompositum 333 Determinatum – s.a. Grundwort 432 Deutsch – als Wortbildungssprache 327 Deutsch als Erstsprache 43 Deutsch als Zweitsprache 29, 43 Diagramm 117, 123 Diakritikum 430 Dialog 188 Didaktik 214 – Fachwortdidaktik 388 ff Differenzhypothese 30 Differenzwortschatz –, poetisch-literarischer 133 dimension 282, 288 Diskriminierung –, sprachliche 450, 453 Diskurs 80, 94, 265, 398, 406, 409, 506, 508 –, Akteur 83 –, Analyse 410 –, Analyse, korpusbasierte 406 –, Definition 79 –, Gebrauchsmuster 84, 94 –, Geschichte 404 –, Merkmale 84 –, öffentlich-politischer 396, 399, 408 –, Position 90 –, Schlüsselwort 90, 92 –, Strang 92 – und Korpora 81 – und korpuslinguistischer Zugang 82 – und qualitative Methode 97
– und quantitative Methode 86, 97 – und Sprichwort 232 Diskursanalyse –, frame-basierte 96 –, linguistische 77 – und qualitative Methode 81 – und quantitative Methode 81 –, wortorientierte 80 Diskursfunktion 260 Diskurslinguistik 407 Diskursmarker 196 – und gesprächssteuernde Wirkung 195 Distinktion –, soziale 118 Diversität –, lexikalische 53, 65, 70 Divis 420 ff, 426 ff – als Bindestrich 434 Domäne 62, 269, 427 –, konzeptuelle 254 –, ontologische 269 Drei-Bänder-System – der Schrift 421 Dynamic Construal 268, 270 E Eigenname 62, 415 Eigennamenwortschatz 414 Einheit –, emische 154, 164, 166 –, etische 154, 161 –, lexikalische 302, 321 Einpassung 349, 353, 355 –, graphematische 348 Elisionsapostroph 425 Ellipse 477 – und Kontiguität zwischen sprachlichen Zeichen 472 Emergenz 218, 339 Emoticon 62, 179, 187, 189, 197 – als interaktive Einheit 197 Empfängerframe 144 entity –, mental 276 Entlehnung 346, 349, 357, 365, 367 –, innere 57 –, lexikalische 356, 360 –, Prozesse 364 –, semantische 357
519
520
Sachregister
–, strukturelle 357 – und Integration 356 entrenchment 277 Entrundung 468 Ergänzungsstrich 427, 429 Erosion –, formale 336 Erstsprache 28 f., 44, 49 Erstspracherwerb 40 –, Stufen 339 Erwerb – von Wortbedeutung 39 Etymologie 513 Euphemismus 487 –, Definition 475 Exaktheit –, sprachliche 378, 382 Exmetapher 473 Expletivum –, phraseologisches 235
Fremdwort 138, 351, 364, 366, 428, 455, 458, 496, 499, 511 –, Bestimmung 347 –, Bildung 350 f. – Gebrauch in Poesie 138 –, Purismus 368, 496 –, Verdeutschung 365 Fremdwortschatz 415, 428 Frequenz –, Analyse 84 Frequenzwörterbuch 22 Fugenelement 326 Fügung –, kollokative 215 Funktion –, poetische 132 Funktionsverbgefüge 222, 234 – als Phrasem 229 Funktionswort 216, 434 – s.a. Synsemantikum 157, 164–167, 171
F Fachkommunikation 372, 377, 382, 390 Fachlexikographie 384, 388 Fachsprache 373, 376, 389 – und Wortbildung 384 Fachsprachenlinguistik 374 f., 383, 391 Fachunterricht 390 Fachwort 372, 377, 382, 386, 389 – s.a. Terminus 373 – und Eigenschaften 378 Fachwortschatz – s.a. Terminologie 373, 375, 378, 386 f. Fahnenwort 395, 401 filler 95 Flexion –, graphematische 425 –, Verhalten 431 Flexionsmorphem 425 Flexionsmorphologie 432 formulaic language 229 Frame 9, 20, 97, 143, 321, 409 – als ontologische Relation 205 –, Analyse 94 – s.a. Wissensrahmen 80 –, Semantik 94, 96 –, Struktur 96 –, Theorie 94 Frame-Semantik 143
G Gastwort 349 GAT 179, 195 Gebrauchssprache 149 – und Wortschatz 133 Gedicht – und Sinnkonstitution 142 Gegensatzpaare 260 Germanismus 363, 367 Gesprächsanalyse 184 Gestalt 104, 125 –, akustische 107 –, visuelle 113 Gestaltung –, ästhetische 106, 109 –, visuelle, s.a. Gestalt, visuelle 107, 113 Getrennt- und Zusammenschreibung 420, 422, 435 Gradpartikel 187, 192 Grammatik –, Linearität und Hierarchie 116 – und Design 118 Grammatikerwerb 32, 34 Graphem 430, 464 Graphematik 414, 427 Graphotaktik 422, 424 Grenze –, phonologische 431
Sachregister
Grundfigur –, diskurssemantische 78 Grundform 305 – als Abstraktionsform 301 Grundwort – s.a. Determinatum 432 Grundwortschatz 10, 28, 31 f., 42 Grundwortschatzforschung 8 H Handeln –, sprachliches 471 Handlung –, idiolektale 60 –, initiale 60 Hebung 468 Hiatus 465, 467 High-Level-Verfahren 311 Historismus 485 Hochwertwort 396, 399 Homograph 69 Homonymie 488, 503 Hyperonymie 18, 255 Hyponymie 18, 255 I Icon 119 Idiom 212–214, 222 – als Wortverbindung 213 –, bildhaftes 231 –, Genese 237 – und Divergenz 240 – und internationale Verbreitung 244 – und Kovergenz 240 Idiomatik 209, 231, 240 Ikonographie –, sprachliche 227 Illokution 232 imitation 346 Infinitiv –, deontischer 118 Information Retrieval 300, 307, 311, 313 – als Index 298 –, semantisches 313 Inhaltswort – s.a. Autosemantikum 157, 165 f., 171 Inkompatibilität (Kohyponymie) 248, 255 Inkorporation 334 Input 33, 39, 48
521
–, sprachlicher und nichtsprachlicher 33 Interjektion 414 Internet 56 –, Lexeme 54 –, Sprache als Varietät (Netspeak) 68 –, Sprache und Wortschatz 63, 71 –, Sprachhandelnde 59 Interpunktionszeichen 420, 424 Intertextualität 104 Inventarmodell 386 Invisible-Hand-Prozess 470 Ironie 68, 478 – und Lexikalisierung 477 i-Umlaut 465 K Kategorien –, interaktionale 190 Kennwort –, poetisches 133, 138 Kernhypothese –, funktionale 30 Kernwortschatz 415, 420, 428 Keyness –, Analyse 90 – s.a. Schlüsselworthaftigkeit 82, 90 Kobild 111 Koda 423 Kognition – und lexikalisches Wissen 328 Kohärenz 104, 113, 166, 168 –, grammatische 166 –, thematische 167, 171 Kohäsion 113, 165 f., 169 f. –, Mittel 161, 168 Kolligation 208 Kollokation 201 f., 204, 207, 214, 221, 231, 395, 409, 501, 504 – als emergentes Phänomen 215, 217 – als Mehrworteinheit 209, 212 – als zweistellige Relation 209 –, Analyse, s.a. Kookkurrenz –, Analyse 82 –, Basis 231, 314 –, Begriff 214, 216 – im Wörterbuch 314 –, kommunizierbare 220 – s.a. Kookkurrenz 88, 95 –, sprachtheoretisch 206 – und Basis 212
522
Sachregister
– und Eigenschaften von Wortverbindungen 208 – und Einfluss lexikalischer Realisierungen 207 – und Form 218 – und Idiomatik 232 – und Konzept 215 – und Selektionsrestriktionen 139 – und Semantik 209 – und Sprachrezeption 206 – und Strukturalismus 207 – und usueller Gebrauch 213 –, vollidiomatische 213 Kollokativität – und Sprachproduktion 202 Kollokator 88, 212, 231, 314 Kombination 205 – von Konzepten 204 – von Wörtern 215, 218 –, Wort 234 Kombinatorik 140, 147 –, graphematische 422 Kombinierbarkeit 424 Kommunikation –, computervermittelte 179, 188, 197 –, digitale und Reduktionsform 67 –, digitale und Varietätenwortschatz 65 – im Internet 61 –, informelle 196 –, mündliche, s.a. Sprache 106 –, schriftliche, s.a. Sprache 106 – von Jugendlichen und Anzeigenwerbung 59 Komplementarität 254 Komposition 305, 334, 416 f., 427, 432 –, Kopulativkompositum 427 Kompositum –, Klassifikation 332 –, Kopf 332 – und morpho-syntaktische Muster 330 Konbild 111 Konfix/Kombinem 114, 325, 428 Konjunktion 166 f. Konkatenation 421, 424 Konkordanz –, Analyse 88 Konnektor 164 f., 169 –, satzinterner 167 –, satzübergreifender 167 Konnotation 133 Konsonantencluster 466 Konstruktion 230, 267, 270
–, analytische/synthetische 239 –, elliptische 118 –, inklusive/implizierende 268 –, kontrastive 267 –, lexikalische 207 – s.a. construction 267, 274 – und Textverständnis 243 Kontext 111, 502 –, Arten 503 –, kultureller 512 Kontrarität 254 Kontrast –, propositionaler 194 Kontrastsprache 213 Kontrastwort 138 Konventionalisierung – der Sprache 216 Konversion 302, 305 Konversivität/Konversität 254 Kookkurrenz 219, 222 – Analyse und Korpuslinguistik 220 – Cluster und syntagmatisches Muster 221 – Gesamtverhalten 223 – s.a. Kollokation 82, 88, 201, 204, 214, 231 – Verhalten einzelner Wörter 223 Kopf 423 Kopulativkompositum 333 Korpus 7, 14, 20 f., 184, 197, 494, 507 –, historisches 488 – und morphosyntaktisches Taggen 69 – und Token und Types 300 – und Wörterbuch 508, 513 – und Wortgeschichte 489 Korpusanalyse 436 Korpusdaten 22, 260, 262 Korpuslinguistik 13 f., 21, 70, 80, 92, 155, 216, 257, 266, 405, 429 – und Kognition 250, 259, 444 – und Wortschatzermittlung 61 Kotext 111 Kreation 351 Kurzwort 63, 428 –, Bildung 417 – s.a. Akronym 414, 430 –, unisegmentales 428 L Lautwandel 464, 468 Lehnbedeutung 357
Sachregister
– s.a. semantischer Transfer 357 Lehnbildung 356 Lehnübersetzung 356 Lehnübertragung 356 Lehnwort 454 –, Bestimmung 347 –, Bildung 350 f. – s.a. loanword 345, 348, 352 Lehnwortschatz 352 Leitvokabel –, politische 395 Lemma 498, 500 – als Konzept 301 –, glattalphabetische Anordnung 499 –, Hauptlemma 499 – in der Sprachtechnologie 301 –, nestalphabetische Anordnung 499 –, Sublemma 499 – und Sprachgebrauch 508 –, Verzeichnis 502 –, Wörterbuch 498 Lemmatisierung 60, 302, 306, 312, 498 –, Prinzipien 497 Lesefähigkeit 43, 48 Lexem 63, 159, 168, 302, 309 –, fachsprachliches 67 –, Form 162, 310 –, homographes 68 –, homonymes 68 –, spezifisches und Kommunikationsform 70 –, terminologische Problematik 314 –, terminologisches 62 – und kommunikative Verwendung 485 – und Referenzlexikon 302 – und Synonym 313 Lexemverband 302, 313 Lexik – der Einstellung 70 – der Internetkommunikation 63 Lexikalisierung 222, 239 Lexikografie 16, 21, 214, 242, 314, 395, 407, 410, 493, 501 –, elektronische 20 – s.a. Computerlexikographie 315 – und lexikalische Beziehung 271 – und Sprachgebrauch 20 Lexikologie 19 Lexikon 207 –, mentales 32, 202 f., 330, 340
523
–, mentales und Inhalt 321 –, mentales und Netzwerkmodelle 322 Linguistik –, interaktionale 178, 180, 185 loanword – s.a. Lehnwort 346, 349 LOC-framework – (= Lexical Meaning as Ontologies and Construals) 274, 281 Long-Tail-Verteilung 60 Lücke –, lexikalische 345, 351 Lyrik 131 –, expressionistische 141 –, klassisch-romantische 136 – und Lexik und Phonologie 137 – und Wortschatz 148 –, zeitgenössische 147, 149 M Makrostruktur 498, 500 meaning –, lexical 291 – of lexical item 291 meaning-making – in discourse 291 meaning structure –, contentful 282, 286 f. Mediostruktur 498 Mehrworteinheit 243 Mehrwortverbindung 231 Merkmalshypothese –, semantische 30 Meronymie – s.a. Parteronymie bzw. Partonymie 248, 255 Metapher 68, 111, 142, 397 – und konzeptuelle Integration 144 Metaphernbildung 146 Metaphorik 378, 382 Metaphorisierung 473 – s.a. metaphorization 283, 289, 474 metaphorization 283, 289, 474 Metonymisierung 283, 289 – s.a. metonymization 475 – und Frame 474 – und Kontiguitätsrelation 474 metonymization 475 – s.a. Metonymisierung 283, 289 Mikroformel 236
524
Sachregister
Mikrostruktur 498 Mitteilungswortschatz, s.a. produktiver Wortschatz 28 Monophthongierung 468 Morph 305 Morphem 305 –, Analyse und Fremdwörter 324 –, Definition 324 –, freies 305, 307, 324, 428 –, gebundenes 305, 307, 325 –, grammatisches 428 –, Grenze 427 –, Struktur und Konstituentenanalyse 323 –, Typen 326 –, Umbau 337 – vs. Silbe 326 Morphologie 427 Morphologieinduktion 308 Morphologismus –, computationeller 306 Mündlichkeit –, informelle 189 –, konzeptionelle 187 f. Mündlichkeitsmarker 189 Muster –, syntagmatisches 222 N Nachfolgerfrequenz 308 Nasalassimilation 416 Neologismus – s.a. Neu-Wort 345 Netspeak 71 Netz –, lexikalisches 148 – s.a. Internet 56, 68 Netzjargon 71 Neubildung 367 – und Produktivität 328 Neuhochdeutsch – als Wortsprache 466 Neuwort 364 Neu-Wort – s.a. Neologismus 345 Newsgroup – und Smileys 67 Newsticker 61 N-Gramm 67 Nomenklatur 375
Norm 443, 451, 460 Null-Pfad 483 O Oberbegriff 39 Ökonomie –, kognitive 328 Ontogenese 339 ontology 281 –, conceptual 280 –, configurational 280 –, contentful 280, 282 Operator-Skopus-Struktur 191 Opinion mining (OM) 68 Orthographie 414 P Paarformel 234 Panel 122 f. Paradigma 251 Paradigmatik 132, 248 Paratext 115 Parteronymie 256 Part-of-Speech (PoS) Tagging 310 Part-of-speech-Tagger 69 Partonymie 255 Perspektive –, frameanalytische 90 Phonologie 427 Phrasem – als historisches Phänomen 238 – als Sprachzeichen 228 – beim Lernen und Lesen 244 –, Entstehung und Wandel 238 –, ikonographisches 239 – im interlingualen Vergleich 241 – im Wörterbuch 242 ff – in der Übersetzung 238 –, Kategorie 234 –, Klassen 315 –, lexikalisiertes 228 – mit unikalen Komponenten 235 –, pragmatisches s.a. Routineformel 235 –, schematisches 230 –, spatial polylexikalisches 228 –, substanzielles 230 –, Typen 236 – und Gegenstandsbezug 238 – und Ikonizität 243
Sachregister
– und Komponenten 230 – und Komposition 230 – und Korpusbasiertheit 244 – und Modifikation 237 – und Semiotik 243 – und Sprachinventar 229 – und Textsortenzugehörigkeit 242 – und Wortschatz 243 Phraseodidaktik 245 Phraseolexikographie 245 Phraseolexikon 230 Phraseologie 209, 226 f., 244 –, Begriff 228, 231 –, falsche Freunde 240 –, Forschung 245 –, interlingual 241 –, Kategorien 236 –, Klassifikation 236 –, Terminus 229 –, Typen 230 – und Korpusbasiertheit 245 – und Onomasiologie 241 – und Sprachlernen 243 Phraseologisierung 237, 239 Phraseologismus 227 Phraseonym 233 –, explizites 234 –, implizites 234 Phraseoreduplikation 234 Phraseoschablone 238 – s.a. Phrasem, schematisches 230 – und Slogans 237 Phraseoterminus 235 Phylogenese 339 Poetische Funktion – und Strukturalismus 148 Polarität 53 Political Correctness 451 Polysemie 468, 478, 502 –, grammatische 336 Porter-Stemmer 307 Präfigierung – s.a. Derivation 334 Präfix 416, 427 pre-meaning structure 282 –, contentful and configurational 281 Produktivität – von Mustern 336 profiling 277, 285
525
property 277, 286, 288 Prototypizität 122 Prozess –, phonologischer 431 Purismus 366, 368, 456 – s.a. Fremdwort 496 R Reduktion 336 –, Abkürzungen 335 –, Kurzwörter 335 –, Wortkreuzung 335 Regionalismus 134, 137 Relation 493, 505 –, lexikalische 147, 506 –, paradigmatische, s.a. Wortfeld 147, 503, 505 –, Prinzip 420, 422 –, semantische 169 –, syntagmatische 18, 147, 505 –, syntagmatische, s.a. Kollokation 503 Retrievalergebnis 313 Retrievalsystem – und Performanz 313 Reversivität 254 Routineformel 235 Rückbildung 334, 417 Rundung 468 S salience 280, 282, 286, 289 Salienz –, diskursive 409 Satz 178 –, Kohäsion 165 Satzenderkennung 303 schematization 282 Schlagwort 81, 92, 399, 404 –, Bedeutung 398 –, Forschung 395 – und Deontik 395, 398 – und Diskursgebundenheit 397 – und hermeneutische Perspektive 405 – und Korpus 407, 409 – und korpuslinguistische Perspektive 397, 407, 410 – und semantische Komplexität 397 Schlagwörterbuch 403 Schlagwortlexikografie 404, 406 Schlüsselwort 80, 92, 395, 432
526
Sachregister
Schlüsselworthaftigkeit – s.a. Keyness 82, 89 Schriftentwicklung 107 Schriftlichkeit –, informelle 178, 189, 197 –, konzeptionelle 40 –, mediale 187 –, normorientierte 178 – und Kurzformen 188 Schriftsprache 42 f., 48 –, überregionale 414 Schwa-Laut 466 Screendesign – und Hypertechnik 121 Script –, erlerntes 62 Segmentierung 429 – eines Textes 303 – von Morphemen 305 Sehfläche –, Definition 102, 123 –, Design und Grammatik 118 –, Gestaltung 118 –, monologische 110 –, Semiotik und Kommunikation 114 –, statische 109 – und digitale Kommunikation 109 – und Gestaltpsychologie 104 – und Kommunikation 118, 124 – und Text-Bild-Relation 108 – und Topographie 117 – vs. monomodale Schriftsprache 115 –, Wahrnehmung 118 Semantik –, literarische 133 Semiwort 188, 195 –, morphologisches 187 Senkung 468 Sentimentlexik 68, 70 Sequenzierung – von Phrasemen 239 Signifikanzanalyse – von Wörtern 65 Silbe –, betonte 467 –, graphematische 424, 427 –, phonologische 424 –, unbetonte, s.a. Nebensilbe 467 Silbensprache 465
– und Hiate 467 Sinnrelationen 19, 250, 254, 266, 268 –, Definition und Klassifikation 254 –, kognitive 266 –, kontextuelle 249 –, konzeptuelle 250, 266 –, lexikalisch 249 – und kognitive Semantik 259 – und Konstruktionsgrammatik 267 – und Konzepte und Konstruktionen 250 – und Korpuslinguistik 259 – und lexikalische Semantik 250 – und Sprachgebrauch 252, 256 f. – und Strukturalismus 255, 257 Slogan – und Kohäsion 237 slot 95 Smiley 67, 71 SMS-Kommunikation 178 f., 188 – und Wortschatzumfang 70 SMS-Mitteilung 65 socio-sensory-cognitive –, basis 275 –, entrenchment 277 –, system 276 –, triad 276, 291 Spatium 105, 107, 125, 426, 430, 434 Spender-Frame 143 Sprachbewertung 440, 443 Sprachbewusstheit 31, 43 Sprachdaten –, authentische 197 Sprachdidaktik 372, 384, 390 Sprache 189 –, gendergerechte 453 –, geschriebene, s.a. Kommunikation 109, 118 –, gesprochene, s.a. Kommunikation 116, 118, 178 f., 185, 188, 190 –, informelle 179 –, interaktionale 190 –, Werbung 57 Sprache der Literatur – und Ansätze der Romantik und Idealismus 133 Sprache der Poesie – und Theorie 131 – und Wortschatz 133 Sprachentwicklung –, verzögerte 41 Spracherwerb 215
Sachregister
–, gesteuerter 41 – und Eltern-Kind-Interaktion 34 – und mentales Lexikon 206 Sprachfähigkeit –, mündliche 40 Sprachfehler 443, 458 Sprachförderung 35, 40 f., 46 Sprachfunktion –, ästhetische/poetische 132 Sprachgebrauch 215, 494, 503 –, Muster 90, 94 –, musterhafter, s.a. Sprachgebrauch –, Muster 92 Sprachgebrauchsmuster 93 Sprachkontakt 352, 355 f., 364, 367 –, Forschung 349 –, historischer 358 Sprachkritik 446, 450 f., 453, 457, 460 –, bewusstseinskritische 443 –, feministische 443, 453 –, laienlinguistische 440, 444 f., 459 –, literarische 443 –, philosophische 443 –, politische 447 –, publizistische 443 –, sprachwissenschaftliche 441, 444, 459 –, wortbezogene 445 Sprachlernprozesse 47 Sprachnorm 364 Sprachnormenkritik – s.a. Sprachnormierungskritik 443 Sprachnormierungskritik 443 Sprachpolitik 440, 450 Sprachproduktion – modularisierbare, serialisierbare 209 – und Basis 209 – und Kollokator 209 – und Wortwahl 203 Sprachstufen –, historische und semantische Veränderungen 471 Sprachtechnologie –, Definition 299 –, Funktion und Aufgabe 310 –, Grundform vs. Lemma 301 –, terminologische Präzisierung 316 –, terminologische Vielfalt 315 –, textbasierte 299 Sprach- und Kulturkontakt 358, 361
Sprachverfall 440, 457 Sprachwandel 455, 459 Sprichwort –, Kriterien 232 Sprossvokal 467 Stabilität –, semantische und Wortfrequenz 469 Stamm –, Definition 327 Stammformapostroph 425 f. Stemming 302, 306, 313 Stichwortliste 5, 15 – s.a. Lemma 498, 500 Stigmawort 396, 399 f. Stimmungswort 135 f. –, und poetischer Wortschatz 137 Stoppwort 66, 70 structure, s.a. Struktur –, conceptual 277, 281, 291 –, ontological 281 –, schematic 281 Struktur, s.a. structure –, morphologische 416 –, paradigmatische 259 –, syntagmatische 258 Strukturwissen –, sprachliches 45 Suffigierung – s.a. Derivation 335 Suffix 427 Syllabierung –, phonologische 427 Symbolwort 395 Synkope 466 synonym 288, 506 Synonym 249, 288, 506 –, monolexikalisches 228 – und Sprachgebrauch 249 Synonymcluster 262 Synonymie 18, 248, 254, 261, 267, 270 –, absolute/totale 255 – als lexikalische Beziehung 261 –, kognitive/nahe 255 –, koordinierte 262 –, partielle/propositionale 255 –, subordinierte 262 – und Kontext 258 – und Konzept 263 synonymy 288
527
528
Sachregister
Synsemantikum – s.a. Funktionswort 158 Syntagma 176, 190, 197, 419, 427, 429 Syntagmatik 104, 132 – s.a. Kollokation/Begriff 214 – s.a. Konstruktion 208 Syntax 427 –, reduktive 64 T Teilwortschatz 12, 17 Tenuesverschiebung 465 t-Epithese 467 Terminologie –, Arbeit 386 –, Lehre 374, 383, 385 –, Normung 372, 374, 382, 386 – s.a. Fachwortschatz 373, 375 Terminus – s.a. Fachwort 373 Text 119 –, Begriff 103 –, Kohäsion 165 –, monomodaler 108, 125 –, prototypischer 108 – und Linearität 108, 116 –, virtueller 158, 164 – vs. Bild 108 Text-Bild-Gestalt 108 Text-Bild-Sorte 123 –, bewegte 109 Textfunktion –, appellative 113 Textkompetenz 28, 42, 46 Textmining 311 Textsorte –, monomodale 115 Textsortenphraseographie 245 Textwort 154 f., 162, 166 f., 172 Tickernews – und lexikalische Diversität 70 Token 63, 66, 154, 159, 163, 300 – und Wort 304 Tokengrenze 300 Tokenisierung – s.a. WASTE 300, 304, 312 Topikalisierung 429 Transfer –, lexikalischer, s.a. Übernahme 349 ff
–, semantischer, s.a. Lehnbedeutung 357 Transkription 180 Transkriptionskonvention 180, 185 Transkriptionssystem –, gesprächsanalytisches 184 – s.a. GAT 179, 195 – und Wort 180 Trennstrich 428 Tweet 66, 69 – und lexikalische Diversität 70 Type 64, 66, 154, 157, 161, 300, 302 Type-Token-Relation 64 Typographie 108 typology – of construals, s.a. construal 283 U Übernahme – s.a. cultural borrowing 345 – s.a. Transfer 346, 350, 353, 356, 358, 362 Umlautung 302 Univerbierung 333, 417 Unterbegriff 39 Unwertwort 396 Unwort 445 ff, 453 usage-based model 208 V Variante 63 –, lexikalische 60, 70 –, stilistische 70 Varietät 55, 68 –, diaphasisch 56 –, diatopisch 56 – in Dialekt und Soziolekt 71 Vektor 312 – und Grundform 313 Verbindung – von Wörtern, s.a. Kollokation 207 Verbmorphem 325 Verbwortschatz 33, 37 Verfahren –, regelbasiertes 306 –, statistisches 306 Verlaufsanalyse 83 Verstehenswortschatz 28 Verwandtschaft – von Bild und Text 109 Verwendungskontext
Sachregister
– im Diskurs 80 Vokallänge 467 W Wandel und Verschiebung – in Diskursen 397 WASTE – und bekannte Segmentmerkmale, s.a. Tokenisierung 304 Wendung –, mehrgliedrig idiomatische 315 Wikipedia 61, 66, 70 Wissen –, kollektives 78, 409 –, lexikalisches 29, 320 Wissensrahmen 86, 96 – s.a. Frame 80 word class 284 word meaning 276 Wort 3, 18, 177, 493, 501 – als mentales Konstrukt 106 – als sprachliches Zeichen 177, 503 –, Analyse und Basismorphem 327 – auf Sehfläche und Morphologie 125 –, Ausdrucksseite 464 –, Begriff 107, 115, 418 –, Begriff und Fremdsprachen 434 –, brisantes 395 –, einfaches 323 –, flexionsmorphologisches 416 –, Form 160, 162, 169, 173, 416 –, Funktion 120 –, Gebrauch und Verbgruppen 481 –, geflügeltes 233, 239 –, graphematisches 415, 418, 422, 427, 429, 436 –, graphematisches und Sprachvergleich 431 – im Diskurs 78 – im Gebrauch 493, 496, 500, 513 – im Kontext von Computerlinguistik und Sprachtechnologie 302 – im Satz 178 – in der Sprachkritik 450, 460 –, Inhaltsseite 468 –, komplexes 323 –, komplexes und Dekomponierung 322 –, Laut 153, 164, 168, 171 –, lexikalisches 425 –, monomodales 106
529
–, phonologisches 416, 431, 435, 467 –, sinnrelationales 266, 268 –, syntaktisches 418, 427 –, Terminus 311, 315 –, textkonstitutives 137 –, topisches 135 – und Abstraktionsniveau 136 – und Äußerung 179, 189, 195 – und Design 125 – und Etymologie 509 – und Gebrauchsakte 503 – und geschriebene Sprache 110 – und gesprochene Sprache 179, 185 – und Lautfluss 183 – und Linearität 125 – und Schriftlichkeit 185 – und Sehfläche 107 – und semantisches Feld 36 – und Sinnverwandtschaft 506 – und Text-Bild-Relation 113 –, wortbildungsmorphologisches 417 Wortanalyse –, diskurslinguistische 80 Wortarten – und Gebrauchshäufigkeit 38 Wortartendisambiguierung (word sense disambiguation) 310 Wortartikel 504 –, Informationsangebot 501 – und Aufbauprinzipien 501 Wortbedeutung 80, 86, 88, 141, 189, 195, 493, 498, 505 Wortbegriff 177 Wortbildung 140, 222, 228, 305, 417, 422 –, graphematische 425, 430 –, Kompetenz 329 –, Laut- und/oder Bedeutungswandel und Intransparenz 329 –, Mittel 140 –, Muster 330 –, okkasionelle 330 –, Prinzip 420, 422 –, Produkt 140, 431 –, Prozess 329, 418, 431 –, textkonstituierende Funktion 338 –, Theorie 336 –, Typen 336 – und Denotate 327 – und Korpuslinguistik 337
530
Sachregister
– und Lexikon 336 –, Wandel im Sprachsystem 337 Wortbildungsmorphem 325 –, nicht produktives 325 –, produktives 325 Wortbildungsmorphologie 432 Wortbildungsregel 32 Wörterbuch 497, 500, 510 –, computergeneriertes 496, 503 –, deskriptives 494 f. –, Didaktik 315 –, elektronisches 498, 501, 507 –, Fremdwörterbuch 497, 509 –, Herkunftswörterbuch 509 –, historisches Bedeutungswörterbuch 509 –, präskriptives 494 –, terminologische Problematik 314 – und Benutzung 494, 497 – und Sprachgemeinschaft 494 – und usueller Wortschatz 500 – und Wortschatz 5 Wortfeld 249, 259, 505 –, paradigmatisches, s.a. Relation 493, 505 Wortfelduntersuchung 46 Wortform 302 Wortfunktion 189, 195 Wortgebrauch 493, 496, 500, 513 –, usueller 213 Wortgrenze 179, 183 –, lexikalische 434 Wortgrupppe 147 Wortkonzept 179 –, schriftsprachliches 176, 184 Wortkürzung – und Suffigierung 335 Wortpaar –, antonymisches 147 –, synonymisches 147 Wortschatz 6, 21, 23, 33, 35, 42, 494, 498, 500, 513 –, Analyse und Verfahren 24 –, Archivierung 19 –, Begriff 21 –, Beschreibung 20 –, Definition 55, 61 – der europäischen Sprachen 511 –, deutscher 43 –, Entwicklung 499 –, Erhebung, computergestützte 12
–, Erweiterung 56 –, fremdsprachiger und Archaismen 486 –, indigener 466 –, Internet 55 –, kollektiver 27 –, Konzept, dynamisches 23 –, produktiver 15, 32, 38 –, rezeptiver 15 –, Selektion 7, 9 –, Stabilität und Wandel 469 –, Strukturierung 19 –, textsortenspezifischer 28 –, Umfang 15, 63 f. – und Adjektive 37 – und Assimilation 346 – und Domäne und Konzepte 61, 249 – und Funktion 255 – und Integration 348, 350 f., 353 – und Korpus 59 – und neue Technologien 58 – und Zeit 56 –, Varietäten 58, 70 – von SMS-Mitteilung 65 –, zweisprachiger 29 Wortschatzarbeit 43, 45, 47 –, funktionale 44 –, systematische 45 – und Kollokationen 45 Wortschatzentwicklung 33, 37 Wortschatzerweiterung 44 Wortschatzerwerb 27 f., 36, 39, 46–48 – im Kleinkindalter 34, 36 – im Vorschulalter 39 – in der Grundschule 42 – in der Sekundarstufe 45 –, individueller 31 –, schulischer 41 – und Einflussfaktoren 33 – und Erstsprache 31 – und Wortartenerwerb 38 –, ungesteuerter rezeptiver 35 Wortschatzförderung 40, 43 f., 47 –, funktionale 41 Wortschatzstruktur 254, 258, 271 –, sinnrelationale 248 Wortschatztest 30 f. Wortschatzumfang 32, 42 Wortschatzvertiefung 44 Wortsprache 466
Sachregister
Wortstamm – und Affix 307 Wortstatus 180, 185, 197 Wortverbindung – im Fremdsprachenunterricht 209 – und unikales Wort 236 Wortwahlpräferenz 210 – in verschiedenen Sprachen 211 Wortzeichen 422, 430, 434, 436 X Xenophrasem 233 Z Zählbarkeit 15 – von Wörtern 15 Zeichen 121, 126 –, ikonisches 108 –, mehrgliedrig lexikalisches 314
–, orthographisches 125 –, sprachliches 148 –, symbolisches 108 –, System 108 –, typographisches 125 Zerlegung –, Ambiguität 310 –, Kompositum 302, 313 –, Zeichen 305 Zielframe 143 Zugang –, inventariografischer 229 Zusammenschreibung 435 Zusammenziehung 430, 435 Zweitsprachenforschung 29 Zweitspracherwerb 37 – und Grundschulkinder 43
531