174 59 58MB
German Pages 359 [364] Year 2002
Das Wort
Das Wort Seine strukturelle und kulturelle Dimension Festschrift für Oskar Reichmann zum 65. Geburtstag Herausgegeben von Vilmos Ägel, Andreas Gardt, Ulrike Haß-Zumkehr und Thorsten Roelcke
Niemeyer
Die Deutsche Bibliothek - dP-Einheitsaufhahme Das Won: seine strukturelle und kulturelle Dimension; Festschrift für Oskar Reichmann zum 65. Geburtstag / hrsg. von Vilmos Agel.... - Tübingen: Niemeyer, 2002 ISBN 3-484-73058-7
© Max Niemeyer Verlag GmbH, Tübingen 2002 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbeständigem Papier. Satz und Druck: AZ Druck und Datentechnik GmbH, Kempten Einband: Heinr. Koch, Tübingen
Inhaltsverzeichnis
Oskar Reichmann Zu Biographie und wissenschaftlichem Werk Oskar Reichmann als Betreuer von Promotionen und Habilitationen
IX XIII
I. Systematische und gegenwartsbezogene Aspekte Vilmos Ägel/Roland Kehrein Das Wort - Sprech- und/oder Schreibzeichen? Ein empirischer Beitrag zum latenten Gegenstand der Linguistik
3
Dirk Geeraerts The scope of diachronic onomasiology
29
Ulrike Haß-Zumkehr Das Wort in der Korpuslinguistik Chancen und Probleme empirischer Lexikologie
45
Anja Lobenstein-Reichmann Die Syntagmenangabe - ein Stiefkind der Bedeutungslexikographie
71
Heino Speer Rechtssprachlexikographie und neue Medien
89
Andreas Gardt Wort, Text und Bedeutung Aspekte der semantischen Erschließung von Texten
111
Jochen A. Bär Das Wort im Spiegel der Sprachkritik
133
VI
Peter Wiesinger Austriazismen als Politikum Zur Sprachpolitik in Österreich
159
Anne Betten/Peter Mauser Deutsche Wörter im Exil
183
Stefan Sonderegger Philologische Probleme der deutschen Bibelübersetzung: der Prolog des Lukas-Evangeliums
201
Gerhard Rau Zur Funktionalität des Wort-Gottes-Theologie im 20. Jahrhundert
217
II. Die historische Dimension Klaus-Peter Wegera „ mich enhabe diu aventiure betrogen " Ein Beitrag zur Wort- und Begriffsgeschichte von aventiure im Mittelhochdeutschen
229
Wilhelm Kühlmann Rätsel der Wörter Zur Diskussion von ,Fachsprache' und Lexikographie im Umkreis der Paracelsisten des 16. Jahrhunderts
245
Joachim Teile Fachschriftsteller als „Rhätersschreiber" Rätselreime aus deutschen Alchemica der frühen Neuzeit
263
Werner Besch Lexikalischer Wandel in der Zürcher Bibel Eine Längsschnittstudie
279
Joachim Schildt Präfigierung von Simplexverben - Beobachtungen zur semantischen Entwicklung frühneuhochdeutscher Verben
297
Thorsten Roelcke Das Niederländische in der deutschen Sprachreflexion des Barock und der Aufklärung
303
VII
Hartmut Schmidt Frühneuhochdeutsche Zustände im Spätneuhochdeutschen?
321
Verzeichnis der Beiträger
343
Oskar Reichmann Zu Biographie und wissenschaftlichem Werk
Oskar Reichmann einen Band zu widmen, dessen Gegenstand das Wort ist, wird niemanden verwundern. Von seiner Marburger Dissertation, die sich mit dem Wortschatz der Siegerländer Land- und Haubergswirtschaft befasst, über die Germanistische Lexikologie bis zum Frühneuhochdeutschen Wörterbuch stand und steht der größte Teil seines Schaffens im Zeichen der Beschäftigung mit Wörtern in ihren strukturellen Eigenschaften und kulturellen Bezügen. Wissenschaftlich kam Oskar Reichmann mit den Wörtern erstmals in Marburg in Kontakt. Aus dem siegerländischen Wilgersdorf stammend, nahm er 1957 an der Marburger Philippe-Universität ein Studium der Germanistik und Geschichte auf. 1962 legte er das 1. Staatsexamen ab und promovierte zwei Jahre später bei Ludwig Erich Schmitt. Sein Doktorvater war es auch, der ihm eine erste Anstellung gab, am neu ausgebauten Forschungsinstitut für deutsche Sprache - Deutscher Sprachatlas. Dort lernte der Sprachwissenschaftler sein lexikologisch.es Handwerkszeug: die genaue Beschreibung der Strukturen von Wörtern, ihres Herkommens und ihrer Verteilung in Raum und Zeit. Jahre später kam er mit der Marburger Institution noch einmal in Berührung, als den Ruf auf den Lehrstuhl für germanische und deutsche Philologie an der PhilippsUniversität erhielt, eine Position, die die Leitung des Sprachatlasses einschließt. Doch zog er seine damalige Tätigkeit in Heidelberg einem Wechsel nach Marburg vor. Nachdem er auch das zweite Staatsexamen abgelegt hatte und eine kurze Zeit im Schuldienst tätig gewesen war, ging Oskar Reichmann 1967 in die Niederlande, um als Dozent an der Freien Universität Amsterdam, zugleich im Bereich der Lehrerausbildung in Utrecht zu arbeiten. 1974 wurde er auf den Lehrstuhl für Germanistische Sprachwissenschaft unter besonderer Berücksichtigung der Sprachgeschichte an die Universität Heidelberg berufen, wo er nach wie vor wirkt. Im Laufe der Jahre war er mehrfach als Gastdozent im Ausland tätig, in Paris, Catania, Budapest, Szeged, Peking und zuletzt in Freiburg (Schweiz), wo er 1997/98 im Rahmen der Wolfgang-Stammler-Gastprofessur über „Sprachgeschichtsschreibung: Tatsachenbericht oder Sinnklitterung" las. Oskar Reichmann ist Mitglied der Kommission für das Deutsche Rechtswörterbuch an der Heidelberger Akademie der Wissenschaften, Leiter des Projektbeirats für das Deutsche Fremdwörterbuch am Institut für Deutsche Sprache in Mannheim und Vertrauensdozent der Studienstiftung des Deutschen Volkes. 1999 wurde ihm das Verdienstkreuz am Bande des Verdienstordens der Bundesrepublik Deutschland verliehen.
Unter den umfangreicheren Arbeiten des hier Geehrten ist als erstes das Frühneuhochdeutsche Wörterbuch zu nennen - eine exzellente Leistung der historischen Lexikographie und eine Pionierleistung für die lexikographische Erfassung dieser Sprachstufe. Das Friihneuhochdeutsche Wörterbuch zeigt gleich in mehrfacher Hinsicht, was Oskar Reichmann auszeichnet: die Fähigkeit zur klaren, stringenten und von einem eigenständigen theoretischen Zugriff getragenen Konzeption, verbunden mit der souveränen Kenntnis des sprachhistorischen Materials. In seinem schieren Umfang ist dieses lexikographische Vorhaben kühn, aber es ist bezeichnend für den Geehrten, dass er es nicht nur entwirft, sondern ihm auch mit großer Konsequenz Wirklichkeit zu verleihen vermag: Zur Zeit liegen die ersten vier Bände vor; die Bände l, 2 und 3 wurden von Oskar Reichmann erarbeitet, Band 4 von Joachim Schildt (Arbeitsstelle am Institut für Deutsche Sprache, Mannheim). Von zwei weiteren Bänden sind insgesamt drei Lieferungen fertig gestellt, zwei von Anja Lobenstein-Reichmann (IDS Mannheim), eine dritte von Vibeke Winge (Kopenhagen). Nebenbei belegt dieses mit geringem Personalaufwand betriebene Großprojekt, dass bei allen Vernetzungen, die die gegenwärtige Wissenschaftslandschaft in Form von Forschungsbereichen und -kollegs bereithält, die individuelle Leistung nach wie vor den Maßstab für Erfolg und Qualität setzt. Neben die Beschäftigung mit dem Wort in seinem historischen Vorkommen tritt bei Oskar Reichmann schon früh die Reflexion über theoretische Fragen der Lexikologie. Eine ganze Reihe von Aufsätzen legt davon Zeugnis ab, vor allem aber die Deutsche Wortforschung bzw. die Germanistische Lexikologie, wie die zweite Auflage der in der Sammlung Metzler 1969 erstmals erschienenen Arbeit lautet. Die Änderung des Titels zwischen den beiden sieben Jahre auseinander liegenden Auflagen spiegelt den Wandel im Wissenschaftsverständnis des Verfassers zu einer Auffassung von Sprachwissenschaft, die neuere strukturalistische Überlegungen ebenso berücksichtigt wie Erkenntnisse der Pragmatik. Dabei entspricht die Hinwendung des Verfassers zu pragmatischen Positionen einer von ihm zutiefst geteilten Überzeugung: dass im Mittelpunkt des Sprechens stets der Mensch steht. Hypostasierungen in der Begrifflichkeit, die eine wie auch immer geartete Eigenständigkeit der Sprache gegenüber ihren Sprechern suggerieren, sind ihm ebenso fremd wie jede Sprach- und Grammatiktheorie, die hinter aufwändigen Theorieapparaten und Formalisierungen keinen Bezug zur Sprachwirklichkeit mehr erkennen lässt. Als Historiker setzt sich Oskar Reichmann mit lexikologischen Fragen nicht nur in systematischer Hinsicht auseinander. Die Reflexion über das Deutsche an der deutschen Sprache und Sprachgeschichte führt zunächst zu einem viel zitierten Aufsatz über die „Deutsche Nationalsprache" (1978). Über zwei Jahrzehnte später wird das Thema erneut aufgegriffen, in einem Beitrag über „Nationalsprache als Konzept der Sprachwissenschaft", schließlich - in einer für ihn charakteristischen Ausweitung des Untersuchungsansatzes über die Grenzen einer als isoliert verstandenen Einzelsprache und Einzelsprachen-Philologie hinaus - in einer Schrift über „Das nationale und das europäische Modell in der Sprachgeschichtsschreibung des Deutschen".
XI
Dieser zuletzt erwähnte Titel zeigt, dass nicht nur die Sprache, sondern auch die Theorie und Praxis ihrer Erforschung ein konstantes Thema für den Heidelberger Sprachhistoriker war und ist. Zahlreiche Aufsätze wären hier zu nennen, etwa der umfassende Beitrag „Sprachgeschichte: Idee und Verwirklichung", der das Handbuch Sprachgeschichte einleitet, das Oskar Reichmann als Hauptherausgeber nunmehr in der zweiten Auflage betreut. Neben diese voluminösen, für jeden germanistischen Sprachhistoriker unverzichtbaren Bände tritt mit dem Handbuch Wörterbücher ein zweites, von ihm als einem der Herausgeber mit konzipiertes, nicht weniger umfangreiches Werk aus der Reihe der Handbücher zur Sprach- und Kommunikationswissenschaft. Im Zusammenhang mit der Herausgebertätigkeit Oskar Reichmanns sind des Weiteren sein Mitwirken an den Reihen Lexicographica (Series Maior), Studio linguistica und den Amsterdamer Publikationen zur Sprache und Literatur zu erwähnen, unter den Einzelpublikationen zumindest das mit Klaus-Peter Wegera konzipierte Frühneuhochdeutsche Lesebuch. In einem ganz anderen Sinne kommt Oskar Reichmanns Interesse am Wort in seiner Beschäftigung mit der Geschichte der Sprachtheorie zum Ausdruck, die sich in Aufsätzen über sprachreflexive Begriffe des 17. und 18. Jahrhunderts - Gebrauch und Deutlichkeit/Eindeutigkeit (von Sprache) -, auch in seinem Plenarvortrag auf dem neunten Weltkongress der Internationalen Vereinigung für Germanische Sprach- und Literaturwissenschaft in Vancouver 1995 niedergeschlagen hat. Hier zeigt sich erneut, dass Sprachgeschichte für den Geehrten mehr ist als die bloße Geschichte des Sprachsystems: Geschichte der das Sprechen und Schreiben bedingenden Vorgaben und Interessen der historischen Individuen. Dass Wort und Wortschatz das Zentrum in Oskar Reichmanns wissenschaftlichem Werk darstellen, belegt auch seine bislang ausführlichste Hinwendung zur Grammatik. 1993 erschien in der „Sammlung kurzer [sie!] Grammatiken germanischer Dialekte" die 562 Seiten starke „Frühneuhochdeutsche Grammatik", die Oskar Reichmann als Mitherausgeber zu verantworten hat und für die er, zusammen mit Klaus-Peter Wegera, neben der Einleitung den Teil über „Flexion und Lautung" verfasst hat. Oskar Reichmanns 65. Geburtstag wird - im Gegensatz zu aller Symbolik, die man diesem Datum gemeinhin zuspricht - beruflich und persönlich keinen Einschnitt für ihn bedeuten. Seine Studenten, Kollegen und Freunde werden ihn weiterhin als jemanden erfahren, der seine Arbeit ganz offensichtlich liebt, Kraft aus ihr zu schöpfen versteht und sie mit Begeisterung vorantreibt. Wer die Atmosphäre kennt, die er an seinem Lehrstuhl geschaffen hat, wusste und weiß sie zu schätzen: Diskussionen werden engagiert geführt, neue Ideen sind stets willkommen, die Unterschiedlichkeit persönlicher Temperamente ist erwünscht. Der Ton des Umgangs ist nie flach, sondern herzlich. Dieselbe Herzlichkeit zeichnet die Einladungen im Hause Reichmann in Mauer aus, wo Oskar Reichmann und seine Frau Anja Gäste aus Heidelberg bewirten, Besucher aus aller Welt beherbergen und die Feinheiten historischer Lexikographie im Besonderen
XII
sowie das Verhältnis von Sprache, Gott und der Welt im Allgemeinen diskutieren. Die Autoren und Herausgeber dieses Bandes wünschen Oskar Reichmann alles Gute zu seinem 65. Geburtstag. Ein Band wie dieser kommt durch Mitwirkung vieler zustande. Unser Dank gilt zunächst den Autoren der Beiträge, die diese Gelegenheit zur Ehrung ihres Kollegen und Freundes - in einem Falle: des Ehemanns - gerne ergriffen haben. Auch den Mitarbeitern des Verlags Max Niemeyer danken wir herzlich, insbesondere Herrn Wolfgang Herbst, Frau Annette Soll und Frau Karin Wenzel. Ein besonderer Dank geht an Herrn Attila Nemeth (Veszprem), der die diffizile Arbeit der computertechnischen Einrichtung der Manuskripte übernommen hat.
Vilmos Ägel, Andreas Gardt, Ulrike Haß-Zumkehr, Thorsten Roelcke
Oskar Reichmann als Betreuer von Promotionen und Habilitationen
(aufgeführt werden ausschließlich Arbeiten, für die das Erstgutachten erstellt wurde; die Tätigkeit als Zweitgutachter bleibt ebenso unberücksichtigt wie die Zusammenarbeit mit Kollegen bei der Betreuung von Dissertations- und Habilitationsvorhaben)
Dissertationen
1984 Paul Schmidt
1985 Ulrike Haß
Gebrauchstheorie der Bedeutung und Valenztheorie. Untersuchungen zum Problem der Hypostasierung von Bedeutungen
Leonhard Schwarzenbachs „Synonyma". Beschreibung und Nachdruck der Ausgabe 1564
1987 John Adrian Hannah
Die Annäherung von Lehnelementen aus dem Englischen an das Deutsche als analogiebedingtes Interferenzphänomen
1988 Udo Benzenhöfer
Johannes' de Rupescissa „Liber de consideratione quintae essentiae omnium rerum" deutsch. Studien zur Geschichte der Alchemica medica im 15-18. Jh. Mit kritischer Edition des Textes
Thorsten Roelcke
Die Terminologie der Erkenntnisvermögen. Wörterbuch und lexikosemantische Untersuchung zu Kants „Kritik der reinen Vernunft"
xrv 1991 Christine Tauchmann Hochsprache und Mundart in den großen Wörterbüchern der Barock- und Aufklärungszeit 1994 Raja Tazi
1995 Marek Konopka
1996 Christoph Becker
1997 Dietmar Benkartek
Lexikalische Transferenzen vom Arabischen ins Deutsche
Strittige Erscheinungen der deutschen Syntax im 18. Jahrhundert
Sprachkonzeptionen der deutschen Frühaufklärung. Wörterbuch und Untersuchung
Ein interpretierendes Wörterbuch der Nominalabstrakta im Narrenschiff Sebastian Brants
Marion Frank
Der Aufbau der Wörterbuchartikel Jacob Grimms: etymologische Teile, Semasiologie, Geschichtsbegriff
Peter Schlesier
Deutsch-Skandinavische Wortsemantik
Tilmann Walter
Unkeuschheit und Werk der Liebe. Diskurse über Sexualität am Beginn der Neuzeit in Deutschland
1998 Jochen Bär
Sprachreflexion der deutschen Frühromantik. Konzepte zwischen Universalpoesie und grammatischem Kosmopolitismus. Mit lexikographischem Anhang
Barbara Gärtner
Das Rechenbuch von Johannes Widmann. Die Rolle der Textsorte „Rechenbuch" in der Mathematik-, Kultur- und Sprachgeschichte der Frühen Neuzeit
Sibylle Orgeldinger
Standardisierung und Purismus bei Joachim Heinrich Campe
XV
1999 Christiane Schlaps
Der „Genius der Sprache". Beleggeschichte und Typologie des Konzepts
2001 Dorothea Jecht
Studien- und Sprachprojekt Wilhelm von Humboldts
Habilitationen
1993 Andreas Gardt
Sprachreflexion in Barock und Frühaufklärung. Entwürfe von Böhme bis Leibniz
Thorsten Roelcke
Dramatische Kommunikation. Modell und Reflexion bei Dürrenmatt, Handke, Weiss
1994 Ulrike Haß-Zumkehr Daniel Sanders. Aufgeklärte Germanistik im 19. Jahrhundert
L Systematische und gegenwartsbezogene Aspekte
Vilmos Ägel/Roland Kehrein
Das Wort - Sprech- und/oder Schreibzeichen? Ein empirischer Beitrag zum latenten Gegenstand der Linguistik
1. Das Problem mit dem ,Wort' 1.1. Das latente Metakriterium 1.2. Wortidee oder Wortideen? 1.3. Sind Sprachzeichen Sprechzeichen und/oder Schreibzeichen? 1.4. Die (empirische) Aufgabe 2. Das/die Sprechzeichen^a 3. Wörter: Sprech- und/oder Schreibzeichen? 4. Literatur 5. Quellen 6. Anhang: akustische Analysen anderer Bedeutungen \onja
l. Das Problem mit dem ,Wort' 1.1. Das latente Metakriterium Irgendwann Mitte der 90er Jahre hat Oskar Reichmann in einer Heidelberger Vorlesung (sinngemäß) Folgendes gesagt: Ohne empirische Fundierung ist die lexikografische Praxis, die Konjunktion aber und die Abtönungspartikel aber in demselben Wortartikel abzuhandeln, zumindest fragwürdig. Denn es müsste zuerst empirisch überprüft werden, ob es sich um einen oder um zwei verschiedene Signifikanten handelt. Wenn es nämlich zwei wären, ginge es ja auch um zwei verschiedene Sprachzeichen.
Das Problem, das hier - unter einem sehr bemerkenswerten Aspekt - angesprochen wird, ist die .Einheit des Wortes', d.h. letztendlich die Definitionskriterien des Begriffs ,Wort'. Reichmann (1976, 4ff.) zählt und diskutiert insgesamt 13 Kriterien und kommt zu der (natürlich immer noch gültigen) Feststellung, dass sich die Kriterien nicht in allen Fällen decken. Es ist nicht unser Anliegen, in die grammatisch-lexikologische Debatte um die Definitionskriterien einzugreifen und auf diesem Wege einen Beitrag zur Problematik des Wortbegriffs zu leisten. Vielmehr möchten wir, wenn man es so sagen darf, zu dem .Metadiskurs' um den Wortbegriff beitragen. Wir wollen also nicht die Brauchbarkeit oder die Tragweite eines oder mehrerer Kriterien unter die Lupe nehmen, sondern den methodologischen Status des Diskurses selbst und vor allem die sich aus diesem ergebenden theoretischen Implikationen empirisch untersuchen. Wo liegt aber das Problem?
4
Vilmos Ägel/Roland Kehrein
Wir meinen, dass es unter den 13 Kriterien eines gibt, das - nicht nur im Wortdiskurs, sondern allgemein in der Linguistik - immer wieder (meist) stillschweigend zu einer Art diagnostischer Bedingung oder Bezugspunkt der übrigen Kriterien erhoben worden ist und auch wird. Es handelt sich um das Kriterium der „Einheit des Schriftbildes" (Reichmann 1976, 4), das also - wohl notwendigerweise - zu einer Art (meist) latentem Metakriterium avanciert ist. Diese unsere Überzeugung soll durch einen kurzen und lediglich exemplarischen .linguistischen Streifzug' belegt werden: 1. Es ist wohl unbestreitbar, dass unser vorwissenschaftliches Verständnis von ,Wort', das wir die literale Idee von Wort (im Folgenden: LIW) nennen wollen, zumindest zum Teil auf den spatia basiert: Für den sprachlichen Normalverbraucher ist Wort meist etwas, was beim Schreiben durch Zwischenräume abgetrennt wird. (Vater 1994, 70) Pre-theoretical notions of the word as a linguistic unit are strongly influenced by the graphic representation of words in writing. (Coulmas 1996,550)
Da LIW natürlich nicht universal sein kann, stellt sich aber einerseits die Frage, ob eine Wortidee auch in oralen Kulturen nachweisbar ist, und wenn ja, worauf dann diese basiert. Andererseits stellt sich die Frage, ob LIW, die ja auch auf den spatia basiert, an die Alphabetschrift gebunden ist, und wenn ja, ob sie von der jeweiligen historischen Erscheinungsform der Alphabetschrift unabhängig ist oder nicht. (Auf diese Fragen kommen wir in 1.2. zu sprechen.) 2. Die Typen von Fragestellungen in der Fachliteratur, die sich mit dem Problem des Wortbegriffs auseinandersetzt, sind bisher in einer Weise perspektiviert, dass das latente Metakriterium nicht zu übersehen ist. Typische Fragen sind etwa: »Wie ist der wortgrammatische Status von Verschmelzungen wie ins, am, zum usw.?«; »Wie beurteilt man wortgrammatisch diskontinuierliche (!) Sprachzeichen wie kommt...an, wird...gemacht, hat...gearbeitet usw.?« (siehe etwa Vater 1994, 70f.) Noch nicht gefragt wird hingegen: „Wie beurteilt man Sprachzeichen wie erklärbar, verschwinden, selbstverständlich usw.?" Diese werden zumeist als unproblematische Repräsentanten des Wortbegriffs angesehen.1 3. Man kann sich des Eindrucks nicht erwehren, dass die moderne Wortbildungsforschung, die sich mit dem Wortbegriff ja eigentlich , Amts wegen' auseinandersetzen müsste, lieber zum Tagesgeschäft übergegangen ist.2 Was ein Wort ist, wird nicht mehr erörtert, die Grenze zwischen Wort- und Satzgram-
Problematisch können sie erst werden, nachdem man schon den Versuch unternommen hat, ,Wort' explizit zu definieren. Dann ist es nämlich sehr wohl möglich, dass man (durch die eigene Definition) gezwungen (worden) ist, etwa das voll motivierte Derivat erklärbar als zwei Wörter anzusehen (siehe dazu Reichmann 1976, 8). Das ist nicht als Kritik, sondern einfach als .Tatsachenfeststellung' gemeint.
Das Wort - Sprech- und/oder Schreibzeichen?
5
matik wird nicht etwa anhand der Kriterien .Idiosynkrasie vs. Systematik', ,Usualität vs. Okkasionalität' oder eben .Lexikalisiertheit vs. Nichtlexikalisiertheit', sondern ganz offensichtlich - allerdings stillschweigend - anhand des Kriteriums ,Zusammen- vs. Getrenntschreibung' gezogen (siehe etwa Motsch 1999 und Eichinger 2000). 4. In der mit der Wortbildungsforschung partiell verwandten Phraseologieforschung herrscht seit jeher Konsens darüber, dass die Mehrgliedrigkeit, d.h. die Kombination von mindestens zwei Wörtern, ein konstitutives Merkmal phraseologischer Einheiten darstellt (z.B. Burger 1998, 16 und Hessky 2000, 2102).3 Unter ,Wort' wird in der Phraseologieforschung ganz offensichtlich die durch Zwischenräume abgetrennte graphische Einheit verstanden. 5. Die Flexionsmorphologen, die sich mit dem Wortbegriff ebenfalls , Amts wegen' auseinandersetzen müssten, diejenigen nämlich, die Wortartensysteme aufgestellt haben, diskutieren in der Regel nicht das Was, sondern vielmehr das Wie der Klassifizierung (zum Überblick siehe Knobloch/Schaeder 2000). Daher liegt der Verdacht nahe, dass ihre Archimedischen Punkte ebenfalls die Druckerschwärzen zwischen den spatia sind.4 6. Auch wenn Syntaktikerlnnen u.U. vehement ableugnen, dass sie irgendetwas mit den graphischen Einheiten zwischen spatia zu tun hätten (z.B. Dürscheid 2000, 20), diskutieren sie die Möglichkeiten einer Grenzziehung zwischen Wort- und Satzgrammatik genauso wenig wie die Morphologen.5 Selbst in einer der anspruchsvollsten Syntaxen der Gegenwartssprache kann man sich heutzutage mit der schlichten Feststellung „Sätze bestehen aus Wörtern" (Eroms 2000, 19) begnügen, ohne Angst haben zu müssen, dass die Rezensentinnen diesen Satz und seine knappe Erläuterung monieren würden. 7. Last, but not least möchten wir erwähnen, dass auch die berechtigte Forderung, die Getrennt- und Zusammenschreibung auf grammatische Grundlagen zu
Feilkes Theorie der „idiomatischen Prägung" (Feilke 1998) würde ein geeignetes Dach bieten, unter dem Wortbildung und Phraseologie gemeinsam untergebracht werden könnten (und vielleicht auch sollten). Paradigmatisch scheint uns hierfür der Fall der Verschmelzungen zu sein. Diese sog. phonologischen Wörter (Vater 1994, 71) wollen nicht als eine eigene Wortart anerkannt werden, obwohl sie sich mindestens genauso stark von ihren Primärformen ,weggrammatikalisiert' haben wie die als eine eigene Wortart etablierten Abtönungspartikeln von ihren Primärformen. Wenn die Verschmelzungen ausnahmsweise doch als eine eigene Wortart aufgefasst werden, werden sie paradoxerweise definiert, als würden sie aus zwei Wörtern, die zu zwei verschiedenen Wortartarten gehören, bestehen. So betrachten Bergenholtz/ Schaeder (1977, 133ff.) die Verschmelzungen als eine eigene Wortart, der Name der Wortart - „Präposition mit enklitischem Artikel" - legt jedoch den Verdacht nahe, dass es sich dabei um eine Art Wortartenkomposition handelt. Das ist auch nicht kritisch gemeint.
6
Vilmos Agel/Roland Kehrein
stellen (Eisenberg 1998, 31 off.) die Überzeugung impliziert, dass die (angenommene) primäre Organisation der Grammatik in Wort und Satz wissenschaftlich erst dann richtig .handhabbar' werden würde, wenn sie auch graphisch sichtbar gemacht würde. Dies deutet wiederum auf die ,magische Macht' der Zwischenräume hin. An dieser Stelle brechen wir unseren kleinen linguistischen Streifzug' ab und hoffen, dass es uns gelungen ist zu vermitteln, dass LIW zumindest zum Teil auf den spatia basiert. Des Weiteren hoffen wir, dass es uns gelungen ist dafür zu argumentieren, dass das Kriterium der „Einheit des Schriftbildes" (im Folgenden: KES) nicht als eines, das sich „nur auf die schriftliche Wiedergabe eines Worts bezieht" (Vater 1994, 70), abgetan werden kann, sondern dass es ganz im Gegenteil den - übergangenen, anerkannten oder eben theoretisch abgelehnten (und trotzdem praktizierten) - Bezugspunkt für die anderen Kriterien darstellt.
1.2. Wortidee oder Wortideen? Wenn KES den latenten Bezugspunkt der modernen wortbasierten Forschungen darstellt, stellt sich, wie in 1.1. erwähnt, einerseits die Frage, ob eine Wortidee auch in oralen Kulturen nachweisbar ist, andererseits die, ob LIW an die Alphabetschrift gebunden ist.6 Was die erste Frage anbelangt, gibt es kontroverse Positionen. Nach einem der ,Oralitätsklassiker' unterscheidet sich die orale Idee von Wort (im Folgenden: ORIW) entscheidend von LIW: Die Auffassung von isolierten Wörtern als bedeutungstragende, isolierte Einheiten wird durch das Schreiben begünstigt, welches f...] zergliedernd und trennend ist. (Ong 1987,65) Ohne die Schrift besitzen die Wörter als solche keine visuelle Präsenz [...]. Sie sind Klänge. (Ong 1987, 37)
Diese „Klänge" seien nicht durch Bedeutungshaftigkeit, sondern vielmehr durch „Ereignishaftigkeit" charakterisierbar (Ong 1987, 38).7 Linguistisch gesehen folgt aus Ongs (und Malinowskis) Auffassung, dass ORIW dynamisch und prozessorientiert, LIW dagegen statisch und produktorientiert ist. Semiotisch gesehen folgt aus ihr, dass ORIW nicht auf der Verbin-
Da der Terminus .Wortforschung' besetzt ist, müssen wir auf den zugegebenermaßen umständlichen Ausdruck .wortbasierte Forschung' ausweichen. Darunter verstehen wir jede Art linguistischer Forschung, die explizit oder implizit mit einem Wortbegriff arbeitet. Es sei an dieser Stelle auch an Bronislaw Malinowskis klassische Studie (engl. Original: 1923) erinnert, in der die Funktion primär oraler Sprache als „Handlungsmodus" und nicht als „Instrument der Reflexion" charakterisiert wird (Malinowski 1974, 346). Orale Wörter seien nach Malinowski nicht deskriptiv (wie die literalen), sondern sie würden „Aktionsmodi" darstellen (ebd., insb. 359-367). In oralen Kulturen benutzt man ein Wort „dann, wenn es ein Handeln hervorrufen kann, nicht um ein Handeln zu beschreiben [...]" (ebd., 361).
Das Wort - Sprech- und/oder Schreibzeichen?
7
düng von Signifikant und Signifikat basiert, sondern auf der Beziehbarkeit eines „Klanges" auf ein Ereignis oder - in Anlehnung an die moderne Semiotik formuliert - auf einer .klingenden' Zeigehandlung (siehe dazu Trabant 1996, 90ff). Ongs (und Malinowskis) Semiotik impliziert also die Unterscheidung zwischen einem oralen Sprechzeichen, mit dem man handelt, und einem literalen Schreibzeichen, mit dem man beschreibt/referiert/repräsentiert. Daher muss sich in ORIW eher die pragmatische Organisation des Sprechens widerspiegeln, während sich LIW an die grammatische Organisation der Sprache anlehnt. Insofern ist es äußerst unwahrscheinlich, dass durch die Einführung der spatia die ,oralen Wörter' lediglich verstärkt ins Bewusstsein treten würden, wie etwa von Hans-Martin Gauger, einem Vertreter der Gegenposition, behauptet wird: Zum Beispiel ist die Behauptung schwer haltbar, dass erst die Schrift ein Wortbewußtsein vermittelt habe, so als hätten die Sprechenden in jenem Jenseits der Schrift' nicht über ein intuitives Wissen darüber verfugt, was ein Wort ist. Als ob dazu die Schrift notwendig gewesen wäre! Als ob das Wort ein Produkt wäre der Schrift! [...] Ein intuitives Wissen über das, was ein Wort ist, gab und gibt es also vor und unabhängig von jeder Schrift. Wobei wir wiederum sehen müssen, daß die Schrift, dann speziell die Einführung der Abstände, der .spatia' zwischen den Wörtern, welche Wortbewußtheit bereits zur Voraussetzung hat, dies Bewußtsein weiter verstärkten. (Gauger 1994,47)
Zuzustimmen ist dagegen Gauger, wenn er betont, dass es ein „Wortbewußtsein" vor und unabhängig von jeder Schrift gebe. Es ist aber eben ein völlig anderes „Wortbewußtsein": Non-literate cultures [...] have a different concept of the word than literate cultures. (Coulmas 1996, 550)
Eine kompetente Antwort auf die zweite Frage, ob nämlich LIW an die Alphabetschrift gebunden ist, geht leider über unsere Möglichkeiten hinaus. Doch können wir uns kaum vorstellen, dass das vorwissenschaftliche literale Wortverständnis etwa in Korea mit dem etwa in Deutschland vergleichbar wäre. In der Hangui-Schrift sind es nämlich die Repräsentationen von Silben, die einen graphischen Block bilden und durch spatia abgetrennt werden (Coulmas 1996, 277). Daher liegt es nahe anzunehmen, dass die ,koreanische LIW' eine Art Silbenblockidee ist. Wir denken also, dass man mit verschiedenen Typen von LIWs zu rechnen hat und dass folglich die oben in Anlehnung an Ong (und Malinowski) erfolgte linguistisch-semiotische Charakterisierung von LIW lediglich auf die .alphabetische LIW' zutrifft.8 Es wäre allerdings naiv zu glauben, dass die diversen Schreibtraditionen, in denen die Alphabetschrift historisch erscheint, LIW nicht berührt hätten. Wie erwähnt, baut unsere »moderne LIW' auf die spatia, deren Erscheinung aber an eine bestimmte Stufe der historischen Entwicklung der Alphabetschrift gebunden ist. Sie hätte sich zu der Zeit der lateinischen und frühmittelalterlichen scriptio continua nicht herausbilden können.
Der Einfachheit halber verstehen wir im vorliegenden Beitrag unter ,LIW' immer die .alphabetische LIW'.
8
Vilmos Agel/Roland Kehr ein
Diese unsere Überzeugung ist nicht einfach in dem ,gesunden Menschenverstand' begründet, sondern folgt auch aus dem sehr überzeugenden evolutionären Sprache/Schrift-Modell von Hartmut Günther (1995): Günther geht davon aus, dass die Quasi-Objektivierung des Sprechens in der Schrift ein langer historischer Prozess ist, dem sich die Beschreibungen der Grammatiker sukzessive angepasst haben. Er rekonstruiert diesen Prozess, dessen Stadien an der Veränderung der äußeren Form von Schriftzeichen und Schriftstücken nachzuvollziehen seien, nach dem folgenden Leitprinzip: Die Schrift fungiert als Modell für die (Analyse der) Lautsprache. (Günther 1995, 17)
Den entscheidenden Schritt in der Veränderung der äußeren Form von Schriftstücken stelle der Übergang von der sog. phonographischen in die sog. grammatische Phase dar (ebd., 21). Dabei geht es um die Einführung des Wortzwischenraumes, der die grammatische Gliederung der ehedem partiturähnlichen Texte einleitet. Im Geschriebenen beginne die grammatische Organisation sichtbar zu werden. Damit entfallt die für die phonographische Phase charakteristische notwendige Rückkopplung des Geschriebenen an das Gesprochene. Buchstabierendes und lautes Lesen des MA wird vom leisen bzw. stummen Lesen abgelöst.9 Aus diesem sehr plausiblen Modell folgern wir, dass bei literalisierten Menschen der phonographischen Phase ORIW nicht mehr funktioniert, ohne dass sie durch LIW bereits ersetzt worden wäre. In dieser Zeit des »Interregnums' könnte man daher - bezogen auf Literalisierte - wohl viel eher von einer Graphemidee als von einer Wortidee sprechen.
1.3. Sind Sprachzeichen Sprechzeichen und/oder Schreibzeichen? Das Problem, dass KES den latenten Bezugspunkt der wortbasierten Forschungen darstellt, das Problem also, dass die wortbasierte Forschung auf einer verschrifteten, ja verschriftlichten Wortidee basiert, ist alles andere als ein intern zu lösendes Detailproblem einiger weniger linguistischer Disziplinen wie Morphologie, Lexikologie, Lexikografie oder Metalexikografie.10 Worauf auch Oskar Reichmann in der zitierten Heidelberger Vorlesung - vordergründig auf die Lexikografie bezogen - abgehoben hat, ist nämlich gerade, dass im Grunde die gesamte moderne Linguistik - ob bei der Theoriebildung oder bei der Theorieanwendung, ob explizit oder implizit - in irgendeiner Form mit .Wörtern' zu tun
Das ist aber sicherlich ein langer Prozess. Goody und Watt rechnen in ihrer klassischen Studie „Konsequenzen der Literalität" damit, dass „man vor der Erfindung der Buchdruckerkunst selten für sich still las [...]." (Goody/Watt 1986, 85) Mit „Verschriftung" meinen Koch und Oesterreicher den medialen, mit „Verschriftlichung" den konzeptionellen Aspekt der Literalisierung (Koch/Oesterreicher 1994, 587). Zu der Unterscheidung .Medium vs. Konzeption' vgl. Soll 1985, 17ff. bzw. Koch/ Oesterreicher 1985 und 1994.
Das Wort - Sprech- und/oder Schreibzeichen?
9
habe, dass sie aber an ihrem deklarierten Gegenstand, dem Saussure'schen „mot parle", latent ,vorbeiarbeite', wenn sie sich nicht (nur) an den Sprechzeichen, sondern (auch) an den Schreibzeichen - an dem Schriftbild - orientiere."
Was Reichmann meint und was auch wir am Beispiel der Wortidee(n) nachzuweisen versuchten, ist mit einem anderen Wort, dass die moderne Sprachwissenschaft skriptizistisch ist. Diese „scriptist bias of modern linguistics" (Harris 1980, 8) bedeutet u.E. genauer, dass die führenden Sprach- und Grammatiktheorien des 20. Jhs. ein .Doppelleben' führen: 1. Per declarationem sind sie logozentrisch (Derrida 1983, 53ff.), verkünden also das Primat des „mot parlo". 2. Qua Implikationen der jeweiligen Theorien muss jedoch auf das latente Primat des „mot ecrit" geschlossen werden. Dabei geht es einerseits um eine schrift(mit)induzierte extensionale Gegenstandskonstitution auf der Ebene der .Daten', andererseits um eine schrift(mit)induzierte intensionale Gegenstandskonstitution auf der Ebene der Theorien.12
An dieser Stelle möchten wir betonen, dass man u.E. einen Unterschied zwischen Skriptizismus und Schrifibezogenheit machen muss. Der Ausdruck Skriptizismus ist insofern negativ konnotiert, als er einen Widerspruch zwischen Theorie und , Wirklichkeit' beschreibt. Dagegen ist der Ausdruck Schrifibezogenheit neutral. Semiotisch gesprochen besteht der Skriptizismus darin, dass man (als deklarierter Logozentriker) der Auffassung ist, dass die etwa in den Wörterbüchern präsentierte ausdrucksseitige Diskretheit und Konstanz der ,Sprachzeichen' auf der phonologischen Analyse von Sprechzeichen beruhe, dass aber in Wirklichkeit das Konzept des ,Sprachzeichens' zumindest teilweise schriftinduziert ist und sich nicht nur an die Sprechzeichen, sondern auch an die Schreibzeichen anlehnt.
In der deutschen Übersetzung lautet die Saussure'sche Bestimmung des Objekts der Sprachwissenschaft (CLG, 28): „Sprache und Schrift sind zwei verschiedene Systeme von Zeichen; das letztere besteht nur zu dem Zweck, um das erstere darzustellen. Nicht die Verknüpfung von geschriebenem und gesprochenem Wort ist Gegenstand der Sprachwissenschaft, sondern nur das letztere, das gesprochene Wort allein ist ihr Objekt." Zum Nachweis des Skriptizismus der führenden (und explizit logozentrischen) Sprach- und Grammatiktheorien des 20. Jhs. am Beispiel von Saussure und Chomsky siehe Ägel 2002. Zum Skriptizismus aus der Sicht der (besonders betroffenen) Gesprochenen-Sprache-Forschung siehe Fiehler 2000.
10
Vilmos Ägel/Roland Kehrein
1.4. Die (empirische) Aufgabe Dem aufmerksamen Leser ist unsere Formulierung, dass LIW zum Teil auf den spatia basiert, nicht entgangen. In der Tat will man mit KES nicht nur die durch die spatia abgesteckten - syntagmatischen, sondern auch die paradigmatischen Grenzen des literalen ,Wortes' erfassen. In diesem Sinne gelten etwa Saite und Seite oder Seite und Seide als je zwei verschiedene „Einheiten des Schriftbildes", d.h. als je zwei verschiedene literale ,Wörter'. Entscheidend ist hierfür die ausdrucks- und die inhaltsseitige Distinktivität. Während das Kriterium für die inhaltsseitige Distinktivität zumindest prinzipiell klar ist (Homonymie vs. Polysemie), scheint uns, dass eine theoretische Auseinandersetzung mit der Problematik der ausdrucksseitigen Distinktivität und deren Beziehung zu der inhaltsseitigen Distinktivität immer noch ein Desiderat darstellt. Was wir damit meinen, soll erneut an dem Fall .Abtönungspartikeln vs. Verschmelzungen' angedeutet werden: Wie erwähnt, ist der Grammatikalisierungsabstand zwischen Verschmelzungen (z.B. im, am, zum) und ihren Primärformen (in dem, an dem, zu dem) durchaus mit dem zwischen Abtönungspartikeln und ihren Primärformen vergleichbar. In der Partikelforschung geht man davon aus, dass es sich dabei um Polysemie handelt, weil die jeweilige Primärbedeutung und die jeweilige(n) Abtönungsbedeutung(en), wenn auch u.U. nur mit ,Ach und Krach', unter einer sog. „Gesamtbedeutung" (Hentschel/Weydt 1994, 285 f.) subsumiert werden könnten.13 Die Annahme einer „Gesamtbedeutung" scheint auszureichen, um stillschweigend - auch die ausdrucksseitige Einheit des Wortes zu postulieren. Dass hier ein ganz klarer Fall der latenten Arbeit mit KES vorliegt, sieht man einerseits daran, dass das Problem des Wortstatus nur bei den Verschmelzungen, die sich ja auch optisch von ihren Primärformen unterscheiden, auftaucht. Hier reichen also vergleichbare „Gesamtbedeutungen" nicht mehr aus. Das ist umso merkwürdiger, als andererseits selbst bei ausdrucksseitigen Unterschieden zwischen betonten und unbetonten Formen (!) derselben (!) Abtönungspartikel die Inhaltsseite als entscheidend angesehen wird:14 Dabei kann man einheitliche, ,übergreifende' Bedeutungen der Partikeln, die ihren betonten und unbetonten Formen gemeinsam sind, annehmen. Somit entfallt die Notwendigkeit, Verfahren, die sonst dem deutschen Sprachsystem fremd sind (zeichenunterscheidende prosodische Verfahren) in die Beschreibung mit aufzunehmen. (Weydt 1986,402)
Soweit unsere ,theoretische Diagnose', die (u.a.) die folgende empirisch anzugehende Aufgabe induziert:
Dabei ist eine immer wieder bemerkte terminologische Merkwürdigkeit der Partikelforschung, dass Primärform und Abtönungspartikel - meist in Anführungszeichen gesetzt als .Homonyme' bezeichnet werden. Weydt versteht unter der »übergreifenden Bedeutung' die semantischen Merkmale, „die allen Vorkommen einer Abtönungspartikel gemeinsam sind." (Hentschel/Weydt 1994,285)
Das Wort - Sprech- und/oder Schreibzeichen?
11
Definieren die ausdrucksseitigen paradigmatischen Grenzen des literalen .Wortes' Sprechzeichen und/oder Schreibzeichen? Anders gefragt: Ist LIW .lediglich' kraft der spatia schriftbezogen, oder auch kraft der (latenten) paradigmatischen Anwendung von KES?
Im Folgenden wollen wir uns dieser Aufgabe am Beispiel der empirischen Analyse der Partikel ja (Schriftbild) zuwenden. Von den Ergebnissen dieser Analyse erwarten wir nicht nur eine Antwort auf die oben formulierte Frage, sondern auch Antworten oder Teilantworten u.a. auf die folgenden ebenfalls heiklen theoretischen Fragen: 1. Wie sollte man verfahren, wenn es sich nachweisen ließe, dass die Linguistik nicht nur auf der .hohen' Ebene der Sprach- und Grammatiktheorien, sondern auch in ihrem , Arbeitsalltag' skriptizistisch ist? Den Skriptizismus und die Schriftbezogenheit wenigstens im ,Arbeitsalltag' abschaffen? Oder den Skriptizismus abschaffen, aber sich offen zu der Schriftbezogenheit bekennen und das Bekenntnis zu begründen suchen (in der Hoffnung, dass man auf diese Weise irgendwann auch auf der .hohen' Ebene der Sprach- und Grammatiktheorien ankommt)? 2. Die erste Frage ist eng verbunden mit der folgenden: Ist es nicht grundsätzlich verfehlt, wenn Literalisierte die Schriftbezogenheit abschaffen wollen? Denn in der Tat dürfte es trotz eventueller segmentaler und prosodischer Unterschiede so etwas wie ein .Gefühl' der Einheit eines geschriebenen .Wortes' geben. Sollten die wortbasierten Forschungen dieses .Gefühl' ignorieren? 3. Sollte man die berechtigte Forderung nach der .Emanzipation' der Gesprochenen-Sprache-Forschung so verstehen, dass man die Aufgabe hat nachzuweisen, dass das .Gefühl' der Einheit des geschriebenen .Wortes' in der konzeptionellen Mündlichkeit gar nicht existiert? 4. Sind ,Wortarten' Klassen von Sprechzeichen, Klassen von Schreibzeichen oder vielleicht beides? 5. Und schließlich die entscheidende theoretische Frage: Sollte das „mot parle" auch als der Gegenstand der Linguistik des 21.Jhs. (re)defmiert werden? Wäre eine Rückkehr zu Saussure durch eine neue theoretische Attacke gegen das „mot ecrit" angemessen?
2. Das/die Sprechzeichenya Unsere empirischen Analysen richten sich exemplarisch auf den Signifikanten hier zunächst im Sinne von ,Signifikant des Schreibzeichens' -ja. In dem (einzelnen) Wörterbucheintrag von Dudens Deutschem Universalwörterbuch werden sieben primäre, insgesamt zwölf Bedeutungen von ja angegeben. Ob diesen Bedeutungen - analog zum Schreibzeichen - ein einziges Sprechzeichen entspricht, obwohl bereits in dem Wörterbuchartikel prosodische Unterschiede angegeben sind, war die leitende Fragestellung unserer Analysen (siehe 1.4.). Die Hypothesen wurden an mindestens einem Beleg je Bedeutung nach Duden überprüft. Zusätzliche Belege wurden für typische Kombinationen von ja (vgl. Thurmair 1989, 208-215) berücksichtigt. Die Texte für die insgesamt 26 Bedeutungen von ja stammen aus den IDS-Korpora und wurden von jeweils
12
Vilmos Ägel/Roland Kehr ein
fünf Sprecherinnen laut vorgelesen.15 Die Belege für die Bedeutungen nach Duden waren:16 1a
drückt eine zustimmende Antwort auf eine Entscheidungsfrage aus ...„Ich sollte mich hier mit einem Herrn treffen, den ich gar nicht kenne." Ja, das erwähnten Sie schon." ... „Wenn ich Sie vorhin richtig verstanden habe, geht es doch um irgendeine geschäftliche Angelegenheit." Ja, mein Chef ist mit Dr. Blomhardt in Hameln befreundet, sie sind Geschäftspartner"... (Bälden, 7)
Ib
drückt in Verbindung mit einem Modaladverb [freudige] Bekräftigung aus ...„Darf ich Ihnen erst noch eine Tasse Kaffee anbieten?" schlug Gabriele vor, weil er einfach nur stumm stehenblieb. ,Ja, gern, danke vielmals."... (Bälden, 27)
2
(betont) nachgestellt bei [rhetorischen] Fragen, auf die eine zustimmende Antwort erwartet wird, als Bitte, Ausdruck leisen Zweifels od. Bestätigung; nicht wahr? ...„Wenn es dir bessergeht, fahren wir beide mit der Kutsche spazieren, ja! Du wirst ja viel frische Luft brauchen"... (de Groot, 51)
3a
(unbetont) drückt im Aussagesatz eine resümierende Feststellung aus, weist auf etw. Bekanntes hin od. dient der Begründung für ein nicht explizites Geschehen od. für etw. Allgemeingültiges ...„Natürlich!" schrie der Fürst ironisch auf. „Dir liebt euch! Ihr kennt euchy'a schon seit einer Ewigkeit! Habt ihr vielleicht auch schon zusammen geschlafen?"... (Torwegge, 9) Partikelkombinationen: ...„Glänzend geschrieben, aber ziemlich gemein". „Nun ja", sagte ich, „er isty'a auch ein Christ". „Sie etwa nicht?"... (Böll, 109) ...Es ist nur arg, daß man uns das nicht von vomeherein klarmacht. Aber hätte es denn einen Zweck? Wir könnten es ja doch nicht aufnehmen. Also, wie gesagt, Kindchen, wenn schon nicht Glück, dann wenigstens Zufriedenheit.... (Bergengrün, 47) ...Die ursprüngliche Annahme Virchows, daß jeder Krankheit eine Veränderung von Zellen oder Zellsystemen entspreche und damit jede Krankheit an einen Ort im Körper gebunden sei, warya eben nur eine Annahme.... (Bamm, 92) ...„Sie sollen mich loslassen! Ich kann toben, so lange ich will, ich mußy'a sowieso sterben. Ihr habt es alle gewußt."... (Stephan, 41)
15
16
Bei den Texten lagen vor und nach dem ja jeweils ca. fünf bis zehn Sätze, so dass der Zweck unserer Aufnahmen nicht erkannt werden konnte. Bei den Sprecherinnen handelte es sich um Mitarbeiter und Studierende an der Universität Marburg im Alter zwischen 20 und 30 Jahren, die alle überwiegend ein standardnahes Register verwenden. Unser Korpus hat einen Gesamtumfang von 130 Aufnahmen. Wir übernehmen sowohl die Nummerierung als auch die Bedeutungsangaben durch (sog.) erklärende Umschreibungen und - sporadisch - durch Synonyme (kursiviert) aus dem Duden. Die Belege für die Partikelkombinationen wurden in die Duden-Gliederung integriert. In den zitierten Belegstellen wurden die betreffenden jas von uns durch Kursivierung hervorgehoben.
Das Wort - Sprech- und/oder Schreibzeichen?
3b
13
...„Weil ich bettelarm bin und kein Geld habe", stöhnte er. Ulrikes Augen verengten sich. Das war ja wohl die dümmste Ausrede, die er sich einfallen lassen konnte.... (Uhl, 20) ...Anschaulich war/'a schon gewesen, daß die amtlichen Beschriftungen in Antiqua und in cyrillischen Zeichen gefertigt waren.... (Heuss, 305) ...Wollte Herr Karsch sich dazu verstehen? Man kann esy'a mal versuchen. Aus besorgter Augenenge schweigend starrte sie neben ihn... (Johnson, 127) (unbetont) drückt im Aussage-, Ausrufesatz Erstaunen über etw. od. Ironie aus ...Dabei machte er zwei, drei schlurfende Schritte tiefer in den Raum. „Da bist du ja endlich!" sagte eine schneidende Stimme von der Theke.... (Pegg, 46)
3c
(unbetont) einschränkend, meist in Korrelation mit aber ...„Du hättest sie heiraten sollen", sagte Sabine leise, „ich meine - ach, du weißt, was ich meine". „Ich weiß", sagte ich, „ich wollte ja, aber dann kam heraus, daß man diesen verfluchten Schein vom Standesamt haben muß."... (Boll, 255) ...„Nachts ging sie im Schloß spazieren. Ein bißchen Bewegung brauchte sie ja. Aber sie war oft ungebärdig und sehr unhöflich zu der gnädigen Gräfin."... (Uhl, 60)
4
(betont) in Aufforderungssätzen als Ausdruck dringender Mahnung; unbedingt, ganz bestimmt; auf jeden/keinen Fall ...„Den Rauch vom Schießpulver haben wir bis oben hin gerochen", schildert ein Hausbewohner: „Meine Frau hat gesagt, geh'ja nicht "runter." ... (FR, 2) Partikelkombinationen: ...Der wischte sich die Hände an den Hosen ab - eine typische Malerbewegung und drohte, bevor er verschwand: „Daß du mir ja nix von meinem Fisch nimmst!" Oskar aber hatte genug vom Fisch.... (Grass, 457) ...„Oho", hatte der Wimmer Sepp ihn unterbrochen, „täusch dich nur ja nicht, mein Lieber. Ich bin keiner von denen, die neugierig die Post durchschnüffeln!"... (Jung, 12)
5
(unbetont) zur steigernden Anreihung von Sätzen od. Satzteilen; mehr noch; sogar; um nicht zu sagen ...Nicht einmal das Läutwerk, das sonst empfindlich, ja fast hysterisch auf den geringsten Stoß, auf draußen vorbeirollende Bierwagen reagierte, zeigte sich durch meinen Schrei beeindruckt.... (Grass, 52) ...Den Dr. Werner wollte ich vertreiben, bloßstellen, ihn der Pfuscherei, ja sogar der fahrlässigen Tötung während einer Kehlkopfoperation bezichtigen. ... (Grass, 404) ...Die Höflichkeit kann so bis zur unpersönlichen Form werden, man kann auch den unsympathischen Menschen mit derselben, ja vielleicht mit einer größeren Höflichkeit behandeln, als den sympathischen.... (Bollnow, 84) ...Alle unsere 367.000 großen Vierbeiner gehen während der Regenzeit Wochen, ja Monate restlos über die neuen Ostgrenzen hinaus, mit denen man jetzt den Serengeti-Nationalpark abgrenzen wird, das wissen wir nun.... (Grzimek, 191)
6a
(betont od. unbetont) reiht einen Satz an, in dem konzessiv Bezug auf vorangegangene Aussagen od. Gedanken genommen wird; allerdings ...Nun, glücklich bin ich wahrscheinlich nicht gewesen, aber zufrieden, -ja, das
14
Vilmos Agel/Roland Kehrein war ich wohl. Ich habe gute Kinder gehabt, und mit der Gesundheit ist es die längste Zeit auch gegangen.... (Bergengrün, 45) 6b
(betont od. unbetont) bestätigt die Berechtigung einer vorangegangenen Frage
7a
...Hätte das nun nicht immer so fortgehen können, ja, hätte es nicht eigentlich so fortgehen müssen?... (Bergengrün, 26) (allein stehend) dient dazu, sich am Telefon zu melden ...Er übergab den Hörer mit einer vielsagenden Vemeigung dem Prinzen. „Ja, wer ist da?" fragte Prinz Flavio.... (Larsen, 45)
7b
(allein stehend) drückt einen Zweifel, eine Frage aus, wenn man etwas nicht verstanden hat od. glauben will ...„Hmm, ich liebe Püree", schnalzte Klaus mit der Zunge. „So? JaT' kam es fast tonlos über Barbaras Lippen. „Darum habe ich auch so viel Kartoffelpüree gemacht."... (Torwegge, 43)
Die Aufnahmen wurden sowohl auditiv - Segmentierung pragmatischer/redesyntaktischer Basiseinheiten17 und Notation von Akzentpositionen und -stärken sowie phonetische Transkription der jas - als auch größtenteils akustisch - Ermittlung der Grundfrequenz-, Intensitäts- und Dauerwerte - analysiert.18 Die Analysen fuhren uns zunächst zu den folgenden beiden allgemeineren Ergebnissen: 1. Die fünf Realisationen vony'a sind bei 25 der 26 Belege gleich, d.h. zwischen den Sprecherinnen sind keine Unterschiede hinsichtlich der Ausdrucksseite der jeweiligen Bedeutung zu beobachten. Lediglich bei 6b - Bestätigung der Berechtigung einer vorangegangenen Frage - wird dasya von drei Sprecherinnen akzentuiert, von zweien aber nicht. Diese Variabilität wird allerdings auch im Duden angegeben (siehe auch Ergebnis 2). 2. Die Realisationen von Ja in unserem Korpus stimmen mit den Angaben soweit vorhanden - in dem Wörterbuchartikel des Duden überein. Diese Übereinstimmung betrifft sowohl die (Nicht-)Akzentuierung als auch das Auftreten von ja als selbständiger pragmatischer Basiseinheit (Funktionen l a sowie 7a und 7b). Über die Angaben im Duden hinausgehend realisieren unsere Spre-
Pragmatische/redesyntaktische Basiseinheit (im Nachfolgenden abkürzend als pragmatische Basiseinheit) bedeutet, dass die betreffende (Teil-)Äußerung im Kontext äußerungssemantisch vollständig ist, eine erkennbare Äußerungsabsicht hat und mit einem Intonationsmuster korreliert (vgl. dazu auch Kehrein 2001). Zu beachten ist dabei, dass die Redesyntax nicht mit der schriftlichen Vorlage übereinstimmen muss. Zu allen Ausführungen zur Prosodie vgl. Kehrein 2001. Die akustischen Analysen wurden mit dem Sprachanalyseprogramm Praat durchgeführt (vgl. http://www.praat.org). Im laufenden Text und im Anhang findet sich für jede der zwölf Bedeutungen eine Abbildung einer akustischen Analyse.
Das Wort - Sprech- und/oder Schreibzeichen?
15
cherlnnen (mitunter) auch die Ausdrucksseite der Bedeutungen Ib, 2, 6a und 6b als pragmatische Basiseinheiten mit jeweils lokalen Intonationsmustern. Die folgende Tabelle bietet eine Übersicht über die Angaben im Duden im Vergleich zu unserer Erhebung:19 Bedeutung nach Duden
Anzahl der Belege
Signifikant nach Duden
betont
la zustimmende Antwort Ib m. Modaladverb (freudige) Bekräftigung 2 zustimmende Antwort wird erwartet 3a Hinweis auf etwas Bekanntes 3b Erstaunen od. Ironie 3c einschränkend 4 dringende Mahnung 5 steigernde Anreihung 6a konzessiver Bezug auf vorangegangene Aussage 6b Bestätigung der Berechtigung einer vorangegangenen Frage 7a Melden am Telefon Tb Ausdruck von Zweifel
unbetont
Stellung
2 1 1
+
nachgestellt
Signifikant in Erhebung (jew. Anzahl d. Sprecherinnen) akzen- nicht pragm. tuiert akzen- Basistuiert einheit 5 5
5
1
5
5
8
+
5
1
+
5
2 3
+
5
+
5 +
4
5
1
+
+
5
1
+
+
3
1 1
allein stehend allein stehend
3
2
3
5
5
5
5
3. Die Ausdrucksseite der Bedeutungen l a, Ib, 2, 6a, 6b, 7a und 7b kann eine pragmatische Basiseinheit bilden. Wie die oben in Anm. 17 angegebene Definition deutlich macht, heißt pragmatische Basiseinheit nicht, dass die (Teil-)Äußerung zwischen zwei Pausen - etwa den spatia vergleichbar - steht. Vielmehr bildet ja hier im Kontext eine Einheit, die
Die weiteren Ausführungen beziehen sich auf die hier genannten Merkmale der Ausdrucksseite.
16
Vilmos Ägel/Roland Kehrein 1. äußerungssemantisch vollständig ist, 2. eine erkennbare Äußerungsabsicht hat und 3. mit einem Intonationsmuster korreliert.
Die jeweiligen Intonationsmuster tragen dann ihrerseits zur Äußerungsbedeutung bei (siehe auch unten). Die folgende Abbildung zeigt eine akustische Analyse des Belegs für Bedeutung 2, bei dem das ja eine pragmatische Basiseinheit bildet, aber dennoch ohne Pause an die vorangehende Einheit angehängt ist.
500,
64.05
300
16.44
^ 200 N
150
100 70
wir beide mit der Kutsche spazieren
Time (s) Abb. l (Bedeutung 2)20
4. Jedes ja, das eine pragmatische Basiseinheit bildet, trägt einen Akzent, aber nicht umgekehrt (z.B. Bedeutung 4). 5. Bei den Akzenten handelt es sich in jedem Fall um Äußerungsakzente. Das bedeutet, dass die jeweilige Silbe ja auditiv prominenter ist als nicht akzentuierte Silben und gleich prominent wie andere Silben des sprachlichen Kontextes mit Äußerungsakzent. Besonders starke Prominenz (Hervorhebungsakzente) kommt beiy'ö nicht vor. Die akustischen Korrelate der Äußerungsakzente sind uneinheitlich. Der Prominenzwahrnehmung kann sowohl ein Merkmalskomplex aus höherer Grundfrequenz oder höherem FO-Umfang (d.h. einer größeren Differenz zwi-
Die Abbildungen der akustischen Analysen enthalten folgende Informationen: Intensitätsverlauf (durchgezogene Linie im oberen Bereich; Maximum und Minimum sind in dB rechts angegeben), Grundfrequenzverlauf (unterbrochene Linie über die gesamte Rahmenhöhe; Skalierung von 50-500 Hz links) und Dauer des Äußerungsausschnitts (unten; alle Rahmen bilden einen zweisekündigen Ausschnitt ab).
Das Wort - Sprech- und/oder Schreibzeichen?
17
sehen FO-Maximum und -Minimum auf der Silbe), höherer Intensität und längerer Dauer der Silbe als auch die Kombination von nur zweien dieser Merkmale entsprechen.21 In Abb. 2 ist die akustische Analyse eines Belegs für Bedeutung 4 wiedergegeben, bei dem der Prominenzwahrnehmung die erhöhte Dauer sowie der größere FO-Umfang auf der Silbe entsprechen. 500
€3.52
300
23.55
_ 200 N
150|
100
70
meine Frau hat gesagt geh
ja
nicht runter
50·
Time (s) Abb. 2 (Bedeutung 4)
6. Bei den Realisierungen von ja, die als nicht akzentuiert wahrgenommen wurden, liegen die Werte der akustischen Merkmale ,Grundfrequenz', ,Intensität' und ,Dauer' niedriger als bei umliegenden Silben des sprachlichen Kontexte (siehe Abb. 3).
Für höher und länger können keine absoluten Werte angegeben werden. Diese Angaben sind vielmehr streng relativ zu umliegenden Silben zu ermitteln.
18
Vilmos Agel/Roland Kehrein
500,
63.35
300
15.7
200
1501
100
70 Wir könnten es
doch nicht aufnehmen
50 Time (s) Abb. 3 (Bedeutung 3a)
7. Zwischen den Realisierungstypen, die sich darin unterscheiden, dass sie einerseits pragmatische Basiseinheiten bilden können und/oder akzentuiert sind und andererseits nicht akzentuiert sind, besteht ein weiterer, segmenteller Unterschied: Der Vokal des ja wird bei den nicht akzentuierten Realisierungstypen regelmäßig als [B], d.h. als reduzierter, zentralerer Vokal realisiert als bei den akzentuierten Realisierungstypen. Bei diesen liegt ein [a] vor.22 Auch diese Wahrnehmung lässt sich durch akustische Analysen stützen: Der Fl (Formant 1) beim Vokal der nicht akzentuierten Silben liegt niedriger als bei den akzentuierten Silben. Diesem Messergebnis entspricht artikulatorisch ein leicht geschlossenerer, zentralerer Vokal. Möglicherweise handelt es sich bei diesem formalen Merkmal um ein Epiphänomen der (Nicht-)Akzentuiertheit. Auf der Grundlage der berücksichtigten formalen Eigenschaften ,Fähigkeit, eine pragmatische Basiseinheit zu bilden', ,Akzentuiertheit' und .Vokalqualität' lässt sich der Schreibzeichen-Signifikant von ja relativ eindeutig in zwei Sprechzeichen-Gruppen einteilen: Gruppe l: pragmatische Basiseinheit, akzentuiert, [a] - Signifikant der Bedeutungen l a, Ib, 2,6a, 6b, 7a und 7b Gruppe 2: keine pragmatische Basiseinheit, nicht akzentuiert, [e] - Signifikant der Bedeutungen 3a, 3b, 3c und 5
Allein das ja mit der Bedeutung 4 bildet eine gewisse Ausnahme, indem alle Realisierungen die Eigenschaften .akzentuiert' und ,[a]' haben, die Ausdrucks-
Der Einfachheit halber transkribieren wir das angegebene Grundzeichen, dem streng phonetisch ein [a] bzw. [9] entspricht.
Das Wort - Sprech- und/oder Schreibzeichen?
19
seite aber in keinem Fall eine pragmatische Basiseinheit bildet (bilden kann?). Nicht nur weil diese Eigenschaft das distributionelle Verhalten und die Selbständigkeit von Zeichen charakterisiert, erheben wir sie für unsere Einteilung zum primären Kriterium, sondern auch weil die Eigenschaft „Fähigkeit eine pragmatische Basiseinheit zu bilden" ein weiteres wichtiges Charakteristikum impliziert: die Fähigkeit einer Einheit, ein Intonationsmuster zu tragen. Daher ordnen wir den Realisierungstyp für Bedeutung 4 in die zweite Gruppe ein, die auf diese Weise in zwei Untergruppen zerfällt. Vergleichen wir die aufgrund der ausdrucksseitigen Merkmale gewonnene Einteilung mit der Inhaltsseite, ergeben sich also die folgenden formal-funktionalen Gruppen: Gruppe l: pragmatische Basiseinheit, Intonationsmuster, akzentuiert, [a] 1a Ib 2 6a 6b 7a 7b
zustimmende Antwort mit einem Modaladverb [freudige] Bekräftigung zustimmende Antwort wird erwartet konzessiver Bezug auf vorangegangene Aussage Bestätigung der Berechtigung einer vorangegangenen Frage Melden am Telefon Ausdruck von Zweifel
Gruppe 2: keine pragmatische Basiseinheit, kein Intonationsmuster: Gruppe 2a: nicht akzentuiert, [B] 3a 3b 3c 5
Hinweis auf etwas Bekanntes Erstaunen oder Ironie einschränkend steigernde Anreihung
Gruppe 2b: akzentuiert, [a] 4
dringende Mahnung
Für beide Gruppen lassen sich relativ problemlos ,übergreifende' Bedeutungen (im Sinne von Weydt) formulieren: 1. Die Ausdrucksseite der Gruppe l steht für ein Signifikat .Bestätigung/Zustimmung'; 2. Die Ausdrucksseite der Gruppe 2a steht für ein Signifikat mit dem Merkmal .bekannt' (siehe Thurmair 1989, 104ff. und Weinrich 1993, 844); 3. Die Ausdrucksseite der Gruppe 2b steht für ein Signifikat mit dem Merkmal .Verstärkung' (siehe Thurmair 1989, 104ff.)
Die (relative) inhaltsseitige Einheit von Gruppe 2, der .Abtönungsgruppe', kommt dadurch zustande, dass es einen offensichtlichen Zusammenhang zwischen den Merkmalen .bekannt' und .Verstärkung' gibt:
20
Vilmos Ägel/RolandKehrein Der durch [nicht akzentuiertes] ja geleistete Verweis auf Bekanntes (bewirkt) eine Bekräftigung der eigenen Äußerung; und aus dieser Bekräftigung ist die durch [akzentuiertes] JA angezeigte Verstärkung abzuleiten. (Thurmair 1989,109)23
Die im Duden differenzierten spezielleren Bedeutungen kommen durch die kontextuelle Einbettung (z.B. Ib) und die Prosodie zustande. So kann die Ausdrucksseite der Bedeutungen 2, 7a und 7b nur mit einem lokal steigenden Intonationsmuster geäußert werden, das zur Grundbedeutung von ja die Bedeutung ,Reaktionsaufforderung' ergänzt (vgl. dazu Schmidt 2001 und Kehrein/Rabanus 2001). Je nach Kontext fungiert dieses ja somit als Zustimmungsheischen (Bedeutung 2), als ein Melden am Telefon (im Sinne von ,Ich höre, was gibt's?', 7a) oder als ein Zweifelsausdruck (im Sinne von ,Hab ich das richtig verstanden? Sag das nochmal!', 7b). Auch bei den abtönenden Realisierungstypen von ja übt der (sprachliche) Kontext den entscheidenden Einfluss auf die im Duden angegebenen Äußerungsbedeutungen aus. Beispielsweise ist bei Bedeutung 4 eine pragmatische Basiseinheit mit (direkt oder indirekt) auffordernder Äußerungsabsicht obligatorisch.24
3. Wörter: Sprech- und/oder Schreibzeichen? Vorausgesetzt, dass die lexikografische Aufbereitung von ja im Duden die aktuell dominierende sprachtheoretische Grundhaltung zu den Sprachzeichen im Allgemeinen widerspiegelt, wovon wir ja stillschweigend ausgegangen sind, erlauben uns die empirischen Analyseergebnisse zu ja die folgende Antwort auf die in l .4. formulierten Hauptfragen: Die ausdrucksseitigen paradigmatischen Grenzen des literalen .Wortes' definieren eindeutig Schreibzeichen. Folglich ist LIW nicht nur kraft der spatia, sondern auch kraft der (latenten) paradigmatischen Anwendung von KES schriftbezogen. Da die paradigmatische Anwendung von KES eben latent ist, bestätigt sich auch hier die skriptizistische Grundhaltung.
Diese Antwort führt uns gleich zu der ersten, oben in l .4. formulierten theoretischen Frage: Wie sollte man in dieser skriptizistischen Situation verfahren? Wir denken, dass es keine Lösung wäre, zusätzliche graphematische Unterscheidungsmöglichkeiten für die zwei oder gar drei Realisierungstypen von ja und damit auch gleich zwei oder drei separate Wörterbuchartikel - zu fordern. Vielmehr plädieren wir für ein offenes Bekenntnis zu LIW mit der Konsequenz, dass wir das Sprachzeichen bei Literalisierten als ein Schreibzeichen mit in-
23 24
„Die drängende oder drohende Nuance kommt dadurch zustande, daß den Adressaten implizit die .bekannten' Sanktionen angedroht werden." (Weinrich 1993, 845) Bedeutung 4 tritt zwar in der Regel in Imperativsätzen auf, doch die Aufforderungsillokution lässt sich auch in Aussagesätzen verwirklichen (Thurmair 1989, 109). Eine indirekte Aufforderung liegt u.E. vor, wenn das akzentuierte ja in Final- oder Relativsätzen vorkommt (zu Beispielen siehe ebd.).
Das Wort - Sprech- und/oder Schreibzeichen ?
21
ferner Sprechzeichen-Gliederung definieren wollen. Diese Lösung verspricht (u.a.) folgende Vorteile: 1. Das „mot parle" als intendierter Gegenstand der modernen Linguistik wird rehabilitiert, ohne dass dadurch die Bedeutung des „mot ecrit" in Frage gestellt werden müsste bzw. würde. 2. Ganz im Gegenteil: Bei der Untersuchung der Sprache von Literalisierten wird das „mot ecrit" als linguistischer Gegenstand ebenfalls anerkannt. An die Stelle des Skriptizismus tritt eine theoretisch und empirisch begründete Relation von Schreib- und Sprechbezogenheit. Im Falle von ja bedeutet das, dass dem einheitlichen Schreibzeichen ja zwei Sprechzeichen ja entsprechen. Dabei zerfallt das zweite Sprechzeichen ja in die Sprechzeichenvarianten 2a und 2b. 3. Daraus folgt, dass man semiotisch zwischen Schreibsignifikant und Sprechsignifikant unterscheiden muss. Oder man könnte, um eine begriffliche Parallele zu der Terminologie der Inhaltsseite mit .Signifikat' und ,Bedeutung(en)' herzustellen, zwischen Signifikant (= Ausdrucksseite des Schreibzeichens) und Sprechtyp (Phonotyp) unterscheiden. Der Terminus .Signifikant' wäre somit strikt auf das Schriftbild bezogen. 4. Die Herstellung einer begrifflichen Parallele zur Inhaltsseite scheint uns umso notwendiger zu sein, als die empirische Analyse von ja zu einem klar (diagrammatisch) ikonischen Ergebnis geführt hat: Der semantischen Grundgliederung von ja mit zwei primären und insgesamt drei Bedeutungstypen entsprechen ja auf der formalen Ebene zwei Sprechtypen bzw. drei Realisierungstypen. Wir können damit dem Skriptizismus zu Recht ferner anlasten, dass durch ihn auch ikonische Verhältnisse (erfolgreich) verdeckt wurden, was möglicherweise eine .Verwerfung' der sprachtheoretischsemiotischen Grundlagen der Diskussion um .Arbitrarität vs. Ikonizität des Sprachzeichens' bewirkt hat (zur arbiträren und/oder ikonischen .Natur' des Sprachzeichens siehe Ägel 1996, 598-607). 5. Die obige Einschränkung der Definition des Sprachzeichens auf Literalisierte impliziert, dass wir für eine konzeptionelle und pragmatisch-sprachsoziologische .Sensibilisierung' des Sprachzeichenbegriffs, d.h. für je nach konzeptioneller Mündlichkeit/ Schriftlichkeit und je nach sprachsoziologischen und pragmatischen Parametern differenzierte Relationen von Schreib- und Sprechbezogenheit, plädieren. 6. Unser Plädoyer für eine theoretisch und empirisch begründete Relation von Schreibund Sprechbezogenheit impliziert, dass das bei Literalisierten zweifelsohne vorhandene .Gefühl' der Einheit eines geschriebenen .Wortes' nicht bekämpft, sondern theoretisch und empirisch untermauert wird.
Damit hätten wir erste und grobe Antworten auf die Fragen in l .4. gegeben, die unsere zentrale Fragestellung am unmittelbarsten berührt haben. Für den Schluss sind uns aber noch zwei schwierige Fragen geblieben: 1. Wie verträgt sich unsere Auffassung mit der berechtigten Forderung nach der .Emanzipation' der Gesprochenen-Sprache-Forschung? 2. Sind .Wortarten' Klassen von Sprechzeichen und/oder von Schreibzeichen?
Das Plädoyer für je nach konzeptioneller Mündlichkeit/Schriftlichkeit und je nach sprachsoziologischen und pragmatischen Parametern differenzierte Relationen von Schreib- und Sprechbezogenheit bedeutet, dass unser kleines semiotisches »Modell' flexibel und dynamisch sein soll. Beispielsweise muss man bei den Sprecherinnen, die funktionale Analphabeten sind, wohl eher von einer ,Semiotik' ausgehen, die gar keine Schreibzeichen aufweist. Der adäquate Gegenstand der Linguistik im Falle der Untersuchung des Sprechens von diesen Sprecherinnen wäre demnach ausschließlich das „mot parle". Umgekehrt muss
22
Vilmos Ägel/Roland Kehrein
man bei hochgradig Literalisierten wohl auch dann mit der Wirkung von LIW rechnen, wenn sie irgendeine Form der konzeptionellen Mündlichkeit beherrschen und praktizieren. Unsere Annahme von übergeordneten Schreib- und untergeordneten Sprechzeichen bezieht sich also lediglich auf diesen Typus von soziopragmatischem Fall. Die Antwort auf die zweite Frage folgt gewissermaßen aus der auf die erste. Ob nämlich .Wortarten' als Klassen von Sprechzeichen und/oder von Schreibzeichen zu definieren sind, ist in abstracto nicht zu entscheiden. Vielmehr hängt der Status - und damit auch die Einteilung - der .Wortarten' von der konzeptionell, pragmatisch und sprachsoziologisch zugrunde gelegten ,Empirie' ab. Beispielsweise würden unsere empirische Analyse von ja und die theoretischen Konsequenzen eine Wortartentheorie notwendig machen, in der das Schreibzeichen als eine Schreibwortart und die zwei Sprechzeichen als Sprechwortarten eingestuft werden könnten. Den Sprechzeichenvarianten würden dann Unterklassen von Sprechwortarten entsprechen. Diese unsere ,Wortartentheorie' würde aber selbstverständlich nicht passen (und auch nicht passen ,wollen') zu der ,Wortartentheorie', die notwendig wäre, um die ,Wortarten' von funktionalen Analphabeten zu charakterisieren.25
4. Literatur Ägel, Vilmos: Von der Sprache - über den Gegenstand der Sprachwissenschaft und die Natur des sprachlichen Zeichens - zur Literatur. In: Zeitschrift für Germanistik 3 (Neue Folge), 1996,596-611. - Prinzipien der Grammatik. In: Anja Lobenstein-Reichmann/Oskar Reichmann (Hrsg.): Neue historische Grammatiken des Deutschen. Tübingen 2002. [im Druck] Bergenholtz, Henning/Schaeder, Burkhard: Die Wortarten des Deutschen. Stuttgart 1977. Burger, Harald: Phraseologie. Eine Einführung am Beispiel des Deutschen. Berlin 1998 (Grundlagen der Germanistik, 36). CLG= Saussure, Ferdinand de: Grundfragen der allgemeinen Sprachwissenschaft. 2. Aufl. Berlin 1967. Coulmas, Florian: The Blackwell Encyclopedia of Writing Systems. Oxford 1996. Derrida, Jacques: Grammatologie. Frankfurt am Main 1983 (stw, 417). [frz. Orig. 1967] Duden. Deutsches Universalwörterbuch. 4., neu bearbeitete und erweiterte Auflage. Hrsg. von der Dudenredaktion. Mannheim [usw.] 2001. Dürscheid, Christa: Syntax. Grundlagen und Theorien. Wiesbaden 2000 (Studienbücher zur Linguistik, 3). Eichinger, Ludwig M.: Deutsche Wortbildung. Eine Einführung. Tübingen 2000 (Narr Studienbücher). Eisenberg, Peter: Grundriß der deutschen Grammatik. Bd.l: Das Wort. Stuttgart, Weimar 1998. Eroms, Hans-Werner: Syntax der deutschen Sprache. Berlin, New York 2000 (de Gruyter Studienbuch).
V. Ägel dankt sowohl für die Unterstützung von OTKA (T 034340 NYE) als auch für die, die ihm im Rahmen eines SZPÖ zuteil wird.
Das Wort - Sprech- und/oder Schreibzeichen?
23
Feilke, Helmuth: Idiomatische Prägung. In: Irmhild Barz/Günther Öhlschläger (Hrsg.): Zwischen Grammatik und Lexikon. Tübingen 1998,69-80. Fiehler, Reinhard: Über zwei Probleme bei der Untersuchung gesprochener Sprache. In: Sprache und Literatur 31,2000,23^2. Gauger, Hans-Martin: Die sechs Kulturen in der Geschichte des Lesens. In: Paul Goetsch (Hrsg.): Lesen und Schreiben im 17. und 18. Jahrhundert. Studien zu ihrer Bewertung in Deutschland, England, Frankreich. Tübingen 1994,27-47. Goody, Jack/Watt, Jan: Konsequenzen der Literalität. In: Jack Goody/Jan Watt/Kathleen Gough: Entstehung und Folgen der Schriftkultur. Frankfurt am Main 1986 (stw, 600), 63122. [engl.Orig. 1968] Günther, Hartmut: Die Schrift als Modell der Lautsprache. In: Osnabrücker Beiträge zur Sprachtheorie 51,1995,15-32. Harris, Roy: The language-makers. London 1980. Hentschel, Elke/Weydt, Harald: Handbuch der deutschen Grammatik. 2., durchgesehene Aufl. Berlin, New York 1994. Hessky, Regina: Entwicklungen der Phraseologie seit der Mitte des 20. Jahrhunderts. In: Werner Besch/Anne Betten/Oskar Reichmann/Stefan Sonderegger (Hrsg.): Sprachgeschichte. Ein Handbuch zur Geschichte der deutschen Sprache und ihrer Erforschung. 2. Aufl. Bd.2. Berlin, New York 2000 (HSK, 2.2), 2101-2106. Kehrein, Roland: Prosodie und Emotionen. Dissertation Universität Greifswald 2001. [erscheint in: Reihe Germanistische Linguistik. Tübingen] Kehrein, Roland/Rabanus, Stefan: Ein Modell zur funktionalen Beschreibung von Diskurspartikeln. In: Jürgen Erich Schmidt (Hrsg.): Neue Wege der Intonationsforschung. Germanistische Linguistik 157-158,2001, 33-50. Knobloch, Clemens/Schaeder, Burkhard: Kriterien für die Definition von Wortarten. In: Geert Booij/Christian Lehmann/Joachim Mugdan (Hrsg.): Morphologie. Ein internationales Handbuch zur Flexion und Wortbildung. Bd.l. Berlin, New York 2000 (HSK, 12.1), 674692. Koch, Peter/Oesterreicher, Wulf: Sprache der Nähe - Sprache der Distanz. Mündlichkeit und Schriftlichkeit im Spannungsfeld von Sprachtheorie und Sprachgeschichte. In: Romanisches Jahrbuch 36, 1985, 15-43. - Schriftlichkeit und Sprache. In: Hartmut Günther/Otto Ludwig (Hrsg.): Schrift und Schriftlichkeit. Ein interdisziplinäres Handbuch internationaler Forschung. Halbbd.l. Berlin, New York 1994 (HSK, 10.1), 587-604. Malinowski, Bronislaw: Das Problem der Bedeutung in primitiven Sprachen. In: C. K. Ogden/I. A. Richards: Die Bedeutung der Bedeutung. Supplement. Frankfurt am Main 1974, 323-384. [engl. Orig. 1923] Motsch, Wolfgang: Deutsche Wortbildung in Grundzügen. Berlin, New York 1999 (Schriften des IdS, 8). Ong, Walter J.: Oralität und Literalität. Die Technologisierung des Wortes. Opladen 1987. [engl. Orig. 1982] Reichmann, Oskar: Germanistische Lexikologie. 2., vollständig umgearbeitete Aufl. von „Deutsche Wortforschung". Stuttgart 1976 (Sammlung Metzler, 82). Schmidt, Jürgen Erich: Bausteine der Intonation? In: Jürgen Erich Schmidt (Hrsg.): Neue Wege der Intonationsforschung. Germanistische Linguistik 157-158, 2001, 9-32. Soll, Ludwig: Gesprochenes und Geschriebenes Französisch. 3. Aufl. Berlin 1985 (Grundlagen der Romanistik, 6). Thurmair, Maria: Modalpartikeln und ihre Kombinationen. Tübingen 1989 (Linguistische Arbeiten, 223). Trabant, Jürgen: Elemente der Semiotik. Tübingen, Basel 1996 (UTB, 1908). Vater, Heinz: Einführung in die Sprachwissenschaft. München 1994 (UTB, 1799). Weinrich, Harald: Textgrammatik der deutschen Sprache. Mannheim [usw.] 1993. Weydt, Harald: Betonungsdubletten bei deutschen Partikeln. In: Albrecht Schöne (Hrsg.): Kontroversen, alte und neue. Akten des VII. Internationalen Germanisten-Kongresses Göttingen 1985. Bd. 3: Textlinguistik contra Stilistik? [usw.] Tübingen 1986,393-403.
Vilmos Ägel/Roland Kehrein
24
5. Quellen Bälden, Barbara: Nur ein einfaches Mädchen. Hamburg 1990 (= Bälden) Bamm, Peter: Ex . Essays. Stuttgart 1956 (neue Ausgabe: 1963) (= Bamm) Bergengrün, Werner: Das Tempelchen. Zürich 1950 (= Bergengrün) Böll, Heinrich: Ansichten eines Clowns. Köln/Berlin 1963 (= Böll) Bollnow, Otto F.: Maß und Vermessenheit des Menschen. Göttingen 1962 (= Bollnow) de Groot, Anne: Dein Vater wird uns liebgewinnen. Hamburg 1990 (= de Groot) Frankfurter Rundschau, 25.03.1999, S. 2, Ressort: N; Familienstreit in Oberursel mit blutigem Ausgang - und was die Nachbarn so darüber denken (= FR) Grass, Günter: Die Blechtrommel. Frankfurt 1962 (= Grass) Grzimek, Bernhard: Serengeti darf nicht sterben. Berlin 1959 (= Grzimek) Heuss, Theodor: Erinnerungen 1905-1933. Memoiren. Tübingen 1963 (= Heuss) Johnson, Uwe: Das dritte Buch über Achim. Frankfurt 1961 (= Johnson) Jung, Eise: Die Magd vom Zellerhof. Hamburg 1965 (= Jung) Larsen, Viola: Die heimlichen Wege der schönen Prinzessin. Bergisch-Gladbach, o. J. (= Larsen) Mann, Thomas: Die Betrogene. Frankfurt 1953 (= Mann) Pegg, Jonny: Nacht des Jägers. Bergisch-Gladbach, o. J. (= Pegg) Stephan, Sabine: Ihre Liebe gab ihr Leben. Bergisch-Gladbach, o. J. (= Stephan) Torwegge, Claudia: Liebe hat ihre eigenen Gesetze. Hamburg 1990 (= Torwegge) Uhl, Yvonne: Um Mitternacht im blauen Schloß. Bergisch-Gladbach, o. J. (= Uhl)
6. Anhang: akustische Analysen anderer Bedeutungen von ja
_ N
500,
64.46
300
16.48
200J
•5 150l £ 100 70 ja
das erwähnten Sie schon
50
Time (s) Abb. 4 (Bedeutung l a)
Das Wort - Sprech- und/oder Schreibzeichen?
N
25
500,
τ61.51
300
16.05
200
150
100 70 gern, danke vielmals
ja 50
Time (s) Abb. 5 (Bedeutung Ib)
500
τ€1.72
300-
15.9
^N 2οσ •g
150-
100-
70-
Da bist du
ja
50 Time (s) Abb. 6 (Bedeutung 3b)
endlich
26
Vilmos Agel/Roland Kehrein 500η
59.62
300-
19.87
^ 200£
£
150-
100ich wollte
aber dann kam herau(s)
ja
504 Time (s) Abb. 7 (Bedeutung 3c)
500i
59.89
300
21.68
^ 200
Il 150 o. 100 70
fast hysterisch
(d)as sonst empfindlich 50l· Time (s) Abb. 8 (Bedeutung 5)
27
Das Wort-Sprech- und/oder Schreibzeichen?
N
500,
j-58.24
300
16.16
200 150
100
70 das war ich wohl
50 Time (s) Abb. 9 (Bedeutung 6a) 500,
r59.95
300
17.09
200
150|
100
70 (imm)er so fortgehen können
Time (s) Abb. 10 (Bedeutung 6b)
ja
hätte es nicht
28
N
Vilmos Agel/Roland Kehrein 500
59.94
300
16.03
200 150
100
70 ja
wer ist da
50 Time (s) Abb. 11 (Bedeutung 7a)
500
53.45
300
15.6
200
•5 .•e 0. 100-
so
kam es fast
ja
50 Time (s) Abb. 12 (Bedeutung 7b)
Dirk Geeraerts
The scope of diachronic onomasiology 1. Distinctions within the field of onomasiology 2. The contribution of various traditions of research 3. A conceptual map of onomasiology 4. References
What could be a more fitting tribute to Oskar Reichmann than a contribution to diachronic onomasiology? The purpose of the present paper - brief though it is - is threefold: first, to chart the domain of onomasiology, determining its various subfields and their mutual relationships; second, to define the specific position of diachronic onomasiology in the context of this classification, and third, to situate my own recent contributions to onomasiological research against the backdrop of this overview of the state of the art. The first aspect expands and revises the suggestions about the internal constitution of the field of onoma-siology that I made elsewhere (Geeraerts 1999a). Although I suspect that the classification that I will present here is still amenable to substantial improvement, I do feel that it is more balanced and comprehensive than my earlier attempt. I would also like to point out that the references to the literature that I will be giving are obviously not intended to be exhaustive. I hope, though, that they are representative of what is going on in contemporary onomasiology. Also, I will restrict my remarks to onomasiological research of a theoretical nature. Descriptive onomasiology as it exists in the form of the onomasiological dictionary will be left unmentioned - though not because I consider the topic to be less worthy of attention (see Geeraerts 2000).
1. Distinctions within the field of onomasiology A conceptual map of the field of onomasiology should be based on at least the following five distinctions: - the distinction between structural and pragmatic onomasiology, - the distinction between the qualitative and the quantitative aspects of lexical structures, - the distinction between referential and non-referential types of meaning, - the distinction between lexicogenetic mechanisms and sociolexicological mechanisms, — the distinction between synchronic and diachronic onomasiology.
30
Dirk Geeraerts
Keeping in mind that our ultimate purpose is to reach a clearer picture of what diachronic onomasiology could be, we will now have a closer look at the first four distinctions. In the final paragraph of the paper, we will see how these various aspects of onomasiology link up with diachronic onomasiology. 1. Although it has hardly found its way to the canonical English terminology of linguistics (it is absent, for instance, from the indexes of reference works such as Collinge 1990 or Bright 1992), the distinction between onomasiology and semasiology is a traditional one in Continental structural semantics and the Eastern European tradition of lexicological research. The following quote from Baldinger illustrates the distinction quite nicely. „Semasiology [...] considers the isolated word and the way its meanings are manifested, while onomasiology looks at the designations of a particular concept, that is, at a multiplicity of expressions which form a whole" (1980, 278).
The distinction between semasiology and onomasiology, then, equals the distinction between meaning and naming: semasiology takes its starting-point in the word as a form, and charts the meanings that the word can occur with; onomasiology takes its starting-point in a concept, and investigates by which different expressions the concept can be designated, or named. However, the two descriptions of onomasiology that Baldinger mentions are not exactly equivalent. On the one hand, studying „a multiplicity of expressions which form a whole" leads directly to the traditional, structuralist conception of onomasiology., i.e. to the study of semantically related expressions (as in lexical field theory, or the study of the lexicon as a relational network of words interconnected by links of a hyponymical, antonymical, synonymous nature etc.). On the other hand, studying „the designations of a particular concept" opens the way for a contextualized, pragmatic conception of onomasiology, involving the actual choices made for a particular name as a designation of a particular concept or a particular referent. This distinction can be further equated with the distinction between an investigation οι structure, and an investigation of use, or between an investigation of langue and an investigation of parole. The structural conception deals with sets of related expressions, and basically asks the question: what are the relations among the alternative expressions? The pragmatic conception deals with the actual choices made from among a set of related expressions, and basically asks the question: what factors determine the choice for one or the other alternative? 2. In order to tackle the latter question in a systematic fashion, yet another distinction has to be envisaged, viz. that between what may roughly be described as the qualitative versus the quantitative aspects of linguistic semantic structure. The distinction may be introduced by considering semasiological structures first. Qualitative aspects of semasiological structure involve the following questions: which meanings does a word have, and how are they semantically re-
The scope ofdiachronic onomasiology
31
lated? The outcome is an investigation into polysemy, and the relationships of metonymy, metaphor etc. that hold between the various readings of an item. Quantitative aspects of lexical structure, on the other hand, involve the question whether all the readings of an item carry the same structural weight. The semasiological outcome of a quantitative approach is an investigation into prototypicality effects of various kinds, as will be obvious to anyone who has followed the developments in semasiological research of the last two decades: prototypicality research is basically concerned with differences of structural weight among the members or the subsenses of a lexical item. The qualitative perspective is a much more traditional one in semasiological lexicology than the quantitative one, which was taken up systematically only recently, with the birth and development of prototype theory. The distinction between qualitative and quantitative aspects of semantic structure can be extrapolated to onomasiology. The qualitative question then takes the following form: what kinds of (semantic) relations hold between the lexical items in a lexicon (or a subset of the lexicon)? The outcome, clearly, is an investigation into various kinds of lexical structuring: field relationships, taxonomies, lexical relations like antonymy and so on. The quantitative question takes the following onomasiological form: are some categories cognitively more salient than others, that is, are there any differences in the probability that one category rather than another will be chosen for designating things out in the world? Are certain lexical categories more obvious names than others? Again, this type of quantitative research is fairly new. The best-known example to date is Berlin & Kay's basic level model (Berlin & Kay 1969, Berlin 1978), which involves the claim that a particular taxonomical level constitutes a preferred, default level of categorization. The basic level in a taxonomy is the level that is (in a given culture) most naturally chosen as the level where categorization takes place; it has, in a sense, more structural weight than the other levels. The relationship between this type of „quantitative" onomasiology and the pragmatic perspective mentioned in the previous point probably does not need further clarification. A particular onomasiological structure (like a level in a taxonomy) can be identified as a preferred level of categorization only by taking into account the pragmatic perspective, i.e. the actual choices language users make from among a set of alternative possibilities. It will also have become obvious at this point that the terms qualitative and quantitative as used here are not in all respects adequate. Fundamentally, what is at issue here is the distinction between the mere presence of an item within a structure and the structural weight of that item, or, if one wishes, between the presence of an item and the preference language users may have for that item. The terms quantitative and qualitative are only used to avoid cumbersome paraphrases expressing this distinction. 3. The distinction between referential (denotational) and non-referential (connotational) aspects of meaning will be clear enough in itself. It involves the distinction between the descriptive aspects of lexical expressions (the contribu-
32
Dirk Geeraerts
tion they can make to the prepositional content of sentences) and their emotive, stylistic or discursive value. As is well-known, there is a general bias in lexical semantics towards the study of referential rather than non-referential meanings. The terminology for describing emotive values, for instance, is much less developed and much less stable than that for describing semasiological links of a referential nature, like metaphor and metonymy: the common terminology has never moved beyond a few traditional concepts like euphemism, taboo, meliorative and pejorative change. From an onomasiological point of view, this relative lack of attention is to be specifically regretted, because the ties between non-referential meaning and onomasiology are perhaps even stronger than those between non-referential meaning and semasiology. There are two reasons for this. In the first place, the very definition of non-referential meaning involves the concept of onomasiological alternatives. When, in fact, do we invoke the notion of non-referential meaning? We may say that a word has a specific non-referential meaning either when its communicative value differs from that of a referential synonym, or when its communicative value cannot be defined in referential terms. The latter case involves the meaning of expressions like hello! What the expression does (i.e. to perform the speech act of greeting) cannot be defined in purely descriptive terms; the expression does not describe a state of affairs or a process, but it performs an action. In the same way, the word yuck does not describe aversion, but expresses it. In cases such as these, we say that hello has a discursive meaning, or that yuck has an emotive meaning. When comparing dead and deceased or departed, on the other hand, the terms do have an identifiable referential value. At the same time, their communicative value is not identical: deceased and departed are less straightforward and slightly more euphemistic than dead - that is to say, they differ in non-referential value although their referential values are equivalent. In cases such as these, the nonreferential value correlates with the presence of referentially equivalent alternatives, i.e. with an onomasiological state of affairs. In the second place, it is only through the incorporation of non-referential meaning that we can hope to get a clearer view of the way in which lexical innovations spread through a linguistic community. It is important, in this respect, to distinguish between lexical changes that do and do not involve conceptual innovations. On the one hand, a conceptual change as meant here is not identical with a semasiological change (a word acquiring a new meaning), but is meant to refer to the introduction of new concepts as such into the language, regardless of the way in which they are lexically expressed (through the use of loan words, or through the productive coining of a neologism, or through the semasiological expansion of an existing word, or through whatever onomasiological process). Lexical changes as meant here, on the other hand, broadly involve all changes in the lexical inventory of the language, i.e. all changes in the language's inventory of pairs of words and meanings. When, for instance, the older English form gate loses its meaning „pathway" in favour of words like
The scope ofdiachronic onomasiology
33
road, path, and way, no new concept is introduced, but the distribution of the concepts over the available lexical forms changes. Lexical innovations, then, may and may not be accompanied by a conceptual innovation. For instance, the introduction of the loan word Computer into German initially involves the spread of the concept „computer"; it seems safe to assume that the basic motif behind this simultaneous introduction of a conceptual and a lexical innovation is a common expressive need on the part of the language users. The driving force behind the spread of the concept „computer" and the word Computer is basically just the growing familiarity of language users with this new piece of equipment. Conversely, when the word Rechner is introduced as an alternative term for Computer, the concept „computer" is already there. (At least, I assume it is for the sake of the argument. Computer and Rechner may have been introduced simultaneously, but I am not familiar enough with the micro-history of German to check whether this was indeed the case.) Now, if we are to understand anything of the factors behind the competition between Computer and Rechner, we necessarily have to take into account their non-referential values: the differences they exhibit with regard to their stylistic value, and which may determine the preference for one or the other term. These values will necessarily have to include the sociolinguistic distribution of the terms: if, in accordance with the well-known mechanisms of sociolinguistics, either of them wins out because it belongs to a prestigious variety of the language, then this sociolinguistic characterization of the item belongs to its nonreferential meaning. Moreover, sociolinguistics as used here is to be taken in the broadest possible sense: whether a word is typical for a learned register, for a rural dialect, for an expert jargon, for a trendy youth culture or for an upper class sociolect are all aspects of its sociolinguistic character, and this sociolinguistic character is part and parcel of its non-referential meaning. This implies, in other words, that the non-referential value of lexical items involves not just their emotive, stylistic or discursive value, as mentioned above, but their variational value at large, including all possible kinds of sociolinguistic characteristics. 4. On the basis of what was just said, it is now a relatively straightforward matter to explain the difference between lexicogenesis and sociolexicology. Lexicogenesis involves the mechanisms for introducing new pairs of word forms and word meanings - all the traditional mechanisms, in other words, like word formation, word creation (the creation of entirely new roots), borrowing, blending, truncation, ellipsis, folk etymology and others, that introduce new items into the onomasiological inventory of a language. Crucially, the semasiological extension of the range of meanings of an existing word is itself one of the major mechanisms of onomasiological change - one of the mechanisms, that is, through which a concept to be expressed gets linked to a lexical expression. In this sense, the study of onomasiological changes is more
34
Dirk Geeraerts
comprehensive than the study of semasiological changes, since it encompasses the latter (while the reverse is obviously not the case). It is a traditional temptation to talk about lexicogenetic mechanisms as if they play a role within the language as such. We might then say, for instance, that German borrows Computer from English. But the language as such is obviously not an anthropomorphic agent: what happens is that individual language users act in a specific way (say, by using a loan word), and that these individual acts lead to changes at the level of the language as a whole - that is, at the level of the speech community. Keller (1990) has introduced a revealing terminology to describe this kind of phenomenon. Borrowing a term from economical theory, he suggests that linguistic change may be described as an „invisible hand" process. As applied to economics, the invisible hand metaphor involves two levels of analysis. On the micro-level, the economic life of a community consists of countless individual actions and transactions. Macro-economically, however, these individual actions result in global phenomena, such as inflation or an economic boom. Crucially, the individuals who engage in the basic transactions do not have the conscious private intention of, for instance, changing the rate of inflation. Nor do they act in accordance with a collective decision. Rather, phenomena like inflation are a cumulative consequence on the macro-level of a myriad of individual acts on the micro-level. Similarly, changes spread through a linguistic community as if guided by an invisible force, whereas the actual process involves a multitude of communicative acts. The invisible hand metaphor, however, stops short of indicating precisely how the transition from the individual level to the global level occurs. What exactly are the mechanisms that enable the cumulative effects? Logically speaking, two situations may occur: either the changes work in parallel, or they take place serially. The first situation occurs when members of a speech community are confronted with the same communicative, expressive problem, and independently choose the same solution. The introduction of computer as a loan from English into German (and many other languages) may at least to some extent have proceeded in this way. More or less simultaneously, a number of people face the problem of giving a name to the new thing in their native language; independently of each other, they then adopt the original name that comes with the newly introduced object. The second type occurs when the members of a speech community imitate each other. For instance, when one person introduces a loan word, a few others may imitate him, and they in turn may be imitated by others, and so on. In the same way, the overall picture of a traffic jam is one in which a great number of cars appear to be halted by an invisible hand, while what actually happens is a cumulative process of individual actions: when the first car brakes to avoid a dog running over the highway, the car behind it has to slow down to avoid an accident, and so on. Studying how onomasiological changes spread through a speech community is typically an aspect of sociolexicology as meant here: beyond merely identifying onomasiological mechanisms in the traditional etymological vein, we need
The scope ofdiachronic onomasiology
35
to study how these mechanisms are put at work and how they may lead to overall changes in the habits of the language community. In short, classifications of lexicogenetic mechanisms merely identify the space of possible or virtual onomasiological changes; sociolexicology studies the actual realization of the changes. Needless to say, the latter approach coincides with the pragmatic perspective (it concentrates on the actual onomasiological choices made by language users), and it crucially involves all the non-referential values mentioned above (as factors that may influence these choices). In the final paragraph of this paper, we will explore to what extent these various aspects of onomasiology might be brought together into a single encompassing schema, and where diachronic onomasiology fits in exactly. As an intermediate step, however, we will check what various traditions of lexical semantics have contributed to the development of onomasiology.
2. The contribution of various traditions of research The various traditions of lexical semantics have contributed in different ways to the study of onomasiology. The traditions that I find useful to distinguish in the present context (cf. Geeraerts 1999a) are the following: - prestructuralist semantics, as dominant between 1870 and 1930, and as represented by the work of Paul, Breal, Darmesteter, Wundt, and many others; - structuralist semantics, as dominant between 1930 and 1960, and as represented by the work of Trier, Weisgerber, Coseriu, Lyons and lexical field theorists at large; - generativist and neogenerativist semantics, as originated in the 1960s, and as originally represented by the early work of Katz, Bierwisch, Leech and other theoreticians of componential semantics, and currently by the Generative Lexicon approach of Pustejovsky and his followers; - cognitive semantics, as originated in the 1980s, and as represented by the work of Lakoff, Langacker, Talmy and others. Of these four traditions, all except the generativist/neogenerativist have made noteworthy contributions to the field of onomasiology. 1. Prestructuralist semantics - apart from coining the term onomasiology itself (Zauner 1902) - has introduced some of the basic terminology for describing lexicogenetic mechanisms. Although basically concerned with semasiological changes, the major semasiological treatises from Breal (1897) and Paul (1880) to Stern (1931) and Carnoy (1927) do not restrict themselves to strictly semasiological mechanisms like metaphor and metonymy, but also devote attention to mechanisms of onomasiological change like borrowing or folk etymology. In fact, an insufficiently clear demarcation between onomasiological and semasi-
36
Dirk Geeraerts
ological mechanisms may well be a major point of criticism with regard to these earlier studies. Characteristically, there is a certain degree of overlap among the overviews given by Kronasser (1952) and Quadri (1952) of semasiological and onomasiological research respectively. While the distinction between the two perspectives is treated more systematically in the structuralist era, attempts to classify lexicogenetic mechanisms continue to the present day. Different proposals may be found in the work of, among others, Dornseiff (1966), Algeo (1978, 1980), Tournier (1985, 1987), Zgusta (1990). It lies beyond the scope of the present article to systematically compare these proposals, but it may be noted that there is no single, universally accepted classification. 2. Structuralist semantics makes two important contributions to onomasiology. First, it insists, in the wake of De Saussure himself, on the distinction between semasiology and onomasiology. In the realm of diachronic linguistics, this shows up in Ullmann's classification of semantic changes (1951, 1962), or in Baldinger's argumentation (1964) for studying the interplay between semasiological and onomasiological changes. More importantly, the bulk of (synchronic) structuralist semantics is devoted to the identification and description of different onomasiological structures in the lexicon, such as lexical fields, taxonomical hierarchies, lexical relations like antonymy and synonymy, and syntagmatic relationships. These phenomena are fairly well-known; readers in need of an introduction might consult Lutzeier (1995) as a good starting-point. From the point of view of the classification presented above, structuralist semantics is mainly situated within the field of „qualitative" synchronic onomasiology: it concentrates on onomasiological structures within the (synchronic) lexicon. Second, structuralist semantics has identified one of the possible explanatory factors for onomasiological change, viz. homonymic clashes (Gillieron & Roques 1912). Gillieron claims that homonymy is a pathological situation that calls for curative devices, viz. the therapeutic elimination of one of the homonyms. Analogously, some structuralists also consider polysemy to be a pathological situation that engenders therapeutic measures (see e.g. Goossens 1969); at the same time, the extent to which avoidance of homonymy actually engenders changes has been critically debated (Williams 1944). Avoidance of homonymy and avoidance of polysemy both derive from the idea that there exists an isomorphism between the form and the content of natural languages, a principle that is summarized in the maxim ,one form, one meaning'. Although this isomorphic principle is presented as a structural cause for change, the most realistic way of interpreting it is to accept that it ultimately relies on communicative mechanisms: in some communicative situations, homonymy may lead to difficulties of understanding, and such homonyms may eventually be avoided by the language users. In this respect, avoidance of homonymy may be considered a first example of a pragmatic perspective in onomasiology
The scope ofdiachronic onomasiology
37
(although it has to be admitted, at the same time, that actual research into homonymy at the level of parole is scarce). 3. There are at least three important contributions that cognitive semantics has made to onomasiology (for basic introductions to cognitive semantics, see Taylor 1995, Ungerer & Schmid 1996, Violi 1997). This level of interest of the cognitive approach for onomasiology is not surprising, by the way. If Cognitive Linguistics is very much involved with categorization as a basic cognitive function, then the onomasiological perspective is indeed a natural one: from the point of view of the speaker, the basic act of categorization is the onomasiological choice of a category to express a certain idea. So, what are the contributions of cognitive semantics to onomasiological research? First, cognitive semantics has drawn the attention to a number of „qualitative" onomasiological structures that did not come to the fore in the structuralist tradition. This holds true, on the one hand, for the development of the Fillmorean frame model of semantic analysis (Fillmore 1977, 1985, Fillmore & Atkins 1992). Frames constitute a specific type of syntagmatic structure in the lexicon that received little or no attention in the structuralist tradition. An instructive attempt to situate frames against the tradition of structuralist semantics can be found in Post (1988). On the other hand, the seminal introduction of generalized metaphor research in the line of Lakoff & Johnson (1980; see Lakoff & Turner 1989, Lakoff & Johnson 1999 for further developments) can be seen as the identification of figurative lexical fields: the ensembles of nearsynonymous metaphors studied as „conceptual metaphors" constitute fields of related metaphorical expressions (just like ordinary semantic fields consist of ensembles of near-synonymous lexical items). Second, cognitive semantics introduces a „quantitative" perspective into the study of onomasiological structures. As mentioned above, basic level research in the line of Berlin and Kay introduces the notion of salience (which is wellknown in cognitive semantics through the semasiological research into prototypicality) into the description of taxonomical structures: basic levels are preferred, default levels of categorization. Third, cognitive semantics introduces a „quantitative" perspective into the study of lexicogenetic mechanisms. Within the set of lexicogenetic mechanisms, some could be more salient (i.e. might be used more often) than others. Superficially, this could involve, for instance, an overall preference for borrowing rather than morphological productivity as mechanisms for introducing new words, but from a cognitive semantic perspective, there are other, more subtle questions to ask: do the ways in which novel words and expressions are being coined, reveal specific (and possibly preferred) ways of conceptualizing the onomasiological targets? An example of this type of research (though not specifically situated within a cognitive semantic framework) is Alinei's work (e.g. 1996) into the etymological patterns underlying the European dialects: he argues, for instance, that taboo words in the European dialects may be motivated either by Christian or Islamic motifs, or by pre-
38
Dirk Geeraerts
Christian, pre-Islamic heathen motifs; the „quantitative" perspective then involves the question whether one of these motifs is dominant or not. Within cognitive semantics properly speaking, this type of approach is represented by the search for dominant (or even universal) conceptual metaphors for a given domain of experience. A case in point is the work of Kövecses (1990, with critical remarks in Geeraerts & Grondelaers 1995). On a broader scale, the etymological research project started by Koch and Blank (Blank & Koch 1999, Koch 1997), intends to systematically explore motivational preferences in the etymological inventory of the Romance languages. In comparison with much of the metaphor-based research, the approach put forward by Blank and Koch takes into account all possible pathways of lexicalization (and not just metaphor). Moreover, it tries to achieve a broader typological coverage than is often the case. Against the background of these types of cognitive semantic research, I would now like to briefly situate my own contributions to diachronic onomasiology (which constitute, in a sense, a sequel to my work in diachronic semasiology as laid down in Geeraerts 1997). Basically, what my research group tries to do is to fill in one of the major blanks in the field of onomasiology, viz. pragmatic onomasiology, as defined above as a/jaro/e-based enterprise. Using a corpus-based methodology (see Speelman 1997), we try to identify the various factors that influence the onomasiological choice of a category for talking about a given referent, and their mutual interaction. So far, we have studied the following factors as influential on the selection of a name for a referent: -
the semasiological salience of the referent, i.e. the degree of prototypicality of the referent with regard to the semasiological structure of the category (see Geeraerts, Grondelaers & Bakema 1994); - the onomasiological entrenchment of the category represented by the expression („entrenchment" is a generalization of the notion of onomasiological salience as represented by the notion of basic level: see Geeraerts 1993, Geeraerts, Grondelaers & Bakema 1994); - non-referential meanings of an emotive and stylistic kind (see Grondelaers & Geeraerts 1998); - contextual features of a classical sociolinguistic and geographical nature, involving the competition between different language varieties (see Geeraerts, Grondelaers & Speelman 1999). These studies concentrate on synchronic variation and short term lexical changes. Similar studies, staring from cognitive semantic models or taking a sociolexicological perspective, have been devoted to long term onomasiological changes: Dekeyser (1990, 1991, 1995), Geeraerts (1999b), Molina (2000).
39
The scope ofdiachronic onomasiology 3. A conceptual map of onomasiology
Would it now be possible to chart the relationship between the various aspects of onomasiology, as described in the first paragraph, into a single comprehensive schema? Two steps need to be taken. The foregoing paragraph has revealed that the quantitative approach is not restricted to basic level research (the example with which it was introduced above). Preferential patterns may also be sought within the set of lexicogenetic mechanisms. This means, in other words, that a first approximation of a conceptual map of onomasiology may take the following form. „qualitative" approaches: what are the relevant phenomena?
„quantitative" approaches: which phenomena carry more weight?
(actual) synchronic structures
research into lexical structures research into (fields, taxonomies, frames, onomasiological salience lexical relations etc.) (basic levels, entrenchment)
(virtual) mechanisms of change
research into lexicogenetic mechanisms (borrowing, word formation, semasiological extension etc.)
research into preferential lexicogenetic mechanisms (dominant metaphors etc.)
Figure 1 A conceptual map of onomasiological research
Filling in the chart with the names of the research traditions that have made a dominant contribution to each of the various subfields, schematizes the progressive development of onomasiology. The historical development from prestructuralist semantics over structuralist semantics to cognitive semantics implies a gradual enlargement of the field of onomasiological research, from an interest in lexicogenetic mechanisms over research into lexical structures (fields and others) to various „quantitative" approaches taking into account the difference in salience of the onomasiological phenomena. „qualitative" approaches: what are the relevant phenomena?
„quantitative" approaches: which phenomena carrymore weight?
(actual) synchronic structures
research into lexical structures: structuralist semantics (plus cognitive semantics)
research into onomasiological salience: cognitive semantics
(virtual) mechanisms of change
research into lexicogenetic mechanisms: prestructuralist semantics
research into preferential lexicogenetic mechanisms: cognitive semantics
Figure 2 Research traditions within onomasiology
40
Dirk Geeraerts
The second step is to recognize the central position of pragmatic onomasiology and sociolexicology for a full picture of onomasiology. There are two aspects to this central position, one connected with the input of onomasiological acts, and one connected with their output. To begin with, pragmatic onomasiology combines the actual structures and the virtual mechanisms: the input for any onomasiological act (the act of naming, the act of choosing a category) is always both the set of already available expressions, and the set of expressions that is virtually available through the presence of lexicogenetic mechanisms. Choosing an expression can in fact take the form of selecting an option that is already there, or of creating a new alternative on the basis of one of the mechanisms. (There are, incidentally, additional reasons for treating the existing structures and the lexicogenetic mechanisms together: they are less clearly separated than may be suggested by the overview. Specifically, whether a lexical item is - psychologically speaking - readily available for use in the individual's mental lexicon is probably a matter of degree rather than a dichotomy.) Further, onomasiological change cannot be understood unless we take into account pragmatic onomasiology: changes are always mediated through the onomasiological choices made on the level of parole. Words die out because speakers refuse to choose them, and words are added to the lexical inventory of a language because some speakers introduce them and others imitate these speakers; similarly, words change their value within the language because people start using them in different circumstances. Change, in other words, is the ouput of processes that are properly studied in the context of pragmatic onomasiology. To repeat a point made earlier, this pragmatic, parole-based perspective automatically takes the form of a sociolexicological investigation: in choosing among existing alternatives, the individual language user takes into account their sociolinguistic, non-referential value, and conversely, the expansion of a change over a language community is the cumulative effect of individual choices. In this sense, it is only through an investigation into factors determining these individual choices, that we can get a grasp on the mechanisms behind the invisible hand of lexical change.
41
The scope ofdiachronic onomasiology The overall picture, then, looks as follows. onomasiological structures
lexicogenetic mechanisms dominant mechanisms
pragmatic, sociolexicological onomasiology
Figure 3 The central position of pragmatic onomasiology
The boxes to the left and to the right repeat the first and the second row of Figure 1. Within each box, the boldface captions identify the „qualitative" aspects, whereas the other captions identify the „quantitative" approaches. The arrows pointing away from the boxes indicate that both boxes constitute input for the processes that play at the pragmatic level: an act of naming may draw from the potential provided by the lexicogenetic mechanisms, or it may consist of choosing among alternatives that are already there. The arrows pointing towards the boxes indicate how the pragmatic choices may lead to change. These processes will primarily affect the actual synchronic structures, through the addition or removal of senses or items, shifts in the variational value of expressions, or changes in the salience of certain options. Secondarily (hence the dotted arrow) a change may affect the lexicogenetic mechanisms, for instance when a particular lexicalization pattern becomes more popular. Onomasiological research at the level of parole, in other words, is central to the whole onomasiological enterprise; it mediates between what is virtual and what is actual, it combines the traditional „qualitative" approaches and the recent „quantitative" innovations, it naturally includes an interest in the nonreferential, variational values of lexical items, and it makes the invisible hand visible.
4. References Algeo, J.: The taxonomy of word making. In: Word 29, 1978, 122-131. - Where do all the new words come from ?. In: American Speech 55, 1980, 264-277. Alinei, M.: Aspetti teoretici della motivazione. In: Quaderni di Semantica 17, 1996, 7-17. Baldinger, K.: Semasiologie et Onomasiologie. In: Revue de linguistique romane 28, 1964, 249-272.
42 -
Dirk Geeraerts
Semantic Theory. Oxford 1980. Translation of Teoria semäntica. Hacia una semäntica moderna. Madrid 1977. Berlin, B.: Ethnobiological classification. In: Eleanor Rösch/Barbara B. Lloyd (eds.): Cognition and Categorization, 9-26. Hillsdale, NJ 1978. Berlin, B./P. Kay: Basic Color Terms. Their Universality and Evolution. Berkeley 1969. Blank, A./P. Koch: Onomasiologie et etymologic cognitive: l'exemple de la tete. In: Mario Vilela/Fatima Silva (eds.): Actas do 1° Encontro Internacional de Linguistica Cognitiva Porto 1999, 49-72. Broal, M.: Essai de semantique. Paris 1897. Bright, W.: International Encyclopedia of Linguistics. New York, Oxford 1992. Carnoy, A.: La science du mot. Traite de somantique. Leuven 1927. Collinge, N.E.: An Encyclopedia of Language. London, New York 1990. Dekeyser, X.: The prepositions with, mid and again(st) in Old and Middle English. A case study of historical lexical semantics. In: Dirk Geeraerts (ed.): Diachronie Semantics. Brüssel 1990, 35^18. Editions de l'Universito de Bruxelles. (Belgian Journal of Linguistics, 5). - Romance loans in Late Middle English: a case study. In: Sylviane Granger (ed.): Perspectives on the English Lexicon. A Tribute to Jacques van Roey. Louvain-la-Neuve 1991,153-162. (Cahiers de I'lnstitut de Linguistique de Louvain, 17.1/3). - Travel, journey and voyage. An exploration into the realm of Middle English lexicosemantics. In: North-Western European Language Evolution 25, 1995, 127-136. Domseiff, F.: Bezeichnungswandel unseres Wortschatzes. Ein Blick in das Seelenleben der Sprechenden. Lahr, Schwarzwald 1966. Fillmore, C.: Scenes-and-frames semantics. In: Antonio Zampolli (ed.): Linguistic structures processing. Amsterdam 1977, 55-81. - Frames and the semantics of understanding. In: Quaderni di Semäntica 6, 1985, 222-255. Fillmore, C./B. Atkins: Towards a frame-based lexicon: the semantics of risk and its neighbors. In: Adrienne Lehrer/Eva Feder Kittay (eds.): Frames, Fields, and Contrasts. New Essays in Semantic and Lexical Organization. Hillsdale 1992, 75-102. Geeraerts, Dirk.: Generalised onomasiological salience. In: Jan Nuyts/Eric Pederson (eds.): Perspectives on Language and Conceptualization. Brüssel 1993, 43-56. Editions de l'Universito de Bruxelles. (Belgian Jounal of Linguistics, 8). - Diachronie Prototype Semantics. A Contribution to Historical Lexicology. Oxford 1997. - Hundred years of lexical semantics. In: Mario Vilela/Fatima Silva (eds.): Actas do Encontro Internacional de Linguistica Cognitiva. Porto 1999,123-154. [= 1999a] - Vleeshouwers, beenhouwers en slagers. Het WNT als bron voor onomasiologisch onderzoek. In: Nederlandse Taalkunde 4, 1999, 34-46. [= 1999b] - Adding electronic value. The electronic version of the Grote Van Dale. In: Ulrich Heid/Stefan Evert/Egbert Lehmann/Christian Rohrer (eds.): The Ninth Euralex International Congress Proceedings I. Stuttgart 2000, 75-84. Geeraerts, D./S. Grondelaers: Looking back at anger. Cultural traditions and metaphorical patterns. In: John Taylor/Robert E. MacLaury (eds.): Language and the Construal of the World. Berlin 1995, 153-180. Geeraerts, D./S. Grondelaers/P. Bakema: The Structure of Lexical Variation. Meaning, Naming, and Context. Berlin 1994. Geeraerts, D./S. Grondelaers/D. Speelman: Convergentie en divergentie in de Nederlandse woordenschat. Een onderzoek naar kleding- en voetbaltermen. Amsterdam 1999. Gillieron, J./M. Roques: Etudes de geographic linguistique. Paris 1912. Goossens, J.: Strukturelle Sprachgeographie. Heidelberg 1969. Grondelaers, S./D. Geeraerts: Vagueness as a euphemistic strategy. In: Angeliki Athanasiadou/Elzbieta Tabakowska (eds.): Speaking of Emotions: Conceptualisation and Expression. Berlin 1998, 357-374. Keller, R.: Sprachwandel. Von der unsichtbaren Hand in der Sprache. Tübingen 1990. Koch, P.: La diacronica quäle campo empirico della semäntica cognitiva. In: Marco Carapezza/Daniele Gambarara/Franco Lo Piparo (eds.): Linguaggio e cognizione. Atti del
The scope of diachronic onomasiology
43
XXVIII Congresso Internazionale della Societa di Linguistica Italiana. Roma 1997, 225246. Kövecses, Z.: Emotion concepts. New York 1990. Kronasser, H.: Handbuch der Semasiologie. Kurze Einführung in die Geschichte, Problematik und Terminologie der Bedeutungslehre. Heidelberg 1952. Lakoff, G./M. Johnson: Metaphors We Live By. Chicago 1980. - Philosophy in the Flesh. The Embodied Mind and its Challenge to Western Thought. New York 1999. Lakoff, G./M. Turner: More than Cool Reason. A Field Guide to Poetic Metaphor. Chicago 1989. Lutzeier, P.: Lexikologie. Ein Arbeitsbuch. Tübingen 1995. Molina, C.: Give sorrow words. Reflexiones semanticas y lexicologicas en torno al dolor en la lengua inglesa desde la diacronia cognitiva. PhD Thesis. Universidad Complutense de Madrid 2000. Paul, H.: Prinzipien der Sprachgeschichte. Halle 1880. Post, M.: Scenes-and-frames semantics as a neo-lexical field theory. In: Werner Hüllen/Rainer Schulze (eds.): Understanding the Lexicon. Meaning, Sense, and World Knowledge in Lexical Semantics. Tübingen 1988, 36-^7. Quadri, B.: Aufgaben und Methoden der onomasiologischen Forschung. Eine entwicklungsgeschichtliche Darstellung. Bern 1952. Speehnan, D.: Abundantia Verborum. A computer tool for carrying out corpus-based linguistic case studies. PhD Thesis. University of Leuven 1997. Stern, G.: Meaning and Change of Meaning. Göteborg 1931. Taylor, J.: Linguistic Categorization. Prototypes in Linguistic Theory. 2nd ed. Oxford 1995. Toumier, J.: Introduction a la lexicogenetique de l'anglais contemporain. Paris 1985. - Pr6cis de lexicologie anglaise. Paris 1987. Ullmann, S.: The Principles of Semantics. Oxford or Glasgow 1951. - Semantics. An Introduction to the Science of Meaning. Oxford 1962. Ungerer, F/H.-J. Schmid: An Introduction to Cognitive Linguistics. London, New York 1996. Violi, P.: Significato ed esperienza. Milano 1997. Williams, E.R.: The Conflict of Homonyms in English. New Haven 1944.
Ulrike Haß-Zumkehr
Das Wort in der Korpuslinguistik Chancen und Probleme empirischer Lexikologie 1. Was ist ein Wort - token, type oder Lemma? 2. Datentypen 3. Korpusaufbau, Korpusorganisation und Recherche-Software 4. Nutzen, Interpretationsbedürftigkeit und -fähigkeit der Analysedaten 5. Literatur
Die Lexikologie versteht sich meist als eine eher theoretisch modellierende Disziplin, die die landläufige Vorstellung, der Wortschatz sei ein kulturell mehr oder weniger wertvolles Sammelsurium von Wörtern, dadurch zu überwinden trachtet, dass sie Relationen und Strukturen zwischen den Elementen des Wortschatzes konstituiert. Angeregt wurde das Systematisieren und Strukturieren durch nichts anderes als lexikografische Arbeit, angefangen bei den Begriffshierarchien der frühen Neuzeit über die wortbildungsbezogenen Systeme der Barockzeit und die Herstellung etymologischer und damit indoeuropäischer Relationen im 19. Jahrhundert bis hin zu den Forderungen Hermann Pauls, die semantischen Vernetzungen des Wortschatzes auch im alphabetisch geordneten Wörterbuch darzustellen (vgl. Haß-Zumkehr 2001). Doch da Lexikografie in der Regel als bloßes Handwerk, als Redaktionstätigkeit und „Bearbeiten"1 bereits vorhandenen Materials angesehen wird - .wissenschaftliche Praxis' nennt sie Wiegand immerhin -, gerät aus dem Blick, dass alle Systematisierungen der Lexikologie im engeren Sinne ihren Ausgang in eben jener bloßen Praxis nahmen. Dabei spielt keine geringe Rolle, dass dem Wortartikel als dem Endergebnis lexikografischer Arbeit kaum noch anzusehen ist, welche theoretischen Reflexionen und Modellierungen, stets empirisch überprüft an Instanzen der Wortverwendung selbst, der lexikografischen Beschreibung vorangehen mussten. Diese weitgehend unsichtbare Arbeit der lexikografischen „Werkstatt" (so bezeichnete es vermutlich als erster Daniel Sanders) lässt sich als empirische Lexikologie bezeichnen und soll in diesem Beitrag als eigenständige, d.h. als für die theoretisch orientierte Lexikologie und für die lexikografische Praxis relevante Teildisziplin plausibel gemacht werden. Man kann das Dilemma überspitzt formulieren, um das erst noch angemessen wahrzunehmende bzw. zu entwickelnde Zwischenglied deutlich werden zu lassen: Die lexikologischen Modellierungen, insbesondere da diese in ihrer Mehr1
Wörterbuchautorinnen und -autoren werden oft als .Bearbeiter' bezeichnet; damit wird impliziert, dass etwas Vorgängiges (was?) auf eine Weise transformiert wird, die mit der Kreativität und Individualität von .Autorschaft* nichts gemein hat.
46
Ulrike Haß-Zumkehr
heit übereinzelsprachlich angelegt sind, stehen bisher auf den zu schwachen Füßen von wenigen (zumeist englischen) Beispielen der Individualkompetenz, wohingegen vor allem allgemeinsprachliche Wörterbücher, wenn mit einer systematisch kaum zu bändigenden Flut von Materialien (Belegen) konfrontiert, über positivistische Auflistungen schwer hinausgelangen. Aber mehr noch als durch die hiermit angedeutete Leerstelle wird die empirische Lexikologie angeregt durch die Möglichkeiten der Korpuslinguistik. Unter Korpus versteht man im weiteren Sinne jede definierte Menge von Texten oder auch von Textausschnitten (Belegen), die die Basis einer linguistischen Untersuchung liefern. Im engeren Sinne ist ein Korpus im Unterschied zum Belegarchiv im Zettelkasten eine Menge elektronisch gespeicherter und digital auszuwertender Texte. Ob man ein Korpus in mehrere Teilkorpora aufgliedert oder einzelne Korpora zu einem Gesamtkorpus zusammenfasst, ist eine Sache des Blickwinkels und auch der technisch-dokumentarischen Organisation. Korpuslinguistik heißt somit, große Textmengen elektronisch zu speichern, gezielt zu durchsuchen und statistisch basierte Analysen zu nutzen. Zur Zeit werden die darin steckenden Möglichkeiten noch selten ausgenutzt; statt dessen werden elektronische Textkorpora meist noch als die schnellere und bequemere Variante des Belegzettelarchivs gesehen. Doch so genutzt ist der Aufwand, den der Aufbau von Textkorpora und die Entwicklung von Recherchesoftware speziell für linguistische Zwecke erfordert, nicht zu rechtfertigen. Mit der Bezeichnung Korpuslinguistik werden also technisch-informatische, theoretisch- wie methodisch-linguistische und anwendungsbezogene Aspekte zusammengefasst. Zu den Anwendungsbereichen der Korpuslinguistik (corpus linguistics; Lenz 2000) zählen bisher allerdings überwiegend automatische Übersetzung und Spracherkennung (language engineering). Zur Beantwortung offener Fragen zu einem einzelsprachlichen System ist Korpuslinguistik bisher noch kaum herangezogen worden (vgl. Teubert 1999, bes. 293). Mit den Chancen für eine empirisch fundierte und theoretisch konsistente Lexikologie, die durch die Korpuslinguistik entstehen, sind sowohl neue Antworten auf bekannte Fragen als auch neue und weiterführende Fragen verbunden. Nachfolgende Bemerkungen lehnen sich an die öffentlich zur Recherche zugänglichen Korpora des Instituts für Deutsche Sprache an2 und damit auch an das institutseigene Recherchesystem Cosmas. Über die genannte Internet-Adresse kann jeder die in diesem Beitrag exemplifizierten Nutzungsarten nachvollziehen.
2
Zugänglich über Internet-Adresse http://www.corpora.ids-mannheim.de. Unter dem Korpusnamen .public' sind alle aus urheberrechtlichen Gründen freien Texte zusammengefasst. Die übrigen stehen der wissenschaftlichen Nutzung innerhalb des IDS (Mitarbeitern und registrierten Gästen) zur Verfügung.
Das Wort in der Korpuslinguistik
47
l. Was ist ein Wort - token, type oder Lemma? Gegenstand der theoretischen Lexikologie sind einmal das Wort (Lexem), verstanden als bi- oder trilaterales Sprachzeichen, und zum zweiten der Wortschatz, verstanden als System aus Wörtern (Lexemen). Beides wird wesentlich sprechsituationseMfAoÄe« gesehen, denn die Lexikologie ist eine langueorientierte Disziplin. Wo sitaationsgebundene, monosemierte Wörter im wissenschaftlichen Fokus stehen, ist von praktischer Semantik, Pragmatik, Sprachkritik oder sogar von Sprachgeschichte, nicht aber von Lexikologie die Rede. Für die Korpuslinguistik ist ein Wort dreierlei. Die korpuslinguistische Perspektive nimmt ihren Ausgang von der Zählbarkeit ausdrucksseitig fassbarer Einheiten in elektronisch (v)erfassten Texten geschriebener Sprache.3 Diese Einheiten sind zunächst die Zeichenketten, aus denen sich die Korpustexte äußerlich zusammensetzen. Je nach Anlage eines Korpus sind dies aber auch Markierungen, die den Korpustexten im Prozess des Korpusaufbaus hinzugefügt wurden (siehe Abschnitt 3). Die zählbaren Primäreinheiten werden als sogenannte tokens von anderen Sichtweisen des Worts abgehoben, während die Metadaten Informationen zum Kontext jedes einzelnen tokens liefern. Das Interesse der Lexikologie wie auch der Lexikografie richtet sich allerdings auf systematische Eigenschaften des Wortschatzes, auf das Usuelle und Typische des Wortgebrauchs, nicht auf den Einzelfall der Wortverwendung. Dass Wörterbücher lexikalische Einheiten deshalb aber dekontextualisieren und isolieren, wie Teubert (1999, 304) meint, ist nicht zwangsläufig. Der Grad der Generalisierung, Abstraktion und Typisierung, den eine Bedeutungserläuterung aufweist, hängt wohl vom jeweiligen lexikografischen Konzept ab. Der Unterschied zwischen Typ und Exemplar wird in der terminologischen Unterscheidung zwischen token, type und Lemma wiedergespiegelt. ,Token' oder auch ,(laufende) Wortform' ist jede als lexikalische Einheit infrage kommende Zeichenkette in einem Korpustext. Die Größe eines Korpus wird in laufenden Wortformen angegeben. Der Jahrgang 2000 der Berliner Zeitung umfasst z.B. 22,8 Mio. Wortformen (ohne Werbung). Die Jahrgänge 1994-1999 der Wochenzeitung Die Zeit enthalten 24,79 Mio. Wortformen. Das British National Corpus4 umfasst ca. 100 Mio. laufender Wortformen. Das Gesamtkorpus des Instituts für Deutsche Sprache in Mannheim (IDS) überschritt im Januar 2001 die Grenze von einer Milliarde (laufender) Wortformen. Die Zahl der tokens kann also Aufschlüsse über die diachrone Umfangsveränderung einer großen Wochenzeitung, über die durchschnittliche Satzlänge
Die Bezeichnung Korpuslinguistik wird durchaus auch mit Bezug auf digitalisierte sprechsprachliche Texte verwendet. Die methodischen Voraussetzungen schon im technischen Bereich sind hier aber so verschieden von denen schriftsprachlicher Korpora, dass gesprochene Sprache im Folgenden ausgeklammert bleiben muss. Zur Korpuslinguistik für gesprochene Sprache siehe http://www.ids-mannheim.de/prag/links.html sowie Lenz 2000, 33ff. Vgl. http://info.ox.ac.uk/bnc/
48
Ulrike Haß-Zumkehr
einzelner Autoren, Textsorten oder Zeitstufen geben, vorausgesetzt es kann ein entsprechendes Teilkorpus, etwa ein Jahrgang, gesondert betrachtet werden. Solche Umfangsquantifizierungen können zusammen mit anderen Faktoren in Schlussfolgerungen einfließen über veränderte Rezeptionsgewohnheiten von Zeitungslesem, die sowohl konzentriertere, kürzere Informationen bevorzugen als auch Text zunehmend im Zusammenhang mit Bildern interpretieren. Auch die durchschnittliche Satzlänge eines (Teil-)Korpus kann im Vergleich aufschlussreich sein: Die Sätze der Süddeutschen Zeitung in den Jahren 1995-1999 enthielten durchschnittlich 24,2 tokens, die der Frankfurter Rundschau der Jahrgänge 1997-1999 22,3 tokens. Viele tokens eines Texts sind äußerlich identisch und bilden daher einen type. Ein type ist meist eine bestimmte Schreib-, Flexions- oder Wortbildungsform. Listen von types sind aufschlussreich für die Wortbildungsforschung. Flexionsparadigmen können im Regelfall aus der Sprachkompetenz der Lexikografen ,richtig', d.h. normgerecht gebildet werden. Jedoch zeigt die aus Korpora gewonnene Liste aller types zu einem bestimmten Lexem, dass zwischen der Sprachwirklichkeit und der sowohl morphologischen als auch orthografischen Norm eine größere Differenz existiert, als sie Lexikologen aus ihrer Kompetenz heraus annehmen würden. Beispiel online: Hierzu sind 3136 types, d.h. außer dem Simplex auch Flexionsformen und Zusammensetzungen belegt; von A-Z-Online-Quellenverzeichnis bis Onlineumsatz. Sieht man sich nur das Simplex online an, dann ist das token mit der Schreibung online 22.740 mal belegt, das token mit der (Getrennt-)Schreibung on line insgesamt nur 353 mal. Dieser enorme Größenunterschied hat zunächst einiges mit dem quantitativen Übergewicht der jeweils jüngsten Jahrgänge im IDS-Korpus zu tun.5 Dennoch ist bei einer chronologischen Sortierung der Treffer (tokens) nach Jahrgängen zu erkennen, dass erstens das Lexem überhaupt erst Mitte der 80er Jahre des 20. Jahrhunderts aufkommt und dass zweitens die Getrenntschreibung und die Bindestrichschreibung (on line, on-line) Mitte der 90er Jahre durch die Zusammenschreibung (online) abgelöst worden ist. Ob dies u.a. mit der gesteigerten Produktivität dieses Lexems vor allem innerhalb mehrgliedriger Bindestrich-Zusammensetzungen zusammenhängt, wäre eine Hypothese, die sich durch die Verknüpfung chronologischer mit Frequenzdaten ergibt. Sie dürfte mit Hilfe weiterer Datentypen und Korpusanalysen relativ leicht zu klären sein. Sinnvollerweise macht man solche Untersuchungen aber nicht an einem einzelnen Lexem fest, sondern an einer systematisch definierten Klasse von Lexemen, etwa von Bindestrich-Anglizismen, damit generalisierbare Aussagen gewonnen werden können.
Dies ist aber keine zufällige oder gar von Desorganisation zeugende Besonderheit. Wer je mit der Akquisition von Korpustexten zu tun hatte, weiß, dass sich Kontakte zu und Bereitwilligkeit von Textgebem im Laufe der Zeit verbessern; quantitätssteigemd wirkt sich auch die zunehmende Digitalisierung des Presse- und Buchdrucks aus. Die Quantität von kontinuierlich gepflegten Korpora wächst im Ergebnis exponenziell.
Das Wort in der Korpuslinguistik
49
on line/on-line/On line/On-Line
online/Online
Jahr: 1985: 1986: 1987: 1989: 1993: 1994: 1995: 1996: 1997: 1998: 1999: 2000:
Jahr: 1985: 1986: 1989: 1993: 1994: 1995: 1996: 1997: 1998 1999: 2000:
Treffer (token) 2 4 2 2 7 5 97 80 54 63 32 5
Treffer (token) 2 2 3 152 220 1091 1698 1953 2096 2147 626
Bei einem so relativ neuen und entlehnten Wort mag die geschulte Individualkompetenz eine gewisse Vielfalt der Schreibungen vermuten, aber sicher nicht Zeitraum und Verlauf des Wandels vorherzusagen. Ein anderes Beispiel: Unter den ca. 360.000 acht mal und öfter belegten6 Lemmata des gegenwartssprachlichen IDS-Gesamtkorpus befinden sich 315 linkserweitemde Zusammensetzungen auf -frau (von Aboriginesfrau bis Zwillingsfrau). Sieht man sich diese Liste genauer an, erkannt man einen neuen Bildungstyp, bei dem stark lexikalisierte und teilweise idiomatisierte Zusammensetzungen auf -mann (a) teils aus rechtlichen Gründen ,moviert', (b) teils aber auch aus ironisch-emanzipatorischen Gründen Aufgebrochen' werden: (a) Außenhandelskauffrau, Bankkauffrau, Fachfrau, Feuerwehrfrau usw., (b) Biederfrau, Buhfrau, Eisfrau, Gewährsfrau, Hampelfrau, Jägersfrau, jedefrau, Sauberfrau, Schmerzensfrau, Schneefrau, Seefrau, Wasserfrau, Watschenfrau, Weihnachtsfrau u.a.
Die chronologische Sortierung zeigt, dass die in diesem Korpus seit 1985 belegten rechtlichen Bildungen (a) den ironisch-emanzipatorischen (b) um mindestens ein bis drei Jahre vorausgehen. Es zeigt sich femer, dass jedefrau als einziges Lexem dieser Klasse ebenfalls seit 1985 und zudem um mindestens das Dreifache häufiger belegt ist als die anderen Lexeme aus der Klasse (b). Somit fallt es aus (b) heraus. Rückfragen an das Korpus und Interpretation der Ergebnisse fangen an dieser Stelle an, eingehenderes Interesse zu wecken, können hier aber nicht weiter verfolgt werden. Die Differenz zwischen dem aus der sprachwissenschaftlichen Individualkompetenz Vorhersagbaren und dem Korpusbefund macht nicht nur existierende Normunsicherheiten der Sprachgemeinschaft deutlich (wie im Falle der Schreibung von online), sondern auch die Allgegenwart des Normen- und Sprachwandels.
Die Grenze von acht Treffern zur ersten und raschen Unterscheidung von usuellen von okkasionellen Bildungen ist natürlich willkürlich.
50
Ulrike Haß-Zumkehr
Types lassen sich in der Regel (aber nicht immer) auf eine Grundform zurückführen. Diese Grundform, wie in der Lexikografie Lemma genannt, spielt in der Korpuslinguistik, anders als in der Lexikografie, die Rolle des von den Nutzern potenziell eingegebenen Suchworts. Es stellt keine anordnungsrelevante Einheit dar. Die Funktion eines korpuslinguistischen Lemmas ist, alle diejenigen types zu bündeln, die Nutzer interessieren könnten, wenn sie ein bestimmtes Suchwort eingeben. Wer Freiheit als Suchwort eingibt, möchte auch Belege zu Freiheiten, möglicherweise auch zu Pressefreiheit, Freiheitssucher, freiheitlich und unter Umständen auch zu freyheit, freihält, friheit usw. ausgegeben erhalten. Das Spektrum der Ableitungen und Zusammensetzungen zu einem Lexem, das ein hinreichend großes Korpus dokumentiert, ist beträchtlich größer als das entsprechende Spektrum, das selbst eine Gruppe von Experten ad hoc zusammenstellen könnte. Auch die kompetenzbasierten Annahmen über okkasionelle und usuelle Wortbildungen stimmen mit Sicherheit nicht mit dem überein, was ein Korpus mittels einer anzusetzenden Frequenzgrenze .aussagt'. Der lexikografische Nutzen solcher type-Listen mag manchem mit wachsender Größe des Korpus als Last erscheinen: Es gilt, die adhoc-Bildungen auszusondern. Dies ist mithilfe von Frequenzkriterien relativ einfach zu erledigen. Setzt man wie oben das Frequenzkriterium z.B. bei acht Treffern an, rutscht allerdings ein type wie Senkrechtsarg als usuelle Bildung durch. Bei genauerem Hinsehen befinden sich diese acht Treffer alle in ein und demselben Text, einer Zeitungsmeldung der Art .Vermischtes und Kurioses', die von einer Erfindung berichtet. Es ist also eine Mindestdistribution nach Texten und am besten auch nach Zeitstufen oder Jahrgängen mit dem Frequenzkriterium zu verknüpfen. Nach einem Aussondern der adhoc-Bildungen bleiben dennoch so viele Wortbildungen übrig, dass die Entscheidung über den Ansatz als WörterbuchLemma schwer fällt, schwerer jedenfalls als die Auswahl aus einer in jedem Falle kleineren, kompetenzbasiert erstellten Liste von Wortbildungen. Hier nun müssen lexikologische Klassifikationen greifen, indem Wortbildungsmuster und die für sie exemplarischen Lexeme gesucht werden. Auch die semantischen Binnenrelationen von Zusammensetzungen liefern klassifikationsrelevante Aspekte, die überdies in kognitiver Sicht interessant sind.7 Ein Lemma in der Korpuslinguistik ist zwar vor allem Suchwort, kann aber auch als Vorstufe für das lexikografische Lemma eines potenziellen Wörterbuchs genutzt werden. Eine der grundlegenden Fähigkeiten eines korpuslinguistischen Recherchesystems ist die Zuordnung vieler tokens zu einem type und in einem weiteren Schritt die Abbildung verschiedener types auf ein Lemma. Im Suchvorgang selbst werden diese Schritte in umgekehrter Reihenfolge abgearbeitet. Eine Liste von Lemmata im Hintergrund des Recherchesystems ist Vor-
7
Teubert (1999, 297f.) sieht mit Recht eine kaum überbrückbare Kluft zwischen Korpuslinguistik und kognitiver Linguistik. M.E. könnte es aber gelingen, mit Hilfe der Korpuslinguistik zu erweisen, dass kognitive Strukturen von der parole abhängen und sich mit ihr wandern.
Das Wort in der Korpuslinguistik
51
aussetzung dafür, dass zu einem eingegebenen Suchwort zunächst alle relevanten types und dann auch die Belegstellen mit je einem token gefunden werden. Geleistet wird dies von einem sogenannten Lemmatisierer, einer Softwarekomponente,8 die einerseits eine Liste von Grundformen enthält, andererseits über Kombinationsregeln verfügt, die ihr erlauben, unbekannte Zeichenketten zu zerlegen und auf bekannte zurückzuführen. Manchmal entstehen dabei Fehler wie Achillesvers, Senftuba, Aludosis und Drachenfliege, die nicht nur erheitern, sondern auch einen Eindruck von der Arbeitsweise dieser Softwarekomponente vermitteln. Die Qualität eines Lemmatisierers kann parallel zum Ausbau eines Korpus mit entsprechendem personellen Einsatz kontinuierlich verbessert werden, indem weitere Wortbildungsregeln algorithmisch formuliert und neue Grundformen hinzugefügt werden. Ein Korpus konfrontiert mit der beträchtlichen Differenz zwischen der Wirklichkeit der einzelsprachlichen Wortbildung und den überlieferungsbedingten Vorstellungen von ,Grund-' bzw. ,Normal-'Formen. Deutlich wird dies insbesondere bei den Partizipien im Verhältnis zu , ihren' Infinitiven. Partizipien wie belebt, entfernt, gelungen, vergangen, geboren, geschickt, geschlossen sind so viel häufiger und dazu öfter attributiv denn prädikativ belegt als die Infinitivformen, dass man sich aus lexikologischen Gründen fragen muss, ob diese Partizipien nicht als lexikalisiert zu betrachten und im Wörterbuch entsprechend als eigenes Lemma anzusetzen sind.9 Eine semantisch-pragmatische Analyse der morphologisch verwandten types fördert u. U. auch inhaltsseitige Differenzen zutage, die für das Vorliegen unterschiedlicher mentaler Konzepte und gegen eine gemeinsame Behandlung im Wortartikel sprechen. Einige partizipial gebildete Adjektive bzw. Adverbien scheinen unter Lexikografen als solche anerkannt und sind beispielsweise im Duden-Universalwörterbuch als Lemma angesetzt, z.B. fahrend, entsprechend, laufend, anschließend, bestimmt, gegeben, betont, erklärt, betroffen. Anderen, bei denen der Verdacht auf Lexikalisierung ebenso besteht (z.B. versucht, vergangen, verkauft, bestätigt, besetzt, geblieben, geplant) wird dieser Status jedoch nicht zugewiesen. Ein korpuslinguistisches Problem dabei ist die Homonymie von Infinitiven und 1. und 3. Person Plural einerseits und 3. Person Singular und Partizip II andererseits. Dort allerdings, wo nicht-homonyme Partizipien I und häufiger sind als mit diesen homonyme Infinitive und finite Verbformen zusammen genommen, stellt die Frequenz ein starkes Argument für die Hypothese der Lexikalisierung dar. Man vergleiche folgende Frequenzen: entsprechend anschließend betroffen
98.483 43.634 47.663
entsprechen anschließen betreffen
8.911 3.340 4.501
Siehe: http://www.ids-mannheim.de/kt/nierkmal2.html In der Lernerlexikografie wird ohnehin, aber aus anderen Gründen, die gesonderte Lemmatisierung vor allem unregelmäßiger Stammformen des Verbs gefordert bzw. realisiert. Es geht mir hier aber allein um die lexikologischen Begründungen für lexikalisierte und nichtlexikalisierte Wortformen.
52
Ulrike Haß-Zumkehr vergangen laufend
127.672 47.564
vergehen laufen
2.803 39.424
Nur nach weitergehenden Analysen - hier hilft die Feststellung der Kookkurrenzpartner (s.u.) weiter - kann im Fall regelmäßiger Verben die Homonymie von finiter Verbform und (attributiv gebrauchtem) Partizip II aufgelöst werden. Die Frequenzangaben in der nachfolgenden linken Spalte enthalten also beide. Dennoch wird die relative Seltenheit des Infinitivs sehr deutlich: bestimmt betont erklärt verkauft versucht bestätigt besetzt geplant
87.384 83.344 238.015 54.954 86.611 57.036 32.817 119.439
bestimmen betonen erklären verkaufen versuchen bestätigen besetzen planen
13.167 5.429 28.116 27.898 34.005 12.167 6.054 10.480
Ein paralleles Problem ist die Homonymie von Infinitiv und Partizip (z.B. beraten, bekommen, geraten, vergessen, verlassen, erfahren). Homonymie als ausdrucksseitige Ununterscheidbarkeit von types verhindert aussagekräftige Frequenzdaten, es sei denn die Frequenzanalysen werden mit disambiguierenden Kookkurrenzanalysen kombiniert. Außer dem Frequenzkriterium kommt das der Lexikalisierung (semantischen Selbstständigkeit) in Betracht, wenn über die Behandlung von Partizipien in Wörterbüchern - als Lemma mit eigenem Artikel oder als dem lemmatisierten Infinitiv subsummierter type - zu entscheiden ist. Genau genommen ist die Frequenz nur als ein Indiz für Lexikalisierung zu werten, aber eben doch als ein ,objektives' Indiz. Die gängige Praxis etwa des Duden-Universalwörterbuchs10 zeigt, dass die Frage nach der semantischen Selbstständigkeit einer ,lemmafähigen' Form intersubjektiv uneinheitlich beantwortet wird, falls sie denn systematisch gestellt wurde. Und das Frequenzkriterium stand mangels Korpus vermutlich nicht zur Verfügung. Was für das Verhältnis zwischen Infinitiv und Partizipien gilt, gilt ähnlich für das Verhältnis zwischen Singular- und Pluralformen von Substantiven. Nicht nur der Infinitiv, sondern in sehr vielen Fällen gehören auch die Formen des Singulars zu den selteneren Formen im Flexionsparadigma eines Lemmas: Angabe: Aktie: Einzelheit: Ermittlung: Geld: Maßnahme: Nachricht: Problem:
10
Sg.: 2.647 Sg.: 21.630 172 Sg.: Sg.: 2.407 Sg.: 9.386 Sg.: 8.003 Sg.: 12.198 Sg.: 72.934
PL 104.360 PL 43.631 7.904 PL PL 22.035 PL 15.182 PL 25.740 PL 16.862 PL 104.421
Hier heißt es in einigen Fällen innerhalb der für etymologische Angaben reservierten eckigen Klammer: „eigentlich Partizip 2 von ...", in anderen (geboren, bewegt, d.h. nicht nur bei unregelmäßigen Verben!) wird auf den Infinitiv verwiesen.
Das Wort in der Korpuslinguistik Struktur: Verhandlung: Kondition: Datum: aber Aktion: Aussicht: Chance: Technik: Technologie: Zeit:
53
Sg.: 13.164 Sg.: 7.462 Sg.: 2.659 Sg.: 8.365
PL: 17.831 PL: 45.791 PL: 4.484 PL: 34.508
Sg.: 41.812 Sg.: 18.381 Sg.: 68.022 Sg.: 46.262 Sg.: 15.040 Sg.: 350.932
PL: 16.530 PL: 9.383 PL: 50.425 PL: 6.464 PL: 6.625 PL: 60.408
Die erste Gruppe zeichnet sich durch den z.T. um ein Vielfaches häufigeren Plural aus. In der zweiten ist zwar der Singular häufiger, aber auch hier besteht der Verdacht auf eine größere oder kleinere semantisch-pragmatische Differenz zwischen Singular und Plural. Vielleicht sollte man neben den bekannten Pluraliatantum, die über keinen Singular verfugen (Eltern, Leute, Kosten), eine weitere Klasse usueller (unechter) Pluraliatantum ansetzen, deren Spezifikum nicht auf der morphologischen, sondern auf der semantisch-pragmatischen Ebene liegt. Prototypisch sind hier etwa Datum und Daten, aber auch Kondition und Konditionen. Vergleichende Untersuchungen des Gebrauchs von Singularund Pluralformen können die generellen Gründe für eine (wachsende?) Usualität bestimmter Pluralformen in bestimmten Textsorten feststellen. Die Frage nach einer möglichen Lexikalisierung stellt sich bei den usuellen Pluraliatantum nicht mit der gleichen Brisanz wie bei den partizipialen Adjektiven, wird aber ebenfalls entscheidend davon abhängen, ob diese Frage korpusund damit in irgendeiner Form gebrauchsbasiert oder ausschließlich kompetenzbasiert entschieden wird. Die traditionell motivierte Fixierung auf die Normalform Singular verhindert jedenfalls, dass semantisch-pragmatische Besonderheiten des Plurals in den Blick kommen. Den Infinitiv und den1' Nominativ Singular als die .prototypische' Form zur Repräsentation mehr oder weniger komplexer morphologischer Paradigmen anzusetzen, war eine Entscheidung der abendländischen Tradition. Zu fragen ist, inwieweit genau diese beiden durch die Tradition hervorgehobenen Formen wirklich prototypisch sind und von den Sprachteilhabem/Nutzern auch entsprechend eingestuft werden. In gedruckten Wörterbüchern ist diese Frage relativ irrelevant, denn es sind die Lexikografen, die die Form des Lemmas vorgeben und darüber entscheiden, ob schwer zuzuordnende Varianten eventuell als Verweislemma angesetzt werden. Wer wie Fremdsprachenlerner nur einen unvollständigen oder unsicheren Überblick über das jeweilige Flexionsparadigma hat und überdies orthografisch unsicher ist, findet das Gesuchte unter Umständen nicht, obwohl es ,drin' steht. In elektronischen Nachschlagewerken, die neben einer Stichwortsuche oft auch über eine Volltextsuche und manchmal auch über
In Wahrheit gibt es hier mehrere Möglichkeiten, abhängig von der Kombination mit bestimmtem, unbestimmtem oder gar keinem Artikel: (ein) Angestellter, (der) Angestellte, (die) Angestellte.
54
Ulrike Haß-Zumkehr
eine sogenannte schreibungstolerante Suche verfügen, werden selbst unsichere und in der Tradition der ,Normalformen' ungeschulte Nutzer hingegen immer fündig, wenn das Gesuchte überhaupt im System enthalten ist. Untersuchungen über die Form, in der Suchwörter (in elektronischen Wörterbüchern und Internet-Suchmaschinen) eingegeben werden, könnten Aufschluss darüber geben, ob bestimmte und wenn ja, welche der types eines morphologisch-orthografischen Paradigmas einen prototypischen Rang haben. Eben die Gewöhnung vor allem von Internet-Vielnutzern an schreibungstolerante Suchmöglichkeiten könnte allerdings dazu führen, dass in der Wahrnehmung der Sprachteilhaber überhaupt gar keine prototypisch ausgezeichneten Formen je Flexionsparadigma mehr existieren, sondern dass man sich von unterschiedlichen orthografischen und morphologischen Varianten her dem Paradigma nähert. Das Variantenspektrum würde dann nicht (mehr) als Paradigma, sondern als äußerlich vielgestaltige Repräsentation eines einheitlichen semantischen Konzepts wahrgenommen.
2. Datentypen Im ersten Abschnitt dieses Beitrags ist zur Veranschaulichung des lexikologischen Nutzens der Korpuslinguistik nur die Frequenzanalyse herangezogen worden. Sie ist zwar die Basis jeder korpuslinguistischen Lexikologie, aber, wie sich schon andeutete, keineswegs deren Grenze. Lexikologen, für die Programme zur Korpusrecherche mehr oder weniger eine black box sind, können sich je nach Anfrage an das Korpus mit einer ganzen Reihe unterschiedlicher Datentypen versorgen lassen. Diese seien im Hinblick auf ihr lexikologisches Potenzial kurz skizziert: Die Auflistung der in einem Korpus belegten types klärt nicht nur über morphologisch-orthografische Varianten eines Lemmas, sondern auch über belegte Zusammensetzungen und Ableitungen und deren Usualitatsgrad (über Häufigkeit) auf. Es ist offensichtlich, dass hierdurch Vergleichsuntersuchungen zur Produktivität bestimmter Wortbildungsmuster - synchron nach Textsorten und Varietäten, diachron innerhalb der gleichen Textsorte und Varietät - in einer Weise ermöglicht werden, mit der eine Exzerption per Hand nicht konkurrieren kann. Der erfahrungsgemäß beste zweite Schritt, nach frequenzannotierten Listen von types, ist die Auseinandersetzung mit automatisch erzeugten Listen signifikanter Kookkurrenzpartner wahlweise zu einem infrage stehenden Lemma oder type. Nicht alle Rechercheprogramme verfügen wie das im IDS entwickelte über eine Kookkurrenz- oder Kollokationskomponente.12 Aber sie ist entscheidend für die linguistische Qualität der Korpusanalysen, denn differenzierte und
Damit ist bei Korpusrecherchen in der Regel dasselbe gemeint. Näheres zum Kollokationsanalyse-Tool des IDS siehe Belica/Steyer (2001).
Das Wort in der Korpuslinguistik
55
mit flexiblen Parametern13 versehene Kookkurrenzanalysen lassen sich für eine ganze Reihe toxikologischer Fragestellungen verwenden. Sie basieren auf der Korrelation der relativen Häufigkeit einzelner types und Lemmata, auf dem signifikanten Miteinander-Vorkommen zweier oder mehrerer types oder Lemmata innerhalb eines wählbaren Wortabstands. So werden lexikalische Kohäsionen mess- und vergleichbar. Zu Hausfrau sind beispielsweise folgende signifikante Kookkurrenzpartner nachweisbar; ihre Reihenfolge entspricht der absteigenden lexikalischen Kohäsion der Partner; die kursivierten Lexeme verweisen auf weitere Elemente eines Kookkurrenzclusters. In Anschluss daran werden die Kookkurrenzpartner zu einem polysemen Lexem aufgelistet und danach kommentiert: Kollokatoren zu Hausfrau:.14 BelegNr 1+614: 615+69: 684+115: 799+36: 835+30: 865+3: 868+82: 950+60: 1010+19: 1029+40: 1069+31: 1100+42: 1142+20: 1162+28: 1190+20: 1210+28: 1238+18: 1256+11: 1267+20: 1287+9: 1296+20:
Gamma Kollokatoren 3446 Mutter 835 manner 695 Rentner 450 Hausmänner 426 Berufsorganisation Mozartstr Berufsorganisation 364 Studenten 242 Mütter 237 Berufstätige 229 Blume 222 Kindern 217 geb geboren geh 211 Hausmann 178 Selbständige 156 Angestellte 155 Kantonsrätin 143 geboren 138 Sekretärin 131 Hausmännern 122 Krankenschwester
Häufigkeit 614 69 115 36 30 3 82 60 19 40 31 42 20 28 20 28 18 11 20 9 20
Dem mit dem Programm Unvertrauten sagen die dort genannten Parameter wohl wenig. Dennoch sei als ein Eindruck von der Komplexität qualitativ hochwertiger Kollokationsanalyse wiedergegeben, worunter linguistische Nutzer wählen können: Lemmatisierung ja/nein („Sollen Lemmata oder Textwörter gesucht werden?"); Wortabstand: l bis n; „Soll über Satzgrenzen hinaus gesucht werden?" ja/nein; Granularität: fein/mittel/grob („Wie intensiv sollen Mehrwortgruppen gesucht werden?"); Zuverlässigkeit hoch/normal/ analytisch („Ziehen Sie Ausbeute oder Zuverlässigkeit vor?"); Clusterzuordnung: eindeutig/mehrfach („Was tun, wenn ein Beleg mehreren Kollokationsclustern zugeordnet werden kann?"); Funktionswörter beachten: ja/nein; Autofokus ja/nein („typische Stellung der Kollokatoren im Kontext ermitteln"); Anzeigen des sog. Gammawerts ja/nein (er gibt die Stärke der lexikalischen Kohäsion an). In Belica/Steyer (2001) werden die Parameter erstmals beschrieben. Kollokatoren sind sortiert absteigend nach der berechneten Stärke der lexikalischen Kohäsion, angegeben durch den ,Gammawert'. Die kursiv gesetzten Lexeme markieren Clusterzugehörigkeit.
56
Ulrike Haß-Zumkehr 1316+20: 1336+2: 1338+13: 1351+20: 1371+10: 1381+11: 1392+29: 1421+19: 1440+14: 1454+10: 1464+1: 1465+7: 1472+7: 1479+11: 1490+13: 1503+15: 1518+10: 1528+9: 1537+57: 1594+18: 1612+10: 1622+27: 1649+5: 1654+7: 1661+8: 1669+5: 1674+14: 1688+18: 1706+3: 1709+13: 1722+17: 1739+24: 1763+7: 1770+12: 1782+5: 1787+6: 1793+3: 1796+7: 1803+5: 1808+52: 1860+2: 1862+2: 1864+4: 1868+5: 1873+9: 1882+8: 1890+9: 1899+5: 1904+2: 1906+11: 1917+4: 1921+4: 1925+5: 1930+8: 1938+4:
121 118 117 117 107 105 104 99 97 91 89 88 88 83 78 78 76 74 73 71 70 69 66 65 60 60 59 58 56 56 56 56 55 55 54 52 52 51 51 51 51 51 51 50 49 49 48 48 48 48 47 47 47 46 46
Arbeitslose Berufsfrau Rentnern verheiratet berufstätige tüchtige Beruf Lehrerin brave Bäuerin kaufmännische züchtige Wurmrieder gelernte Einkaufen Handwerker verheiratete biedere Kinder Schüler biederen Küche männern Kauffrau Ferres gestreßte Wäsche Arbeiter Familienväter Kochen Maria Rolle Einkaufstaschen Müttern Nänni Erwerbstätige Gemeinderätin frustrierten Köchin alte gard Kindergärtnerin Mutterdasein Rentnerinnen Erika Landwirt Herisau Geschäftsleute Geschäftsfrau Elisabeth Haushilfen Blankers-Koen Bäuerinnen perfekte Teilzeitangestellte
20 2 13 20 10 11 29 19 14 10 l 7 7 11
13 15 10 9 57 18 10 27 5 7 8 5 14 18 3 13 17 24 7 12 5 6 3 7 5 52 2 2 4 5 9 8 9 5 2 11 4 4 5 8 4
57
Das Wort in der Korpuslinguistik 1942+2: 1944+7: 1951+15: 1966+2: 1968+5: 1973+3: 1976+3: 1979+5: 1984+4: 1988+18: 2006+5: 2011+5: 2016+3: 2019+4: 2023+4: 2027+2: 2029+3751:
44 44 44 43 43 42 42 42 42 41 41 41 41 41 40 40
Veronika 60jährige Ehemann Maaßen berufstätig Ehefrau Psychiatrieschwester Bichwil Bügeln Monika Mutterrolle Hobbyköche Familienfrau Marianne Magdalene Romi statistisch unspezifisch
2 7 15 2 5 3 3 5 4 18 5 5 3 4 4 2 3751
Kollokatoren za Absatz·}5 BelegNr 1+328: 329+83: 412+1: 413+14: 427+8: 435+60: 495+9: 504+48: 552+47: 599+36: 635+2: 637+16: 653+23: 676+111: 787+12: 799+71: 870+69: 939+133: 1072+117: 1189+257: 1446+111: 1557+32: 1589+6: 1595+267: 1862+215: 2077+339: 2416+515: 2931+169: 3100+143:
15
Gamma Kollokatoren 4929 reissend finden reissend 4010 Artikel Grundgesetz 231 Artikel Grundgesetz 2 3 Artikel Grundgesetz 2 l Artikel Grundgesetz 2 Artikel Grundgesetz 3 1 Artikel Grundgesetz 3 Artikel Grundgesetz 1 Artikel Grundgesetz Artikel 231 Artikel 2 3 Artikel 2 1 Artikel 2 Artikel 3 1 Artikel 3 Artikel l Artikel 2834 Paragraph 1 Paragraph
1923 reissenden finden 1371 1198 948 781 695 596 550
reissenden Grundgesetz finden steigern steigen Prozent Umsatz Produktion
Häufiekeit 328 83 1 14 8 60 9 48 47 36 2 16 23 111 12 71 69 133 117 257 111 32 6 267 215 339 515 169 143
Kollokatoren sind sortiert absteigend nach der berechneten Stärke der lexikalischen Kohäsion, angegeben mittels .Gammawert'. Die kursiv gesetzten Lexeme markieren Clusterzugehörigkeit.
58 3243+287: 3530+22: 3552+35: 3587+72: 3659+67: 3726+123: 3849+102: 3951+87: 4038+134: 4172+301: 4473+159: 4632+3: 4635+68: 4703+1: 4704+7: 4711+30: 4741+37: 4778+51: 4829+30: 4859+23: 4882+23: 4905+13: 4918+56: 4974+65: 5039+19: 5058+11: 5069+26: 5095+19: 5114+6: 5120+1: 5121+50: 5171+19: 5190+18: 5208+11: 5219+9: 5228+15: 5243+22: 5265+23: 5288+9: 5297+9: 5306+27: 5333+19: 5352+9: 5361+2: 5363+6: 5369+15: 5384+3: 5387+3: 5390+9: 5399+7: 5406+14: 5420+3: 5423+2: 5425+4: 5429+13:
Ulrike Haß-Zumkehr 530 2 527 Satz 7 Satz 505 ankurbeln 417 stagnieren 391 Produkt 356 sinken 344 Schuh 320 3 282 hoch 262 l 236 Einkommensteuergesetz 220 weltweit 198 2c 190 Paragraf 188 schleppend 173 rückläufig 163 Fahrzeug 159 Halbjahr 159 Heizöl 156 Inland 154 alkoholfrei 153 4 151 fördern 146 Nutzfahrzeug 129 Preisgarantie 128 schrumpfen 122 gestiegen 116 Mineralölprodukt 115 Nr 115 erhöhen 114 Geschäftsjahr 110 Erzeugnis 108 harzen 106 kehrtmachen 103 Audi 101 Stiefel 100 Pkw 97 mengenmässig 96 Getränk 93 Marke 91 stocken 87 Rover 86 Bundesverfassung 85 Umsatzrekord 84 quartal 84 BMW 83 Ertrag 83 Personalcomputer 83 Ertrag 77 klettern 76 überprüfungsbedürftig 75 landwirtschaftlich 74 Stöckelschuh 70 regehi
287 22 35 72 67 123 102 87 134 301 159 3 68 l 7 30 37 51 30 23 23 13 56 65 19 11 26 19 6 l 50 19 18 11 9 15 22 23 9 9 27 19 9 2 6 15 3 3 9 7 14 3 2 4 13
59
Das Wort in der Korpuslinguistik 5442+19: 5461+2: 5463+8: 5471+7: 5478+15: 5493+3: 5496+1: 5497+2: 5499+15: 5514+1: 5515+10: 5525+37: 5562+12: 5574+1: 5575+2: 5577+5: 5582+34: 5616+6: 5622+1: 5623+3: 5626+1: 5627+6: 5633+11: 5644+2: 5646+23: 5669+12: 5681+6: 5687+1: 5688+44: 5732+5: 5737+1: 5738+2: 5740+6: 5746+4: 5750+1: 5751+6: 5757+3: 5760+8: 5768+4: 5772+6: 5778+8: 5786+51: 5837+15: 5852+28: 5880+5: 5885+11: 5896+17: 5913+3: 5916+18: 5934+1: 5935+2: 5937+18: 5955+1: 5956+13: 5969+1:
68 Steigerung 68 zweistellig zweistellig 68 Sohle 65 flach 65 Grundgesetzartikel 65 flach 63 Ausländergesetz 60 Rindfleisch 60 wachsen 60 verdoppeln 60 wachsen 60 verdoppeln 60 wachsen 59 Spezialität 59 Skoda 58 Tonne 58 Umsatzzahl 58 besagen 58 Benz 58 besagen 58 Benz 57 Kilowattstunde 57 Satzung 57 Vorjahr 57 schleppen 57 Gesamtjahr 57 Vorjahr 55 sichern 55 Hektolitern 55 sichern 55 Lire 54 Nordamerika 54 Reissender 52 EG 52 Neuwagen 51 Autohersteller 49 hergestellt 48 Beschafningsmarkt 47 Westeuropa 47 Hektoliter 47 Stück 46 Zeile 46 1995 45 Zentimeter 45 boomen 44 zurückgehen 43 Alpinski 43 leicht 42 Ausland 42 anfügen 42 Ausland 42 Dieselkraftstoff 42 mangeln 42 Dieselkraftstoff
19 2 8 7 15 3 l 2 15 l 10 37 12 l 2 5 34 6 l 3 l 6 11 2 23 12 6 l 44 5 l 2 6 4 l 6 3 8 4 6 8 51 15 28 5 11 17 3 18 l 2 18 l 13 l
60
Ulrike Haß-Zumkehr 5970+7: 5977+3: 5980+1: 5981+1: 5982+1: 5983+4: 5987+4: 5991+4: 5995+2: 5997+4001:
41 41 41 40 40 40 40
spitz Dataquest spitz Ottokraftstoff inländisch Mineralbrunnen inländisch inländisch 40 Ottokraftstoff statistisch unspezifisch
7 3 l l l 4 4 4 2 4001
Es wird unmittelbar deutlich, welche unterschiedlichen Gründe die hier nachgewiesenen Kohäsionen haben können: Es gibt mehr oder weniger variable oder feste Syntagmen, ob man sie den Phraseologismen, Funktionsverbgefugen (reißenden Absatz finden), Kollokationen (züchtige, biedere Hausfrau; reißender, schleppender Absatz), oder irgendeiner anderen Klasse zuordnen will. Femer gibt es pragmatisch bzw. diskursindizierte und sachgebietsspezifische Kohäsionen (zu Absatz: Artikel, Paragraf, Satz, Grundgesetzartikel, Einkommenssteuergesetz·, steigern, Umsatz, Produktion, stagnieren, boomen; Schuh, Stöckelschuh, Stiefel, Sohle, flach, spitz).16 Mit dem Instrument der Kookkurrenzanalyse erhält man folglich Zugang zu Hypothesen über usuelle (!)17 Mehrworteinheiten, über das Spektrum der lexikalischen wie syntaktischen Variabilität einer Mehrworteinheit, sowie über unterschiedliche Lesarten eines Lexems, insbesondere, wenn diese parallel zu Domänen und Themen angesetzt werden sollen. Die an entsprechenden Kookkurrenzpartnern abzulesende Polysemie von Absatz z.B. ist nach dem hier zugrundegelegten Textkorpus dreifach: (a) Verkauf, (b) Teil eines Textes, insbesondere eines Gesetzestextes, (c) Teil eines Schuhs.
Auch die Reihenfolge lässt sich aus dem Korpus begründen: Die überragende Häufigkeit der wirtschaftsbezogenen Lesart (a) sorgt für Prototypikalität. Die textbezogene Lesart (b) ist relativ häufig, aber das Lexem wird hier rein referenziell zur Identifizierung von Textstellen und völlig beiläufig im Zusammenhang von Diskussionen über aktuelle Rechtsfragen verwendet. Am seltensten ist noch die schuhbezogene Lesart (c). Die Reihenfolge a, b, c ist im Zehnbändigen Duden (2000) genau umgekehrt wie hier. Es fallt ferner auf, dass eine weitere, in Wörterbüchern regelmäßig auftauchende Lesart hier fehlt: die architekturbezogene, von fachsprachlichen Lesarten zu schweigen:
16 17
Zur Differenzierung s. Steyer 2000. Das Ausrufungszeichen bezieht sich auf die immer wieder festzustellende Diskrepanz zwischen den in einem weitgehend kompetenzgestützt erarbeiteten Wörterbuch verzeichneten Mehrworteinheiten und den durch Usualität (Korpusfrequenz) ausgezeichneten Mehrworteinheiten.
Das Wort in der Korpuslinguistik
61
4. Unterbrechung einer Fläche, von etw. Fortlaufendem: der A. eines Berges, einer Treppe, einer Mauer. S. (Geol.) Ablagerung: A. von Schlamm und Kies. [© 2000 Dudenverlag]
Man kann daraus schließen: Die Duden-Lesart (4) von Absatz ist so selten, dass sie in einem überwiegend gebrauchs- und pressesprachlichen Korpus des gegenwärtigen Deutsch nicht signifikant häufig belegt ist. Möglicherweise ist sie als fachspezifisch einzustufen. Dass die Duden-Lesart (5) die einzige fachspezifische Lesart von Absatz ist, scheint zweifelhaft; sie kann daher in einem standardsprachlichen Wörterbuch auch entfallen. Wenn man auch betonen muss, dass automatische Kookkurrenzanalysen nichts weiter als Hypothesen zu unterschiedlichen syntagmatischen und semantischen Aspekten liefern - die linguistische Beurteilung der jeweiligen Kohäsion wird ein Computer m.E. auch in alle Zukunft nicht leisten können -, so ist der Wert solcher Hypothesen doch offensichtlich. Für eine Validierung der Hypothesen und für weitere Fragestellungen eignet sich der Datentyp der sogenannten Key-Word-in-Context-Belege (KWICs), bei dem ein strikt zeichenbegrenzter, maximal eine Bildschirmzeile langer Satzausschnitt rechts und links des types, Lemmas oder auch der zuvor festgestellten signifikanten Kookkurrenz angezeigt wird. KWIC-Beispiele zu Absatz: WKB/SG3, Der Spiegel (2. Hj. 1990) wei Senatoren hat - bestimmt Artikel 51 Absatz 2 des Grundgesetzes :. die Schuhfabrik hat keinen Absatz mehr, beim Glühlampenhersteller Verteidigungswaffen fanden " reißenden Absatz ", berichtet das Hallesche Boule WKB/ZT2, Die Zeit (1. Hj. 1990) fkleber fanden unter Trabifahrem guten Absatz. Izog sich im Schatten des Artikels 20, Absatz 2 der Verfassung, der die Diskri WKD/BZA, Berliner Zeitung, 2. Halbjahr 1989 r Forschung über die Produktion bis zum Absatz - weltmarktfähige Erzeugnisse her ndung von Wissenschaft , Produktion und Absatz in diesen starken ökonomischen Ei KWIC-Beispiele zu Absatz mit Kollokator stieg: M89 us 17,7 Prozent). Dagegen stieg der Absatz bei BMW of North America Ine (ebe M89 passen: In wenigen Jahren stieg der Absatz von alkoholfreiem Bier von prakti M91 (gfu) in Hannover hingewiesen. Der Absatz stieg auf 7,9 (1990: 6,9 M94 6 000 Wagen. In Brasilien stieg der Absatz um 22,4 auf 344 000 Fahrzeuge. In M95 runnen in Bonn mitteilte, stieg der Absatz in den ersten drei Quartalen 1995 M96 zent gegenüber 1994. Zwar stieg der Absatz im Dezember 1995 bei einer Jahres M98 von 15 Prozent. Im Januar stieg der Absatz von Mercedes- Pkw im Vergleich zu H85 den drei folgenden Jahren stieg der Absatz auf jeweils etwa 900 Mill. DM. gr MK1 so-Ausstellung machte selbst diesen Absatz ansehnlich und originell - stieg BZK n. als im Laufe des Jahres 1968 der Absatz wieder stieg, haben sich in den C93 rie ihre Umsätze um 30 Prozent. Der Absatz von Windows-Anwendungen stieg sog U95 r erfolgreichen C-Klasse, stieg der Absatz um etwa 15 Prozent auf mehr als 5
Mittels KWIC-Indizes kann nicht nur die polyseme Struktur des Lexems sowie seine Rolle in Mehrwortausdrücken und die Qualität einer lexikalischen Kohäsion festgestellt, sondern auch viele der syntaktischen Merkmale ermittelt werden. Im Falle des oben genannten Beispiels online ist dies etwa die Nachstel-
62
Ulrike Haß-Zumkehr
lung bei attributiver Funktion, die Verwendung in Zusammenhang vor allem mit einigen bestimmten Verben (gehen) und die sehr viel häufigere Verwendung als präfixartiges Element (vgl. Haß-Zumkehr 2000). Dadurch, dass jede KWIC-Zeile mit einem Quellennachweis (Sigle) versehen ist, erfüllt dieser Datentyp bereits die Bedingungen des wissenschaftlichen, nachweisenden Belegs. Der letzte hier zu nennende Datentyp sind die altbekannten Belege, die ein Lexem oder eine Kollokation im größeren Satz- bzw. Textkontext zeigen. Doch weisen Belege aus elektronischen Korpora Unterschiede gegenüber handexzerpierten Belegen in den klassischen Zettelarchiven auf. Die „Korpuslinguistik [wertet] das Korpus systematisch und nicht nur exemplarisch aus" (Teubert 1999, 302). Der Datentyp des Belegs kann je nach Recherchesystem mehrere Subtypen aufweisen: Die Belegstellenliste zeigt in Form dokumentierter Abkürzungen, wie viele Belege in einem Subkorpus und in einem Text enthalten sind. Dies genügt, um eine an einen einzelnen Text gebundene adhoc-Bildung wie das oben erwähnte Senkrechtsarg trotz höherer Frequenz zu identifizieren: Auszug aus der Belegstellenliste zu Absatz: 1+13:M89/901 14+10:M89/902 24+25 :M89/903 49+19:M89/904 68+30:M89/905 98+33:M89/906 131+35:M89/907 166+25:M89/908 191+21:M89/909 1463+2:WKB/MM3 1465+10:WKB/RM2 1475+1:WKB/RM3 1476+4:WKB/SG3 1480+1:WKB/ST2 1481+2:WKB/TZ1 1483+1:WKB/ZT1 1484+3.-WKB/ZT2 1487+3:WKD/BZA 1490+1 :WKD/BZB 1491 +6:WKD/BZC 1497+1:WKD/ND1
MM Januar 1989 MMFebruar 1989 MM März 1989 MM April 1989 MMMai 1989 MMJuni 1989 MM Juli 1989 MM August 1989 MM September 1989 Mannheimer Morgen (2. Hj. 1990) Rheinischer Merkur (1. Hj. 1990) Rheinischer Merkur (2. Hj. 1990) Der Spiegel (2. Hj. 1990) stern (1. Hj. 1990) taz, Sonderheft l (2. Hj. 1989) Die Zeit (2. Hj. 1989) Die Zeit (l. Hj. 1990) Berliner Zeitung, 2. Halbjahr l Berliner Zeitung, l. Halbjahr l Berliner Zeitung, 2. Halbjahr l Neues Deutschland, [Tageszeitung]
13 10 25 19 30 33 35 25 21 2 10 l 4 l 2 l 3 3 l 6 l
Einen wichtigen Aspekt stellt die Verbindung dieser Listen mit den KWICZeilen und den daran anschließenden Belegen dar. Von den Belegstellen kann man durch Mausklick unmittelbar zu einer KWIC-Übersicht gelangen und von diesen zu den Kontextbelegen. Insofern dient die KWIC-Zeilen-Übersicht auch der gezielteren Auswahl von Belegen, nachfolgend solche zu Absatz mit Kollokator stieg mit je einem Satz vor und nach dem Satz, in dem die beiden Lexeme vorkommen: In der Oberklasse meldete die Daimler-Vertriebstochter Mercedes-Benz of America Ine (Montvale/New Jersey) für die ersten sechs Monate einen Absatzrückgang von 44 066 im 1. Halbjahr 1988 auf 36 265 (minus 17,7 Prozent). Dagegen stieg der Absatz bei BMW of
Das Wort in der Korpuslinguistik
63
North America Ine (ebenfalls Montvale) auf 34 849 (34 787) leicht an. Das Schlußlicht bildete die Porsche Cars North America Ine, Reno (Nevada), die mit 4556 (8806) nur halb so viel Wagen verkaufte. (M89/907.24363: Mannheimer Morgen, 08.07.1989, Wirtschaft; Absatz deutscher Autos in USA schwächer) Bei Rover war der Land-Rover das Zugpferd. Der Absatz des Geländewagens stieg um 20 Prozent auf den Rekordwert von 116 000 Stück, alles in allem erhöhte der Rover-Absatz jedoch nur um 2 Prozent auf 483 000 Wagen. Besserung erwartet sich BMW auch auf dem deutschen Markt, von neuen Modellen und einem verbesserten Vertrieb. (M96/604.15230: Mannheimer Morgen, 03.04.1996, Wirtschaft; Zwei Töchter lagen BMW auf der Tasche)
Der Umfang der Belege sollte prinzipiell frei wählbar sein, bewegt sich aus urheberrechtlichen Gründen aber in den meisten Systemen zwischen dem Minimum eines Satzes und dem Maximum einer Bildschirmseite.18 Im Korpusrecherchesystem des IDS können symmetrische und asymmetrische Kontextmengen gewählt werden, etwa ein Satz vor und drei Sätze nach oder drei Absätze vor und kein Absatz nach dem type bzw. Lemma. Im Falle der Hypothese etwa eines Neologismus, einer fachsprachlichen Bedeutung und der Suche in einem fachsprachlichen Subkorpus kann es sinnvoller sein, den Fokus auf den nachfolgenden Kontext zu legen, weil bei Ersterwähnungen von Fachlexemen in einem Text die terminologischen Erläuterungen unmittelbar folgen (vgl. Teubert 1998b). Geht es z.B. um die möglichst scharf abgrenzende Feststellung des Referenzbereichs eines Kollektivums oder um die Kohyponyme zu einem infrage stehenden Hyperonym, dürfte der vorangehende Kontext aufschlussreicher sein. Solche methodischen Überlegungen bedürfen aber noch einer systematischen Überprüfung, die die thematische Entfaltung in Texten eines bestimmten Typs je spezifisch mit den semantischen und pragmatischen Eigenschaften eines Lexems oder einer Lexemklasse korreliert. Ergebnis wären nicht nur eine effektivere Handhabung des Korpus durch Lexikografen, sondern - im Sinne der empirischen Lexikologie - Erkenntnisse über den Zusammenhang von Text und Diskurs, letzteres hier verstanden als intertextuelle Ebene, und den systematischen Eigenschaften des Wortschatzes. Wenn nämlich paradigmatische Relationen eines Lexems wie Synonymic, Hyperonymie usw. korpusbasiert ermittelt werden sollen, müssen sich diese Relationen irgendwie aus der Ebene des Textes, aus seiner semantischen Struktur ableiten lassen. Die abgestufte Folge und Verknüpfbarkeit von Belegstellenlisten, KWICZeilen und Belegen ist mehr als nur komfortabel. Bei großen Korpora kann auf diese Weise die unüberschaubare Menge von Belegen gezielt und weil schrittweise reduziert werden. Die einzige Alternative hierzu ist eine methodisch kaum zu begrüßende Zufallsauswahl. Kleinere Korpora sind keine Alternative.
18
Potenzielle Textgeber wollen verhindert sehen, dass ein kompletter Text über die Belegausgabe .abgesaugt' werden kann.
64
Ulrike Haß-Zumkehr
3. Korpusaufbau, Korpusorganisation und Recherche-Software Die Untersuchung des Worts mit korpuslinguistischen Mitteln bindet Lexikologie und Textlinguistik zusammen. Umso entscheidender ist die Zusammenstellung des jeweils zugrundegelegten Korpus. Die Erfahrungen der letzten Jahrzehnte haben gezeigt, dass weder ein für allemal feststehendes kanonisches Korpus wie das British National Corpus (URL: http://info.ox.ac.uk/bnc/) noch ein gegenüber textlinguistischen Aspekten indifferentes Korpus wie das des Leipziger Informatik-Projekts Deutscher Wortschatz (http://www.wort-scb.atz. uni-leipzig.de) oder wie die meisten computerlinguistisch orientierten Korpussammlungen (z.B. des IMS Stuttgart: http://www.ims.uni-stuttgart.de/projekte/ corplex/) die Anforderungen sowohl syntaktischer als auch lexiko-logischer Interessen abdecken. Ein breites Anforderungsspektrum abzudecken ist aber angesichts des hohen Aufwands, den der Aufbau eines größeren Korpus kostet, unerlässlich. Von ausschließlich morphologisch-syntaktisch interessierten Computerlinguisten wird Korpuslinguistik oft zu eng definiert und Anforderungen lexikologischer Art tendenziell als „traditionell" und „philologisch" abgewertet. Die verstärkte Aufmerksamkeit, die die kognitive Linguistik seit einiger Zeit dem ,Lexikon' als mentaler Komponente gegenüber walten lässt, klammert aber gerade alle pragmatischen und textlinguistischen Aspekte aus ihrem Semantikbegriff aus. Ohne die Diskussion hier im Einzelnen zu referieren (vgl. Sinclair 1998; unter historischem Aspekt hierzu Bergmann 1988), sei aus der jahrzehntelangen Erfahrung des IDS mit Textakquisition und Korpusaufbau in Form einiger Thesen zusammengefasst, was ein für lexikologische Zwecke geeignetes Korpus ausmacht: -
19
Die Alternative zu einem abgeschlossenen Korpus ist die Parallelität eines erweiterbaren, aktuell wachsenden (sog. opportunistischen) Korpus mit einem aus dessen Teilen je nach Forschungsziel systematisch komponierten und somit definierten (sog. virtuellen) Korpus. Aus dem sich ständig verändernden opportunistischen Korpus können immer wieder neue, aktualisierte oder nach sonstigen Kriterien gebildete, etwa projektspezifische Korpora gebildet werden. Eine Teilmenge des IDS-Korpus „W-PUB" (öffentlich zugängliche Texte geschriebener Sprache) ist beispielsweise das virtuelle Korpus WK (Wendekorpora West und Ost), seinerseits untergliedert in Westtexte und Osttexte sowie in Phasen.19 Ein opportunistisches Korpus ist so groß und so breit gestreut wie möglich ohne Einschränkung durch qualitative Kriterien. Die schiere Größe (in tokens) steigert die Qualität und Feinheit der so wichtigen Kookkurrenzanalysen. Überhaupt sind frequenzbasierte Analysen nur auf der Basis größerer Korpora seriös.
Letztere Untergliederung wird erst mit der neuen Version des Recherchesystems Cosmas getrennt durchsuchbar sein.
Das Wort in der Korpuslinguistik -
-
-
20
65
Ein repräsentatives Korpus im eigentlichen, d.h. statistischen Sinne kann es nicht geben, weil die sog. Grundgesamtheit, auf die Repräsentativität bezogen und definiert wird, nicht abgegrenzt werden kann (vgl. Haß-Zumkehr 1998, 71, nach Rieger 1979; Teubert 1998b, 147ff.). Was ist ,die' deutsche Sprache, ,die' Standard-, Gemein-, Gegenwarts-, Umgangssprache, ,die' Fachsprache X? So unterschiedlich und immer nur vage diese Fragen beantwortet werden können, so unterschiedlich kann die Frage nach der Zusammenstellung eines entsprechenden Korpus beantwortet werden. Besser ist es umgekehrt: Man hat ein virtuelles Korpus mit einer bestimmten Zusammensetzung sowie mit einer bestimmbaren Relevanz für die Sprachwissenschaft und begrenzt die Gültigkeit der daraus resultierenden (lexikologischen) Erkenntnisse auf den jeweiligen Sprachbereich des Korpus. Im Übrigen können weder die klassischen Zettelarchive noch Individualkompetenz Aussagen von größerer Generalisierbarkeit machen als die, die auf der Basis eines wie auch immer zusammengesetzten Korpus entstehen. Das Korpus muss aus vollständigen Texten bestehen, nicht aus einzelnen Sätzen bzw. Belegen und auch nicht aus willkürlich gekürzten Textausschnitten. Die Texte sollten textlinguistisch annotiert sein. Die Texte müssen im Prozess des Korpusaufbaus mit Markierungen, bibliografischer Art (zu Autor, Erscheinungsdatum usw.), textstruktureller Art (zu Überschriften, Absatzgrenzen, Zitaten, Bildern, Tabellen usw.), pragmatischer Art (zu Textfunktion, Sach- oder Fachbereich, Region, Situation usw.) und auch syntaktischer Art versehen werden, um diese Ebenen der Sprache mit der des Wortschatzes verknüpfen zu können (vgl. Haß-Zumkehr 1998, bes. 80).20 Die Metadaten werden den Korpustexten bisher noch überwiegend händisch, teilweise automatisch hinzugefügt. Die händischen Verfahren sind sehr aufwändig; die automatischen vor allem im Bereich der Syntax noch recht fehleranfallig. Hier muss also je nach Forschungsziel und personellen wie finanziellen Ressourcen abgewogen werden. In der Folge ist ein völlig standardisiertes Annotationsschema für alle Korpora, selbst wenn man nur an die zur deutschen Gegenwartssprache denkt, illusorisch. Erreicht wird jedoch eine gewisse Einheitlichkeit der textstrukturellen Markierungen, soweit diese aus den typografischen Eigenschaften der Texte erschlossen werden können. Als internationale Standards haben sich in diesem Zusammenhang die Annotationsschemata der Text Encoding Initiative (TEI) und der europäische Corpus Encoding Standard (CES) etabliert. Es ist jedoch zu beobachten, dass zumindest die Korpus-,Bauer' im deutschsprachigen Bereich diese Standards in der Regel modifizieren, damit vor allem die Metadaten den jeweiligen Forschungszielen angepasst werden.
Die in den Text mittels Sonderzeichen eingefügten Markierungen sind in der Belegausgabe überwiegend nicht zu sehen, weil sie den Text unübersichtlicher machen. Möglich wäre aber ein wahlweises Hin- und Herschalten zwischen beiden Ansichten. Wichtig ist, dass die Markierungen zu Quelle, Datierung usw. vom Recherchesystem eindeutig identifiziert werden können.
66 -
-
Ulrike Haß-Zumkehr Ein forschungspraktisches Hindernis muss einkalkuliert werden, das, wenn zu spät bemerkt, zum echten Problem werden kann: die wachsenden Vorbehalte der Rechteinhaber (Autoren, deren Erben oder Verlage) gegenüber einer digital vervielfältigenden Nutzung ihrer Texte. Nicht ganz zu Unrecht wächst die Befürchtung vor .Datenklau', Raubkopie oder kommerzieller Ausnutzung in dem Maße, wie Internet, e-commerce, e-book und dergleichen an Raum gewinnen. Auch eine erwiesenermaßen nicht-kommerzielle Nutzung der Texte durch wissenschaftliche Institutionen muss mehr oder weniger einschränkenden Bedingungen der Textgeber (z. B. Verbot der online-Nutzung, Verbot der Weitergabe an andere Forscher, Begrenzung des Belegkontextes) folgen. Recherchewerkzeuge für Korpora werden an vielen wissenschaftlichen Institutionen, aber auch von Firmen kommerziell entwickelt und man kann sie zum Teil auch erwerben.21 Manche sind einzelsprachunabhängig, andere spezifisch. Letzteres dürfte für semantische und lexikologische Untersuchungen wichtiger sein. Der bei der Forschungsfb'rderung bevorzugt behandelte Bereich der automatischen Übersetzung greift hingegen auf einzelsprachunabhängige Werkzeuge zurück. Ein für das jeweilige Forschungsziel optimales Werkzeug wird in jedem Fall einen großen Anteil an eigener Arbeit bei der Entwicklung und Pflege von Recherchesoftware erfordern - dies ist aus verschiedenen Gründen keine leichte Aufgabe für Universitäten sowie für außeruniversitäre Forschungseinrichtungen. Das »schönste' Korpus ist aber nur so gut wie das Instrument, das es erst erschließt. Zu den Qualitätsanforderungen - allgemeiner Bedienungskomfort, Schnelligkeit, Sicherheit einmal vorausgesetzt - an ein lexikologisch brauchbares Recher-chewerkzeug gehören nicht nur ein ,gutes' Wortsegmentierungsprogramm (tokenizer), eine aktuelle bzw. der jeweiligen Zeitstufe angepasste Grundformenliste sowie angemessen algorithmisierte Wortbildungsregeln (letzteres beides machen einen guten Lemmatisierer aus), sondern auch die Kombinationssuche und die flexibel parametrisierbare Kookkurrenzanalyse.
Der Hinweis auf wissenschaftspraktische Probleme (Urheberrecht, Software) soll keineswegs abschrecken, sondern im Gegenteil die Etablierung einer korpusbasierten Lexikologie von blauäugigem Idealismus entlasten, der letztlich nur zu Resignation führen kann.
21
Wegen der raschen Veränderungen auf diesem Gebiet verzichte ich auf konkrete Angaben. Am besten informiert man sich per Internet-Suche (Suchwörter „corpus" und „tools"). Vgl. Lenz 2000, 28ff.
Das Wort in der Korpuslinguistik
67
4. Nutzen, Interpretationsbedürftigkeit und -fähigkeit der Analysedaten Der Computer ist kein Automat, der, nachdem er mit Texten gefüttert wurde, Erkenntnisse über Wörter und Wortschatz auswirft. Korpuslinguistische Verfahren versorgen Lexikologen und Lexikografen mit teilweise neuen Datentypen, die wissenschaftlich zu interpretieren sind. Einige interpretierende Schlussfolgerungen etwa aus Listen von types und von Kollokatoren sind in diesem Beitrag schon gezogen worden. Weiteres ist noch zu benennen. Die o.g. Liste der 2487 linkserweiternden Substantivkomposita (Lemmata) auf -frau lässt sich über die kritisch-ironischen Transformationen lexikalisierter Maskulina hinaus noch weiter semantisch klassifizieren und mit einer entsprechenden Klassifikation der noch bedeutend zahlreicheren movierten Personenbezeichnungen auf-i« vergleichen.22
22
Aspirin u.a. nicht movierungsbedingte Bildungen auf -in sind natürlich ausgesondert worden. Ich danke meinem Kollegen Ulrich Schnörch für die Versorgung mit korpusbasierten Listen auf -in, -frau und -euse.
68
Ulrike Haß-Zumkehr
Bildungen \+frau
movierte Bildungen X+in
Berufsbezogen (lexikalisiert/nicht lexikalisiert) (Zugehfrau, Putzfrau, Anchorfrau, Bürokauffrau)
berufsbezogen (nicht lexikalisiert) (Lehrerin); berufsbezogene Lexikalisierungen sind selten: Sekretärin ist nicht die ,weibl. Form von Sekretär'
Funktionsbezogen (politische Funktion) (CDU-Frau)
Funktionsbezogen (politische Funktion) (Parlamentarierin)
funktionsbezogen (kirchlich-religiöse Funktion/Amt) (Ordensfrau)
Funktionsbezogen (kirchlichreligiöse Funktion/Amt) (Priesterin)
funktionsbezogen (gesellschaftlich) (Geschäftsfrau, Alibifrau)
auf ökonomische Rolle bezogen ( Verbraucherin)
sportbezogen (Handballfrau)
sportbezogen (Handballerin)
auf Ehemann bezogen (Zahnarztfrau)
[Bäckerin im Sinne von ,Frau des Bäckers' ist heute veraltet]
auf Ethnic bezogen (Zulufrau, Eskimofrau)
nationalitätsbezogen (Amerikanerin) auf Ort und Region bezogen (Berlinerin, Schwäbin)
auf die äußere Gestalt/Aussehen bezogen (Zweizentnerfrau)
bildungsbezogen (Abiturientin)
imagebezogen (Businessfrau, Dutzendfrau)
einstellungsbezogen(Z)arH'wzi/iK)
Zweitfrau,
auf beliebige Tätigkeiten/Rollen bezogen (Gratulantin)
Da Movierungen auf -in sich zum kritisch-ironischen Aufbrechen maskuliner Personenbezeichnungen nicht eignen, ist das Muster des Typs Hampelfrau nicht übertragbar. Den sehr vereinzelt vorkommenden ungrammatischen Bildungen Geistin, Mitgliedin, Mitgliederin, Ritterin (ungrammatisch?), Rüdin, Kätzin fehlt das Ironisch-Augenzwinkernde. Sie sind eher bewusst feministisch motiviert und folgen im Übrigen historischen und literarischen Vorbildern (Gutsherrin, Kaußnännin, Rättin). Die leitende Frage einer mit der obigen Tabelle veranschaulichten vergleichenden Klassifizierung könnte sein: Welche semantischen bzw. pragmatischen Aspekte werden bei der Bildung weiblicher Personenbezeichnungen fokussiert, im Unterschied etwa zu männlichen? Wie sind semantische Gemeinsamkeiten (Handballfrau ~ Handballerin) und Unterschiede (Arztfrau/Ärztin) zu erklären? Warum sind manche Klassen nur einseitig besetzt oder spezifisch akzentuiert? Welche der Einseitigkeiten gehen auf das Konto strukturell-morphologischer Restriktionen (*Eskimoiri) und welche sind eher pragmatisch bedingt? Inwiefern unterscheidet sich die Semantik des Simplex Frau von der des Elements fraul Die Interpretierbarkeit allein solcher Listen hat sich in den genannten Fragen noch nicht erschöpft. Zur Beantwortung dieser und weiterer Fragen sind
Das Wort in der Korpuslinguistik
69
gezielt Belege heranzuziehen. Ausschließlich anhand großer Belegmengen wäre man auf die Fragen allerdings kaum gekommen. Ein wesentliches Moment der wissenschaftlichen Interpretation jedes Datentyps ist die Kenntnis über die Zusammensetzung des benutzten (virtuellen, s.o.) Korpus. Inbezug auf die oben erwähnten kritisch-ironischen Bildungen wie Biederfrau, Buhfrau, Gewährsfrau, Hampelfrau, jedefrau, Watschenfrau, Weihnachtsfrau könnte man vermuten, dass sie ausschließlich oder ganz überwiegend in bekannt kreativen Presseorganen wie taz und Spiegel bezeugt sind. Entsprechend zu relativieren wäre das Gewicht dieses Bildungsmusters in der Entwicklung der Standard- oder Gemeinsprache. Die Überprüfung der Belegung zeigt indes ein ganz anderes Bild. Alle genannten Lexeme werden in einem größeren Spektrum von deutschen und schweizerischen Tages- und Wochenzeitungen verwendet, die nicht gerade zu sprachlichen Neuschöpfungen neigen: Süddeutsche Zeitung, Frankfurter Rundschau, Mannheimer Morgen, St. Galler Tageblatt, Züricher Tagesanzeiger; Spiegel und taz sind gerade nicht darunter. Die Belege datieren in der Mehrzahl seit 1989, vereinzelt seit Mitte der 90er Jahre. Textbelege wurden für dieses Bild übrigens noch gar nicht benötigt. Deren methodische Funktion konzentriert sich in der Korpuslinguistik zunehmend auf die semantisch-pragmatische Feinarbeit. Ein weiteres Moment, das bei der Interpretation vor allem von Frequenzdaten beachtet werden muss, ist die Tatsache, dass aktuelle Themen der öffentlichen Diskussion lexikalisch markiert und bestimmte Lexeme deshalb - zeitlich oft vorübergehend - häufiger sind, prototypisches Beispiel war der Elchtest. Frequenz muss also in Relation zur Zeit und zur ,Karriere' eines Themas gesetzt werden - das heißt: Frequenz steht in Zusammenhang mit Diskurs (vgl. Teubert 1999). Dabei sind es keineswegs immer schlüsselwortähnliche Lexeme wie Entsorgung, Schwarzgeld, Berliner Republik, die ein Thema begleiten oder sogar indizieren. Das Beispiel von Absatz für ,Textteil eines Gesetzes' hat gezeigt, dass diese Funktion auch semantisch-pragmatisch .uninteressanten' Wörtern zukommen kann; Absatz in dieser Bedeutung begleitete gleich mehrere rechtspolitische Themen der letzten Jahrzehnte. Unter den 1000 häufigsten Wörtern des IDS-Gesamtkorpus sind auffallend viele Spezifikatoren für Quantoren wie Prozent, Mark, Seite, Jahr, Stück, Tag, Grad; auch die Frequenz der genannten Lesart von Absatz lässt sich aus dieser Perspektive interpretieren. Sie spielen ihre Rolle bei der von der Presseberichterstattung allgemein erwarteten Genauigkeit und Präzision. Genauigkeit bei Quantitäten ist viel leichter zu erreichen als Genauigkeit bei Qualitäten. Zu ,Fakten' gehören also wesentlich »Zahlen', und zu Zahlen gehören Bezeichnungen für das, was jeweils gezählt wird. Korpuslinguistisch gewonnene Daten bedürfen nicht nur einer fachlinguistischen bzw. lexikologischen Interpretation, sie sind, wie gezeigt werden sollte, auch vielfaltig interpretierbar. Die unterschiedlichen Datentypen sind aufeinander bezogen und erlauben in ihrer Gesamtheit neue Einblicke in die Struktur des Wortschatzes. Die Frage allerdings, was denn ,das' bzw. ein lexikalisches System sei, wie viel es mit dem mentalen Lexikon und wie viel mit den Wörtern in
70
Ulrike Haß-Zumkehr
Texten zu tun hat, muss die theoretische Lexikologie, die sich den Möglichkeiten der Korpuslinguistik öffnet, wieder einmal neu beantworten.
5. Literatur Belica, Cyril: Statistische Analyse von Zeitstrukturen in Korpora. In: Teubert, Wolfgang (Hrsg.): Neologie und Korpus. Tübingen 1998, 31-42. (Studien zur deutschen Sprache, 11). Belica, Cyril/Kathrin Steyer: Die COSMAS-Kollokationsanalyse - statistisches Modell, Funktonsweise und Interpretationsspielräume. 2001 (in Vorbereitung). Bergmann, Rolf: Probleme der Textauswahl für einen elektronischen Thesaurus. Beiträge zum ersten Göttinger Arbeitsgespräch zur Historischen Deutschen Wortforschung 1. und 2. November 1996. Hrsg. im Auftrag der Kommission für das deutsche Wörterbuch von Jacob Grimm und Wilhelm Grimm von Rolf Bergmann. Stuttgart usw. 1998 Duden-Universalwörterbuch. 3. Aufl. CD-Rom-Version 1.1. Mannheim 1996. Duden: Das große Wörterbuch der deutschen Sprache. 10 Bde auf CD-Rom. Mannheim 2000. Feldweg, Helmut/Erhard W. Hinrichs (Hrsg.): Lexikon und Text. Wiederverwendbare Methoden und Ressourcen zur linguistischen Erschließung des Deutschen. Tübingen 1996 (Lexicographica Serie Maior, 73). Haß-Zumkehr, Ulrike: Das historische Korpus des Instituts für deutsche Sprache. In: Bergmann, Rolf: Probleme der Textauswahl für einen elektronischen Thesaurus. Beiträge zum ersten Göttinger Arbeitsgespräch zur Historischen Deutschen Wortforschung 1. und 2. November 1996. Hrsg. im Auftrag der Kommission für das deutsche Wörterbuch von Jacob Grimm und Wilhelm Grimm von Rolf Bergmann. Stuttgart usw. 1998, 69—80. - Wortschatz ist mehr als „viele Wörter". Die Aufgaben der Abteilung Lexik des IDS. hi: Sprachreport 2/2000, 2-7. - Deutsche Wörterbücher - Brennpunkt von Sprach- und Kulturgeschichte. Berlin 2001. Journal for Corpus Linguistics. Ed by Wolfgang Teubert (John Benjamins publishing company). Vol. 1, Nr. 1/1996 - Vol. 5, Nr. 1/2000. Lenz, Susanne: Korpuslinguistik. Tübingen 2000 (Studienbibliographien Sprachwissenschaft, 32). Sinclair, John: Korpustypologie. Ein Klassifikationsrahmen. In: Teubert, Wolfgang (Hrsg.): Neologie und Korpus. Tübingen 1998, 111-128. (Studien zur deutschen Sprache, 11). Steyer, Kathrin: Usuelle Wortverbindungen des Deutschen. Linguistisches Konzept und lexikografische Möglichkeiten. In: Deutsche Sprache 28, 2000, 101-125. - Die korpusbasierte Kookkurrenzanalyse - ein empirischer Weg zur Verifizierung usueller Wortverbindungen, (unveröff. Vortragsmskpt. für Tagung „Phraseologie und Parömiologie - neue Perspektiven der Forschung", 17.-22. Juni 2001, Ascona, Schweiz) 2001. Teubert, Wolfgang (Hrsg.): Neologie und Korpus. Tübingen 1998 (Studien zur deutschen Sprache, 11). [= Teubert 1998a] Teubert, Wolfgang:Korpus und Neologie. In: Teubert, Wolfgang (Hrsg.): Neologie und Korpus. Tübingen 1998, 129-170. (Studien zur deutschen Sprache, 11). [= Teubert 1998b] - Korpuslinguistik und Lexikographie. In: Deutsche Sprache 27, 1999, 292—313.
Anja Lobenstein-Reichmann
Die Syntagmenangabe - ein Stiefkind der Bedeutungslexikographie 1. Allgemeine Vorbemerkungen 2. Was sind Syntagmen? Z.I.Definition 2.2. Syntagmen-Phraseme-Kollokationen 2.3. Füllung einer Syntagmenangabe 2.4. Darstellung im Frühneuhochdeutschen Wörterbuch 3. Weitere Funktion von Syntagmen 4. Schlussbemerkungen 5. Literatur
l. Allgemeine Vorbemerkungen Das Wortbildungsfeld des hier zum Thema erhobenen Stichwortes ,Syntagma' (,Syntax', ,syntaktisch') impliziert oft eine auf ausdrucksseitige Kombinatorik und nicht primär auf Semantik zielende Funktion einer in der Wörterbuchpraxis relativ selten genutzten lexikographischen Informationsposition. Das Ziel dieses Aufsatzes ist es aber gerade nicht, die Möglichkeiten der Darstellung ausdrucksseitiger kombinatorischer Regeln in einem Wörterbuch auszuloten, sondern im Mittelpunkt der folgenden Ausführungen sollen die semantischen Erkenntnismöglichkeiten dieser lexikographischen Informationsposition stehen, die sowohl für den Lexikographen als auch für den Wörterbuchbenutzer das zentrale Anliegen eines Bedeutungswörterbuches bilden. Mithilfe der Syntagmenangabe kann dargestellt werden, wie der Autor eines Textes, der als Teil eines Wörterbuchcorpus vom Lexikographen bearbeitet wird, seine Welt sieht, sie beschreibt und in ihr handelt. Syntagmen in einem Wörterbuch sind also als Wiedergabe der typischen Wortverwendungen eines Autors, einer bestimmten soziologischen Gruppe oder einer Epoche von semantischem und pragmatischem Interesse für den Lexikographen wie für den Wörter-buchbenutzer. Wie wichtig eine solche Position besonders für die historische Bedeutungslexikographie sein kann, soll hier am Beispiel des Frühneuhochdeutschen Wörterbuches (im weiteren FWB genannt) ausgeführt werden, da das FWB aufgrund seiner Konzeption und seiner Materialbasis den Anspruch erhebt, nicht nur den sprachlichen Zugang zu einer Epoche zu ermöglichen, sondern in gleicher Weise auch die Funktion hat, historische Sekundärliteratur mit breit gestreuter Darstellung von Primärquellen zu sein, also mit dem Zugang zur Sprache auch das Verständnis von Kultur, Mentalität und Sozialität der Zeit von ca. 1350 bis ca. 1650 zu ermöglichen.
72
Anja Lobenstein-Reichmann
Mit rein auf syntaktische Konstruktionen zielenden Informationspositionen in Wörterbüchern wird besonderer Wert auf mögliche grammatische Konstruktionen gelegt. Dabei tritt die kulturhistorische Informationsfülle, die sich in einem Wörterbuch spiegeln kann und sollte, in den Hintergrund. Syntagmenangaben, wie sie im folgenden behandelt werden, dienen also nicht in erster Linie der Beschreibung grammatischer Konstruktionen, sondern stellen diese sozusagen nur nebenbei dar. Dir eigentliches Anliegen sind diejenigen semantischen (einschließlich enzyklopädischen) und pragmatischen Informationen, die je nach lexikographischem Anliegen zum Verständnis einer Epoche, eines Kommunikationsbereichs oder eines Autors notwendig sind. Die Erstellung von Syntagmenangaben verfolgt demnach keinen primär syntaxgeschichtlichen (z.B. in einem historischen Wörterbuch) oder gar syntaxtheoretischen Zweck, sondern Syntagmen werden als Quelle zur Erkenntnis sprachlicher Gebrauchsweisen genutzt; Sie dienen damit dem Nachvollzug aller vom historischen Autor vollzogenen Bezugsetzungen von Inhalten. Solche inhaltlichen Beziehungsverhältnisse sind besonders deswegen interessant, weil sie in knapper Form innerhalb historischer Wörterbücher dargestellt werden können und damit Einblicke in historische Epochen gewähren. Syntagmenangaben sind weder in der lexikographischen Praxis üblich noch in der metalexikographischen Diskussion ernsthaft diskutiert oder gar als relevante Informationsposition erkannt worden. Eine kurze Übersicht über die bekannteren allgemeinsprachlichen Wörterbücher des Neuhochdeutschen sowie über die relevanten historischen Wörterbücher zeigt folgendes Bild: -
Es gibt „Belegbeispiele", und das ist der Normalfall. Das sind Auszüge in teils vollständiger, teils abgekürzter Satzform; sie können dem Belegcorpus entnommen oder aufgrund der Kompetenz des Lexikographen konstruiert sein (Lexer; Duden, GWB, s.v. leben; Paul/Henne u.v.a.). Es gibt „Syntagmenbeispiele"; das sind aus den Corpustexten herausgelöste oder aufgrund der Kompetenz des Lexikographen konstruierte, eng geschnittene Auszüge aus Belegbeispielen. Praktisch realisiert finden sie sich in erheblichem Ausmaß im Wörterbuch der deutschen Gegenwartssprache, ohne allerdings in dessen Vorwort ihrem Gewicht entsprechend linguistisch und metalexikographisch erläutert worden zu sein. Vgl. unter diesem Aspekt auch Lexer (mit Ansätzen zur Nennung von Syntagmenbeispielen des Typs: den tac leben). Das Wörterbuch der deutschen Gegenwartssprache kann in gewisser Weise als Vorbild für das Vorgehen im FWB gelten.
Die Syntagmenangabe - ein Stieflcind der Bedeutungslexikographie
73
2. Was sind Syntagmen?
2.1. Definition Im einem allgemeinen Verständnis sind Syntagmen eine „durch Segmentierung gewonnene, strukturierte, aber noch unklassifizierte Folge von sprachlichen Ausdrücken, die aus Lauten, Wörtern, Wortgruppen, Teilsätzen oder ganzen Sätzen bestehen kann" (Bußmann 1990, 765). Für das spezifisch bedeutungslexikographische Anliegen dieser Ausführungen muss eine solche allgemeine Definition modifiziert werden.1 Die Syntagmenangabe ist metalexikographisch betrachtet eine durch Segmentierung aus Texten gewonnene, lexikographisch aufgearbeitete Kombination von Wörtern, die dem Anliegen des Lexikographen gemäß auf eine Bedeutung des zu beschreibenden Einzellexems ausgerichtet ist. Man könnte sie als verdichteten, in keinem Fall aber als abstrahierten Belegausschnitt bezeichnen. Aber auch diese Definition ist für eine semantische Ausrichtung von Syntagmenangaben in einem Wörterbuch noch zu unspezifisch. Sie muss daher folgendermaßen erweitert werden: Syntagmen sind durch Segmentierung aus einem Text gewonnene, zu einem lexikographischen Zweck strukturierte, d.h. in und mit ihrem syntaktisch relevanten Kontext wiedergegebene Belegausschnitte, die aufgrund der Tatsache, dass sie das Lemmazeichen in seinem Aussagezusammenhang darstellen, weitergehende bedeutungs- und pragmatikrelevante Aussagen ermöglichen. Dies verläuft maßgeblich über die Darstellung derjenigen Prädikationen,2 auf die mit einem Wort, das heißt konkret mit dem untersuchten Lemmazeichen, Bezug genommen wird bzw. über die Darstellung derjenigen Ausdrücke, die sich auf das Lemmazeichen selbst beziehen. Der Lexikograph möchte dabei also nicht nur die typischen Verwendungen, in denen das Lemmazeichen steht, als distributioneile Verteilung im Wortschatz wiedergeben, sondern darüber hinaus typische Spezifika einer Einzelbedeutung eines Einzelwortes mittels der mit diesem Wort verbundenen anderen Ausdrücke und deren Bedeutungen, Konnotationen usw. verdeutlichen. Dabei wird vorausgesetzt, dass
1
2
Die folgenden Ausführungen betreffen ausschließlich Bedeutungswörterbücher und beziehen sich nicht auf andere Wörterbuchtypen, wie syntaktisch gegliederte, Valenzwörterbücher usw. Ich verwende das Wort Prädikation im Sinne Reichmanns (1985, 247): „Das Wort Prädikation des vorangehenden Satzes ist dabei nicht mit den grammatischen Termini Prädikat oder Prädikatsaussage gleichzusetzen. Aussagen grammatischer Prädikate bilden lediglich einen Teil der Prädikationen eines Textes. Prädikationen im hier gemeinten, sehr umfassenden Sinne des Wortes stecken allgemein in der bloßen Kompatibilität der in einem Text begegnenden Wörter, im Gebrauch von Metaphern, in den Generalisierungen, Spezifizierungen, Nuancierungen, Wertungen, Gegensatzbildungen, die man schon durch die Fixierung der Referenz mittels eines gewählten Wortes vornimmt, im Stellenwert eines Wortes innerhalb des onomasiologischen Feldes und im Stellenwert einer Bedeutung innerhalb ihres semasiologischen Feldes, schließlich selbstverständlich auch in den Symptomwerten eines Wortes, nur mit dem Unterschied, daß die Symptomwertprädikationen den Sprachträger, alle übrigen die im Text behandelten Bezugsgegenstände betreffen."
74
Anja Lobenstein-Reichmann
auch diese Ausdrücke selbst als Lemmazeichen im Wörterbuch ihren eigenen Artikel haben. Das Augenmerk des Lexikographen liegt bei diesem Vorgehen sowohl auf der Distribution eines Ausdruckes im sprachlichen Gefüge des ihm zugrunde liegenden Materials als auch auf der semantischen Verknüpfung der Ausdrücke untereinander.3 Bei einem Wörterbuchartikel, der das Verb leben in der Bedeutung 2 ,sein irdisches Leben auf eine bestimmte Weise, in einem bestimmten Zustand verbringen (von Menschen, der Seele gesagt)' zum Gegenstand hat, sollen die Syntagmen nicht nur darüber informieren, dass das Verb absolut gebraucht wird, was grammatische Interessen befriedigen würde, sondern auch darüber, wie man sein Leben in der frühen Neuzeit verbringen konnte, was semantische und pragmatische Informationen vermittelt. Dieser weitgehenden Fragestellung liegt das Postulat zugrunde, dass Sprachwissen gleich Kulturwissen ist.4 Je mehr der Lexikograph, indem er ein Wort erläutert, auch auf die erläuterte Bezugssache ausgreift und dabei dasjenige einbezieht, was Sprecher dieser Zeit über den Bezugsgegenstand gesprochen oder geschrieben haben, desto näher kommt er nicht nur der sprachlichen Wirklichkeit einer vergangenen Epoche, sondern desto mehr verschwinden die Grenzen zwischen Sachbezug und Sprachbezug. Der Lexikograph ist in diesem Sinne also nicht nur Sprachwissenschaftler, sondern auch Kulturwissenschaftler in allen dazu nötigen Ausprägungen. Um so mehr ist es die Aufgabe des Lexikographen: „aus Quellentexten die Inhalte derjenigen Prädikationen herauszulösen, zu klassifizieren und lexikographisch zu verarbeiten, die für einen Autor, für eine Varietät einer historischen Sprache oder für eine historische Sprache selbst nach dem Urteil des Lexikographen kennzeichnend ist" (Reichmann 1985, 247). Aufgrund dieser Tätigkeit ist es möglich, in gleicher Weise Sprach- wie Sachaussagen zu einer bestimmten Zeit zu machen. Ein Beispiel: Aus dem Material des FWB ergibt sich für das Verb leben mit der obengenannten Bedeutung 2 folgender Vorkommensbefund: Synt.: oft absolut; auf erden, ane neid, ausser der ehe, in arbeit / armut / dürftigkeit / eintracht / eren /faulheit /friede / freudenspiel / keuschheit / miissiggang / liebe / ruhe / schalle / sündenflut / fügend / Unzucht / wollust / zucht, in lediger stat, in gütlicher furcht, in einem abgescheidenen leben l, mit jm., für jn. l., mit gehorsam /schänden / Würdigkeit, wieder das fegefeuer, wieder got /.; adellich / andächfiglich / christenlich / ehelich / einträchtlich / erbariglich / erlich /feist /frei /fürstlich / geistiglich / gerechtiglich /gut / heilig(lich) / heftig / innerlich / lästerlich / liederlich / mässiglich / minniglich / schandlich / selig / tugendlich / unordenlich / vernünftiglich l verschnitten / weltlich / wol, got gefällig l.
Die hier im Duktus des FWB angegebenen Syntagmen zu leben ermöglichen dem Leser nicht nur einen Einblick in die typischen Kombinationen des Verbs mit anderen Wörtern, sondern auch in das Begriffsgefüge der frühneuhochdeutschen Epoche, indem sie die mit dem Verb verbundenen Prädikationen in
3 4
Dies im Gegensatz zu Heringer 1999. Vgl. dazu: Reichmann 1985, 242-263.
Die Syntagmenangabe - ein Stiefkind der Bedeutungslexikographie
75
grammatisch geregelter Reihenfolge darstellen. In analoger Weise könnte diese Position aus dem Material eines gegenwartssprachlichen Wörterbuches gefüllt werden. Das große Wörterbuch der deutschen Sprache gibt für die oben angeführte Bedeutung folgende Belegbeispiele an, die ich nun der Vergleichbarkeit wegen in Syntagmen umformuliere: anständig, armselig, bürgerlich, enthaltsam, flott, forstlich, gut, herrlich, in Freuden, im Wohlstand, in glücklicher Ehe, in Scheidung, in dem Wahn, mit etw., in völliger Harmonie mit etw., nach seinen Grundsätzen l5 Beim Vergleich stellt sich heraus, dass wir, das ist der deutschsprachige Mensch im Jahre 2001, das Verb leben zwar in ähnlicher Bedeutung gebrauchen, dass aber die aus einem gegenwartssprachlichen Corpus entnommenen Bezugssetzungen anders polarisiert sind. Während man in frnhd. Zeit sein Leben überwiegend auf eine besondere religiöse Moral, auf das Einhalten sozialer Ordnungsverhältnisse ausrichtete, besteht die Orientierung in der Neuzeit eher darin, ein genussreiches und materiell gut ausgestattetes Dasein zu haben. Durch die angesetzten Einzelbedeutungen allein könnte dieser krasse Unterschied in den Lebensvorstellungen nicht dargestellt werden, durch das Auflisten der Syntagmen sehr wohl. Bei einer Betrachtung des Substantivs leben, und dazu reicht ebenfalls ein Blick auf die Syntagmen aus, stellt man schnell fest, dass Menschen in der frühen Neuzeit unter dem Wort Leben und unter der damit verbundenen „Sache" etwas anderes verstanden haben, dass das wichtigste am Leben nicht wie in heutiger Zeit das Leben an sich war, sondern dass der Tod als das Ende des Lebens eine weitaus gewichtigere Rolle spielte. Denn die häufigsten Syntagmen handeln in auffällig variantenreicher Weise vom Leben als einer dauernd bedrohten Gegebenheit und vom tatsächlichen Verlust des Lebens. Synt.: das / sein l. (gering) achten / (an)berüren / angewinnen / antreten / aufgeben / bezalen / (dar)geben / darvonbringen / dranstecken >sein Leben aufs Spiel setzen< / einbüssen / haben / lassen / suchen / verlieren l verunruhigen / verwirken //ölenden / wagen, das l. durch jn., von jm. haben, sich sein l. verkürzen, js. l. erstören, jm. das l. abstechen / erretten / geben / gönnen / kosten / (be)nemen / schenken, dem tode das l. zollen, pßichtig sein; das leben (Subj. )jm. lieb sein; des l. abkommen / begeren, sich des l. retten / weren, jn. des l. berauben / gnaden; um das leben kämpfen / streiten, jn. bei dem leben behalten / lassen, jn. von dem l. scheiden, jm. an dem 1. gnaden; l. des leibes / menschen, l. in dieser weit; abdruk / bäum / beschädigung / buch /feind /frucht / gefar / gold / kleid / krankheit / natur / süsheit / Ursache / verlust / verwirkung des l.; ßeheliches / fleischliches / gegenwärtiges / menschliches / natürliches / peinliches / sinliches / sterbendes / tierisches / tödliches / vergängliches / weltliches / wunderliches /zeitliches l.
Diese Syntagmen sprechen eine deutliche Sprache. Man musste dem Tod das Leben zollen, war es ihm pßichtig. Das Leben war eben nicht dazu angetan, es zu genießen. Man musste eher jeden einzelnen Tag dafür sorgen, dass man überlebte, dass man seinen Lebensunterhalt beizuschaffen wusste, weil man sonst verhungert wäre, nicht mit dem Gesetz in Konflikt geriet, weil man sonst zum Tode verurteilt wurde und nicht in die Hände von Räubern und Mörder
5
Duden 4, 2080.
76
Anja Lobenstein-Reichmann
geriet, die einem ebenfalls im Handumdrehen das Leben nahmen. Um den Sinn des Lebens brauchte man sich übrigens keine Sorgen zu machen, denn der Sinn des Lebens war der Tod oder positiver ausgedrückt, das andere Leben nach dem Tod, das im Artikel leben (Subst.) unter Bedeutung 2 behandelt wird. Dieses andere Leben konnte allerdings ebenso furchterregend wie das diesseitige Leben sein, nämlich dann, wenn man sein diesseitiges Leben so gelebt hatte, dass einen im Jenseits nicht das ewige Leben, also das Paradies erwartete, sondern der ewige Tod, wenn nicht noch Schlimmeres, nämlich die ewige Höllenqual. Dies alles kann ein aufmerksamer Leser schnell und gut strukturiert den Syntagmen des Frühneuhochdeutschen Wörterbuches entnehmen.
2.2. Syntagmen — Phraseme — Kollokationen Im Zusammenhang mit der Definition von Syntagmen in einem Wörterbuch ist eine theoretische Abgrenzung von Syntagmen, Kollokationen und Phrasemen notwendig. Eine solche Abgrenzung kann an dieser Stelle allerdings nur in Grundzügen geleistet werden und muss sich auf den konkreten Beschreibungsfall im FWB beschränken. Während Syntagmen, wie sie oben definiert wurden, zunächst alle Verbindungen zusammenfassen, die mit dem untersuchten Lemmazeichen vorkommen, sich also durch eine vollständige und freie Kombinierbarkeit auszeichnen, sind Phraseme (z.B. sich um Kopf und Kragen reden) oder Kollokationen (z.B. Zähne putzen) Wortverbindungen, die konkreten, auf sie beschränkten Gebrauchsregeln unterworfen und in ihrer Kombinierbarkeit begrenzt sind. Diese gehören daher eigenen Kategorien an. Phraseme sind relativ fest, idiomatisiert6 und haben, ähnlich wie ein einzelnes Wort, eine eigene, aus den Einzelbedeutungen ihrer Teileinheiten nicht vollständig ableitbare, also lexikalisierte Bedeutung. Idiomatisierung, Festigkeit und Häufigkeit sind allerdings Kriterien, die in einem historischen Corpus nur bedingt erkennbar sind, das heißt: Die Unterscheidung von Syntagmen und Phrasemen gestaltet sich in der Praxis der historischen Lexikographie ausgesprochen schwierig.7 Trotz dieser Schwierigkeit kann und darf die Syntagmenangabe, wie sie hier vorgestellt wird, bestimmte eigenständige Informationspositionen eines Wörterbuchartikels nicht ersetzen. Dazu gehört besonders die Position „Phraseme". Ein Vorkommen wie sein leben dranstecken, was soviel bedeutet wie ,sein Leben aufs Spiel setzen' stellt den Lexikographen vor die Entscheidung, es in die eine oder andere Kategorie einzuordnen. Da der Lexikograph aufgrund mangelnder Sprecherkompetenz und der zumeist begrenzten Beleglage nur sehr selten das Kriterium der Festigkeit heranziehen kann, dasjenige der Lexikalisierung oder der Stabilität noch weniger, wird er je nach Vorkommen das Risiko eingehen müssen, einen solchen Beleg unter der
Burger 1998, 14ff.; Fleischer 1982, 35ff. Vgl. dazu Burger/Linke 1998, 743ff.
Die Syntagmenangabe - ein Stiefkind der Bedeutungslexikographie
77
Position Phraseme oder bei den Syntagmen einzureihen, ohne sich seiner Entscheidung wirklich sicher sein zu können. Hinzu kommt, dass Phraseme, die heute als Ganzes vorn Sprecher gelernt werden müssen, diachron betrachtet, zu bestimmten Zeiten noch konkrete, nicht idomatisierte Bedeutungen haben können bzw. z.B. gerade in frühneuhochdeutscher Zeit den Wandel von unabhängigen Teileinheiten zu festen Verbindungen vollziehen. Wer weiß heute schon, dass eine Phrasem wie den Löffel abgeben tatsächlich einmal konkret in dem Sinne gemeint war, dass man sein wichtigstes und oft auch einziges Essinstrument selbstverständlich erst dann abgibt, wenn man es wirklich nicht mehr braucht, das heisst, wenn man im Sterben liegt.8 Dem Lexikographen kann im Ernstfall der Erstbeleg zu einem solchen Phrasem vorliegen, und er muss nun entscheiden, ob eine Phrasem bereits fest ist oder nicht. Ein wenig anders liegt die Sache bei der Unterscheidung von Syntagmen und Kollokationen.9 In der praktischen lexikographischen Arbeit können (freie) Syntagmen und Kollokationen zwar ebenso wenig mit Sicherheit unterschieden werden wie Syntagmen und Phraseme, eine Bearbeitung in unterschiedlichen Informationspositionen ist aber deswegen nicht notwendig, weil eine solche Unterscheidung für das angesetzte Lemmazeichen nicht bedeutungsrelevant ist. Kollokationen und freie Syntagmen fließen daher nahezu immer in der Position Syntagmen zusammen. Wenn hier von nahezu die Rede ist, dann liegt dies daran, dass es auch hier Problemfälle gibt. Rechtsformeln oder Zwillingsformeln, die in der Fachliteratur zu Recht häufig als Kollokationen eingeordnet werden,10 sind im FWB in der Position Phraseme eingeordnet. Die Paarformel Land und Leute ist nämlich tatsächlich mehr als nur die Addition der Bedeutungen ihrer beiden Bestandteile. Sie steht für die: ,Gesamtheit des in einem bestimmten Gebiet befindlichen Besitzes (Land, Vieh, Häuser usw.) und der dazugehörigen Bevölkerung; Lebens- und Rechtsgemeinschaft derer, die in einem bestimmten Gebiet zusammenleben'. Eine „normale" Kollokation wie Haare waschen ist dagegen nicht extra als Kollokation gekennzeichnet bzw. unter der Position ,Phraseme' aufgeführt, sondern wird wie gewöhnliche Syntagmen behandelt. Denn abgesehen davon, dass es im Artikel Haar semantisch keinen Unterschied macht, ob ich mir die Haare wasche, oder ob ich sie mir putze, wäre eine andere Vorgehensweise als die eingeschlagene kaum möglich, da dem Lexikographen schlichtweg die nötige Kompetenz fehlt, eine solche Kollokation von freien Syntagmen zu unterscheiden. So ist es nämlich durchaus denkbar, dass man in fmhd. Zeit die Haare nicht nur gewaschen, sondern auch geputzt hat.
Ein interessanter mündlicher Hinweis Heino Speers sei hier noch angeführt: im lübischen Recht bedeutete es die Schuldenfreiheit für die Witwe, wenn sie den Löffel ihres Mannes bei seiner Beerdigung am Grab abgibt. Vgl. dazu Burger 1998; Kohn 1992, 369-387; Hausmann 1984, 119-129. Vgl. dazu Burger 1998, 51.
78
Anja Lobenstein-Reichmann
2.3. Füllung einer Syntagmenangabe Syntagmen können entsprechend dem zugrundeliegenden Textcorpus vorwiegend einem idiolektalen, dialektalen, fachsprachlichen, synchron oder diachron angelegten Textcorpus entstammen, wobei eine Trennung der verschiedenen Lekte nur bedingt sinnvoll erscheint und nur unter bestimmten Informationsanliegen von Bedeutung ist. Syntagmen setzen sich aus dem untersuchten Lemmazeichen und ein oder mehreren textlich-linear mit ihm kombinierten weiteren Ausdrücken zusammen. Erscheint das Wort leben mit dem Verb retten, so wird das Syntagma leben retten aufgeführt; entsprechend ergibt sich in anderen Zusammenhängen z.B.: leichtes leben oder jm. das leben schwer machen usw. In der lexikographischen Praxis müssen allerdings bei der Handhabung von Syntagmen vom Bearbeiter bestimmte Entscheidungen getroffen werden, die zum einen ihre Auswahl, dann ihre Füllung und als drittes ihre Segmentierung betreffen. Diese Entscheidungen hängen zum einen vom zu beschreibenden Wort ab und zum anderen vom Informationsanliegen, das der Lexikograph hat. Will er grammatische Informationen weitergeben, so werden die Syntagmen z.B. über syntaktische Valenzen informieren, will er jedoch semantische oder gar pragmatische Informationen formulieren, wie es in diesem Falle nicht nur Anliegen, sondern auch Programm ist, so werden die Syntagmen entsprechend erweitert. Die eigentliche Leistung des Lexikographen ist es also, je nach Wörterbuchtypus zu unterscheiden, was bei der Füllung der Syntagmenangabe obligatorisch ist und was fakultativ. Selbst minimalisierte Syntagmen müssen notwendige Füllungen haben, wie dies im Falle von Hunde bellen z.B. dadurch geleistet ist, dass eine Syntagmenangabe aus mindestens zwei Worteinheiten bestehen muss. Bei eher semantischen Fragestellungen scheint es allerdings so, als wäre eine Syntagmenangabe, die allein mit diesen beiden Wörtern gefüllt ist, nur dann informationsrelevant, wenn die Benutzersituation diejenige ist, dass der Rezipient erst einmal darüber informiert werden muss, dass Hunde bellen. Da ein solches Wissen enzyklopädisch ist, könnte man davon ausgehen, dass es kaum das Informationsanliegen eines Wörterbuchbenutzers ist, dieses zu erfahren. Anders liegen die Dinge jedoch bei Syntagmen zum Lemmazeichen got oder leben, wie: Gott suchen, Gott versuchen, das Leben verwirken, bezahlen oder gar verunreinigen. Bereits durch die Angabe des mit dem Substantiv verbundenen Verbs erfahrt der Leser sofort etwas über das Verhältnis des Menschen zu Gott oder zum Leben. An dieser Stelle sei bemerkt, dass es sich in einem Sprachstadienwörterbuch in der Regel um typische Syntagmen handelt, d.h. dass sie sich im untersuchten Material besonders häufig oder an inhaltlich betonter Textstelle finden lassen. Und was sprachlich typisch ist, ist letztlich auch zeithistorisch typisch und lässt Aussagen zu wie die folgende: Gott war in der Frühen Neuzeit eine Größe, die man gesucht hat bzw. die man versuchen oder gar verunreinigen konnte. Beim Vergleich scheinen diese Informationen kulturhistorisch schon interessanter zu sein als die Aussage: In der Frühen Neuzeit hat es Hunde gegeben, die gebellt haben.
Die Syntagmenangabe - ein Stiefkind der Bedeutungslexikographie
79
Doch betrachtet man das scheinbar „überflüssige" Syntagma Hunde bellen noch einmal näher, dann stellt man fest, dass ein solches Vorkommen nicht immer uninteressant sein muss. Äußerst informativ wird die Angabe dieses Syntagmas für den Wörterbuchbenutzer dann, wenn mit einem Lexem wie Hund kein Tier gemeint ist, sondern wenn mit diesem Wort Bezug genommen wird auf einen bestimmten Typ von Menschen. Dann nämlich müsste der Lexikograph bei seiner Bedeutungserläuterung darauf hinweisen, dass das Wort Hund neben seiner rein enzyklopädischen Bedeutung auch noch eine andere, nämlich eine tropische, hat. Tierbezeichnungen dienen häufig als Schimpfwörter, mit denen die einem Tier zugeordneten Eigenschaften auf den Menschen übertragen werden. So findet man im FWB unter dem Lemmazeichen bellen tatsächlich nicht nur die Bedeutung ,bellen (von Hunden, Füchsen gesagt)', sondern auch eine Bedeutung ,laut, unartikuliert, feindselig gegen jn./etw. agieren, schreien, keifen [...]'. Diese 2., übertragene Bedeutung bezieht sich auf bestimmten Menschen (z.B. auf Prediger und „Weiber").11 Die Herausarbeitung und die Nennung der Bezugssetzungen ist dabei nicht nur für den Lexikographen informationsrelevant, da sie bedeutungsrelevant ist, sie gewährt auch dem Wörterbuchbenutzer gewisse Einblicke in die kommunikativen Muster einer Zeit. Ein ähnlicher Fall liegt vor, wenn Martin Luther in seinen Schriften vom Bock zu Leipzig oder vom (Papst)Esel12 in Rom und deren Handlungen spricht. Denn ein Bock schreibt nicht und ein Esel hat kaum die Macht, einen Bann auszusprechen. Abgesehen von den bislang aus zwei Einträgen bestehenden Angaben gibt es noch diejenigen Angaben, in denen das Verb zwei oder dreiwertig ist. Hier sollten die entsprechenden Leerstellen ebenfalls gefüllt werden, j. jm. das l. erretten oder das leben jm. lieb sein, wobei die genauere Füllung der Platzhalter möglich ist, im Sinne vony/w. (z.B. dem menschen) das l. lieb sein bzw. / (z.B. got) jm. (z.B. dem menschen) das l. erretten. In einem Sprachstadienwörterbuch sind solche Syntagmenangaben ausreichend. Maximale Füllungen können jedoch weit über den Valenzeintrag hinaus gehen, so dass z.B. bei einem möglichen idiolektalen Wörterbuch, in dem im Gegensatz zum gesamtsprachbezogenen Wörterbuch nicht das allgemein Typische, sondern das Spezielle und Charakterisierende des Autors im Vordergrund steht, die Füllungen der Klammern mehrere Wörter, ja sogar Satzgrenzen überschreiten können. Bei einem idiolektalen Wörterbuch, das sich zum Ziel gesetzt hat, den antiliberalen Sprachgebrauch eines Rechtskonservativen wie Arthur Moeller van den Brucks darzustellen, könnte unter dem Lemma liberal daher folgender Syntagmeneintrag stehen: j. (z.B. der liberale Mensch) j. (irgendwie jeder Mensch, der sich nicht mehr in der Gemeinschaft ßihlt) sein. Die ausschließli-
11 12
FWB, Bd. 3, 1228f. WA 26, 577 (l528) .Aber der Bapstesel thut recht, das er die schlifft also deutet". WA 32, 299, 25 (1532): „erstlich sind jnn dis funfft Capitel gefallen die groben sewe und esel, Juristen und Sophisten, des Bapst Esels rechte hand und seine Manuno Luchen, die haben aus dieser schoenen rosen solche gifft gesogen". Vgl. auch: Ebd. 54, 221, 5 (1545) und öfter.
80
Anja Lobenstein-Reichmann
ehe Bezugsetzung von liberal und Mensch hätte im Verhältnis dazu nur geringen Aussagewert, besonders wenn man dabei berücksichtigt, dass für Moeller van den Brück in seinem Buch „Das dritte Reich" fast ein Drittel der liberalBelege Adjektivattribute zu Mensch sind. Dieses Beispiel zeigt, dass sich im Ernstfall auch Nebensätze in die Klammern einfügen ließen, sofern es den Intentionen des Wörterbuches entgegenkommt und die entscheidende Information/Satzaussage eben genau dort zu finden ist. Eine solch intensive Klammerfüllung ist jedoch nur dann sinnvoll, wenn es sich um ein ausgesprochenes Autorenwörterbuch handelt bzw. um ein Diskurswörterbuch. Gesamtsprachbezogene Wörterbücher können und sollten aufgrund ihres Anliegens auf diese Breite verzichten. In ihnen geht es mehr um das Typische eines Sprachganzen als um eine spezifische themen- oder personenbezogene Einzelaussage, wie es bei den vorher genannten Wörterbuchtypen der Fall ist. Dieser Rekurs auf Idiolektales sollte allerdings die weitreichenden Möglichkeiten andeuten, die auch in anderen Zusammenhängen mit der lexikographischen Informationsposition Syntagmen gegeben sind. Aus dem eben Beschriebenen erklärt sich auch, warum die Syntagmenangabe gemeinsam mit den paradigmatischen Angaben wie Bdv. und Ggs. in das direkte Umfeld der Bedeutungserläuterung gehören sollte. Sie ist als Teil der Wortpragmatik an die Bedeutung adressiert (Reichmann 1985, 260; Lex 5). Das Wort Pragmatik führt bereits einen weiteren, bislang nur am Rande angedeuteten Interessensbereich der Syntagmenangabe ein. Es geht in der Syntagmenangabe um eine bestimmte Gebrauchs- und damit Handlungssituation, in der ein Wort innerhalb eines Textes von einem Autor verwendet wird. Die Bezüge, die von diesem gesetzt werden, sind zwar einerseits sehr freizügig, andererseits aber nicht willkürlich, denn sie entsprechen bestimmten kommunikativen Regeln. Damit sind nicht nur die notwendig verwendeten grammatischen Regularitäten gemeint, sondern kommunikative Konventionen einer bestimmten Zeit, einer bestimmten Gesellschaft, einer bestimmten Textsorte, einer bestimmten Sprachgebrauchssituation usw. Am Beispiel der Sprachgebrauchssituation soll dies verdeutlicht werden: Dass eine Teekanne sprechen kann, ist zwar im Märchen möglich, jedoch in einem juristischen Text schwer vorstellbar. Die Tatsache jedoch, dass in einem Text ein solches Syntagma (z.B. unter dem Lemma sprechen (j. (z.B. Alice/Teekanne) sprechen), vorkommt, kann als Indikator dafür gewertet werden, dass dieser Text fiktive Züge hat. Dieses Beispiel demonstriert übrigens auch, dass der Lexikograph nicht eine irgendwie konstante Wahrheit nachvollzieht, sondern immer nur eine von einem Autor gesetzte Wirklichkeit. Aus diesem Grunde kann gesagt werden, dass Lexikographie in letzter Konsequenz immer auch Pragmatik ist, und zwar Pragmatik im Sinne Wittgensteins. Es geht um Gebrauchsweisen, um das sprachliche Handeln der Menschen einer bestimmten Zeit. Um auf das Beispiel mit der Teekanne zurückzukommen Hinweise wie der auf die Fiktionalität eines Textes oder die besondere Literarizität ermöglichen vielschichtige Aussagen über die Bedeutungssetzungen, die Textsorten oder das sprachliche Handeln einer Zeit (siehe dazu auch das oben genannten Beispiel mit den Tiernamen Hund, Esel).
Die Syntagmenangabe - ein Stiefkind der Bedeutungslexikographie
81
2.4. Darstellung der Syntagmenangabe im FWB Das Wörterbuch, das zu diesen Ausführungen Pate stand, ist in erster Line das Frühneuhochdeutsche Wörterbuch, das von Ulrich Goebel und Oskar Reichmann herausgegeben wird. In der Konzeption dieses Wörterbuches wurde von Oskar Reichmann eine Informationsposition , Syntagmenangabe' eingeführt, bei der er die Angabe typischer Syntagmen anstrebt. Diese Syntagmen sind „in keinem Fall Abstraktionen, wie sie aus den Belegen auf unterschiedlicher Generizitätsstufe formulierbar wären." (Reichmann, Lex. Einl. 1986, 133). Sie sind vielmehr, laut Reichmann (ebd.), „in jedem Fall Ausschnitte aus Belegen". „Syntagmen mit Belegstatus [...] enthalten Prädikationen über den Gegenstand, auf den mit einem Wort Bezug genommen wird; sie leisten damit einen Beitrag zur Erschließung der Spezifika der in Frage stehenden Einzelbedeutung, also insbesondere zur Klärung der schwierigeren Fragen von Wörterbuchbenutzern" (ebd.). Der deutlich auf die Bedeutungsspezifik ausgerichtete Status dieser Informationsposition, wie er hier schon mehrfach angeführt worden ist, schließt jedoch nicht aus, dass die Anordnung dieser typischen Syntagmen, nicht doch nach grammatischen Kategorien geschieht, so dass der grammatisch interessierte Benutzer auch diese Informationen kurz und prägnant erhält. Er wird zwar nicht auf abstraktiv gewonnene Hinweise wie abgot als affiliertes Akkusativobjekt zu Handlungsverben (ebd.) stoßen, aber er kann sich diese Information anhand der gegebenen Syntagmen systematisch erschließen. Dazu sei ein Hinweis auf die interne Syntagmenreihenfolge, wie sie im Frühneuhochdeutschen Wörterbuch gebraucht wird, erlaubt. Ist das zu beschreibende Lemma ein Verb, so ist die interne Reihenfolge: Verb + Akkusativobjekt; Verb + Subjekt; Verb + Genitivobjekt.; Verb + Dativobjekt; Verb + Präpositionalobjekt und -angäbe; Verb + Adverb. Handelt es sich um ein Substantiv, so können folgende Kategorien nacheinander gefüllt werden: Substantiv als Akkusativobjekt; Substantiv als Subjekt; Substantiv als Genitivobjekt; Substantiv als Dativobjekt; Substantiv als Präpositionalangabe oder -objekt; Substantiv mit abhängigem Genitiv; Adjektivattribut + Substantiv; Substantiv mit Präpositionalangabe. Bei Adjektiven und Adverbien sind adverbiale und attributive Verwendungen zu unterscheiden. Die konkrete Reihenfolge lautet am Beispiel ledig: An erster Stelle stehen alle prädikativen Verwendungen von ledig: z.B./ ledig sein, j. e.S. ledig sein. Dann folgt die Verwendungsweise als prädikatives Attribut: jn. ledig machen, jn. e.S. ledig machen. Als drittes kommen die am häufigsten belegten attributiven Verwendungen: z.B. ledige sele. Und zum Schluss werden die Verwendungen aufgeführt, in denen das Adjektiv mit abhängigem Kasus erscheint: z.B. ledig des saufens. Ob im Einzelfall jede mögliche grammatische Verwendung auch gefüllt werden kann, hängt vom jeweiligen Belegmaterial ab. Usus ist außerdem, dass die Syntagmenposition im FWB überhaupt nur dann aufgeführt wird, wenn über das zitierte Belegmaterial hinaus in den Belegstellenangaben noch weitere interessante Syntagmen greifbar sind. Ist ein Lemma nur schwach belegt, so dass
82
Anja Lobenstein-Reichmann
das gesamte Material zitiert werden konnte, oder finden sich in den Belegstellenangaben keine zusätzlichen Informationen, so wäre die eigene Auflistung der Syntagmen nur noch eine Wiederholung und somit unnötig. Ist die Position allerdings gefüllt, so enthält sie vollständig alle Syntagmen, die im Material gefunden werden konnten, und zwar genau in der oben aufgeführten grammatischen Reihenfolge. Nun stellt sich die Frage, was dem Benutzer über das oben angegebene grammatisch sortierte Material hinaus im FWB an Füllmaterial aus den Belegen angeboten werden kann, damit der intendierte kulturhistorische Erkenntnisgewinn gesteigert wird. Im Artikel got wird die 1. Bedeutung folgendermaßen erläutert: >christlicher Gott des Alten und des Neuen Testaments, auf den der Mensch als auf seinen absoluten Bezugspunkt sein Vertrauen richtet, der ~ allgegenwärtig, ewig, allmächtig, allwissend und unveränderlich -- als alles bestimmende Wirklichkeit das menschliche Dasein konstituiert und zu jeder Zeit und an jedem Ort in dieses Dasein eingreiftGott Vater, trinitarisch die erste der drei Naturen Gottesmit Gottes Hilfeω5. Fuit in diebus Herodis, regis ίβ, τ« βασιλέως της ίαδαίας, Ιεξενς Judaeae, Sacerdos quidam nomine Zav. 2. St. Mt.
Abb. 1: Der griechische und lateinische Text von Luk. 1,1-4 nach der Ausgabe des Leander van Ess, Novum Testamentum Graece et Latine. T bingen 1827. (Privatexemplar Prof. St. Sonderegger)
215
Philologische Probleme der deutschen Bibel bersetzung
I N C I f i T.
ΨΑΐΚ-h ΑΠΚΑΝ
EVAN GEL I U M ftfundiim
L
U
C A
M.
CAP. I.
C A P . I.
jo fpell gebypa^ om
Op)>am ]je pitoblice maneja ]>ohton )>apa fm^a pace je-enijebyp an J>e on uf
HNS VAlhTINS
syA sve
snw
flNSlS
ΓΑΛ6ΐκΑιλΑ 9ΑΛ MIS J=KAM iM rAArrynΝλΐΝ rA MeAg λ« BATISTA
4. 61
BI
y VAS ΪΗ A Ar AM Νδ ΊηλΑιΑδ τηλαι. «ΑΜΙΝ A^ARiAS ns AP AK ABIg A« USIHS i's ns ΤΚΠΜ AhAK-XNS g Ah ftyis ΑιλθΐβΑΒΑιψ: ^. yesminh ΨΑΗ ΒΑ ΪΝ Α«λνΑΐΚΨ9 Y ΓΑΝ-
*· Spa tir befczhtun pa'δε hit op ppym^e jej-apon. anb pppxce Jienaj" pxpon. 3. C e jej be ppom pputna] geopnlice eallum. [011%] enbebypbne]rj-e ppitan ^e . Theophiluj· .
4.. Dxtr ]>u oncnape papa popba fo^jcseftnefj-e. of ]>am ^5e ]>u jelxpeb eapt :5. Onftepooej- bagura lubea cymncgef . p^ej- f um p• cepo on naman Zachapiaf. op Abian tune. ~] hij- pjj; pasj" op Aaponef bohtpurn. anb hype nama psej- €Jizabeth :· 6. So^Shce hij ρκροη butu pihtpij-e bepopan Jjobe.
Abb. 2: Editio princeps der gotischen Bibel des Missionsbischofs Wulfila (Mitte 4. Jh.) durch Franciscus Junius, Dordrecht 1665, Seite 169, Luk. l, 1-6, zusammen mit der altenglischen Interlinearversion. (Privatexemplar Prof. St. Sonderegger)
216
Stefan Sonderegger
t» tmu uuAtrrtL ijiin ' ff». t*«f
cjut eimnae 1-pf) ui i
' f%rm e; zugleich wird aber das i der Folgesilbe vorweggenommen: deligiert (Zeit 10.5.1985, 47); Delegierte (FAZ 17.6.2000, 3); erimitiert (taz 12.3.1996, 27); Zwangserimitierte (T 2.8.1996, 23); inszinieren (taz 10.8.1995, 6 u.o.); Repititorium (Zeit 17.10.1997, 26; FR 3.11.1999, 27). Suffixanalogie dagegen liegt vor, wenn die im Deutschen seltene Endung -eum (wenn sie unbetont ist) in die weit häufigere Endung -ium (z.B. Helium, Podium, Studium) übergeht: Linolium (Berl. Ztg. 27.9.1993, 37); Linoliumverschnitt (taz 27.9.1995, 11); Linolium-Fußboden (FR 6.11.1997, 8); Petroliumfiinzeln (FR 16.5.1997, 21); Petroleumlampen (SZ 13.10.1998, 2); Petroliumpolitik (Züricher Tagesanzeiger 25.8.1998, 30). - Schriftform a/o/u (deutlich seltener): Jokar (MM Sonntag aktuell 25.2.2001,
Frühneuhochdeutsche Zustände im Spätneuhochdeutschen?
339
11); Kokusnuss (Berl. Ztg. 29.8.1995, 3); kondulieren (FAZ 5.5.2000,40); Obulus (Dahn 1987, 46); Oktagon (T 11.1.1992, 6; T 29.8.1998, 14); popo/a>(Asmus 1993, 178). - Euphonischer Vokaltausch über Silbengrenzen; die Abfolge der unbetonten i/i/e wird in i/e/i geändert: priveligiert (taz 13.5.1991, 15; T 4.1.1992, 17; Berl. Ztg. 2.7.1997, VI u.ö.). Zu vergleichen ist - mit Einschluss der betonten Silbe - der in der Sprechform weithin konventionelle Ersatz von Libyen durch Lybien (T 23.1.1999, 1). Hierzu derzeit 98 Belege in den EDS-Korpora.
6.6. Tendenz zur Vereinfachung von Konsonantenclustern Betroffen sind vor allem die Gruppen -nds, -ndst- und -gtst- und darunter in erster Linie Superlative von Partizipien I und II. Das Partizip II schwacher Verben auf -igen (z.B. berechtigt) wird behandelt, als wäre es ein Adjektiv auf -ig: berechtigst (FR 13.10.1999, 25); berüchtigst (ND 24.5.1974, 7; Zeit 6.6.1986, 25; FAZ 4.4.1998, 8; MM 13.12.2000, 3); beschäftigst (taz 24.4.1992, 26; St. Galler Tagblatt 23.11.1999); erregenst (St. Galler Tagblatt 18.11.1997; T 31.10.1998, 8; FR 13.7.1999, 9); geachtest (taz 19.8.1987, 3; 15.9.1989, 8); meistbegünstigst (taz 11.5.1990, 10; Berl. Ztg. 24.6.1998, 34); schillernst (taz 3.6.1988, 12; Berl. Ztg. 16./17.12.1995, 36; SZ 27.12.1999, 14); umfassenst (MM 20.3.1986, 22; SZ 15.5.1996, Umwelt; T 25.11.1999, 16); unbeteiligst (Züricher Tagesanzeiger 3.7.1997, 45). Und so auch die Adverbialbildungen abens (taz 31.3.1993, 19; SZ 29.10.1998, 1; FR 15.9.1999, 47); eilens (taz 10.8.1990, 6; 26.2.1999, 2); Zusehens (MM 11.6.1986, 3; T 27.12.1995, 3; taz 16.3.2000, 24).
6.7. Tendenz zur Sinngebung unverstandener Fremdwörter - Beispielgruppe förder-/Förder- für föder-/Föder-: förderal (taz 31.8.1989, 10; Berl. Ztg. 27.11.1997, 18); Förderalismus (taz 10.8.1988, llf.; T 22.4.1995, 11; FR 18.4.1997, 12); ßrderalistisch (T 27.1.1996, 17); Förderation (Spiegel 18.7.1994, 110); förderativ (T 14.1.2001, B2). Die Gruppe förder-/Förder- stattföder-/Föder- ist heute (21.3.2001) mit über 500 Belegen in den IDS-Korpora vertreten. Entsprechende Verwendungen sind nicht auf die Medien beschränkt: Bismarck [...] der den Förderalismus im deutschen Reich befürwortete (Schautafel im König-Ludwig-Museum, Herrenchiemsee 19.7.1994). Daneben steht bereits sprachspielerischer Gebrauch: Wir sollten ein Buch über die Fördermittel zusammenstellen [...] Das ,Handbuch des Förderalismus' (Zeit 31.10.1997, 42). - Beispielgruppe komplementär für komplementär (Anlehnung an Kompliment): [ein] Komplementär der Helmut Horten KG (Welt 10.1.1959, 7; vgl. Welt 11.9.1974, 10); komplimentär (taz 8.3.1989, 19; SZ 1.10.1996, 15; Zeit
340
Hartmut Schmidt
18.7.1997, 14; FR 1.12.1998, 10); Komplimentärfarben (Zeit 5.12.1986, LB, 5); Komplimentärfinanzierung (T 26.7.1996, 14; MM 6.3.1998, Lokalteil); Komplimentärmedizin (St. Galler Tagblatt 23.6.1997); Komplimentärmittel (taz 13.3.1990, 22); Komplimentärsysteme (Berl. Ztg. 1.7.1999, VI). Sprachspielerisch: klug, charmant und freundlich, komplimentär sozusagen (Wiglaf Droste in: taz 6.12.1996, 20). - Beispielgruppe zentripedal für zentripetal (mit Lenisrealisierung, vgl. 6.2., und Anlehnung an Pedal [kraft]): zentripedal (taz 2.7.1992, 14; T 26.9.1995, 25; SZ 21.12.1996, Literatur; FR 13.10.1999, 12); Zentripedalkraft (taz 25.11.1988, 18; Berl. Ztg. 21.10.2000, 4).
6.8. Tendenz zur Präflxverwechslung pro-/poHier kann nur noch summarisch darauf hingewiesen werden, dass heute neben die altbekannte (durch fehlende Russischkenntnis motivierte) Fehlervariante Program (für Pogrom) eine Fülle umgekehrter (durch geschwundene Lateinkenntnis beförderter) Schreibungen mit zahlreichen Korpusbelegen tritt, so z.B. Paßt, Pogramm, Potest, Potokoll, Povinz statt Profit, Programm, Protest, Protokoll, Provinz.
1. Schlussbemerkung Die Frage .Fehler oder Variante?' können wir für das Frühneuhochdeutsche in vielen Fällen kaum beantworten. Für die Gegenwartssprache besitzen wir als Grundlage einer Antwort Wörterbücher und Grammatiken, die den sprachgemeinschaftlichen Konsens einer ganzen Epoche abbilden. Da aber auch Germanisten und selbst Grammatiker und Lexikographen gelegentlich der Gefahr erliegen, ihren Idiolekt für die maßgebliche Ausprägung der Schriftsprache zu halten, kann ein Blick über den Rand der Grammatiken und Wörterbücher in die tatsächlich manchmal irritierende Vielfalt der Sprachpraxis nicht schaden. Denn unter der festgeschriebenen Oberfläche unseres Normensystems herrscht Bewegung. Es gibt kein dauerhaft stabilisiertes System von Sprachnormen. Um viele festgelegte Positionen bilden sich Sphären der Variation und jede Gruppe von Varianten lässt Änderungspotenzen erkennbar und Änderungstendenzen bestimmbar werden. Ob sie sich durchsetzen, hängt allerdings weniger von sprachintemen Strukturen als von denen der Sprachgemeinschaft ab. Wir leben in einer Zeit, die konventionelle Sprachnormen nicht mehr für sakrosankt hält. Wen der Zustand der Mediensprache hiervon nicht überzeugt, der lasse die informelleren Texte handgeschriebener oder gedruckter Speisekarten, anderer kommerzieller Angebotstexte oder privater Annoncen auf sich wirken. Es geht nicht um Sprachverderb, sondern um Sprachentwicklung. In einer modernen Gesellschaft bedarf sie der Beobachtung, der Reflexion und der Orientierung,
Frühneuhochdeutsche Zustände im Spätneuhochdeutschen?
341
wenn das Kulturgut einer ihre Differenzen und Bewegungsabläufe immer wieder ausbalancierenden gemeinsamen Schriftsprache bewahrt bleiben soll.
8. Beleggrundlage Die Mehrzahl der Belege ist Tageszeitungen, Wochenzeitungen und Monatszeitschriften entnommen, ergänzt durch Hörbelege aus dem Fernsehen. Eigene Belege stammen im wesentlichen aus den Zeitungen und Zeitschriften Berliner Zeitung (Berlin), Börsenblatt (Leipzig), Die Kirche (Berlin), Mannheimer Morgen (Mannheim, mit dessen Sonntagsausgabe ,Sonntag aktuell'), Märkische Oderzeitung (Frankfurt/Oder), Muttersprache (Wiesbaden), Neues Deutschland (Berlin), Neue Zürcher Zeitung (Zürich), Ostpreußenblatt (Ham-burg), Tagesspiegel (Berlin), Welt am Sonntag (Berlin) und Wochenpost (Ber-lin) sowie den Fernsehsendern ARD, BR (Bayrischer Rundfunk), Phoenix, SAT l, WDR und ZDF. Elektronische On-line-Archive wurden zusätzlich für die Berliner Zeitung und die tageszeitung (taz) genutzt. Die Masse der übrigen Belege (darunter alle Zeitungsbelege ohne Datum oder ohne Seitenzahl) ist den Korpora des Instituts für Deutsche Sprache (s. al-Wadi 1994; http://www. corpora.ids-mannheim.de/ cosmas) entnommen. Abkürzungen für Zeitungstitel: Berl. Ztg. (Berliner Zeitung), FAZ (Frankfurter Allgemeine), FR (Frankfurter Rundschau), MM (Mannheimer Morgen), MOZ (Märkische Oderzeitung), NZZ (Neue Zürcher Zeitung), SZ (Süddeutsche Zeitung), T (Tagesspiegel), taz (tageszeitung). Außerdem wurden als Quellen zitiert: Asmus, Hans-Werner: Das große cinema-Starlexikon. Hamburg 31993. Borowiak, Simone: Baroness Bibi. o.O. 1997 (Goldmann). Dahn, Daniela: Prenzlauer Berg-Tour. Halle/Leipzig 1987. Dexter, Colin: Tod für Don Juan. Reinbek 1992.
9. Literatur al Wadi, Doris: COSMAS. Ein Computersystem für den Zugriff auf Textkorpora. Mannheim 1994. Anderson, Robert R./Goebel, Ulrich/Reichmann, Oskar (Hrsg.): Frühneuhochdeutsches Wörterbuch. Berlin, New York 1986ff. Bittner, Andreas: Wie schwach sind die starken Verben? Berlin 1985. (Linguistische Studien/ZISW/A, 126). Bittner, Dagmar/Bittner, Andreas: Sind Flexionsklassen nur morphologische Klassen? In: Bassarak, Arnim/Bittner, Dagmar/Bittner, Andreas/Thiele, Petra (Hrsg.): Wurzel(n) der Natürlichkeit. Berlin 1990, 16-36. (Linguistische Studien/ZISW/A, 208). Duden: Die deutsche Rechtschreibung. 22. Auflage. Mannheim/Leipzig/Wien/Zürich 2000. - Grammatik der deutschen Gegenwartssprache. 4. Auflage. Mannheim, Leipzig, Wien, Zürich 1984. (zit.: Duden Gr)
342 -
Hartmut Schmidt
Das große Wörterbuch der deutschen Sprache in zehn Bänden. Mannheim, Leipzig, Wien, Zürich 1999 (zit: Duden GW). Eisenberg, Peter: Grundriss der deutschen Grammatik. 3. Aufl. Stuttgart, Weimar 1994. Engel, Ulrich: Deutsche Grammatik. 2. Aufl. Heidelberg 1991. Grimm, Jacob/Grimm, Wilhelm. Deutsches Wörterbuch. Leipzig 1854-1971. 33 Bde. (zit.: DWB). Kämper, Heidrun: Wörterbuch und Literatur. In: Muttersprache 109, 1999, 24-42. Klappenbach, Ruth/Steinitz, Wolfgang (Hrsg.): Wörterbuch der deutschen Gegenwartssprache. Berlin 1964-77. 6 Bde. (zit: WOG). Paul, Hermann: Deutsches Wörterbuch. 9., vollständig neu bearbeitete Auflage von Hebnut Henne und Georg Objartel unter Mitarbeit Heidrun Kämper-Jensen. Tübingen 1992. Reichmann, Oskar/Wegera, Klaus-Peter (Hrsg.): Frühneuhochdeutsche Grammatik. Tübingen 1993. Schmidt, Hartmut: Lehnpräpositionen aus dem Lateinischen in der deutschen Gegenwartssprache. In: Horst Haider Munske/Alan Kirkness (Hrsg.): Eurolatein. Das griechische und lateinische Erbe in den europäischen Sprachen. Tübingen 1996, 65-81. Wurzel, Wolfgang Ullrich: Flexionsmorphologie und Natürlichkeit. Berlin 1984. (studia grammatica, 21). Zifonun, Gisela/Hoffmann, Ludger/Strecker, Bruno: Grammatik der deutschen Sprache. Berlin, New York 1997. 3 Bde. (durchpaginiert).
Verzeichnis der Beiträger
Prof. Dr. Vilmos Agel Universität Szeged, Institut für Germanistik, Lehrstuhl für Germanistische Linguistik, Egyetem u. 2, H-6722 Szeged, E-Mail: [email protected] Dr. Jochen A. Bär Universität Heidelberg, Germanistisches Seminar, Hauptstr. 207-209, D-69117 Heidelberg, E-Mail: [email protected] Prof. Dr. Werner Besch Hobsweg 64, D-53125 Bonn Prof. Dr. Anne Betten Universität Salzburg, Institut für Germanistik, Akademiestr. 24, A-5020 Salzburg, E-Mail: [email protected] Prof. Dr. Andreas Gar dt Universität Gesamthochschule Kassel, FB 09 - Germanistik, D-34109 Kassel, E-Mail: [email protected] Prof. Dr. Dirk Geeraerts Katholieke Universiteit Leuven, Departement LinguStiek, Blijde -Inkomststraat 21, B-3000 Leuven, E-Mail: [email protected] Prof. Dr. Ulrike Haß-Zumkehr Institut für Deutsche Sprache, Postfach 10 1621, D-68016 Mannheim, E-Mail: [email protected] Dr. Roland Kehrein Forschungsinstitut für Deutsche Sprache, Deutscher Sprachatlas, Hermann-Jacobsohn-Weg 3, D-35032 Marburg, E-Mail: [email protected] Prof. Dr. Wilhelm Kühlmann Universität Heidelberg, Germanistisches Seminar, Hauptstr. 207-209, D-69117 Heidelberg, E-Mail: [email protected]
344
Verzeichnis der Beiträger
Dr. Anja Lobenstein-Reichmann Institut für Deutsche Sprache, Postfach 10 16 21, D-68016 Mannheim, E-Mail: [email protected] Dr. Peter Mauser Universität Salzburg, Institut für Germanistik, Akademiestr. 24, A-5020 Salzburg, E-Mail: [email protected] Prof. Dr. Gerhard Rau Langgewann 18, D-69121 Heidelberg Prof. Dr. Thorsten Roelcke Riggenbacher Weg 3, D-79842 Bernau im Schwarzwald, E-Mail: [email protected] Prof. Dr. Joachim Schildt Fischerinsel 5 - 14/6, D-10179 Berlin Prof. Dr. Hartmut Schmidt Feldbergstr. 62/23, D-68163 Mannheim Prof. Dr. Stefan Sonderegger Buchenstraße 4, CH-9101 Herisau Dr. Heino Speer Deutsches Rechtswörterbuch, Akademie der Wissenschaften, Karlstr. 4, D-69117 Heidelberg Prof. Dr. Joachim Teile Pfeiferstraße Nr. 63/1, D-72622 Nürtingen-Hardt Prof. Dr. Klaus-Peter Wegera Ruhr-Universität Bochum, Germanistisches Institut, D-44780 Bochum, E-Mail: [email protected] Prof. Dr. Peter Wiesinger Universität Wien, Institut für Germanistik, Dr. Karl Lueger Ring 1/Stg. VII, A-1010 Wien, E-Mail: peter. [email protected]