187 81 12MB
German Pages 347 [348] Year 2006
Korpuslinguistik deutsch: synchron - diachron - kontrastiv
Korpuslinguistik deutsch: synchron - diachron - kontrastiv Würzburger Kolloquium 2003
Herausgegeben von Johannes Schwitalla und Werner Wegstein
Max Niemeyer Verlag, Tübingen 2005
Bibliographische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliographie; detaillierte bibliographische Daten sind im Internet über http://dnb. ddb. de abrufbar. ISBN 13: 9783-484-73064-9
ISBN 10: 3-484-73064-1
© Max Niemeyer Verlag, Tübingen 2005 Ein Unternehmen der K. G. Saur Verlag GmbH, München http:/Avww. niemeyer. de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbeständigem Papier. Druck und Einband: ΑΖ Druck und Datentechnik GmbH, Kempten
Vorwort
Im Gegensatz zur Geschichts- und Literaturwissenschaft hat sich die Linguistik erst relativ spät um eine eigene ,Quellenkunde' gekümmert (Wolf 2004, 133). Das änderte sich erst, seitdem mit dem Tonband gesprochene Texte konserviert und durch den Einsatz der elektronischen Datenverarbeitung große Mengen von Texten maschinell lesbar gemacht werden können. Der Lehrstuhl für Deutsche Sprachwissenschaft der Universität Würzburg hat sich seit den 80er Jahren Fragen der maschinellen Aufarbeitung von Texten gewidmet. Zunächst ging es hauptsächlich um die Erschließung großer Textmengen aus der Zeit des Frühneuhochdeutschen. Zu dieser Thematik richtete das Institut für deutsche Philologie im März 1997 das Fünfte Internationale Symposion zur maschinellen Verarbeitung altdeutscher Texte aus (Moser/Stahl/Wegstein/Wolf 2001). Parallel dazu wurden von Würzburg aus auch einige kontrastive Korpora initiiert, so das deutsch-finnische FiNDE-Korpus mit Kolleginnen und Kollegen der Universitäten Jyväskylä, Turku und Helsinki, das deutschportugiesische PORTDE-Korpus mit einem Team an der Universität Braga und ein deutschtschechisches Korpus mit den germanistischen Lehrstühlen der Universitäten in Opava und Ostrava. Ein deutsch-niederländisches und ein deutsch-polnisches Korpus sind in Arbeit, ein deutsch-russisches Korpus ist geplant. Hierzu veranstaltete der Lehrstuhl für deutsche Sprachwissenschaft vom 20. bis 23. Februar 2003 ein internationales Kolloquium mit dem Titel ,Korpuslinguistik deutsch 2003: synchron, diachron, kontrastiv', das von der Deutschen Forschungsgemeinschaft (DFG) und dem Bayerischen Staatsministerium für Wissenschaft, Forschung und Kunst finanziell gefordert wurde. Beiden Institutionen gebührt an dieser Stelle unser ganz besonderer Dank, denn ohne ihre verständnisvolle Förderung hätte das Kolloquium mit seiner internationalen Ausrichtung nicht stattfinden können. Für die Mitwirkung bei der Drucklegung der Beiträge danken wir Frau Monika Wojcicka und Frau Mirjam Blümm MA. Der Untertitel des Bandes - ,synchron, diachron, kontrastiv' - deutet schon die thematische Ausrichtung des Kolloquiums an: die Diskussion über Erfahrungen auf dem Gebiet der aktuellen Korpusarbeit mit historischen und gegenwartssprachlichen deutschen Texten und mit sprachkontrastiven Korpora. Damit sollen erreichte Standards gesichert und Perspektiven für neue Fragestellungen eröffnet werden. Die Computertechnologie hat in den vergangenen Jahren solch rasante Fortschritte gemacht, dass ein Austausch von Korpuslinguisten über ihre Arbeiten dringend geboten ist. Auch grundsätzliche Fragen sollen im Lichte der nun schon an vielen Universitäten und Forschungseinrichtungen etablierten Korpuslinguistik diskutiert werden. Die Ergebnisse des Kolloquiums legen wir mit diesem Band vor.
VI
Vorwort
Im ersten Teil sind alle Aufsätze zu Grundsatzfragen der Korpuslinguistik versammelt. ERNST BURGSCHMIDT weist am Beispiel englischer Adjektive mit dem Suffix -ing und deren abgeleiteter Adverbien auf -ingly nach, dass kleinere, spezifisch zusammengestellte Korpora ergiebiger sein können als die sehr großen Korpora. Aus einer ähnlichen Motivation plädiert CHRISTIAN MAIR dafür, dass es sinnvoll ist, die gewaltigen Textmassen des World-Wide-Web für linguistische Fragestellungen auszunützen; er demonstriert dies am gef-Passiv. TONY McENERY zeigt am Beispiel der Untersuchung von Tempus und Aspekt an einem englisch-chinesischen Parallelkorpus den Wert paralleler Korpora für Übersetzungsstudien und die maschinelle bzw. maschinengestützte Übersetzung. AHTI JÄNTTI fordert mit Blick auf die bestehenden Grammatiken des Deutschen die Einbeziehung von Korpora bei der Formulierung grammatischer Regeln. Im zweiten Teil,,Korpuslinguistik synchron', werden synchrone Korpora vorgestellt und es wird mit beispielhaften Analysen demonstriert, wie Korpusauswertungen zu neuen linguistischen Einsichten führen können. RAINER PERKUHN, CYRIL BELICA, DORIS ALWADI, MEDCE LAUER, KATHRIN STEYER und CHRISTIAN WEIB beschreiben eine Reihe von öffentlich zugänglichen Korpora geschriebener Texte des Instituts für Deutsche Sprache (IDS) in Mannheim. WERNER KALLMEYER und WILFRIED SCHÜTTE führen am Beispiel von aber vor, wie die Suche an den Gesprächskorpora des IDS abläuft und welche Resultate damit zu erzielen sind. PETER EISENBERG, WOLFGANG LEZIUS und GEORGE SMITH stellen ihr grammatisch annotiertes TIGER-Korpus aus Texten der ,Frankfurter Rundschau' vor und erläutern, wie Strukturbeschreibungen und Korpusabfrage ineinandergreifen. ANGELIKA FEINE und MECHTHILD HABERMANN plädieren für eine korpusbasierte Erforschung von Wortbildungen mit Konfixen aus anderen Sprachen und zeigen mit Hilfe des COSMAS-II-Korpus des IDS, wie die Bildungen auf -manie zwischen 1994 und 2000 zuerst stark zunahmen, dann aber wieder zurückgingen. NORBERT DITTMAR und JANA BRESSEM überprüfen anhand des Berliner Wendekorpus (56 Interviews mit Ost- und Westberlinern zum Fall der Mauer am 9. 11. 1989) einige Hypothesen zu weil mit Verbzweitstellung und sprechen sich für die Behandlung von weil + V2 als Diskursmarker aus. IRMGARD ELTER untersucht auf der Grundlage eines frei zusammengestellten Korpus von Zeitungstexten aus dem Internet die Rektionen der Präpositionen wegen, während, trotz, statt und dank mit Dativ, die insgesamt selten sind und, sofern sie vorkommen, einen umgangssprachlichen Hintergrund anzeigen. ILKA MENDT führt in den Bereich der LernerKorpora ein und stellt eine Fallstudie zur Aussprache englischer Vokale von deutschen Muttersprachlern vor. KIRSL PAKKANEN-KILPIÄ hinterfragt an drei Beispielen die in Grammatiken behaupteten Verwendungsbeschränkungen in Fällen, in denen in großen Korpora eben diese Verwendungen ohne ein Merkmal von Fehlerhaftigkeit belegt sind. GYUNG U K KIM benutzt die Mannheimer Korpora und das Bonner Korpus des IDS, um Belege für Wortbildungen mit -arm, -fertig, -fest und -frei in Graduierungen von Komposita (vitaminarm) und Suffixableitungen (bügelarm) zu differenzieren. Den dritten Bereich, ,Korpuslinguistik diachron', bilden Aufsätze über historische Korpora und damit verbundene linguistische Fragestellungen. Wir haben sie hier in der chronologischen Reihenfolge der Sprachstufen angeordnet. HEINRICH HETTRICH stellt eine korpusbasierte kontrastive Studie zum Akkusativ im Vedischen und Deutschen vor. ECKHART MEINEKE entwickelt Überlegungen für ein Korpusprojekt zur Beschreibung der Semantik
Vorwort
VII
der derivierten Substantive im Althochdeutschen und Altniederdeutschen. FRANZ SIMMLER fordert die Erstellung textsorteneinheitlicher Korpora in Form von Dokumentationen eines Textes oder eines Textensembles (Bibel) über mehrere Jahrhunderte hinweg und argumentiert gegen die Verwendung normierter Textausschnitte (z.B. die ersten 30 Seiten) als Untersuchungsgrundlage, weil damit nicht gesichert ist, dass die ganze Varianz eines sprachlichen Phänomens erfasst wird. Er zeigt dies am Beispiel der Adjektivmorphologie. LENKA VANKOVÄ stellt das ,01mützer medizinische Korpus' vor, das aus fünf Texten unterschiedlicher Textsorten besteht. Die Reihe der Arbeiten zum Themenbereich ,Korpuslinguistik kontrastiv' eröffnen CHRISTINE HEISS und MARCELLO SOFFRITTI mit einer Studie über die Nutzung von Parallelkorpora auf der Basis von Filmdialogen für das Sprachenpaar Deutsch - Italienisch. NELLEKE OOSTDIJK zeigt an Beispielen aus dem Bereich multilingualer Korpora Formen und Modelle der Korpusannotation mit Schwerpunkt auf den Sprachen Niederländisch und Englisch. CATHRINE FABRICIUS-HANSEN stellt das Oslo Multilingual Corpus vor, das Sprachvergleiche zwischen Norwegisch, Englisch, Deutsch und (nach Plan) Französisch in fiktionalen und nicht-fiktionalen Texten mit den jeweiligen Übersetzungen erlaubt. LEENA KOLEHMAINEN und PETER STAHL liefern schließlich einige Beobachtungen zu Übersetzungsuniversalien, zur Sprachtypologie und zur Textsortenspezifik am Beispiel des finnisch-deutschen FLNDE-Korpus. Der fünfte Themenbereich präsentiert in kurzen Berichten aktuelle Korpusprojekte, die Deutsch als Vergleichssprache haben. MARIA KATARZYNA LASATOWICZ beschreibt ihre Korpusarbeiten zur Dokumentation des gegenwärtig in Schlesien gesprochenen Deutsch und des Wasserpolnischen. DANIELA PELKA und FELICJA KSI^ZYK berichten von ihrem Projekt über Auswirkungen des Sprachkontakts bei Deutsch und Polnisch sprechenden Personen in Oberschlesien. IDALETE DIAS skizziert das Kodierungskonzept des im Aufbau begriffenen deutsch-portugiesischen PORTDE-Korpus, das mit einem Roman von Jose Saramago und dessen deutscher Übersetzung beginnt. SERGEJ DUBININ, SERGEY VADYAEV und JULIA SMOLSKAJA beschäftigen sich mit den Problemen eines deutsch-russischen Parallelkorpus mit modernen Texten und erläutern ein Arbeitsmodell. ASTRID STEDJE stellt ein semantisches Modell für Tugenden und Laster vor, das man aufgrund von Korpora mit Texten aus unterschiedlichen Kulturen vergleichen kann. ANITA MALMQVIST hat aus deutschen und schwedischen Korpora Komposita gesammelt, welche das Übersteigerte einer menschlichen Eigenschaft ausdrücken. IVA KRATOCHVILOVÄ und KARSTEN RINAS beschreiben ihr deutsch-tschechisches Fehlerkorpus. Es basiert auf auf vier, von Tschechen verfassten Lehrbüchern der deutschen Sprache, in welche sich Fehler eingeschlichen haben. Der sechste Themenbereich befasst sich mit technischen Verfahren und Konzeptionen im Umfeld der Korpuserstellung und -auswertung. DEREK LEWIS thematisiert die Wechselbeziehung zwischen Korpora und maschineller Übersetzung. MICHAEL SPERBERGMCQUEEN beschäftigt sich mit dem Stand und der Entwicklungsrichtung der Extensible Markup Language XML und damit verwandter Standards. ROY BOGGS zeigt am Beispiel des Hartmann von Aue-Portals die Anforderungen und Möglichkeiten global vernetzter Datenstrukturen.
VIII
Vorwort
Zwei Aufsätze aus den Nachbarwissenschaften schließen den Band ab: WOLF-DIETER SCHÄFER beschreibt ausgehend von einen kurzen Überblick über das menschliche Sehen den Prozess des Lesens und die Auswirkungen von Sehschwächen. Über das Urheberrecht, das zur Zeit im Umbruch ist, informiert JOHANNES PATZELT in einer Skizze der im Jahr 2003 gültigen Rechtsvorschriften. Wir widmen diesen Band dem Würzburger Initiator zahlreicher Korpusprojekte, dem unermüdlichen Fürsprecher einer korpusbasierten Linguistik, unserem Freund und Kollegen NORBERT RICHARD WOLF, der am 19. Februar 2003 seinen 60. Geburtstag gefeiert hat.
Würzburg, im Juli 2005
Johannes Schwitalla Werner Wegstein
Literatur: MOSER, STEPHAN / STAHL, PETER / WEGSTEIN, WERNER / WOLF, NORBERT RICHARD (Hg.)
(2001): Maschinelle Verarbeitung altdeutscher Texte V. Beiträge zum Fünften Internationalen Symposion, Würzburg 4.-6. März 1997. Tübingen. WOLF, NORBERT RICHARD (2004): Plädoyer für eine Korpuslinguistik. In: Germanistik im Spiegel der Generationen. Festschrift für Prof. PhDr. ZDEN£K MASARIK, DrSc. zu seinem 75. Geburtstag. Hg. von IVA KRATOCHVILOVÄ. Opava, 132-140.
Inhalt
GRUNDSATZFRAGEN Ernst Burgschmidt Englische Korpora: Welche eignen sich wozu?
1
Christian Mair Tracking Ongoing Grammatical Change and Recent Diversification in Present-day Standard English: The Complementary Role of Small and Large Corpora
9
Anthony McEnery / Zhonghua Xiao A Corpus-based Approach to Tense and Aspect in English-Chinese Translation
27
Ahti Jäntti Korpus und Grammatik: Neue Perspektiven?
51
KORPUSLINGUISTIK SYNCHRON Rainer Perkuhn / Cyril Belica / Doris al-Wadi / Meike Lauer / Kathrin Steyer / Christian Weiß Korpustechnologie am Institut für Deutsche Sprache
57
Werner Kallmeyer / Wilfried Schütte Der Umgang mit Gesprächskorpora am IDS Mannheim: Die Recherche in der COSMAS-II-Gesprächsdatenbank
71
Peter Eisenberg / Wolfgang Lezius / George Smith Die Grammatik des TIGER-Korpus
81
Angelika Feine / Mechthild Habermann Eine korpusgestützte Analyse zur deutschen Fremd-Wortbildung. Möglichkeiten und Grenzen
89
X Norbert Dittmar / Jana Bressem Syntax, Semantik und Pragmatik des kausalen Konnektors weil im Berliner ,Wendekorpus' der neunziger Jahre
Inhalt
99
Irmgard Elter Genitiv versus Dativ. Die Rektion der Präpositionen wegen, während, trotz, statt und dank in der aktuellen Zeitungssprache
125
Ilka Mindt Learner English: Ein Überblick über vorhandene Korpora und mögliche Forschungsansätze. Die Aussprache der englischen Vokale /e/ und /ae/ von deutschen Muttersprachlern
137
Kirsi Pakkanen-Kilpiä Indizien für einen systematischen Überprüfungsbedarf der grammatischen Beschreibung
147
Gyung-Uk Kim Ist trinkfreudig eine Zusammensetzung oder eine Ableitung? Ergebnisse aus Recherchen in gegenwartssprachlichen Korpora der deutschen Standardsprache
155
KORPUSLINGUISTIK DIACHRON
Heinrich Heftrich Vedische und deutsche Kasus im Kontrast: Der Akkusativ
163
Eckhard Meineke Morphosemantik der derivierten Substantive im Althochdeutschen und Altniederdeutschen. Überlegungen zu einem Forschungsprojekt
173
Franz Simmler Zur Bedeutung textsortengebundener Materialkorpora für die Erforschung der deutschen Sprachgeschichte
189
Lenka Vankova Frühneuhochdeutsche medizinische Korpora in Tschechien: Das ,01mützer medizinische Korpus'
201
Inhalt
XI
KORPUSLINGUISTIK KONTRASTIV
Christine Heiss / Marcello Soffritti Parallelkorpora .gesprochener' Sprache aus Filmdialogen? Ein multimedialer Ansatz für das Sprachenpaar Deutsch - Italienisch
207
Nelleke Oostdijk The Annotation of Multilingual Corpora. Challenges and Opportunities
219
Cathrine Fabricius-Hansen Das Oslo Multilingual Korpus (OMC). Eine Kurzdarstellung
229
KORPUSPROJEKTE
Leena Kolehmainen / Peter Stahl Übersetzungsuniversalien, Sprachtypologie und Textsortenspezifik: Beobachtungen an Hand des finnisch-deutschen FiWe-Korpus
235
Maria Katarzyna Lasatowicz Ein Spracharchiv der in Oberschlesien gesprochenen deutschen Sprache. Sozialgeschichtliche und kulturgeschichtliche Aspekte
245
Daniela Pelka / Felicja Ksi^zyk Ein Korpus zur Untersuchung des deutsch-polnischen Sprachkontaktes in Oberschlesien
251
Idalete Dias Das deutsch-portugiesische PORTDE-Korpus
255
Sergej Dubinin / Sergej Vadyaev / Julia Smolskaja Probleme und Schwerpunkte eines modernen russisch-deutschen Textkorpus
259
Astrid Stedje Was die Versprachlichung ethischer Konzepte im Inneren zusammenhält - ein kognitiv basiertes Beschreibungsmodell
267
Anita Malmqvist Sammelwut und Wegwerjmanie. Zur Versprachlichung von ,Laster' als Übertreibung im Deutschen und Schwedischen
273
XII
Iva Kratochvilovä / Karsten Rinas Das deutsch-tschechische Fehlerkorpus. Ein Projekt zur systematischen Erfassung der häufigsten Interferenzfehler tschechischer Sprecher
Inhalt
277
TECHNISCHE VERFAHREN
Derek Lewis Using Corpora in Machine Assisted Translation
281
C. Michael Sperberg-McQueen Perspectives on XML
287
Roy A. Boggs Quo Vadimus: Sharing Data in a Very Large Arena
311
NACHBARWISSENSCHAFTEN
Johannes Patzelt Urheberrecht
319
Wolf-Dieter Schäfer Sehen - Lesen - Verstehen
327
Ernst
Burgschmidt
Englische Korpora: Welche eignen sich wozu?
1. EDV-gestützte Korpora und andere Korpora Die EDV-gestützte Korpuslinguistik ist aus der theoretischen wie angewandten Sprachwissenschaft der letzten 30 Jahre nicht mehr wegzudenken. Besonders fur den englischsprachigen Bereich sind Grammatiken und Lexika besonders der Verlage Longman, Collins, Oxford University Press u. a. auf immer umfangreicher werdenden elektronisch nutzbaren und großenteils mit Tags versehenen Textmengen aufgebaut. Dabei sind nach der anfänglichen „magischen Zahl" 1 Million Wörter im Brown University Corpus und im Lancaster-Oslo/Bergen-Corpus {LOB) längst Hunderte von Millionen Wörtern erreicht, wie in der Bank of English (vergleichbar dazu die Deutsche Textbörse) für die Lexika des Collins Verlags, verbunden zu der Birmingham Collection of English Texts an der University of Birmingham (COBUILD), weiterhin wie im British National Corpus, dem Longman Corpus Network und der Longman Examples Bank. Teilweise direkt abrufbar oder durch Elicitation und Tests weiter validiert sind Satz-Analysen etwa im International Corpus of English {ICE) mit seinen Tausenden von ,parse trees' oder in Grammatiken wie der CGEL. Gesprochene Materialien sind zuerst mit dem London-Lund-Corpus und dem Lancaster!IBM Spoken English Corpus {SEC) zugänglich gemacht worden, wobei ersteres stärker umgangssprachliche Diskussionen und Gespräche, letzteres eher förmlichere Monologe und Dialoge enthält.1 Bei aller Begeisterung fur diese rasante Entwicklung, die auch andere Sprachen wie das Deutsche und historische Perioden wie Mittelenglisch {Helsinki Corpus of English Texts. Diachronic Part) oder Frühneuenglisch {Lampeter Corpus of Early Modern English) sowie zahlreiche Varianten des weltweiten Englisch erfasst hat, darf aber nicht vergessen werden, dass auch früher und noch jetzt viele Studien zur Sprache einzelner Autoren, spezieller Perioden und Stile, zu Dialekten und satz- wie textübergreifenden Phänomenen auf ebenfalls sehr präziser, wenn auch manuell erstellter Korpusbasis erarbeitet wurden. Der Vorteil der Korpuslinguistik liegt auf der zunehmenden Quantität des Materials, der Schnelligkeit des Zugriffs, auf der Möglichkeit des automatischen Tagging und der möglichen TextBandbreite. Doch gibt es auch Nachteile. In polyfunktionalen Bereichen (z.B. -ing-Formen, Infinitive ohne to), bei diskontinuierlichen morphologischen, syntaktischen und kollokationellen Bezügen, besonders aber auch bei satzübergreifenden Phänomen gibt es erhebliche Schwierigkeiten im Zugriff und in der Skopus-Bestimmung. Textsorten und Stile, die ja
Einen umfassenden Überblick über weitere vorhandene maschinenlesbare Korpora zum Englischen gibt David Lee's Bookmarks for Corpus-based Linguistics (http://devoted.to/corpora.). Es wird hier darauf verzichtet, die bekannten Corpora im Einzelnen bibliographisch zu spezifizieren.
2
Burgschmidt
durch linguistisch beschreibbare Merkmale konstituiert werden, entziehen sich trotz Zitatangabe der einzelnen Sätze oft einer schnellen Übersicht. Da die Textwahl der großen Korpora eher einer statistisch verwendbaren Portionierung von Sachgebieten folgt denn einer Zusammenfassung von Texttypen oder Textformen, sind hier dann manchmal für solche Fragestellungen langwierige und aufwendige Wege einzuschlagen. Text-Haltungen und Pragmatik sind ebenfalls korpusmäßig (noch) schlecht zu untersuchen, wenn es sich um mehr als einzelne Floskeln handelt.
2. Korpora für
V-ingl-ingly
Im Folgenden wird der Versuch unternommen zu zeigen, wie allgemeine Korpusergebnisse, gewonnen aus dem LOB,2 eingeschätzt und modifiziert werden sollten. Beispielbereiche sind (echte) deverbale Adjektiva mit -zng-Suffix und davon abgeleitete, eventuell zusätzlich mit un- präfigierte -mg(y-Adverbien (z. B. interestinglly). Für die entsprechenden Adjektive ist es zuerst nicht ganz einfach, im LOB das Material aufzuschlüsseln, da die -zMg-Form ja neben deverbalen Adjektiven auch reine Partizipien, Gerundien und Verbalsubstantiva bilden kann. Das Users' Manual diskutiert in Abschnitt 7.4 (1986, pp. 35-48) die -ing-Form und die Vergabe der Tags VBG, JJ, NN und RB. JJ wäre Adjektivstatus; es finden sich nun aber im Korpus zahlreiche einfache und zusammengesetzte -wg-Formen in attributiver (= pränominaler) Stellung, die eher partizipial zu interpretieren sind und die üblichen Adjektivkriterien (Steigerung, Intensivierung, -(y-Ableitung, prädikative Stellung) nicht aufweisen. 3 Es sind im LOB aber auch zahlreiche echte -ing-Adjektiva, die auch in den gängigen Lexika mit mehr oder weniger Berechtigung als eigene Lemmata oder separate Anhänge an Verb-Lemmata aufgeführt sind. Die kollozierenden Nomina sind infolge des eher allgemeinen Textkorpus (vgl. Users' Manual, 1986, p.l) und häufiger Einmal-Belegung nicht sonderlich aussagekräftig. Ähnliches gilt für die -z'«g/y-Adverbien (Kollokation zu Adjektiva oder Verben, bei Disjunct-Verwendung auch Satz), wo aber infolge eindeutiger morphologischer Markierung zumindest das Tag RB unabweisbar und eindeutig ist. Bei den Adjektiven (und in Konsequenz bei den abgeleiteten Adverbien) ergibt sich nun, dass neben den oben genannten grammatischen Merkmalen auch semantische Aspekte für die Einordnung und textuelle Wertung herangezogen werden müssen. Satz-, Phrasen- und Wort-Semantik zeigen eine vielen relevanten Adjektiven eigene Grundstruktur, die im Folgenden nach Nickel adaptiert gegeben wird:4
2
3
4
Es wird sowohl auf das Lancaster-Oslo/Bergen Corpus wie auf das Users' Manual (1986) Bezug genommen. Vgl. den Beleg BEATING JJ with heavily beating heart he reached out and lifted the lid *Adjektiv! Die ausfuhrlichste Beschreibung hierzu findet sich bei Nickel (1968, 150-159); vgl. auch CGEL (1985), Ch.7.15ff. (,participial adjectives') und 17.98 ff. Gpremodification').
Englische Korpora: Welche eignen sich wozu? Subject NP personal concrete, non-personal abstract Clause nominal (+/-finit) e. g. This book Cracking jokes
3
Verb transitiv
Object affected personal
interests amused
the readers. the audience.
Daraus ergibt sich, dass viele solcher Adjektive und vermutlich ihre abgeleiteten Adverbien in einem emotiven und evaluativen Kontext auftreten. Dies führte zu der Überlegung, ein spezielleres Korpus als das LOB fur weitere Beispielbereiche und Textverwendung zu befragen. Im Jahr 1983 wurde vom Verfasser ein Zeitungs-Korpus von ca. 230.000 Wörtern mit Artikeln aus den Bereichen Feuilleton (besonders Musik- und Theater-Rezensionen), Sport (Nachdruck auf Spielerevaluation) und Leitartikel (Politiker-Beurteilung) untersucht. Es zeigte sich, dass viele dieser Texte nur so von relevanten Beispielen Überflossen, auch wenn manche Textstellen nun gelegentlich zu euphorisch oder im Gegensatz dazu zu abwertend oder insgesamt etwas affektiert waren. Dies war nun fur Adverbien noch typischer als fur Adjektive, so dass im Folgenden auch getrennt untersucht wird, obwohl die Verbbasen großenteils gleich sind. Die evaluativen Texte zeigten ein erheblich dichteres, an „Farbe" und an Kollokationen reicheres Angebot. 5
3. Adjektive im evaluativen Korpus Evaluative, wertende Texte vergeben ,Noten', indem sie die Reaktion eines Beurteilers, Rezensenten, eines Publikums oder der allgemeinen Meinung in Bezug auf eine aktive Person (Künstler, Sportler, Politiker) oder seine Performanz (Vorstellung, Ergebnis) charakterisieren. Das verwendete Korpus zeigt eine große Dichte und Bandbreite, besonders auch eine weit gefasste Streuung von ,positiv' bis ,negativ'. Dabei sind die abwertenden Adjektive sogar in der Überzahl (in der Zählung ,type' wie auch ,token'), was die Kritikfreudigkeit der Menschen beweisen mag, aber etwas im Gegensatz zur sonstigen Antonymie-Verteilung etwa bei Dimensionalwörtern und besonders bei Qualitätsadjektiven steht, wo etwa im Wortfeld des „Schönen" wesentlich mehr positive Adjektive (beautiful, pretty, handsome, nice u.a.) dem negativen ugly gegenüberstehen. Ähnliches gilt fur das Wortfeld der „Zuneigung", wo ebenfalls wesentlich mehr positive Verben {love, like, admire etc.) als negative (hate) auftreten. Es sei schon hier angemerkt, dass sich zumindest auf der ,token'-Ebene mehr positive -/'«g/y-Adverbien finden als negative, was ein interessanter und zu interpretierender Gegensatz zu den Adjektiven ist (s. Abschnitt 4). Das evaluative Korpus-Material lässt sich grob in vier unterschiedliche Wertungsbereiche einteilen.
5
Aufgrund der Unsicherheit der VBN- und JJ-Zuweisung im LOB und in Folge der Tatsache, dass das eigene Korpus manuell erstellt wurde, wird hier kein voller prozentueller Vergleich vorgestellt, sondern es werden Tendenzen herausgearbeitet.
4
Burgschmidt
a) POSITIV: absorbing, accommodating, amusing, appetizing, captivating, charming, comforting, convincing, disarming, enchanting, encouraging, endearing, enthralling, enticing, exhilarating, exciting, fascinating, flattering, heartening, illuminating, inspiring, interesting, invigorating, inviting, pleasing, reassuring, refreshing, relaxing, rewarding, satisfying, soothing, uplifting·, b) ERSTAUNEN /+/-: appealing, arresting, astounding, baffling, beguiling, bewildering, breathtaking, devastating, electrifying, fetching, intriguing, startling, stirring, striking, stunning, surprising, tantalising, tempting, thrilling, touching·, c) FORDERUNG: challenging, commanding, compelling, exacting·, d) NEGATIV: agonizing, alarming, annoying, appalling, belittling, boring, chastening, chilling, damaging, damning, daunting, deafening, debilitating, dehumanizing, depressing, devastating, disabling, disappointing, discouraging, disheartening, dispiriting, disquieting, distressing, disturbing, diverting, embarrassing, excruciating, exhausting, forbidding, frightening, frustrating, gruelling, horrifying, humiliating, infuriating, insulting, intimidating, irritating, menacing, misleading, punishing, sickening, sobering, taxing, terrifying, threatening, unedifying, unprepossessing, worrying. Die evaluative Komponente ist vollkommen dominierend, wenn auch angemerkt sein muss, dass nicht alle Adjektive, wie etwa dashing oder lasting, dem beschriebenen syntaktischen Typ angehören. Die Unterschiede zum LOB bestehen in höherer ,token'-Dichte und in einer Verschiebung zu den ,farbigeren' Rändern der Skalen (also weg von .interesting').
4. Adverbien im LOB und im evaluativen Korpus Von vielen der in Abschnitt 3 beschriebenen Adjektive existieren Adverbbildungen. Sie können in zwei Funktionen auftreten: als Disjuncts und als Adjuncts/Subjuncts.6 Zahlreiche relevante Bildungen werden als ,value judgements' verwendet und sind somit Attitudinal Disjuncts (GCE, 1972) oder Content Disjuncts (CGEL, 1985) oder Attitude Stance Adverb(ial)s (LGoSWE, 1999), z.B. annoyingly, disappointingly, disturbingly, pleasingly, refreshingly, amusingly etc. Im LOB mit seinen stärker narrativen und deskriptiven Texten sind sie in dieser Funktion ebenso wenig häufig wie im evaluativen Korpus, da sie eher in argumentativen Texten auftreten. 6
Diese Begriffe stammen aus CGEL (1985). Während die Verwendung von Disjunct eindeutig ist, ist die Abgrenzung von Adjunct und Subjunct besonders bei Verben (nicht so bei Adjektive prämodifizierenden Intensifier-Adverbien) nicht so einfach, vgl. Ch. 8.88 (p. 566): „We apply the term SUBJUNCTS to adverbials which have, to a greater or lesser degree, a subordinate role [...] in comparison with other clause elements". In der ersten Version GCE (1972) ist noch keine Trennung gegeben (Ch. 8.8 ff., pp. 426 ff.), alle relevanten Beispiele sind als Adjuncts klassifiziert; auch die LGoSWE (Ch. 7.14, pp. 552 ff. & 10.2, pp. 776 ff.) fasst alle relevanten Beispiele als Circumstance Adverbs/Adverbials zusammen; Disjuncts werden als Stance Adverbials gelistet.
Englische Korpora: Welche eignen sich wozu?
5
Viel zahlreicher sind generell und besonders im evaluativen Korpus die intensivierenden, positiv wie negativ wertenden Adverbien auf -ingly, wobei im LOB Adjuncts und Subjuncts zu Verben und Subjuncts zu Adjektiven eher gleichmäßig vertreten sind, während im evaluativen Korpus die Prämodifizierung von selbst schon wertenden Adjektiven durch nochmals steigende und skalierende -mg/y-Adverbien vorherrscht. Die evaluativen Texte haben insgesamt eine größere Dichte und Bandbreite an Beispielen, auch wenn in beiden Korpora increasingly und surprisingly (dieses als Disjunct und Subjunct) an der Spitze liegen. Das LOB hat fur -ingly-Adverbien 56 .types' mit insgesamt 132 .tokens' (bei 20 Mehrfachnennungen somit viele Einmal-Vorkommen), während das ja wesentlich kleinere evaluative Korpus 92 .types' mit insgesamt 188 .tokens' bei Mehrfachnennungen aufweist. Die Kollokationen haben erheblich mehr Farbe, vielleicht auch Idiosynkratizität, es ergibt sich eine Tendenz zur delexikalisierten Über- oder Untertreibung, die letztlich alle ein Archi-Adverb very ersetzen können.7 Allerdings behalten die in den evaluativen Texten des Korpus verwendeten -wg/y-Adverbien neben der Steigerung doch viel von ihrer oft expressiven Grundbedeutung (so etwa in deafeningly,
threateningly,
engagingly,
chillingly
u.a.), wenn auch oft eher figurativ. Im Folgenden sollen - auch mit Hilfe einer Skalierungstabelle - einige Beispiele für die Verwendung von -;«g/y-Adverbien gegeben werden, wobei die Skalierung nach der Relation Adverb-Adjektiv (Head) von negativen zu neutralen zu positiven Adjektiven mit der jeweiligen Qualifizierung durch Adverbien erfolgt. In der Tabelle wurden etwas .stärkere' Adverbien als die etwas allgemeinen interestingly und surprisingly gewählt. Da 33 ,types' aber Mehrfachvorkommen zeigen, wird deutlich, wie sehr diese Adverbgruppe die gegebene Textsorte charakterisieren kann. Aus der Semantik der Kollokationen und natürlich auch der Einzelsemantik der Kollokatoren ergibt sich, dass manche Verbindungen nur .negativ' plus .negativ' möglich sind, wie depressingly bad, andere nur .positiv' plus .positiv' wie strikingly beautiful, während manche Bildungen frei verfugbar sind, neben surprisingly (siehe Kategorie .Erstaunen' bei den Adjektiven) etwa exceedingly, alarmingly, breathtakingly u.a.
Insgesamt geben diese -z'wg/y-Adverbien der Bewertung des Beurteilers und in der gegebenen Dichte der Vorkommen einem Text Farbe, wobei ein absoluter, kaum übertreffbarer Höhepunkt in dem folgenden Beispiel aus dem evaluativen Korpus liegen mag, das aus der Beschreibung des Cricket Teams der West Indies 1983 stammt: Lloyd's men will be back to their frighteningly
brilliant best (Τ 15/6/83,24).
Der West Indies ,pace attack' war damals in der Tat durch Schnelligkeit und Kraft .furchterregend', doch erreicht frighteningly durch die Kollokation mit zwei SuperlativWörtern brilliant und best eine zusätzliche und im Abstand von den Ereignissen eher rein positiv verstärkende dritte Steigerungsebene, die kaum überboten werden kann. So können Semantik, Kollokation und Textsorte insgesamt ein allgemeines wie speziell korpuslinguistisch vorhandenes und auffälliges Phänomen über die reine EDV-Erfassung und Quantifizierung hinaus charakterisieren.
7
Auf die Delexikalisierung und Grammatikalisierung hat Lorenz (2002, 143-161) mit zahlreichen Adverb-Beispielen, wenn auch kaum solchen auf -ingly, hingewiesen und dabei die semantischen Kategorien .evaluative', .comparative' und .modal' mit entsprechenden .clines of delexicalisation' postuliert. Der Begriff .evaluativ' wird hier allerdings primär für die Texte verwendet.
Burgschmidt
6
ο oo OS
s C
(Ν
>η
(Ν (Ν
m TJ ο>
ε
α
'S .1
>
1
"3b j>> "M
1
a
υ κ •o
•β
'τΛ
< α
+ £ Ξ ίο >
1> Ζ
ο •Ο C
Μ ο ο J3
1 η "ο §
£ S£« £ ο
,2
Q
CN ο
m
νο
ε
»>
Ui ω •s
ο ο •β τ ο 'Si cd Β
£
5 (Λ g ς Λ 0Η CO υ cU We PP1S2 are_VBR injl a ATI periodNNI of_IO decisive JJ historical JJ significance NN1 forJF Africa NP1 and CC ils APPGE pin ftfj[Nh]^(Nc) Ä[Caa)"R|Nep|fi(P)1tt#(Nc! Kl|DE| jfSlNa) lElDjlitSlVJ)ft®f(Na|#[D] £|VJ)j5jj6|Na] SX(Na) Kl[DE] β) We PPISZ are_VBH determined JfVN that CST lhis_OD1 2lst FO century_NNTl shail_VM be_VBI the_AT Afrlcan_JJ cenfuiy_NNT1 ._. < The AT ideaNNl ofJO an ATI AfricanJJ renaissance NNI has VHZ taken WN hold NNI injl our APPGE continent NNI with IW a #jflf(Nc| ÄÄtVCJ W[DE| ί|»,(Νβ) B|D) (E(P)ftf][Nh)^K|Nc|lL[VC| T(Nes| t
· welchen Stellenwert ha't rechtschreibung denn eigentlich in der schuletr und im deutschunterrichta >bitteschönG