Korpuslinguistik deutsch: synchron - diachron - kontrastiv: Würzburger Kolloquium 2003 9783110924725, 9783484730649

194 82 12MB

German Pages 347 [348] Year 2006

Recommend Papers

Regularität und Irregularität in Phonologie und Morphologie: Diachron, kontrastiv, typologisch 9783110486094, 9783110485066

Based on phonological and morphological phenomena in German, the authors explore the relationship between regularity and

148 29 12MB Read more

Regularität und Irregularität in Phonologie und Morphologie: Diachron, kontrastiv, typologisch 9783110486094, 9783110485066

Based on phonological and morphological phenomena in German, the authors explore the relationship between regularity and

177 82 4MB Read more

Althochdeutsches Wörterbuch. Beiband Die althochdeutschen Adjektive auf -aht(i)/-oht(i): Eine diachron- und synchron-vergleichende Untersuchung 9783110794892, 9783110793567

This volume is the first to provide a complete morphological, semantic, and syntactic analysis of Old High German adject

139 8 2MB Read more

Phonetik des Deutschen: Eine kontrastiv deutsch-niederländische Beschreibung für den Zweitspracherwerb 9783111556925, 9783111186542

149 35 13MB Read more

Spanisch / Portugiesisch kontrastiv 9783110273861, 9783110253818

Neues Studienbuch This book presents an in-depth comparison of two Romance languages. The authors analyze Spanish and

144 100 17MB Read more

August Graf von Platen im Horizont seiner Wirkungsgeschichte: Ein deutsch-italienisches Kolloquium 9783110263497, 9783110263480

The reception history of the controversial author, who was stigmatized due to his homosexuality, has been made the subje

148 43 4MB Read more

Fortgeschrittene Lernervarietäten: Korpuslinguistik und Zweitsprachenerwerbsforschung 9783484305205, 9783484970342

This collected volume presents papers dealing with the language behaviour of advanced learners of a foreign language. In

178 39 2MB Read more

Liebe und Macht in der deutsch-amerikanischen Sicherheitsbeziehung 2001-2003: Eine kritisch-realistische Diskursanalyse 9783839435878

How can the change in the German-American security structure between the war in Afghanistan in 2001 and the war in Iraq

126 81 6MB Read more

Der Élysée-Vertrag und die deutsch-französischen Beziehungen 1945 - 1963 - 2003 9783486836783, 9783486576788

Der 40. Geburtstag des Élysée-Vertrages im Jahre 2003 war Anlass zu deutsch-französischen Feierlichkeiten, die wie nie z

155 97 14MB Read more

Philosophie und Mythos: Ein Kolloquium 9783110862195, 9783110076011

160 84 7MB Read more

Korpuslinguistik deutsch: synchron - diachron - kontrastiv: Würzburger Kolloquium 2003
9783110924725, 9783484730649

Author / Uploaded
Johannes Schwitalla (editor)
Werner Wegstein (editor)

0 0 0
Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up

File loading please wait...

Citation preview

Korpuslinguistik deutsch: synchron - diachron - kontrastiv

Korpuslinguistik deutsch: synchron - diachron - kontrastiv Würzburger Kolloquium 2003

Herausgegeben von Johannes Schwitalla und Werner Wegstein

Max Niemeyer Verlag, Tübingen 2005

Bibliographische Information der Deutschen Bibliothek Die Deutsche Bibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliographie; detaillierte bibliographische Daten sind im Internet über http://dnb. ddb. de abrufbar. ISBN 13: 9783-484-73064-9

ISBN 10: 3-484-73064-1

© Max Niemeyer Verlag, Tübingen 2005 Ein Unternehmen der K. G. Saur Verlag GmbH, München http:/Avww. niemeyer. de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Printed in Germany. Gedruckt auf alterungsbeständigem Papier. Druck und Einband: ΑΖ Druck und Datentechnik GmbH, Kempten

Vorwort

Im Gegensatz zur Geschichts- und Literaturwissenschaft hat sich die Linguistik erst relativ spät um eine eigene ,Quellenkunde' gekümmert (Wolf 2004, 133). Das änderte sich erst, seitdem mit dem Tonband gesprochene Texte konserviert und durch den Einsatz der elektronischen Datenverarbeitung große Mengen von Texten maschinell lesbar gemacht werden können. Der Lehrstuhl für Deutsche Sprachwissenschaft der Universität Würzburg hat sich seit den 80er Jahren Fragen der maschinellen Aufarbeitung von Texten gewidmet. Zunächst ging es hauptsächlich um die Erschließung großer Textmengen aus der Zeit des Frühneuhochdeutschen. Zu dieser Thematik richtete das Institut für deutsche Philologie im März 1997 das Fünfte Internationale Symposion zur maschinellen Verarbeitung altdeutscher Texte aus (Moser/Stahl/Wegstein/Wolf 2001). Parallel dazu wurden von Würzburg aus auch einige kontrastive Korpora initiiert, so das deutsch-finnische FiNDE-Korpus mit Kolleginnen und Kollegen der Universitäten Jyväskylä, Turku und Helsinki, das deutschportugiesische PORTDE-Korpus mit einem Team an der Universität Braga und ein deutschtschechisches Korpus mit den germanistischen Lehrstühlen der Universitäten in Opava und Ostrava. Ein deutsch-niederländisches und ein deutsch-polnisches Korpus sind in Arbeit, ein deutsch-russisches Korpus ist geplant. Hierzu veranstaltete der Lehrstuhl für deutsche Sprachwissenschaft vom 20. bis 23. Februar 2003 ein internationales Kolloquium mit dem Titel ,Korpuslinguistik deutsch 2003: synchron, diachron, kontrastiv', das von der Deutschen Forschungsgemeinschaft (DFG) und dem Bayerischen Staatsministerium für Wissenschaft, Forschung und Kunst finanziell gefordert wurde. Beiden Institutionen gebührt an dieser Stelle unser ganz besonderer Dank, denn ohne ihre verständnisvolle Förderung hätte das Kolloquium mit seiner internationalen Ausrichtung nicht stattfinden können. Für die Mitwirkung bei der Drucklegung der Beiträge danken wir Frau Monika Wojcicka und Frau Mirjam Blümm MA. Der Untertitel des Bandes - ,synchron, diachron, kontrastiv' - deutet schon die thematische Ausrichtung des Kolloquiums an: die Diskussion über Erfahrungen auf dem Gebiet der aktuellen Korpusarbeit mit historischen und gegenwartssprachlichen deutschen Texten und mit sprachkontrastiven Korpora. Damit sollen erreichte Standards gesichert und Perspektiven für neue Fragestellungen eröffnet werden. Die Computertechnologie hat in den vergangenen Jahren solch rasante Fortschritte gemacht, dass ein Austausch von Korpuslinguisten über ihre Arbeiten dringend geboten ist. Auch grundsätzliche Fragen sollen im Lichte der nun schon an vielen Universitäten und Forschungseinrichtungen etablierten Korpuslinguistik diskutiert werden. Die Ergebnisse des Kolloquiums legen wir mit diesem Band vor.

VI

Vorwort

Im ersten Teil sind alle Aufsätze zu Grundsatzfragen der Korpuslinguistik versammelt. ERNST BURGSCHMIDT weist am Beispiel englischer Adjektive mit dem Suffix -ing und deren abgeleiteter Adverbien auf -ingly nach, dass kleinere, spezifisch zusammengestellte Korpora ergiebiger sein können als die sehr großen Korpora. Aus einer ähnlichen Motivation plädiert CHRISTIAN MAIR dafür, dass es sinnvoll ist, die gewaltigen Textmassen des World-Wide-Web für linguistische Fragestellungen auszunützen; er demonstriert dies am gef-Passiv. TONY McENERY zeigt am Beispiel der Untersuchung von Tempus und Aspekt an einem englisch-chinesischen Parallelkorpus den Wert paralleler Korpora für Übersetzungsstudien und die maschinelle bzw. maschinengestützte Übersetzung. AHTI JÄNTTI fordert mit Blick auf die bestehenden Grammatiken des Deutschen die Einbeziehung von Korpora bei der Formulierung grammatischer Regeln. Im zweiten Teil,,Korpuslinguistik synchron', werden synchrone Korpora vorgestellt und es wird mit beispielhaften Analysen demonstriert, wie Korpusauswertungen zu neuen linguistischen Einsichten führen können. RAINER PERKUHN, CYRIL BELICA, DORIS ALWADI, MEDCE LAUER, KATHRIN STEYER und CHRISTIAN WEIB beschreiben eine Reihe von öffentlich zugänglichen Korpora geschriebener Texte des Instituts für Deutsche Sprache (IDS) in Mannheim. WERNER KALLMEYER und WILFRIED SCHÜTTE führen am Beispiel von aber vor, wie die Suche an den Gesprächskorpora des IDS abläuft und welche Resultate damit zu erzielen sind. PETER EISENBERG, WOLFGANG LEZIUS und GEORGE SMITH stellen ihr grammatisch annotiertes TIGER-Korpus aus Texten der ,Frankfurter Rundschau' vor und erläutern, wie Strukturbeschreibungen und Korpusabfrage ineinandergreifen. ANGELIKA FEINE und MECHTHILD HABERMANN plädieren für eine korpusbasierte Erforschung von Wortbildungen mit Konfixen aus anderen Sprachen und zeigen mit Hilfe des COSMAS-II-Korpus des IDS, wie die Bildungen auf -manie zwischen 1994 und 2000 zuerst stark zunahmen, dann aber wieder zurückgingen. NORBERT DITTMAR und JANA BRESSEM überprüfen anhand des Berliner Wendekorpus (56 Interviews mit Ost- und Westberlinern zum Fall der Mauer am 9. 11. 1989) einige Hypothesen zu weil mit Verbzweitstellung und sprechen sich für die Behandlung von weil + V2 als Diskursmarker aus. IRMGARD ELTER untersucht auf der Grundlage eines frei zusammengestellten Korpus von Zeitungstexten aus dem Internet die Rektionen der Präpositionen wegen, während, trotz, statt und dank mit Dativ, die insgesamt selten sind und, sofern sie vorkommen, einen umgangssprachlichen Hintergrund anzeigen. ILKA MENDT führt in den Bereich der LernerKorpora ein und stellt eine Fallstudie zur Aussprache englischer Vokale von deutschen Muttersprachlern vor. KIRSL PAKKANEN-KILPIÄ hinterfragt an drei Beispielen die in Grammatiken behaupteten Verwendungsbeschränkungen in Fällen, in denen in großen Korpora eben diese Verwendungen ohne ein Merkmal von Fehlerhaftigkeit belegt sind. GYUNG U K KIM benutzt die Mannheimer Korpora und das Bonner Korpus des IDS, um Belege für Wortbildungen mit -arm, -fertig, -fest und -frei in Graduierungen von Komposita (vitaminarm) und Suffixableitungen (bügelarm) zu differenzieren. Den dritten Bereich, ,Korpuslinguistik diachron', bilden Aufsätze über historische Korpora und damit verbundene linguistische Fragestellungen. Wir haben sie hier in der chronologischen Reihenfolge der Sprachstufen angeordnet. HEINRICH HETTRICH stellt eine korpusbasierte kontrastive Studie zum Akkusativ im Vedischen und Deutschen vor. ECKHART MEINEKE entwickelt Überlegungen für ein Korpusprojekt zur Beschreibung der Semantik

Vorwort

VII

der derivierten Substantive im Althochdeutschen und Altniederdeutschen. FRANZ SIMMLER fordert die Erstellung textsorteneinheitlicher Korpora in Form von Dokumentationen eines Textes oder eines Textensembles (Bibel) über mehrere Jahrhunderte hinweg und argumentiert gegen die Verwendung normierter Textausschnitte (z.B. die ersten 30 Seiten) als Untersuchungsgrundlage, weil damit nicht gesichert ist, dass die ganze Varianz eines sprachlichen Phänomens erfasst wird. Er zeigt dies am Beispiel der Adjektivmorphologie. LENKA VANKOVÄ stellt das ,01mützer medizinische Korpus' vor, das aus fünf Texten unterschiedlicher Textsorten besteht. Die Reihe der Arbeiten zum Themenbereich ,Korpuslinguistik kontrastiv' eröffnen CHRISTINE HEISS und MARCELLO SOFFRITTI mit einer Studie über die Nutzung von Parallelkorpora auf der Basis von Filmdialogen für das Sprachenpaar Deutsch - Italienisch. NELLEKE OOSTDIJK zeigt an Beispielen aus dem Bereich multilingualer Korpora Formen und Modelle der Korpusannotation mit Schwerpunkt auf den Sprachen Niederländisch und Englisch. CATHRINE FABRICIUS-HANSEN stellt das Oslo Multilingual Corpus vor, das Sprachvergleiche zwischen Norwegisch, Englisch, Deutsch und (nach Plan) Französisch in fiktionalen und nicht-fiktionalen Texten mit den jeweiligen Übersetzungen erlaubt. LEENA KOLEHMAINEN und PETER STAHL liefern schließlich einige Beobachtungen zu Übersetzungsuniversalien, zur Sprachtypologie und zur Textsortenspezifik am Beispiel des finnisch-deutschen FLNDE-Korpus. Der fünfte Themenbereich präsentiert in kurzen Berichten aktuelle Korpusprojekte, die Deutsch als Vergleichssprache haben. MARIA KATARZYNA LASATOWICZ beschreibt ihre Korpusarbeiten zur Dokumentation des gegenwärtig in Schlesien gesprochenen Deutsch und des Wasserpolnischen. DANIELA PELKA und FELICJA KSI^ZYK berichten von ihrem Projekt über Auswirkungen des Sprachkontakts bei Deutsch und Polnisch sprechenden Personen in Oberschlesien. IDALETE DIAS skizziert das Kodierungskonzept des im Aufbau begriffenen deutsch-portugiesischen PORTDE-Korpus, das mit einem Roman von Jose Saramago und dessen deutscher Übersetzung beginnt. SERGEJ DUBININ, SERGEY VADYAEV und JULIA SMOLSKAJA beschäftigen sich mit den Problemen eines deutsch-russischen Parallelkorpus mit modernen Texten und erläutern ein Arbeitsmodell. ASTRID STEDJE stellt ein semantisches Modell für Tugenden und Laster vor, das man aufgrund von Korpora mit Texten aus unterschiedlichen Kulturen vergleichen kann. ANITA MALMQVIST hat aus deutschen und schwedischen Korpora Komposita gesammelt, welche das Übersteigerte einer menschlichen Eigenschaft ausdrücken. IVA KRATOCHVILOVÄ und KARSTEN RINAS beschreiben ihr deutsch-tschechisches Fehlerkorpus. Es basiert auf auf vier, von Tschechen verfassten Lehrbüchern der deutschen Sprache, in welche sich Fehler eingeschlichen haben. Der sechste Themenbereich befasst sich mit technischen Verfahren und Konzeptionen im Umfeld der Korpuserstellung und -auswertung. DEREK LEWIS thematisiert die Wechselbeziehung zwischen Korpora und maschineller Übersetzung. MICHAEL SPERBERGMCQUEEN beschäftigt sich mit dem Stand und der Entwicklungsrichtung der Extensible Markup Language XML und damit verwandter Standards. ROY BOGGS zeigt am Beispiel des Hartmann von Aue-Portals die Anforderungen und Möglichkeiten global vernetzter Datenstrukturen.

VIII

Vorwort

Zwei Aufsätze aus den Nachbarwissenschaften schließen den Band ab: WOLF-DIETER SCHÄFER beschreibt ausgehend von einen kurzen Überblick über das menschliche Sehen den Prozess des Lesens und die Auswirkungen von Sehschwächen. Über das Urheberrecht, das zur Zeit im Umbruch ist, informiert JOHANNES PATZELT in einer Skizze der im Jahr 2003 gültigen Rechtsvorschriften. Wir widmen diesen Band dem Würzburger Initiator zahlreicher Korpusprojekte, dem unermüdlichen Fürsprecher einer korpusbasierten Linguistik, unserem Freund und Kollegen NORBERT RICHARD WOLF, der am 19. Februar 2003 seinen 60. Geburtstag gefeiert hat.

Würzburg, im Juli 2005

Johannes Schwitalla Werner Wegstein

Literatur: MOSER, STEPHAN / STAHL, PETER / WEGSTEIN, WERNER / WOLF, NORBERT RICHARD (Hg.)

(2001): Maschinelle Verarbeitung altdeutscher Texte V. Beiträge zum Fünften Internationalen Symposion, Würzburg 4.-6. März 1997. Tübingen. WOLF, NORBERT RICHARD (2004): Plädoyer für eine Korpuslinguistik. In: Germanistik im Spiegel der Generationen. Festschrift für Prof. PhDr. ZDEN£K MASARIK, DrSc. zu seinem 75. Geburtstag. Hg. von IVA KRATOCHVILOVÄ. Opava, 132-140.

Inhalt

GRUNDSATZFRAGEN Ernst Burgschmidt Englische Korpora: Welche eignen sich wozu?

1

Christian Mair Tracking Ongoing Grammatical Change and Recent Diversification in Present-day Standard English: The Complementary Role of Small and Large Corpora

9

Anthony McEnery / Zhonghua Xiao A Corpus-based Approach to Tense and Aspect in English-Chinese Translation

27

Ahti Jäntti Korpus und Grammatik: Neue Perspektiven?

51

KORPUSLINGUISTIK SYNCHRON Rainer Perkuhn / Cyril Belica / Doris al-Wadi / Meike Lauer / Kathrin Steyer / Christian Weiß Korpustechnologie am Institut für Deutsche Sprache

57

Werner Kallmeyer / Wilfried Schütte Der Umgang mit Gesprächskorpora am IDS Mannheim: Die Recherche in der COSMAS-II-Gesprächsdatenbank

71

Peter Eisenberg / Wolfgang Lezius / George Smith Die Grammatik des TIGER-Korpus

81

Angelika Feine / Mechthild Habermann Eine korpusgestützte Analyse zur deutschen Fremd-Wortbildung. Möglichkeiten und Grenzen

89

X Norbert Dittmar / Jana Bressem Syntax, Semantik und Pragmatik des kausalen Konnektors weil im Berliner ,Wendekorpus' der neunziger Jahre

Inhalt

99

Irmgard Elter Genitiv versus Dativ. Die Rektion der Präpositionen wegen, während, trotz, statt und dank in der aktuellen Zeitungssprache

125

Ilka Mindt Learner English: Ein Überblick über vorhandene Korpora und mögliche Forschungsansätze. Die Aussprache der englischen Vokale /e/ und /ae/ von deutschen Muttersprachlern

137

Kirsi Pakkanen-Kilpiä Indizien für einen systematischen Überprüfungsbedarf der grammatischen Beschreibung

147

Gyung-Uk Kim Ist trinkfreudig eine Zusammensetzung oder eine Ableitung? Ergebnisse aus Recherchen in gegenwartssprachlichen Korpora der deutschen Standardsprache

155

KORPUSLINGUISTIK DIACHRON

Heinrich Heftrich Vedische und deutsche Kasus im Kontrast: Der Akkusativ

163

Eckhard Meineke Morphosemantik der derivierten Substantive im Althochdeutschen und Altniederdeutschen. Überlegungen zu einem Forschungsprojekt

173

Franz Simmler Zur Bedeutung textsortengebundener Materialkorpora für die Erforschung der deutschen Sprachgeschichte

189

Lenka Vankova Frühneuhochdeutsche medizinische Korpora in Tschechien: Das ,01mützer medizinische Korpus'

201

Inhalt

XI

KORPUSLINGUISTIK KONTRASTIV

Christine Heiss / Marcello Soffritti Parallelkorpora .gesprochener' Sprache aus Filmdialogen? Ein multimedialer Ansatz für das Sprachenpaar Deutsch - Italienisch

207

Nelleke Oostdijk The Annotation of Multilingual Corpora. Challenges and Opportunities

219

Cathrine Fabricius-Hansen Das Oslo Multilingual Korpus (OMC). Eine Kurzdarstellung

229

KORPUSPROJEKTE

Leena Kolehmainen / Peter Stahl Übersetzungsuniversalien, Sprachtypologie und Textsortenspezifik: Beobachtungen an Hand des finnisch-deutschen FiWe-Korpus

235

Maria Katarzyna Lasatowicz Ein Spracharchiv der in Oberschlesien gesprochenen deutschen Sprache. Sozialgeschichtliche und kulturgeschichtliche Aspekte

245

Daniela Pelka / Felicja Ksi^zyk Ein Korpus zur Untersuchung des deutsch-polnischen Sprachkontaktes in Oberschlesien

251

Idalete Dias Das deutsch-portugiesische PORTDE-Korpus

255

Sergej Dubinin / Sergej Vadyaev / Julia Smolskaja Probleme und Schwerpunkte eines modernen russisch-deutschen Textkorpus

259

Astrid Stedje Was die Versprachlichung ethischer Konzepte im Inneren zusammenhält - ein kognitiv basiertes Beschreibungsmodell

267

Anita Malmqvist Sammelwut und Wegwerjmanie. Zur Versprachlichung von ,Laster' als Übertreibung im Deutschen und Schwedischen

273

XII

Iva Kratochvilovä / Karsten Rinas Das deutsch-tschechische Fehlerkorpus. Ein Projekt zur systematischen Erfassung der häufigsten Interferenzfehler tschechischer Sprecher

Inhalt

277

TECHNISCHE VERFAHREN

Derek Lewis Using Corpora in Machine Assisted Translation

281

C. Michael Sperberg-McQueen Perspectives on XML

287

Roy A. Boggs Quo Vadimus: Sharing Data in a Very Large Arena

311

NACHBARWISSENSCHAFTEN

Johannes Patzelt Urheberrecht

319

Wolf-Dieter Schäfer Sehen - Lesen - Verstehen

327

Ernst

Burgschmidt

Englische Korpora: Welche eignen sich wozu?

1. EDV-gestützte Korpora und andere Korpora Die EDV-gestützte Korpuslinguistik ist aus der theoretischen wie angewandten Sprachwissenschaft der letzten 30 Jahre nicht mehr wegzudenken. Besonders fur den englischsprachigen Bereich sind Grammatiken und Lexika besonders der Verlage Longman, Collins, Oxford University Press u. a. auf immer umfangreicher werdenden elektronisch nutzbaren und großenteils mit Tags versehenen Textmengen aufgebaut. Dabei sind nach der anfänglichen „magischen Zahl" 1 Million Wörter im Brown University Corpus und im Lancaster-Oslo/Bergen-Corpus {LOB) längst Hunderte von Millionen Wörtern erreicht, wie in der Bank of English (vergleichbar dazu die Deutsche Textbörse) für die Lexika des Collins Verlags, verbunden zu der Birmingham Collection of English Texts an der University of Birmingham (COBUILD), weiterhin wie im British National Corpus, dem Longman Corpus Network und der Longman Examples Bank. Teilweise direkt abrufbar oder durch Elicitation und Tests weiter validiert sind Satz-Analysen etwa im International Corpus of English {ICE) mit seinen Tausenden von ,parse trees' oder in Grammatiken wie der CGEL. Gesprochene Materialien sind zuerst mit dem London-Lund-Corpus und dem Lancaster!IBM Spoken English Corpus {SEC) zugänglich gemacht worden, wobei ersteres stärker umgangssprachliche Diskussionen und Gespräche, letzteres eher förmlichere Monologe und Dialoge enthält.1 Bei aller Begeisterung fur diese rasante Entwicklung, die auch andere Sprachen wie das Deutsche und historische Perioden wie Mittelenglisch {Helsinki Corpus of English Texts. Diachronic Part) oder Frühneuenglisch {Lampeter Corpus of Early Modern English) sowie zahlreiche Varianten des weltweiten Englisch erfasst hat, darf aber nicht vergessen werden, dass auch früher und noch jetzt viele Studien zur Sprache einzelner Autoren, spezieller Perioden und Stile, zu Dialekten und satz- wie textübergreifenden Phänomenen auf ebenfalls sehr präziser, wenn auch manuell erstellter Korpusbasis erarbeitet wurden. Der Vorteil der Korpuslinguistik liegt auf der zunehmenden Quantität des Materials, der Schnelligkeit des Zugriffs, auf der Möglichkeit des automatischen Tagging und der möglichen TextBandbreite. Doch gibt es auch Nachteile. In polyfunktionalen Bereichen (z.B. -ing-Formen, Infinitive ohne to), bei diskontinuierlichen morphologischen, syntaktischen und kollokationellen Bezügen, besonders aber auch bei satzübergreifenden Phänomen gibt es erhebliche Schwierigkeiten im Zugriff und in der Skopus-Bestimmung. Textsorten und Stile, die ja

Einen umfassenden Überblick über weitere vorhandene maschinenlesbare Korpora zum Englischen gibt David Lee's Bookmarks for Corpus-based Linguistics (http://devoted.to/corpora.). Es wird hier darauf verzichtet, die bekannten Corpora im Einzelnen bibliographisch zu spezifizieren.

2

Burgschmidt

durch linguistisch beschreibbare Merkmale konstituiert werden, entziehen sich trotz Zitatangabe der einzelnen Sätze oft einer schnellen Übersicht. Da die Textwahl der großen Korpora eher einer statistisch verwendbaren Portionierung von Sachgebieten folgt denn einer Zusammenfassung von Texttypen oder Textformen, sind hier dann manchmal für solche Fragestellungen langwierige und aufwendige Wege einzuschlagen. Text-Haltungen und Pragmatik sind ebenfalls korpusmäßig (noch) schlecht zu untersuchen, wenn es sich um mehr als einzelne Floskeln handelt.

2. Korpora für

V-ingl-ingly

Im Folgenden wird der Versuch unternommen zu zeigen, wie allgemeine Korpusergebnisse, gewonnen aus dem LOB,2 eingeschätzt und modifiziert werden sollten. Beispielbereiche sind (echte) deverbale Adjektiva mit -zng-Suffix und davon abgeleitete, eventuell zusätzlich mit un- präfigierte -mg(y-Adverbien (z. B. interestinglly). Für die entsprechenden Adjektive ist es zuerst nicht ganz einfach, im LOB das Material aufzuschlüsseln, da die -zMg-Form ja neben deverbalen Adjektiven auch reine Partizipien, Gerundien und Verbalsubstantiva bilden kann. Das Users' Manual diskutiert in Abschnitt 7.4 (1986, pp. 35-48) die -ing-Form und die Vergabe der Tags VBG, JJ, NN und RB. JJ wäre Adjektivstatus; es finden sich nun aber im Korpus zahlreiche einfache und zusammengesetzte -wg-Formen in attributiver (= pränominaler) Stellung, die eher partizipial zu interpretieren sind und die üblichen Adjektivkriterien (Steigerung, Intensivierung, -(y-Ableitung, prädikative Stellung) nicht aufweisen. 3 Es sind im LOB aber auch zahlreiche echte -ing-Adjektiva, die auch in den gängigen Lexika mit mehr oder weniger Berechtigung als eigene Lemmata oder separate Anhänge an Verb-Lemmata aufgeführt sind. Die kollozierenden Nomina sind infolge des eher allgemeinen Textkorpus (vgl. Users' Manual, 1986, p.l) und häufiger Einmal-Belegung nicht sonderlich aussagekräftig. Ähnliches gilt für die -z'«g/y-Adverbien (Kollokation zu Adjektiva oder Verben, bei Disjunct-Verwendung auch Satz), wo aber infolge eindeutiger morphologischer Markierung zumindest das Tag RB unabweisbar und eindeutig ist. Bei den Adjektiven (und in Konsequenz bei den abgeleiteten Adverbien) ergibt sich nun, dass neben den oben genannten grammatischen Merkmalen auch semantische Aspekte für die Einordnung und textuelle Wertung herangezogen werden müssen. Satz-, Phrasen- und Wort-Semantik zeigen eine vielen relevanten Adjektiven eigene Grundstruktur, die im Folgenden nach Nickel adaptiert gegeben wird:4

2

3

4

Es wird sowohl auf das Lancaster-Oslo/Bergen Corpus wie auf das Users' Manual (1986) Bezug genommen. Vgl. den Beleg BEATING JJ with heavily beating heart he reached out and lifted the lid *Adjektiv! Die ausfuhrlichste Beschreibung hierzu findet sich bei Nickel (1968, 150-159); vgl. auch CGEL (1985), Ch.7.15ff. (,participial adjectives') und 17.98 ff. Gpremodification').

Englische Korpora: Welche eignen sich wozu? Subject NP personal concrete, non-personal abstract Clause nominal (+/-finit) e. g. This book Cracking jokes

3

Verb transitiv

Object affected personal

interests amused

the readers. the audience.

Daraus ergibt sich, dass viele solcher Adjektive und vermutlich ihre abgeleiteten Adverbien in einem emotiven und evaluativen Kontext auftreten. Dies führte zu der Überlegung, ein spezielleres Korpus als das LOB fur weitere Beispielbereiche und Textverwendung zu befragen. Im Jahr 1983 wurde vom Verfasser ein Zeitungs-Korpus von ca. 230.000 Wörtern mit Artikeln aus den Bereichen Feuilleton (besonders Musik- und Theater-Rezensionen), Sport (Nachdruck auf Spielerevaluation) und Leitartikel (Politiker-Beurteilung) untersucht. Es zeigte sich, dass viele dieser Texte nur so von relevanten Beispielen Überflossen, auch wenn manche Textstellen nun gelegentlich zu euphorisch oder im Gegensatz dazu zu abwertend oder insgesamt etwas affektiert waren. Dies war nun fur Adverbien noch typischer als fur Adjektive, so dass im Folgenden auch getrennt untersucht wird, obwohl die Verbbasen großenteils gleich sind. Die evaluativen Texte zeigten ein erheblich dichteres, an „Farbe" und an Kollokationen reicheres Angebot. 5

3. Adjektive im evaluativen Korpus Evaluative, wertende Texte vergeben ,Noten', indem sie die Reaktion eines Beurteilers, Rezensenten, eines Publikums oder der allgemeinen Meinung in Bezug auf eine aktive Person (Künstler, Sportler, Politiker) oder seine Performanz (Vorstellung, Ergebnis) charakterisieren. Das verwendete Korpus zeigt eine große Dichte und Bandbreite, besonders auch eine weit gefasste Streuung von ,positiv' bis ,negativ'. Dabei sind die abwertenden Adjektive sogar in der Überzahl (in der Zählung ,type' wie auch ,token'), was die Kritikfreudigkeit der Menschen beweisen mag, aber etwas im Gegensatz zur sonstigen Antonymie-Verteilung etwa bei Dimensionalwörtern und besonders bei Qualitätsadjektiven steht, wo etwa im Wortfeld des „Schönen" wesentlich mehr positive Adjektive (beautiful, pretty, handsome, nice u.a.) dem negativen ugly gegenüberstehen. Ähnliches gilt fur das Wortfeld der „Zuneigung", wo ebenfalls wesentlich mehr positive Verben {love, like, admire etc.) als negative (hate) auftreten. Es sei schon hier angemerkt, dass sich zumindest auf der ,token'-Ebene mehr positive -/'«g/y-Adverbien finden als negative, was ein interessanter und zu interpretierender Gegensatz zu den Adjektiven ist (s. Abschnitt 4). Das evaluative Korpus-Material lässt sich grob in vier unterschiedliche Wertungsbereiche einteilen.

5

Aufgrund der Unsicherheit der VBN- und JJ-Zuweisung im LOB und in Folge der Tatsache, dass das eigene Korpus manuell erstellt wurde, wird hier kein voller prozentueller Vergleich vorgestellt, sondern es werden Tendenzen herausgearbeitet.

4

Burgschmidt

a) POSITIV: absorbing, accommodating, amusing, appetizing, captivating, charming, comforting, convincing, disarming, enchanting, encouraging, endearing, enthralling, enticing, exhilarating, exciting, fascinating, flattering, heartening, illuminating, inspiring, interesting, invigorating, inviting, pleasing, reassuring, refreshing, relaxing, rewarding, satisfying, soothing, uplifting·, b) ERSTAUNEN /+/-: appealing, arresting, astounding, baffling, beguiling, bewildering, breathtaking, devastating, electrifying, fetching, intriguing, startling, stirring, striking, stunning, surprising, tantalising, tempting, thrilling, touching·, c) FORDERUNG: challenging, commanding, compelling, exacting·, d) NEGATIV: agonizing, alarming, annoying, appalling, belittling, boring, chastening, chilling, damaging, damning, daunting, deafening, debilitating, dehumanizing, depressing, devastating, disabling, disappointing, discouraging, disheartening, dispiriting, disquieting, distressing, disturbing, diverting, embarrassing, excruciating, exhausting, forbidding, frightening, frustrating, gruelling, horrifying, humiliating, infuriating, insulting, intimidating, irritating, menacing, misleading, punishing, sickening, sobering, taxing, terrifying, threatening, unedifying, unprepossessing, worrying. Die evaluative Komponente ist vollkommen dominierend, wenn auch angemerkt sein muss, dass nicht alle Adjektive, wie etwa dashing oder lasting, dem beschriebenen syntaktischen Typ angehören. Die Unterschiede zum LOB bestehen in höherer ,token'-Dichte und in einer Verschiebung zu den ,farbigeren' Rändern der Skalen (also weg von .interesting').

4. Adverbien im LOB und im evaluativen Korpus Von vielen der in Abschnitt 3 beschriebenen Adjektive existieren Adverbbildungen. Sie können in zwei Funktionen auftreten: als Disjuncts und als Adjuncts/Subjuncts.6 Zahlreiche relevante Bildungen werden als ,value judgements' verwendet und sind somit Attitudinal Disjuncts (GCE, 1972) oder Content Disjuncts (CGEL, 1985) oder Attitude Stance Adverb(ial)s (LGoSWE, 1999), z.B. annoyingly, disappointingly, disturbingly, pleasingly, refreshingly, amusingly etc. Im LOB mit seinen stärker narrativen und deskriptiven Texten sind sie in dieser Funktion ebenso wenig häufig wie im evaluativen Korpus, da sie eher in argumentativen Texten auftreten. 6

Diese Begriffe stammen aus CGEL (1985). Während die Verwendung von Disjunct eindeutig ist, ist die Abgrenzung von Adjunct und Subjunct besonders bei Verben (nicht so bei Adjektive prämodifizierenden Intensifier-Adverbien) nicht so einfach, vgl. Ch. 8.88 (p. 566): „We apply the term SUBJUNCTS to adverbials which have, to a greater or lesser degree, a subordinate role [...] in comparison with other clause elements". In der ersten Version GCE (1972) ist noch keine Trennung gegeben (Ch. 8.8 ff., pp. 426 ff.), alle relevanten Beispiele sind als Adjuncts klassifiziert; auch die LGoSWE (Ch. 7.14, pp. 552 ff. & 10.2, pp. 776 ff.) fasst alle relevanten Beispiele als Circumstance Adverbs/Adverbials zusammen; Disjuncts werden als Stance Adverbials gelistet.

Englische Korpora: Welche eignen sich wozu?

5

Viel zahlreicher sind generell und besonders im evaluativen Korpus die intensivierenden, positiv wie negativ wertenden Adverbien auf -ingly, wobei im LOB Adjuncts und Subjuncts zu Verben und Subjuncts zu Adjektiven eher gleichmäßig vertreten sind, während im evaluativen Korpus die Prämodifizierung von selbst schon wertenden Adjektiven durch nochmals steigende und skalierende -mg/y-Adverbien vorherrscht. Die evaluativen Texte haben insgesamt eine größere Dichte und Bandbreite an Beispielen, auch wenn in beiden Korpora increasingly und surprisingly (dieses als Disjunct und Subjunct) an der Spitze liegen. Das LOB hat fur -ingly-Adverbien 56 .types' mit insgesamt 132 .tokens' (bei 20 Mehrfachnennungen somit viele Einmal-Vorkommen), während das ja wesentlich kleinere evaluative Korpus 92 .types' mit insgesamt 188 .tokens' bei Mehrfachnennungen aufweist. Die Kollokationen haben erheblich mehr Farbe, vielleicht auch Idiosynkratizität, es ergibt sich eine Tendenz zur delexikalisierten Über- oder Untertreibung, die letztlich alle ein Archi-Adverb very ersetzen können.7 Allerdings behalten die in den evaluativen Texten des Korpus verwendeten -wg/y-Adverbien neben der Steigerung doch viel von ihrer oft expressiven Grundbedeutung (so etwa in deafeningly,

threateningly,

engagingly,

chillingly

u.a.), wenn auch oft eher figurativ. Im Folgenden sollen - auch mit Hilfe einer Skalierungstabelle - einige Beispiele für die Verwendung von -;«g/y-Adverbien gegeben werden, wobei die Skalierung nach der Relation Adverb-Adjektiv (Head) von negativen zu neutralen zu positiven Adjektiven mit der jeweiligen Qualifizierung durch Adverbien erfolgt. In der Tabelle wurden etwas .stärkere' Adverbien als die etwas allgemeinen interestingly und surprisingly gewählt. Da 33 ,types' aber Mehrfachvorkommen zeigen, wird deutlich, wie sehr diese Adverbgruppe die gegebene Textsorte charakterisieren kann. Aus der Semantik der Kollokationen und natürlich auch der Einzelsemantik der Kollokatoren ergibt sich, dass manche Verbindungen nur .negativ' plus .negativ' möglich sind, wie depressingly bad, andere nur .positiv' plus .positiv' wie strikingly beautiful, während manche Bildungen frei verfugbar sind, neben surprisingly (siehe Kategorie .Erstaunen' bei den Adjektiven) etwa exceedingly, alarmingly, breathtakingly u.a.

Insgesamt geben diese -z'wg/y-Adverbien der Bewertung des Beurteilers und in der gegebenen Dichte der Vorkommen einem Text Farbe, wobei ein absoluter, kaum übertreffbarer Höhepunkt in dem folgenden Beispiel aus dem evaluativen Korpus liegen mag, das aus der Beschreibung des Cricket Teams der West Indies 1983 stammt: Lloyd's men will be back to their frighteningly

brilliant best (Τ 15/6/83,24).

Der West Indies ,pace attack' war damals in der Tat durch Schnelligkeit und Kraft .furchterregend', doch erreicht frighteningly durch die Kollokation mit zwei SuperlativWörtern brilliant und best eine zusätzliche und im Abstand von den Ereignissen eher rein positiv verstärkende dritte Steigerungsebene, die kaum überboten werden kann. So können Semantik, Kollokation und Textsorte insgesamt ein allgemeines wie speziell korpuslinguistisch vorhandenes und auffälliges Phänomen über die reine EDV-Erfassung und Quantifizierung hinaus charakterisieren.

7

Auf die Delexikalisierung und Grammatikalisierung hat Lorenz (2002, 143-161) mit zahlreichen Adverb-Beispielen, wenn auch kaum solchen auf -ingly, hingewiesen und dabei die semantischen Kategorien .evaluative', .comparative' und .modal' mit entsprechenden .clines of delexicalisation' postuliert. Der Begriff .evaluativ' wird hier allerdings primär für die Texte verwendet.

Burgschmidt

6

ο oo OS

s C

(Ν

>η

(Ν (Ν

m TJ ο>

ε

α

'S .1

>

1

"3b j>> "M

1

a

υ κ •o

•β

'τΛ

< α

+ £ Ξ ίο >

1> Ζ

ο •Ο C

Μ ο ο J3

1 η "ο §

£ S£« £ ο

,2

Q

CN ο

m

νο

ε

»>

Ui ω •s

ο ο •β τ ο 'Si cd Β

£

5 (Λ g ς Λ 0Η CO υ cU We PP1S2 are_VBR injl a ATI periodNNI of_IO decisive JJ historical JJ significance NN1 forJF Africa NP1 and CC ils APPGE pin ftfj[Nh]^(Nc) Ä[Caa)"R|Nep|fi(P)1tt#(Nc! Kl|DE| jfSlNa) lElDjlitSlVJ)ft®f(Na|#[D] £|VJ)j5jj6|Na] SX(Na) Kl[DE] β) We PPISZ are_VBH determined JfVN that CST lhis_OD1 2lst FO century_NNTl shail_VM be_VBI the_AT Afrlcan_JJ cenfuiy_NNT1 ._. < The AT ideaNNl ofJO an ATI AfricanJJ renaissance NNI has VHZ taken WN hold NNI injl our APPGE continent NNI with IW a #jflf(Nc| ÄÄtVCJ W[DE| ί|»,(Νβ) B|D) (E(P)ftf][Nh)^K|Nc|lL[VC| T(Nes| t

· welchen Stellenwert ha't rechtschreibung denn eigentlich in der schuletr und im deutschunterrichta >bitteschönG